A OpenAI apresentou na terça-feira (1º) uma série de atualizações de API que possibilitam otimizar o trabalho dos desenvolvedores que utilizam a tecnologia da startup na criação de recursos de inteligência artificial. As novidades surgiram durante o DevDay 2024, realizado em São Francisco, nos Estados Unidos.
Entre elas, há a API Realtime, destinada à criação de apps alimentados por IA que falam com o usuário, aproveitando o modo de voz avançado anunciado pela dona do ChatGPT recentemente. Anteriormente, era necessário transcrever o áudio, executar o texto em um modelo de linguagem e usar outro na conversão de texto para fala.
Tecnologia, negócios e comportamento sob um olhar crítico.
Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo
Uma das ferramentas promete facilitar a criação de apps de IA com voz.Fonte: Getty Images/Reprodução
Com a ferramenta em tempo real, os desenvolvedores agora podem criar apps de voz sem a integração de outros softwares, realizando o processamento do áudio imediatamente e com um só conjunto de instruções. A nova API deve evitar a perda de emoção e sotaques, além da latência perceptível na versão anterior.
Outro destaque é a funcionalidade de ajuste fino de visão, permitindo adicionar as capacidades de entender e reconhecer imagens em produtos de IA. Segundo a OpenAI, isso trará melhorias para soluções que utilizam pesquisa visual aprimorada e detecção de objetos para veículos autônomos, entre outras.
Mais novidades para desenvolvedores de IA
Na conferência, a startup também anunciou o “Model Distillation”. A ferramenta possui a capacidade de aprimorar modelos menores, como o GPT-4o mini, aproveitando recursos semelhantes aos executados por modelos mais avançados, incluindo o GPT-4o e o o1, mas sem depender do mesmo poder de processamento.
Dessa forma, é possível reduzir os custos com o desenvolvimento de novas aplicações de IA, algo que também faz o “Prompt Caching”. Esta novidade oferece aos programadores a possibilidade de reutilizar prompts processados com frequência pela tecnologia em diferentes tipos de soluções.
Se a API detectar um prompt que já foi utilizado, aplicará desconto de 50% no token de entrada, de acordo com a OpenAI, resultando em uma economia significativa, dependendo do caso. A rival Anthropic, responsável pela IA Claude, introduziu um recurso semelhante em agosto.
Fontes
Categorias