OpenAI apresenta novas ferramentas para aprimorar e baratear soluções de IA

1 min de leitura
Imagem de: OpenAI apresenta novas ferramentas para aprimorar e baratear soluções de IA
Imagem: Getty Images/Reprodução

A OpenAI apresentou na terça-feira (1º) uma série de atualizações de API que possibilitam otimizar o trabalho dos desenvolvedores que utilizam a tecnologia da startup na criação de recursos de inteligência artificial. As novidades surgiram durante o DevDay 2024, realizado em São Francisco, nos Estados Unidos.

Entre elas, há a API Realtime, destinada à criação de apps alimentados por IA que falam com o usuário, aproveitando o modo de voz avançado anunciado pela dona do ChatGPT recentemente. Anteriormente, era necessário transcrever o áudio, executar o texto em um modelo de linguagem e usar outro na conversão de texto para fala.

smart people are cooler

Tecnologia, negócios e comportamento sob um olhar crítico.

Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo

Uma das ferramentas promete facilitar a criação de apps de IA com voz.Uma das ferramentas promete facilitar a criação de apps de IA com voz.Fonte:  Getty Images/Reprodução 

Com a ferramenta em tempo real, os desenvolvedores agora podem criar apps de voz sem a integração de outros softwares, realizando o processamento do áudio imediatamente e com um só conjunto de instruções. A nova API deve evitar a perda de emoção e sotaques, além da latência perceptível na versão anterior.

Outro destaque é a funcionalidade de ajuste fino de visão, permitindo adicionar as capacidades de entender e reconhecer imagens em produtos de IA. Segundo a OpenAI, isso trará melhorias para soluções que utilizam pesquisa visual aprimorada e detecção de objetos para veículos autônomos, entre outras.

Mais novidades para desenvolvedores de IA

Na conferência, a startup também anunciou o “Model Distillation”. A ferramenta possui a capacidade de aprimorar modelos menores, como o GPT-4o mini, aproveitando recursos semelhantes aos executados por modelos mais avançados, incluindo o GPT-4o e o o1, mas sem depender do mesmo poder de processamento.

Dessa forma, é possível reduzir os custos com o desenvolvimento de novas aplicações de IA, algo que também faz o “Prompt Caching”. Esta novidade oferece aos programadores a possibilidade de reutilizar prompts processados com frequência pela tecnologia em diferentes tipos de soluções.

Se a API detectar um prompt que já foi utilizado, aplicará desconto de 50% no token de entrada, de acordo com a OpenAI, resultando em uma economia significativa, dependendo do caso. A rival Anthropic, responsável pela IA Claude, introduziu um recurso semelhante em agosto.

smart people are cooler

Tecnologia, negócios e comportamento sob um olhar crítico.

Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo

Você sabia que o TecMundo está no Facebook, Instagram, Telegram, TikTok, Twitter e no Whatsapp? Siga-nos por lá.