ChatGPT ganha suporte para comandos de voz e interpretação de imagens

Por Igor Almenara Carneiro

25/09/2023 - 10:502 min de leitura

ChatGPT ganha suporte para comandos de voz e interpretação de imagens

Fonte:

Imagem de ChatGPT ganha suporte para comandos de voz e interpretação de imagens no tecmundo

Essa não é uma matéria patrocinada. Contudo, o TecMundo pode receber uma comissão das lojas, caso você faça uma compra.

O ChatGPT agora está disponibilizando a interação por voz ou imagens. Nesta segunda-feira (25), a OpenAI anunciou que, o chatbot é capaz de adaptar discursos em texto.

O processo de interação é bem similar ao chat tradicional, mas em vez de digitar, o usuário deve falar. Basta tocar sobre o botão de gravação para falar a pergunta ou interação. Então, o ChatGPT converterá para texto e enviará para o modelo.

A tecnologia por trás da ferramenta é o Whisper, um modelo de inteligência artificial (IA) capaz de adaptar discurso falado em texto. Assim como assistentes virtuais, o ChatGPT também será capaz de responder usando uma voz sintética. 

Segundo a OpenAI, isso é possível graças a um novo modelo de IA de texto para voz. O modelo capaz de responder em voz alta terá disponibilidade limitada.

Interpretação de imagens

A outra novidade é a interação por imagens. A função é bastante parecida com o Google Lens, capaz de reconhecer elementos de uma figura ou foto para fazer buscas na web.

Ao subir um arquivo, o ChatGPT tentará deduzir o que o usuário deseja conversar e responder de acordo. Também será possível usar a ferramenta de edição para indicar o que precisa ser identificado pela IA, falar ou digitar uma pergunta para complementar a interação.

De certa forma, o recurso vai além do que o Google Lens, uma vez que não se trata de uma simples busca na web. A versatilidade da IA da OpenAI garante uma interação mais natural, como se fosse um bate-papo com uma pessoa.

Por questões de segurança, o ChatGPT não será capaz de reconhecer pessoas. A OpenAI afirma que a medida é uma forma de preservar a privacidade do público. Sem isso, qualquer pessoa poderia enviar uma foto ao modelo e perguntar "quem é?" para ter uma resposta, por exemplo.

Inicialmente, ambas as novidades serão disponibilizadas apenas para assinantes do ChatGPT. O restante dos usuários vai ganhar a novidade "logo depois", segundo a OpenAI.

--

Curso de ChatGPT

Widget de produto do Hub de Ofertas


Por Igor Almenara Carneiro

Especialista em Redator

Redator de tecnologia desde 2019, ex-Canaltech, atualmente TecMundo e um assíduo universitário do curso de Bacharel em Sistemas de Informação. Pai de pet, gamer e amante de músicas desconhecidas.


Veja também


Fontes