ChatGPT ganha suporte para comandos de voz e interpretação de imagens
25/09/2023 - 10:50•2 min de leitura
Imagem de ChatGPT ganha suporte para comandos de voz e interpretação de imagens no tecmundo
Essa não é uma matéria patrocinada. Contudo, o TecMundo pode receber uma comissão das lojas, caso você faça uma compra.
O ChatGPT agora está disponibilizando a interação por voz ou imagens. Nesta segunda-feira (25), a OpenAI anunciou que, o chatbot é capaz de adaptar discursos em texto.
O processo de interação é bem similar ao chat tradicional, mas em vez de digitar, o usuário deve falar. Basta tocar sobre o botão de gravação para falar a pergunta ou interação. Então, o ChatGPT converterá para texto e enviará para o modelo.
Use your voice to engage in a back-and-forth conversation with ChatGPT. Speak with it on the go, request a bedtime story, or settle a dinner table debate.
— OpenAI (@OpenAI) September 25, 2023
Sound on ?? pic.twitter.com/3tuWzX0wtS
A tecnologia por trás da ferramenta é o Whisper, um modelo de inteligência artificial (IA) capaz de adaptar discurso falado em texto. Assim como assistentes virtuais, o ChatGPT também será capaz de responder usando uma voz sintética.
Segundo a OpenAI, isso é possível graças a um novo modelo de IA de texto para voz. O modelo capaz de responder em voz alta terá disponibilidade limitada.
Interpretação de imagens
A outra novidade é a interação por imagens. A função é bastante parecida com o Google Lens, capaz de reconhecer elementos de uma figura ou foto para fazer buscas na web.
ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
— OpenAI (@OpenAI) September 25, 2023
Ao subir um arquivo, o ChatGPT tentará deduzir o que o usuário deseja conversar e responder de acordo. Também será possível usar a ferramenta de edição para indicar o que precisa ser identificado pela IA, falar ou digitar uma pergunta para complementar a interação.
De certa forma, o recurso vai além do que o Google Lens, uma vez que não se trata de uma simples busca na web. A versatilidade da IA da OpenAI garante uma interação mais natural, como se fosse um bate-papo com uma pessoa.
Por questões de segurança, o ChatGPT não será capaz de reconhecer pessoas. A OpenAI afirma que a medida é uma forma de preservar a privacidade do público. Sem isso, qualquer pessoa poderia enviar uma foto ao modelo e perguntar "quem é?" para ter uma resposta, por exemplo.
Inicialmente, ambas as novidades serão disponibilizadas apenas para assinantes do ChatGPT. O restante dos usuários vai ganhar a novidade "logo depois", segundo a OpenAI.
--
Curso de ChatGPT
Especialista em Redator
Redator de tecnologia desde 2019, ex-Canaltech, atualmente TecMundo e um assíduo universitário do curso de Bacharel em Sistemas de Informação. Pai de pet, gamer e amante de músicas desconhecidas.