De acordo com uma equipe de pesquisadores da Carnegie Mellon University (CMU), nos Estados Unidos, um robô já pode assistir vídeos para aprender a realizar tarefas domésticas simples do dia a dia. No estudo, os cientistas descobriram que os robôs conseguem realizar essas tarefas ao assistir vídeos de pessoas fazendo atividades comuns, como abrir uma gaveta, abrir uma porta ou atender ao telefone.
Até o momento, outros estudos treinaram inteligências artificiais (IA) ao mostrar literalmente como uma tarefa é realizada, por exemplo, usando um ambiente simulado ou mostrando um ser humano realizando a tarefa. Contudo, o modelo proposto pela CMU, consegue fazer um robô aprender uma tarefa em apenas 25 minutos, apenas assistindo a um vídeo.
O novo modelo foi nomeado de Visual-Robotics Bridge (VRB) e trata-se de uma versão avançada de outro modelo usado anterioremente para treinar robôs, conhecido como WHIRL (In-the-Wild Human Imitating Robot Learning).
A maior diferença entre os modelos é que o WHIRL necessita que um humano literalmente mostre uma tarefa na frente de um robô em um ambiente específico, já no VRB não é necessária a presença física de um ser humano e nem de um ambiente específico.
No estudo, os pesquisadores fizeram os robôs assistirem a vídeos com grandes conjuntos de dados para, assim, ensiná-los a realizar tarefas humanas do cotidiano.Fonte: Getty Images
“Neste artigo, planejamos preencher essa lacuna aproveitando vídeos de interações humanas de maneira centrada no ambiente. Utilizando vídeos de comportamento humano na Internet, treinamos um modelo de recursos visuais que estima onde e como um humano na cena provavelmente interagirá. A estrutura desses recursos comportamentais permite diretamente que o robô execute muitas tarefas complexas”, os pesquisadores descrevem no estudo.
Robôs assistindo vídeos
Os pesquisadores treinaram as IAs para realizar 12 tipos de ações que os humanos executam quase diariamente, como abrir uma porta, levantar uma tampa, abrir uma lata de sopa, abrir uma gaveta, entre outras. As tarefas foram realizadas com sucesso após os robôs passarem por um treinamento de 200 horas.
Conforme a equipe explica, no futuro, eles esperam que o modelo VRB seja utilizado para treinar inteligências artificiais a executarem tarefas mais complexas e com múltiplas etapas. O estudo afirma que os pesquisadores utilizaram quatro paradigmas de aprendizado de robôs para criar o modelo, incluindo aprendizado de imitação offline, exploração, aprendizado condicionado a objetivos e parametrização de ação para aprendizado por reforço.
“O Vision-Robotics Bridge (VRB) é uma abordagem escalável para aprender recursos úteis a partir de dados de vídeo humanos passivos e implantá-los em muitos paradigmas diferentes de aprendizado de robôs”, o estudo conclui.
Categorias