Facilitar o acesso de todos é o novo mote de acessibilidade do YouTube. Até recentemente o site de vídeos mais frequentado do mundo interpretava esse conceito como “poder ver um vídeo de qualquer lugar”, seja em um desktop ou no celular. Agora a ideia é permitir que pessoas com deficiência auditiva ou que não sejam fluentes em inglês também possam usufruir do serviço.
O sistema funciona de forma semelhante ao closed caption dos canais de TV normais. Um programa de reconhecimento de fala captura e decodifica o conteúdo verbal do vídeo, transformando-o em legendas.
Tecnologia, negócios e comportamento sob um olhar crítico.
Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo
Para todas as pessoas
Qualquer pessoa pode se aproveitar do auto-caption do YouTube. Além das pessoas com problemas de audição, qualquer um que esteja estudando o inglês como idioma estrangeiro pode se beneficiar do sistema.
O primeiro caso – quem tem dificuldades auditivas, ou mesmo a falta desse sentido – tem aplicações de inclusão. No vídeo a seguir (em inglês) você acompanha a alegria dos estudantes da California School for the Deaf (Escola para surdos da Califórnia), em Fremont, ao testar a novidade:
Porém, ainda deve demorar algum tempo para que todos os vídeos que cumpram os requisitos recebam o auto-captioning. O pessoal do YouTube recomenda que os usuários que tiverem problemas habilitando o sistema em seus uploads antigos visitem o Help Center do site.
Para todo o mundo
Com o tempo e o desenvolvimento de novas ferramentas mais poderosas, devem-se incluir outros idiomas e melhores capacidades de tradução da palavra falada em escrita, e os programadores responsáveis pelo auto-caption já estão trabalhando nesse sentido.
Segundo Mike Cohen, especialista em reconhecimento de fala do Google, são vários os empecilhos para que a tecnologia atinja seu objetivo final. Cada idioma tem suas particularidades e estruturas, o que gera uma quantidade enorme de regras para o reconhecimento. Somando-se a isso o extenso vocabulário das línguas modernas, os sotaques e dialetos o cenário torna-se extremamente complexo.
Outro problema para a transcrição perfeita é a qualidade do áudio nos vídeos. Barulhos de fundo, captação ruim e até mesmo problemas de fala e dicção do interlocutor tornam-se vilões de alta estirpe para o software de reconhecimento.
Requisitos e alertas
Ken Harrenstein, engenheiro de software do Google, comentou que em um dos testes as palavras SIM card – o chip dos celulares GSM – foi transcrita como salmon (salmão, em inglês). Assim, para que o sistema funcione perfeitamente, a dicção e a clareza na voz do interlocutor devem ser exemplares .
O software de reconhecimento de fala do Google é extremamente avançado, porém ainda está longe de ser perfeito. Falhas de captação, problemas da faixa de áudio e qualquer idioma além do inglês ainda estão além da capacidade da nova funcionalidade.
Com o tempo, a situação só tende a melhorar, mas por enquanto, a grande ideia é aproveitar para praticar o inglês com o melhor da filmografia da web.