O Mozilla resolveu ir na contramão das grandes empresas que gravam seus usuários sem eles saberem e resolveu pedir ajuda ao público: criou o Common Voice, baseado em crowdsourcing, para diversificar o reconhecimento de fala de dispositivos como assistentes pessoais. A ferramenta permite a qualquer um gravar sua voz, juntando-se a um banco de dados representivo da população do planeta.
O projeto fundamenta-se naquilo que os programadores de algoritmos estão começando a perceber: o humano transfere para a máquina sua própria visão de mundo. Da mesma maneira que o Twitter foi acusado de ter uma IA racista ao classificar como discurso de ódio publicações de afro-americanos, assistentes de voz como Alexa e Siri são o espelho de seus desenvolvedores predominantemente brancos. Isso se revela em sua incapacidade de entender o não-nativo em inglês (ou quem tem pronúncia típica de certas regiões).
Tecnologia, negócios e comportamento sob um olhar crítico.
Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo
Enquanto o público faz crescer o banco de vozes, o Mozilla libera o conjunto de dados para que qualquer um use-o para pesquisa, criação e treinamento de seus próprios aplicativos de voz. Isso vai levar a um melhor reconhecimento vocal para todos os usuários, independentemente de idioma, sexo, idade ou sotaque.
Apenas idiomas lucrativos
Segundo o chefe de Aprendizado de Máquina do Mozilla, Kelly Davis, "os serviços de reconhecimento de fala estão disponíveis apenas em idiomas lucrativos. Também tendem a ter um desempenho melhor quando respondem à voz masculina do que a feminina, e dificilmente reconhecem comandos de pessoas com sotaques diferentes.”
Um estudo do Instituto AI Now da Universidade de Nova York descobriu que a falta de representação em grandes empresas de tecnologia como Microsoft, Google e Facebook faz com que a IA atenda mais prontamente a homens brancos: apenas 15% da equipe de IA do Facebook são mulheres; no Google, elas são 10%.
Fontes