Desde o início da internet, existem os sistemas de busca. Mas como gerenciar todo o volume de conteúdo que é inserido diariamente na rede mundial de computadores? Esse sempre foi um grande problema. Primeiro porque a internet não é uma rede centralizada, na qual tudo pode ser controlado. Depois, como fazer para diferenciar o que é importante do que não é?
Os grandes serviços de busca sempre tentaram responder essas perguntas. Quem conseguiu sair na frente foi o Google que, em 1998, implantou um mecanismo baseado em relevância. Isso garantiu um diferencial perante a concorrência.
Mas mesmo assim pouco mudou desde o início da internet. Apesar de terem melhorado incrivelmente seus algoritmos de procura, os portais ainda precisam que você digite a combinação correta de palavras-chaves para encontrar o conteúdo desejado. Isso acontece porque a indexação dos documentos é feita com base nas palavras contidas neles — e não no que eles realmente significam.
Isso finalmente está prestes a mudar. Há poucos dias, o Google liberou a sua mais nova invenção: o "Knowledge Graph" ou, em português, "Gráfico do Conhecimento". O que ele faz é procurar termos e expressões e tentar interpretar essa informação dentro de um contexto.
A Microsoft também não deixou de lado as inovações em seu mecanismo de pesquisa. O seu banco de dados inteligente, batizado como Satori, deve ser incorporado ao Bing em julho deste ano.
Coisas, não termos
Se hoje entramos no Google ou no Bing e digitamos, por exemplo, “eu estou com fome”, recebemos resultados de sites que contenham essas palavras, mas não seu significado. Encontramos pessoas reclamando que estão com fome, músicas com esse nome, textos e outras informações não necessariamente ligadas ao fato de você estar realmente querendo comer alguma coisa.
(Fonte da imagem: Reprodução/Google)
A ideia é fazer com que o sistema entenda o que você está dizendo, interpretando a informação em vez de simplesmente reproduzir sites que contenham aquelas palavras. Quando você escrever “eu estou com fome”, ele deverá responder: “o que você quer comer?” e exibir uma lista com restaurantes de diversos estilos próximos ao local de onde você está.
Ou seja, ele entende o contexto da sua pergunta. Da mesma maneira, se você escrever “onde fica o aeroporto?”, ele não vai exibir uma página que contém o endereço do aeroporto ou o mapa até o seu destino. Ele vai mostrar especificamente o caminho e também o melhor jeito de chegar lá. Quem sabe até mesmo sugerir um serviço de táxi ou indicar a estação de ônibus ou de metrô mais próxima. Além disso, ele pode oferecer serviços de check-in online para você se antecipar e não correr o risco de perder o voo.
(Fonte da imagem: Reprodução/Bing-Microsoft)
Nos últimos tempos, Google e Microsoft vêm reunindo uma grande quantidade de informações em suas bases de dados para conseguir desenvolver um sistema mais inteligente. Tudo o que foi coletado por eles veio de fontes de informação pública disponibilizadas gratuitamente, como a Wikipedia, ou de sites de produtos e serviços que contam com a recomendação dos usuários (a Microsoft também utiliza dados coletados das redes sociais).
Segundo Stefan Weitz, diretor do Bing, “todas as coisas que descrevem um objeto estão espalhadas pela web". Isso significa que basta coletar essas informações e desenvolver um sistema que interprete todas elas.
O Google e o Gráfico do Conhecimento
Para organizar o grande volume de dados, o Google traçou relações entre o conteúdo armazenado, criando uma rede de conhecimento que ultrapassa o antigo conceito de banco de dados com informações estáticas. O Gráfico do Conhecimento do Google já conta com mais de 500 milhões de entradas conectadas entre si em milhares de tipos de relacionamentos possíveis.
(Fonte da imagem: Reprodução/Google Official Blog)
Quando você procura algo no Google, os algoritmos fazem buscas tanto na web quanto no Gráfico de Conhecimento. Se você digitar “Mona Lisa”, além de exibir as obras de Leonardo da Vinci, um painel surge ao lado direito da tela com informações particulares sobre ele, incluindo suas obras mais famosas, onde viveu, além de outros artistas da renascença, como Michelangelo ou Rafael.
O novo motor de busca também diferencia os termos procurados, exibindo uma lista de variações que procura contextualizar a sua pergunta, afinal, você poderia estar procurando pelo artista Leonardo da Vinci, pelo vírus de mesmo nome ou até mesmo pelo personagem do game Assassin’s Creed.
Satori é o novo “cérebro” por trás do Bing
O sistema que a Microsoft está introduzindo no Bing é similar ao do Google, mas trabalha de forma um pouco diferente. Ele deve começar a fazer parte das buscas do sistema a partir de julho deste ano e vai funcionar assim: ao fazer uma busca sobre um restaurante, por exemplo, o Bing vai continuar a mostrar o site do local. Mas, assim que você passa o mouse sobre o termo, um quadro (chamado pela empresa de Snapshot) aparece na tela, contendo opiniões e críticas ao local feitas por outras pessoas. Ainda é possível ver fotos do lugar e até mesmo reservar uma mesa (desde que o lugar ofereça esse tipo de serviço).
(Fonte da imagem: Reprodução/Ars Technica)
O Bing também utilizará o Satori aliado à busca tradicional na web para encontrar as informações necessárias. Até agora, o arquivo já possui cerca de 350 milhões de entradas de dados registrados, organizadas e combinadas em milhares de relacionamentos diferentes.
A principal tarefa do Google e da Microsoft é tornar as buscas mais naturais, sem que você precise digitar a combinação correta de palavras-chaves para encontrar o resultado desejado.
Comparando os dois superficialmente, podemos ver que o novo sistema do Google pretende responder às perguntas, enquanto o do Bing procura oferecer um ambiente mais propício à tomada de decisões.
Apple, Siri e Wolfram Alpha
No campo das pesquisas inteligentes, os dois gigantes das buscas enfrentam uma competição acirrada com o Wolfram Alpha, que é um sistema que já começou com a interpretação de contexto. A diferença é que ele não utiliza conteúdo disponibilizado gratuitamente, mas sim fontes de dados já corroborados por profissionais. O Wolfram Alpha pode formar compilações de dados, como a comparação de preços de ações.
(Fonte da imagem: Divulgação/Apple)
Recentemente, a Apple introduziu a Siri no iPhone 4S. A assistente pessoal do aparelho surpreendeu o mundo com a capacidade de interpretar as informações de maneira inteligente. Mas ela não está sozinha nesse trabalho: por trás da sua mecânica está o Wolfram Alpha.
E isso deve ser só o começo. Conforme o Satori do Bing e o Gráfico do Conhecimento do Google se desenvolvem e coletam mais informações, as buscas devem se tornar cada vez mais ricas em detalhes.
Até agora, o conteúdo que ambos os motores de busca trabalham é apenas em inglês. Assim que os dois sistemas passarem a indexar conteúdo em outras linguagens, o banco de dados de ambos deve crescer em progressão geométrica — tanto em volume quanto em complexidade.
Fontes: Ars Technica, Google Inside Search, New Scientist