Utilizar mecanismos de busca já se tornou uma atividade tão cotidiana que às vezes nem nos damos conta da quantidade de vez que acessamos algum site exclusivamente para procurar alguma informação. Desde o resultado da rodada de futebol do fim de semana, até receitas de bolo e letras de músicas podem ser encontradas facilmente em pouquíssimo tempo, bastando digitar palavras-chave no navegador.
O principal líder deste mercado é o Google, empresa que atualmente reúne cerca de 70% das buscas realizadas pela internet. Desde sua criação, houve uma grande evolução tanto dos mecanismos utilizados quanto das ferramentas disponíveis. Não é à toa: desde 1997, quando o buscador foi lançado, a própria Internet se transformou muito, com a popularização da banda larga e o crescimento dos mecanismos multimídia, capazes de exibir de uma só vez grande variedade de imagens, sons e vídeos.
Chegamos a um ponto em que a rapidez e a diversidade de informações que podem ser encontradas é fascinante: aplicativos para celulares permitem identificar a música que está tocando no ambiente após alguns segundos, isso sem falar nos sites que identificam objetos e animais através de fotos enviadas pelos usuários. Parece que atualmente não há nada que uma pesquisa não seja capaz de encontrar.
Porém, se engana quem pensa que chegamos ao ponto máximo no que diz respeito à pesquisa de dados: nos próximos anos as revoluções neste campo prometem ser tão grandes que as opções atuais parecerão extremamente ridículas e limitadas.
Como funciona um mecanismo de busca tradicional?
Os mecanismos de busca utilizados atualmente funcionam armazenando informações obtidas através de análises realizadas em milhões de endereços espalhados pela Internet. Para isto, são utilizados diversos robôs que analisam aspectos como o título de cada página, meta tags (sistema de palavras-chave que facilita encontrar determinado assunto) e o texto apresentado em cada uma. Os resultados obtidos são armazenados e organizados em um banco de dados de forma a fornecer ao usuário o resultado mais relevante para as buscas realizadas.
Quando você digita determinada palavra ou frase em um mecanismo de busca, através de uma análise realizada neste banco de dados é fornecida uma lista de resultados com as páginas mais relevantes. O que vai diferenciar um mecanismo de busca do outro é justamente a exatidão dos resultados obtidos: quanto mais precisos os sites apontados, maior a probabilidade do usuário voltar a utilizar aquele sistema de busca no futuro. Foi através deste mecanismo que o Google se tornou líder do mercado: seu algorítimo de cálculo de relevância, chamado PageRank, é um dos mais eficientes do mundo.
As limitações dos sistemas de busca atuais
O grande problema relacionado com os sistemas de busca tradicionais está relacionado a limitações do número de resultados obtidos. Afirmar isto pode ser estranho se levarmos aos milhões de resultados que podemos obter, mas é preciso levar em conta que a maioria dos sites hospedados na Internet atualmente simplesmente não aparecem como resultados em nenhum mecanismo. E mesmo os que aparecem nem sempre tem a relevância que deveriam na ordem exibida pelos mecanismos.
Segundo Weiyi Meng, professor de computação da Universidade de Binghamton, a Web é formada por duas partes, uma superficial e outra profunda. Enquanto a parte superficial é formada por cerca de 60 bilhões de páginas, a parte profunda é muito maior, chegando a quase um trilhão de páginas. O grande obstáculo encontrado pelos mecanismos de busca atuais é a impossibilidade de conseguir indexar o conteúdo da Web profunda, que acaba se tornando desconhecido para a maior parte dos usuários.
Outro desafio enfrentado atualmente pelos grandes sistemas de busca é tentar se adequar à velocidade com que as informações são atualizadas, especialmente quando se trata de conteúdo postado em sites menores e redes sociais. Em uma explicação simplificada, atualmente a relevância de um resultado é determinada pelo número de links que levam a ele: ou seja, quanto mais pessoas recomendarem determinada página, maior a visibilidade dela no sistema de busca.
Porém, este sistema muitas vezes deixa de fora sites que possuem informações importantes, mas que não são indicados por não possuírem um tamanho relevante. É o caso de blogs, que muitas vezes são capazes de fornecer informações de forma mais rápida do que grandes portais, mas que passam batidas para a maioria das pessoas. Com o crescimento do número de usuários fornecendo informações em tempo real para sites independentes, é cada vez mais problemático conseguir analisar estes dados em tempo real, fornecendo resultados relevantes para as buscas realizadas por usuários em mecanismos de busca.
Qual o futuro dos sistemas de busca?
Quando se trata da evolução dos sistemas de busca disponíveis, as possibilidades apresentadas atualmente são muito grandes, cada uma com potencial para revolucionar totalmente o modo como buscamos informações relevantes. O professor Weiyi Meng, por exemplo, aposta em um sistema em que não serão mais exibidas listas com diversos sites, mas sim o próprio resultado.
Ele aposta na possibilidade de fazer perguntas diretas para o sistema, obtendo em seguida sempre a resposta mais relevante aos desejos do usuário. Junto com seus colegas, Meng criou uma plataforma muito parecida com os sistemas atuais de metabusca, que realizam pesquisas em diversos mecanismos diferentes. Porém, a ideia da plataforma, batizada como Webscalers é utilizar as ferramentas de buscas próprias de cada site, aumentando o número de resultados disponíveis e a relevância de informações atualizadas em tempo real.
Outro sistema que se mostra bastante promissor é o mecanismo de busca através do Twitter, rede social que ganha cada vez mais relevância na Internet. O grande diferencial do sistema é que a relevância dos sites e assuntos é medida não por um robô pré-programado, mas sim pelos próprios usuários: quanto mais pessoas falarem de um assunto ou se referirem a determinada pessoa, maior a possibilidade de que este seja relevante.
Atualmente o sistema do site ainda não possui mecanismos que permitam classificar a relevância dos links ou usuários, mas isto deve mudar muito em breve. Os criadores do site já anunciaram que em breve não somente o conteúdo das mensagens, mas também os links postados serão levados em conta no sistema de busca do site. Desta forma, ficará muito mais fácil descobrir notícias e assuntos relevantes para o público, tudo isso atualizado em tempo real pelos próprios usuários.
Pesquise em qualquer lugar e em qualquer mídia
Atualmente já é possível utilizar diversos mecanismos de busca através de dispositivos portáteis, como celulares, notebooks e até mesmo videogames. Porém, estes ainda sofrem de duas limitações bastante graves: disponibilidade de sinal e a dependência de ter que utilizar textos para fazer as pesquisas.
Este é justamente um dos pontos que os mecanismos de busca atuais prometem explorar em um futuro não muito distante: imagine uma peça de roupa inteligente, capaz de se conectar à rede mundial de computadores com extrema rapidez e fornecer respostas sobre as mais diferentes perguntas. Pode parecer coisa de ficção científica, mas já há gente que está investindo nesta ideia.
Outra aposta está na possibilidade de fazer pesquisas com outros meios que não o texto. Em alguns anos, deve ser perfeitamente possível procurar dados através da sua própria voz, sem precisar digitar nada. Da mesma forma, inserir uma foto ou vídeo em um sistema de busca poderá fornecer dados interessantes sobre o conteúdo dos mesmos. Em vez de ter que pesquisar o nome de determinado pássaro escrevendo suas características, bastará enviar uma foto dele para o sistema para obter informações detalhadas em segundos.
O modo como os resultados serão obtidos também vai mudar: em vez de uma simples lista com as respostas obtidas, haverá a possibilidade de procurar pelo tipo de mídia mais relevante para o usuário naquele momento. Ao pesquisar sobre determinada notícia, o sistema de busca automaticamente irá determinar se é mais relevante exibir resultados em vídeos ou através de textos e fotos.
A maior aposta do momento está na possibilidade de realizar buscas personalizadas, levando em conta os conhecimentos de cada usuário e aspectos relevantes sobre sua vida. Obviamente você estará no controle de como suas informações pessoas serão utilizadas, mas poderá permitir que os mecanismos saibam um pouco mais sobre seus hábitos de forma a obter resultados melhores. Um mecanismo de busca do futuro poderá fornecer informações diferenciadas para cada pessoa, baseado no lugar onde ela mora, formação acadêmica e até mesmo levando em conta as buscas realizadas anteriormente.