Por: Pavan Tummala, Richard Hagarty
Atualizado em: 28 de dezembro de 2018 | Publicado em: 27 de dezembro de 2018
Resumo
Neste padrão de código, criaremos um aplicativo da web para visualizar dados não estruturados usando Watson™ Natural Understanding, Apache Tika e D3.js. Depois que um usuário carrega um arquivo local de sua escolha, o aplicativo utiliza o Apache Tika para extrair texto do arquivo de dados não estruturados. O texto é então passado pelo Watson Natural Language Understanding, do qual entidades e conceitos são extraídos. Por fim, o aplicativo utiliza a biblioteca D3.js como ferramenta de visualização para mostrar os resultados ao usuário.
Descrição
O principal benefício de utilizar o Watson Natural Understanding Service é seu poderoso mecanismo de análise que fornece enriquecimento cognitivo e insights sobre os dados. Os principais enriquecimentos extraídos incluem:
Entidades – pessoas, empresas, organizações, cidades e muito mais;
Palavras-chave – tópicos importantes geralmente utilizados para indexar ou pesquisar os dados;
Conceitos – conceitos gerais identificados que não são necessariamente referenciados nos dados;
Sentimento – o sentimento geral positivo ou negativo dos dados.
Os enriquecimentos serão exibidos por meio do uso do D3.js, uma biblioteca JavaScript que fornece técnicas de visualização poderosas que ajudam a dar vida aos dados. Neste aplicativo, vamos utilizá-lo a fim de exibir cada um dos enriquecimentos em uma nuvem de bolhas interativa, com o tamanho e a localização de cada elemento determinados por seu relevância relativa.
Ao concluir este padrão de código, você entenderá como:
Criar e utilizar uma instância do Watson Natural Language Understanding;
Aproveitar o Apache Tika para extrair texto de arquivos não estruturados;
Utilizar o D3.js para exibir os visuais.
Fluxo
O usuário configura as credenciais para o serviço Watson Natural Language Understanding e inicia o aplicativo;
O usuário seleciona o arquivo de dados para processar e carregar;
O Apache Tika extrai o texto do arquivo de dados;
O texto extraído é passado para o Watson NLU para enriquecimento;
Os dados enriquecidos são visualizados na IU por meio da biblioteca D3.js.
Instruções
Pronto para começar? Consulte o README para obter instruções detalhadas.
Conclusão
Este padrão mostrou como criar um aplicativo da web para visualizar dados não estruturados utilizando Watson Natural Understanding, Apache Tika e D3.js. O padrão faz parte do caminho de aprendizagem Introdução ao processamento de linguagem natural. Para continuar com o caminho de aprendizagem, dê uma olhada na próxima etapa, Descubra insights de uso ocultos do Facebook.
...
Quer ler mais conteúdo especializado de programação? Conheça o IBM Blue Profile e tenha acesso a matérias exclusivas, novas jornadas de conhecimento e testes personalizados. Confira agora mesmo, consiga as badges e dê um upgrade na sua carreira!
…..
Quer dar o próximo grande passo na sua jornada profissional? Participe do Cloud Training, um curso online e gratuito que vai te preparar para o exame da certificação IBM Cloud Foundations. Inscreva-se já!