A IBM apresentou nesta quinta-feira (25) um kit de ferramentas de código aberto capaz de coletar informações e fazer uma análise aprofundada dos dados referentes à covid-19. O novo recurso tem como público-alvo os desenvolvedores e cientistas de dados que trabalham na detecção e no rastreamento da propagação do novo coronavírus.
Intitulada “notebook COVID”, a plataforma agrega dados da doença obtidos de fontes como a Universidade Johns Hopkins (EUA), o The New York Times e o Centro Europeu de Prevenção e Controle de Doenças (ECDC), entre outras, e utiliza notebooks Jupyter para fazer um pente-fino nessas informações.
O sistema cria relatórios e gráficos que ajudam a entender a disseminação da doença em tempo real e, à medida que os dados mudam, o notebook COVID faz as atualizações, permitindo que os pesquisadores tenham acesso às informações mais recentes. A finalidade do recurso é aliviar a carga de trabalho dos cientistas de dados, liberando-os para outras tarefas mais avançadas, como a modelagem de previsão.
A ferramenta ajuda a entender melhor a disseminação do vírus e a planejar políticas de combate.Fonte: IBM/Divulgação
A tecnologia por trás da ferramenta é uma estrutura de dados conhecida como Dataframes Pandas, muito utilizada nas análises feitas por cientistas de dados. A companhia também aproveitou recursos como o editor gráfico de fluxo de trabalho criado para o projeto Elyra, entre outros.
Separando os dados da doença
Segundo a IBM, a ferramenta é capaz de realizar análises bastante detalhadas. Ela pode, por exemplo, encontrar correlações entre os níveis de pobreza e as taxas de infecção em uma determinada cidade, identificando possíveis tendências da pandemia.
Com isso, ela auxilia os responsáveis por desenvolver as políticas para prevenir e combater a doença de acordo com as informações da área analisada.
O kit de códigos abertos da ferramenta da IBM está disponível no GitHub, onde também se encontram as instruções de uso.
Fontes
Categorias