A pandemia de Covi-19 tem desafiado os jornalistas e organizações de notícias a analisar em tempo real uma quantidade sem precedentes de dados. O desafio para os jornalistas é avaliar essas informações com precisão e comunicar suas descobertas ao público de maneira eficaz. Para tanto é imperativo que os jornalistas primeiro entendam os dados com os quais estão trabalhando. Texto do jornalista Amr Eleraqi, no site da Rede Internacional de Jornalistas (IJNET, na sigla em inglês) traça uma série de cuidados a serem tomados na coleta e análise das informações.

“Sempre analise os números com ceticismo saudável. Como jornalistas, devemos investigar quando e de onde se originam os dados que usamos. Devemos determinar quem originalmente coletou e publicou os números, bem como os financiadores por trás deles”, diz Eleraqi. Segundo ele, os jornalistas também devem consertar valores ilógicos ou ausentes e limpar números com rótulos incorretos. Esses erros podem ocorrer durante o processo de entrada de dados, seja feito manualmente ou automaticamente.

Veja a lista de verificações sugerida por Eleraqi:

Transparência
Procure recursos que sejam transparentes sobre como eles compilam e documentam os dados. Isso inclui a tecnologia e os algoritmos usados durante o processo. Quanto mais transparentes os provedores de dados, maior o potencial de precisão.

Metodologia
Não publique um conjunto de dados sem anexar o arquivo de metadados correspondente, o que ajuda a explicar como os dados foram coletados. Também pode-se incluir informações sobre o tamanho da amostra, margem de erro e valores ausentes, além de um glossário de termos e abreviações.

Contexto
Chave ao analisar os dados. Por exemplo, considere como você apresenta informações sobre o total de infecções e as taxas de infecção. Quando uma autoridade governamental apresenta dados regionais sobre o número de pessoas infectadas com COVID-19, uma grande cidade pode apresentar o valor mais alto. No entanto, isso não significa necessariamente que suas taxas de infecção sejam mais altas – pode ser simplesmente o resultado de ser a área mais populosa. A maneira mais apropriada de comparar números em locais com populações diferentes é calcular as taxas de infecção por 100 pessoas. Isso demonstrará com mais precisão a propagação do vírus.

Entenda os dados
Não comece a trabalhar em um banco de dados a menos que você entenda o que está sendo apresentado. Para fazer isso, pergunte-se o seguinte:

O que os dados indicam?
Eu entendo todos os termos e definições incluídos nos dados?
O que não está incluído nos dados que podem fornecer contexto?
Quais são as unidades de medida?
Você pode cruzar os dados com uma fonte diferente, para corroborar os valores?