Alberto Cairo, um dos maiores especialistas da área, afirma que refletimos pouco sobre a visualização de dados de maneira crítica e falamos muito sobre ferramentas. Nesta análise, mostramos como gráficos podem mentir a partir de um exemplo recente, e trazemos uma discussão teórica de Cairo sobre o assunto.
Alberto Cairo, grande especialista em visualização de dados, acaba de lançar o livro “How charts lie” (“Como os gráficos mentem”). Nele, o professor fala sobre a explosão da visualização de dados no jornalismo nos últimos 20 anos – ele chama de era de ouro – e defende que ela tem potencial de se tornar uma linguagem universal.
Há pelo menos 3 razões para a popularidade dos gráficos, segundo ele. Primeiro, as pessoas têm maior engajamento e passam mais tempo em histórias com boas visualizações. Segundo, são úteis. E por fim, as visualizações de dados nos permitem descobrir insights e padrões muito difíceis de enxergar em grandes planilhas.
No entanto, Cairo enfatiza que costumamos falar muito sobre como construir visualizações de dados (e sobre as ferramentas para isso), mas refletimos pouco sobre como pensá-las de maneira crítica. No vídeo abaixo, ele detalha os principais pontos do livro (em inglês):
Um dos exemplos que ele cita é este gráfico (abaixo) sobre o resultado das eleições presidenciais de 2016 nos EUA, que voltou a circular há alguns dias e foi compartilhado pela filha de Donald Trump, com a informação “tente pedir o impeachment disso”:
Alberto Cairo fez uma thread no Twitter explicando por que há um grave erro de interpretação neste gráfico, que inclusive foi transformado em um quadro na Casa Branca e também virou capa de livro, cujo título é “Citizens for Trump” (“Cidadãos por Trump”).
O professor destaca que a palavra “cidadãos” mostra exatamente o erro do mapa e é o motivo para a interpretação equivocada dele. “O mapa não mostra o número de cidadãos, mas sim territórios. O mapa em si não mente, mas a interpretação sim”, explica.
Segundo ele, se a pergunta fosse “quem ganhou onde”, o mapa estaria correto. Mas ele não é preciso para indicar o número de pessoas que votaram. Além disso, ignora a densidade demográfica nos estados. “Levando em consideração que 40% das pessoas não votaram na eleição, o nome do livro de Posobiec na verdade deveria ser ‘Cidadãos por ninguém’”, diz. Veja as porcentagens abaixo:
Para Cairo, a melhor visualização de dados para o resultado das eleições de 2016 seria a abaixo, que mostra o que realmente aconteceu: a disputa foi apertada.
Codificação, recursos de design e camadas de anotação
Neste artigo publicado em português na edição mais recente da revista Lumina (UFJF), Alberto Cairo explica de maneira mais conceitual a importância da escolha correta de uma visualização. Segundo ele, a visualização de dados falha se não pensamos sobre seu propósito.
Nesse sentido, a noção de codificação é fundamental. “O que realmente fazemos ao projetar a visualização de dados é mapear números para propriedades de objetos, geralmente formas geométricas ou ‘GeoMS’. O que muda em relação aos números representados é a propriedade da codificação”, explica. Posição, forma, tamanho, cor, largura da linha e tipo de linha são algumas das codificações mais comuns.
“A escolha de codificações não é um processo arbitrário ou baseado apenas em preferências pessoais. A seleção deve depender do propósito da visualização. Sempre que projetamos um gráfico, precisamos nos perguntar: o que o meu leitor precisa ver neste gráfico? Que tipo de informações eu quero fornecer?”
O design visual e a estética são também essenciais na visualização dos dados. Para Cairo, aprender design visual é como aprender a escrever bem: não deve ser considerado a posteriori, porque pode beneficiar a todos.
Por último, o texto que acompanha a visualização ou as “camadas de anotação” cumprem um papel igualmente importante: títulos, cabeçalhos, explicações, rótulos e assim por diante. Ele cita como exemplo um gráfico publicado pelo Washington Post que, ao invés de usar um título seco – “Porcentagem de anos saudáveis versus expectativa de vida” – preferiu uma abordagem mais envolvente – “Quanto tempo vamos viver – e com que qualidade”.
A defesa de Cairo é que a visualização deve contribuir para que os dados façam sentido para as pessoas, enfatizando o que é importante em relação ao que é secundário e, sempre que possível, colocando os dados em contexto e explicando o que significam. Faz sentido, não?