- Isso ajuda a filtrar o fluxo de dados
- Proporcionando uma nova abordagem e técnicas para contar histórias.
- Uma forma diferente de jornalismo, assim como existe o jornalismo escrito e o fotojornalismo
- O jornalismo de dados é o futuro do consumo de conteúdo na web
- Atualizando suas habilidades
- Uma solução para o processamento de informações
- Uma resposta para relações públicas orientadas por dados
- Fornecer interpretações independentes de informações oficiais
- Lidando com o dilúvio de dados
- Atividade que economiza tempo
- e muito mais…
Resumo de perguntas e respostas
- Jornalismo de dados – um dia típico no escritório
- Como a revista The Economist analisa dados para produzir suas reportagens
- Pesquisas eleitorais e erros de pesquisa
- Algumas das histórias em que trabalhei incluem:
- Modelando os resultados do Brexit
- Analisando se a leitura de jornais pode prever o apoio a Donald Trump
- Conselhos de carreira em jornalismo de dados
Jornalismo de dados – um dia típico no escritório
Primeiramente, aqui está o ciclo de vida de uma história de dados:- Geração de ideias
- Identificação de fontes de dados existentes
- Limpar e organizar os dados, dando-lhes formatação adequada
- Explorando os dados, muitas vezes de forma um tanto sem rumo
- Testar suas hipóteses para chegar a conclusões interessantes ou construir um modelo estatístico (geralmente apenas explicativo; modelos preditivos são muito mais difíceis)
- Redigir suas conclusões, que sempre são complementadas por relatórios convencionais, também é fundamental
- Por último, mas não menos importante, responder aos editores e verificadores de fatos antes da publicação
Muito trabalho é investido em nossos gráficos antes que a mágica da visualização aconteça (a coleta e o processamento de dados em R e Python que mencionei). Assim que os dados limpos estão prontos, utilizamos duas ferramentas de criação de gráficos personalizadas: um script em Excel e um script em Adobe Illustrator que converte os dados em um gráfico propriamente dito.
Como a revista The Economist analisa dados para produzir suas reportagens
Assim que tenho um conjunto de dados promissor em mãos, limpo-o e o organizo em um formato analisável usando a biblioteca pandas do Python ou o R, que é a escolha mais popular entre os jornalistas de dados aqui. Depois que os dados estão organizados, costumo explorá-los um pouco: observo as médias, verifico se há valores ausentes ou estranhos e crio gráficos de tendências. A partir daí, decidimos quais gráficos acompanharão a matéria. Eu os crio no meu computador e depois os envio para um visualizador de dados para que ele os adapte ao nosso estilo característico. O que torna o The Economist único é que não existe uma seção de jornalismo de dados específica na publicação; ele está presente em todos os lugares. Em segundo lugar, como um jornal semanal, temos prazos generosos em comparação com nossos colegas dos jornais diários. Produzir matérias com dados geralmente leva bastante tempo, em parte devido ao tempo necessário para limpar e processar dados complexos. Temos a sorte de poder dedicar o tempo necessário às matérias e dar-lhes um tratamento rigoroso antes da publicação.Comentários sobre pesquisas de opinião e erros em pesquisas de opinião
A resposta básica, para dizer de forma um tanto monótona, é que as amostras são tendenciosas e não representativas. As pesquisas funcionam se, e somente se, a amostra representar toda a população. Há diversos problemas que impedem que esse padrão de excelência seja alcançado — viés de não resposta (certas pessoas são mais propensas a responder às suas perguntas do que outras) ou viés de autoseleção (realizar uma pesquisa em um clube de campo, por exemplo, distorceria a amostra). Os dados brutos com os quais a maioria dos institutos de pesquisa trabalha geralmente são bastante enviesados. Por exemplo, a amostra pode ser composta por 60% de homens, quando a população real é mais próxima de 50%. Para corrigir isso, os institutos de pesquisa aplicam ponderação, o que faz com que as respostas femininas tenham mais peso. Isso funciona muito bem, a menos que haja realinhamentos repentinos em eixos políticos descontrolados, o que pode ter ocorrido no ano passado.Outra área que pode ser aprimorada são as projeções de comparecimento às urnas, que geralmente se baseiam de forma simplista em pesquisas de boca de urna de eleições anteriores ou em palpites autodeclarados. Modelos mais sofisticados, que incluam previsões individualizadas, provavelmente são necessários. As campanhas nos Estados Unidos já estão à frente nesse tipo de trabalho — muitas vezes com o apoio de cientistas de dados muito competentes — e os institutos de pesquisa fariam bem em aprender com eles.
Exemplo de histórias em que Idrees Kahloon trabalhou
Modelando os resultados do Brexit
A maior dificuldade na modelagem do Brexit foi a ausência de um modelo análogo para treinamento. Meu colega James Fransham e eu contornamos esse problema analisando microdados de pesquisas eleitorais para identificar os melhores indicadores de voto a favor ou contra a saída da União Europeia. Imediatamente, percebemos que escolaridade e classe social eram indicadores extremamente eficazes, enquanto indicadores de comportamento político que haviam funcionado bem no passado (como filiação partidária) apresentaram desempenho excepcionalmente ruim. Após identificarmos os fatores mais importantes, utilizamos dados do censo para projetar os resultados finais. Também modelamos a participação eleitoral utilizando um procedimento semelhante.
O modelo da noite da eleição usou todos esses cálculos como previsão base (uma distribuição a priori Bayesiana). À medida que os resultados chegavam, escrevemos um script que ajustava dinamicamente o modelo subjacente, tornando-o cada vez mais preciso ao longo da noite. Infelizmente para o Reino Unido, mas felizmente para o nosso modelo, estávamos prevendo o Brexit uma hora após a divulgação dos resultados. Você pode ver mais detalhes, incluindo as gloriosas estatísticas, aqui .
A leitura de jornais apoia a previsão de Donald Trump
Tem surpreendentemente bom. Se você perguntar a um eleitor o quão confiáveis eles consideram vários jornais, você pode prever o voto dele com 88% de precisão. Isso sem levar em conta outras informações relevantes, como raça, filiação partidária ou nível de escolaridade. Embora possa ser um triunfo para as estatísticas, acho um pouco desanimador que as atitudes em relação à mídia estejam tão polarizadas por linhas partidárias.
Qual a melhor forma de se preparar para uma carreira em jornalismo de dados?
Para ser um bom jornalista de dados, é preciso ter conhecimento em três áreas: estatística, informática e escrita. A escrita em geral, e o jornalismo em particular, são melhor aprendidos na prática. Se você se interessa por jornalismo, a melhor maneira de se preparar é estagiar em um jornal local e tentar escrever para a revista da sua escola ou para o jornal universitário. Outra opção é trabalhar na imprensa especializada, onde você se especializa em um nicho específico, mas adquire todas as habilidades básicas necessárias para escrever sobre qualquer assunto. É muito mais fácil aprender com jornalistas experientes do que tentar estudar tudo por conta própria. A maioria dos funcionários da The Economist , por exemplo, nunca estudou jornalismo formalmente.
Estatística e ciência da computação são melhor aprendidas em sala de aula, com um instrutor experiente que possa corrigir erros antes que se tornem muito arraigados. Se você já concluiu sua formação acadêmica, há uma grande variedade de materiais e cursos online que podem te ajudar. Para uma introdução rigorosa à estatística, recomendo a leitura do excelente livro "Introduction to Probability" (e a resolução dos exercícios!). Com essa base, você verá que muitos tópicos, como econometria e aprendizado de máquina, se tornarão muito mais acessíveis.
Hoje em dia, a maioria dos programadores aprende por conta própria. Assim como na escrita, o mais importante é praticar. Escolha uma linguagem (Python costuma ser a mais fácil para iniciantes), configure tudo e tente criar programas simples. Quanto mais você se esforçar para escrever código, mais natural isso se tornará.





