Ein Tag im Leben eines Datenjournalisten – Idrees Kahloon, The Economist

Ein typischer Arbeitstag eines Datenjournalisten besteht aus der Auswertung von Tabellenkalkulationen und der sinnvollen Präsentation von Informationen Handbuch des Datenjournalismus Laut mehreren Beiträgen ist Datenjournalismus aus folgenden Gründen wichtig:

Es hilft dabei, den Datenfluss zu filtern
Bereitstellung eines neuen Ansatzes und neuer Techniken für das Geschichtenerzählen
Eine andere Form des Journalismus, wie es beispielsweise den Wortjournalismus oder den Fotojournalismus gibt
Datenjournalismus ist die Zukunft des Konsums von Inhalten im Web
Aktualisierung Ihrer Kenntnisse
Ein Mittel zur Informationsverarbeitung
Eine Antwort auf datengetriebene PR
Bereitstellung unabhängiger Interpretationen offizieller Informationen
Umgang mit der Datenflut
Zeitsparende Aktivität
und mehr…

Idrees Khaloon, ein frischgebackener Harvard-Absolvent der Angewandten Mathematik, arbeitet als Datenjournalist beim Economist. Dort ist er für die Zusammenarbeit mit Ressortjournalisten, Redakteuren, Entwicklern und Designern zuständig, um Datenvisualisierungen, Karten und Infografiken zu recherchieren und zu erstellen. Diese unterstützen die journalistischen Beiträge und gewährleisten die optimale Darstellung der Daten in allen Formaten (Print, App und Web) mit dem Ziel, längerfristige redaktionelle Produkte und Geschichten zu entwickeln. Aufgrund seiner vielseitigen Rolle im Unternehmen leitete Idrees am 27. Januar eine Veranstaltung Live-Fragerunde auf QuoraNachfolgend finden Sie den Ablauf der Sitzung sowie eine Zusammenfassung der Fragen und Antworten.

QA-Übersicht

Datenjournalismus – ein typischer Tag im Büro
Wie The Economist Daten analysiert, um Geschichten zu recherchieren
Umfragen und Umfragefehler
Zu den Geschichten, an denen ich mitgearbeitet habe, gehörten unter anderem:
- Modellierung der Ergebnisse des Brexit
- Eine Untersuchung darüber, ob die Zeitungsleserschaft die Unterstützung für Donald Trump vorhersagen kann
Karriereberatung im Datenjournalismus

Datenjournalismus – ein typischer Tag im Büro

Zunächst der Lebenszyklus einer Datenstory:

Ideengenerierung
Identifizierung vorhandener Datenquellen
Daten bereinigen und in Form bringen
Die Daten erkunden, oft etwas ziellos
Hypothesen auf interessante Schlussfolgerungen prüfen oder ein statistisches Modell erstellen (in der Regel nur erklärende Modelle; Vorhersagemodelle sind viel schwieriger)
Die schriftliche Ausarbeitung der Ergebnisse, die stets durch herkömmliche Berichterstattung ergänzt wird
Zu guter Letzt sollte man vor der Veröffentlichung auf Anmerkungen von Redakteuren und Faktencheckern reagieren

An einem typischen Arbeitstag erledigt ein Datenjournalist nicht all diese Aufgaben – aber einige davon schon. Die wohl anspruchsvollste Aufgabe, die ich je übernommen habe, war der Aufbau unseres GolfmodellNachdem einer meiner Kollegen das Framework für das Modell entwickelt hatte, das Faktoren wie Erfolgsserien und Wettereinflüsse berücksichtigt – und das in einer Excel-Tabelle! –, musste ich den Prototyp in Python übersetzen. Anschließend mussten wir herausfinden, wie wir Turniere mit diesem Modell simulieren konnten, was sich als gar nicht so einfach erwies. Nach ein bis zwei Wochen harter Arbeit funktionierte das Programm schließlich so gut, dass wir vergangene Turniere 10.000 Mal simulieren konnten. Trotz meiner Bemühungen erreichte Python, eine interpretierte Sprache, nicht annähernd die benötigte Geschwindigkeit. Daher wandten wir uns an einen Kollegen mit Doktortitel in Physik, der es schaffte, meinen Python-Code in C++ zu übersetzen – wodurch sich unsere Geschwindigkeit um mindestens eine Größenordnung verbesserte. Ein Riesenspaß!.

Bevor die Visualisierung unserer Diagramme stattfindet (die bereits erwähnte Datenerfassung und -verarbeitung in R und Python), ist viel Vorarbeit nötig. Sobald die aufbereiteten Daten vorliegen, verwenden wir zwei eigens entwickelte Diagrammwerkzeuge: ein Excel-Skript und ein Adobe Illustrator-Skript, das die Daten in ein Diagramm umwandelt.

Wie The Economist Daten analysiert, um Geschichten zu recherchieren

Sobald ich einen vielversprechenden Datensatz habe, bereinige ich ihn und bringe ihn mithilfe der Python-Bibliothek pandas oder R, der bei den Datenjournalisten hier beliebteren Bibliothek, in eine analysierbare Form. Sind die Daten aufbereitet, analysiere ich sie in der Regel genauer: Ich betrachte Durchschnittswerte, suche nach fehlenden oder ungewöhnlichen Werten und erstelle Diagramme zu Trends. Anschließend wählen wir die passenden Diagramme für den Artikel aus. Diese erstelle ich auf meinem Rechner und gebe sie dann an einen Datenvisualisierer weiter, der sie in unseren bekannten Stil einarbeitet. Das Besondere am Economist ist, dass es keine separate Datenjournalismus-Abteilung gibt – Datenjournalismus ist allgegenwärtig. Außerdem haben wir als Wochenzeitung im Vergleich zu unseren Kollegen bei den Tageszeitungen großzügige Abgabefristen. Die Erstellung von Datenartikeln ist in der Regel sehr zeitaufwendig, unter anderem wegen der Zeit, die für die Bereinigung und Verarbeitung unstrukturierter Daten benötigt wird. Wir haben das Glück, uns für unsere Artikel ausreichend Zeit nehmen und sie vor der Veröffentlichung gründlich aufbereiten zu können.

Anmerkungen zu Umfragen und Umfragefehlern

Die grundlegende Antwort, etwas nüchtern formuliert, lautet: verzerrte und nicht repräsentative Stichproben. Meinungsumfragen funktionieren nur dann, wenn die Stichprobe die Gesamtbevölkerung repräsentiert. Es gibt diverse Probleme, die diesem Ideal entgegenstehen – etwa die Verzerrung durch fehlende Antworten (bestimmte Personen antworten eher als andere) oder die Selbstselektionsverzerrung (beispielsweise würde eine Umfrage in einem exklusiven Club die Stichprobe verfälschen). Die Rohdaten, mit denen die meisten Meinungsforscher arbeiten, sind in der Regel stark verzerrt. So könnte die Stichprobe beispielsweise zu 60 % aus Männern bestehen, während der Anteil der Männer in der tatsächlichen Bevölkerung eher bei 50 % liegt. Um dies zu korrigieren, gewichten Meinungsforscher die Antworten, wodurch die Antworten von Frauen stärker gewichtet werden. Dies funktioniert recht gut, solange es nicht zu plötzlichen, unkontrollierten politischen Umwälzungen kommt, wie sie möglicherweise im letzten Jahr stattgefunden haben.

Ein weiterer Bereich mit Verbesserungspotenzial sind die Prognosen zur Wahlbeteiligung, die sich üblicherweise recht ungenau auf Wählerbefragungen vergangener Wahlen oder auf Selbsteinschätzungen stützen. Vermutlich sind ausgefeiltere Modelle mit individuellen Vorhersagen erforderlich. Wahlkämpfe in den USA haben in diesem Bereich bereits einen Vorsprung – oft unterstützt von hochqualifizierten Datenwissenschaftlern – und Meinungsforscher täten gut daran, von ihnen zu lernen.

Beispiele für Geschichten, an denen Idrees Kahloon gearbeitet hat

Modellierung der Ergebnisse des Brexit

Die größte Schwierigkeit bei der Modellierung des Brexit bestand darin, dass es keine vergleichbaren Daten gab, an denen wir uns orientieren konnten. Mein Kollege James Fransham und ich umgingen dieses Problem, indem wir Umfragedaten analysierten, um die besten Prädiktoren für die Brexit-Entscheidung (Leave oder Remain) zu ermitteln. Sofort zeigte sich, dass Bildung und soziale Schicht äußerst aussagekräftig waren, während Indikatoren für politisches Verhalten, die sich in der Vergangenheit bewährt hatten (wie die Parteizugehörigkeit), extrem schlecht abschnitten. Nachdem wir die wichtigsten Faktoren identifiziert hatten, nutzten wir Volkszählungsdaten, um die endgültigen Wahlergebnisse zu prognostizieren. Auch die Wahlbeteiligung modellierten wir mit einem ähnlichen Verfahren.

Das Wahlnachtmodell nutzte all diese Berechnungen als Basisprognose (eine Bayes'sche A-priori-Wahrscheinlichkeit). Mit Eintreffen der Ergebnisse passten wir das zugrundeliegende Modell dynamisch an und verbesserten so dessen Genauigkeit im Laufe der Nacht. Zum Leidwesen Großbritanniens, aber zum Glück für unser Modell, sagten wir den Brexit bereits eine Stunde nach Bekanntgabe der Ergebnisse voraus. Weitere Details, einschließlich der detaillierten statistischen Auswertung, finden Sie hier .

Prognose der Zeitungsleserschaft zur Unterstützung von Donald Trump

Das Ergebnis ist erstaunlich gut. Fragt man Wähler nach der Vertrauenswürdigkeit verschiedener Zeitungen, lässt sich ihre Wahlentscheidung in 88 % der Fälle vorhersagen. Und das ganz ohne Berücksichtigung weiterer hilfreicher Informationen wie ethnische Zugehörigkeit, Parteizugehörigkeit oder Bildungsniveau. Auch wenn dies statistisch gesehen ein Triumph ist, finde ich es doch etwas beunruhigend, dass die Einstellung zu den Medien so stark entlang parteipolitischer Linien polarisiert ist.

Wie bereitet man sich am besten auf eine Karriere im Datenjournalismus vor?

Um ein guter Datenjournalist zu sein, braucht man Kenntnisse in drei Bereichen: Statistik, Informatik und Schreiben. Schreiben im Allgemeinen und Journalismus im Speziellen lernt man am besten durch praktische Erfahrung. Wer sich für Journalismus interessiert, bereitet sich optimal vor, indem er ein Praktikum bei der Lokalzeitung absolviert und für die Schülerzeitung oder die Campuszeitung schreibt. Eine weitere Möglichkeit bietet die Fachpresse, wo man sich auf ein Nischengebiet spezialisiert, aber alle grundlegenden Fähigkeiten erwirbt, um über jedes beliebige Thema schreiben zu können. Es ist viel einfacher, von erfahrenen Journalisten zu lernen, als sich das Wissen selbst anzueignen. Die meisten Mitarbeiter des Economist haben beispielsweise nie Journalismus studiert.

Statistik und Informatik lernt man am besten im Hörsaal, von einem erfahrenen Dozenten, der Fehler frühzeitig erkennt und korrigiert. Wenn Sie Ihre Ausbildung bereits abgeschlossen haben, gibt es zahlreiche Online-Materialien und -Kurse, die Ihnen weiterhelfen können. Für eine fundierte Einführung in die Statistik empfehle ich das hervorragende Buch „ Introduction to Probability“ (und unbedingt die Übungsaufgaben!). Mit diesem Wissen werden Ihnen viele Themen, wie Ökonometrie und Maschinelles Lernen, viel verständlicher erscheinen.

Die meisten Programmierer sind heutzutage Autodidakten. Wie beim Schreiben gilt auch hier: Übung macht den Meister. Wähle eine Programmiersprache (Python ist für Anfänger meist am einfachsten), richte alles ein und versuche, einfache Programme zu schreiben. Je mehr du dich zum Programmieren zwingst, desto natürlicher wird es.

Welche weiteren Tipps würden Sie Datenjournalisten geben? Bitte hinterlassen Sie unten Ihre Kommentare.

SODP

SODP Media

Ein Tag im Leben eines Datenjournalisten – Idrees Kahloon, The Economist

Erstellt von

Faktencheck durch

Herausgegeben von

Inhaltsverzeichnis

Von Vahe Arabian

QA-Übersicht

Datenjournalismus – ein typischer Tag im Büro

Wie The Economist Daten analysiert, um Geschichten zu recherchieren

Anmerkungen zu Umfragen und Umfragefehlern

Beispiele für Geschichten, an denen Idrees Kahloon gearbeitet hat

Modellierung der Ergebnisse des Brexit

Wie bereitet man sich am besten auf eine Karriere im Datenjournalismus vor?

Um

Nützliche Links

Ausgewählte Artikel

SODP

Ein Tag im Leben eines Datenjournalisten – Idrees Kahloon, The Economist

Erstellt von

Faktencheck durch

Herausgegeben von

Inhaltsverzeichnis

Abonnieren Sie KI-Einblicke

Von Vahe Arabian

QA-Übersicht

Datenjournalismus – ein typischer Tag im Büro

Wie The Economist Daten analysiert, um Geschichten zu recherchieren

Anmerkungen zu Umfragen und Umfragefehlern

Beispiele für Geschichten, an denen Idrees Kahloon gearbeitet hat

Modellierung der Ergebnisse des Brexit

Wie bereitet man sich am besten auf eine Karriere im Datenjournalismus vor?

Ähnliche Beiträge

Nützliche Links

Ausgewählte Artikel