SODP logo

    Ein Tag im Leben eines Datenjournalisten – Idrees Kahloon, The Economist

    Ein typischer Arbeitstag eines Datenjournalisten besteht aus der Auswertung von Tabellenkalkulationen und der sinnvollen Präsentation von Informationen, wie das Handbuch für Datenjournalismus jedoch feststellt…
    Aktualisiert am: 1. Dezember 2025
    Vahe Arabian

    Erstellt von

    Vahe Arabian

    Vahe Arabian

    Faktencheck durch

    Vahe Arabian

    Vahe Arabian

    Herausgegeben von

    Vahe Arabian

    Ein typischer Arbeitstag eines Datenjournalisten besteht aus der Auswertung von Tabellenkalkulationen und der sinnvollen Präsentation von Informationen Handbuch des Datenjournalismus Laut mehreren Beiträgen ist Datenjournalismus aus folgenden Gründen wichtig:
    • Es hilft dabei, den Datenfluss zu filtern
    • Bereitstellung eines neuen Ansatzes und neuer Techniken für das Geschichtenerzählen
    •  Eine andere Form des Journalismus, wie es beispielsweise den Wortjournalismus oder den Fotojournalismus gibt
    • Datenjournalismus ist die Zukunft des Konsums von Inhalten im Web
    • Aktualisierung Ihrer Kenntnisse
    • Ein Mittel zur Informationsverarbeitung
    • Eine Antwort auf datengetriebene PR
    • Bereitstellung unabhängiger Interpretationen offizieller Informationen
    • Umgang mit der Datenflut
    • Zeitsparende Aktivität
    • und mehr…
    Idrees Khaloon, ein frischgebackener Harvard-Absolvent der Angewandten Mathematik, arbeitet als Datenjournalist beim Economist. Dort ist er für die Zusammenarbeit mit Ressortjournalisten, Redakteuren, Entwicklern und Designern zuständig, um Datenvisualisierungen, Karten und Infografiken zu recherchieren und zu erstellen. Diese unterstützen die journalistischen Beiträge und gewährleisten die optimale Darstellung der Daten in allen Formaten (Print, App und Web) mit dem Ziel, längerfristige redaktionelle Produkte und Geschichten zu entwickeln. Aufgrund seiner vielseitigen Rolle im Unternehmen leitete Idrees am 27. Januar eine Veranstaltung Live-Fragerunde auf QuoraNachfolgend finden Sie den Ablauf der Sitzung sowie eine Zusammenfassung der Fragen und Antworten.

    QA-Übersicht

    • Datenjournalismus – ein typischer Tag im Büro
    • Wie The Economist Daten analysiert, um Geschichten zu recherchieren
    • Umfragen und Umfragefehler
    • Zu den Geschichten, an denen ich mitgearbeitet habe, gehörten unter anderem:
      • Modellierung der Ergebnisse des Brexit
      • Eine Untersuchung darüber, ob die Zeitungsleserschaft die Unterstützung für Donald Trump vorhersagen kann
    • Karriereberatung im Datenjournalismus

    Datenjournalismus – ein typischer Tag im Büro

    Zunächst der Lebenszyklus einer Datenstory:
    • Ideengenerierung
    • Identifizierung vorhandener Datenquellen
    • Daten bereinigen und in Form bringen
    • Die Daten erkunden, oft etwas ziellos
    • Hypothesen auf interessante Schlussfolgerungen prüfen oder ein statistisches Modell erstellen (in der Regel nur erklärende Modelle; Vorhersagemodelle sind viel schwieriger)
    • Die schriftliche Ausarbeitung der Ergebnisse, die stets durch herkömmliche Berichterstattung ergänzt wird
    • Zu guter Letzt sollte man vor der Veröffentlichung auf Anmerkungen von Redakteuren und Faktencheckern reagieren
    An einem typischen Arbeitstag erledigt ein Datenjournalist nicht all diese Aufgaben – aber einige davon schon. Die wohl anspruchsvollste Aufgabe, die ich je übernommen habe, war der Aufbau unseres GolfmodellNachdem einer meiner Kollegen das Framework für das Modell entwickelt hatte, das Faktoren wie Erfolgsserien und Wettereinflüsse berücksichtigt – und das in einer Excel-Tabelle! –, musste ich den Prototyp in Python übersetzen. Anschließend mussten wir herausfinden, wie wir Turniere mit diesem Modell simulieren konnten, was sich als gar nicht so einfach erwies. Nach ein bis zwei Wochen harter Arbeit funktionierte das Programm schließlich so gut, dass wir vergangene Turniere 10.000 Mal simulieren konnten. Trotz meiner Bemühungen erreichte Python, eine interpretierte Sprache, nicht annähernd die benötigte Geschwindigkeit. Daher wandten wir uns an einen Kollegen mit Doktortitel in Physik, der es schaffte, meinen Python-Code in C++ zu übersetzen – wodurch sich unsere Geschwindigkeit um mindestens eine Größenordnung verbesserte. Ein Riesenspaß!.

    Bevor die Visualisierung unserer Diagramme stattfindet (die bereits erwähnte Datenerfassung und -verarbeitung in R und Python), ist viel Vorarbeit nötig. Sobald die aufbereiteten Daten vorliegen, verwenden wir zwei eigens entwickelte Diagrammwerkzeuge: ein Excel-Skript und ein Adobe Illustrator-Skript, das die Daten in ein Diagramm umwandelt.

    Wie The Economist Daten analysiert, um Geschichten zu recherchieren

    Sobald ich einen vielversprechenden Datensatz habe, bereinige ich ihn und bringe ihn mithilfe der Python-Bibliothek pandas oder R, der bei den Datenjournalisten hier beliebteren Bibliothek, in eine analysierbare Form. Sind die Daten aufbereitet, analysiere ich sie in der Regel genauer: Ich betrachte Durchschnittswerte, suche nach fehlenden oder ungewöhnlichen Werten und erstelle Diagramme zu Trends. Anschließend wählen wir die passenden Diagramme für den Artikel aus. Diese erstelle ich auf meinem Rechner und gebe sie dann an einen Datenvisualisierer weiter, der sie in unseren bekannten Stil einarbeitet. Das Besondere am Economist ist, dass es keine separate Datenjournalismus-Abteilung gibt – Datenjournalismus ist allgegenwärtig. Außerdem haben wir als Wochenzeitung im Vergleich zu unseren Kollegen bei den Tageszeitungen großzügige Abgabefristen. Die Erstellung von Datenartikeln ist in der Regel sehr zeitaufwendig, unter anderem wegen der Zeit, die für die Bereinigung und Verarbeitung unstrukturierter Daten benötigt wird. Wir haben das Glück, uns für unsere Artikel ausreichend Zeit nehmen und sie vor der Veröffentlichung gründlich aufbereiten zu können.

    Anmerkungen zu Umfragen und Umfragefehlern

    Die grundlegende Antwort, etwas nüchtern formuliert, lautet: verzerrte und nicht repräsentative Stichproben. Meinungsumfragen funktionieren nur dann, wenn die Stichprobe die Gesamtbevölkerung repräsentiert. Es gibt diverse Probleme, die diesem Ideal entgegenstehen – etwa die Verzerrung durch fehlende Antworten (bestimmte Personen antworten eher als andere) oder die Selbstselektionsverzerrung (beispielsweise würde eine Umfrage in einem exklusiven Club die Stichprobe verfälschen). Die Rohdaten, mit denen die meisten Meinungsforscher arbeiten, sind in der Regel stark verzerrt. So könnte die Stichprobe beispielsweise zu 60 % aus Männern bestehen, während der Anteil der Männer in der tatsächlichen Bevölkerung eher bei 50 % liegt. Um dies zu korrigieren, gewichten Meinungsforscher die Antworten, wodurch die Antworten von Frauen stärker gewichtet werden. Dies funktioniert recht gut, solange es nicht zu plötzlichen, unkontrollierten politischen Umwälzungen kommt, wie sie möglicherweise im letzten Jahr stattgefunden haben.

    Ein weiterer Bereich mit Verbesserungspotenzial sind die Prognosen zur Wahlbeteiligung, die sich üblicherweise recht ungenau auf Wählerbefragungen vergangener Wahlen oder auf Selbsteinschätzungen stützen. Vermutlich sind ausgefeiltere Modelle mit individuellen Vorhersagen erforderlich. Wahlkämpfe in den USA haben in diesem Bereich bereits einen Vorsprung – oft unterstützt von hochqualifizierten Datenwissenschaftlern – und Meinungsforscher täten gut daran, von ihnen zu lernen.

     Beispiele für Geschichten, an denen Idrees Kahloon gearbeitet hat

    Modellierung der Ergebnisse des Brexit

    Die größte Schwierigkeit bei der Modellierung des Brexit bestand darin, dass es keine vergleichbaren Daten gab, an denen wir uns orientieren konnten. Mein Kollege James Fransham und ich umgingen dieses Problem, indem wir Umfragedaten analysierten, um die besten Prädiktoren für die Brexit-Entscheidung (Leave oder Remain) zu ermitteln. Sofort zeigte sich, dass Bildung und soziale Schicht äußerst aussagekräftig waren, während Indikatoren für politisches Verhalten, die sich in der Vergangenheit bewährt hatten (wie die Parteizugehörigkeit), extrem schlecht abschnitten. Nachdem wir die wichtigsten Faktoren identifiziert hatten, nutzten wir Volkszählungsdaten, um die endgültigen Wahlergebnisse zu prognostizieren. Auch die Wahlbeteiligung modellierten wir mit einem ähnlichen Verfahren.

    Das Wahlnachtmodell nutzte all diese Berechnungen als Basisprognose (eine Bayes'sche A-priori-Wahrscheinlichkeit). Mit Eintreffen der Ergebnisse passten wir das zugrundeliegende Modell dynamisch an und verbesserten so dessen Genauigkeit im Laufe der Nacht. Zum Leidwesen Großbritanniens, aber zum Glück für unser Modell, sagten wir den Brexit bereits eine Stunde nach Bekanntgabe der Ergebnisse voraus. Weitere Details, einschließlich der detaillierten statistischen Auswertung, finden Sie hier .

    Prognose der Zeitungsleserschaft zur Unterstützung von Donald Trump

    Das Ergebnis ist erstaunlich gut. Fragt man Wähler nach der Vertrauenswürdigkeit verschiedener Zeitungen, lässt sich ihre Wahlentscheidung in 88 % der Fälle vorhersagen. Und das ganz ohne Berücksichtigung weiterer hilfreicher Informationen wie ethnische Zugehörigkeit, Parteizugehörigkeit oder Bildungsniveau. Auch wenn dies statistisch gesehen ein Triumph ist, finde ich es doch etwas beunruhigend, dass die Einstellung zu den Medien so stark entlang parteipolitischer Linien polarisiert ist.

    Wie bereitet man sich am besten auf eine Karriere im Datenjournalismus vor?

    Um ein guter Datenjournalist zu sein, braucht man Kenntnisse in drei Bereichen: Statistik, Informatik und Schreiben. Schreiben im Allgemeinen und Journalismus im Speziellen lernt man am besten durch praktische Erfahrung. Wer sich für Journalismus interessiert, bereitet sich optimal vor, indem er ein Praktikum bei der Lokalzeitung absolviert und für die Schülerzeitung oder die Campuszeitung schreibt. Eine weitere Möglichkeit bietet die Fachpresse, wo man sich auf ein Nischengebiet spezialisiert, aber alle grundlegenden Fähigkeiten erwirbt, um über jedes beliebige Thema schreiben zu können. Es ist viel einfacher, von erfahrenen Journalisten zu lernen, als sich das Wissen selbst anzueignen. Die meisten Mitarbeiter des Economist haben beispielsweise nie Journalismus studiert.

    Statistik und Informatik lernt man am besten im Hörsaal, von einem erfahrenen Dozenten, der Fehler frühzeitig erkennt und korrigiert. Wenn Sie Ihre Ausbildung bereits abgeschlossen haben, gibt es zahlreiche Online-Materialien und -Kurse, die Ihnen weiterhelfen können. Für eine fundierte Einführung in die Statistik empfehle ich das hervorragende Buch „ Introduction to Probability“ (und unbedingt die Übungsaufgaben!). Mit diesem Wissen werden Ihnen viele Themen, wie Ökonometrie und Maschinelles Lernen, viel verständlicher erscheinen.

    Die meisten Programmierer sind heutzutage Autodidakten. Wie beim Schreiben gilt auch hier: Übung macht den Meister. Wähle eine Programmiersprache (Python ist für Anfänger meist am einfachsten), richte alles ein und versuche, einfache Programme zu schreiben. Je mehr du dich zum Programmieren zwingst, desto natürlicher wird es.

      Welche weiteren Tipps würden Sie Datenjournalisten geben? Bitte hinterlassen Sie unten Ihre Kommentare.
    0
    Ich würde mich über eure Meinung freuen, bitte kommentiert. x