SODP logo

    Sehari Dalam Kehidupan Seorang Wartawan Data – Idrees Kahloon, The Economist

    Sehari dalam kehidupan seorang wartawan data boleh dilihat sebagai melihat hamparan dan menyampaikan maklumat dengan cara yang bermakna, walau bagaimanapun, seperti yang dinyatakan dalam buku panduan Kewartawanan Data…
    Dikemas kini Pada: 1 Disember 2025
    Vahe Arabian

    Dicipta Oleh

    Vahe Arabian

    Vahe Arabian

    Fakta Disemak Oleh

    Vahe Arabian

    Vahe Arabian

    Disunting Oleh

    Vahe Arabian

    Sehari dalam kehidupan seorang wartawan data boleh dilihat sebagai melihat hamparan dan menyampaikan maklumat dengan cara yang bermakna, walau bagaimanapun, sebagai Buku panduan Kewartawanan Data nota melalui beberapa penyumbang, Kewartawanan Data adalah penting atas sebab-sebab berikut:
    • Ia membantu menapis aliran data
    • Menyediakan pendekatan dan teknik baharu untuk bercerita
    •  Bentuk kewartawanan yang berbeza, seperti terdapat perkataan kewartawanan atau fotojurnalisme
    • Kewartawanan data adalah masa depan penggunaan kandungan di web
    • Mengemas kini set kemahiran anda
    • Satu penyelesaian untuk memproses maklumat
    • Jawapan kepada PR berasaskan data
    • Memberikan tafsiran bebas kepada maklumat rasmi
    • Menangani banjir data
    • Aktiviti menjimatkan masa
    • dan banyak lagi…
    Idrees Khaloon, seorang graduan Harvard baru-baru ini dalam bidang Matematik Gunaan, merupakan seorang Wartawan Data di Economist yang bertanggungjawab bekerjasama dengan wartawan terkemuka, editor bahagian, pembangun dan pereka untuk mendapatkan dan menghasilkan visualisasi data, kartografi dan infografik yang menyokong kisah wartawan dan memastikan perwakilan data terbaik dalam semua format (cetak, aplikasi dan web) dengan tujuan membangunkan produk dan kisah editorial paparan yang lebih panjang. Memandangkan peranannya yang bersilang yang menarik dalam organisasi, Pada 27 Januari, Idrees menjalankan Sesi soal jawab secara langsung di QuoraBerikut adalah garis besar sesi dan ringkasan soalan serta jawapan.

    Garis Panduan QA

    • Kewartawanan data – hari biasa di pejabat
    • Bagaimana The Economist memproses data untuk membuat liputan berita
    • Ralat tinjauan pendapat dan tinjauan pendapat
    • Antara cerita yang pernah saya garap termasuklah:
      • Memodelkan keputusan Brexit
      • Mengkaji sama ada pembaca akhbar boleh meramalkan sokongan untuk Donald Trump
    • Nasihat Kerjaya Kewartawanan Data

    Kewartawanan data – hari biasa di pejabat

    Pertama sekali, inilah kitaran hayat cerita data:
    • Penjanaan idea
    • Mengenal pasti sumber data sedia ada
    • Membersihkan dan menyusun semula data ke dalam bentuk
    • Meneroka data, selalunya agak tanpa tujuan
    • Menguji hipotesis anda untuk kesimpulan yang menarik atau membina model statistik (biasanya hanya penjelasan; model ramalan jauh lebih sukar)
    • Menulis dapatan anda, yang sentiasa dilengkapi dengan pelaporan konvensional
    • Akhir sekali, memberi maklum balas kepada editor dan pemeriksa fakta sebelum menerbitkan
    Dalam kehidupan seharian, seorang wartawan data tidak akan melakukan semua perkara ini—tetapi dia akan melakukan beberapa daripadanya. Tugasan paling mencabar yang mungkin pernah saya ambil ialah membina model golfSelepas salah seorang rakan sekerja saya membangunkan rangka kerja untuk model tersebut, yang mengambil kira perkara seperti garisan panas dan kesan cuaca—dalam helaian Excel—saya terpaksa menterjemahkan prototaip tersebut ke dalam Python. Kemudian kami perlu memikirkan cara untuk mensimulasikan kejohanan di bawah model ini, yang mana sesuatu yang tidak mudah. ​​Selepas seminggu atau dua minggu bertarung, program ini berfungsi dengan cukup baik untuk mensimulasikan kejohanan lalu sebanyak 10,000 kali. Walaupun saya telah berusaha sedaya upaya, Python, yang merupakan bahasa yang ditafsirkan, tidak mendapat kelajuan yang kami perlukan. Jadi kami berpaling kepada seorang rakan sekerja yang mempunyai PhD fizik, yang berjaya menterjemahkan Python saya ke dalam C++—meningkatkan kelajuan kami dengan magnitud tertentu atau lebih. Sangat menyeronokkan.

    Banyak kerja yang dilakukan untuk carta kita sebelum keajaiban visualisasi berlaku (pengumpulan dan pemprosesan data dalam R dan Python yang telah saya sebutkan). Setelah data yang dibersihkan siap, kita mempunyai dua alat carta tersuai yang kita gunakan untuk mencipta carta: skrip Excel dan skrip Adobe Illustrator yang menukar data menjadi carta sebenar.

    Bagaimana The Economist memproses data untuk membuat liputan berita

    Jadi, sebaik sahaja saya mempunyai set data yang menjanjikan, saya membersihkannya dan memasukkannya ke dalam bentuk yang boleh dianalisis menggunakan pustaka panda Python atau R, yang merupakan pilihan yang lebih popular di kalangan wartawan data di sini. Sebaik sahaja data kemas, saya biasanya akan meneroka sedikit: melihat purata, mencari jika ada nilai yang hilang atau pelik, graf beberapa trend. Dari situ, kami akan memutuskan carta yang betul untuk mengiringi cerita. Ini saya olok-olok pada mesin saya dan kemudian serahkan kepada visualiser data untuk dibawa ke dalam gaya terkenal kami. Apa yang menjadikan Economist unik ialah tiada bahagian kewartawanan data dalam perniagaan ini, ia ada di mana-mana. Kedua, sebagai akhbar mingguan, kami mempunyai tarikh akhir yang mewah berbanding rakan-rakan kami di akhbar harian. Menghasilkan cerita data biasanya mengambil sedikit masa, sebahagiannya kerana masa yang diperlukan untuk membersihkan dan memproses data yang tidak kemas. Kami cukup bernasib baik kerana dapat meluangkan masa dengan cerita dan memberikannya layanan yang teliti sebelum diterbitkan.

    Komen tentang tinjauan pendapat dan ralat tinjauan pendapat

    Jawapan asas, secara ringkasnya, adalah sampel yang berat sebelah dan tidak mewakili. Pengundian berfungsi jika, dan hanya jika, sampel mewakili seluruh populasi. Terdapat pelbagai jenis masalah yang menghalang piawaian emas ini—bias tanpa tindak balas (orang tertentu lebih cenderung untuk menjawab soalan anda berbanding orang lain) atau bias pemilihan kendiri (menjalankan tinjauan di kelab desa akan memesongkan sampel anda, sebagai contoh). Data mentah yang digunakan oleh kebanyakan peninjau biasanya agak memiring. Contohnya, sampel mungkin 60% lelaki sedangkan populasi sebenar lebih kurang 50%. Untuk menyelesaikannya, peninjau menggunakan pemberat, yang akan menjadikan respons wanita lebih bernilai. Ini berfungsi dengan baik melainkan terdapat penjajaran semula secara tiba-tiba di sepanjang paksi yang tidak terkawal dalam politik, yang mungkin berlaku pada tahun lepas.

    Satu lagi bidang yang perlu diperbaiki mungkin unjuran jumlah pengundi, yang biasanya bergantung secara malas pada tinjauan keluar daripada pilihan raya sebelumnya atau kemungkinan yang dilaporkan sendiri. Model yang lebih menarik, yang melibatkan ramalan individu, mungkin diperlukan. Kempen di Amerika sudah mempunyai permulaan yang lebih baik dalam kerja seperti ini—selalunya disokong oleh saintis data yang sangat bijak—dan peninjau pendapat mungkin perlu belajar daripadanya.

     Contoh cerita yang telah diusahakan oleh Idrees Kahloon

    Memodelkan keputusan Brexit

    Kesukaran terbesar dalam memodelkan Brexit adalah kerana tiada analog yang boleh kami gunakan untuk berlatih. Saya dan rakan sekerja saya, James Fransham, berjaya mengatasi perkara ini dengan melihat mikrodata tinjauan pendapat untuk mendapatkan gambaran yang jelas tentang peramal terbaik untuk mengundi Tinggalkan atau Kekal. Dengan serta-merta, kami dapat melihat bahawa pendidikan dan kelas sosial adalah sangat baik, manakala peramal tingkah laku politik yang telah berfungsi dengan baik pada masa lalu (seperti gabungan parti) menunjukkan prestasi yang sangat buruk. Sebaik sahaja kami mengenal pasti faktor yang paling penting, kami menggunakan nombor banci untuk mengunjurkan kiraan akhir. Kami juga memodelkan jumlah keluar mengundi menggunakan prosedur yang serupa.

    Model malam pilihan raya menggunakan semua pengiraan nombor ini sebagai ramalan asas (pendahuluan Bayesian). Sebaik sahaja keputusan dikeluarkan, kami menulis skrip yang melaraskan model asas secara dinamik, menjadikannya semakin tepat seiring dengan berlalunya waktu malam. Malangnya bagi United Kingdom, tetapi mujurlah bagi model kami, kami meramalkan Brexit dalam masa sejam selepas keputusan dikeluarkan. Anda boleh melihat sedikit lagi, termasuk butiran statistik yang hebat, di sini .

    Ramalan sokongan pembaca akhbar untuk Donald Trump

    Ia yang sangat baik. Jika anda bertanya kepada pengundi tentang sejauh mana mereka boleh dipercayai dalam menilai beberapa akhbar, anda boleh meramalkan undian mereka dengan ketepatan 88%. Itu tanpa memasukkan sebarang maklumat berguna lain seperti bangsa, gabungan parti atau tahap pendidikan. Walaupun statistik mungkin satu kejayaan, saya fikir agak mengecewakan bahawa sikap terhadap media terpolarisasi begitu kuat mengikut garis kepartian.

    Apakah cara terbaik untuk membuat persediaan bagi kerjaya dalam kewartawanan data?

    Pengetahuan tentang tiga perkara diperlukan untuk menjadi wartawan data yang baik: statistik, sains komputer dan penulisan. Menulis secara meluas dan khususnya kewartawanan paling baik dipelajari melalui amalan. Jika anda berminat dalam kewartawanan, cara terbaik untuk membuat persediaan adalah dengan menjalani latihan amali untuk akhbar tempatan anda dan cuba menulis untuk majalah atau kertas kampus sekolah anda. Satu lagi saluran ialah akhbar perdagangan, di mana anda mengkhusus dalam bidang khusus tetapi mempelajari semua kemahiran asas yang diperlukan untuk menulis tentang sebarang subjek. Lebih mudah untuk belajar daripada wartawan berpengalaman daripada cuba membaca tentang perkara ini. Kebanyakan kakitangan di The Economist tidak pernah mempelajari kewartawanan secara formal, contohnya.

    Statistik dan sains komputer paling baik dipelajari di dalam bilik darjah, daripada pengajar berpengalaman yang boleh membetulkan kesilapan sebelum ia terlalu sebati. Jika anda telah menamatkan pendidikan formal anda, terdapat banyak bahan dan kursus dalam talian yang boleh membantu anda. Untuk pengenalan statistik yang teliti, saya cadangkan anda membaca buku Pengenalan kepada Kebarangkalian (dan menyelesaikan masalahnya!). Dengan asas itu, anda akan mendapati bahawa banyak topik, seperti ekonometrik dan pembelajaran mesin, akan menjadi lebih mudah diakses.

    Kebanyakan pengaturcara belajar sendiri pada masa kini. Seperti penulisan, perkara yang paling penting di sini ialah melakukannya. Pilih bahasa (Python cenderung paling mudah untuk pemula), sediakan sesuatu, dan cuba bina program mudah. ​​Lebih banyak anda memaksa diri anda untuk menulis kod, lebih semula jadi ia akan menjadi.

      Apakah nasihat lain yang akan anda berikan tentang menjadi seorang wartawan data? Sila berikan komen anda di bawah.
    0
    Suka pendapat anda, sila komen. x
    ()
    x