SODP logo

    Sumber Data Teratas untuk Wartawan pada 2018 (350+ Sumber)

     Terdapat banyak jenis laman web yang menyediakan pelbagai data percuma, freemium dan berbayar yang dapat membantu pembangun khalayak dan wartawan dengan usaha pelaporan dan penceritaan mereka,…
    Dikemas kini Pada: 1 Disember 2025
    Vahe Arabian

    Dicipta Oleh

    Vahe Arabian

    Vahe Arabian

    Fakta Disemak Oleh

    Vahe Arabian

    Vahe Arabian

    Disunting Oleh

    Vahe Arabian

     Terdapat banyak jenis laman web yang menyediakan pelbagai data percuma, freemium dan berbayar yang dapat membantu pembangun khalayak dan wartawan dengan usaha pelaporan dan penceritaan mereka. Pasukan di State of Digital Publishing ingin mengiktiraf ini, yang diperoleh daripada carian manual dan pengiktirafan daripada khalayak sedia ada kami.

    1. Kaggle Kaggle merupakan laman web yang membolehkan pengguna meneroka pembelajaran mesin sambil menulis dan berkongsi kod berasaskan awan. Bergantung terutamanya pada semangat komuniti yang besar, laman web ini menganjurkan pertandingan set data untuk hadiah wang tunai dan hasilnya ia mempunyai sejumlah besar data yang dikumpulkan ke dalamnya. Sama ada anda mencari data sejarah daripada Bursa Saham New York, gambaran keseluruhan trend pengeluaran gula-gula di AS atau kod canggih, laman web ini penuh dengan maklumat. 2. Wikipedia Mustahil untuk berada di Internet untuk masa yang lama tanpa menemui artikel Wikipedia. Dengan artikel yang terdiri daripada sumber penuh dan rujukan biografi sejarah hinggalah garis masa masa hadapan yang dekat dan jauh, boleh dikatakan bahawa Wikipedia telah mengukuhkan statusnya sebagai ensiklopedia berasaskan web percuma. Antara entri yang berfungsi sebagai gambaran umum subjek dan banyak buku dan rujukan dalam talian yang disediakan oleh laman web ini, Wikipedia merupakan sahabat penulis dalam banyak aspek. 3. Merangkak Biasa Seperti yang dapat diandaikan daripada nama laman web tersebut, Common Crawl mencari atau "merangkak" web untuk data yang kemudiannya disimpan dan dibina dalam repositori terbuka yang boleh diakses oleh pengguna. Bagi dua contoh tentang apa yang mungkin dilakukan dengan laman web ini, penanda paten maya dan senarai komprehensif laman web yang menawarkan suapan RSS memberikan sedikit contoh betapa hebatnya aplikasi ini. Jika terdapat data atau perbandingan tapak yang ingin anda buat, ini adalah alat yang mudah diakses untuk mencipta maklumat asli. 4. EDRM EDRM, singkatan untuk Model Rujukan Penemuan Elektronik, ialah laman web untuk profesional undang-undang yang berdedikasi untuk merealisasikan potensi e-penemuan dan peraturan serta jangkaan tentang bagaimana maklumat ditadbir urus. Di samping itu, ahli EDRM bekerjasama untuk membangunkan piawaian kolaboratif, perisian dan alat pendidikan yang direka bentuk untuk memajukan matlamat komuniti. Untuk mendapatkan maklumat tentang cara teknologi boleh dan telah mengubah aspek prosedur dan pentadbiran amalan undang-undang, inilah laman web yang anda ingin lawati. 5. Mahout Mahout memberi tumpuan kepada perisian dengan nama yang sama yang cuba memikirkan logistik pembinaan persekitaran yang mampu mencipta aplikasi pembelajaran mesin berprestasi tinggi yang boleh diskalakan dan dicipta dengan cepat. Bagi penyelidik yang ingin menyusun dan memanipulasi set data mereka sendiri atau mencuba aplikasi pembelajaran mesin, perisian ini amat berguna. Laman ini akan mempunyai individu yang sedang dalam perjalanan untuk mahir dengan perisian ini. 6Projek Lemur Projek Lemur merupakan pangkalan data yang menumpukan pada sokongan penyelidikan tentang mendapatkan maklumat dan pengendalian teknologi bahasa manusia. Dengan laman web berjumlah kira-kira 1 bilion dan 10 bahasa yang dikumpul dari Januari 2009 hingga Februari 2009, jumlah bahan yang ada dan sokongan menjadikannya sumber yang sangat baik untuk penyelidik. Antara semua ini dan sokongan tambahan yang boleh didapati di laman web ini, sesiapa sahaja yang berminat dengan teknologi dan bahasa manusia akan mempunyai banyak bahan untuk digunakan di laman web ini. 7Projek Gutenberg Project Gutenberg ialah direktori yang memaparkan novel, kertas kerja dan karya lain yang berdomain awam. Koleksi eBook laman web ini mempunyai lebih 54,000 karya terdiri daripada bahan terkenal seperti Shakespeare, Mark Twain dan Jane Austen hinggalah karya yang kurang dikenali oleh nama-nama yang lebih kurang dikenali seperti Henri Bergson dan Samuel Butler. Sama ada ingin membaca novel klasik untuk dibaca ramai atau membuat kajian tentang bagaimana orang ramai mengalami kehidupan pada abad ke-19, Project Gutenberg ialah sumber yang sangat baik. 8Set Data Juta Lagu Ini merupakan laman web yang menempatkan set data penuh yang mengandungi ciri audio dan metadata kira-kira 1 juta lagu popular. Selain set data juta lagu utama, terdapat juga beberapa set data yang telah disumbangkan oleh komuniti dalam kategori berkaitan seperti lagu saduran, label genre dan lirik antara lain. Ahli sejarah muzik, penggemar atau penyelidik yang mahukan maklumat ini akan dapat menyusun data dengan agak mudah. ​​Ini mungkin merupakan set data paling luas mengenai perkara ini di seluruh Internet. 9. Amazon Semua orang mengenali Amazon sebagai peruncit digital, tetapi tahukah anda bahawa Amazon juga menganjurkan set data awam percuma yang terbuka untuk diakses oleh sesiapa sahaja tanpa perlu menyimpan atau memuat turun apa-apa pada peranti mereka sendiri? Dengan data yang merangkumi cuaca, persekitaran angkasa lepas dan maklumat meteorologi kepada imejan yang tertumpu pada pembangunan algoritma yang membantu dalam penglihatan komputer, terdapat banyak pilihan bagi mereka yang mahukan cara yang lebih mudah untuk menganalisis sejumlah besar data. 10. Kerajaan Terbuka Kanada Demi menggalakkan lebih banyak ketelusan, menarik lebih ramai rakyat untuk terlibat, dan menggalakkan dialog, Kerajaan Kanada menawarkan data yang meluas sebagai sebahagian daripada inisiatif Kerajaan Terbukanya. Di laman web ini, anda boleh menemui set data mengenai isu berkaitan kerajaan seperti tahap kapasiti tempat perlindungan gelandangan di Kanada serta angka serantau mengenai tahap penyertaan penutur Anglofon dan Francofon dalam sektor awam. Dengan akses kepada set data seperti ini, tidak perlu bergantung pada statistik orang lain untuk mencari maklumat. 11. Katalog Data Katalog Data, kini Portal Data, menawarkan pengguna laman web yang mudah untuk melayari portal data terbuka dari seluruh dunia. Dengan portal yang dinilai dan dikendalikan oleh pelbagai peringkat kerajaan, beberapa NGO, malah Bank Dunia, data yang tersedia untuk dianalisis adalah berkualiti tinggi. Pengguna mempunyai pilihan untuk melayari atau menyumbang portal data. Dari sudut penyelidikan, kepelbagaian subjek dan maklumat menjadikan laman web ini tempat yang sangat mudah untuk memulakan pencarian maklumat. 12Data.gov.uk Data.gov.uk ialah laman web yang membolehkan individu mencari dan mengakses data yang diterbitkan oleh pelbagai badan awam, jabatan kerajaan, pihak berkuasa tempatan dan agensi kerajaan. Di sini, para penyelidik boleh mendapatkan maklumat tentang iklim ekonomi untuk perniagaan kecil, perdagangan, import, industri dan eksport atau melakukan penyelidikan mengenai pembayaran melebihi £25,000 yang dibuat oleh jabatan kerajaan. Dengan laman web ini menyatakan secara jelas bahawa data tersebut boleh digunakan untuk penyelidikan, maklumat yang diliputi di sini mungkin menjana lebih banyak idea apabila para penyelidik menelitinya. 13Data.gov Laman ini merupakan tempat Kerajaan AS menyediakan data terbuka yang boleh diakses oleh orang ramai dalam bentuk set data. Selain data mentah, laman ini juga menawarkan beberapa alat yang boleh digunakan untuk membuat visualisasi data serta membina aplikasi untuk web dan mudah alih. Jangan salah sangka. Datanya sangat banyak dengan maklumat daripada aduan kad kredit kepada data program pinjaman pelajar persekutuan dalam lebih 197,000 set data. Laman ini menawarkan banyak peluang untuk inovasi dan analisis yang komprehensif. 14DataSF DataSF menawarkan beratus-ratus set data berkaitan dengan Bandar dan Daerah San Francisco. Berminat untuk melihat apa yang telah didesak oleh pelobi tempatan dan serantau? Adakah anda memerlukan statistik mengenai jenayah? Layari tab Pameran untuk melihat apa yang telah dicapai oleh orang ramai dengan data tersebut atau gunakan borang tersebut untuk membuat sumbangan. Dibuat dengan Data Terbuka dan menawarkan akademi, blog dan beberapa alatan lain, laman web ini sebahagian besarnya didorong oleh kerjasama dan komuniti. Ini menjadikannya aset untuk penyelidik. 15. DataFerrett DataFerrett berbeza daripada kebanyakan laman web kerana ia bukanlah repositori atau direktori tetapi lebih kepada alat yang membolehkan pengguna menyesuaikan data daripada sumber tempatan, negeri dan persekutuan melalui analisis dan pengekstrakan data. Alat ini membolehkan pengguna mencipta hamparan tersuai dan komprehensif dan kemudian menukarkan maklumat yang sama kepada peta atau graf tanpa perlu memuat turun atau mendayakan sebarang perisian lain. Mengatur input data yang besar dan mengubahnya menjadi sesuatu yang mudah dibaca tidak pernah semudah ini. 16. Inforum Melalui Universiti Maryland, Inforum menyediakan data ekonomi AS kepada orang ramai. Banyak agensi kerajaan AS telah menyumbang kepada laman web ini sehingga laman web ini kini menyimpan beribu-ribu "siri masa ekonomi", seperti yang dipanggilnya, dan ini mengandungi nombor pengeluaran perindustrian, indeks harga, statistik buruh dan penunjuk perniagaan. Data ini tersedia secara percuma dan boleh diakses sama ada dengan komputer riba peribadi atau desktop. Penyelidik yang ingin melihat dengan teliti data ekonomi mentah mempunyai sumber dalam Inforum. 17. Eropah Menurut nombor laman web itu sendiri, koleksi Europeana menyumbang lebih 50 juta rekod. Dengan menggunakan set data yang dipilih di sini, para penyelidik dapat menemui maklumat yang mereka cari dalam masa yang lebih singkat. Set data di sini merangkumi kategori seperti model 3D, peta Perang Dunia I Itali, dan juga koleksi lebih 20,000 foto bersejarah dari muzium Lithuania antara lain. Sama ada untuk carian sejarah umum atau sebagai titik permulaan untuk meneliti rekod besar Europeana, ini merupakan sumber yang sangat baik untuk dimiliki. 18Penjaga Selain liputan tanpa henti tentang berita dan peristiwa terkini, The Guardian juga mempunyai keseluruhan bahagian yang dikhaskan untuk ringkasan data. Artikel-artikel di sini terdiri daripada topik serius seperti keberkesanan dasar perumahan mengenai gelandangan kepada subjek yang lebih ringan seperti negara mana yang mempunyai paling banyak pemenang hadiah Nobel. Wartawan dan penyelidik tidak kekurangan maklumat untuk digunakan dalam projek mereka sendiri dari laman web ini. Dengan bantuan carian pantas, adalah mungkin untuk mencari data tentang apa sahaja. 19Omnibus Ekspresi Gen Dihoskan oleh Pusat Kebangsaan untuk Maklumat Bioteknologi, Gene Expression Omnibus ialah laman web yang mengandungi "data genomik berfungsi awam" yang mematuhi piawaian MIAME (Maklumat Minimum Mengenai Eksperimen Microarray). Laman web ini juga menerima data yang disusun atau dijujukan sambil menyediakan alatan yang diperlukan untuk mencari dan memuat turun maklumat tersebut. Mereka yang berminat untuk mengkaji genom atau memperoleh maklumat mengenai subjek tersebut akan mempunyai semua data yang mereka perlukan di sini dan kemudian beberapa lagi. 20Universiti Chicago Pusat Sains Data Ruang (CSDS) Universiti Chicago, yang telah lama diiktiraf atas sumbangannya kepada inovasi dan kemajuan dalam bidang sains sosial, meneroka sempadan seterusnya dengan penerokaannya dalam analisis dan teknologi ruang. Kerja CSDS mempunyai aplikasi dalam hampir mana-mana bidang yang perlu bersaing dengan ruang dalam menangani isu-isu tersebut. Akibatnya, bidang seperti ekonomi alam sekitar, kesihatan awam dan kriminologi semuanya telah mendapat manfaat daripada aplikasi ini. Dedikasi CSDS kepada perisian sumber terbuka dan pengedaran maklumatnya menjadikan data yang disediakan lebih mudah diakses. 21Konect Melalui penggunaan data yang dikumpul oleh Institut Sains dan Teknologi Web Universiti Koblenz-Landau, KONECT (Koleksi Rangkaian Koblenz) menawarkan penyelidikan yang dilakukan dalam bidang sains rangkaian dan subjek berkaitannya. Projek ini menggunakan satu siri alat analisis rangkaian perisiannya sendiri untuk mengira nombor dan menghasilkan plot dan algoritma yang dilukis. KONECT kemudiannya mengehos hasil kerja analitiknya terus di laman web. Dengan lebih 200 set data untuk dipilih, ini merupakan sumber yang berbaloi untuk diterokai. 22Data MI MIdata ialah laman web yang bertindak sebagai repositori untuk data yang sepatutnya digunakan oleh data pembelajaran mesin. Set data ini boleh terdiri daripada himpunan ekspresi wajah manusia kepada topik yang lebih saintifik seperti meramalkan bagaimana molekul akan terikat. Dengan entri yang dibahagikan kepada kategori yang menawarkan akses kepada data mentah, tutorial dalam bahagian bahan dan kaedah, serta tugasan dan cabaran pembelajaran, laman web ini membolehkan penyelidik menghuraikan repositori untuk set data yang menarik. 23NASDAQ NASDAQ ialah bursa saham terkenal di dunia yang telah lama menjadi sumber yang sangat baik untuk wartawan dan penyelidik yang mencari data daripada dunia kewangan dan perniagaan. Di sini anda akan menemui maklumat tentang IPO, data harga bersejarah dan berita kewangan terkini yang menjadikan laman web ini destinasi dalam talian untuk data kewangan. NASDAQ Composite juga menawarkan pilihan data berbayar bagi mereka yang ingin melakukan analisis yang lebih mendalam. Ini merupakan sumber yang sangat dihormati dan mantap. 24NASA Bermula sejak pendaratan di bulan, kini semua orang telah mendengar tentang agensi kerajaan ini dan penerokaannya ke angkasa lepas. Walau bagaimanapun, yang menarik minat wartawan ialah bagaimana NASA juga merupakan sumber data yang berharga melalui Arkib Terselaras Data Sains Angkasa Lepasnya. Di sini, para penyelidik dapat mencari data misi sains angkasa lepas dalam kategori seperti astrofizik, sumber imej dan heliofizik antara lain. Di samping itu, terdapat juga banyak kertas putih yang tersedia di laman web ini untuk disertakan dengan data baharu yang dihantar. 25Socrata Socrata ialah laman web yang mengambil data kerajaan yang tersedia dan memasukkannya ke dalam format yang memudahkan orang ramai menganalisis, mengklik dan mencari maklumat yang mereka cari. Direka khusus dengan mengambil kira keperluan individu bukan teknikal seperti pakar dasar awam, penyelidik, usahawan dan rakyat yang prihatin, Socrata menggunakan awan untuk mengumpulkan data daripada pelbagai sumber. Bagi wartawan yang cuba memahami keberkesanan dasar yang berbeza, ini adalah platform yang berguna. 26Quandl Quandle ialah laman web yang menawarkan terutamanya data ekonomi dan kewangan yang diformatkan dengan mengambil kira keperluan profesional pelaburan. Bergantung pada lebih 500 sumber maklumat daripada organisasi yang boleh dipercayai seperti CLS Group, PBB, bank pusat dan Zacks antara lain untuk mengagregatkan datanya, sumber data ini sesuai untuk penyelidik dan wartawan yang ingin mendapatkan gambaran keseluruhan secara sepintas lalu. Terima kasih kepada tambahan Excel laman web ini, mengakses data secara langsung juga tidak pernah semudah ini untuk pengguna. 27. Universiti Carnegie Mellon Universiti Carnegie Mellon mempunyai reputasi yang sewajarnya sebagai institusi akademik yang cemerlang. Apa yang ramai orang tidak tahu ialah StatLab Carnegie Mellon merupakan sumber yang berguna untuk wartawan yang mencari data. Arkib set data ini merangkumi data mengenai isu-isu seperti gaji pemain MLB Amerika Utara pada tahun 1986 serta data yang direka bentuk untuk digunakan dalam menilai ketepatan perisian statistik. Sebagai pertukaran untuk pengakuan, set data ini tersedia untuk kegunaan awam. 28. UCI Repositori Pembelajaran Mesin UC Irvine, yang dirujuk sebagai UCI, ialah laman web yang menyimpan banyak data menarik yang boleh digunakan oleh wartawan. Laman web ini mempunyai 394 set data setakat penulisan ini, dan mempunyai kelebihan tambahan iaitu mempunyai antara muka yang mudah dicari. Antara set data yang lebih popular termasuk maklumat tentang "Pengecaman Aktiviti Manusia Menggunakan Telefon Pintar", wain dan pemasaran bank antara subjek lain. Sebagai pertukaran untuk menggunakan semua data ini, laman web ini hanya meminta petikan. 29. UCR Jika anda seorang wartawan yang sedang mengkaji perkembangan pembelajaran mesin, halaman Pengelasan/Pengelompokan Siri Masa UCR akan menjadi bacaan yang sangat baik. Laman ini menyediakan dokumen taklimat berguna yang akan memberikan anda semua maklumat latar belakang yang perlu anda ketahui. Bersama-sama dengan gambaran keseluruhan tentang kandungan maklumat tersebut, laman ini juga menawarkan keupayaan untuk memuat turun data secara langsung. Ingatlah untuk menggunakan format petikan yang diminta oleh laman web ini jika anda menggunakan set data ini. 30. Banci AS Perlukan statistik tentang kekayaan penduduk? Ingin tahu pecahan jantina yang tepat bagi sesuatu bidang? Banci AS ialah laman web yang mempunyai semua data ini dan banyak lagi yang tersedia untuk tontonan umum. Isih data mengikut tahun atau wilayah, dan anda akan dapat dengan cepat menemui statistik yang kebanyakan orang tidak tahu telah difaktorkan ke dalam banci AS seperti sedia ada. Nombor-nombor ini tersedia dalam Excel dan Microsoft Word sebagai pilihan yang menjadikan data lebih mudah diakses oleh wartawan. 31. Wolfram Alpha Wolfram Alpha sebenarnya merupakan enjin pengiraan yang membolehkan pengguna memasukkan data yang mereka ingin tahu dan menerima pengiraan. Enjin ini melakukan data dan analisis statistik, kimia, tarikh dan masa, malah perkataan dan linguistik antara lain. Bagi pengguna yang cuba menemui cara baharu mengendalikan data, ini amat berguna kerana ia boleh menghasilkan pengiraan baharu dengan hanya menekan butang. Wartawan khususnya akan mendapat banyak manfaat dengan menggunakan ini sebagai sumber tambahan. 32. Yelp Ternyata Yelp bukan sekadar restoran dan ulasan perniagaan pengguna. Laman ulasan yang dipacu pengguna ini juga menyimpan set data yang memberi penyelidik akses kepada ulasan, data pengguna dan perniagaan untuk "tujuan peribadi, pendidikan dan akademik". Berdasarkan kiraan syarikat, terdapat 4.7 juta ulasan dan 156,000 perniagaan di 12 kawasan metropolitan yang termasuk dalam set data. Dengan angka tersebut, bahan dan trend yang berpotensi ditemui oleh penyelidik dalam data ini mungkin satu kejutan yang menyenangkan. 33. Dunia Data Ingin mempunyai senarai halaman Facebook yang telah dialih keluar? Bagaimanakah keupayaan untuk menyusun data ekonomi AS mengikut daerah? Data World ialah laman web yang membolehkan orang ramai berkongsi, mengehos, bekerjasama dan menjejaki data. Laman web ini juga merangkumi bahagian untuk wartawan yang menggariskan sebab-sebab mengapa Data World berguna untuk ahli profesion sambil turut menunjukkan keupayaan pengehosan kepada peramal FOIA yang diperkemas serta halaman yang direka untuk membantu dalam pengaturan. Secara keseluruhannya, ini merupakan gabungan data dan pengehosan data yang kukuh. 34. Buku Fakta Dunia Dikendalikan dan dikendalikan oleh CIA, World Factbook memberikan anda maklumat tentang struktur masyarakat, sejarah, ketenteraan dan situasi ekonomi untuk 267 buah negara berserta peta, bendera dan satu set zon waktu mengikut bahan-bahan dalam peta dunia. Laman ini menawarkan pandangan menyeluruh dan mendalam tentang perkara yang dibincangkan dengan cara yang melangkaui asas. Pendek kata, ini adalah sumber data yang sepatutnya ada dalam simpanan setiap wartawan. 35. HealthData.gov Diuruskan oleh Jabatan Kesihatan & Perkhidmatan Manusia AS, HealthData.gov menawarkan akses awam kepada "data kesihatan bernilai tinggi" dengan harapan dapat menarik perhatian usahawan, pembuat dasar dan penyelidik. Sekurang-kurangnya dalam bidang pembangunan produk dan perkhidmatan, orang ramai dapat memeriksa data ini dan mendapatkan hasil. Wartawan yang ingin mengetahui perkembangan terkini data kesihatan atau yang sedang menyemak kenyataan yang telah dikeluarkan oleh pegawai penjagaan kesihatan boleh menggunakan laman web ini untuk mencari jawapan. 36. UNICEF Ini merupakan laman web yang memberikan kredibiliti segera kepada wartawan yang menggunakan maklumat yang ditawarkannya. Statistik yang diliputi oleh UNICEF termasuk yang berkaitan dengan isu kesihatan dan hak asasi manusia seperti pendidikan, kesihatan ibu, kemiskinan kanak-kanak, air dan sanitasi, dan kecacatan kanak-kanak antara banyak kategori statistik lain yang disimpan. Ia berguna untuk penyelidik kerana ia terkini dan disokong oleh salah satu organisasi paling terkenal di planet ini. Wartawan tidak akan salah memetik sumber data ini. 37. Pertubuhan Kesihatan Sedunia Pertubuhan Kesihatan Sedunia merupakan sebuah organisasi antarabangsa yang mengumpulkan statistik dan maklumat kesihatan di seluruh dunia. Selain maklumat yang boleh didapati terus di laman utama, laman web ini juga menawarkan data melalui Balai Cerap Kesihatan Global. Data ini merangkumi maklumat tentang langkah-langkah yang diambil oleh negara-negara ke arah penjagaan kesihatan sejagat, penyelidikan dan pembangunan kesihatan antara kategori lain. Wartawan akan menemui banyak maklumat tentang wabak, kecemasan kesihatan dan liputan penjagaan kesihatan dari perspektif antarabangsa di sini. 38. Data Awam Google Dengan adanya Data Awam Google, wartawan jelas dapat bergantung pada Google dalam lebih daripada satu cara. Enjin carian gergasi ini mempunyai data awam yang tersedia dan tersedia untuk dianalisis dengan lebih 100 set data awam. Subjek data terdiri daripada yang sangat serius dengan Petunjuk Pembangunan Dunia dan Petunjuk Pembangunan Manusia hinggalah yang menarik dengan data tentang jalan raya paling berbahaya di Eropah. Apa yang perlu dilakukan oleh penyelidik hanyalah menjalankan carian dan melihat apa yang dimiliki oleh Data Awam Google. 39. Penjaga Jurang Gap Minder menawarkan data mengenai beberapa penunjuk tempatan dan kebangsaan berserta pautan dan maklumat mengenai semua penyedia data. Dengan menggunakan laman web ini, para penyelidik boleh melihat maklumat seperti berapa umur wanita ketika mereka berkahwin buat kali pertama, statistik mengenai penggunaan alkohol dan punca kematian kanak-kanak. Bagi wartawan yang menulis dengan kecenderungan antarabangsa atau yang membuat data perbandingan, ini merupakan sumber yang sangat baik. Ini merupakan sumber data yang berguna walau apa pun. 40. Aliran Google Google Trends ialah alat yang memberi penyelidik pandangan tentang apa yang dicari orang ramai pada masa ini. Penyelidik boleh membandingkan data dengan trend yang telah berlaku pada masa lalu dan juga boleh menggunakan alat ini untuk membuat anggaran menjelang, contohnya musim cuti, bagi melihat apa yang akan berlaku untuk carian pada masa hadapan. Google Trends menawarkan graf, topik hangat dan banyak peluang untuk mendedahkan berita sebelum ia menjadi berita rasmi. 41. Kewangan Google Google Finance menawarkan peluang yang cepat dan mudah untuk melakukan carian yang lebih mendalam tentang syarikat yang telah dipuji oleh pelabur. Cara mudah untuk menapis penunjuk teknikal dan menyemak berita terkini tentang syarikat dalam satu tetingkap mudah dan ringkas yang membolehkan anda menyusun maklumat dengan lebih lanjut. Di samping itu, ia percuma. Bagi wartawan yang ingin menyelidik kewangan syarikat yang didagangkan, Google Finance menawarkan antara muka intuitif untuk mengakses maklumat ini. Malangnya, Google baru-baru ini telah menghentikan beberapa ciri teras seperti portfolio kewangan. Berikut adalah beberapa alternatif kepada Google Finance. 42. DBpedia Sesiapa yang pernah menginginkan cara yang lebih mudah untuk menjalankan carian Wikipedia mempunyai sebab untuk teruja dengan DBpedia. Dikuasakan oleh komitmen komuniti, laman web ini bertujuan untuk membolehkan carian yang lebih canggih dijalankan terhadap kandungan Wikipedia. Dengan versi Bahasa Inggeris yang mempunyai 4.58 juta entri dengan klasifikasi dan kategori yang berkaitan, laman web ini sedang dalam perjalanan untuk menawarkan liputan komprehensif berdasarkan maklumat dalam Wikipedia. Wartawan tidak akan salah dengan sumber data ini. 43. Penyelidikan Pew Bagi kebanyakan orang, Pew Research berada di peringkat atasan dalam hal tinjauan, laporan dan data penyelidikan. Laman ini merangkumi topik yang merangkumi pelbagai pendapat politik hingga trend dan perkembangan sosial dalam pelbagai industri tempat kerja. Pew Research juga mempunyai fungsi carian yang memudahkan akses maklumat berbanding sebelum ini. Wartawan yang mahukan statistik dan penemuan terkini yang datang daripada sumber yang dipercayai dan bereputasi baik tidak akan salah untuk beralih kepada Pew Research. 44. Institut Luas Bagi wartawan yang ingin mengetahui berita terkini berkaitan kanser, set data Broad Institute mungkin merupakan tempat yang sesuai untuk mencari maklumat tersebut. Ini juga merangkumi maklumat mengenai subjek tambahan seperti Bioinformatik & Biologi Pengkomputeran serta kanser otak dan penemuan corak molekul. Pendek kata, laman web ini memberi kelebihan kepada wartawan dari segi mencari data mendalam tentang kanser untuk menghasilkan cerita daripada data yang disediakan oleh Broad Institute. 45. UNdata UNdata menawarkan maklumat tentang pelbagai negara di seluruh dunia. Ini termasuk data seperti penunjuk teknikal, penunjuk sosial dan penunjuk ekonomi untuk setiap negara yang terlibat. Bagi wartawan yang sedang mengusahakan kisah-kisah berkaitan kepentingan manusia atau kisah-kisah yang boleh mendapat manfaat daripada disahkan oleh beberapa statistik dan data tambahan, UNdata adalah pilihan yang ideal. Ketepatan data serta reputasi PBB menjadikan sumber data ini boleh diandalkan oleh wartawan semasa menjalankan penyelidikan. 46. Google Scholar Bayangkan jika daripada menatal laman web, adalah mungkin untuk menemui carian yang hanya mengandungi kertas kerja yang disemak oleh rakan sebaya dan bahan akademik. Google Scholar membolehkan orang ramai mencari artikel jurnal, kertas putih dan penerbitan oleh cendekiawan terkemuka dunia. Seperti yang biasa berlaku untuk syarikat ini, Google Scholar adalah seintuitif yang mungkin dengan pengguna hanya perlu memasukkan kata kunci untuk memulakan. Mencari kertas kerja akademik tidak pernah semudah ini. 47. Reddit Dikenali paling umum sebagai "muka depan Internet", Reddit merupakan salah satu laman web paling popular di Internet. Selain menjadi pengukur tepat tentang apa yang berlaku dalam talian, laman web ini juga mempunyai subreddit, atau subforum, yang dikhaskan untuk set data juga. Pengguna boleh meminta set data, menyiarkan sumber dan mengadakan perbincangan tentang cara bekerja dengan data melalui format seperti JSON. Penyelidik mendapat banyak manfaat daripada meneliti sumber data ini. 48. Pasaran Data Qlik DataMarket membolehkan anda mengumpul dan mengendalikan data daripada sumber luaran. Platform ini membolehkan pengguna meminjam merentasi beberapa set data dengan pilihan untuk merujuk silangnya dengan data yang telah mereka miliki untuk memperhalusi pemahaman mereka tentang konteks yang lebih luas. Lebih baik lagi, walaupun ini merupakan platform berbayar bergantung pada perkara yang dikaji, terdapat juga pilihan percuma dengan Qlik Datamarket. Wartawan yang meneroka data boleh berbuat demikian sepuas hati mereka. 49. Hubspot Hubspot sentiasa menjadi peneraju pemikiran dalam pemasaran untuk perniagaan. Dari sudut pandangan menjalankan penyelidikan, ini adalah laman web yang akan memberitahu para penyelidik segala-galanya tentang apa yang berlaku dalam industri serta apa yang diperkatakan oleh orang ramai dalam industri pemasaran sekarang dalam masa nyata. Wartawan boleh menggunakan laman web ini untuk mengetahui lebih lanjut tentang trend. Sehubungan itu, Hubspot ialah sumber yang hebat untuk para penyelidik. 50. Biro Statistik Kehakiman Mungkin tidak menghairankan, Biro Kehakiman menyimpan banyak statistik. Di laman web Biro, anda boleh menemui angka mengenai penangkapan, kematian banduan, hukuman mati, statistik penguatkuasaan undang-undang dan banci penjara. Sistem keadilan jenayah merupakan subjek yang sentiasa menarik minat orang ramai dan mereka yang terlibat dengannya. Itulah yang menjadikan statistik Biro Kehakiman lebih berguna untuk wartawan yang melakukan penyelidikan mengenai sistem keadilan jenayah. 51. Laporan Jenayah Seragam Laporan Jenayah Seragam merupakan himpunan statistik mengenai jenayah harta benda dan jenayah kekerasan yang dikumpulkan oleh FBI. Walaupun agensi penguatkuasaan undang-undang dari seluruh AS telah melaporkan data ini sejak tahun 1930, penemuan tersebut telah diterbitkan sejak tahun 1958 boleh mencari di . Wartawan yang ingin meneroka data jenayah mempunyai pilihan untuk mengakses dan menggunakan alat data UCR untuk meneroka maklumat yang tersedia di laman web ini. 52. Pelaporan Jenayah Seragam Pelaporan Jenayah Seragam merupakan hasil daripada program yang difikirkan oleh Persatuan Ketua Polis Antarabangsa pada tahun 1929. Angka-angka yang dikumpulkan oleh FBI di sini diterbitkan empat kali setahun. Selain maklumat yang disediakan oleh program UCR, laman web ini juga merangkumi laporan mengenai statistik jenayah kebencian, Pegawai Penguatkuasa Undang-undang Terbunuh dan Diserang (LEOKA), serta keputusan dan angka yang disediakan oleh Sistem Pelaporan Berasaskan Insiden Kebangsaan. 53. NACJD NACJD, atau Arkib Data Keadilan Jenayah Kebangsaan, ialah laman web yang mendapatkan maklumat daripada set data seperti Laporan Jenayah Seragam (UCR) dan Tinjauan Mangsa Jenayah Kebangsaan (NCVS) dan kemudian menyimpan serta mengedarkan statistik tersebut. Direka bentuk untuk dikurasi, disimpan dan diselenggara untuk kebolehcapaian muktamad, data ini terdapat dalam beberapa bentuk termasuk eksperimen, kualitatif dan membujur. Akhirnya, ini menawarkan wartawan dan penyelidik lain cara lain untuk menggambarkan dan mengakses statistik keadilan jenayah. 54. Bank Data Pertama First Databank ialah laman web yang mengendalikan data ubat. Laman ini bertujuan untuk menggalakkan proses membuat keputusan yang lebih cekap dan berasaskan data dalam bidang farmaseutikal. Ini membolehkan doktor dan doktor mula berfikir tentang ubat farmaseutikal dengan cara yang berbeza melalui penggunaan teknologi inovatif First Databank. Dari sudut pandangan profesional, laman web ini amat berguna kerana bagaimana datanya dapat membantu pasukan menyesuaikan diri apabila maklumat baharu datang. Sekurang-kurangnya, ini merupakan sumber yang berguna untuk wartawan yang menulis dalam ruang farmaseutikal. 55. FDA FDA, yang dikenali sebagai Pentadbiran Makanan dan Ubat-ubatan, merupakan agensi yang bertanggungjawab melindungi kesihatan awam melalui penyeliaan dan kelulusan ubat-ubatan, produk makanan, suplemen, vaksin dan kosmetik antara produk pengguna yang lain. Sebagai sumber, FDA mempunyai set data yang tersedia untuk dibaca oleh orang ramai di samping menyediakan data teknikal untuk mereka yang selesa menggunakan hamparan dan menganalisis maklumat yang datang daripada set data. Ini sememangnya sumber yang berguna untuk wartawan. 56. Drugbase Pernahkah anda tertanya-tanya berapa sebenarnya jumlah yang dibayar oleh negara susulan wabak dadah? Adakah terdapat khabar angin tentang orang yang mengambil dadah secara berbeza daripada sebelumnya? Drugbase menawarkan pangkalan data yang penuh dengan statistik tentang trend dan penggunaan dadah di Amerika Syarikat. Terdapat infografik serta penerbitan mengenai topik seperti komorbiditi ketagihan dan penyakit mental atau fakta tentang pemanduan dalam keadaan mabuk (bukan dalam keadaan mabuk). Ini adalah sumber yang menyediakan maklumat yang mencukupi untuk mengenal pasti trend dan membuat perbandingan dengan data lepas. 57. UNODC UNODC, atau Pejabat Pertubuhan Bangsa-Bangsa Bersatu mengenai Dadah dan Jenayah, mempunyai laman web yang dikhaskan untuk mencapai matlamatnya bagi membantu negara anggota menerima pakai piawaian penyelidikan, pengumpulan data dan forensik yang lebih kukuh. Di laman web ini, para penyelidik boleh menemui pelbagai statistik dan penerbitan yang merangkumi subjek seperti pengumpulan data, analisis trend dan program penyelidikan jika boleh. Sumber yang penuh dengan maklumat tentang pelbagai topik berkaitan forensik serta sains subjek tersebut. 58. Fakta Perang Dadah Fakta Perang Dadah ialah laman web yang menawarkan perbincangan meluas tentang perang terhadap dadah serta akibat daripada dasar tersebut. Ini termasuk statistik dan angka mengenai butiran seperti perbandingan antara kos rawatan berbanding kos bergantung kepada penguatkuasaan undang-undang, angka mengenai anggaran perbelanjaan kawalan dadah dan pelbagai maklumat tentang hampir setiap topik yang berkaitan dengan perang terhadap dadah. Bagi kebanyakan orang, ini adalah laman web paling komprehensif di web berkenaan perang terhadap dadah. 59. Pusat Statistik Pendidikan Kebangsaan Pusat Statistik Pendidikan Kebangsaan, atau lebih dikenali sebagai NCES, merupakan tempat yang sesuai untuk mendapatkan sebarang statistik berkaitan pendidikan. Laman ini mempunyai statistik tentang keadaan pinjaman pelajar, unjuran trend pendidikan, berserta set data dan alat perbandingan yang boleh digunakan untuk melakukan analisis yang lebih mendalam. Wartawan boleh menggunakan sumber ini untuk mendedahkan trend, mengesahkan kenyataan awam, menyemak penerbitan Pusat Statistik Pendidikan Kebangsaan dan mencari cerita baharu dalam data. 60. Bank Dunia Bank Dunia menyimpan pelbagai statistik dan data yang dikumpulkan oleh Kumpulan Data Pembangunan dalam sektor kewangan serta makroekonomi. Data boleh disusun menggunakan hashtag. Pengguna boleh memilih antara pelbagai petunjuk dan membuat pilihan mengikut negara untuk menyemak ukuran kemajuan pembangunan yang berbeza. Oleh itu, ini merupakan sumber yang boleh dimanfaatkan oleh sesiapa sahaja yang melihat keadaan kewangan dan/atau ekonomi negara anggota. 61. Biro Statistik Buruh Biro Statistik Buruh merupakan sumber rujukan wartawan untuk mendapatkan nombor dan statistik yang berkaitan dengan keadaan kerja semasa, apa yang berlaku dalam pasaran buruh, serta bagaimana harga berubah dan mempengaruhi ekonomi AS. Dengan kerja statistik agensi yang bermula sejak tahun 1884, terdapat banyak data ekonomi untuk para penyelidik teliti. Laman ini menyimpan maklumat dalam antara muka mesra pengguna dan sentiasa mengemas kini data yang tersedia untuk carian. Ini merupakan sumber data yang patut diterokai. 62. Nombor-nombor Siaran filem blockbuster mendapat banyak perhatian media, tetapi sukar untuk mengetahui sejauh mana prestasi sesebuah syarikat tanpa angka. Masukkan "The Numbers". Laman web ini menawarkan penyelidikan dan data untuk industri filem dan hiburan. Penyelidik boleh meneroka anggaran pendapatan, jangkaan untuk siaran akan datang dan data pelaburan lain melalui kapasiti enjin carian berasaskan SQL OpusData. The Numbers ialah tempat pertama yang dikunjungi oleh penyelidik untuk mendapatkan statistik yang boleh dipercayai tentang filem dan filem. Itulah yang menjadikannya sumber yang sangat baik. 63. Filem Selamanya Film Forever ialah laman web yang boleh dilawati oleh para penyelidik untuk mendapatkan risikan pasaran dan data bagi industri filem di United Kingdom. Di sini, pengguna boleh menemui nombor box office mingguan untuk 15 keluaran teratas UK, kajian penonton, laporan, kajian kes dan Buku Tahunan Statistik utama organisasi tersebut. Di samping itu, laman web ini juga mempunyai kalendar yang memastikan penonton dimaklumkan tentang bila statistik seterusnya akan dikeluarkan. Niche Film Forever menjadikannya sumber data yang sangat berbaloi. 64. IFPI IFPI ialah laman web yang berbangga kerana dapat mengetahui perkembangan industri rakaman di seluruh dunia. Pengguna akan menemui laporan yang diterbitkan yang penuh dengan pandangan tentang muzik yang dirakam, data jualan kebangsaan dan global, serta laporan mengenai aspek perniagaan industri muzik yang menunjukkan bagaimana syarikat-syarikat melabur dalam muzik. Laporan ini membolehkan pengguna melihat apa yang sedang berlaku. Laman web ini akan memastikan para penyelidik sentiasa dikemas kini tentang apa yang sedang berlaku dalam industri muzik dalam masa nyata. 65. Statista Statista ialah enjin carian seperti Google, cuma laman web ini mengembalikan data dan statistik berbanding halaman web. Dengan satu tekan butang, pengguna boleh mendapatkan akses segera kepada lebih satu juta statistik dan fakta. Pengguna akan menemui infografik, statistik tentang China, industri makanan, pasaran pengguna, dan, dengan bayaran, dossier dan laporan industri juga tersedia untuk dilihat. Sama ada mencari maklumat tentang ekonomi, media sosial atau Big Mac, inilah tempatnya. 66. EPA EPA, yang merupakan singkatan bagi Agensi Perlindungan Alam Sekitar Amerika Syarikat, ialah agensi kerajaan yang bertanggungjawab melindungi manusia dan alam sekitar dengan menguatkuasakan undang-undang yang diwujudkan dan diluluskan melalui Kongres. Di laman web EPA, pengguna boleh melihat beberapa set data mengenai topik yang terdiri daripada pertanian hingga subjek yang sempit seperti pelepasan tahunan mengenai bahan kimia toksik dan kaedah pengurusan sisa. Laman ini merupakan pilihan yang sangat baik untuk wartawan yang mahukan akses kepada data alam sekitar mentah. 67. Pusat Kawalan dan Pencegahan Penyakit Laman web untuk Pusat Kawalan dan Pencegahan Penyakit ini menggelarkan dirinya sebagai "kedai sehenti untuk data kesihatan awam alam sekitar". Di laman web ini, para penyelidik akan menemui rujukan dan senarai kepada sistem data yang menerima dana negara sambil menjejaki dan menyimpan maklumat yang berkaitan dengan kebimbangan kesihatan awam alam sekitar. Dengan tumpuan kepada program yang beroperasi di peringkat kebangsaan dan aksesibiliti melalui keupayaan muat turun langsung, ini merupakan sumber yang boleh diandalkan untuk maklumat terkini dan paling tepat di web. 68. Pusat Kebangsaan untuk Kesihatan Alam Sekitar Ditubuhkan selepas penggabungan tiga agensi yang sebelum ini bebas, Pusat Kesihatan Alam Sekitar Kebangsaan merupakan tempat yang sesuai untuk mendapatkan maklumat berkualiti tinggi tentang alam sekitar. Menawarkan data komprehensif yang terdiri daripada data lautan hingga rekod ais dari berjuta-juta tahun yang lalu, jika isu tersebut melibatkan alam sekitar, kemungkinan besar laman web ini akan mempunyai maklumat mengenainya. Komitmen agensi terhadap ketepatan dan kecemerlangan dalam pengurusannya terhadap salah satu arkib terbesar seumpamanya juga menjadikannya salah satu daripada beberapa laman web dalam talian yang memiliki, mengemas kini dan menyelenggara data jenis ini. 69. Perkhidmatan Cuaca Kebangsaan Perkhidmatan Cuaca Kebangsaan Pentadbiran Lautan dan Atmosfera Kebangsaan akan memberitahu penyelidik semua yang mereka perlu tahu tentang cuaca. Laman ini menawarkan carian data yang merangkumi maklumat tentang kategori seperti amaran dan ramalan, iklim, ramalan geografi dan banyak lagi. Di samping itu, ia dilengkapi dengan peta yang intuitif dan mudah diikuti dengan tab yang boleh diklik untuk hasil yang berbeza. Sama ada menyemak apa yang berlaku di kawasan tempatan atau mencari ramalan untuk bandar di negeri yang berbeza, laman ini akan mendedahkan maklumat dengan cepat. 70. Wunderground Wunderground merupakan sumber yang didedikasikan untuk memastikan maklumat tentang cuaca tersedia untuk semua orang di seluruh dunia dengan perhatian juga diberikan kepada kawasan yang tidak menerima banyak liputan. Wunderground secara eksplisit menyatakan bahawa ia telah mengambil langkah untuk memastikan pengalaman pengguna cemerlang di pelbagai platform digital. Ini bermakna laman web ini boleh diakses melalui mudah alih dan juga melalui PC, menjadikannya sumber yang ideal untuk wartawan yang sentiasa bergerak. 71. Pangkalan Cuaca Weatherbase menyediakan maklumat tentang keadaan semasa, purata, maklumat iklim dan keadaan perjalanan untuk lebih 40,000 bandar di seluruh dunia dengan bantuan bar carian mudah. ​​Gunakan laman web pendamping yang dipautkan oleh laman web ini untuk mencari maklumat perjalanan tambahan seperti penukar mata wang, koordinat dan maklumat daerah antara fakta menarik yang lain. Weatherbase juga boleh digunakan untuk mencari tempat bercuti semata-mata berdasarkan cuaca. Selamat mencari! 72. Atlas Tenaga Diterbitkan di bawah Agensi Tenaga Antarabangsa, Atlas Tenaga membentangkan penyelidik dengan keupayaan untuk melihat dunia melalui statistik tenaga. Pada asalnya direka bentuk untuk menjadi sumber data pelengkap dari tarikh penubuhannya yang asal, laman web ini mempunyai imbangan tenaga aliran Sankey yang beranimasi serta beberapa pangkalan data untuk disertakan dengan penerbitan yang boleh diteliti di halaman statistik Agensi Tenaga Antarabangsa. Penyelidik akan mendapati kedua-dua laman web ini dan laman web pendampingnya sangat berguna semasa menyelidik cara negara dan bandar menggunakan tenaga. 73. Biro Analisis Ekonomi Biro Analisis Ekonomi, atau singkatannya BEA, menerbitkan pelbagai maklumat berguna yang membolehkan para penyelidik sentiasa mengikuti perkembangan ekonomi negara. Di laman web ini, terdapat angka-angka mengenai akaun ekonomi AS yang merangkumi angka perbelanjaan pengguna, KDNK dan aset tetap antara data berguna yang lain. Penyelidik boleh mencari mengikut wilayah atau industri serta mengikut tahap dengan pilihan carian antarabangsa, kebangsaan dan serantau. Cuba halaman data interaktif untuk mengetahui lebih lanjut tentang biro tersebut. 74. Biro Penyelidikan Ekonomi Kebangsaan Laman web Biro Penyelidikan Ekonomi Kebangsaan, atau NBER, merupakan sumber data yang mendekati ekonomi dari sudut pandangan analitikal. Ia menempatkan data mengenai pelbagai topik ekonomi dengan entri seperti Indeks Tadbir Urus Afrika, Kitaran Perniagaan Rasmi, Serentak Eksperimen, Indeks Terkemuka dan Kemelesetan, dan Pangkalan Data Sejarah Makro. NBER mempunyai set data rasmi yang diterbitkan dan disusun di bawah namanya sendiri serta indeks yang disusun oleh penerbit lain. 75. Suruhanjaya Sekuriti dan Bursa AS Suruhanjaya Sekuriti dan Bursa Amerika Syarikat merupakan sebuah agensi yang bertindak sebagai pengawas dalam mempromosikan ketelusan, keadilan dan kecekapan dalam pasaran. Menariknya, laman web ini mempunyai set data penyata kewangan yang bertarikh dari Januari 2009 hingga Oktober 2017 dengan kemas kini dibuat setiap suku tahun. Para penyelidik boleh bergantung pada laman web ini untuk mengikuti berita terkini berkaitan pemfailan dan maklumat yang boleh diberitahunya tentang syarikat dan keadaan kewangan mereka. 76. Tabung Kewangan Antarabangsa Tabung Kewangan Antarabangsa, juga dikenali sebagai IMF, merupakan sebuah organisasi yang mantap dalam sektor ekonomi dan kewangan antarabangsa. Di laman web ini, para penyelidik boleh menemui pelbagai data mengenai subjek tersebut. Pengguna boleh mencari set data mengikut penunjuk dan negara serta menyemak imbas carta dan peta sambil melakukan penyelidikan. Set data popular termasuk arah perdagangan, harga komoditi utama, Petunjuk Kekukuhan Kewangan, tinjauan dan statistik Kewangan Antarabangsa antara maklumat berharga yang lain. 77. Atlas – Harvard Pada asalnya dicetuskan oleh Harvard, Atlas ialah alat dalam talian yang membolehkan orang ramai membayangkan dan berinteraksi dengan situasi perdagangan sesebuah syarikat. Atlas kemudiannya akan mengambil maklumat dan mencadangkan pelbagai produk yang berpotensi dikeluarkan oleh negara tersebut untuk meningkatkan ekonomi mereka. Ini ialah alat yang digunakan oleh pembuat dasar, ahli perniagaan, pelabur dan orang awam yang terlibat yang ingin mempunyai pemahaman yang lebih baik tentang iklim ekonomi sesebuah negara. Persoalan perdagangan dan ekonomi negara tidak pernah semudah ini. 78. Menjalankan Perniagaan Menjalankan Perniagaan adalah hasil daripada usaha untuk membuat penilaian objektif terhadap peraturan perniagaan. Laman ini mengkaji hampir 200 ekonomi dan pelbagai bandar yang mengukur butiran seperti penunjuk ekonomi serta menilai kemudahan menjalankan perniagaan. Laman ini membolehkan pengguna mengkaji kesan pelbagai jenis peraturan perniagaan antara negara dan laporan hos serta data kualitatif yang meluas. Di samping itu, laman ini juga membolehkan perbandingan dibuat dari semasa ke semasa. 79. Comtrade Pada asalnya merupakan projek Jabatan Perniagaan, Tenaga dan Strategi Perindustrian United Kingdom dengan kerjasama Jabatan Perdagangan Antarabangsa, Comtrade merupakan sumber yang sangat baik. Meminjam data daripada Data Comtrade Pertubuhan Bangsa-Bangsa Bersatu, laman web ini menyediakan pengguna dengan carta interaktif yang boleh digunakan untuk mencari, membandingkan dan menganalisis bilangan perdagangan dan barangan yang tepat antara negara. Hanya pilih negara pelapor, pilih negara rakan kongsi dan buat pilihan sebanyak mungkin. 80. Data Kewangan Global Data Kewangan Global merupakan sumber yang bukan sahaja mengumpulkan data kewangan standard, malah ia mengambil maklumat kewangan dari tahun 1200-an hingga kini. Maklumat ini diperoleh daripada pelbagai sumber termasuk buku, bahan arkib, jurnal akademik dan terbitan berkala berita. Di samping itu, laman web ini mempunyai set data yang menggunakan kaedah statistik penghubung rantai. Hasil akhirnya, dari perspektif pengguna, adalah sumber yang tiada tandingan di Internet berdasarkan data eksklusifnya. 81. Visualisasi Ekonomi Visualisasi Ekonomi bukanlah sumber dalam erti kata penemuan data dan lebih kepada perkhidmatan yang tertumpu pada mereka bentuk grafik maklumat dan papan pemuka interaktif. Di samping itu, Visualisasi Ekonomi juga melakukan analisis dan reka bentuk untuk tujuan khusus bagi menjadikan data ekonomi lebih mudah difahami. Melalui laman web ini, wartawan mempunyai peluang yang sah untuk bekerjasama dengan profesional yang mempunyai pengalaman bertahun-tahun dalam menterjemahkan data ekonomi kepada sesuatu yang lebih mudah diakses oleh orang awam. 82. Portal Data Terbuka EU Portal Data Terbuka EU merupakan projek yang ditubuhkan selepas keputusan yang dibuat oleh Suruhanjaya Eropah. Di laman web ini, institusi EU menawarkan data untuk tontonan dan penggunaan awam tanpa sekatan hak cipta dan tersedia tanpa sebarang caj. Set data termasuk data rujukan CORDIS, daftar ketelusan dan juga senarai penuh orang, entiti dan kumpulan yang telah dikenakan sekatan kewangan oleh EU. Di samping itu, data tersebut tersedia dalam beberapa format digital. 83. Data Terbuka Rangkaian Rangkaian Data Terbuka ialah laman web yang membolehkan pengguna mencari data mengikut wilayah dan bandar. Dengan laman utama yang jelas dan intuitif di laman web ini, para penyelidik mempunyai keupayaan untuk mencari mengikut kategori data, bandar dan juga soalan contoh. Pada setiap halaman, selepas meneliti sama ada kategori data atau soalan contoh, terdapat pautan mudah ke lebih banyak set data. Penyusunan data sahaja menjadikan Rangkaian Data Terbuka sebagai laman web yang berbaloi untuk diterokai. 84. Landmatrix Landmatrix ialah laman web yang menawarkan pangkalan data dalam talian untuk urusan tanah dengan tujuan untuk menggalakkan lebih banyak ketelusan dalam pemerolehan. Pada asasnya, alat ini boleh digunakan untuk menggambarkan dan memahami pelbagai urusan tanah. Data sentiasa bertambah baik, berubah dan diselaraskan untuk meningkatkan ketepatan maklumat yang disediakan. Setakat ini, Landmatrix mempunyai maklumat tentang lebih 1,000 urusan. Ia merupakan sumber yang patut diterokai oleh para penyelidik. 85. Program Pembangunan Pertubuhan Bangsa-Bangsa Bersatu Program Pembangunan Pertubuhan Bangsa-Bangsa Bersatu (PBB) menyimpan banyak data berguna tentang pembangunan manusia di seluruh dunia untuk diterokai oleh orang ramai. Dengan tarikh yang secara amnya merangkumi dari tahun 1990 hingga 2015 dalam kebanyakan set data ini, indeks tersebut merangkumi jadual penuh seperti trend dalam indeks pembangunan manusia, indeks ketidaksamaan jantina dan jurang jantina sepanjang hayat. Penyelidik boleh mencari data secara langsung melalui bar carian dan juga pergi mengikut negara jika niat mereka adalah untuk melihat carta. 86. OCED OECD, yang dikenali sebagai Organisasi untuk Kerjasama dan Pembangunan Ekonomi, mempunyai laman web yang tertumpu pada membantu kerajaan dalam inisiatif anti-kemiskinan dan kemakmuran melalui kestabilan dan pertumbuhan ekonomi. Di laman web ini, para penyelidik akan menemui bahan, penerbitan, serta piawaian dan hujah yang disemak oleh rakan sebaya yang menyokong penetapan piawaian. OECD juga menganjurkan buku fakta yang menyediakan alat rujukan ekonomi yang kukuh untuk disertakan dengan beberapa tinjauan dan ramalan mengenai prospek ekonomi yang boleh didapati di halamannya. 87. Jabatan Kesihatan & Perkhidmatan Manusia AS Jabatan Kesihatan & Perkhidmatan Manusia AS mengendalikan laman web yang menyediakan maklumat tentang Majlis Presiden mengenai Kecergasan, Sukan dan Pemakanan. Dengan fakta dan data yang dikumpulkan dengan bantuan beberapa pakar dalam bidang berkaitan seperti chef dan atlet. Di samping itu, laman web ini juga mempunyai pelbagai statistik. Penyelidik boleh menemui fakta tentang aktiviti fizikal kanak-kanak, tabiat menguatkan otot orang dewasa, serta maklumat tentang tabiat berdiet orang ramai, serta obesiti antara pelbagai fakta dan statistik lain. 88. Rakan Kongsi dalam Akses Maklumat untuk Tenaga Kerja Kesihatan Awam Rakan Kongsi dalam Akses Maklumat untuk Tenaga Kerja Kesihatan Awam merupakan projek yang terhasil hasil daripada organisasi kesihatan awam, agensi kerajaan AS dan perpustakaan yang mengkhusus dalam sains kesihatan. Halaman topik di laman web ini merangkumi subjek seperti geran dan pembiayaan, promosi kesihatan dan pendidikan kesihatan, serta literatur dan garis panduan. Melalui bahagian Topik Kesihatan Awam, terdapat juga data mengenai subjek seperti biokeganasan, genomik kesihatan awam dan kesihatan awam pergigian, antara lainnya. 89. Yayasan Kesihatan Bersatu Selama tiga dekad yang lalu, United Health Foundation telah menyediakan maklumat tentang kedudukan kesihatan untuk digunakan sebagai cara mengukur kesihatan awam. Laman ini menempatkan pelbagai laporan dan penerbitan yang merangkumi laporan tentang kesihatan mereka yang telah berkhidmat, laporan kanan, kesihatan wanita dan kanak-kanak, laporan tahunan dan juga taklimat mengenai topik penting dalam bidang ini. Gunakan peta interaktif untuk meneroka mengikut wilayah dan ketahui lebih lanjut maklumat. Terdapat juga bar carian untuk navigasi lanjut jika penyelidik mencari sesuatu yang lebih spesifik. 90. Medicare Di Amerika Syarikat, Medicare merupakan cara utama yang diandalkan oleh ramai orang untuk insurans kesihatan dan akses kepada rawatan perubatan. Selain perkhidmatan yang ditawarkannya dalam masa nyata, Medicare juga menawarkan data tentang piawaian dan kualiti rawatan merentasi kemudahan dan hospital melalui carta dan peraturan perbandingannya. Ia merupakan set data rasmi yang digunakan oleh laman web Hospital Compare dan ia penuh dengan data yang boleh dimuat turun ke dalam Excel untuk memudahkan akses selanjutnya. 91. Pengawasan, Epidemiologi dan Keputusan Akhir (SEER) Surveillance, Epidemiology and End Results, juga dikenali sebagai SEER, mempunyai laman web yang amat berguna sebagai sumber maklumat tentang statistik kanser. Ia menempatkan ringkasan statistik yang membolehkan penyelidikan tentang angka yang berkaitan dengan kanser yang boleh disusun mengikut tapak kanser, etnik, bangsa, umur, jantina dan juga mengikut jenis data. Laman web ini juga menempatkan penerbitan, set data dan perisian yang boleh digunakan oleh penyelidik untuk analisis yang lebih mendalam. 92. Amnesty Antarabangsa Amnesty International merupakan sebuah organisasi yang telah lama menjadi penyokong hak asasi manusia dan keadilan di seluruh dunia. Ia juga kebetulan menyimpan banyak data tentang status hak asasi manusia di seluruh dunia serta maklumat tentang kekejaman dan jenayah terhadap kemanusiaan tertentu pada titik yang berbeza sebagai sebahagian daripada laporan tahunannya. Para penyelidik boleh menggunakan maklumat tersebut untuk membuat perbandingan antara tahun yang berbeza dan untuk melihat bagaimana negara yang berbeza telah berkembang atau mundur dalam bidang hak asasi manusia. 93. Kumpulan Analisis Data Hak Asasi Manusia Sejak penubuhannya 25 tahun yang lalu, Kumpulan Analisis Data Hak Asasi Manusia telah mengaplikasikan prinsip saintifik terhadap pelanggaran hak asasi manusia di pelbagai negara di seluruh dunia. Laman ini menempatkan penerbitan yang telah diterbitkan dalam saluran media bereputasi seperti Washington Post dan penerbitan formal melalui penerbit Macmillan yang disusun mengikut tahun. Selain penerbitan terancangnya sejak bertahun-tahun yang lalu, terdapat juga projek yang berlaku di seluruh dunia. Untuk pandangan yang lebih teknikal tentang pelanggaran hak asasi manusia, ini adalah carian yang hebat. 94. Data Hubungan Antarabangsa & Hak Asasi Manusia Laman ini menempatkan pangkalan data yang disusun oleh pelbagai organisasi, universiti dan juga agensi kerajaan yang bereputasi. Contohnya ialah Projek Manifesto, Projek Minoriti (Berisiko), Daerah Negara Kebajikan Perbandingan dan Pangkalan Data Konflik Bersenjata. Terdapat beberapa projek seperti Projek Polity IV yang bermula sejak tahun 1800-an. Sementara itu, projek seperti Institut Penyelidikan Keamanan Antarabangsa Stockholm (SIPRI) mengukur pemindahan senjata, perbelanjaan ketenteraan antarabangsa dan trend keselamatan. Cara terbaik untuk menghargai data adalah dengan pergi ke laman web ini dan meneroka. 95. Program Data Konflik Uppsala Jabatan Penyelidikan Keamanan dan Konflik Uppsala, yang sering dirujuk sebagai UCDP, menempatkan pangkalan data besar yang dipanggil Ensiklopedia Konflik UCDP. Ini adalah laman web yang membolehkan pengguna mengklik dan meneroka data yang telah diasingkan oleh jabatan tersebut. Penyelidik boleh diklik melalui laman web dan juga dimuat turun untuk manipulasi dan analisis selanjutnya. Ini adalah sumber yang boleh diandalkan dan dirujuk untuk maklumat berkualiti yang diedarkan dengan cara yang mudah diakses. 96. Jabatan Buruh Amerika Syarikat Jabatan Buruh Amerika Syarikat menyimpan banyak data ekonomi mengenai statistik pengangguran dan pekerjaan. Sudah tentu, angka-angka ini merangkumi pangkalan data yang merangkumi statistik pemberhentian kerja besar-besaran, unjuran pekerjaan, pembukaan pekerjaan dan pertukaran tempat kerja, statistik pekerjaan nasional, dan juga statistik perbandingan buruh antarabangsa. Laman ini menyediakan maklumat terkini dan tepat sementara Jabatan Buruh menjejaki semuanya. Ini adalah sumber yang bereputasi dengan sokongan kerajaan untuk tujuan penyelidikan. 97. Pentadbiran Perniagaan Kecil Pentadbiran Perniagaan Kecil telah lama menjadi sumber yang terbukti untuk usahawan dan bakal usahawan lain. Laman ini menempatkan banyak statistik tentang pekerjaan serta maklumat yang membolehkan penyelidik melakukan kajian pasaran dan analisis persaingan. Di sini penyelidik boleh menemui nombor, statistik dan alatan yang boleh digunakan untuk mendedahkan data tambahan. Untuk maklumat tentang statistik perniagaan kecil dari perspektif majikan dan perniagaan, ini merupakan sumber yang sangat baik yang boleh digunakan oleh wartawan pada bila-bila masa. 98. Crowdpac Crowdpac ialah platform yang membolehkan calon politik mengumpul dana dan menganjurkan. Berdasarkan idea bahawa terdapat beberapa calon kongres setiap pilihan raya yang pada asasnya berjalan tanpa sebarang pencabar, laman web ini membolehkan rakyat yang terlibat untuk menganjurkan sokongan. Dengan artikel yang membincangkan isu politik yang berkaitan seperti pembahagian gerrymandering berserta topik tambahan seperti hak sivil dan keselamatan negara, laman web ini mewakili peluang yang sangat baik untuk memahami dan mengetahui apa yang berlaku dalam arena politik akar umbi. 99. Gallup Laman ini merupakan tempat tinjauan pendapat Gallup yang terkenal. Gallup pakar dalam analitik yang membolehkan pembuat keputusan organisasi menyelesaikan masalah melalui pendekatan berasaskan data untuk penyelesaian masalah. Tambahan pula, peranti yang dicadangkan oleh Gallup sering berguna untuk memacu penyelesaian. Ini adalah sumber yang diiktiraf sebagai standard emas dalam data dan analitik lanjutan. Layari sahaja laman web ini untuk meneroka laporan tentang segala-galanya daripada keadaan tempat kerja global hinggalah perbincangan tentang produktiviti AS. 100. Perpustakaan Berkeley Perpustakaan Berkeley menempatkan himpunan penuh statistik dan data untuk penyelidikan Sains Politik di laman webnya. Di halaman ini, para penyelidik akan menemui banyak pautan yang menyediakan akses kepada beberapa set data kepada para penyelidik serta keupayaan untuk membina sendiri. Antaranya ialah Statistik Sejarah Amerika Syarikat (HSUS), Edisi Milenium, Planet Data, Wawasan Statistik ProQuest dan Konsortium Antara Universiti untuk Penyelidikan Politik dan Sosial. Terdapat beberapa jam data untuk diproses. 101. Perkhidmatan Negeri RAND Bagi mereka yang tidak tahu, RAND Corporation ialah sebuah organisasi yang pakar dalam penyelidikan tentang cabaran dasar awam. Dengan pelanggan dan portfolio yang merangkumi semua peringkat kerajaan, perbadanan ini merupakan sumber penyelidikan berkualiti untuk tujuan membuat keputusan. Cawangan perbadanan di AS menempatkan satu set statistik pangkalan data di laman webnya. Di sini para penyelidik boleh mendapatkan maklumat tentang pendidikan K-12, kesihatan, perniagaan dan ekonomi antara kategori lain yang menangani isu-isu yang berkaitan dengan kebaikan awam. 102. Pusat Penyelidikan Pendapat Awam Roper Dikendalikan dan dikendalikan melalui Universiti Cornell, Pusat Penyelidikan Pendapat Awam Roper mengkhusus dalam mengumpul, mengedarkan dan memelihara data pendapat awam. Sebagai contoh jenis maklumat yang boleh didedahkan oleh Pusat Roper, para penyelidik boleh mengakses data daripada pilihan raya AS serta pautan ke arkib lebih 23,000 set data. Sama ada wartawan mencari reaksi awam terhadap politik atau kebimbangan kesihatan baru-baru ini, laman web ini hampir pasti mempunyai maklumat. 103. Kerajaan Pengangkutan Dikuasakan dan dikendalikan oleh Biro Pengangkutan, laman web ini mempunyai data yang merangkumi pelbagai subjek berkaitan pengangkutan. Sumber di laman web ini termasuk laporan tentang tenaga, keselamatan penumpang, tenaga, prestasi sistem, ekonomi pengangkutan, infrastruktur dan pengangkutan barang. Pengguna juga boleh menyusun dan mengakses data yang ditawarkan di laman web ini mengikut lokasi dan geografi. Ini adalah laman web yang membolehkan penyelidik mengetahui semua yang mereka jangkakan untuk ketahui tentang topik berkaitan pengangkutan. 104. Perdagangan Perjalanan Travel Trade ialah laman web yang menyimpan data mengenai pemergian warga AS dari tahun 1996 hingga 2016 setakat penulisan ini. Matlamat sumber ini adalah untuk membantu orang awam yang berminat memproses dan memahami bagaimana pelancongan global dan pelancongan antarabangsa telah beroperasi selama ini. Maklumat ini tersedia untuk dimuat turun dan juga untuk tontonan dalam talian. Penyelidik boleh menggunakan data ini dengan mudah untuk mencari trend dan membuat perbandingan. 105. Skift Skift ialah laman web yang memberi tumpuan kepada penyediaan risikan dan data kepada industri pelancongan. Antara sumber data lain, syarikat ini menganjurkan penyelidikan, persidangan dan surat berita bermaklumat untuk pelanggan dan penyelidik memilih daripadanya. Skift mengkaji topik yang ingin diketahui oleh individu dalam sektor pelancongan seperti ke mana orang ramai semakin melancong, pengenalpastian pasaran baharu dan banyak maklumat tambahan tentang teknologi pelancongan yang boleh diterokai oleh penyelidik. 106. Geoba.se Geoba.se ialah laman web yang sesuai untuk mereka yang mahukan fakta dan hanya fakta tentang sesebuah bandar atau lokasi. Menggunakan enjin carian di laman utama, mencari koordinat, maklumat untuk perjalanan, cuaca dan juga rakaman kamera web tempatan hanya dengan beberapa ketukan kekunci sahaja. Laman ini juga menempatkan halaman yang menyediakan maklumat tentang kedudukan dunia yang boleh disempitkan mengikut wilayah dan negara. Pendek kata, ini adalah sumber yang akan menyediakan data dan statistik tulen. 107. Perjalanan AS US Travel menjadi tuan rumah kepada laman web yang dikendalikan dan diselenggara oleh Jabatan Negara AS. Misi laman web ini adalah bertujuan untuk melindungi nyawa warga AS yang akan pergi ke luar negara. Oleh itu, sumber ini menyimpan statistik, maklumat dan laporan mengenai topik seperti pasport AS, visa AS, pengambilan anak angkat antara negara, kematian di luar negara dan penculikan ibu bapa dan anak antarabangsa. Maklumat ini boleh digunakan semasa merancang perjalanan tetapi juga boleh digunakan untuk mengenal pasti trend jangka panjang dengan statistik yang merangkumi dari tahun 1996 hingga 2016. 108. Perkhidmatan Data UK Dibiayai oleh Majlis Penyelidikan Ekonomi dan Sosial, koleksi Perkhidmatan Data UK menerbitkan pelbagai jenis data. Laman ini mempunyai maklumat yang merangkumi bahan seperti data perniagaan hingga tinjauan rentas negara, tinjauan yang ditaja oleh kerajaan UK, dan juga data banci UK. Pada asasnya, laman web ini direka bentuk dengan mengambil kira keperluan pelajar dan penyelidik. Di samping itu, terdapat panduan, sumber dan arahan yang menawarkan panduan dan sumber yang akan membantu penyelidik memahami dan menggunakan alatan di laman ini dengan cepat. 109. Data.gov.au Dikendalikan dan diterbitkan oleh kerajaan Australia, Data.gov.au menawarkan akses dan pencarian data terbuka yang mudah. ​​Laman ini secara eksplisit menunjukkan bahawa data kerajaan boleh digunakan untuk membangunkan alat dan aplikasi yang seterusnya boleh digunakan untuk manfaat rakyat Australia. Bukan sahaja terdapat akses yang disediakan kepada set data terbuka, tetapi terdapat juga data yang tidak diterbitkan yang boleh diakses dengan bayaran. Bagi penyelidik yang ingin melakukan analisis yang lebih mendalam, laman ini juga menawarkan Kit Alat Data. 110. Twitter Semua orang mengenali Twitter kerana perbualan pantas, pesanan ringkas dan statusnya dalam budaya popular sebagai hab berita terkini. Walau bagaimanapun, apa yang ramai orang tidak tahu ialah Twitter juga mempunyai alat pembangun yang memudahkan penapisan dan penemuan maklumat. Alat ini juga membolehkan penyelidik melihat trend dan menapis mengikut geografi. Sama ada membaca hashtag yang sedang popular atau meneroka alat pembangun, Twitter ialah sumber yang telah digunakan oleh wartawan sejak sekian lama. 111. Instagram Instagram bukan semata-mata untuk menyukai gambar kucing comel dan foto bayi yang comel. Atau sekurang-kurangnya, ia tidak semestinya begitu. Aplikasi ini mempunyai set alat pembangun yang sangat canggih yang memudahkan untuk difahami dan melakukan kajian tentang khalayak. Di samping itu, hashtag dan petunjuk yang didedahkan oleh foto yang disiarkan orang ramai serta individu yang ditag di dalamnya boleh menjadi khazanah maklumat. Instagram ialah cara yang berguna untuk mendedahkan apa yang sedang menjadi trend dalam pelbagai sektor. 112. Empat Petak Untuk jenis penyelidikan yang melibatkan lokasi, Four Square merupakan sumber data yang berguna kerana pangkalan datanya yang besar dan semua maklumat yang telah dikumpulkannya. Secara zahirnya, ia mempunyai panduan bandar yang memberikan cadangan kepada pengguna tentang kekuatan komuniti. Four Square juga mempunyai alatan pembangun yang membolehkan akses maklumat tambahan melalui Pangkalan Data Tempat. Wartawan boleh menggunakannya untuk mengetahui lebih lanjut tentang lokasi tertentu dan tentang orang yang menggunakan aplikasi tersebut. 113. New York Times Dianggap oleh ramai sebagai ahli Estet Keempat yang dihormati, terdapat sangat sedikit wartawan yang belum pernah mendengar tentang New York Times. Walau bagaimanapun, apa yang sering diabaikan ialah penggunaan New York Times sebagai sumber data melalui APInya. Penyelidik boleh mencari artikel sejak tahun 1851 mengikut bulan, mencari artikel dan juga ulasan buku. API ini membolehkan carian berdasarkan paparan, perkongsian dan e-mel serta untuk mencari dan mengakses komen. 114. AP Associated Press mempunyai tempat tetap dalam budaya popular sebagai sumber berita yang tepat dan tepat pada masanya. Terima kasih kepada alat pembangunnya, ia juga merupakan sumber data yang berguna untuk wartawan. Sehingga penulisan ini, para penyelidik boleh menggunakan alat ini untuk membuat suntingan mereka sendiri semasa memuat turun gambar dan video. Tahap kandungan nampaknya bergantung pada jenis pelan yang digunakan oleh penyelidik, tetapi API Associated Press tetap membolehkan pengguna membawa proses penyelidikan ke tahap yang lebih tinggi. 115. Lima Tiga Puluh Lapan Wartawan mungkin sudah biasa dengan Nate Silver dan Five Thirty Eight serta model statistiknya kerana ramalannya yang kadangkala tidak dijangka tetapi biasanya betul. Five Thirty Eight mempunyai GitHub yang menyimpan set data serta pengekodan yang telah digunakan sepanjang sejarah laman web ini. Set data ini menampilkan subjek lucu seperti data tentang pemandu yang teruk, Avengers dan tinjauan tentang etika penerbangan. Pada masa yang sama, terdapat juga fail yang menangani perkara yang lebih serius seperti keselamatan syarikat penerbangan dan jenayah kebencian. 116. IMDb IMDb dianggap oleh ramai sebagai laman web paling komprehensif di web berkenaan industri filem dan lakonan. Jika terdapat filem yang akan ditayangkan dan orang ramai ingin tahu siapa yang berlakon di dalamnya atau untuk melihat reaksi umum orang ramai yang menonton filem, kemungkinan besar mereka akan sampai ke laman web ini pada satu ketika semasa carian mereka. IMDb juga mengehos beberapa set data yang dikemas kini setiap hari dan tersedia untuk kegunaan komersial dan bukan komersial. 117. KAPSARC KAPSARC ialah portal data yang menempatkan sejumlah 923 set data dengan maklumat khusus tentang data tenaga. Set ini dibahagikan kepada beberapa tema umum dalam penggunaan tenaga, bekalan tenaga dan faktor berkaitan lain seperti dasar, demografi, alam sekitar, perdagangan, air, dan maklumat ekonomi. Bagi penyelidik yang berminat dengan tenaga dan bagaimana ia digunakan merentasi pelbagai industri dan sektor, KAPSARC ialah salah satu sumber data tenaga paling komprehensif di web. 118. Makro Aset Asset Marco ialah laman web yang menyediakan data kewangan sejarah dan penunjuk makroekonomi. Data ini merangkumi lebih daripada 75,000 saham, mata wang, komoditi dan bon yang merangkumi seluruh dunia. Di samping itu, laman web ini mempunyai lebih daripada 120,000 penunjuk makroekonomi yang boleh digunakan oleh pengguna untuk meneroka data kewangan negara yang berbeza. Selain semua data pasaran kewangan ini, laman web ini juga membincangkan strategi pelaburan. Sumber ini sangat unik kerana terdapat banyak maklumat yang boleh didapati. 119. Perkhidmatan Web Kerajaan AS dan Sumber Data XML Perkhidmatan Web Kerajaan AS dan Sumber Data XML dihoskan di laman web yang dipanggil USGovXML.com. Di sini, pengguna boleh menyemak imbas pelbagai sumber data XML dan perkhidmatan web yang telah disediakan oleh kerajaan AS. Tindakan pemeliharaan mudah ini memastikan sumber web tersebut telus dan boleh diakses oleh orang ramai. Bagi penyelidik yang kerap memantau indeks ini secara umum, adalah mungkin untuk mencari cerita dalam data sekiranya terdapat perubahan mendadak pada data XML. 120. Figshare Figshare ialah laman web yang menempatkan lebih 5,000 kandungan saintifik yang tersedia untuk penyelidikan dan petikan akademik. Selain maklumat di sana, laman web ini direka bentuk untuk menawarkan penyelidik satu lokasi untuk tujuan menyusun, memuat naik, menyimpan dan mengurus penyelidikan yang mereka temui. Matematik, sains kesihatan, kejuruteraan, kimia, sains biologi dan sains sosial semuanya disenaraikan sebagai kategori pilihan. Laman web ini merupakan sumber yang hebat untuk wartawan yang mencari lebih banyak sumber akademik untuk dimuatkan. 121. DataBerpautan LinkedData ialah laman web yang didedikasikan untuk idea mencari cara baharu untuk menghubungkan data Internet yang tidak dipautkan sebelum ini. Di sini, pengguna akan menemui tutorial, panduan dan set data yang akan memulakan cerita. Semua set data memberi tumpuan kepada topik terlibat dengan komuniti data yang dipautkan, dan selain senarai beli-belah data yang dipautkan, kebanyakannya dikategorikan sebagai URI yang tidak boleh dirujuk sama ada dengan atau tanpa format RDF pelengkap. Untuk mengetahui lebih lanjut tentang komuniti ini, laman web ini mesti dikunjungi. 122. Pelombong Web Web Miner ialah tempat yang sesuai untuk penyelidik yang ingin mengumpul semua data generik yang boleh mereka temui dengan program ini. Laman ini menempatkan pangkalan data contoh seperti restoran AS, kod SWIFT dari bank di seluruh dunia, stesen minyak AS, tarikan pelancong Amerika dan aplikasi Google Play antara senarai besar yang lain. Malah, ia merupakan laman web yang akan memudahkan dan mempercepatkan wartawan untuk menapis dan mendedahkan sejumlah besar data dalam masa yang jauh lebih singkat. 123. Hab Data Hab Data berbangga kerana menjadi tempat pengguna boleh mencari dan menerbitkan data secepat dan secekap mungkin. Laman ini sendiri menempatkan beberapa set data. Indeks Harga Rumah (Case-Shiller), harga emas bulanan dan Trend Semasa dalam Karbon Dioksida Atmosfera adalah tiga yang paling popular. Selain data, laman ini juga menempatkan beberapa tutorial yang boleh dibaca oleh pengguna untuk mengetahui lebih lanjut tentang menavigasi pelbagai jenis data yang tersedia. 124. Enigma Awam Di laman webnya, Enigma Public menggelarkan dirinya sebagai "koleksi data awam terluas" yang terdapat di web. Set data ini tergolong dalam salah satu daripada empat kategori luas dalam FOIA, Essentials, Newsworthy dan Under the Radar. Sebahagian daripada data di laman web ini termasuk gaji pekerja Rumah Putih dan Lesen Senjata Api Persekutuan Aktif. Selepas membuat akaun percuma, pengguna boleh mengakses mana-mana satu kategori data yang ada untuk tontonan. 125. Yahoo Kebanyakan pengguna web biasa dengan nama Yahoo kerana terdapat banyak syarikat seperti Yahoo! News dan Yahoo! Finance antara ciri-ciri dalam talian syarikat itu. Menarik minat penyelidik dan wartawan ialah hakikat bahawa Yahoo juga menyimpan sejumlah besar set data termasuk Penilaian Pengguna Muzik Yahoo! untuk Lagu dengan Maklumat Meta Artis, Album dan Genre, v. 1.0 dan Penilaian Pengguna Filem Yahoo! dan Maklumat Kandungan Deskriptif, v.1.0. Wartawan yang mencari statistik baharu pasti akan memilih sumber ini. 126. 1000 Genom 1000 Genom merupakan lokasi projek dengan nama yang sama yang berlangsung dari tahun 2008 hingga 2015. Tujuan projek ini adalah untuk mencari setiap variasi genetik yang boleh berlaku dalam sekurang-kurangnya 1% daripada populasi yang dikaji. Selain penerbitan yang terhasil daripada projek ini, terdapat juga set data yang besar-besaran yang merangkumi pangkalan data berasingan bagi sel varian, fail jujukan mentah dan ketersediaan sampel. Data ini boleh dilayari atau dimuat turun. 127. CBOE CBOE ialah bursa niaga hadapan yang memberi tumpuan terutamanya kepada niaga hadapan turun naik. Khususnya, laman web ini menampilkan banyak bahan mengenai niaga hadapan yang dipaparkan pada Indeks Volatiliti bertanda dagangan laman web ini. Laman web ini menempatkan pelbagai jenis data pasaran termasuk data sejarah, statistik pasaran harian dan Harga Penyelesaian Harian Niaga Hadapan VX. Bagi wartawan yang mencari data pasaran yang berkualiti, CBOE ialah laman web yang boleh menyediakan maklumat tersebut dalam format yang mudah diikuti dan difahami. 128. St. Louis Fed Bank Rizab Persekutuan St. Louis merupakan salah satu, jika bukan yang paling penting, pusat kewangan di rantaunya. Di laman web ini, para penyelidik boleh membaca kertas kerja, data ekonomi, penerbitan dan perkhidmatan maklumat secara langsung. Dalam erti kata lain, terdapat banyak maklumat tentang pemikiran semasa dan lepas Rizab Persekutuan St. Louis dari segi dasar serta keupayaan untuk menilai keberkesanan Bank Rizab Persekutuan St. Louis. Bagi wartawan perniagaan, kewangan dan ekonomi, ini merupakan sumber maklumat yang terbaik. 129. OANDA OANDA ialah platform dagangan saham dalam talian yang popular, terutamanya yang didagangkan dalam CFD dan Pertukaran Asing. Selain daripada pelbagai ciri yang ditambah kepada pedagang dengan tujuan untuk menarik pedagang dalam talian, OANDA juga menyimpan banyak data kadar sejarah serta maklumat sejarah pada penukar mata wang di laman web ini. Bersama-sama dengan semua data ini, laman web ini juga menawarkan maklumat dengan strategi pelaburan berserta berita dan analisis pasaran. Akaun tidak diperlukan untuk mengakses kebanyakan data ini. 130. ABS Biro Perangkaan Australia, atau ABS, tidak berbeza dengan rakan sejawatnya dari Amerika, menawarkan data objektif, maklumat ekonomi dan penyelidikan mengenai pelbagai topik yang berkaitan dengan negara. Secara langsung di laman web itu sendiri, para penyelidik boleh mencari data statistik mengenai penunjuk perniagaan, penjagaan kesihatan, perumahan, kewangan, Perdagangan Antarabangsa, perumahan, kesihatan mental serta indeks harga dan inflasi. Wartawan boleh menjalankan carian untuk mencari tinjauan dan maklumat lama yang juga boleh menyusun maklumat mengikut wilayah. 131. Pangkalan Data London Pada asalnya difikirkan dan dikendalikan oleh Pihak Berkuasa Greater London, Pangkalan Data London merupakan percubaan London untuk menjadikan data London lebih mudah diakses oleh orang ramai. Matlamat akhirnya adalah untuk memberi orang ramai akses kepada maklumat ini sambil menggalakkan mereka menggunakannya secara percuma dalam apa jua cara yang mereka mahukan. Di laman web ini, pengguna boleh mencari data mengikut topik seperti Seni & Budaya, Jenayah dan Keselamatan Komuniti, Pendidikan dan Kesihatan. Wartawan yang berminat dengan jenis data ini kini boleh mendapatkannya terus daripada kerajaan tempatan. 132. Statistik NZ Kerajaan New Zealand menyimpan banyak statistik dan data untuk para penyelidik teliti dan analisis di laman web ini. Maklumat ini boleh ditapis menggunakan bar carian di bahagian atas, dengan menapis lokasi dan wilayah, serta mengikut topik. Antara topik tersebut termasuk petunjuk ekonomi, kesihatan, pendapatan dan pekerjaan, sektor industri, alam sekitar dan perniagaan. Antara sumber berita dan siaran tambahan yang mengetengahkan pelbagai penemuan dan statistik, wartawan akan mendedahkan pelbagai jenis statistik khusus New Zealand melalui laman web ini. 133. Biro Meterologi Kerajaan Australia Dikendalikan dan dikendalikan sepenuhnya oleh Kerajaan Australia, laman web Biro Meterologi Australia memaparkan maklumat cuaca yang berkaitan dengan pelbagai bandar dan wilayah di Australia. Mengikut laman web tersebut, agensi ini ditubuhkan sebagai cara untuk membantu rakyat Australia menghadapi iklim di sekitar mereka melalui gabungan amaran dan nasihat. Di sini para penyelidik akan dapat mencari tinjauan bermusim, simpanan air, ramalan hujan, kebolehubahan iklim dan ramalan aliran sungai bermusim. Di laman web ini, anda akan menemui liputan yang tepat dan bereputasi tentang cuaca Australia. 134. GroupLens Laman web ini berada di web ihsan GroupLens dari Jabatan Sains Komputer dan Kejuruteraan Universiti Minnesota. Laman web ini menawarkan penerbitan serta set data untuk tujuan penyelidikan. Terdapat sejumlah kira-kira enam set data. Antara set yang dinamakan, terdapat beberapa yang bertajuk Book-Crossing, MovieLens dan HetRec 2011. Pendek kata, ini merupakan sumber yang berguna untuk wartawan yang ingin lebih memahami cara menggunakan data yang disediakan. 135. KD Nuggets KD Nuggets ialah laman web yang memberi tumpuan terutamanya kepada penyediaan sains data, analitik perniagaan, pembelajaran mesin dan perlombongan data kepada orang ramai. Terdapat halaman di laman web ini yang mempunyai senarai lengkap set data yang digunakan oleh orang ramai untuk melakukan lebih banyak penerokaan perlombongan data dan data raya dengan set data seperti Bioassay Data, Asset Marco, DataMarket, Casualty Workbench, Data Ferrett dan Datamob yang semuanya dipautkan. Ini ialah sumber yang hebat untuk wartawan yang lebih suka mempunyai semua maklumat pada satu halaman. 137. Microsoft Setiap orang yang pernah menggunakan PC atau komputer riba mungkin pernah mendengar tentang Microsoft sekurang-kurangnya secara sepintas lalu. Menariknya, selain PC, komputer riba dan perisian, Microsoft juga menganjurkan banyak penyelidikan dan penerbitan. Ini termasuk penemuan baharu seperti usaha syarikat untuk mencipta mesin yang celik huruf serta sains data berasaskan awan. Terdapat juga maklumat tambahan tentang alatan yang sedang dibangunkan oleh Microsoft seperti Visual Studio Code Tools dan perkembangan dalam AI yang diwakilinya. 138. RDataMining Seperti yang tertera pada tin, R Datamining ialah sumber tentang R dan perlombongan data. Laman ini menyediakan pelbagai contoh dan dokumen yang memberikan perspektif mendalam tentang perlombongan data dan perlombongan data dengan R. Di samping itu, terdapat juga pautan ke kursus latihan seperti kursus pendek yang ditawarkan oleh Universiti Canberra. Ini termasuk pautan ke set data dan pembentangan percuma serta set data yang merangkumi subjek seperti kapal terbang, syarikat penerbangan dan data laluan serta pautan ke laman web seperti GeoDa. 139. Penyelidikan Kolaboratif dalam Neurosains Komputasi – Perkongsian data Penyelidikan Kolaboratif dalam Neurosains Komputasi, juga dikenali sebagai CRCN, mempunyai beberapa set data yang boleh diakses melalui laman web mereka. Set data dikategorikan mengikut pelbagai bahagian otak seperti korteks visual, hippocampus, korteks motor, burung, pergerakan mata dan aplysia sebagai beberapa contoh. Folder ini juga merangkumi cabaran, alatan, simulasi dan kaedah. Keupayaan untuk berkongsi data ini menjadikannya sumber yang lebih baik untuk digunakan dalam penyelidikan. 140. Arkib Bank Data Protein Menurut laman webnya, arkib Protein Data Bank telah menjadi sumber utama mengenai asid nukleik, struktur 3D protein dan pemasangan kompleks sejak tahun 1971. Dibentuk dengan misi eksplisit untuk menyimpan maklumat ini dalam domain awam, para penyelidik boleh pergi ke sini untuk melihat laporan pengesahan dan kamus data dalam talian. Terdapat juga pertumbuhan data dan statistik penggunaan yang tersedia untuk pengisihan dan analisis berasaskan web serta untuk dimuat turun. Paling penting, laman web ini sentiasa menambah maklumat baharu. 141. Projek PubChem PubChem sebagai projek rasmi direka bentuk untuk memaklumkan orang ramai tentang apa yang molekul kecil mampu lakukan dari sudut biologi. Laman ini dipautkan oleh tiga pangkalan data termasuk PubChem Compound, PubChem Substance dan PubChem BioAssay. Di samping itu, laman ini juga membolehkan pencarian persamaan antara protein yang berbeza. Bagi penyelidik yang membawa analisis data mereka ke peringkat seterusnya, laman ini juga menawarkan pengekodan dan petua percuma. 142. Perubatan Coremine Coremine Medical merupakan sumber yang tidak ternilai bagi sesiapa sahaja yang mencari maklumat tentang biologi, kesihatan dan perubatan. Kini setelah keupayaan perlombongan teks bioperubatan PubGene telah digabungkan ke dalam bentuknya yang sekarang, Coremine juga merupakan salah satu sumber maklumat bioperubatan yang paling fleksibel. Laman ini akan memaparkan pautan antara konsep dan idea dalam format yang menarik secara visual dan mudah difahami yang mungkin tidak disedari sebaliknya. Ia merupakan salah satu sumber data bioperubatan paling komprehensif yang tersedia untuk wartawan. 143. Tu Tiempo Tu Tiempo merupakan sumber data cuaca dan iklim yang luar biasa untuk setiap negara di dunia. Dengan menggunakan sumber ini, mudah untuk mencari purata tahunan, bulanan dan harian bagi hampir setiap bandar dan wilayah di dunia. Di samping itu, pengguna juga boleh mencari melalui pangkalan data yang mengandungi lebih 115 juta rekod yang penuh dengan data sejarah yang boleh dicari oleh sesiapa sahaja. Bergantung pada wilayah yang dicari, data yang bermula sejak tahun 1929 boleh ditemui. 144. Sumber Rangkaian Kompleks Ini merupakan laman web yang menyediakan akses kepada sebahagian besar data yang pertama kali digunakan dalam eksperimen berasaskan komputernya. Senarai penuh set data yang menyenaraikan jenis data termasuk graf berita, graf biologi, graf petikan, graf kolaborasi, graf kejuruteraan dan graf semantik. Halaman ini juga memautkan ke senarai sumber yang mengandungi banyak maklumat seperti set data yang memeriksa kira-kira 3 juta paten AS. Halaman ini juga mempunyai himpunan set data Rangkaian Kompleks yang mengagumkan. 145. Scopus Scopus ialah alat yang membolehkan individu mencari penyelidikan dan petikan akademik dengan cepat dan mudah. ​​Laman ini menawarkan pangkalan data penyelidikan yang sangat luas yang telah berlaku di seluruh dunia dalam beberapa bidang yang merangkumi sektor seperti perubatan, teknologi, sains sosial, dan seni serta kemanusiaan. Gunakan Scopus untuk mendapatkan sumber akademik yang mungkin diabaikan. Lagipun, dalam banyak kalangan, kualiti sumber akademik boleh menjadi hampir sama pentingnya dengan maklumat yang disediakannya. 146. Stanford Reputasi Stanford sebagai institusi akademik yang berprestij tidak berlaku secara tiba-tiba. Kecemerlangannya terserlah dalam kursus berkaitan pengaturcaraannya. Laman ini juga menempatkan beberapa set data yang merangkumi butiran seperti maklumat rangkaian sosial. Terdapat set data yang berpusat pada kalangan sosial di Facebook, permintaan pentadbir Wikipedia, kalangan sosial Twitter dan Google+. Rangkaian komunikasi dan Rangkaian Produk Amazon juga mempunyai set data mereka sendiri. 147. Universiti Milano Jabatan Sains Maklumat Universiti Milano mengendalikan dan mengendalikan laman web yang dikenali sebagai Makmal Algoritma Web. Laman ini menempatkan banyak set data yang tersedia untuk diterokai. Ini termasuk graf berkaitan rangkaian sosial, graf Facebook, petikan daripada projek DELIS dan senarai pendek pelbagai data. Maklumat yang terdapat di sini boleh dilihat dalam talian dan dimuat turun jika dikehendaki, menjadikannya salah satu set data yang paling mudah diakses seumpamanya di web. 148. Repositori Data Rangkaian UCI Repositori Data Rangkaian UCI ialah laman web yang didedikasikan untuk mengambil pendekatan saintifik terhadap kajian rangkaian. Pada halaman sumber, para penyelidik akan menemui pautan ke direktori set data yang dipilih oleh organisasi dan kumpulan penyelidikan serta oleh individu. Ia juga mempunyai koleksi set data yang biasanya akan digunakan untuk analisis media sosial. Mereka yang mendalami data akan gembira apabila mendapati set ini juga tersedia untuk dimuat turun. 149. CAIDA CAIDA, atau Pusat Analisis Data Internet Gunaan, mengumpul pelbagai jenis data daripada beberapa lokasi berbeza, selalunya dengan bantuan organisasi dan individu yang berbeza. Terdapat set data yang dihoskan di laman web ini seperti Perhubungan AS, Serangan DDOS, Teleskop dan yang berkaitan dengannya berserta data lain. Kategori tersebut termasuk trafik, topologi, keselamatan, ringkasan cacing dan statistik ringkasan trafik. Set data mungkin memerlukan akses permintaan, tetapi kebanyakannya adalah awam. 150. Crawdad Crawdad, atau Sumber Komuniti untuk Pengarkiban Data Tanpa Wayar di Dartmouth, adalah unik kerana tumpuannya untuk menyediakan data tanpa wayar kepada penyelidik dan orang lain yang mungkin berminat dengan subjek ini. Laman ini menawarkan beberapa alatan serta akses kepada pelbagai set data. Antara set yang disenaraikan ialah set yang dirujuk kepada Penggunaan Pendidikan, Pencirian Ralat Bit, Diagnosis Rangkaian, Kesambungan Oportunistik, Pengkomputeran Sedar Lokasi dan banyak lagi untuk dipilih. Penyelidik akan menghargai sumber ini apabila mereka lebih mendalaminya. 151. Pentadbiran Maklumat Tenaga AS Sering dirujuk sebagai EIA, Pentadbiran Maklumat Tenaga AS menjalankan perniagaan menyediakan data utiliti elektrik tahunan kepada orang ramai. Maklumat dalam data ini merangkumi stok bahan api fosil, penggunaan bahan api, maklumat bulanan dan tahunan tentang penjanaan elektrik, dan data alam sekitar antara pilihan lain. Data tersebut tersedia dan boleh dianalisis dari tahun 2001 hingga 2017. Apa yang perlu dilakukan oleh penyelidik hanyalah melayari laman web ini dan memuat turun maklumat tersebut. 152. Data Oseanografi British Dibiayai oleh Majlis Penyelidikan Alam Sekitar Kebangsaan, Data Oseanografi British merupakan salah satu sumber data marin yang paling mudah diakses di Internet. Dengan pangkalan data yang luas yang menyentuh arus, profil CTD, data paras laut antarabangsa, arus, dan juga data perakam tekanan dasar sejarah. Di samping itu, terdapat set data yang boleh didapati di Perpustakaan Data Terbitan yang menawarkan akses tambahan kepada katalog. Ini mungkin salah satu sumber maklumat marin yang paling luas yang terdapat dalam talian. 153. Fakta Factual menyediakan data lokasi untuk pengiklanan dan untuk kegunaan pada platform mudah alih. Antara yang menarik minat penyelidik ialah alatan pembangun yang merangkumi SDK Engine Mobile dan aplikasi profesional dan penyelidikan penuh bagi Graph Observation serta Local Validation Stack. Dengan nama samaran laman web yang menekankan minat syarikat untuk mengambil data di seluruh dunia dan mencari cara baharu untuk meletakkannya dalam konteks, Factual mempunyai komitmen yang jelas terhadap data dan mencari peluang baharu dan luar biasa untuk menggunakannya. 154. Kawasan Pentadbiran Global Kawasan Pentadbiran Global ialah pangkalan data geo yang menunjukkan lokasi pelbagai kawasan pentadbiran di dunia. Data yang dikumpulkan daripada pangkalan data jenis ini kemudiannya biasanya digunakan dalam sistem maklumat geografi. Ini termasuk negara dan dibahagikan lagi kepada wilayah, daerah dan jabatan antara lain. Berita baik untuk wartawan ialah semua data ini tersedia secara percuma dan juga boleh digunakan untuk kegunaan akademik dan umum bukan komersial. 155. Nama-nama geografi Geonames ialah laman web yang menempatkan pangkalan data geografi dengan berjuta-juta entri, ciri unik dan nama alternatif. Menawarkan pilihan eksport dan akses melalui pelbagai perkhidmatan web, pangkalan data ini memproses kira-kira 150 juta permintaan setiap hari. Terima kasih kepada keupayaan wiki pangkalan data, pengguna dapat membuat pelarasan dan perubahan pada entri pangkalan data dengan agak mudah. ​​Ini merupakan sumber yang hebat untuk keupayaan pengehosan berbilang bahasa sahaja. 156. Data Bumi Semula Jadi Data Bumi Semula Jadi ialah set data peta yang tersedia dalam domain awam dan penuh dengan maklumat yang direka untuk digunakan dalam perisian pembuatan peta bagi penciptaan peta canggih. Visual produk akhir adalah kemas dan tersusun dengan baik dan data boleh digunakan serta-merta. Set data ini merangkumi kehadiran data risikan dan pelbagai tema data vektor budaya, raster dan fizikal. Pada asalnya dibuat dengan mengambil kira keperluan dan keutamaan ahli kartografi, set data ini berguna kepada sesiapa sahaja yang berminat dalam geografi. 157. Peta Jalan Terbuka Openstreet Map bukanlah sebuah laman web tetapi lebih kepada kerjasama antara pengguna yang kini menyediakan perkhidmatan pemetaan kepada aplikasi, tapak dan pelbagai peranti perkakasan. Laman ini memperoleh data baharu apabila pengguna memasukkan maklumat tentang mercu tanda yang kurang dikenali seperti stesen kereta api, jalan raya dan laluan. Set data penuh tersedia secara percuma di laman web ini dan boleh dimuat turun sama ada sepenuhnya atau sebahagian. Bagi mereka yang memilih untuk memuat turun data secara separa, muat turun mengikut wilayah juga boleh dilakukan. 158. Bandar Chicago Bandar Chicago merupakan tempat kelahiran pasukan juara Bulls pimpinan Michael Jordan dan gaya pizanya yang unik, dan ia juga mempunyai portal data lengkapnya sendiri. Kategori set data merangkumi pelbagai topik yang merangkumi Pentadbiran & Kewangan, Etika, Kesihatan & Perkhidmatan Manusia, Taman & Rekreasi, Keselamatan Awam dan Pemeliharaan Bersejarah. Pendek kata, portal data Bandar Chicago menempatkan hampir apa sahaja yang menarik minat penyelidik, pembuat dasar dan wartawan tempatan. 159. CKAN CKAN pada asasnya merupakan pusat dalam talian bagi projek data terbuka Bandar Glasgow. Laman ini mempunyai set data mengenai pelbagai subjek yang berguna untuk usahawan, pembuat dasar, penyelidik akademik dan pembangun aplikasi untuk digunakan. Daripada 360 set data yang dihoskan di sini, ada yang berkaitan dengan tadbir urus bandar seperti set data stok rumah mengikut tempoh pegangan manakala yang lain seperti set data berbasikal amat menarik minat penduduk tempatan. Terdapat pelbagai maklumat di sini untuk wartawan yang membuat liputan mengenai rentak tempatan. 160. Kerajaan India Kerajaan India mempunyai laman web yang merangkumi analitik dan sumber data dalam versi Projek Data Terbukanya. Pada masa ini, terdapat kira-kira 137,940 sumber yang telah dilihat berjuta-juta kali di laman web ini. Sebahagian besar fail ini juga tersedia untuk dimuat turun di laman web ini. Sama ada mencari nombor dalam bajet kerajaan atau mencari set data yang menangani kesihatan dan kebajikan keluarga, kemungkinan besar laman web ini akan menawarkan sumber. 161. Statistik SA Laman ini penuh dengan statistik, penerbitan dan data terkini yang dikumpulkan oleh kerajaan Afrika Selatan. Di sini para penyelidik akan menemui maklumat tentang segala-galanya daripada tinjauan makanan dan minuman kepada petunjuk ekonomi, statistik pekerjaan, bilangan penduduk dan statistik kesihatan yang penting. Anda boleh mencari nombor mengikut bandar, tema dan petunjuk bergantung pada apa yang diperlukan. Laman ini menyimpan banyak maklumat tentang banci di samping mengeluarkan penerbitan statistik, soal selidik, kod dan klasifikasi serta dasar harga. 162. Pembangunan dan Penyelidikan Dasar Laman ini diterbitkan di bawah naungan Pejabat Pembangunan & Penyelidikan Dasar Jabatan Perumahan dan Pembangunan AS. Ia menerbitkan sejumlah besar kajian kes, penerbitan dwitahunan dan terbitan berkala secara berkala setiap tahun. Ia juga menawarkan sejumlah besar set data yang menarik minat wartawan dengan Sewa Pasaran Saksama, Had Pendapatan, Faktor Inflasi Pembiayaan Pembaharuan hanyalah beberapa set yang boleh diakses oleh orang ramai di laman ini. 163. Data Kesihatan Bersih Penting Di Vital Net Health Data, para penyelidik akan menemui banyak set data berkaitan kesihatan yang besar. Laman ini bukan sahaja menempatkan semua set ini, malah menawarkan pautan ke set yang boleh dilawati dan dicari maklumat oleh orang ramai. Senarai yang disusun rapi ini memautkan kepada sumber seperti CDC Wonder, Eurocat, Health Data All Star dan juga hasil kerja organisasi amal seperti Persatuan Pendaftaran Kanser Pusat Amerika Utara. Ini sememangnya merupakan salah satu sumber set data kesihatan yang paling komprehensif di luar sana. 164. Jambatan Analitik Analytic Bridge ialah sumber yang dikhaskan untuk risikan perniagaan. Di sini para penyelidik akan menemui perbincangan tentang pembelajaran mesin dan AI, pautan ke webinar dan persidangan, malah tab carian kerja. Laman ini juga menganjurkan Data Science Central, iaitu bahagian laman web yang memfokuskan pada data raya. Dengan komuniti yang aktif dan terlibat serta komitmennya untuk menyediakan berita dan maklumat, wartawan yang berminat dengan implikasi data untuk perniagaan akan mendapat banyak manfaat daripadanya. 165. Arkib.org Dikenali terutamanya kerana usahanya untuk menjadi perpustakaan awam dalam talian, archive.org menempatkan pelbagai karya yang diterbitkan serta koleksi set data yang besar. Laman ini mempunyai hasil daripada Banci Internet 2012 serta arkib Dark Net Market dari 2011 hingga 2015, dan juga set data komen awam Reddit. Terdapat lambakan data daripada Music Brainz dan set data yang mengandungi imej kulit audio. Antara penerbitan dan datanya, archive.org mempunyai banyak bahan untuk dibaca oleh wartawan. 166. Torrents Akademik Laman web ini merujuk dirinya sebagai sistem yang direka untuk memudahkan perkongsian dan muat turun set data yang besar. Dengan menggunakan teknologi torrent untuk memudahkan pengedaran data, Academic Torrents berbangga kerana membenarkan penyelidik memuat turun semua yang mereka perlukan dengan cepat. Laman ini juga menempatkan kertas kerja, kursus dan koleksi untuk tontonan. Carian pantas melalui sumber yang tersedia akan mendedahkan bahawa terdapat banyak set data dan koleksi yang tersedia untuk dimuat turun di sini. 167. Dataverse Cara terbaik untuk mendekati Dataverse adalah dengan menganggapnya seperti sejenis perpustakaan yang lain. Di sini, para penyelidik boleh mencari, menemui dan memetik data dengan mudah sambil menggunakan laman web ini sebagai repositori untuk maklumat mereka sendiri. Subjek yang diliputi merangkumi bidang seperti sains sosial, sains pertanian, perubatan, kesihatan dan sains hayat, serta sains bumi dan alam sekitar. Nama-nama besar yang menerbitkan di laman web ini termasuk Gallup dan Jabatan Perdagangan AS, Biro Banci, Bahagian Geografi. 168. DATA UC Beroperasi bersama Makmal Data Sains Sosial UC Berkeley, UC Data merupakan arkib terbesar dan paling terkenal di universiti ini. Laman ini menyediakan tawaran dalam bidang statistik dan data sains sosial. Di laman ini, para penyelidik boleh mengakses kertas kerja, laporan dan kertas kerja yang dihasilkan oleh penyelidik UC Data. Data mentah merangkumi pelbagai bidang penyelidikan yang merangkumi Penjagaan Kesihatan, Kebajikan dan Insurans Sosial, Demografi, Pengundian dan Teknologi Maklumat antara pelbagai topik lain. 169. Kem Jenaka Joe Kamp menawarkan panduan lengkap untuk mencari data dan API bola sepak dan bola sepak untuk tujuan analisis data. Jika penyelidik mengikuti pautan yang disediakan di halaman tersebut, terdapat data sumber terbuka yang tersedia melalui GitHub serta akses kepada API percuma dan komersial untuk tujuan akses yang lebih mudah. ​​Memandangkan data dan pengekodan tersedia di laman web yang terkenal seperti GitHub, mendapatkan data seperti ini tidak pernah semudah ini. 170. Sean Lahman Sean Laham bukanlah nama yang didengari orang setiap hari, tetapi laman webnya merupakan rumah kepada salah satu statistik memukul dan melontar yang paling komprehensif dan mendalam di Internet. Dengan angka yang meliputi tempoh dari 1871 hingga 2016, data tersebut benar-benar bermula sejak berabad-abad yang lalu. Data adalah percuma untuk diakses dan digunakan di bawah lesen Creative Commons Share Alike 3.0 dan boleh dimuat turun terus dalam SQL dan Microsoft Access, antara lainnya. Statistik ini juga boleh dimuat turun melalui GitHub. 171. Helaian Retro Retro Sheet merupakan salah satu sumber paling meluas di Internet untuk statistik dan data besbol. Laman ini merangkumi butiran seperti senarai pemain tahunan dan pengenalpastian pengadil, pemain dan jurulatih. Selama bertahun-tahun ia relevan, data untuk perlawanan semua bintang telah dimasukkan ke dalam fail acara bersama-sama dengan satu set fail acara untuk pascamusim dan fail percanggahan kecil. Retro Sheet juga mempunyai pengenalpastian untuk taman besbol untuk setiap musim. Bagaimana dengan menyeluruh? 172. Cabaran Data Hubway Bagi mereka yang tidak begitu biasa dengan program ini, Hubway ialah nama tempat perkongsian basikal yang berpangkalan di kawasan metropolitan Boston. Sudah tentu, sistem ini tidak merekod dan mengeluarkan maklumat pengenalan diri, tetapi Hubway tetap mempunyai maklumat asas untuk setiap perjalanan yang pernah diambil antara Julai 2011 dan September 2012. Ini termasuk butiran seperti permulaan dan pengakhiran perjalanan serta stesen pengambilan, antara lain beberapa kategori. 173. Penerbangan Terbuka Open Flights ialah pangkalan data yang mempunyai maklumat tentang lebih 10,000 terminal feri, lapangan terbang dan stesen kereta api di seluruh dunia. Para penyelidik boleh menemui versi .csv yang serasi dengan Excel melalui GitHub dan juga boleh memuat turun data terus di laman web. Dengan menggunakan peta di laman utama, adalah mungkin untuk melihat tempat tertentu yang terdapat dalam senarai dan laman web tersebut juga menyediakan maklumat laluan. Pemilik laman web boleh dihubungi untuk maklumat yang lebih terkini. 174. MLVIS MLVIS ialah repositori data yang menggabungkan analitik visual dengan perlombongan data dalam masa nyata. Ini membolehkan penerokaan pemahaman data yang lebih intuitif walaupun semasa bekerja dengan set data yang besar. Data penanda aras dan pembelajaran data mesin bukan hubungan berserta jenis data yang berbeza seperti dikaitkan dan heterogen adalah antara banyak ciri dan pilihan yang tersedia melalui laman web ini. Untuk kemudahan tambahan pengguna, maklumat ini juga boleh dimuat turun ke dalam format tunggal yang konsisten. 175. Permulaan Data Terbuka Open Data Inception ialah laman web yang menawarkan pautan ke lebih 2600 portal data. Dengan menggunakan bar carian di bahagian atas, penyelidik boleh mencari portal dan set data mengikut kategori dan tema. Di samping itu, laman web ini juga boleh digunakan sebagai cara untuk mencari versi set data terkini yang dicari. Manfaatkan keupayaan untuk melihat portal data dalam format senarai atau dalam bentuk visual interaktif dan mula mencari data yang diperlukan. 176. OpenDataSoft Tersedia dalam bahasa Perancis, Inggeris dan Jerman, OpenDataSoft ialah sumber yang menawarkan akses kepada 480 juta rekod, 4 juta sel API dan 9,284 set data. Dengan menggunakan bar carian di tengah-tengah halaman utama, penyelidik boleh memasukkan kata kunci atau kategori dan mencari set data yang paling sesuai dari sana. Bagi wartawan, ini adalah cara yang lebih pantas untuk mencari set data yang paling relevan yang diperlukan untuk melengkapkan penyelidikan yang dimaksudkan. Lawati laman web ini untuk mengetahui lebih lanjut. 177. Nationmaster NationMaster ialah sumber data yang dikumpul sepenuhnya dari lebih 300 buah negara yang telah disusun dalam lebih 5,000 kategori. Data tersebut merangkumi angka-angka yang merangkumi angka peratusan kematian yang telah direkodkan, statistik Perang Dunia 2, malah maklumat tentang perang dan ujian nuklear. Penyelidik juga akan menemui jadual, graf dan carta pai yang akan membolehkan visualisasi data selanjutnya. Secara ringkasnya, terdapat begitu banyak subjek yang diliputi sehingga sentiasa ada sesuatu yang baharu untuk ditemui dalam data tersebut. 178. Followerwonk Twitter telah lama menjadi laman media sosial yang popular untuk berita terkini dan mencari cerita yang sedang popular. Followerwonk membolehkan pengguna meningkatkan penggunaan Twitter mereka ke tahap seterusnya. Ini termasuk mencari pengguna Twitter untuk berhubung, mengkaji pengikut semasa dan merancang aktiviti Twitter untuk hasil yang maksimum. Pada masa kini, terdapat ramai wartawan dan wartawan di Twitter yang menggunakan laman web ini untuk berangkaian dan menyebarkan cerita. Followerwonk menjadikan pengguna Twitter lebih produktif di laman web ini. 179. Infochimps Infochimps ialah laman web yang menawarkan perkhidmatan berasaskan awan yang boleh dikurangkan saiznya untuk tujuan memanfaatkan sepenuhnya data raya. Ia berguna dalam hal penggunaan dan penyepaduan teknologi dan aplikasi data raya. Apabila penyelidik mencari sejumlah besar data atau menilai trend dalam data raya, ini merupakan sumber yang tidak ternilai untuk dimiliki. Terdapat juga banyak kertas putih dan kes yang tersedia untuk penyelidik lihat di laman web ini. 180. Statistik kerajaan negara yang diarkibkan Ditubuhkan pada tahun 2006, Archive-It merupakan perkhidmatan yang disediakan oleh Internet Archive. Perkhidmatan ini membantu organisasi dan perniagaan mencipta koleksi digital dan hasilnya, ia telah berpeluang untuk bekerjasama dengan badan bukan berasaskan keuntungan, kolej, universiti dan kerajaan. Penyelidik boleh mencari beberapa arkib berbeza di laman web ini seperti laman web daripada perlumbaan calon kongres 2014, Arkib Negeri Alabama dan Arkib Web PLN Maklumat Kerajaan Kanada. Laman ini merupakan khazanah maklumat untuk wartawan yang berdaya usaha. 181. Kawasan Awam Sivik Civic Commons mempunyai halaman yang menyenaraikan pelbagai inisiatif data terbuka kerajaan. Senarai sumber yang boleh dicari ini disusun mengikut negara, bandar, wilayah, dan juga menyebut sumber yang disediakan oleh organisasi antara kerajaan. Bagi wartawan, laman web ini mewakili cara yang lebih pantas untuk mengetahui kerajaan mana yang mengambil bahagian dalam Projek Data Terbuka. Laman web ini juga memberikan akses kepada cebisan data setempat yang tidak semestinya muncul dalam carian Google yang mudah. 182. Kerajaan Dunia Penjaga The Guardian merupakan nama yang terkenal dalam dunia kewartawanan kerana reputasinya sebagai berita terkini. Apa yang kurang disedari oleh orang ramai ialah laman web ini mempunyai bahagian yang menawarkan data tentang kerajaan di seluruh dunia. Terdapat artikel tentang kesan bilangan gelandangan, perbincangan tentang keselamatan siber, dan juga perbincangan yang bernas tentang peranan data dan statistik dalam iklim politik dan sosial semasa. Bahagian Kerajaan Dunia The Guardian mampu memulakan perbincangan dan mencari sudut untuk cerita. 183. Data Kerajaan Terbuka (Hab) Laman ini dimiliki oleh sebuah kumpulan melalui Open Knowledge Foundation dengan matlamat untuk menggalakkan dan menyokong pembangunan berterusan data kerajaan terbuka. Di sini, pengguna akan menemui pautan ke salah satu senarai katalog data terbuka yang paling luas yang tersedia. Antara matlamat tambahan yang disebut di laman web ini, kumpulan ini juga berusaha untuk mencari maklumat tentang dasar, amalan terbaik dan garis panduan. Ia menyediakan wartawan dengan akses yang meluas kepada maklumat yang lebih banyak dan lebih baik. 184. Kerajaan Terbuka – Perancis Laman web ini merupakan pusat dalam talian bagi projek data terbuka yang ditawarkan oleh Kerajaan Perancis. Data boleh digali dengan mencari di bawah kategori seperti pekerjaan, pertanian, pendidikan, pelancongan dan pelancongan. Ini adalah data yang membolehkan pembinaan dan pembangunan pemahaman yang lebih terperinci tentang apa yang sebenarnya dikatakan oleh data tersebut di samping memberi ruang untuk perbandingan berdasarkan maklumat sejarah. Pada asasnya, wartawan mempunyai banyak sebab untuk teruja untuk meneliti data ini. 185. Universiti Notre Dame Laman ini menyimpan data penyelidikan yang tersedia melalui penggunaan SourceForge.net oleh Universiti Notre Dame. Data ditawarkan melalui pangkalan data hubungan. Lambakan data bulanan juga memungkinkan untuk mendapatkan pemahaman yang lebih baik tentang perisian sumber terbuka dan aplikasinya. Untuk mengakses maklumat ini, permintaan akses mesti dibuat secara bertulis melalui e-mel. Walau bagaimanapun, kekurangannya ialah penyelidik ilmiah dan akademik adalah satu-satunya yang layak untuk mengakses data tersebut. 186. Laporan UFO Pusat Pelaporan UFO Kebangsaan mempunyai pangkalan data dalam talian yang memperincikan pengalaman orang ramai dengan objek terbang yang tidak dikenali. Para penyelidik boleh menyelaraskan carian pangkalan data mereka dengan menggunakan mana-mana empat kategori iaitu tarikh, bentuk UFO, tarikh yang dipaparkan dan juga mengikut negeri. UFO adalah unik kerana ia tidak pernah gagal menarik imaginasi orang ramai. Jika terdapat sebarang pertemuan jenis ketiga baru-baru ini yang berlaku berdekatan, inilah tempat untuk mengetahui apa yang orang ramai katakan. 187. WikiLeaks Terkenal dan terkenal di media kerana kontroversi dan apa yang didedahkan oleh kebocoran maklumat tentang cara kerja dalaman kerajaan dan tokoh-tokoh terkenal dan berkuasa lain dalam masyarakat, WikiLeaks mempunyai reputasi yang mendahuluinya. Walaupun lambakan data jarang dikeluarkan secara senyap, tiada siapa yang mempersoalkan ketepatan maklumat tersebut. Bagi wartawan yang mencari cerita yang akan menarik minat serta-merta, WikiLeaks ialah sumber yang terbukti. Jika tiada apa-apa lagi, ia akan menjadi bacaan yang menarik. 188. The Washington Post Akhbar ini sudah dikenali sebagai sumber berita terkini dan pendapat yang sangat baik, tetapi hanya sedikit orang yang tahu bahawa Washington Post memberikan akses kepada data mentah yang sering disebut dalam artikelnya. Pada halaman data, para penyelidik boleh menemui data dalam kategori seperti pendidikan, banci, kesihatan dan keselamatan, pengangkutan dan pembangunan, pangkalan data Piala Dunia bersejarah, malah nombor yang berkaitan dengan kerajaan dan politik. Secara ringkasnya, mempunyai akses kepada nombor ini membantu orang ramai mengembangkan pemahaman yang lebih konkrit tentang isu-isu dalam berita. 189. Data Iklim Data Iklim ialah set data yang menyediakan maklumat komprehensif tentang suhu global. Dalam format semasa, pengguna boleh melihat setiap maklumat iklim penting melalui grid sambil dapat melihat puratanya. Bagi mereka yang mencari data pendamping, maklumat yang sama untuk darat dan lautan juga boleh diakses. Maklumat ini boleh dimuat turun, tetapi untuk kemudahan, ia juga boleh dilihat terus di laman web ini. 190. Struktur Protein Struktur Protein merupakan sumber yang bertujuan untuk mengkaji bagaimana rangkaian komputer boleh digunakan bersama-sama dengan biologi. Halaman ini menempatkan repositori dengan data yang boleh diakses melalui pautan yang disediakan. Menarik perhatian khusus bagi ahli komuniti penyelidikan ialah bagaimana laman web ini menggabungkan beberapa idea seperti analisis model dan biologi boleh laku dalam usaha mencapai matlamat ini. Bagi wartawan, laman web ini amat berbaloi untuk dilihat bagi memerhatikan kemajuan dan memeriksa data. 191. Analisis Data Tinjauan Secara Percuma Dengan bantuan laman web ini, pengguna boleh mengambil kursus menganalisis data tinjauan tanpa perlu membayar untuk keistimewaan tersebut. Analisis Data Tinjauan Percuma dengan Isi Kandungannya yang terperinci, merangkumi bahagian-bahagian yang menampilkan tajuk seperti Peta dan Seni Tinjauan – Penyelenggaraan Berwajaran, Mengimbangi Kerahsiaan Responden dengan Ketepatan Anggaran Varians, Model Persamaan Struktur (SEM) dan Data Tinjauan Kompleks. Laman web ini menawarkan penyegaran yang hebat untuk mereka yang menjangkakan akan mengendalikan lebih banyak data statistik pada masa hadapan. 192. UCLA Di laman wiki UCLA, para penyelidik akan menemui beberapa set data yang tersedia untuk tujuan demonstrasi. Terdapat banyak data simulasi dan pemerhatian untuk dipilih. Dengan menggunakan sumber ini, orang ramai boleh menggunakan sumber ini untuk mendedahkan data iklim, data populasi, data bioperubatan, data pengimejan saraf, data banci AS, data pilihan raya dan data ekonomi antara pelbagai kategori lain. Akhirnya, set data ini merupakan sumber yang boleh dimanfaatkan oleh ramai orang. 193. Universiti Toronto Di halaman laman webnya, Universiti Toronto menawarkan akses kepada penyelidik kepada apa yang dipanggil Set Data Delve. Koleksi data ini merupakan sebahagian daripada produk yang lebih besar yang direka untuk tujuan membuat perbandingan antara kaedah pembelajaran. Akhirnya, maklumat ini tersedia untuk pembangunan dan penilaian pendekatan pembelajaran yang berbeza. Pendek kata, ini merupakan sumber yang kukuh untuk penyelidik yang ingin lebih memahami cara menganalisis dan mengendalikan set data. 194. Perkhidmatan Pemuliharaan Sumber Asli Perkhidmatan Pemuliharaan Sumber Asli mempunyai laman web yang menumpukan pada mempromosikan pemuliharaan sambil menawarkan maklumat tentang pelbagai lumut, lumut tanduk, tumbuhan vaskular, liken dan lumut hati yang terdapat di Amerika Syarikat. Laman ini menempatkan pangkalan data penuh tumbuhan dan imej tumbuhan yang boleh didapati di laman web ini untuk disertakan dengan banyak maklumat. Penyelidik boleh memuat turun pangkalan data dan menemui banyak maklumat mengenai topik seperti tanaman alternatif. Pada asasnya, laman web ini mempunyai semua yang orang ramai perlu tahu tentang tumbuhan. 195. Perkhidmatan Penyelidikan Pertanian Seperti yang dapat diandaikan daripada nama agensi tersebut, perkhidmatan ini mengendalikan keperluan penyelidikan untuk Jabatan Pertanian AS. Setiap kali masalah pertanian ditemui, bahagian kerajaan inilah yang kemungkinan besar akan membantu mencari penyelesaian. Laman ini menempatkan beberapa set data yang boleh diakses dan dimuat turun secara langsung. Wartawan juga boleh menggunakan laman ini untuk mencari semua berita terkini berkaitan isu-isu yang mempengaruhi pertanian. 196. Perpustakaan Imej Sel Laman ini menawarkan perpustakaan awam yang menawarkan sumber, maklumat dan akses kepada imej dan animasi yang menggambarkan sel dan proses selular. Sel ini direka bentuk dengan mengambil kira proses penyelidikan dan pendidikan berganda, maklumat di sini hampir selalu relevan semasa perbincangan tentang kesihatan awam dan penyakit. Bahan-bahan ini berasal daripada gabungan sumber termasuk penerbitan sejarah dan moden. Untuk penjelasan menyeluruh yang memudahkan proses biologi yang rumit, wartawan pasti akan memilih Perpustakaan Imej Sel. 197. Genomik Lengkap Ini merupakan tapak sebuah syarikat yang menganggap dirinya sebagai sebahagian daripada ruang bioteknologi yang mantap dalam bidang penjujukan genom manusia. Menariknya, Complete Genomics telah menyediakan beberapa jujukan genom keseluruhannya kepada orang ramai. Akhirnya, ini menawarkan pelbagai pandangan berguna tentang DNA dan genom manusia yang dijujukan. Satu-satunya syarat pada bahan ini ialah penyelidik yang menggunakan maklumat ini perlu berhati-hati untuk memberikan rujukan yang betul kepada Complete Genomics. 198. Ekspres Array Array Express ialah repositori yang menyimpan maklumat daripada hasil eksperimen genomik yang memerlukan sejumlah besar penjujukan atau pemprosesan. Di laman web ini, pengguna akan menemui lebih daripada 70,000 hasil eksperimen untuk disertakan dengan lebih daripada 2 juta esei di dalam berbilang terabait stor data. Lebih baik lagi, maklumat ini adalah percuma untuk digunakan semula bagi tujuan penyelidikan. Ini merupakan sumber yang hebat untuk semua maklumat terkini tentang genomik dan kemajuan yang dicapai dalam bidang ini. 199. Kod Ensiklopedia Unsur DNA, atau Konsortium ENCODE, merupakan hasil daripada kumpulan penyelidikan dari seluruh dunia yang bekerjasama antara satu sama lain. Matlamat utamanya adalah untuk menyusun senarai semua bahagian berfungsi genom yang merangkumi pemeriksaan rapi tahap RNA, protein, unsur-unsur yang mengawal selia sel dan aktiviti gen. Terdapat data yang boleh dicari serta ensiklopedia yang menawarkan maklumat lanjut. 200. Genom Ensembel Ensemble Genomes ialah laman web yang ditubuhkan pada tahun 2000 yang berkaitan dengan genom vertebrata. Selama bertahun-tahun, sumber ini telah menambah maklumat tambahan tentang invertebrata metazoan, tumbuhan, bakteria dan kulat. Data mengenai semua subjek ini boleh didapati dan diakses dengan mengklik pautan yang tersedia di laman web ini. Laman web ini mempunyai tutorial, set data mengenai semua topik yang dibincangkan dan koleksi dokumen untuk dilayari. Semua faktor ini menjadikan Ensemble Genomes sumber data yang hebat untuk wartawan. 201. Konsortium Ontologi Gen Ontologi Gen ialah laman web yang wujud untuk tujuan khusus mencari cara untuk mewakili pemahaman semasa tentang bagaimana gen beroperasi melalui komputer. Ia mempunyai banyak penerbitan serta dokumentasi tambahan yang boleh dibaca oleh orang ramai. Terdapat anotasi yang dihoskan terus di laman web ini. Berita baik untuk penyelidik yang ingin melihat dengan lebih dekat nombor dan data mentah ialah terdapat fail yang tersedia untuk dimuat turun terus di laman web. 202. Perpustakaan Tandatangan Selular Berasaskan Rangkaian Bersepadu Pusat LINCS Sekolah Perubatan Harvard wujud untuk tujuan membantu komuniti penyelidikan dan orang awam mempelajari lebih lanjut tentang bagaimana sel manusia bertindak balas apabila mereka diganggu oleh ubat-ubatan. Dengan menggunakan pangkalan data HMS LINCS dan alat peneroka projek, para penyelidik boleh menemui penerbitan dan ringkasan projek serta sumber umum. Wartawan juga boleh menggunakan laman web ini untuk mendapatkan semua berita dan maklumat terkini yang terhasil daripada penyelidikan ini. 203. Projek Kepelbagaian Genom Manusia Projek Kepelbagaian Genom Manusia telah mencapai banyak kemajuan melalui usaha Pusat Genom Manusia Stanford. Laman ini mempunyai sampel yang mempunyai beribu-ribu sampel dan penanda. Ternyata sampel ini boleh dimuat turun dan diperhatikan serta dianalisis secara menyeluruh hanya dengan mengikuti pautan yang telah disediakan di halaman tersebut. Ini merupakan sumber yang hebat untuk wartawan yang ingin memahami maklumat yang datang daripada komuniti penyelidikan. 204. Pemapar Data JCB JCB DataViewer membolehkan mereka yang berminat dengan apa yang ingin disampaikan oleh Journal of Cell Biology untuk melihat data imej yang berkaitan dengan artikel yang diterbitkan di sana. Laman ini mempunyai galeri penuh yang boleh ditatal oleh orang ramai untuk melihat bahan-bahan tersebut. Di samping itu, penonton juga mempunyai pilihan untuk melakukan analisis lanjut terhadap data semasa mereka melayari laman web ini. Secara ringkasnya, laman web ini sesuai untuk memahami rujukan dan angka yang terdapat dalam artikel jurnal. 205. Portal Data Umum Data Genomik Portal Data GDC merupakan platform yang direka untuk membantu penyelidik dan mereka yang berada dalam bidang bioinformasi menjalankan penyelidikan mengenai kanser dengan lebih cekap. Terdapat arkib, API, serta dokumen yang tersedia untuk dibaca dan sebagainya. Akses ke laman web ini bermakna dapat melihat maklumat yang sama yang digunakan oleh penyelidik kanser untuk menjalankan penyelidikan mereka sendiri. Di sini, wartawan akan dapat mencari semua data yang mereka cari dan banyak lagi. 206. Opensp Opensp ialah projek berkuasa komuniti yang direka untuk tujuan berkongsi genotip. Orang yang telah ditaip menggunakan FamilyTreeDNA, 23andMe atau deCODEme boleh memuat naik maklumat tersebut ke laman web ini. Tujuan meminta orang ramai melakukan ini adalah supaya laman web ini boleh memberi tumpuan kepada melihat sama ada hubungan boleh ditemui antara genotip dan SNP, atau polimorfisme nukleotida tunggal. Apa yang menarik minat wartawan ialah terdapat data yang tersedia untuk orang ramai muat turun dan nikmati semakannya. 207. Pathguide Pathguide ialah laman web yang didedikasikan untuk menyediakan maklumat tentang laluan metabolik dan isyarat serta interaksi antara protein pada peringkat molekul. Laman ini mengandungi senarai kira-kira 697 sumber yang berkaitan dengan subjek utama. Pangkalan data yang dipautkan di laman web ini secara amnya percuma untuk diakses. Kebanyakan rujukan yang disediakan dalam senarai sumber ini memberi tumpuan terutamanya kepada interaksi protein dengan protein. Laman web ini merupakan sumber yang tidak ternilai untuk peminat biologi. 208. RCSB PBB Ini adalah laman web yang didedikasikan untuk memaklumkan ahli akademik dan orang ramai tentang semua perkara yang berkaitan dengan asid nukleik dan protein. Bank Data Protein RCSB menawarkan akses kepada pelbagai alat yang direka untuk menjadikan aspek biologi ini lebih mudah difahami termasuk alat visualisasi, paparan struktur 3D dan arkib yang boleh dicari sepenuhnya yang boleh dikategorikan mengikut kategori organisma. Di samping itu, laman web ini menawarkan berita terkini tentang semua perkembangan terkini dalam bidang ini. 209. Konsortium Genomik Psikiatri Konsortium Genomik Psikiatri merupakan hasil kerjasama antara penyiasat dan saintis dari seluruh dunia yang sedang menjalankan penyelidikan mengenai komponen genetik gangguan psikiatri. Akhirnya, projek ini berjaya menghasilkan 17 kertas kerja utama dan 31 kertas kerja pembangunan tambahan yang menawarkan analisis dan kaedah sekunder dengan satu kertas kerja penting yang terhasil daripada semua itu. Konsortium ini menawarkan alatan, muat turun dan akses kepada dapatan melalui portal akses data atas permintaan. 210. Kimia Pub PubChem merupakan nama yang disegani dalam bidang penyelidikan perubatan dan biologi dan telah lama wujud. Dengan menawarkan keupayaan untuk mencari struktur serta pangkalan data Compound, BioAssay dan Substance, para penyelidik pasti akan memilih laman web ini. Di samping itu, terdapat berjuta-juta entri yang terdapat dalam setiap pangkalan data ini. Maklumat ini boleh dilihat melalui alatan seperti alatan conformer 3D dan alatan BioAssay. Data ini juga boleh dimuat turun. 211. KOSMIK Seperti namanya, Katalog Mutasi Somatik Dalam Kanser, atau COSMIC, dikhaskan untuk mencatat dan penerokaan kesan mutasi somatik dalam kanser. Laman ini membolehkan carian COSMIC yang dikategorikan mengikut jenis kanser, gen dan mutasi. Terdapat alatan di COSMIC seperti pelayar genom dan pelayar kanser. Di samping itu, terdapat juga data tentang kurasi gen, rintangan ubat, skrin genom, tandatangan mutasi dan kurasi gabungan gen yang tersedia di laman web ini untuk dimuat turun. 212. Genomik Kepekaan Ubat dalam Kanser Genomics of Drug Sensitiviti dalam Kanser didedikasikan untuk mencari penanda biologi yang boleh membantu doktor mengenal pasti jenis ubat antikanser yang lebih cenderung untuk ditanggapi oleh pesakit. Wartawan boleh menggunakan tab berita untuk mengikuti perkembangan terkini tentang kehadiran data baharu atau perubahan pada laman web ini. Di samping itu, terdapat juga himpunan data tentang barisan sel, pangkalan data yang mencatat ciri-ciri kanser, dan juga senarai sebatian yang semuanya tersedia untuk dilihat di laman web ini. 213. Institut Penyelidikan Perubatan Stowers Laman web Institut Penyelidikan Perubatan Stowers menawarkan akses percuma kepada orang awam yang menjalankan penyelidikan kepada data yang telah digunakan oleh saintis, saintis penyelidikan dan saintis genomik untuk penerbitan mereka. Bagi orang awam, institut ini berusaha keras untuk menunjukkan bahawa Repositori Data Asal Stowers biasanya percuma untuk diakses. Walau bagaimanapun, beberapa fail terbesar dalam pangkalan data mungkin tidak boleh diakses secara langsung melalui Internet dan mungkin memerlukan pengaturan tambahan. 214. Pangkalan Data SSBD Pangkalan data Sains Dinamik Biologi sistem, yang biasanya dirujuk sebagai pangkalan data SSBD, menyediakan satu set alat dan sumber yang akan digunakan untuk tujuan memeriksa imej mikroskopik dan menilai data biologi kuantitatif. Imej yang terdapat di laman web ini berasal daripada pelbagai sumber dan merangkumi objek seperti sel, molekul tunggal dan nukleus ekspresi gen. Dengan data di laman web ini diperoleh daripada simulasi dan eksperimen pengiraan, wartawan boleh yakin bahawa maklumat di sini sentiasa diperhalusi dan dikemas kini. 215. Berkongsi Genom Peribadi Projek Genom Peribadi merupakan laman web yang memberi tumpuan kepada penciptaan data kesihatan, genom dan sifat yang terbuka dan tersedia kepada orang ramai. Sebahagian besarnya meneruskan projek ini dengan bantuan individu yang telah menawarkan diri untuk mendedahkan maklumat genomik mereka kepada umum, laman web ini menawarkan data yang telah ditemui dan berjaya diperoleh kepada orang ramai secara percuma. Selain sains, projek ini menawarkan wartawan pandangan yang menarik tentang kesan penciptaan rekod awam maklumat genom peribadi. 216. Pelayar Genom UCSC Pelayar Genom USCS membolehkan individu melihat himpunan genom. Selain tontonan dalam talian, laman web ini juga menyediakan pautan yang boleh digunakan untuk memuat turun jujukan dan anotasi untuk himpunan genom yang sama. Pautan ini dibahagikan kepada kategori manusia, mamalia, vertebrata lain, deuterostom, serangga, nematod, genom lain dan muat turun lain. Alat dan direktori di laman web ini juga percuma untuk kegunaan peribadi dan bukan komersial. Wartawan boleh mendapat manfaat daripada ketelitian dan kebolehcapaian maklumat ini. 217. UniProt Sumber Protein Universal, yang dikenali dengan nama UniProt, merupakan tempat untuk mendapatkan maklumat tentang penjujukan dan anotasi protein. Berdasarkan maklumat yang disediakan oleh tiga pangkalan data dalam Kelompok Rujukan UniProt, Pangkalan Pengetahuan UniProt dan Arkib UniProt, laman web ini dilengkapi dengan carian peptida dan kelompok antara ciri-ciri lain. Wartawan boleh menggunakan laman web ini untuk mengesahkan, menemui dan mempelajari lebih lanjut tentang penemuan baharu dalam bidang penjujukan dan anotasi protein. 218. Data Indeks Iklim Aktuari Indeks Iklim Aktuari, juga dikenali sebagai ACI, memberikan maklumat kepada orang awam dan pembuat keputusan tentang trend iklim dan kesan perubahan iklim di Kanada dan AS. Para penyelidik boleh meneliti maklumat yang disediakan oleh alat pendidikan ini untuk mencari dan menemui perubahan besar-besaran pada laut dan cuaca. Anda boleh mempersempitkan carian mengikut wilayah dan komponen. Laman ini mempunyai data selama beberapa dekad dan ia mengemas kini maklumatnya secara rutin setiap suku tahun. 219. Pusat Cuaca Penerbangan Pusat Cuaca Penerbangan menyediakan maklumat cuaca yang tepat, tepat pada masanya dan terkini yang boleh diandalkan oleh sistem ruang udara. Di laman web ini, pengguna boleh melihat pelbagai graf, ramalan dan pemerhatian cuaca yang dibingkaikan dengan cara yang dapat difahami oleh juruterbang. Maklumat yang disediakan oleh sumber data laman web boleh dilihat dalam masa nyata sama ada melalui output .csv atau XML. Penyelidik boleh memanipulasi dan memerhatikan nombor mentah dengan lebih teliti melalui pilihan muat turun ini. 220. Unit Penyelidikan Iklim Laman web Unit Penyelidikan Iklim disediakan untuk tujuan khusus menjalankan penyelidikan mengenai kesan perubahan iklim pada masa lalu, mengkaji punca-puncanya, dan mencari penyelesaian kepada isu-isu perubahan iklim pada masa kini. Di sini, orang ramai boleh membaca hasil penyelidikan, mendapatkan gambaran keseluruhan subjek melalui helaian maklumat, membaca penerbitan, dan juga mengakses data mentah. Wartawan yang mencari set data cuaca mentah bernasib baik dengan sumber ini. 221. Penilaian & Set Data Iklim Eropah Di laman web Penilaian & Set Data Iklim Eropah, orang ramai dapat menemui maklumat tentang perubahan ekstrem sama ada dalam iklim atau cuaca. Penyelidik mempunyai pilihan untuk menggunakan alat penyelidikan projek ini, yang dipanggil KNMI Climate Explorer, untuk mengesahkan data, memeriksa ramalan bermusim, dan juga melihat dengan lebih dekat kesan El Nino antara aplikasi lain. Memandangkan set data ini dikemas kini setiap hari, wartawan yang menggunakan sumber ini akan menjadi yang pertama mengetahui tentang sebarang tanda perubahan iklim yang ekstrem. 222. Perkhidmatan Semak Imbas Imej Global Perkhidmatan Semak Imbas Imej Global, atau singkatannya GIBS, merupakan bahagian penting EOSDIS dalam peranannya sebagai penyedia perkhidmatan imej yang responsif dan berdasarkan piawaian komuniti. Dalam erti kata lain, GIBS membolehkan orang biasa berinteraksi dengan imej satelit yang diambil dari mana-mana sahaja di bumi dalam definisi tinggi. Memandangkan EOSDIS GIBS disediakan melalui data sains bumi NASA, lebih mudah berbanding sebelum ini bagi wartawan dan penyelidik untuk mengetahui lebih lanjut tentang dunia dalam masa nyata. 223. Iklim dan Ekosistem Bering Beroperasi di bawah Pentadbiran Lautan dan Atmosfera Kebangsaan Kerajaan Amerika Syarikat, laman web ini memberitahu wartawan dan penyelidik semua yang mereka ingin tahu tentang bagaimana iklim dan ekosistem Laut Bering bertindak balas terhadap perubahan yang telah berlaku di Artik. Di sini, anda boleh membaca esei, menyemak unjuran dan menggunakan alat data dalam talian untuk melihat prestasi pelbagai indeks iklim, biologi, atmosfera, data lautan dan hidupan liar di Laut Bering. 224. NCEI NCEI, atau Pusat Kebangsaan untuk Maklumat Alam Sekitar, merupakan hasil akhir selepas penggabungan tiga pusat data Pentadbiran Lautan dan Atmosfera Negara. Halaman ini menempatkan satu siri pautan yang dibahagikan kepada 22 kategori yang akan menghubungkan pengguna ke sumber yang berbeza, halaman yang diminati dan set data iklim dan cuaca. Wartawan yang mencari maklumat tentang iklim, ribut, hujan dan pelbagai kebimbangan cuaca lain, mungkin akan menemui apa yang mereka cari di sini. 225. Makmal Penyelidikan Sistem Bumi Bahagian Pemantauan Global Pentadbiran Lautan dan Atmosfera Negara menyediakan maklumat tentang trend jangka panjang kuasa perubahan iklim di bumi melalui pemantauan metrik atmosfera utama. Antaranya ialah karbon monoksida, metana, nitrus oksida dan karbon dioksida sebagai contoh. Metrik ini kemudiannya digunakan untuk mengukur perkara seperti penipisan ozon jangka panjang, sumber dan tahap karbon dioksida, serta sinki. Ini adalah sumber perubahan iklim yang boleh digunakan oleh wartawan. 226. WorldClim – Data Iklim Global Pernahkah anda mahukan cara yang lebih baik untuk mendapatkan data iklim visual? WorldClim ialah penyedia perisian data percuma yang kemudiannya boleh digunakan untuk pemodelan ruang serta untuk mencipta peta. Versi semasa perisian percuma ini hanya boleh digunakan untuk iklim semasa manakala versi lama membenarkan akses kepada data iklim dari masa lalu dan semasa dan juga membolehkan pengguna melihat keadaan ramalan iklim masa hadapan. Wartawan hanya boleh mengikuti pautan dan memuat turun perisian tersebut. 227. Makmal Penemuan Pengetahuan Makmal Penemuan Pengetahuan merupakan laman web yang didedikasikan untuk pembangunan teknologi inovatif, asas pembelajaran mesin dan aplikasi pengetahuan tersebut dalam bidang praktikal seperti sains rangkaian, pengesanan penipuan dan analisis data saintifik. Laman web ini menempatkan set data yang agak besar dalam DBLP dengan 1.2 juta objek dan 2.48 juta pautan yang disertakan dalam set tersebut. Bagi penyelidik yang berminat dengan matlamat Makmal Penemuan Pengetahuan, set data ini merupakan sumber yang sangat baik. 228. Cabaran Pelaksanaan DIMACS Laman web Cabaran Pelaksanaan ke-9 adalah untuk membantu para penyelidik mempelajari cara menyelesaikan masalah laluan terpendek. Bagi pencipta, laman web ini dibina dengan dua matlamat. Pertama, untuk mencari penyelesaian terbaik yang boleh dihasilkan semula. Dan kedua, untuk memudahkan para penyelidik bekerjasama dan menemui penyelesaian yang lebih berkesan. Penyelidik yang berminat untuk melihat sejauh mana kemajuan yang dicapai dengan ini boleh menyemak kertas kerja dan set data di laman web ini. 229. Repositori Rangkaian Repositori Rangkaian ialah laman web tempat data saintifik disimpan dengan penambahan alat visual interaktif yang boleh diakses dan dianalisis oleh pengguna. Laman web ini mempunyai dua kelebihan iaitu sebagai repositori pertama seumpamanya dan juga yang terbesar di web. Menggunakan data grafik dan imej intuitif yang menarik secara visual, membuat perbandingan dan mencari cara baharu untuk mengkontekstualisasikan data adalah lebih mudah. ​​Wartawan boleh menggunakan sumber ini untuk mencari cerita dalam data saintifik. 230. Set data Pajek Pajek Datasets ialah halaman yang menyediakan set data yang menangani interaksi antara protein yang terdapat dalam yis tunas. Selepas menawarkan penjelasan latar belakang yang ringkas tentang kesan mencari kaedah baharu untuk mengesan interaksi berserta sebab-sebab mengapa keupayaan untuk membezakan kepentingan pelbagai interaksi protein dengan protein adalah penting, laman web ini menghubungkan penonton terus ke set data yang tersedia untuk dimuat turun. Untuk mengetahui lebih lanjut, penyelidik boleh mengklik pada pautan di bahagian bawah untuk membaca kertas kerja yang diterbitkan mengenai subjek tersebut. 231. Data Rangkaian Mejn Laman ini bertujuan untuk berkongsi pautan ke set data rangkaian yang telah digunakan dan disusun oleh pemilik web. Tema set data terdiri daripada bola sepak Kolej Amerika, blog politik dan buku tentang politik Amerika, hinggalah rangkaian sosial, Les Miserables dan kolaborasi teori bertenaga tinggi. Individu yang berminat untuk menerokai perkara ini akan mempunyai banyak tema set data yang menarik untuk dipilih. Di samping itu, data ini percuma untuk digunakan selagi terdapat rujukan. 232. Pangkalan Grafik Stanford Stanford GraphBase ialah nama yang diberikan kepada sekumpulan set data dan program oleh Donald Knuth dari Stanford. Apabila digunakan bersama antara satu sama lain, program dan set data ini dapat memanipulasi dan menjana graf dan rangkaian. Di laman web ini, bahan yang diperlukan tersedia untuk dimuat turun melalui pautan. Dalam fail ini, penyelidik akan menemui data skor bola sepak, data kamus, data yang berkaitan dengan pembinaan semula Mona Lisa dan banyak lagi. 233. Koleksi Matriks SuiteSparse Dahulunya dikenali sebagai Koleksi Matriks Jarang Universiti Florida, Koleksi Matriks SuiteSparse ialah koleksi matriks yang mempunyai implikasi kehidupan sebenar. Menurut laman web ini, koleksi khusus ini lebih kerap digunakan untuk algebra linear berangka dalam membangunkan dan memperhalusi algoritma matriks jarang. Pengguna cenderung menyukai koleksi ini kerana kegunaannya dalam menjalankan dan menguji keputusan eksperimen. Set data dan penanda aras matriks boleh dimuat turun terus di laman web ini. 234. Set Data Graf Ini adalah satu set set data yang dipercayai oleh pencipta halaman web ini sama ada bersifat relasional atau mampu diterjemahkan dengan baik kepada perwakilan graf. Set Data Graf menawarkan set data seperti data Cabaran Toksikologi Prediktif, data IMDb, data mutagenesis, data MovieLens, penapisan kolaboratif dan data protein kepada penyelidik yang ingin mempelajari cara bekerja dengan nombor mentah. Fail-fail tersebut disediakan di halaman ini dan terutamanya tersedia untuk dimuat turun dalam format XML. 235. Berita Data Besar Big Data News ialah laman web yang memberi tumpuan kepada data raya dan asas-asas sains data. Laman ini menempatkan berita terkini dan merangkumi perbincangan tentang pembelajaran mendalam dan Kecerdasan Buatan. Di samping itu, Big Data News juga menempatkan set data besar-besaran yang mengandungi sejumlah kira-kira 3.5 bilion halaman web. Semua ini dipisahkan oleh tahap yang masing-masing dirujuk sebagai graf peringkat halaman, graf peringkat subdomain, graf subdomain peringkat pertama dan graf peringkat domain bayar. 236. Pusat Penyelidikan Rangkaian dan Sistem Kompleks CNetS, atau Pusat Penyelidikan Rangkaian dan Sistem Kompleks, beroperasi di bawah naungan Institut Sains Rangkaian Universiti Indiana dan Sekolah Informatik dan Pengkomputeran. Laman ini bertujuan untuk menjadi sumber dalam bidang sains data, sains sosial pengkomputeran dan rangkaian serta sistem kompleks dengan maklumat tentang perlombongan dan corak trafik dalam talian. Di samping itu, CNetS juga mengehos set data yang mengandungi kira-kira 53.5 bilion permintaan rangkaian yang dibuat oleh pengguna Universiti Indiana. 237. Penjelajah OONI OONI Explorer, sebahagian daripada Balai Cerap Terbuka Gangguan Rangkaian, merupakan projek yang dikhaskan untuk menyediakan perisian percuma dan sumber terbuka. Pengguna kemudiannya boleh menggunakan perisian ini untuk mencuba menyekat laman web dan aplikasi pemesejan antara aplikasi lain. Antara yang menarik minat mereka yang berminat dengan teknologi ini ialah ketersediaan akses percuma kepada data mentah yang telah dikumpulkan oleh OONI. Hanya masukkan maklumat tersebut ke dalam OONI Explorer dan berinteraksi dengan data dari sana. 238. Cabaran dalam Pembelajaran Mesin Cabaran dalam Pembelajaran Mesin dikhaskan untuk penyelidikan dan pembangunan pembelajaran mesin. Di laman web ini, pembaca akan menemui pautan ke perisian, buku, cabaran pembelajaran mesin, serta pemberitahuan bengkel yang akan datang. Laman web ini juga menyediakan pautan ke cabaran yang membolehkan penyerahan selepas tarikh. Bagi wartawan yang berminat untuk melihat sama ada pembelajaran mesin boleh melaksanakan tugas seperti ramalan kewangan atau pengelasan halaman web, ini adalah laman web yang sangat berbaloi untuk dikunjungi. 239. DataX Kini beroperasi di bawah naungan CrowdANALYTIX, DataX merupakan bahagian mesin dalam inisiatif berpacu komuniti yang memanfaatkan kuasa kolektif untuk mencipta aplikasi Kecerdasan Buatan, pembelajaran mesin dan Pengaturcaraan Neuro-Linguistik tersuai. Peranan DataX dalam proses tersebut adalah penyelenggaraan dan penggunaan yang seterusnya berfungsi untuk menjadikan penyelesaian ini boleh diskala. Bagi wartawan yang mempunyai banyak teks, video dan data untuk disusun, bot yang tersedia melalui CrowdANALYTIX dan DataX boleh memendekkan separuh masa penyelidikan. 240. Data Dipacu Driven Data menggabungkan crowdsourcing dengan sains data dengan cara yang hampir tiada laman web lain lakukan. Menekankan peranannya dalam menyediakan bantuan kepada organisasi yang menangani pelbagai cabaran sosial, laman web ini menawarkan bantuan dengan menggunakan komuniti sains datanya yang besar untuk menghasilkan model statistik yang menyelesaikan soalan ramalan. Driven Data nampaknya berfungsi terutamanya dengan pertubuhan bukan untung, tetapi ia berpotensi berguna untuk sesiapa sahaja yang mempunyai data mentah yang memerlukan penambahbaikan. Wartawan boleh mendapat manfaat daripada mengingati sumber ini. 241. Data Besar Terbuka Dandelion API ialah aplikasi yang mengendalikan analisis teks semantik untuk data raya. Ini bermakna bagi mereka yang mempunyai data yang memerlukan pemprosesan ialah program ini akan mengambil teks yang tidak teratur dan mencari cara untuk meletakkannya dalam konteks. Wartawan yang sedang menghuraikan banyak dokumen pasti boleh mendapat manfaat daripada keupayaan tersebut. Dandelion API juga mempunyai Open Big Data di bawah kategori Milano, Trento dan Eropah. Walaupun API ini berbayar, terdapat jumlah teks harian yang boleh dianalisis secara percuma. 242. Model Bumi Model Bumi memberi tumpuan kepada perkongsian dan penyimpanan perisian dan set data yang berkaitan dengan bumi. Alat pemodelan yang disebut di laman web ini termasuk perisian simulasi dan pemprosesan serta data maya yang banyak meminjam daripada bidang pengajian tertentu seperti tektonik dan seismologi. Wartawan dan penyelidik yang ingin memperhalusi pengetahuan mereka tentang subjek ini boleh menggunakan penerbitan dan artikel di laman web ini untuk berbuat demikian sebelum menggunakan alat pemodelan dan visualisasi. 243. Pusat Data dan Aplikasi Sosioekonomi (SEDAC) Pusat Data dan Aplikasi Sosioekonomi, atau SEDAC, merupakan salah satu pusat data yang berkaitan dengan sistem EOSDIS NASA. Di laman web ini, pembaca akan menemui set data yang menawarkan nombor mengenai perubahan iklim atau maklumat demografi grid. Set data juga boleh dicari mengikut tema seperti Tadbir Urus, Pertanian, Penggunaan Tanah, Kesihatan, Pemuliharaan dan Iklim, Air, Penderiaan Jauh dan Kemiskinan. Terdapat peta, galeri, panduan yang memberikan lebih konteks kepada data dan sumber serta alatan tambahan yang boleh diakses oleh penyelidik di laman web ini juga. 244. Portal AODN Portal AODN, sebuah laman web yang dipegang oleh Rangkaian Data Lautan Australia, merupakan laman web yang menawarkan akses kepada data sains iklim dan marin Australia. Penyelidik yang mengakses maklumat ini juga akan mempunyai akses kepada data IMOS dan metadata, yang merupakan rangka kerja penyelidikan pelbagai institusi termasuk sokongan Kerajaan Australia. Penyelidik yang memilih untuk memanfaatkan Portal AODN boleh menjangkakan untuk menerima penyampaian data lautan yang sangat baik dalam antara muka yang intuitif. 245. Planet OS Planet OS menawarkan rangka kerja data raya dengan penekanan pada tenaga boleh diperbaharui. Pilihan niche ini digandingkan dengan kecekapan laman web ini telah menjadikannya popular di kalangan syarikat tenaga yang mencari cara baharu untuk memvisualisasikan dan mengkontekstualisasikan data mereka. Di samping itu, laman web ini juga mempunyai apa yang dipanggil DataHub di mana ia menempatkan koleksi besar lebih 2,000 set data. Set data ini termasuk data terbuka melalui NASA dan Copernicus dan data tersebut sering dikemas kini secara berkala. 246. INSTITUSI SMITHSONIAN Smithsonian telah lama menjadi nama akademik yang dihormati dan dihargai di seluruh dunia atas komitmennya terhadap penyelidikan dan sejarah. Dalam beberapa aspek, adalah wajar jika Smithsonian mempunyai laman web yang menawarkan beberapa maklumat terbaik tentang penyelidikan gunung berapi dalam talian. Laman ini menerbitkan laporan, pautan penyelidikan dan pangkalan data yang merangkumi carian gunung berapi yang disempitkan, letusan, pelepasan dan ubah bentuk untuk disertakan dengan senarai dan hamparan gunung berapi Holosen. Wartawan tidak memerlukan sumber lain tentang aktiviti gunung berapi. 247. Katalog Gempa Bumi Dikemas kini dan diselenggara oleh Program Bahaya Gempa Bumi kerajaan AS, Katalog Gempa Bumi membolehkan para penyelidik melihat bila dan di mana gempa bumi terakhir berlaku. Walaupun hasil carian dihadkan kepada 20,000, carian katalog mampu menapis hasil mengikut magnitud, tarikh dan masa, malah mengikut wilayah geografi. Tahap fleksibiliti ini menjadikan sumber ini amat berguna untuk wartawan yang membuat liputan bencana alam atau gempa bumi tempatan dan mencari maklumat latar belakang. 248. Persatuan Ekonomi Amerika Persatuan Ekonomi Amerika menyediakan data mengenai data makroekonomi untuk AS dan negara-negara lain di seluruh dunia kepada para penyelidik. Laman ini nampaknya tidak menghasilkan data ekonomi tetapi ia menyusun senarai pendek yang paling boleh dipercayai. Walau bagaimanapun, memandangkan banyak laman web yang menawarkan maklumat ekonomi di Internet, ini adalah sumber yang boleh dijangkakan oleh wartawan. Hanya pergi ke laman web tersebut dan klik kategori data ekonomi dengan sewajarnya. 249. Statistik Sejarah.org Historicalstatistics.org merupakan laman web yang sangat berguna untuk mencari jenis maklumat ekonomi yang memberikan kontras yang menarik dengan masa kini. Contohnya, penukar mata wang sejarah laman web ini membolehkan para penyelidik mengetahui berapa banyak yang boleh dibeli oleh seseorang yang mempunyai $10 USD pada tahun 1923 pada hari ini. Ia juga menempatkan penerbitan dan kertas kerja yang menanyakan soalan tentang metrik yang digunakan dalam bidang sejarah ekonomi berserta indeks harga dan maklumat tentang penawaran wang yang boleh ditapis mengikut negara. 250. DB Nomics Bagaimana jika semua data ekonomi awam di Internet boleh diakses dan dicari dari satu platform yang boleh dinavigasi? Db.nomics ialah agregator pangkalan data ekonomi yang berusaha untuk melakukan perkara itu. Data tersedia dalam format seperti HTML, JSON dan CSV dan dikemas kini secara automatik sementara semakan sebelumnya diarkibkan dengan sewajarnya. Sumber ekonomi termasuk Rizab Persekutuan, Biro Analisis Ekonomi, Tabung Kewangan Antarabangsa dan lain-lain. Penyelidik yang mencari data ekonomi yang bereputasi tidak akan salah dengan Db.nomics. 251. Hab Hutang Luar Bersama (JEDH) Dibangunkan melalui gabungan kerja Bank for International Settlements, Pertubuhan Kerjasama dan Pembangunan Ekonomi (OECD), Tabung Kewangan Antarabangsa dan Bank Dunia, Hab Hutang Luar Bersama menjadikan maklumat tentang data hutang dan pemiutang serta penghutang antarabangsa boleh diakses oleh orang ramai. Wartawan yang sedang mengkaji kewangan negara-negara yang berbeza dan cuba memahami landskap kewangan antarabangsa dengan lebih mendalam akan menemui hampir semua yang mereka ingin tahu di sini. 252. Data Perdagangan Antarabangsa Digabungkan dengan input penuh daripada pakar ekonomi terkemuka dalam Jon Haveman, halaman Data Perdagangan Antarabangsa ini menempatkan data yang boleh dimuat turun dan dianalisis selanjutnya. Set data tersebut merangkumi data tarif, jadual Penn World, utiliti, data import, produktiviti pembuatan, klasifikasi barangan, Kod Pembezaan Produk Rauch, data NBER, tinjauan aliran komoditi 1997, perdagangan dan imigresen, dan model graviti yang berguna. UNIX ialah sistem pengendalian yang digunakan untuk menyusunnya, tetapi laman web ini menyatakan bahawa PC juga harus mempunyai akses kepada data tersebut. 253. Korporat Terbuka Di OpenCorporates, para penyelidik mempunyai kemewahan untuk mencari dan menemui maklumat, salah satu pangkalan data terbuka syarikat terbesar di seluruh dunia. Maklumat ini kemudiannya digunakan oleh pelbagai kumpulan di seluruh dunia seperti bank, penyiasat, NGO dan wartawan dalam usaha untuk mendapatkan risikan dan maklumat. Wartawan mempunyai manfaat tambahan kerana dapat mengakses data dalam masa nyata dengan bantuan API OpenCorporates serta melalui data teras pukal atau set data teras lain. 254. Dunia Kita dalam Data Dunia Kita dalam Data mengambil maklumat daripada beberapa sumber dalam pelbagai bidang dan membentangkan data kuantitatif mengenainya. Daripada angka penyertaan wanita dalam tenaga kerja kepada maklumat tentang persepsi rasuah umum dalam sektor awam dan ketidaksamaan pendapatan global, jika subjek ini boleh dibincangkan dari segi data, laman web ini mungkin mempunyai entri untuknya. Wartawan boleh menggunakan sumber ini untuk mencari statistik dan angka yang berkaitan dengan isu sosial. 255. Sains Po Sciences Po, atau lebih dikenali sebagai Institut Pengajian Politik merupakan sebuah sekolah yang mempunyai pengaruh yang tidak dapat dinafikan dalam sains sosial. Dalam kes ini, halaman Thierry Mayer merangkumi fail data yang menampilkan data regresi graviti dan konflik ketenteraan daripada “Make Trade Not War” serta set data mengenai potensi pasaran antara lain. Wartawan yang ingin lebih memahami kesimpulan yang dicapai dalam jurnal akademik akan menemui banyak maklumat semasa melayari laman web ini. 256. Pusat Data Antarabangsa Sejak membuat penampilan sulungnya pada tahun 1999, Pusat Data Antarabangsa telah berdedikasi untuk misinya mengumpul, mencipta, menambah baik dan mengedarkan data ekonomi antarabangsa di luar talian dan dalam talian. Di laman web ini, pembaca boleh mengakses maklumat seperti data Tarif AS, import dan eksport Dunia dan AS, malah maklumat daripada Jadual Dunia Penn. Dengan maklumat ini disediakan kepada orang ramai untuk pendidikan dan penyelidikan, wartawan boleh mengakses dan menggunakan data ini secara percuma. 257. Balai Cerap Kerumitan Ekonomi Balai Cerap Kerumitan Ekonomi, yang biasanya dirujuk sebagai OEC, membolehkan penyelidik, pelajar, ahli ekonomi dan sesiapa sahaja untuk menggambarkan data perdagangan antarabangsa. Dengan tema yang menarik perhatian dan antara muka interaktif, laman web ini memberi peluang yang sah kepada penyelidik untuk meneroka maklumat perdagangan antarabangsa dengan cara yang belum pernah dilihat sebelum ini. Bagi wartawan yang suka melihat data ekonomi menjadi nyata semasa mereka mencarinya, OEC merupakan sumber yang tidak ternilai. 258. Data Kad Skor Kolej Pendidikan tinggi merupakan topik hangat dalam banyak kalangan dengan pelajar dan keluarga yang ingin tahu bagaimana prestasi sekolah dan sejauh mana pembelajaran pelajar. Melalui data Kad Skor Kolejnya, Jabatan Pendidikan AS memberikan semua maklumat ini dan banyak lagi kepada pendidik dan pelajar. Nombor-nombor ini merangkumi tahun 1996 hingga 2016 dan merangkumi data semasa, data kad skor dan pendapatan pasca sekolah, serta maklumat Sistem Data Pinjaman Pelajar Kebangsaan yang baharu. Ia merupakan sumber pendidikan pasca menengah terkini yang harus digunakan oleh wartawan. 259. Set Data Tenaga Bangunan Komersial Sebagai set data yang berkaitan terutamanya dengan tenaga, COMBED mempunyai tuntutan automatik terhadap keunikan. Tambahan pula, datanya diperbaharui beberapa kali seminit semasa datang dari bangunan komersial, dan menjadi jelas bahawa set data ini adalah unik. Bagi wartawan, maklumat ini sangat berguna untuk dimiliki semasa menyediakan artikel mengenai penggunaan tenaga. Mengakses data COMBED semudah memuat turun dan membuka hamparan Excel. 260. Set Data DRED Bahagian DRED bagi Pangkalan Data DRED bermaksud Set Data Tenaga Kediaman Belanda. Seperti yang dicadangkan oleh tajuknya, data ini mengukur dan mengkaji berapa banyak tenaga yang akan digunakan oleh satu isi rumah Belanda. Suasana, penghunian, elektrik dan maklumat isi rumah umum semuanya dipantau dalam set data ini dari 5 Julai 2015 hingga 5 Disember 2015. Mana-mana wartawan yang menyelidik penggunaan tenaga akan mendapat manfaat daripada menyemak nombor mentah yang disediakan di sini. Arahan untuk memuat turun data dalam CSV boleh didapati terus di laman web. 261. Set Data ECO ECO, yang bermaksud Penggunaan dan Penghunian Elektrik, merupakan projek yang dikendalikan dan dikendalikan oleh Kumpulan Sistem Teragih. Premis projek ini melibatkan penyelidik yang memantau beban dan mengesan penghunian di enam isi rumah Switzerland sepanjang 8 bulan. Laman ini menawarkan akses kepada maklumat tersebut serta arahan dan pautan ke penerbitan berkaitan. Terima kasih kepada papan pemuka interaktif visual laman web ini, wartawan sepatutnya tidak menghadapi masalah untuk menterjemahkan penyelidikan kepada sesuatu yang menarik. 262. Set Data India untuk Air dan Tenaga Ambien IAWE, yang bermaksud Indian Dataset for Ambient Water and Energy, telah dicipta dengan matlamat untuk memantau penggunaan tenaga sebuah rumah di New Delhi dengan pengukuran elektrik daripada peralatan, meter elektrik dan panel litar. Disebabkan oleh gangguan bekalan, perbezaan bekalan air, penurunan paket dan turun naik voltan, iAWE menghadapi masalah yang unik untuk menjejaki penggunaan tenaga di India. Ini merupakan data yang sangat berguna untuk dimiliki oleh wartawan apabila membincangkan corak penggunaan tenaga. 263. Elektrik Peringkat Perkakas Domestik UK Elektrik Tahap Perkakas Domestik UK, atau UK-DALE, ialah nama yang diberikan kepada set data yang memantau dan merekodkan berapa banyak kuasa yang diperlukan dalam sekumpulan lima isi rumah. Setiap enam saat, UK-DALE mengukur permintaan daripada kedua-dua grid kuasa utama serta peralatan individu di dalam rumah. Wartawan yang berminat untuk melihat bagaimana isi rumah UK menggunakan tenaga, pastinya boleh menggunakan UK-DALE. Data tersebut boleh diakses dan terdapat kertas kerja yang menerangkan sistem yang tersedia untuk dibaca. 264. ArcGIS ArcGIS Hub ialah platform yang boleh digunakan oleh organisasi dan individu untuk mencapai matlamat melalui inisiatif seluruh laman web. Dengan templat halaman, panduan langkah demi langkah dan contoh yang tersedia untuk dilihat, laman web ini merupakan sumber yang sangat baik untuk penggerak sosial yang bercita-cita tinggi. Sementara itu, maklumat yang tersedia di bawah tab Data Terbuka menempatkan ratusan set data dalam kategori "Bencana" sahaja. Sama ada wartawan sedang menyelidik data atau menyumbangkannya, ArcGIS Hub berguna dalam pelbagai cara. 265. GIS Cambridge Cambridge GIS ialah repositori data terbuka Bandar Cambridge, Massachusetts. Kecuali fail yang terlalu besar untuk dimuat turun melalui repositori GitHub ini, kebanyakan set data bandar boleh didapati di halaman ini. Set data individu yang tersedia di sini termasuk daerah komersial, easement, daerah pengezonan, keputusan banci, tanah perkuburan dan mercu tanda serta ciri lain yang boleh diukur melalui data. Seorang wartawan yang mencari maklumat tempatan akan menemui semua yang mereka cari dan banyak lagi di laman web ini. 266. Geo-Wiki.org Sebagai sumber, Geo-Wiki ialah laman web yang didedikasikan untuk apa yang digelarnya sebagai "pergerakan sains warganegara". Di sini, rakyat digalakkan untuk mencuba memantau alam sekitar. Para penyelidik boleh menemui berita terkini di bar sisi bersama-sama dengan nama penerbitan dan set data percuma serta muat turun perisian. Alatan yang disediakan oleh laman web ini termasuk peta, muat naik data peribadi, pengesahan dan hackathon yang boleh dimuat turun dalam format Excel dan fail zip. 267. Peta Jalan Terbuka Petikan data OpenStreetMap berasal daripada projek OpenStreetMap, percubaan dalam talian yang berterusan untuk mencipta peta dunia melalui suntingan dan usaha komuniti pengguna global. Untuk bermula dengan sumber data ini, semua penerbit kandungan perlu lakukan ialah memilih benua pilihan mereka dan kemudian mencari negara pilihan mereka selepas itu. Tiada yuran dikenakan untuk memuat turun Geofabrik GmbH ini dan data dikemas kini setiap hari sebagai peraturan umum. 268. Data Terbuka HIFLD Dikendalikan dan diselenggara oleh Jabatan Keselamatan Dalam Negeri, HIFLD, untuk Data Peringkat Asas Infrastruktur Dalam Negeri, meletakkan data geospatial dalam domain awam. Data ini diedarkan untuk tujuan khusus menyediakan sokongan dan maklumat bagi tujuan penyelidikan dan persediaan dalam komuniti. Data ini boleh dimuat turun ke dalam Shapefile dan CSV dan ia juga boleh dilihat di web. Bagi penerbit, Data Terbuka HIFLD menjadikan data geospatial lebih visual dan menarik berbanding sebelum ini. 269. Alamat Terbuka OpenAddresses pakar dalam infrastruktur dan pengumpulan alamat. Dikuasakan sebahagian besarnya oleh kekuatan usaha komuniti, laman web ini menggunakan GitHub sebagai platform pembangunannya. Di sini, orang ramai boleh meletakkan alamat pada peta selepas menambahkannya ke pangkalan data atau mereka boleh mengambil data dan mula mengekod geo secara langsung dengan segera. Dengan semua data dan alamat terbuka dan hanya memerlukan atribusi, kemas kini data berkala dan potensi untuk kemajuan pengekodan geo menjadikan OpenAddresses satu projek yang sangat menarik. 270. Data Terbuka LMU Open Data LMU sangat bergantung pada data daripada OpenStreetMap untuk membantu dalam pembangunan Fast Reverse Geocoder. Ini bermakna aplikasi ini mampu mengambil lokasi pada peta dengan cepat dan mencari alamat penuh berdasarkan titik tersebut. Ini berpotensi digunakan untuk kawasan kejiranan dan daerah juga. Laman web ini menempatkan banyak pautan yang berkaitan dengan aplikasi yang merangkumi kod sumber, set data dan jadual carian serta resolusi OpenStreetMap. 271. Penjelajah Data Alam Sekitar Dengan Environmental Data Explorer, wartawan, penyelidik dan pelajar boleh memuat turun dan meneroka set data yang sama yang digunakan oleh Program Alam Sekitar Pertubuhan Bangsa-Bangsa Bersatu bersama-sama dengan organisasi dan rakan kongsi gabungannya. Carian boleh disempitkan mengikut wilayah dan dibuat menggunakan mana-mana atau semua 500 penapis. Di samping itu, set data termasuk kategori seperti kesihatan, KDNK, iklim, pelepasan dan air tawar yang boleh dilihat terus di laman web ini sama ada dalam bentuk graf, jadual atau peta. 272. Kumpulan Bank Pembangunan Afrika Laman web Kumpulan Bank Pembangunan Afrika merupakan persinggahan pertama wartawan apabila mencari maklumat statistik dan petunjuk yang berkaitan dengan benua Afrika. Pengguna yang menatal katalog data boleh menapis set data mengikut sumber, topik dan wilayah. Bagi sesiapa yang mencari pengetahuan yang lebih mendalam tentang subjek yang dibincangkan, laman web ini juga menawarkan pautan ke senarai penerbitan yang mengagumkan yang merangkumi tajuk-tajuk seperti Tinjauan Ekonomi Afrika dan Buku Tahunan Statistik Afrika. 273. Data Umum Genomik (GDC) Genomic Data Commons NCI menempatkan salah satu repositori data kanser paling teliti di web yang menumpukan pada bidang kajian genomik kanser. Portal data laman web ini menempatkan beribu-ribu kes dan merangkumi 38 jenis penyakit untuk disertakan dengan 39 projek dan percuma untuk diakses. Dengan penyerahan data dibuat terutamanya oleh institusi dan penyelidik, ketepatan maklumat ini menjadikannya sumber data yang sesuai untuk disimpan oleh wartawan. 274. Pangkalan Data PhysioBank Pangkalan data PhysioBank menyediakan data fisiologi kepada individu melalui domain awam. Pangkalan data ini dibahagikan kepada dua kategori yang lebih besar iaitu bentuk gelombang dan klinikal. Antara subkategori bentuk gelombang terdapat pangkalan data imej, selang antara denyutan, sintetik, gaya berjalan dan keseimbangan, ECG dan pangkalan data berbilang parameter. Sebahagian daripada maklumat tulen yang keluar daripadanya termasuk data tentang data tanda vital di sisi katil, tepu oksigen dan juga penyakit kardiovaskular. Wartawan dan individu yang menyelidik tubuh manusia mungkin menemui beberapa maklumat di sini. 275. Pangkalan Data Perlindungan Medicare Pangkalan data Medicare Coverage, yang diselenggarakan oleh Pusat Perkhidmatan Medicare & Medicaid melalui Jabatan Kesihatan dan Perkhidmatan Manusia, menawarkan akses penuh kepada penyelidik kepada banyak maklumat tentang perkhidmatan perubatan. Terdapat maklumat tentang keadaan kronik, perbelanjaan ubat, templat klinikal elektronik, sistem kutipan hutang dan geran penyelidikan dan demonstrasi untuk dibaca. Untuk data yang diambil terus daripada sumber, ini adalah laman web dalam talian yang paling teliti dan komprehensif seumpamanya. 276. Data Pembayaran Terbuka Apabila kebanyakan orang berjumpa doktor, mereka biasanya tidak duduk untuk memikirkan sama ada doktor penjagaan utama mereka mendapat manfaat dari segi kewangan atau tidak selepas bekerjasama dengan pengeluar penjagaan kesihatan. Pembayaran Terbuka memaklumkan orang ramai tentang sebarang makanan, penyelidikan, hadiah, yuran ceramah dan perbelanjaan perjalanan yang diterima oleh doktor atau hospital daripada syarikat. Wartawan yang mencari cerita yang penting boleh menggunakan penjelajah data untuk melihat maklumat atau mengklik pada tab untuk memuat turun data secara langsung. 277. FlickrLogos Sebahagiannya ditulis dalam nama, tetapi FlickrLogos merujuk kepada set data yang terdiri daripada logo syarikat yang telah difoto dalam pelbagai kedudukan yang berbeza. Dikendalikan oleh Makmal Pengkomputeran Multimedia dan Penglihatan Komputer Universiti Augsburg, koleksi ini pada asalnya disusun dengan tujuan untuk melatih komputer untuk mengenali logo dan teks. Untuk mengikuti sebarang kemajuan yang dibuat dengan program yang bernilai berita ini, tidak salah untuk memuat turun set data ini dan melihat isinya. 278. ImageNet ImageNet ialah pangkalan data yang penuh dengan gambar yang telah dianjurkan oleh WordNet. Terdapat cabaran tahunan di laman web ini yang boleh dilihat walaupun selepas ditutup dan tertumpu pada penciptaan algoritma yang mampu melaksanakan tugas tertentu. ImageNet juga merupakan rumah kepada pelbagai penerbitan, petikan dan slaid. Penerbit kandungan berorientasikan teknologi pasti mempunyai banyak sebab untuk menggunakan pilihan penjelajah bagi memahami struktur WordNet serta peta awan. 279. Set Data Anjing Stanford Set data Stanford Dogs mengandungi banyak gambar dan imej baka anjing yang berbeza. Dengan 120 baka anjing yang berbeza disertakan bersama lebih 20,000 imej individu, pangkalan data berkuasa ImageNet ini memberikan penyelidik banyak gambar untuk digunakan sambil mengajar mesin cara mengenali setiap baka anjing. Di laman web ini, pautan ke penerbitan berbeza yang membincangkan penggunaan set data untuk mengajar komputer tentang pengecaman imej boleh diklik dan dibaca bersama muat turun set data. 280. Pangkalan Data SUN Pangkalan data SUN merupakan tapak projek yang diwujudkan untuk komuniti penyelidikan bagi mencapai kemajuan dalam bidang seperti visi dan grafik komputer, perlombongan data, pembelajaran mesin dan neurosains antara lain. Dengan lebih 131,000 imej dan hampir 4,000 kategori objek dalam indeksnya, laman web ini sekomprehensif yang mungkin. Bagi penerbit yang berminat dengan pangkalan data ini dan apa yang penyelidik dapat lakukan semasa menggunakannya, ini merupakan sumber data yang berbaloi untuk diterokai. 281. Set Data Haiwan Peliharaan Oxford-IIIT Set Data Haiwan Peliharaan Oxford-IIIT merupakan laman web yang bertindak sebagai pelengkap kepada kertas kerja yang diterbitkan pada Persidangan IEEE 2012 mengenai Penglihatan Komputer dan Pengecaman Corak dan menempatkan set data asal yang digunakan untuk tujuan kertas kerja tersebut. Imej-imej ini telah disusun kepada kira-kira 37 kategori haiwan peliharaan untuk disertakan dengan 200 imej lain yang berkaitan dengan setiap kelas yang terlibat. Tambahan pula, data ini boleh dimuat turun terus melalui pautan di laman web. 282. Set Data Genom Visual API Genom Visual merupakan hasil akhir kerja keras yang dilakukan oleh beberapa pelajar dan profesor madya dari Universiti Stanford. Dengan beberapa kertas kerja atas namanya dalam usaha mencipta API yang mampu menilai dan menerangkan imej, program ini telah berjaya menjawab lebih sejuta soalan sambil menilai lebih 100,000 imej. API ini mewakili kemajuan dalam bidang sains komputer dan bidang berkaitannya dan set data boleh dimuat turun terus di laman web ini. 283. Wajah YouTube Pangkalan Data Wajah YouTube tertumpu pada pembangunan penyelesaian kepada isu pengecaman wajah automatik dalam video. Secara keseluruhannya, set data ini mempunyai lebih 3,000 video yang diambil dari YouTube daripada hampir 1600 individu pada purata panjang kira-kira 181 bingkai. Pada akhirnya, matlamatnya adalah untuk mencipta algoritma yang mampu mencipta label yang mengenal pasti orang yang berada dalam video tersebut. Data berserta maklumat tentang ralat serta kaedah penerangan semuanya tersedia untuk ditonton terus di laman web ini. 284. Repositori set data KEEL Repositori set data KEEL mengandungi set data perisian sumber terbuka berasaskan Java yang direka bentuk untuk membantu dalam pelbagai jenis penemuan data pengetahuan. KEEL, yang dikenali sebagai Pengekstrakan Pengetahuan berdasarkan Pembelajaran Evolusi, boleh dilatih untuk mempelajari cara menambah nilai yang hilang, model hibrid dan kaedah statistik untuk menilai eksperimen antara beberapa tugas lain. Muat turun set data serta senarai lengkap algoritma yang dipaparkan dalam KEEL boleh dimuat turun terus dari laman web ini. 285. Kelab Pemberi Pinjaman Kemunculan Lending Club yang terkenal adalah statusnya sebagai pemberi pinjaman rakan sebaya yang membolehkan peminjam menerima pinjaman walaupun mereka tidak semestinya mempunyai skor kredit yang mencukupi untuk meminjam daripada pemberi pinjaman tradisional. Selain aspek kebaharuan cara laman web ini beroperasi, ia juga menyediakan statistik yang merangkumi sorotan platform, maklumat pinjaman yang ditolak, nombor prestasi pelabur dan juga kamus data yang mengandungi data sejarah. Nombor-nombor ini biasanya bermula dari tahun 2007 dan boleh dimuat turun dalam CSV. 286. Muzium Sejarah Alam Muzium Sejarah Semula Jadi dianggap oleh ramai sebagai salah satu muzium yang paling dikenali di dunia, tetapi pendigitalan dan keupayaan untuk memeriksa katalognya melalui portal data terbuka mungkin merupakan berita baharu bagi ramai orang. Dengan 91 set data yang merangkumi koleksi mikrofosil dan fosil serta rekod lot indeks antara bahan lain, data ini terbuka kepada orang ramai dan percuma untuk dimuat turun dalam pelbagai format. 287. Perbendaharaan Kata Getty Laman ini sesuai untuk wartawan dan penerbit yang ingin kekal dalam garis panduan gaya tertentu semasa menerangkan dan mengkategorikan seni, nama artis, seni bina, bahan dan nama geografi tertentu. Laman ini menghubungkan pengguna secara langsung ke pangkalan data perbendaharaan kata terkawal yang perlu diketahui oleh penyelidik dan pengkatalog untuk memenuhi piawaian antarabangsa. Sekurang-kurangnya di sini, tiada tandingan dengan Perbendaharaan Kata Getty. Set data boleh diterokai melalui teks atau SPARQL dan boleh dimuat turun melalui laman web ini. 288. Korpus Penyiasatan Stilometri CLiPS (CSI) Korpus Penyiasatan Stilometri CLiPS mungkin bukanlah apa yang difikirkan oleh kebanyakan orang apabila mereka mendengar perkataan CSI, tetapi korpus CSI tetap merupakan set data yang terdiri daripada ulasan pelajar dan esei pelajar. Selain teks itu sendiri, kehadiran meta-data dan maklumat yang terbenam dalam dokumen tersebut dinyatakan oleh laman web ini mempunyai pelbagai kegunaan. Ditawarkan dan diedarkan di bawah lesen Creative Commons, semua yang diminta oleh korpus sebagai pertukaran untuk menggunakan set data tersebut adalah atribusi. 289. Kebergantungan Universal v2 Universal Dependencies v2 merujuk kepada versi kedua projek Universal Dependencies yang dikemas kini, satu usaha untuk membangunkan anotasi bank pokok yang boleh digunakan secara konsisten dengan beberapa bahasa yang berbeza. Dalam versi yang dikemas kini, penyelidik akan menemui berpuluh-puluh bank pokok UD untuk bahasa yang berbeza termasuk bahasa Afrikaans, Yunani kuno, Jepun, Belanda, Finland dan Cina di samping bahasa Inggeris. Versi terbaharu Universal Dependencies boleh didapati dan dimuat turun berhampiran bahagian bawah halaman web ini. 290. Webhose Webhose ialah sumber set data terbaik yang diambil terus daripada repositori laman web dan dibuka kepada orang ramai. Penyelidik boleh menyusun artikel berita mengikut bahasa dengan bahasa Arab, Perancis dan Belanda hanyalah beberapa bahasa dengan nombor artikel melebihi 100,000. Di samping itu, artikel berita Inggeris dipecahkan lagi kepada kategori seperti hiburan dan sukan untuk disertakan dengan ulasan dan catatan forum. Penerbit digital dan penyelidik boleh mendapat manfaat daripada meneroka set data ini. 291. Data Wiki Wikidata merupakan sumber kandungan dan idea yang dipandang rendah oleh penerbit dan penyelidik. Menurut halaman ini, terdapat beberapa cara untuk mengakses bahan dalam lambakan data walaupun penggunaan JSON adalah cara yang paling disyorkan oleh laman web ini. Tersedia dan percuma sepenuhnya untuk kegunaan bukan komersial dan komersial, semua data yang tersedia di sini boleh diakses dan dimuat turun secara percuma di bawah lesen Creative Commons. 292. Pautan Wiki Terletak dengan selesa dalam rangka kerja Google Code, Wiki Links ialah projek sumber terbuka yang bertujuan untuk menyediakan individu dengan akses kepada set data unik tertentu itu. Di halaman web ini, para penyelidik boleh memuat turun teks README, fail data dan lesen Creative Commons sama sekali. Penerbit atau individu yang berorientasikan teknologi mempunyai banyak perkara yang dinanti-nantikan apabila melihat set data yang besar ini. Hanya navigasi melalui laman web, klik dan mula memuat turun fail. 293. Wordnet WordNet ialah leksikon Bahasa Inggeris yang terdiri daripada komponen bahasa, kata keterangan, kata nama, kata sifat dan kata kerja yang dikategorikan kepada kumpulan berbeza yang kemudiannya digunakan untuk menyatakan idea tertentu. Hasil akhirnya ialah alat berguna yang mengkategorikan perkataan mengikut cara ia digunakan dan maksudnya dan bukannya bagaimana ia berbunyi apabila disebut. Aplikasi WordNet dalam pengaturcaraan linguistik dicatatkan bersama-sama dengan pelbagai penerbitan dan statistik yang terdapat di laman web ini. 294. Atlas Otak Allen Atlas Otak Allen, yang dicipta oleh Allen Institute for Brain Science Resources, merupakan alat untuk mengkaji dan mempelajari lebih lanjut tentang otak manusia dan bagaimana ia bertindak balas apabila badan manusia sihat serta apabila terdapat penyakit. Dengan menggunakan atlas ini, para penyelidik boleh mempelajari tentang otak manusia dan perkembangannya serta glioblastoma dan kesan kanser pada otak. Wartawan yang membuat liputan topik ini boleh melayari laman web ini untuk mendapatkan set data dan maklumat. 295. NITRC NITRC, atau Neuroimaging Informatics Tools and Resources Clearinghouse, ialah tempat wartawan dan penerbit boleh mendapatkan neuroimaging. Disatukan dan dipromosikan sebagai inisiatif untuk neuroimaging perkongsian data, laman web ini menempatkan data daripada beberapa projek seperti Projek 1000 Connectome, Inisiatif Praproses Addiction Connectome, serta projek INDI-Prospektif dan Retrospektif. Individu bebas memuat turun data melalui laman web. Neuroimage yang diambil pada pelbagai peringkat tidak pernah dapat diakses sebegini. 296. HCP Dewasa Muda Projek Human Connectom Young Adult merupakan kesinambungan usaha berterusan untuk mencipta peta tepat bagi connectom manusia seperti yang akan dilihat pada kebanyakan orang dewasa normal. Melalui dua fasa, 1200 orang dewasa yang sihat telah diimbas melalui gabungan teknik fMRI keadaan rehat dan pengimejan resapan. Wartawan dan penerbit yang mencari maklumat tentang otak tidak akan menemui laman web lain dengan lebih banyak data tentang connectom manusia pada orang dewasa muda yang sihat. 297. Arkib Data NIMH Arkib Data NIMH, atau NDA secara ringkasnya, bukanlah sumber data bebas tetapi ia merupakan platform untuk mengedarkan dan menyimpan data. Di laman web ini, terdapat data yang telah dikumpulkan sepanjang pelbagai kertas kerja dan projek penyelidikan serta penyediaan kaedah dan alatan yang membolehkan analisis dan kerjasama yang lebih baik. Ringkasan data tersedia secara percuma dan penyedia kandungan yang melaporkan perkembangan sains terkini boleh menggunakan maklumat ini untuk menyampaikan berita terkini. 298. Neurodata NeuroData berdedikasi untuk menjalankan penyelidikan tentang hubungan unik antara minda dan otak. Hasil daripada komitmen laman web ini terhadap sains terbuka dan penyelidikan yang boleh dihasilkan semula, penyedia kandungan mempunyai akses kepada penerbitan dan beberapa set data yang boleh diakses dengan mengikuti pautan di laman web. Ketersediaan kod percuma dan alat analisis yang menjadikan penerokaan kerja NeuroData lebih mudah menarik minat mereka yang ingin melihat data tersebut. 299. NeuroElektro Projek NeuroElektro direka bentuk dengan tujuan untuk mengumpul pelbagai ciri elektrofisiologi yang berkaitan dengan jenis neuron yang berbeza dan mengagregatkannya ke dalam satu pangkalan data. Projek ini bertujuan untuk mengkaji hubungan antara neuron dalam usaha untuk mengkaji perbezaan antara pelbagai jenis neuron. Laman ini memautkan ke artikel dan menyenaraikan jenis neuron dan sifat elektrofisiologi yang ditemui setakat ini. Penyedia kandungan boleh bergantung pada laman ini sebagai sumber data tentang hubungan neuron-ke-neuron. 300. Siri Pengajian Pengimejan Akses Terbuka Siri Pengajian Pengimejan Akses Terbuka, juga dikenali ramai sebagai OASIS, merupakan projek yang direka bentuk dengan matlamat untuk menjadikan set data MRI otak boleh diakses oleh komuniti saintifik secara amnya. Wartawan dan penyelidik boleh mengakses penerbitan yang membandingkan data MRI antara orang dewasa serta helaian fakta komprehensif daripada kertas kerja komprehensif OASIS yang membandingkan dan membezakan hasil daripada lebih 400 subjek. Maklumat dan alatan boleh dimuat turun dari laman web dalam beberapa format. 301. OpenfMRI Bagi wartawan yang ingin mengakses set data MRI tanpa sebarang kerumitan yang berkaitan dengan beberapa laman web lain, tumpuan OpenfMRI.org untuk menjadikan set data MRI boleh diakses oleh orang ramai merupakan perkembangan positif. Datang terus daripada penyelidik sendiri, laman web ini menempatkan pelbagai set data seperti set data pembelajaran pengelasan, tugasan perjudian campuran dan tugasan pengambilan risiko analog belon. Kepelbagaian dan kuantiti data membolehkan penyelidik mencari jalan pertanyaan baharu melalui laman web ini. 302. Studyforrest Meminjam namanya daripada filem terkenal Forrest Gump, kajianforrest berusaha untuk memahami apa yang mampu dilakukan oleh otak apabila ia perlu berfungsi pada tahap yang lebih tinggi sambil berhadapan dengan rangsangan semula jadi tetapi sama kompleksnya. Walaupun begitu, laman web ini mengakui bahawa jumlah data fMRI yang dikumpul daripada kajian ini mempunyai aplikasi yang lebih luas daripada yang disangka pada mulanya. Penyedia kandungan boleh menyemak imbas 19 penerbitan yang telah digunakan kajianforrest data dan juga boleh mengakses data tersebut secara langsung. 303. Pangkalan Data Terbuka Kristalografi Seperti yang dijangkakan daripada tajuknya, Pangkalan Data Terbuka Kristalografi merupakan koleksi 385,697 mineral dan sebatian logam-organik, struktur kristal organik dan bukan organik dengan pengecualian ketara biopolimer. Penyedia kandungan yang ingin mengetahui lebih lanjut tentang struktur kristal boleh mencari mengikut formula struktur atau menjalankan pertanyaan carian yang sepadan dengan pilihan untuk melayari. Terdapat juga perisian dan data di laman web ini yang menjadikan laman web ini sangat berharga dalam bidang kimia. 304. Arkib Eksoplanet NASA Sejak sekian lama dianggap sebagai salah satu sumber maklumat utama tentang angkasa lepas, NASA meneruskan tradisinya sebagai sumber yang tidak ternilai dengan arkib Eksoplanetnya. Laman ini menempatkan beberapa alat dan perisian interaktif seperti Perkhidmatan Transit dan Efemeris, Periodogram, Alat Perancangan Planet yang Disahkan dan keupayaan untuk memuat naik fail dan mencari jadual secara interaktif. Penyedia kandungan yang mencari pandangan unik boleh menggunakan data ini untuk berbuat demikian pada kali seterusnya eksoplanet menjadi berita besar. 305. Tinjauan Langit Digital Sloan Keupayaan untuk mencipta peta tiga dimensi Alam Semesta boleh dilakukan oleh sesiapa sahaja dengan bantuan Sloan Digital Sky Survey, atau SDSS. Wartawan dan penyedia kandungan boleh mengakses algoritma, data pengimejan, set data, tutorial dan pembangunan bahan visual selanjutnya untuk tujuan mendidik orang ramai secara formal dan tidak formal. Laman ini juga membincangkan secara eksplisit tentang cara menjadikan datanya boleh diakses oleh orang ramai melalui berita dan media sosial. Ini merupakan alat visual yang tidak ternilai untuk penyedia kandungan. 306. StatSci.org Statsci.org menawarkan senarai sumber yang komprehensif yang boleh diakses dan digunakan oleh orang ramai bergantung pada keperluan khusus mereka. Antara maklumat tersebut termasuk Perkhidmatan Set Data Elektronik dan kajian kes yang disusun oleh UCLA. Selain set data mentah, terdapat juga buku teks yang dipautkan di halaman ini. Ini termasuk tajuk seperti Buku Panduan Set Data Kecil dan Kajian Kes dalam Biometri. Penyedia kandungan yang mencari statistik pasti akan tersilap langkah dengan melihatnya. 307. ERIC ERIC, juga dikenali sebagai Institut Sains Pendidikan, merupakan sumber yang bertindak sebagai enjin carian bagi sesiapa sahaja yang mencari maklumat tentang bidang pendidikan. Carian awal juga menyediakan pilihan untuk menapis secara eksklusif untuk maklumat yang disemak oleh rakan sebaya serta teks penuh berasaskan ERIC. Memandangkan betapa kerapnya bajet pendidikan dan kaedah pengajaran muncul dalam berita, ini merupakan sumber data yang harus diingat oleh wartawan. 308. NTIS Ditubuhkan sejurus selepas tamatnya Perang Dunia 2, NTIS (Perkhidmatan Maklumat Teknikal Kebangsaan) telah ditubuhkan dengan matlamat untuk menggunakan data bagi membantu agensi persekutuan membuat keputusan berasaskan data yang tepat melalui penggunaan data. Agensi ini pada asalnya merupakan repositori data kerajaan AS dalam bidang penyelidikan saintifik. Hari ini, laman web ini menempatkan berjuta-juta penerbitan mengenai pelbagai subjek. Maklumat sejarah sahaja menjadikan laman web ini layak sebagai sumber data untuk wartawan dan penerbit. 309. Sijil Data Terbuka Laman web ODI (Institut Data Terbuka) menempatkan apa yang dipanggil Sijil Data Terbuka, iaitu alat percuma yang tersedia dalam talian yang dibangunkan untuk tujuan khusus bagi memeriksa dan mengiktiraf kualiti data terbuka secara kritis. Dari perspektif penerbit atau wartawan, laman web ini juga menempatkan pelbagai set data mengenai subjek daripada senarai geran kepada amaran alahan berserta senarai yang boleh dimuat turun dalam format CSV. 310. Arkib GitHub GitHub merupakan salah satu repositori dan arkib data yang paling popular dan terkenal di Internet kerana kemudahan kerjasama, kapasiti arkib dan kebolehcapaian pengekodan. Sama ada melibatkan percubaan untuk mencipta bot yang boleh melaksanakan tugas tertentu atau membangunkan aplikasi, GitHub ialah laman web di mana penerbit kandungan dan wartawan boleh menemui produk yang berpotensi bernilai berita dengan mudah. ​​Arkib ini boleh diakses dengan mengikuti arahan tutorial untuk sama ada JSON atau Big Query. 311. Corak Sosio SocioPatterns merupakan projek yang memberi tumpuan kepada pencarian corak dalam aktiviti manusia dan dinamik sosial melalui data. Seperti yang dijangkakan dengan matlamat yang dinyatakan secara meluas, maklumat laman web ini telah digunakan dalam penerbitan yang membincangkan pelbagai subjek daripada penyebaran penyakit kepada kajian kes tentang perbezaan antara persona individu dalam talian dan luar talian. Set data tersedia untuk dilihat begitu juga kertas kerja yang diterbitkan yang mengandungi maklumat yang mungkin akan didapati relevan oleh penerbit pada satu ketika nanti. 312. Peta Indie Peta Indie merupakan hasil daripada pengambilan maklumat daripada lebih 2,000 laman web IndieWeb yang paling sibuk dan menggulung data tersebut ke dalam bentuk visual interaktif seperti API Graf Sosial, set data dengan keupayaan pertanyaan SQL dan maklumat mentah yang dirayapi pada sejumlah 5.7 juta halaman web. Penerbit digital yang berminat dengan perisian sumber terbuka dan apa yang mungkin dikatakan oleh data ini tentang komuniti dalam talian ini boleh mengakses maklumat tersebut terus daripada laman web. 313. Universiti Simon Fraser Simon Fraser terus membina statusnya sebagai universiti yang bereputasi dengan ketersediaan set datanya mengenai "Statistik dan Rangkaian Sosial Video YouTube". Mengambil maklumat daripada crawler yang menggunakan API YouTube untuk mencari video, fail tersebut mengandungi data mengenai berjuta-juta video dan set data maklumat pengguna. Laman ini menyatakan bahawa muat turun set data adalah untuk tujuan akademik sahaja, tetapi mungkin untuk mencari sumber kewartawanan dan rujukan mengenai projek ini melalui laman web ini. 314. ACLED ACLED, atau Projek Data Lokasi dan Peristiwa Konflik Bersenjata, menawarkan data awam mengenai protes dan keganasan politik di negara membangun. Maklumat yang diberikan di sini merangkumi angka kematian, maklumat mengenai tarikh dan tempat keganasan atau protes, nama kumpulan berkaitan, dan data mengenai rusuhan dan pertempuran ganas yang telah berlaku. ACLED menyediakan akses kepada laporan, penerbitan dan visual tetap serta data yang tersedia untuk dimuat turun di laman web ini. 315. Institut Maklumat Perundangan Kanada Institut Maklumat Perundangan Kanada, atau CanLII seperti yang dipanggil dalam bahasa biasa, merupakan laman web yang menyediakan akses percuma kepada undang-undang dan peraturannya, undang-undang kes daripada mahkamah pelbagai bidang kuasa termasuk Mahkamah Agung Kanada, mahkamah wilayah dan rayuan, dan Queen's Bench, berserta keputusan daripada pelbagai tribunal pentadbiran dan badan yang diwujudkan secara berkanun. Dengan 301 pangkalan data undang-undang kes dan lebih 140,000 keputusan mahkamah tersedia untuk tontonan, wartawan dan penerbit digital yang membuat liputan topik undang-undang akan mendapat manfaat daripada menanda buku laman web ini. 316. Pusat Keamanan Sistemik Pusat Keamanan Sistemik, atau CSP, merupakan sebuah organisasi yang telah mendedikasikan dirinya untuk menganalisis sistem global bagi tujuan menangani isu keganasan politik. Di laman web ini, wartawan yang menjalankan penyelidikan dalam bidang ini akan mempunyai akses kepada analisis mengenai konflik di Afrika, trend konflik di peringkat global antara lain berserta ringkasan mengenai tiga penerbitan utama organisasi seperti Perang Dunia Ketiga dan Laporan Global dan Perpustakaan Maya CSP. 317. Projek Korelasi Perang Fokus projek Correlates of War, atau COW, adalah untuk membantu dalam pengumpulan dan pengedaran data kuantitatif seperti dalam bidang hubungan antarabangsa. Selaras dengan komitmennya untuk menerapkan prinsip saintifik pada data hubungan antarabangsa, COW menjadikan set datanya boleh diakses secara bebas oleh orang ramai. Pangkalan data ini mengandungi nombor maklumat yang boleh digunakan oleh wartawan dan penyelidik seperti konflik ketenteraan antara negara, ahli sistem negara, keupayaan material negara dan pakatan formal. 318. Tinjauan Sosial Eropah Tinjauan Sosial Eropah, atau ESS, ialah satu tinjauan yang dijalankan di seluruh Eropah dengan matlamat untuk mengukur pelbagai corak tingkah laku, sikap dan kepercayaan populasi yang berbeza di pelbagai negara. Memandangkan wartawan sering berminat untuk mendapatkan pendapat orang ramai, Siri ESS Topline yang merangkumi subjek yang merangkumi kesejahteraan peribadi dan sosial orang Eropah, sikap terhadap kebajikan, dan juga kehadiran ageisme di UK, boleh memperkukuhkan cerita dalam pelbagai cara. 319. Dana untuk Keamanan Dana Keamanan merupakan sebuah organisasi yang menumpukan pada pencegahan konflik dan menumpukan pada keselamatan melalui pembangunan alat yang boleh digunakan untuk mengurangkan konflik. Sepanjang kerjaya FFP, ia telah bekerjasama dengan wartawan, NGO, organisasi tempatan dan rakan sejawat antarabangsa mereka, serta kerajaan. Sama ada mencari trend, analisis perbandingan dan data global, wartawan dan penerbit boleh mencari bahan yang mereka inginkan melalui alat penerokaan data dalam pelayar laman web ini. 320. Tinjauan Sosial Umum Kerja Tinjauan Sosial Umum (GSS) memberi tumpuan kepada pengumpulan maklumat tentang pelbagai aspek masyarakat Amerika moden sebagai cara untuk mengikuti trend dan corak sikap dan tingkah laku dalam populasi. Dengan amalan pengesanan trend ini sejak tahun 1972, data sejarah sahaja merupakan lombong emas bagi wartawan yang ingin meneroka trend. Dengan menggunakan GSS Data Explorer, penyelidik dan wartawan dapat memuat turun, memeriksa dan juga menilai data. 321. Gesis GESIS ialah sebuah institut infrastruktur Jerman yang didedikasikan untuk sains sosial. Ia menawarkan pelbagai sains sosial, berserta kerja penyelidikan dan perkhidmatan yang terdiri daripada metodologi tinjauan kepada sains komputer gunaan, pengumpulan data, perancangan kajian dan analisis data antara lain yang dilakukan oleh GESIS. Wartawan yang berminat dengan subjek seperti pendekatan GESIS terhadap metodologi, penggunaan pendatang yang terlalu berkelayakan dan banyak lagi boleh mendapatkan banyak maklumat dalam bahagian penerbitan. 322. Masa Depan Keagamaan Global Daripada topik seperti pengguguran hinggalah pendidikan seks, agama begitu berleluasa, sehinggakan di negara-negara yang sebahagian besarnya sekular, pendirian seseorang terhadap subjek sosial yang sukar boleh dipengaruhi oleh kepercayaan agama. Dalam Global Religious Futures, Pew Research Center mengkaji trend dalam sikap dan kepercayaan orang ramai yang berkaitan dengan agama global. Wartawan yang ingin mengkaji butiran seperti pengaruh Evangelikalisme dalam politik atau sikap terhadap hukuman rejam boleh menggunakan Data Explorer untuk mencari jawapan dalam nombor. 323. Indeks Untuk Pengurusan Risiko Indeks Pengurusan Risiko, juga dikenali sebagai INFORM, ialah tempat yang boleh dikunjungi oleh para penyelidik dan wartawan untuk penilaian risiko dalam situasi di mana terdapat risiko krisis kemanusiaan atau bencana. Organisasi ini menawarkan pautan kepada data mengenai topik seperti kadar kematian kanak-kanak, indeks ketidaksamaan jantina dan kekerapan kemarau antara nombor lain. Anda juga boleh melihat dan memuat turun data INFORM atau mengaksesnya melalui peta interaktif laman web ini. 324. INED INED, atau Institut Pengajian Demografi Perancis, merupakan salah satu sumber data dan statistik paling prolifik yang boleh ditemui oleh seorang wartawan di Internet. Dengan lebih 70 penerbitan dikaji dan diterbitkan setiap tahun untuk disesuaikan dengan populasi dunia dalam format graf serta statistik yang mengukur soalan seperti perbezaan kesuburan antara jantina untuk disesuaikan dengan berita dan kaedah sumber. Penyelidik yang mencari penemuan yang tepat daripada sumber yang bereputasi akan menemuinya dengan INED. 325. Arkib Rangkaian Antarabangsa Arkib Rangkaian Antarabangsa Princeton menawarkan gabungan penerbitan yang unik, dengan penyelidikan seperti Laporan Pembangunan Manusia 1999 dan Rangkaian Global: Jurnal Hal Ehwal Transnasional tersedia untuk dibaca di laman web ini. Di laman web ini, wartawan akan dapat meneliti data sejarah awam dan terkini arkib yang komprehensif. Subjek yang diliputi di sini termasuk penjagaan kesihatan, senjata, buku, muzik, migrasi, wilayah, Internet, politik dan pengangkutan hanyalah contoh bahan yang boleh diteliti oleh penyelidik di sini. 326. Program Tinjauan Sosial Antarabangsa Diasaskan sejak awal sebagai cara kerjasama antara rakyat dari pelbagai negara, Program Tinjauan Sosial Antarabangsa (ISSP) telah menjalankan tinjauan setiap tahun mengenai pelbagai subjek yang penting dalam bidang sains sosial. Topik selama ini merangkumi ketidaksamaan sosial, identiti nasional, kewarganegaraan, rangkaian sosial dan orientasi kerja antara lain. Penemuan ISSP boleh dicari mengikut tahun atau mengikut topik dan boleh dimuat turun dengan sewajarnya di laman web. 327. Persatuan Pengajian Antarabangsa Wartawan atau penyelidik lain yang mencari perbincangan intelektual dan bermaklumat mengenai isu-isu yang berkaitan dengan subjek transnasional, antarabangsa dan global, Persatuan Pengajian Antarabangsa (ISA) menghimpunkan kepakaran penyelidik, ahli akademik dan pakar dasar antara lain. Ensiklopedia Pengajian Antarabangsa ISA menampilkan esei yang dikaji semula oleh rakan sebaya yang penuh dengan perbincangan mendalam mengenai topik berkaitan penyelidikan dalam bidang ini serta esei yang memberikan maklumat yang diceritakan dari perspektif yang lebih bersejarah. 328. Data Merentas Negara di Web Halaman Profesor James W. McGuire dari Universiti Wesleyan yang sangat berguna, yang sesuai bertajuk Data Merentas Negara di Web, merupakan halaman sumber yang penuh dengan pautan ke data pembangunan ekonomi dan global yang berkaitan. Antara set data yang boleh ditemui oleh wartawan di sini, terdapat data tentang perancangan keluarga, pencapaian pendidikan, kekurangan zat makanan, air dan sanitasi, orientasi pasaran bebas dan maklumat khusus untuk Amerika Latin dan Caribbean, antara lainnya. Sumber data yang disenaraikan di sini adalah sempurna. 329. Pusat Data Penyelidikan Norway Pusat Data Penyelidikan Norway merupakan sebuah institusi yang menyokong dan membantu penyelidik dalam pelbagai bidang menjalankan penyelidikan empirikal seperti privasi, pengumpulan dan analisis data, penilaian metodologi dan etika dalam penyelidikan. Di sini, penyelidik akan menemui perisian dan alatan yang dibangunkan dan disyorkan oleh pusat untuk disertakan dengan koleksi data serantau, individu dan institusi yang luas yang boleh diakses secara percuma. Penemuan pusat dalam Laporan Tahunan Penyelidikan dan Privasi juga sentiasa menarik untuk dibaca. 330. IPUMS IPUMS tidak semestinya sumber data dalam erti kata yang dijangkakan oleh kebanyakan orang setelah mendengar istilah itu, tetapi ia tetap merupakan sumber yang berguna untuk wartawan kerana peranannya sebagai pengagregat, pengarkib dan penganjur data yang disediakan oleh entiti lain. Contohnya, IPUMS USA bertindak sebagai sejenis repositori data untuk mikrodata banci AS, dengan data bermula seawal tahun 1790 dan bertarikh sehingga kini. 331. ND-GAIN Indeks Negara ND-GAIN, satu inisiatif yang dianjurkan oleh Inisiatif Adaptasi Global Universiti Notre Dame, mengukur daya tahan sesebuah negara terhadap perubahan iklim dan kuasa globalisasi yang lain. Indeks ini merangkumi skor kerentanan dalam bidang seperti makanan, kesihatan, infrastruktur dan ekosistem serta skor kesediaan untuk sehingga 500,000 titik data. Mengandungi dua dekad data dari tahun 1995 hingga 2014 dalam bentuk fail CSV, maklumat ini tersedia untuk dimuat turun. 332. Polis UK Di laman web ini, wartawan dan penerbit boleh mengakses data terbuka mengenai keadaan kepolisan dan jenayah di United Kingdom. Data ini mengandungi statistik berguna tentang pasukan kejiranan, pasukan polis individu, nombor hentian dan penggeledahan, serta statistik tentang jenayah dan hasil. Dengan menggunakan laman web ini, wartawan boleh menjalankan perbandingan antara pasukan polis dan mengenal pasti trend dalam keadilan jenayah. Mendapatkan maklumat semudah memilih julat tarikh, memilih pasukan polis dan kemudian menunggu fail tersebut. 333. Halaman Data Antarabangsa Umum Paul Hensel Halaman Data Antarabangsa Umum Paul Hensel merupakan satu siri pautan yang dikumpulkan di bawah tajuk Negeri dan Sistem Antarabangsa, Data Geografi Antarabangsa, Keupayaan Negeri, Koleksi Data Sains Sosial dan Perikatan, Perjanjian dan Organisasi. Setiap sumber yang disenaraikan di halaman web ini mengandungi data canggih yang secara automatik akan memberikan kredibiliti kepada kerja wartawan. Sumber-sumber ini boleh merangkumi apa sahaja daripada perisian hingga set data dan arkib, tetapi setiap pautan yang disertakan di sini adalah berguna. 334. TRAC Dalam dunia pasca-911, keganasan dan kesan buruknya terhadap penduduk tempatan telah mendapat banyak perhatian dalam perhatian media. TRAC, di trackingterrorism.org, menyediakan penyelidik dengan analisis dan maklumat yang meluas mengenai subjek ini. Laman ini mengandungi maklumat tentang beberapa ribu kumpulan pengganas yang berbeza. Harga pengguna tunggal sebanyak $500 mungkin sedikit mahal pada mulanya tetapi sangat berbaloi dengan harga yang dibayar bagi mereka yang menulis tentang keganasan dan perang menentang keganasan. 335. Jabatan Keadilan Jenayah Texas Berminat dengan cara kerja dalaman sistem Keadilan Jenayah Texas? Ingin tahu siapa yang sedang menunggu hukuman mati? Jabatan Keadilan Jenayah Negeri Texas mempunyai banyak maklumat daripada kenyataan terakhir banduan sebelum hukuman mati, statistik hukuman mati mengikut jantina dan bangsa, serta statistik dan lembaran fakta hukuman mati selanjutnya. Jabatan Keadilan Jenayah Texas merupakan sumber yang boleh dipercayai untuk wartawan. 336. Sistem Organisasi Masyarakat Sivil Bersepadu Sistem Organisasi Masyarakat Sivil Bersepadu, atau iCSO, direka bentuk untuk memudahkan organisasi masyarakat sivil berkomunikasi dengan Jabatan Hal Ehwal Ekonomi dan Sosial. Selain keberkesanan rangka kerja yang mantap, halaman web ini merangkumi set data dan kategori untuk maklumat lanjut. Data boleh disusun mengikut sektor, jenis organisasi, wilayah yang terlibat dan status ECOSOC organisasi. Ini adalah sumber data yang pasti boleh digunakan oleh wartawan untuk mencari sumber. 337. Universiti Seluruh Dunia Universities Worldwide ialah pangkalan data universiti di seluruh dunia yang boleh dicari untuk maklumat lanjut. Carian boleh dibuat melalui penyenaraian dunia atau ditapis secara eksklusif ke universiti Amerika Syarikat, dan pengguna juga boleh menambah pautan mereka sendiri dalam proses tersebut. Penerbit data dengan kontinjen pelajar yang besar, atau wartawan yang ingin mengesahkan fakta, semuanya boleh mendapat manfaat daripada dapat mengakses pangkalan data seperti ini atas permintaan. 338. Program Data Konflik Uppsala Ini adalah laman web untuk Program Data Konflik Uppsala, yang merupakan salah satu penyedia maklumat paling terkenal mengenai keganasan terancang. Sepanjang 40 tahun terakhir program ini, ia juga telah mengukuhkan kedudukannya melalui kerjanya dalam mengumpul data daripada perang saudara. Wartawan boleh menggunakan sumber data ini untuk mencari maklumat tentang konflik dan pelaku tertentu dalam konflik tersebut dan juga boleh mengakses data ini untuk tujuan memuat turunnya. 339. Pop Dunia Projek WorldPop, hasil akhir penggabungan projek AsiaPop, AfriPop dan AmeriPop, didedikasikan untuk pengarkiban set data demografi spatial yang seterusnya mempunyai aplikasi sebagai cara untuk menyediakan sokongan kepada usaha bantuan bencana. Penerbit kandungan dan wartawan yang terlibat dengan tujuan keadilan sosial atau yang sedang menyelidik peluang bantuan bencana yang cekap pasti berminat dengan projek ini. Penyelidik boleh memuat turun data atau menyemak kajian kes dalam talian. 340. Draf Ekspres DraftExpress mungkin paling terkenal di Internet kerana penyelidikannya, laporan peninjauan pra-draf, pilihan draf olok-olok dan penyelenggaraan ketinggian dan ukuran pemain yang teliti untuk disertakan dengan data sejarahnya. Bakal pemain yang disebut di laman web ini berasal dari liga NCAA, sekolah menengah dan juga antarabangsa. Wartawan sukan atau penyedia kandungan yang berhasrat untuk menawarkan ulasan berkaitan bola keranjang boleh merujuk kepada statistik DraftExpress sambil membincangkan pemain dan acara semasa ia berlaku dalam sukan tersebut. 341. Betfair Betfair mungkin paling dikenali sebagai laman web untuk pertaruhan sukan. Walau bagaimanapun, yang menarik minat penyedia kandungan dan penerbit digital khususnya ialah ketersediaan maklumat sejarah terperinci mengenai data harga dan sejarah laman web tersebut. Data tersebut boleh diakses dan dimuat turun dengan atau tanpa cap masa terperinci di samping menawarkan data yang luas mengenai perlumbaan kuda dan tawaran pasaran lain laman web tersebut dari tahun Jun 2004 hingga Oktober 2017. 342. LEMBARAN KRITIK Cricsheet menawarkan perkhidmatan yang serupa dengan beberapa hab data sukan lain, tetapi ia merupakan laman web yang pakar secara eksklusif dalam menyediakan data kriket. Laman web ini menawarkan statistik dan data bola demi bola daripada beberapa liga termasuk Liga Perdana India, perlawanan antarabangsa satu hari, serta nombor untuk pasukan lelaki dan wanita, antara lain beberapa kategori yang lebih besar. Penerbit kandungan yang mencari data kriket sejarah boleh memuat turun data dalam format CSV atau XML. 343. Data Siri Masa Merentas Negara Dengan data konflik politik, ekonomi, perundangan dan domestik yang meliputi data selama lebih 200 tahun di lebih 200 buah negara di seluruh dunia, Arkib Data Siri Masa Rentas Negara merupakan salah satu set data paling komprehensif di Internet. Data disimpan, dengan paling mudah, dalam helaian Google Drive yang dibuka secara automatik setelah mengklik pada kategori fail. Sebagai pertukaran untuk petikan, maklumat ini boleh dilihat sebahagian atau keseluruhannya bergantung pada keperluan penyelidik. 344. Ford GoBike Ford GoBike ialah nama program perkongsian basikal yang digunakan di Bay Area. Walaupun ramai orang tidak syak lagi menggunakan program ini untuk kekal cergas dan mengelakkan penggunaan bahan api fosil, sistem perkongsian basikal telah menjejaki data perjalanan. Sudah tentu, maklumat ini tidak termasuk apa-apa yang boleh mengenal pasti penunggang tetapi butiran seperti nombor basikal, masa mula, masa tamat, jenis penunggang dan stesen ketibaan dan berlepas disertakan dalam data. Itu berbaloi untuk diterokai. 345. Trafik Marin Marine Traffic ialah sebuah syarikat yang mengesan dan menjejaki pergerakan kapal dan perjalanan laut menggunakan data raya. Jenis maklumat yang diliputi melalui perkhidmatan API AIS Marine Traffic termasuk kapal, maklumat tentang pelayaran dan data tentang kapal yang dimaksudkan seperti jangkaan ketibaan, malah insiden, foto, butiran kapal dan ramalan pelayaran. Walau bagaimanapun, terdapat pelan harga di laman web ini, jadi tidak jelas berapa banyak kajian yang boleh dilakukan secara percuma. 346. Bixi Program perkongsian basikal Bixi mungkin merupakan antara program perkongsian basikal yang paling terkenal di beberapa bandar terbesar di Amerika Utara. Menariknya, jenama ini juga mengeluarkan data terbuka yang memberikan maklumat tentang perkara seperti sejarah perjalanan dan status stesen serta perbandingan yang boleh dibuat antara ahli dan pengguna sekali-sekala. Wartawan tempatan yang sedang mengkaji bagaimana individu menggunakan dan menyesuaikan program perkongsian basikal ke dalam kehidupan mereka mempunyai banyak sebab untuk menggunakan data ini. 347. Pangkalan Data Kemalangan Daripada Amelia Earhart hinggalah Penerbangan AirAsia 8501 Indonesia, kemalangan penerbangan dan kapal terbang merupakan topik yang menarik perhatian orang ramai. Pangkalan Data Kemalangan mengarkibkan dan menyimpan data tentang kemalangan penerbangan yang telah berlaku antara tahun 1920 dan 2017. Kemalangan yang dikira dalam pangkalan data ini termasuk kemalangan kapal udara awam dan tentera, kemalangan yang melibatkan kematian selebriti atau seseorang yang terkenal, kemalangan helikopter dengan 10 atau lebih kematian, penerbangan udara penumpang berjadual dan tidak berjadual yang berakhir dengan kematian. 348. Pengangkutan untuk London Transport for London merupakan badan kerajaan yang bertanggungjawab menyelia pengangkutan awam di kawasan Greater London. Terdapat peta tiub dan kereta api yang tersedia di laman web berserta panduan perancangan perjalanan. Selain semua perkhidmatan praktikal ini, laman web ini juga menyimpan banyak data terbuka termasuk berbasikal, kualiti udara, tab mandi, dan juga tiram. Sesiapa yang berminat untuk melihat bagaimana penduduk Greater London menggunakan pengangkutan awam boleh mendapat manfaat daripada akses kepada data ini. 349. CMAP CMAP bertanggungjawab untuk melakukan perancangan dan organisasi wilayah di daerah DuPage, Lake, McHenry, Kendall, Kane, Cook dan Will di Illinois. Seperti yang dapat dilihat dari laman web, tanggungjawab CMAP meliputi menangani isu-isu seperti pembangunan komuniti, cukai dan penunjuk ekonomi, malah jalan raya dan transit. Inilah sebabnya mengapa data terbuka mengenai bidang seperti penunjuk wilayah dan perjalanan berguna kepada wartawan yang cuba memahami gambaran besar di mana masa depan wilayah itu berkaitan. 350. Rangka Kerja Analisis Pengangkutan Dihasilkan hasil kerjasama antara Biro Statistik Pengangkutan dan Pentadbiran Lebuhraya Persekutuan, Rangka Kerja Analisis Pengangkutan mengumpul data yang kemudiannya digunakan untuk menilai kesihatan dan prestasi umum sistem pengangkutan. Perisian ini mengumpul maklumat tentang butiran seperti jenis komoditi dan tan berbanding stesen berlepas dan ketibaan dan data tersebut seterusnya telah disediakan untuk orang ramai mengakses dan memuat turun sama ada secara penuh atau dalam bentuk ringkasan. 351. Sains Mozilla Mozilla Science ialah perisian sumber terbuka, amalan terbuka, dan kolaboratif yang sedia ada untuk membantu dalam pembangunan dan pengedaran pelbagai sumber data dan dapatan penyelidikan. Selain kepentingan ketelusan, keputusan untuk membuka program dan menggunakan sumber awam untuk proses penambahbaikan memudahkan penambahbaikan program yang sedia ada. Dengan projek yang tersedia dalam pelbagai bidang termasuk sains hayat dan perubatan antara lain, terdapat penyelesaian perisian di sini yang mungkin mewakili kemajuan yang patut diberi perhatian dalam bidang ini. 352. Set Data Hebat Daya tarikan Set Data Menarik mudah dilihat daripada nama laman web ini. Di halaman ini, set data tergolong dalam enam kategori umum dalam kerajaan, hiburan, sains, penyerahan pengguna, pelbagai dan pembelajaran mesin. Wartawan yang ingin meneroka data dan melombong cerita akan mendapat manfaat sepenuhnya daripada menyemak apa yang ditawarkan oleh laman web ini. Terdapat pilihan untuk meneroka set data dan, jika boleh, untuk menyumbang set data juga. 353. Pemantau Data Terbuka  OpenDataMonitor ialah platform yang mengambil set data awam dan mempersembahkannya dengan cara yang lebih intuitif dan mudah diikuti oleh individu. Penyelidik boleh melayari platform tersebut untuk melihat ringkasan tentang keupayaan sumber data terbuka, dan mereka akan dapat melihat data sedia ada yang dibentangkan kepada mereka dengan cara yang lebih menarik secara visual. Laman ini menerangkan metodologi dan penanda arasnya, dan penerbit sepatutnya tidak menghadapi masalah untuk mencari data yang berbaloi untuk diterbitkan. 354. CrunchBase  CrunchBase mungkin paling dikenali kerana penekanannya terhadap statistik dan komitmennya untuk memberikan pembacanya akses kepada data terbaik yang tersedia. Individu yang berfikiran perniagaan datang ke laman web ini setiap hari untuk mengetahui tentang trend terkini dalam pelaburan dan industri. Di sini, wartawan dan penerbit akan menemui berita dan perbincangan baharu tentang trend perniagaan terkini. Sementara itu, sebagai sebahagian daripada pilihan berbayarnya, laman web ini juga menempatkan set data yang luas yang boleh dianalisis menggunakan alat perisian Crunchbase. 355. Indeks Index ialah platform dengan proposisi jualan yang unik kerana ia menawarkan sesuatu kepada semua orang antara syarikat baharu, pelabur, penganalisis dan syarikat. Laman ini juga menyimpan maklumat tentang lebih 100,000 syarikat dalam sektor teknologi dan pada masa yang sama menawarkan pengguna keupayaan untuk menyusun, membina dan mengeksport hamparan. Penerbit dan wartawan yang melihat tajuk utama untuk sudut cerita yang berpotensi boleh mendahului berita perniagaan melalui laman ini. Index mungkin luar biasa, tetapi tidak dinafikan ia merupakan sumber yang berguna. 356. SEMRUSH SEMrush berbangga kerana menjadi salah satu alat risikan carian paling mantap yang tersedia untuk pemasar dalam talian. Antara akademi dan webinar, para penyelidik mempunyai setiap peluang untuk mempelajari asas-asasnya. Walau bagaimanapun, bahagian blog dan berita mengandungi maklumat yang mencukupi agar penerbit dan wartawan boleh mengikuti perkembangan berita terkini dalam pengiklanan dalam talian dan SEO dengan mudah. ​​Perkhidmatan SEMrush memang ada harganya, tetapi terdapat banyak maklumat berkualiti yang mereka sediakan secara percuma. 357. Ahrefs Ahrefs mungkin paling tepat dirumuskan sebagai satu set alat pemasaran yang berpotensi berguna kepada sesiapa sahaja yang menerbitkan kandungan dalam talian. Laman ini menawarkan gabungan perkhidmatan seperti penyelidikan kandungan, pemantauan web, penyelidikan kata kunci dan penyelidikan pautan balik untuk membantu pengguna merekayasa balik kejayaan pesaing. Mungkin paling berguna kepada penerbit dalam talian dalam skema besar, blog Ahrefs sahaja mewakili nilai yang sangat baik bagi mereka yang menyukai pemasaran mereka dilakukan dengan kecenderungan berasaskan data. 358. Senarai Malaikat AngelList, dengan nama yang dipilih dengan bijak, pada asasnya terdiri daripada dua bahagian Craigslist dan satu bahagian LinkedIn dengan penekanannya untuk menyatukan pelabur, pencari kerja dan syarikat baharu di satu tempat. Bersama-sama dengan konsep laman web yang menarik ini, terdapat banyak peluang untuk wartawan yang berdaya usaha untuk menemui syarikat baharu yang paling popular dan trend pelaburan terkini sebelum ia menjadi arus perdana. Dengan antara muka yang mudah dan orientasi perniagaan yang kukuh, laman web ini berguna untuk golongan profesional dalam pelbagai cara. 359. Diperoleh Dalam hampir semua sektor, pengambilalihan perniagaan boleh mengubah keseluruhan industri hampir dalam sekelip mata. Acquired ialah laman web yang bertanggungjawab untuk memastikan orang ramai dimaklumkan apabila pengambilalihan telah dibuat dalam sektor teknologi. Penuh dengan statistik yang boleh dilihat di laman web ini berserta keupayaan untuk menapis carian, wartawan yang menulis tentang teknologi akan mendapat manfaat sepenuhnya daripada menjadikan Acquired sebagai sebahagian daripada pelayaran web harian mereka. 360. Mattermark Mattermark ialah perkhidmatan berbayar yang memudahkan urusan pembuat keputusan syarikat dengan menghasilkan senarai pelanggan berkualiti yang mengambil kira syarikat dan pekerja utama mereka. Mattermark melakukan segala yang terbaik dengan menyediakan profil syarikat yang komprehensif, fleksibiliti dengan APInya, malah keupayaan eksport untuk tujuan membuat kemas kini. Perniagaan yang ingin menyasarkan jangkauan mereka dengan lebih baik sambil menjejaki hasil kempen mereka akan mendapat banyak manfaat daripada mendaftar untuk ini. 361. Syarikat permulaan Fintech FintechStartupsCo berfungsi sebagai sejenis agregator yang menjejaki berapa banyak syarikat berbeza yang dapat mengumpul dana dalam IPO mereka. Dengan reka bentuk minimalis yang bertukar antara tab "syarikat baharu" dan "berita", ini merupakan cara yang cepat dan mudah untuk wartawan mengikuti berita terkini tentang pengumpulan dana. Sementara itu, penerbit yang mencari kandungan pantas dan cerita ringkas juga berpeluang mendapat manfaat daripada melihat semula apa yang ditawarkan oleh laman web ini. 362. Datafox Sekiranya namanya tidak memberikan segalanya, DataFox ialah sebuah syarikat yang berusaha untuk memberikan maklumat yang diperlukan oleh pelanggan perniagaannya bagi memaksimumkan CRM mereka dan secara amnya membuat keputusan berasaskan data. Menawarkan perkhidmatan yang merangkumi risikan persidangan dan syarikat, API dan isyarat syarikat, syarikat ini merupakan pusat sehenti untuk perniagaan yang sedang memperbaharui kerja jualan dan jangkauan mereka. Penerbit digital dan penyedia kandungan mungkin ingin mencubanya juga. 363. Pembukaan OpenSpending ialah platform percuma yang boleh diakses hampir di mana-mana sahaja di dunia, yang membolehkan pengguna mencari dan memeriksa data kewangan dalam domain awam. Bagi ahli masyarakat yang tidak menggodam, ini merupakan alat yang ampuh untuk menggambarkan dan menganalisis. Wartawan, khususnya, boleh menggunakan OpenSpending untuk mencari pandangan baharu yang menarik dan mengejar sudut cerita seperti yang dicadangkan oleh syarikat secara langsung di laman webnya. Sebagai bonus tambahan, wartawan adalah antara profesion yang diminta secara khusus di forum ini. 364. API Sukan ESPN Tidak berpuas hati hanya dengan menjadi saluran sukan paling popular di saluran kabel, ESPN mengembangkan pengaruhnya ke dalam pengekodan dan API. Di Pusat Pembangun, laman web ini menawarkan penerbit pilihan beberapa API yang merangkumi nota penyelidikan, kedudukan kuasa, pilihan draf, kalendar dan tajuk utama. Malah terdapat API yang memuatkan profil atlet, biografi dan statistik dalam semua sukan utama. Wartawan yang sedang bersedia untuk menulis cerita dengan kandungan sukan hanya boleh mendapat manfaat daripada melayari semua ini. 365. Rujukan Sukan Bagi pencinta sukan yang gemar mengira nombor dan menyukai statistik dan sumber lanjutan mereka di satu tempat, Sports Reference merupakan salah satu laman web terbaik di web. Dengan data sejarah yang merangkumi statistik pasukan dan pemain mengenai serangan dan pertahanan, penyelidik sukan boleh memilih seberapa luas atau sempit yang mereka mahukan dengan laman web ini. Di samping itu, terdapat nombor untuk hampir setiap sukan utama daripada bola keranjang hingga besbol dan data berasingan untuk sukan kolej yang berbeza juga. 366. Set Data Juta Lagu "Koleksi Sejuta Lagu" yang dinamakan dengan tepat ini merangkumi 28 set data metadata dan maklumat penuh mengenai ciri audio tepat satu juta lagu. Sebahagian besarnya hasil kerja LabROSA Universiti Columbia bersama Echo Nest, maklumat ini boleh diakses dan dihoskan pada sistem AWS Amazon. Pengguna boleh menjalankan carian untuk maklumat tersebut melalui Infochimps yang menjadikannya lebih mudah diakses oleh wartawan yang mencari trivia yang tidak jelas serta penerbit kandungan.