Maraming iba't ibang uri ng mga site na nagbibigay ng maraming libre, freemium, at bayad na data na makakatulong sa mga audience developer at mga mamamahayag sa kanilang mga pagsisikap sa pag-uulat at pagkukuwento. Nais pasalamatan ng pangkat sa State of Digital Publishing ang mga ito, na hango sa mga manu-manong paghahanap at pagkilala mula sa aming mga kasalukuyang audience.
1. Kaggle Ang Kaggle ay isang site na nagbibigay-daan sa mga user na matuklasan ang machine learning habang nagsusulat at nagbabahagi ng cloud-based code. Pangunahing umaasa sa sigasig ng malaking komunidad nito, ang site ay nagho-host ng mga kompetisyon sa dataset para sa mga premyong pera at bilang resulta ay mayroon itong napakaraming data na naipon dito. Naghahanap ka man ng makasaysayang data mula sa New York Stock Exchange, isang pangkalahatang-ideya ng mga trend sa produksyon ng kendi sa US, o makabagong code, ang site na ito ay puno ng impormasyon. 2. Wikipedia Imposibleng magtagal sa Internet nang hindi nakakakita ng artikulo sa Wikipedia. Dahil sa mga artikulong mula sa mga kumpletong pinagmulan at mga talambuhay na may kaugnayan sa kasaysayan hanggang sa mga timeline ng malapit at malayong hinaharap, masasabing napatunayan na ng Wikipedia ang katayuan nito bilang isang libreng ensiklopedya na nakabase sa web. Sa pagitan ng entry na nagsisilbing pangkalahatang-ideya ng paksa at ng maraming libro at mga online na sanggunian na ibinibigay ng site, ang Wikipedia ay matalik na kaibigan ng isang manunulat sa maraming aspeto. 3. Karaniwang Paggapang Gaya ng maaaring mahinuha mula sa pangalan ng website, ang Common Crawl ay naghahanap o "nag-crawl" sa web para sa data na iniimbak at binubuo nito sa isang bukas na repositoryo na maaaring ma-access ng mga user. Para sa dalawang halimbawa ng kung ano ang posible sa site na ito, ang mga virtual na patent marker at komprehensibong listahan ng mga website na nag-aalok ng mga RSS feed ay nagbibigay ng isang maliit na halimbawa kung gaano kalakas ang application na ito. Kung may mga paghahambing ng data o site na gusto mong gawin, ito ay isang madaling gamiting tool para sa paglikha ng orihinal na impormasyon. 4. EDRM Ang EDRM, pinaikling pangalan para sa Electronic Discovery Reference Model, ay isang site para sa mga legal na propesyonal na nakatuon sa pagsasakatuparan ng potensyal ng e-discovery at ang mga patakaran at inaasahan na nakapalibot sa kung paano pinamamahalaan ang impormasyon. Bukod pa rito, ang mga miyembro ng EDRM ay nagtutulungan upang bumuo ng mga pamantayan ng pakikipagtulungan, software, at mga kagamitang pang-edukasyon na idinisenyo upang isulong ang mga layunin ng komunidad. Upang makakuha ng impormasyon tungkol sa mga paraan kung paano maaaring at binabago ng teknolohiya ang mga aspeto ng proseso at administratibo ng legal na kasanayan, ito ang site na gusto mong bisitahin. 5. Mahout Ang Mahout ay nakatuon sa isang software na may parehong pangalan na nagtatangkang alamin ang logistik ng pagbuo ng isang kapaligiran na may kakayahang lumikha ng mga high-performing machine learning application na maaaring i-scale at mabilis na malikha. Para sa mga mananaliksik na gustong mag-compile at manipulahin ang kanilang sariling mga dataset o subukan ang mga machine learning application, ang software na ito ay lalong kapaki-pakinabang. Ang site na ito ay magbibigay sa mga indibidwal ng kasanayan sa software na ito. 6Ang Proyekto ng Lemur Ang Lemur Project ay isang database na nakatuon sa pagsuporta sa pananaliksik sa pagkuha ng impormasyon at paghawak ng mga teknolohiya sa wika ng tao. Dahil sa mga web page na may humigit-kumulang 1 bilyon at 10 wika na nakolekta mula Enero 2009 hanggang Pebrero 2009, ang dami ng materyal na naroroon at suporta ay ginagawa itong isang mahusay na mapagkukunan para sa mga mananaliksik. Sa pagitan ng lahat ng ito at ng karagdagang suporta na matatagpuan sa site, sinumang may interes sa teknolohiya at mga wika ng tao ay magkakaroon ng maraming magagamit sa site na ito. 7Proyekto Gutenberg Ang Project Gutenberg ay isang direktoryo na nagtatampok ng mga nobela, papel, at iba pang mga akda na nasa pampublikong domain. Ang koleksyon ng site na may mahigit 54,000 eBook ay mula sa mga kilalang materyales tulad nina Shakespeare, Mark Twain, at Jane Austen hanggang sa mga hindi gaanong kilalang akda ng mas hindi kilalang mga pangalan tulad nina Henri Bergson at Samuel Butler. Kukuha man ng isang klasikong nobela para mabasa ng marami o nagsasaliksik kung paano naranasan ng mga tao ang buhay noong ika-19 na siglo, ang Project Gutenberg ay isang mahusay na mapagkukunan. 8Dataset ng Milyong Kanta Ito ay isang website na naglalaman ng kumpletong dataset na naglalaman ng mga audio feature at metadata ng humigit-kumulang 1 milyong sikat na kanta. Bukod sa pangunahing dataset na may milyong kanta, mayroon ding ilang dataset na naiambag ng komunidad sa mga kaugnay na kategorya tulad ng mga cover song, genre label, at lyrics bukod sa iba pa. Ang mga historyador ng musika, mga hobbyist, o mga mananaliksik na nangangailangan ng impormasyong ito ay madaling makakapag-uri-uri ng data. Maaaring ito na ang pinakamalawak na dataset sa paksang ito sa buong Internet. 9. Amazon Kilala ng lahat ang Amazon bilang isang digital retailer, ngunit alam mo ba na nagho-host din ang Amazon ng mga libreng pampublikong dataset na bukas para ma-access ng sinuman nang hindi kinakailangang mag-imbak o mag-download ng kahit ano sa kanilang sariling mga device? Dahil sa datos na sumasaklaw mula sa panahon, kapaligiran sa kalawakan, at impormasyon sa meteorolohiko hanggang sa imahe na nakatuon sa pagbuo ng mga algorithm na nakakatulong sa computer vision, napakaraming opsyon para sa mga naghahanap ng mas maginhawang paraan upang suriin ang napakaraming datos. 10. Bukas na Pamahalaan ng Canada Para sa pagtataguyod ng higit na transparency, paghikayat sa mas maraming mamamayan na makisali, at paghikayat ng diyalogo, ang Pamahalaan ng Canada ay nag-aalok ng malawak na datos bilang bahagi ng inisyatibo nitong Open Government. Sa site na ito, makakahanap ka ng mga dataset sa mga isyung may kaugnayan sa gobyerno tulad ng mga antas ng kapasidad ng mga tirahan para sa mga walang tirahan sa Canada pati na rin ang mga numero sa rehiyon sa mga antas ng pakikilahok ng mga Anglophone at Francophone sa pampublikong sektor. Dahil sa ganitong uri ng access sa mga dataset, hindi na kailangang umasa sa mga istatistika ng ibang tao para makahanap ng impormasyon. 11. Mga Katalogo ng Datos Ang Data Catalogs, na ngayon ay Data Portals, ay nag-aalok sa mga gumagamit ng isang maginhawang site para sa pag-browse ng mga open data portal mula sa buong mundo. Dahil ang mga portal ay sinusuri at pinangangasiwaan ng iba't ibang antas ng pamahalaan, ilang NGO, at maging ng World Bank, ang datos na magagamit para sa pagsusuri ay napakataas ang kalidad. May opsyon ang mga gumagamit na mag-browse o mag-ambag ng mga data portal. Mula sa pananaw ng pananaliksik, ang iba't ibang paksa at impormasyon ay ginagawang isang partikular na maginhawang lugar ang site na ito upang simulan ang paghahanap ng impormasyon. 12Data.gov.uk Ang Data.gov.uk ay isang site na nagbibigay-daan sa mga indibidwal na maghanap at mag-access ng datos na inilalathala ng iba't ibang pampublikong katawan, departamento ng gobyerno, lokal na awtoridad, at mga ahensya ng gobyerno. Dito makakahanap ang mga mananaliksik ng impormasyon tungkol sa klima ng ekonomiya para sa maliliit na negosyo, kalakalan, importasyon, industriya, at pag-export o kahit na magsaliksik sa mga pagbabayad na higit sa £25,000 na ginawa ng mga departamento ng gobyerno. Dahil tahasang sinasabi ng site na ang datos ay maaaring gamitin para sa pananaliksik, ang impormasyong sakop dito ay maaaring makabuo ng mas maraming ideya habang pinag-aaralan ito ng mga mananaliksik. 13Data.gov Sa site na ito, nagbibigay ang Pamahalaan ng Estados Unidos ng bukas na datos na maaaring ma-access ng publiko sa anyo ng mga dataset. Bukod sa hilaw na datos, nag-aalok din ang site ng ilang mga tool na maaaring gamitin upang gumawa ng mga visualization ng datos pati na rin bumuo ng mga application para sa web at mobile. Huwag magkamali. Napakalawak ng datos na may impormasyon mula sa mga reklamo sa credit card hanggang sa datos ng pederal na programa ng pautang pang-estudyante sa mahigit 197,000 dataset. Nag-aalok ang site na ito ng maraming pagkakataon para sa inobasyon at komprehensibong pagsusuri. 14DataSF Nag-aalok ang DataSF ng daan-daang dataset kaugnay ng Lungsod at County ng San Francisco. Interesado kang makita kung ano ang isinusulong ng mga lokal at rehiyonal na lobbyist? Kailangan mo ba ng mga istatistika sa krimen? I-browse ang tab na Showcase upang makita kung ano ang nagawa ng mga tao gamit ang datos o gamitin ang form upang magbigay ng kontribusyon. Ginawa gamit ang Open Data at nag-aalok ng isang akademya, isang blog, at ilang iba pang mga tool, ang site na ito ay higit na pinapatakbo ng kolaborasyon at komunidad. Ginagawa itong isang asset para sa mga mananaliksik. 15. DataFerrett Ang DataFerrett ay naiiba sa maraming site dahil hindi ito isang imbakan o direktoryo kundi isang tool na nagbibigay-daan sa mga user na i-customize ang data mula sa mga lokal, estado, at pederal na mapagkukunan sa pamamagitan ng pagsusuri at pagkuha ng data. Ang tool na ito ay nagbibigay-daan sa mga user na lumikha ng mga customized at komprehensibong spreadsheet at pagkatapos ay gawing mapa o graph ang parehong impormasyon nang hindi kinakailangang mag-download o mag-enable ng anumang iba pang software. Ang pag-oorganisa ng malalaking input ng data at paggawa nito sa isang bagay na madaling basahin ay hindi kailanman naging ganito kadali. 16. Inforum Sa pamamagitan ng University of Maryland, inilalaan ng Inforum ang datos pang-ekonomiya ng US sa publiko. Maraming ahensya ng gobyerno ng US ang nag-ambag sa site na ito hanggang sa puntong ang site na ito ngayon ay naglalaman ng libu-libong "economic time series", gaya ng tawag dito, at naglalaman ang mga ito ng mga numero sa produksiyong industriyal, mga indeks ng presyo, mga istatistika ng paggawa, at mga tagapagpahiwatig ng negosyo. Ang datos ay malayang makukuha at maaaring ma-access gamit ang personal na laptop o desktop. Ang mga mananaliksik na gustong makita nang mabuti ang hilaw at pang-ekonomiyang datos ay may mapagkukunan sa Inforum. 17. Europea Ayon sa mga numero ng site mismo, ang mga koleksyon ng Europeana ay bumubuo ng mahigit 50 milyong talaan. Gamit ang mga napiling dataset dito, mahahanap ng mga mananaliksik ang impormasyong kanilang hinahanap sa mas maikling panahon. Kasama sa mga dataset dito ang mga kategorya tulad ng mga 3D model, mga mapa ng Unang Digmaang Pandaigdig ng Italya, at maging ang isang koleksyon ng mahigit 20,000 makasaysayang larawan mula sa mga museo ng Lithuania at iba pa. Para sa mga pangkalahatang paghahanap sa kasaysayan o bilang panimulang punto para sa pagtingin sa malalaking talaan ng Europeana, isa itong mahusay na mapagkukunan. 18Ang Tagapangalaga Bukod sa walang tigil nitong pagbabalita ng mga breaking news at kaganapan, mayroon ding buong seksyon ang Guardian na nakatuon sa mga blurb ng datos. Ang mga artikulo rito ay mula sa mga seryosong paksa tulad ng pagiging epektibo ng mga patakaran sa pabahay sa kawalan ng tirahan hanggang sa medyo mas magaan na mga paksa tulad ng kung aling mga bansa ang may pinakamaraming nanalo ng Nobel Prize. Hindi nagkukulang ng impormasyon ang mga mamamahayag at mananaliksik na magagamit sa kanilang sariling mga proyekto mula sa site na ito. Sa tulong ng isang mabilis na paghahanap, posible na makahanap ng datos sa halos anumang bagay. 19Omnibus ng Ekspresyon ng Gene Hino-host ng National Center for Biotechnology Information, ang Gene Expression Omnibus ay isang site na naglalaman ng "pampublikong functional genomics data" na sumusunod sa mga pamantayan ng MIAME (Minimum Information About a Microarray Experiment). Tumatanggap din ang site ng data na naka-array o naka-sequence habang nagbibigay ng mga tool na kinakailangan upang mahanap at ma-download ang impormasyon. Ang mga interesado sa pag-aaral ng mga genome o pagkuha ng impormasyon tungkol sa paksa ay magkakaroon ng lahat ng data na kailangan nila dito at higit pa. 20Ang Unibersidad ng Chicago Matagal nang kinikilala ang mga kontribusyon nito sa inobasyon at pag-unlad sa larangan ng agham panlipunan, ang Center for Spatial Data Science (CSDS) ng University of Chicago ay nagsasaliksik sa susunod na hangganan sa pamamagitan ng pagsabak nito sa spatial analysis at teknolohiya. Ang gawain ng CSDS ay may mga aplikasyon sa halos anumang larangan na kailangang makipaglaban sa espasyo sa pagharap sa mga isyu. Dahil dito, ang mga larangan tulad ng environmental economics, pampublikong kalusugan, at kriminolohiya ay pawang nakinabang mula sa mga aplikasyong ito. Ang dedikasyon ng CSDS sa open source software at pamamahagi ng impormasyon nito ay ginagawang mas madaling ma-access ang data. 21Konect Sa pamamagitan ng paggamit ng datos na nakalap ng Institute of Web Science and Technologies ng University of Koblenz-Landau, ang KONECT (Koblenz Network Collection) ay nag-aalok ng pananaliksik na ginawa sa larangan ng agham ng network at mga kaugnay na paksa nito. Gumagamit ang proyekto ng sarili nitong serye ng mga software network analysis tool upang makalkula ang mga numero at makagawa ng mga iginuhit na plot at algorithm. Pagkatapos ay direktang ini-host ng KONECT ang mga resulta ng analytic work nito sa website. May mahigit 200 dataset na mapagpipilian, ito ay isang mapagkukunang sulit tuklasin. 22MIdata Ang MIdata ay isang site na nagsisilbing imbakan para sa datos na dapat gamitin ng datos ng machine learning. Ang mga dataset na ito ay maaaring mula sa isang koleksyon ng mga ekspresyon ng mukha ng tao hanggang sa mas siyentipikong mga paksa tulad ng paghula kung paano magbubuklod ang mga molekula. Dahil ang mga entry ay nahahati sa mga kategorya na nag-aalok ng access sa hilaw na datos, mga tutorial sa seksyon ng materyal at pamamaraan, pati na rin ang mga gawain at hamon sa pag-aaral, pinapayagan ng site na ito ang mga mananaliksik na suriin ang imbakan para sa mga dataset na interesado. 23NASDAQ Ang NASDAQ ay isang tanyag na stock exchange sa mundo na matagal nang naging mahusay na mapagkukunan para sa mga mamamahayag at mananaliksik na naghahanap ng datos mula sa mundo ng pananalapi at negosyo. Dito makikita mo ang impormasyon tungkol sa mga IPO, makasaysayang datos ng presyo, at ang mga pinakabagong balita sa pananalapi na ginagawang isang pangunahing destinasyon ang site na ito para sa datos sa pananalapi. Nag-aalok din ang NASDAQ Composite ng mga opsyon sa bayad na datos para sa mga nais gumawa ng mas malalim na pagsusuri. Ito ay isang lubos na iginagalang at kilalang mapagkukunan. 24NASA Mula pa noong paglapag sa buwan, alam na ng lahat ang tungkol sa ahensya ng gobyerno na ito at ang mga pagsalakay nito sa kalawakan. Gayunpaman, ang interesante sa mga mamamahayag ay kung paano ang NASA ay isa ring mahalagang mapagkukunan ng datos sa pamamagitan ng Space Science Data Coordinated Archive nito. Dito, makakahanap ang mga mananaliksik ng datos ng misyon sa agham pangkalawakan sa mga kategorya tulad ng astrophysics, mga mapagkukunan ng imahe, at heliophysics bukod sa iba pa. Bukod pa rito, marami ring white paper na makukuha sa site na kasama ng mga bagong datos na isinumite. 25Socrata Ang Socrata ay isang site na kumukuha ng datos ng gobyerno na magagamit at inilalagay ito sa isang format na nagpapadali sa mga tao na suriin, i-click, at hanapin ang impormasyong kanilang hinahanap. Dinisenyo partikular na isinasaalang-alang ang mga pangangailangan ng mga indibidwal na hindi teknikal tulad ng mga eksperto sa pampublikong patakaran, mananaliksik, negosyante, at mga mamamayang may malasakit, ginagamit ng Socrata ang cloud upang mag-compile ng datos mula sa iba't ibang mapagkukunan. Para sa mga mamamahayag na nagsisikap na maunawaan ang bisa ng iba't ibang mga patakaran, ito ay isang kapaki-pakinabang na plataporma. 26Quandl Ang Quandle ay isang site na nag-aalok ng pangunahing datos pang-ekonomiya at pinansyal na naka-format na isinasaalang-alang ang mga pangangailangan ng mga propesyonal sa pamumuhunan. Umaasa sa mahigit 500 mapagkukunan ng impormasyon mula sa mga mapagkakatiwalaang organisasyon tulad ng CLS Group, UN, mga bangko sentral, at Zacks bukod sa iba pa upang pagsamahin ang datos nito, ang mapagkukunan ng datos na ito ay perpekto para sa mga mananaliksik at mamamahayag na gustong makuha ang pangkalahatang larawan sa isang sulyap. Salamat sa Excel add-in ng site, ang direktang pag-access sa datos ay naging mas madali na para sa mga gumagamit. 27. Pamantasang Carnegie Mellon Ang Carnegie Mellon University ay may karapat-dapat na reputasyon bilang isang mahusay na institusyong pang-akademiko. Ang hindi alam ng maraming tao ay ang StatLab ni Carnegie Mellon ay isang kapaki-pakinabang na mapagkukunan para sa mga mamamahayag na naghahanap ng datos. Kasama sa archive ng dataset na ito ang datos sa mga isyu tulad ng mga suweldo ng mga manlalaro sa MLB sa North America noong 1986 pati na rin ang datos na idinisenyo para magamit sa pagsusuri ng katumpakan ng software ng istatistika. Kapalit ng pagkilala, ang mga dataset na ito ay magagamit ng publiko. 28. UCI Ang UC Irvine Machine Learning Repository, na tinutukoy bilang UCI, ay isang site na nag-iimbak ng napakaraming kawili-wiling datos na magagamit ng mga mamamahayag. Tahanan ng 394 na datosset sa ngayon, ang site ay may karagdagang bentahe ng pagkakaroon ng interface na madaling hanapin. Ang ilan sa mga mas sikat na dataset ay kinabibilangan ng impormasyon tungkol sa "Human Activity Recognition Using Smartphones", alak, at bank marketing bukod sa iba pang mga paksa. Kapalit ng paggamit ng lahat ng datos na ito, humihingi lamang ang site ng isang citation. 29. UCR Kung ikaw ay isang mamamahayag na nag-aaral tungkol sa pag-unlad ng machine learning, ang pahina ng UCR Time Series Classification/Clustering ay magiging isang mahusay na babasahin. Ang site ay nagbibigay ng isang kapaki-pakinabang na dokumento ng briefing na magbibigay sa iyo ng lahat ng impormasyong kailangan mong malaman. Kasama ng isang pangkalahatang-ideya ng nilalaman ng impormasyon, nag-aalok din ang site ng kakayahang direktang i-download ang data. Tandaan lamang na gamitin ang format ng pagsipi na hinihingi ng site kung gagamitin mo ang mga dataset na ito. 30. Senso ng Estados Unidos Kailangan mo ba ng mga istatistika sa yaman ng populasyon? Gusto mo bang malaman ang eksaktong pagkakahati-hati ng kasarian ng isang partikular na larangan? Ang senso ng US ay isang site na naglalaman ng lahat ng datos na ito at higit pa na maaaring makita ng publiko. Ayusin ang datos ayon sa taon o rehiyon, at mabilis mong mahahanap ang mga istatistika na hindi alam ng karamihan na isinama pala sa senso ng US sa paraang ginamit. Ang mga numerong ito ay makukuha sa Excel at Microsoft Word bilang mga opsyon na ginagawang mas madaling ma-access ang datos para sa mga mamamahayag. 31. Wolfram Alpha Ang Wolfram Alpha ay isang computational engine na nagbibigay-daan sa mga user na maglagay ng datos na gusto nilang malaman at makatanggap ng kalkulasyon. Gumagawa ang engine ng statistical data at analysis, chemistry, petsa at oras, at maging ang mga salita at lingguwistika, bukod sa iba pang mga bagay. Para sa mga user na nagtatangkang tumuklas ng mga bagong paraan ng paghawak ng datos, ito ay lalong kapaki-pakinabang dahil sa kung paano nito nagagawang maglabas ng mga bagong kalkulasyon sa pamamagitan lamang ng pagpindot ng isang buton. Ang mga mamamahayag, sa partikular, ay maaaring makinabang nang malaki sa paggamit nito bilang karagdagang mapagkukunan. 32. Yelp Lumalabas na ang Yelp ay higit pa sa mga review ng mga restawran at negosyo ng mga gumagamit. Ang user-driven review site na ito ay nagtataglay din ng isang dataset na nagbibigay sa mga mananaliksik ng access sa mga review, data ng gumagamit, at mga negosyo para sa "personal, pang-edukasyon, at akademikong layunin". Kung pagbabatayan ang bilang ng kumpanya, ito ay 4.7 milyong review at 156,000 negosyo sa 12 metropolitan area na kasama sa dataset. Sa mga numerong iyon, ang mga materyales at trend na maaaring matuklasan ng mga mananaliksik sa data na ito ay maaaring maging isang kasiya-siyang sorpresa. 33. Mundo ng Datos Gusto mo bang magkaroon ng listahan ng mga tinanggal na pahina sa Facebook? Ano ang masasabi mo sa pag-uuri ng datos pang-ekonomiya ng US ayon sa county? Ang Data World ay isang site na nagbibigay-daan sa mga tao na magbahagi, mag-host, makipagtulungan, at subaybayan ang datos. Mayroon ding seksyon ang site para sa mga mamamahayag na nagbabalangkas sa mga dahilan kung bakit kapaki-pakinabang ang Data World para sa mga miyembro ng propesyon habang itinuturo rin ang mga kakayahan sa pag-host sa isang pinasimpleng FOIA-predictor pati na rin ang mga pahinang idinisenyo upang makatulong sa pag-oorganisa. Sa pangkalahatan, ito ay isang mahusay na halo ng datos at pag-host ng datos. 34. Ang Aklat ng mga Katotohanan sa Mundo Pinapatakbo at pinapatakbo ng CIA, ang World Factbook ay nagbibigay sa iyo ng impormasyon tungkol sa mga istrukturang panlipunan, kasaysayan, sitwasyong militar, at ekonomiya para sa 267 na bansa kasama ang mga mapa, watawat, at isang hanay ng mga time zone na sumusunod sa mga materyales sa mapa ng mundo. Nag-aalok ang site ng masinsinan at malalim na pagtingin sa paksa sa paraang higit pa sa mga pangunahing kaalaman. Sa madaling salita, ito ay isang mapagkukunan ng datos na dapat nasa arsenal ng bawat mamamahayag. 35. HealthData.gov Pinamamahalaan ng Kagawaran ng Kalusugan at Serbisyong Pantao ng Estados Unidos, ang HealthData.gov ay nag-aalok sa publiko ng access sa "mahalagang datos sa kalusugan" sa pag-asang makuha ang atensyon ng mga negosyante, tagagawa ng patakaran, at mananaliksik. Sa mga larangan ng pagbuo ng produkto at serbisyo, kahit papaano, nasuri ng mga tao ang datos na ito at nakakuha ng mga resulta. Ang mga mamamahayag na gustong maging nauuna sa datos sa kalusugan o sinusuri ang isang pahayag na inilabas ng isang opisyal ng pangangalagang pangkalusugan ay maaaring gumamit ng site na ito upang makahanap ng mga sagot. 36. UNICEF Ito ay isang site na nagbibigay ng agarang kredibilidad sa mga mamamahayag na gumagamit ng impormasyong iniaalok nito. Kabilang sa mga estadistika na sakop ng UNICEF ang mga may kaugnayan sa mga isyu ng kalusugan at karapatang pantao tulad ng edukasyon, kalusugan ng ina, kahirapan ng bata, tubig at sanitasyon, at kapansanan ng bata, bukod sa maraming iba pang kategorya ng estadistika na itinatago. Ito ay kapaki-pakinabang para sa mga mananaliksik dahil ito ay napapanahon at sinusuportahan ng isa sa mga pinakakilalang organisasyon sa planeta. Hindi maaaring magkamali ang mga mamamahayag sa pagbanggit sa pinagmulang datos na ito. 37. Organisasyon ng Kalusugan ng Pandaigdig Ang World Health Organization ay isang internasyonal na organisasyon na nangangalap ng mga estadistika at impormasyon sa kalusugan sa buong mundo. Bukod sa impormasyong direktang matatagpuan sa homepage, nag-aalok din ang site ng datos sa pamamagitan ng Global Health Observatory. Kasama sa datos na ito ang impormasyon tungkol sa mga hakbang na ginagawa ng mga bansa tungo sa pangkalahatang pangangalagang pangkalusugan, pananaliksik at pagpapaunlad ng kalusugan, bukod sa iba pang mga kategorya. Makakahanap ang mga mamamahayag ng maraming impormasyon tungkol sa mga pagsiklab, mga emerhensiyang pangkalusugan, at saklaw ng pangangalagang pangkalusugan mula sa isang pandaigdigang pananaw dito. 38. Pampublikong Datos ng Google Dahil sa pagkakaroon ng Google Public Data, malinaw na maaasahan ng mga mamamahayag ang Google sa iba't ibang paraan. Ang higanteng search engine na ito ay may pampublikong datos na magagamit at maaaring suriin gamit ang mahigit 100 pampublikong dataset. Ang paksa ng datos ay mula sa napakaseryosong datos tungkol sa World Development Indicators at Human Development Indicators hanggang sa kawili-wiling datos tungkol sa mga pinakadelikadong kalsada sa Europa. Ang kailangan lang gawin ng isang mananaliksik ay maghanap at tingnan kung ano ang mayroon ang Google Public Data. 39. Tagapag-alaga ng Gap Nag-aalok ang Gap Minder ng datos sa ilang lokal at pambansang tagapagpahiwatig kasama ang mga link at impormasyon sa lahat ng tagapagbigay ng datos. Gamit ang site na ito, makikita ng mga mananaliksik ang impormasyon tulad ng kung ilang taon na ang mga babae kapag sila ay unang nagpakasal, mga istatistika sa pag-inom ng alak, at mga sanhi ng pagkamatay ng mga bata. Para sa mga mamamahayag na nagsusulat na may pandaigdigang pananaw o gumagawa ng paghahambing na datos, ito ay isang mahusay na mapagkukunan. Isa itong kapaki-pakinabang na mapagkukunan ng datos anuman ang mangyari. 40. Mga Trend ng Google Ang Google Trends ay isang tool na nagbibigay sa mga mananaliksik ng pananaw sa kung ano ang hinahanap ng mga tao ngayon. Maihahambing ng mga mananaliksik ang datos sa mga trend na naganap noon at magagamit din ang tool upang gumawa ng mga pagtatantya bago, halimbawa ang panahon ng kapaskuhan, upang makita kung ano ang mangyayari para sa mga paghahanap sa hinaharap. Nag-aalok ang Google Trends ng mga graph, mainit na paksa at maraming pagkakataon upang matuklasan ang balita bago pa ito opisyal na maging balita. 41. Pananalapi ng Google Nag-aalok ang Google Finance ng mabilis at madaling pagkakataon upang magsagawa ng mas malalim na paghahanap sa isang kumpanyang pinag-iinitan ng mga mamumuhunan. Mga madaling paraan upang salain ang mga teknikal na tagapagpahiwatig at suriin ang mga pinakabagong balita tungkol sa kumpanya sa isang simple at direktang window na nagbibigay-daan sa iyong pag-uri-uriin ang impormasyon nang mas marami. Bukod pa rito, libre ito. Para sa mga mamamahayag na gustong magsaliksik tungkol sa pananalapi ng isang kumpanyang kinakalakal, nag-aalok ang Google Finance ng isang madaling gamitin na interface upang ma-access ang impormasyong ito. Sa kasamaang palad, kamakailan ay itinigil ng Google ang ilan sa mga pangunahing tampok tulad ng portfolio ng pananalapi. Narito ang ilan mga alternatibo sa Google Finance. 42. DBpedia Sinumang nagnanais ng mas madaling paraan ng paghahanap sa Wikipedia ay may dahilan para matuwa sa DBpedia. Pinapagana ng pangako ng komunidad, hangad ng site na ito na gawing posible ang mas sopistikadong paghahanap laban sa nilalaman ng Wikipedia. Dahil ang bersyong Ingles ay may 4.58 milyong entry na may mga klasipikasyon at kaugnay na kategorya, ang site ay nasa tamang landas na sa pag-aalok ng komprehensibong saklaw batay sa impormasyon sa Wikipedia. Hindi maaaring magkamali ang mga mamamahayag sa pinagmumulan ng datos na ito. 43. Pananaliksik sa Pew Para sa marami, ang Pew Research ay nasa mataas na antas pagdating sa mga survey, ulat, at datos ng pananaliksik. Sinasaklaw ng site ang mga paksang mula sa mga opinyong pampulitika hanggang sa mga kalakaran at pag-unlad sa lipunan sa iba't ibang industriya sa lugar ng trabaho. Mayroon ding search function ang Pew Research na ginagawang mas madali kaysa dati ang pag-access ng impormasyon. Ang mga mamamahayag na naghahanap ng mga napapanahong istatistika at natuklasan na nagmumula sa isang mapagkakatiwalaan at kagalang-galang na mapagkukunan ay hindi magkakamali sa paggamit ng Pew Research. 44. Malawak na Institusyon Para sa mga mamamahayag na gustong malaman ang mga pinakabagong balita kaugnay ng kanser, ang mga dataset ng Broad Institute ay maaaring maging perpektong lugar para mahanap ang impormasyon. Kasama rin dito ang impormasyon sa mga karagdagang paksa tulad ng Bioinformatics at Computational Biology pati na rin ang kanser sa utak at pagtuklas ng molecular pattern. Sa madaling salita, ang site na ito ay nagbibigay sa mga mamamahayag ng kalamangan sa paghahanap ng malalimang datos tungkol sa kanser upang makagawa ng mga kuwento mula sa datos na ibinigay ng Broad Institute. 45. UNdata Nag-aalok ang UNdata ng impormasyon tungkol sa iba't ibang bansa sa buong mundo. Kabilang dito ang mga datos tulad ng mga teknikal na tagapagpahiwatig, mga tagapagpahiwatig ng lipunan, at mga tagapagpahiwatig ng ekonomiya para sa bawat bansang kasangkot. Para sa mga mamamahayag na gumagawa ng mga kuwento tungkol sa human interest o mga kuwentong maaaring makinabang mula sa pagpapatunay ng ilang karagdagang istatistika at datos, ang UNdata ang mainam na pagpipilian. Ang katumpakan ng datos pati na rin ang reputasyon ng UN ay ginagawa itong isang mapagkukunan ng datos na maaasahan ng mga mamamahayag habang nagsasaliksik. 46. Google Scholar Isipin mo na lang kung sa halip na mag-scroll sa mga website, posible pang maghanap ng mga artikulo at akademikong materyales na sinuri ng mga kapwa mananaliksik. Dahil sa Google Scholar, posible para sa mga tao na makahanap ng mga artikulo sa journal, white paper, at publikasyon ng mga nangungunang iskolar sa mundo. Gaya ng karaniwang nangyayari sa kumpanyang ito, ang Google Scholar ay napakadaling gamitin, kailangan lang maglagay ng keyword para makapagsimula. Hindi pa naging ganito kadali ang paghahanap ng mga akademikong papel. 47. Reddit Kilala bilang "ang unang pahina ng Internet," ang Reddit ay isa sa mga pinakasikat na website sa Internet. Bukod sa pagiging tumpak na panukat ng mga nangyayari online, ang site ay mayroon ding subreddit, o subforum, na nakatuon sa mga dataset. Ang mga gumagamit ay maaaring humiling ng mga dataset, mag-post ng mga mapagkukunan, at magkaroon ng mga talakayan tungkol sa paggamit ng data sa pamamagitan ng mga format tulad ng JSON. Malaki ang naitutulong ng mga mananaliksik sa pagbabasa ng data source na ito. 48. Datamarket Ginagawang posible ng Qlik DataMarket para sa iyo na mangolekta at humawak ng datos mula sa mga panlabas na mapagkukunan. Pinapayagan ng platform na ito ang mga gumagamit na humiram sa iba't ibang dataset na may opsyon na i-cross-reference ito laban sa datos na mayroon na sila upang pinuhin ang kanilang pakiramdam ng mas malawak na konteksto. Higit pa rito, kahit na ito ay isang bayad na platform depende sa paksa, mayroon ding libreng opsyon sa Qlik Datamarket. Magagawa ito ng mga mamamahayag na nagsasaliksik ng datos hangga't gusto nila. 49. Hubspot Ang Hubspot ay palaging nangunguna sa mga isyu ng marketing para sa negosyo. Mula sa pananaw ng pagsasaliksik, ito ay isang site na magsasabi sa mga mananaliksik ng lahat ng nangyayari sa industriya pati na rin kung ano ang pinag-uusapan ng mga tao sa industriya ng marketing ngayon sa totoong oras. Magagamit ng mga mamamahayag ang site na ito upang matuto nang higit pa tungkol sa mga uso. Kaugnay nito, ang Hubspot ay isang mahusay na mapagkukunan para sa mga mananaliksik. 50. Mga Estadistika ng Kawanihan ng Hustisya Marahil hindi nakakagulat, ang Bureau of Justice ay nagtataglay ng napakaraming estadistika. Sa website ng Bureau, makikita mo ang mga numero tungkol sa mga pag-aresto, pagkamatay ng mga bilanggo, pagbitay sa pamamagitan ng parusang kamatayan, mga estadistika ng pagpapatupad ng batas, at mga senso ng mga kulungan. Ang sistema ng hustisyang kriminal ay isang paksang patuloy na kinagigiliwan ng publiko at ng mga taong sangkot dito. Iyan ang dahilan kung bakit mas kapaki-pakinabang ang mga estadistika ng Bureau of Justice para sa mga mamamahayag na nagsasaliksik tungkol sa sistema ng hustisyang kriminal. 51. Ulat ng Uniform Crime Ang Uniform Crime Report ay isang koleksyon ng mga istatistika sa krimen sa ari-arian at marahas na krimen na nakalap ng FBI. Bagama't ang mga ahensya ng pagpapatupad ng batas mula sa buong US ay nag-uulat ng datos na ito mula pa noong 1930, ang mga natuklasan ay nailathala mula pa noong 1958 ay maaaring maghanap sa . Ang mga mamamahayag na naghahanap upang galugarin ang datos ng krimen ay may opsyon na ma-access at gamitin ang tool ng datos ng UCR upang galugarin ang impormasyong makukuha sa site na ito. 52. Pag-uulat ng Unipormeng Krimen Ang Uniform Crime Reporting ay resulta ng isang programang naisip ng International Association of Chiefs of Police noong 1929. Ang mga bilang na nakalap ng FBI dito ay inilalathala nang apat na beses sa isang taon. Bukod sa impormasyong ibinibigay ng programang UCR, kasama rin sa site ang mga ulat tungkol sa mga istatistika ng hate crime, Law Enforcement Officers Killed and Assaulted (LEOKA), pati na rin ang mga resulta at bilang na ibinigay ng National Incident-Based Reporting System. 53. NACJD Ang NACJD, o ang National Archive of Criminal Justice Data, ay isang site na kumukuha ng impormasyon mula sa mga dataset tulad ng Uniform Crime Reports (UCR) at National Crime Victimization Survey (NCVS) at pagkatapos ay iniimbak at ipinamamahagi ang mga istatistika. Dinisenyo upang ma-curate, maiimbak, at mapanatili para sa ganap na pag-access, ang datos ay may iba't ibang anyo kabilang ang eksperimental, kwalitatibo, at paayon. Sa huli, nag-aalok ito sa mga mamamahayag at iba pang mananaliksik ng isa pang paraan upang mailarawan at ma-access ang mga istatistika ng hustisyang kriminal. 54. Unang Bangko ng Datos Ang First Databank ay isang site na tumatalakay sa datos ng gamot. Nilalayon ng site na isulong ang mas mahusay at mas nakabatay sa datos na paggawa ng desisyon sa larangan ng mga parmasyutiko. Nagbibigay-daan ito sa mga doktor at clinician na magsimulang mag-isip tungkol sa mga gamot na parmasyutiko sa iba't ibang paraan sa pamamagitan ng paggamit ng makabagong paggamit ng teknolohiya ng First Databank. Mula sa isang propesyonal na pananaw, ang site na ito ay lalong kapaki-pakinabang dahil sa kung paano makakatulong ang datos nito sa mga koponan na umangkop sa pagdating ng mga bagong impormasyon. Sa kahit papaano, ito ay isang kapaki-pakinabang na mapagkukunan para sa mga mamamahayag na nagsusulat sa larangan ng parmasyutiko. 55. FDA Ang FDA, na kilala bilang Food and Drug Administration, ay ang ahensya na responsable sa pagprotekta sa kalusugan ng publiko sa pamamagitan ng pangangasiwa at pag-apruba ng mga gamot, produktong pagkain, suplemento, bakuna, at mga kosmetiko bukod sa iba pang mga produktong pangkonsumo. Bilang isang mapagkukunan, ang FDA ay may mga dataset na magagamit ng publiko upang mabasa habang nagbibigay din ng teknikal na datos para sa mga taong komportable sa paggamit ng mga spreadsheet at pagsusuri ng impormasyong nagmumula sa mga dataset. Ito ay tiyak na isang kapaki-pakinabang na mapagkukunan para sa mga mamamahayag. 56. Drugbase Naisip mo na ba kung magkano nga ba ang eksaktong binabayaran ng bansa kasunod ng epidemya ng droga? May mga tsismis ba tungkol sa mga taong gumagamit ng droga nang iba kaysa dati? Nag-aalok ang Drugbase ng database na puno ng mga istatistika tungkol sa mga uso at paggamit ng droga sa Estados Unidos. May mga infographic pati na rin mga publikasyon tungkol sa mga paksang tulad ng comorbidity ng adiksyon at sakit sa pag-iisip o mga katotohanan tungkol sa pagmamaneho nang nakadroga (hindi lasing). Ito ay isang mapagkukunan na nagbibigay ng sapat na impormasyon upang matukoy ang mga uso at makagawa ng mga paghahambing laban sa mga nakaraang datos. 57. UNODC Ang UNODC, o ang United Nations Office on Drugs and Crime, ay may website na nakatuon sa pagsusulong ng layunin nitong tulungan ang mga estadong miyembro na magpatibay ng mas matibay na pamantayan ng pananaliksik, pangongolekta ng datos, at forensic. Sa site na ito, makakahanap ang mga mananaliksik ng maraming istatistika at publikasyon na sumasaklaw sa mga paksang tulad ng pangongolekta ng datos, pagsusuri ng trend, at mga programa sa pananaliksik kung saan posible. Isang mapagkukunang puno ng impormasyon sa iba't ibang paksang may kaugnayan sa forensic pati na rin sa agham ng paksa. 58. Mga Katotohanan Tungkol sa Digmaan sa Droga Ang Drug War Facts ay isang site na nag-aalok ng malawakang talakayan tungkol sa digmaan laban sa droga pati na rin ang mga bunga ng patakaran. Kabilang dito ang mga istatistika at numero sa mga detalye tulad ng paghahambing sa pagitan ng gastos ng paggamot kumpara sa gastos ng pag-asa sa pagpapatupad ng batas, sa mga numero sa mga pagtatantya ng paggastos sa pagkontrol ng droga, at maraming impormasyon sa halos bawat paksang may kaugnayan sa digmaan laban sa droga. Para sa maraming tao, ito ang pinakakomprehensibong site sa web patungkol sa digmaan laban sa droga. 59. Pambansang Sentro para sa mga Estadistika ng Edukasyon Ang National Centre for Education Statistics, o NCES, ay ang lugar na dapat puntahan para sa lahat ng estadistika na may kaugnayan sa edukasyon. Ang site na ito ay may mga estadistika sa estado ng pagpapautang ng mga estudyante, mga pagtataya ng mga trend sa edukasyon, kasama ang mga dataset at mga tool sa paghahambing na maaaring magamit para sa mas malalim na pagsusuri. Magagamit ng mga mamamahayag ang mapagkukunang ito upang matuklasan ang mga trend, beripikahin ang mga pampublikong pahayag, suriin ang mga publikasyon ng National Centre for Education Statistics, at makahanap ng mga bagong kuwento sa datos. 60. Bangko Pandaigdig Ang World Bank ay nagho-host ng maraming estadistika at datos na tinipon ng Development Data Group sa sektor ng pananalapi pati na rin sa macro-economics. Posibleng pagbukud-bukurin ang datos gamit ang mga hashtag. Maaaring pumili ang mga gumagamit sa pagitan ng iba't ibang tagapagpahiwatig at pumili ayon sa bansa upang masuri ang iba't ibang sukatan ng pag-unlad ng pag-unlad. Dahil dito, ito ay isang mapagkukunan na maaaring makinabang ang sinumang tumitingin sa kalagayang pinansyal at/o pang-ekonomiya ng mga bansang miyembro. 61. Kawanihan ng mga Estadistika ng Paggawa Ang Bureau of Labor Statistics ay isang pangunahing mapagkukunan ng mga mamamahayag para sa mga numero at estadistika na may kaugnayan sa kasalukuyang mga kondisyon sa pagtatrabaho, kung ano ang nangyayari sa merkado ng paggawa, pati na rin kung paano nagbabago at nakakaapekto ang mga presyo sa ekonomiya ng US. Dahil ang gawaing pang-estadistika ng ahensya ay nagsimula pa noong 1884, hindi nagkukulang ang datos pang-ekonomiya para mabasa ng mga mananaliksik. Iniimbak ng site ang impormasyon sa isang madaling gamiting interface at patuloy na ina-update ang datos na magagamit para sa paghahanap. Ito ay isang mapagkukunan ng datos na sulit tuklasin. 62. Ang mga Numero Ang mga pelikulang blockbuster ay nakakakuha ng maraming atensyon mula sa media, ngunit mahirap sabihin kung gaano kahusay ang naging performance ng isang kumpanya nang walang mga numero. Isama ang "The Numbers". Ang website na ito ay nag-aalok ng pananaliksik at datos para sa industriya ng pelikula at entertainment. Maaaring tuklasin ng mga mananaliksik ang mga pagtatantya ng kita, mga inaasahan para sa mga paparating na pelikula, at iba pang datos ng pamumuhunan sa pamamagitan ng kapasidad ng search engine na nakabatay sa SQL ng OpusData. Ang The Numbers ang unang lugar na binibisita ng mga mananaliksik para sa maaasahang istatistika sa mga pelikula. Iyan ang dahilan kung bakit ito isang mahusay na mapagkukunan. 63. Pelikula Magpakailanman Ang Film Forever ay isang site na maaaring bisitahin ng mga mananaliksik para sa market intelligence at datos para sa industriya ng pelikula sa United Kingdom. Dito makikita ng mga user ang lingguhang numero ng takilya para sa nangungunang 15 pelikulang inilabas sa UK, pananaliksik sa madla, mga ulat, mga case study, at ang pangunahing Statistical Yearbook ng organisasyon. Bukod pa rito, mayroon ding kalendaryo ang site na nagbibigay-alam sa mga manonood kung kailan ilalabas ang susunod na mga istatistika. Dahil sa niche ng Film Forever, isa itong partikular na kapaki-pakinabang na mapagkukunan ng datos. 64. IFPI Ang IFPI ay isang site na ipinagmamalaki ang pagkakaroon ng daliri sa pulso ng pandaigdigang industriya ng pagre-record. Makakahanap ang mga gumagamit ng mga nailathalang ulat na puno ng mga pananaw sa nairekord na musika, pambansa at pandaigdigang datos ng mga benta, pati na rin ang mga ulat sa panig ng negosyo ng industriya ng musika na nagpapakita kung paano namumuhunan ang mga kumpanya sa musika. Ang mga ulat na ito ay nagbibigay-daan sa mga gumagamit na makita kung ano ang nangyayari. Ang site na ito ay magpapanatili sa mga mananaliksik na napapanahon sa kung ano ang nangyayari sa industriya ng musika sa real time. 65. Statista Ang Statista ay isang search engine tulad ng Google, ngunit sa halip na mga webpage, ang site ay nagbabalik ng data at istatistika. Sa isang pindot lang ng buton, makakakuha agad ng access ang mga user sa mahigit isang milyong istatistika at katotohanan. Makakakita ang mga user ng mga infographic, istatistika tungkol sa China, industriya ng pagkain, merkado ng mga mamimili, at, sa dagdag na bayad, may mga dossier at ulat ng industriya na maaaring tingnan. Naghahanap ka man ng impormasyon tungkol sa ekonomiya, social media, o Big Mac, ito ang lugar para gawin ito. 66. EPA Ang EPA, na pinaikling pangalan para sa United States Environmental Protection Agency, ay ang ahensya ng gobyerno na responsable sa pagprotekta sa mga tao at sa kapaligiran sa pamamagitan ng pagpapatupad ng mga batas na itinatag at ipinasa ng Kongreso. Sa website ng EPA, maaaring tingnan ng mga gumagamit ang ilang mga dataset sa mga paksang mula sa agrikultura hanggang sa mga paksang kasing-kitid ng taunang paglabas ng mga nakalalasong kemikal at mga pamamaraan sa pamamahala ng basura. Ang site na ito ay isang mahusay na pagpipilian para sa mga mamamahayag na nagnanais ng access sa hilaw na datos pangkapaligiran. 67. Mga Sentro para sa Pagkontrol at Pag-iwas sa Sakit Ang website na ito para sa Centers for Disease Control and Prevention ay itinuturing na isang "one-stop shop para sa datos tungkol sa kalusugan ng publiko sa kapaligiran". Sa site na ito, makakahanap ang mga mananaliksik ng mga sanggunian at listahan sa mga sistema ng datos na tumatanggap ng pambansang pondo habang sinusubaybayan at iniimbak ang impormasyon na may kaugnayan sa mga alalahanin sa kalusugan ng publiko sa kapaligiran. Nakatuon sa mga programang tumatakbo sa pambansang antas at accessibility sa pamamagitan ng mga kakayahan sa direktang pag-download, ito ay isang mapagkukunang maaasahan para sa pinakabago at pinakatumpak na impormasyon sa web. 68. Mga Pambansang Sentro para sa Kalusugan sa Kapaligiran Itinatag pagkatapos ng pagsasama ng tatlong dating independiyenteng ahensya, ang National Centers for Environmental Health ang lugar na dapat puntahan para sa mataas na kalidad na impormasyon tungkol sa kapaligiran. Nag-aalok ng komprehensibong datos na mula sa datos ng karagatan hanggang sa mga talaan ng yelo mula milyun-milyong taon na ang nakalilipas, kung ang isyu ay may kinalaman sa kapaligiran, malamang na ang website na ito ay magkakaroon ng impormasyon tungkol dito. Ang pangako ng ahensya sa katumpakan at kahusayan sa pangangasiwa nito sa isa sa pinakamalaking archive ng uri nito ay ginagawa rin itong isa sa ilang mga site online na nagtataglay, nag-a-update, at nagpapanatili ng ganitong uri ng datos. 69. Pambansang Serbisyo sa Panahon Sasabihin ng National Weather Service ng National Oceanic and Atmospheric Administration sa mga mananaliksik ang lahat ng kailangan nilang malaman tungkol sa lagay ng panahon. Nag-aalok ang site na ito ng mga paghahanap ng datos na kinabibilangan ng impormasyon sa mga kategorya tulad ng mga babala at pagtataya, klima, mga pagtataya sa heograpiya at marami pang iba. Bukod pa rito, mayroon itong madaling maunawaan at madaling sundan na mapa na may mga tab na maaaring i-click para sa iba't ibang resulta. Sinusuri man ang nangyari sa lokal o hinahanap ang pagtataya para sa isang lungsod sa ibang estado, mabilis na matutuklasan ng site na ito ang impormasyon. 70. Wunderground Ang Wunderground ay isang mapagkukunan na nakatuon sa pagtiyak na ang impormasyon tungkol sa lagay ng panahon ay makukuha ng lahat sa buong mundo, at binibigyang-pansin din ang mga lugar na hindi gaanong sakop. Malinaw na sinasabi ng Wunderground na gumawa ito ng mga hakbang upang matiyak na ang karanasan ng gumagamit ay mahusay sa maraming digital platform. Nangangahulugan ito na ang site ay maa-access sa pamamagitan ng mobile pati na rin sa pamamagitan ng PC, kaya isa itong mainam na mapagkukunan para sa mga mamamahayag na on the go. 71. Weatherbase Nagbibigay ang Weatherbase ng impormasyon tungkol sa kasalukuyang mga kondisyon, average, impormasyon sa klima, at mga kondisyon sa paglalakbay para sa mahigit 40,000 lungsod sa buong mundo sa tulong ng isang simpleng search bar. Gamitin ang kasamang site na naka-link sa site upang makahanap ng karagdagang impormasyon sa paglalakbay tulad ng mga currency converter, coordinate, at impormasyon sa county bukod sa iba pang nakakatuwang katotohanan. Maaari ring gamitin ang Weatherbase upang maghanap ng mga lugar na maaaring bakasyonan batay lamang sa kung ano ang magiging lagay ng panahon. Maligayang paghahanap! 72. Atlas ng Enerhiya Inilathala sa ilalim ng International Energy Agency, ang Energy Atlas ay nagbibigay sa mga mananaliksik ng kakayahang makita ang mundo sa pamamagitan ng mga istatistika ng enerhiya. Orihinal na idinisenyo upang maging isang komplementaryong mapagkukunan ng datos mula sa petsa ng orihinal nitong pagsisimula, ipinagmamalaki ng site ang isang animated na balanse ng enerhiya ng daloy ng Sankey pati na rin ang ilang mga database na kasama ng mga publikasyon na maaaring basahin sa pahina ng istatistika ng International Energy Agency. Matutuklasan ng mga mananaliksik na lubos na kapaki-pakinabang ang site na ito at ang mga kasamang site nito habang sinasaliksik ang mga paraan kung paano ginagamit ng mga bansa at lungsod ang enerhiya. 73. Kawanihan ng Pagsusuring Pang-ekonomiya Ang Bureau of Economic Analysis, o BEA sa madaling salita, ay naglalathala ng malawak na hanay ng mga kapaki-pakinabang na impormasyon na nagbibigay-daan sa mga mananaliksik na subaybayan ang pulso ng ekonomiya ng bansa. Sa site na ito, may mga numero sa mga economic account ng US na kinabibilangan ng mga numero sa paggastos ng mga mamimili, GDP, at mga fixed asset bukod sa iba pang kapaki-pakinabang na datos. Maaaring maghanap ang mga mananaliksik ayon sa rehiyon o industriya pati na rin ayon sa antas gamit ang mga opsyon sa paghahanap sa internasyonal, pambansa, at rehiyon. Subukan ang interactive na pahina ng datos upang malaman ang higit pa tungkol sa kawanihan. 74. Pambansang Kawanihan ng Pananaliksik sa Ekonomiya Ang website ng National Bureau of Economic Research, o NBER, ay isang mapagkukunan ng datos na lumalapit sa ekonomiks mula sa isang analitikal na pananaw. Nagho-host ito ng datos sa malawak na hanay ng mga paksang pang-ekonomiya na may mga entry tulad ng Index of African Governance, ang Official Business Cycle, Experimental Coincident, Leading and Recession Indexes, at ang Macro History Database. Ang NBER ay may mga opisyal na dataset na inilathala at tinipon sa ilalim ng sarili nitong pangalan pati na rin ang mga index na tinipon ng iba pang mga publisher. 75. Komisyon sa Seguridad at Palitan ng Estados Unidos Ang United States Securities and Exchange Commission ay isang ahensya na nagsisilbing tagapagbantay sa pagtataguyod ng transparency, fairness, at efficiency sa mga merkado. Kapansin-pansin, ang site ay mayroong dataset ng mga financial statement mula Enero 2009 hanggang Oktubre 2017 na may mga update na ginagawa bawat quarter. Makakaasa ang mga mananaliksik sa site na ito upang manatiling updated sa mga pinakabagong balita kaugnay ng mga pag-file at sa impormasyong masasabi nito sa iyo tungkol sa mga kumpanya at sa estado ng kanilang pananalapi. 76. IMF Ang International Monetary Fund, na kilala rin bilang IMF, ay isang matatag na organisasyon sa pandaigdigang sektor ng ekonomiya at pananalapi. Sa website, makakahanap ang mga mananaliksik ng maraming datos tungkol sa mga paksang iyon. Maaaring maghanap ang mga gumagamit ng mga dataset ayon sa indicator at bansa at mag-browse sa mga tsart at mapa habang nagsasaliksik. Kabilang sa mga sikat na dataset ang direksyon ng kalakalan, mga presyo ng pangunahing bilihin, mga Indicator ng Katatagan sa Pananalapi, mga survey, at mga istatistika ng International Finance bukod sa iba pang mahahalagang impormasyon. 77. Ang Atlas – Harvard Orihinal na binuo ng Harvard, ang Atlas ay isang online na kagamitan na nagbibigay-daan sa mga tao na mailarawan at makipag-ugnayan sa sitwasyon ng kalakalan ng isang kumpanya. Pagkatapos, kukunin ng Atlas ang impormasyon at magmumungkahi ng iba't ibang produkto na maaaring gawin ng bansa upang mapabuti ang kanilang ekonomiya. Ito ay isang kagamitan na ginagamit ng mga tagagawa ng patakaran, negosyante, mamumuhunan, at mga miyembro ng publiko na gustong magkaroon ng mas mahusay na pag-unawa sa klima ng ekonomiya ng isang partikular na bansa. Ang mga tanong tungkol sa kalakalan at pambansang ekonomiya ay ngayon pa lamang naging mas madaling maunawaan. 78. Pagnenegosyo Ang Pagnenegosyo ay bunga ng pagsisikap na gumawa ng mga obhetibong pagsusuri sa mga regulasyon sa negosyo. Sinusuri ng site ang halos 200 ekonomiya at maraming lungsod na sumusukat sa mga detalye tulad ng mga tagapagpahiwatig ng ekonomiya pati na rin ang pagraranggo ng kadalian ng pagnenegosyo. Pinapayagan ng site na ito ang mga gumagamit na suriin ang mga epekto ng iba't ibang uri ng mga regulasyon sa negosyo sa pagitan ng mga bansa at mga ulat na nagho-host pati na rin ang malawak na kwalitatibong datos. Bukod pa rito, ginagawang posible rin ng site na gumawa ng mga paghahambing sa paglipas ng panahon. 79. Comtrade Orihinal na isang proyekto ng Kagawaran para sa Negosyo, Enerhiya, at Istratehiya sa Industriya ng United Kingdom katuwang ang Kagawaran para sa Pandaigdigang Kalakalan, ang Comtrade ay isang mahusay na mapagkukunan. Gamit ang datos mula sa Comtrade Data ng United Nations, ang site ay nagbibigay sa mga gumagamit ng isang interactive na tsart na maaaring gamitin upang maghanap, maghambing, at suriin ang eksaktong bilang ng kalakalan at mga produkto sa pagitan ng mga bansa. Piliin lamang ang bansang nag-uulat, pumili ng isang kasosyong bansa, at gumawa ng mga pagpili hangga't maaari. 80. Pandaigdigang Datos sa Pananalapi Ang Global Financial Data ay isang mapagkukunan na hindi lamang nagtitipon ng karaniwang datos pinansyal, kundi kumukuha rin ito ng impormasyong pinansyal mula noong 1200s hanggang ngayon. Ang impormasyong ito ay hango sa iba't ibang mapagkukunan kabilang ang mga libro, naka-archive na materyales, akademikong journal, at mga peryodiko ng balita. Bukod pa rito, ang site ay may mga dataset na gumagamit ng chain linking statistical method. Ang resulta, mula sa pananaw ng gumagamit, ay isang mapagkukunang walang katulad sa Internet dahil sa eksklusibong datos nito. 81. Pagpapakita ng Ekonomiks Ang Visualizing Economics ay hindi gaanong isang mapagkukunan sa kahulugan ng terminong pagtuklas ng datos at mas maituturing na isang serbisyo na nakatuon sa pagdidisenyo ng mga information graphics at mga interactive dashboard. Bukod pa rito, ang Visualizing Economics ay gumagawa rin ng pagsusuri at disenyo para sa layuning gawing mas madaling maunawaan ang datos pang-ekonomiya. Sa pamamagitan ng site na ito, ang mga mamamahayag ay may lehitimong pagkakataon na makipagtulungan sa isang propesyonal na may mga taon ng karanasan sa pagsasalin ng datos pang-ekonomiya sa isang bagay na mas madaling ma-access ng pangkalahatang publiko. 82. Portal ng Bukas na Datos ng EU Ang EU Open Data Portal ay isang proyektong itinatag kasunod ng isang desisyon na ginawa ng European Commission. Sa site na ito, ang mga institusyon ng EU ay nag-aalok ng datos para sa pampublikong pagtingin at paggamit nang walang mga paghihigpit sa copyright at makukuha nang walang bayad. Kasama sa mga dataset ang datos ng sanggunian ng CORDIS, ang transparency register, at maging ang isang kumpletong listahan ng mga tao, entidad, at mga grupo na pinagbigyan ng EU ng mga parusang pinansyal. Bukod pa rito, ang datos ay makukuha sa iba't ibang digital na format. 83. Bukas na Datos Network Ang Open Data Network ay isang site na nagbibigay-daan sa mga user na maghanap ng data ayon sa rehiyon at lungsod. Dahil sa malinaw at madaling gamiting homepage sa site, may kakayahan ang mga mananaliksik na maghanap ayon sa kategorya ng data, lungsod, at maging sa pamamagitan ng mga sample na tanong. Sa bawat pahina, pagkatapos dumaan sa alinman sa mga kategorya ng data o sa mga sample na tanong, mayroon ding mga maginhawang link patungo sa mas maraming dataset. Ang organisasyon pa lamang ng data ay ginagawa ang Open Data Network na isang site na sulit tuklasin. 84. Landmatrix Ang Landmatrix ay isang site na nag-aalok ng online database para sa mga kasunduan sa lupa na may layuning isulong ang higit na transparency sa mga pagkuha. Sa esensya, ang tool na ito ay maaaring gamitin upang mailarawan at maunawaan ang iba't ibang mga kasunduan sa lupa. Ang data ay palaging nagpapabuti, nagbabago, at inaayos upang mapabuti ang katumpakan ng impormasyong ibinibigay. Sa ngayon, ang Landmatrix ay may impormasyon sa mahigit 1,000 kasunduan. Ito ay isang mapagkukunan na sulit tuklasin para sa mga mananaliksik. 85. Programa sa Pagpapaunlad ng mga Nagkakaisang Bansa Ang United Nations Development Programme ay nagho-host ng maraming kapaki-pakinabang na datos tungkol sa pag-unlad ng tao sa buong mundo para sa publiko na tuklasin. Dahil ang mga petsa ay karaniwang sumasaklaw mula 1990 hanggang 2015 sa marami sa mga dataset na ito, kasama sa mga indeks ang mga kumpletong talahanayan tulad ng mga trend sa human development index, ang gender inequality index, at ang life-course gender gap. Maaaring direktang maghanap ang mga mananaliksik ng datos sa pamamagitan ng search bar at pumunta rin ayon sa bansa kung ang layunin ay tingnan ang tsart. 86. OCED Ang OECD, na kilala bilang Organisation for Economic Co-operation and Development, ay may isang site na nakatuon sa pagtulong sa mga pamahalaan sa mga inisyatibo laban sa kahirapan at kasaganaan sa pamamagitan ng katatagan at paglago ng ekonomiya. Sa site na ito, makakahanap ang mga mananaliksik ng mga materyales, publikasyon, pati na rin ang mga pamantayan at argumento na sinuri ng mga kapwa mananaliksik na pabor sa pagtatakda ng mga pamantayan. Nagho-host din ang OECD ng isang factbook na nagbibigay ng isang matibay na tool sa sanggunian sa ekonomiya na sasama sa ilang mga survey at hula sa pananaw sa ekonomiya na matatagpuan sa mga pahina nito. 87. Kagawaran ng Kalusugan at Serbisyong Pantao ng Estados Unidos Ang Kagawaran ng Kalusugan at Serbisyong Pantao ng Estados Unidos ay nagpapatakbo ng isang site na nagbibigay ng impormasyon tungkol sa Konseho ng Pangulo sa Kalusugan, Palakasan, at Nutrisyon. Gamit ang mga katotohanan at datos na tinipon sa tulong ng ilang eksperto sa mga kaugnay na larangan tulad ng mga chef at atleta. Bukod pa rito, ang site ay mayroon ding maraming estadistika. Makakahanap ang mga mananaliksik ng mga katotohanan tungkol sa pisikal na aktibidad ng mga bata, ang mga gawi sa pagpapalakas ng kalamnan ng mga nasa hustong gulang, pati na rin ang impormasyon tungkol sa mga gawi sa pagdidiyeta ng publiko, pati na rin ang labis na katabaan kasama ng maraming iba pang mga katotohanan at estadistika. 88. Mga Kasosyo sa Pag-access ng Impormasyon para sa Lakas-Paggawa ng Pampublikong Kalusugan Ang Partners in Information Access for the Public Health Workforce ay isang proyektong nabuo bilang resulta ng mga organisasyong pangkalusugan ng publiko, mga ahensya ng gobyerno ng US, at mga aklatan na dalubhasa sa agham pangkalusugan. Kasama sa mga pahina ng paksa sa site na ito ang mga paksang tulad ng mga grant at pondo, promosyon ng kalusugan at edukasyon sa kalusugan, at mga literatura at alituntunin. Sa pamamagitan ng seksyon ng Mga Paksa sa Pampublikong Kalusugan, mayroon ding datos sa mga paksang tulad ng bioterrorism, genomics sa kalusugan ng publiko, at kalusugan ng publiko sa ngipin, ilan lamang ito sa mga paksang nabanggit. 89. Pundasyon ng Kalusugan ng Nagkakaisang Kalusugan Sa nakalipas na tatlong dekada, ang United Health Foundation ay nagbibigay ng impormasyon tungkol sa mga ranggo ng kalusugan para magamit bilang isang paraan ng pagsukat ng kalusugan ng publiko. Ang site ay nagho-host ng maraming ulat at publikasyon na kinabibilangan ng mga ulat tungkol sa kalusugan ng mga naglingkod, mga ulat ng mga senior, kalusugan ng kababaihan at mga bata, mga taunang ulat, at maging mga maikling pahayag sa mahahalagang paksa sa larangan. Gamitin ang interactive na mapa upang mag-explore ayon sa rehiyon at matuto ng higit pang impormasyon. Mayroon ding search bar para sa karagdagang nabigasyon kung ang mga mananaliksik ay naghahanap ng isang bagay na mas tiyak. 90. Medicare Sa Estados Unidos, ang Medicare ang pangunahing paraan na inaasahan ng maraming tao para sa health insurance at access sa medikal na paggamot. Kasama ng mga serbisyong inaalok nito sa real time, nag-aalok din ang Medicare ng datos sa mga pamantayan at kalidad ng paggamot sa iba't ibang pasilidad at ospital sa pamamagitan ng tsart at tuntunin ng paghahambing nito. Ito ang opisyal na dataset na ginagamit ng website ng Hospital Compare at puno ito ng datos na maaaring i-download sa Excel para sa mas madaling pag-access. 91. Pagsubaybay, Epidemiolohiya, at mga Pangwakas na Resulta (SEER) Ang Surveillance, Epidemiology and End Results, na kilala rin bilang SEER, ay may isang site na lalong kapaki-pakinabang bilang mapagkukunan ng impormasyon tungkol sa mga istatistika ng kanser. Nagho-host ito ng mga buod ng istatistika na nagbibigay-daan para sa pananaliksik sa mga bilang na nauugnay sa kanser na maaaring ayusin ayon sa lokasyon ng kanser, etnisidad, lahi, edad, kasarian, at maging ayon sa uri ng datos. Nagho-host din ang site ng mga publikasyon, dataset, at software na maaaring gamitin ng mga mananaliksik para sa mas malalim na pagsusuri. 92. Amnesty International Ang Amnesty International ay isang organisasyong matagal nang tagapagtaguyod ng karapatang pantao at hustisya sa buong mundo. Nagkataon din na nagho-host ito ng maraming datos tungkol sa katayuan ng mga karapatang pantao sa buong mundo pati na rin ang impormasyon tungkol sa mga partikular na kalupitan at krimen laban sa sangkatauhan sa iba't ibang punto bilang bahagi ng taunang ulat nito. Magagamit ng mga mananaliksik ang impormasyon upang gumawa ng mga paghahambing sa pagitan ng iba't ibang taon at upang makita kung paano umunlad o umatras ang iba't ibang bansa sa larangan ng karapatang pantao. 93. Grupo ng Pagsusuri ng Datos ng Karapatang Pantao Mula nang mabuo ito 25 taon na ang nakalilipas, ang Human Rights Data Analysis Group ay naglalapat ng mga prinsipyong siyentipiko sa mga paglabag sa karapatang pantao sa iba't ibang bansa sa buong mundo. Ang site ay nagho-host ng mga publikasyon na nailathala sa mga kagalang-galang na outlet ng media tulad ng Washington Post at mga pormal na publikasyon sa pamamagitan ng mga tagapaglathala ng Macmillan na inayos ayon sa taon. Kasama ng mga organisadong publikasyon nito noong mga nakaraang taon, mayroon ding mga proyektong nagaganap sa buong mundo. Para sa mas teknikal na pagtingin sa mga paglabag sa karapatang pantao, ito ay isang mahusay na paghahanap. 94. Datos ng Internasyonal na Ugnayan at Karapatang Pantao Ang site na ito ay naglalaman ng mga database na tinipon ng maraming kagalang-galang na organisasyon, unibersidad, at maging ng mga ahensya ng gobyerno. Ang mga halimbawa nito ay ang Manifesto Project, ang Minorities (at Risk) Project, ang Comparative Welfare States District, at ang Armed Conflict Database. May ilang mga proyekto tulad ng Polity IV Project na nagsimula pa noong 1800s. Samantala, ang mga proyekto tulad ng Stockholm International Peace Research Institute (SIPRI) ay sumusukat sa mga paglilipat ng armas, internasyonal na paggastos sa militar, at mga trend sa seguridad. Ang pinakamahusay na paraan upang maunawaan ang datos ay ang pumunta sa site at mag-explore. 95. Programa ng Datos ng Salungatan sa Uppsala Ang Uppsala Department of Peace and Conflict Research, na kadalasang tinutukoy bilang UCDP, ay nagho-host ng isang napakalaking database na tinatawag na UCDP Conflict Encyclopedia. Ito ay isang site na nagbibigay-daan sa mga user na i-click at tuklasin ang datos na pinaghiwalay na ng departamento. Maaaring i-click ang mga mananaliksik sa pamamagitan ng website at i-download din para sa karagdagang manipulasyon at pagsusuri. Ito ay isang mapagkukunan na maaaring maasahan at ma-reference para sa de-kalidad na impormasyong ipinamamahagi sa isang madaling maunawaang paraan. 96. Kagawaran ng Paggawa ng Estados Unidos Ang Kagawaran ng Paggawa ng Estados Unidos ay nagho-host ng maraming datos pang-ekonomiya tungkol sa mga estadistika ng kawalan ng trabaho at trabaho. Natural lamang, kasama sa mga numerong ito ang mga database na kinabibilangan ng mga estadistika ng malawakang pagtanggal sa trabaho, mga pagtataya sa trabaho, mga bakanteng trabaho at paglipat sa lugar ng trabaho, mga pambansang estadistika ng trabaho, at maging ang mga internasyonal na estadistika ng paghahambing ng paggawa. Nagbibigay ang site ng impormasyong napapanahon at tumpak habang sinusubaybayan ng Kagawaran ng Paggawa ang lahat ng ito. Ito ay isang kagalang-galang na mapagkukunan na may suporta ng gobyerno para sa mga layunin ng pananaliksik. 97. Pangangasiwa ng Maliliit na Negosyo Matagal nang napatunayang mapagkukunan ang Small Business Administration para sa mga negosyante at iba pang naghahangad na maging negosyante. Ang site na ito ay naglalaman ng napakaraming istatistika tungkol sa trabaho pati na rin ang impormasyon na nagbibigay-daan sa mga mananaliksik na magsagawa ng pananaliksik sa merkado at pagsusuri sa kompetisyon. Dito makakahanap ang mga mananaliksik ng mga numero, istatistika, at mga tool na maaaring magamit upang matuklasan ang karagdagang data. Para sa impormasyon tungkol sa mga istatistika ng maliliit na negosyo mula sa pananaw ng isang employer at negosyo, ito ay isang mahusay na mapagkukunan na maaaring gamitin ng mga mamamahayag anumang oras. 98. Crowdpac Ang Crowdpac ay isang plataporma na nagbibigay-daan sa mga kandidato sa politika na mangalap ng pondo at mag-organisa. Batay sa ideya na mayroong ilang mga kandidato sa kongreso sa bawat halalan na halos walang kalaban-laban, pinapayagan ng site na ito ang mga mamamayang nakikilahok na mag-organisa ng suporta. May mga artikulong tumatalakay sa mga kaugnay na isyung pampulitika tulad ng gerrymandering kasama ang mga karagdagang paksa tulad ng mga karapatang sibil at pambansang seguridad, ang site na ito ay kumakatawan sa isang mahusay na pagkakataon upang maunawaan at malaman kung ano ang nangyayari sa grassroots political scene. 99. Gallup Ang site na ito ang tahanan ng mga sikat na botohan ng Gallup. Ang Gallup ay dalubhasa sa analytics na nagbibigay-daan sa mga gumagawa ng desisyon sa organisasyon na lutasin ang mga problema sa pamamagitan ng isang diskarte na nakabatay sa data sa paglutas ng problema. Bukod pa rito, ang aparatong iminungkahi ng Gallup ay kadalasang kapaki-pakinabang para sa pagpapaunlad ng mga solusyon. Ito ay isang mapagkukunan na kinikilala bilang pamantayang ginto sa data at advanced analytics. Mag-browse lamang sa site upang galugarin ang mga ulat sa lahat ng bagay mula sa estado ng pandaigdigang lugar ng trabaho hanggang sa talakayan ng produktibidad ng US. 100. Aklatan ng Berkeley Ang Berkeley Library ay nagho-host ng kumpletong koleksyon ng mga estadistika at datos para sa pananaliksik sa Agham Pampulitika sa kanilang site. Sa pahinang ito, makakahanap ang mga mananaliksik ng napakaraming link na nagbibigay sa mga mananaliksik ng access sa iba't ibang dataset pati na rin ang kakayahang bumuo ng sarili nila. Kabilang dito ang Historical Statistics of the United States (HSUS), ang Millennial Edition, ang Data Planet, ProQuest Statistical Insight, at ang Inter-university Consortium for Political and Social Research. Mayroong ilang oras ng datos na kailangang basahin. 101. Mga Serbisyo ng Estado ng RAND Para sa mga hindi nakakaalam, ang RAND Corporation ay isang organisasyong dalubhasa sa pananaliksik sa mga hamon ng pampublikong patakaran. Dahil sa mga kliyente at portfolio na sumasaklaw sa lahat ng antas ng pamahalaan, ang korporasyon ay isang mapagkukunan ng de-kalidad na pananaliksik para sa layunin ng paggawa ng desisyon. Ang sangay ng korporasyon sa US ay nagho-host ng isang hanay ng mga istatistika ng database sa website nito. Dito makakahanap ang mga mananaliksik ng impormasyon tungkol sa edukasyon sa K-12, kalusugan, negosyo, at ekonomiya bukod sa iba pang mga kategorya na tumutugon sa mga isyung may kaugnayan sa kabutihang pampubliko. 102. Sentro ng Roper para sa Pananaliksik sa Opinyon ng Publiko Pinapatakbo at pinapatakbo sa pamamagitan ng Cornell University, ang Roper Center for Public Opinion Research ay dalubhasa sa pagkolekta, pamamahagi, at pagpapanatili ng datos ng opinyon ng publiko. Bilang isang halimbawa ng uri ng impormasyong maaaring matuklasan ng Roper Center, maaaring magkaroon ng access ang mga mananaliksik sa datos mula sa halalan sa US pati na rin ang isang link sa isang archive na may mahigit 23,000 dataset. Naghahanap man ang mga mamamahayag ng reaksyon ng publiko sa politika o sa isang kamakailang pangamba sa kalusugan, halos tiyak na maglalaman ang site na ito ng impormasyon. 103. Gobyerno ng Transportasyon Pinapatakbo at pinapatakbo ng Bureau of Transportation, ang site na ito ay may datos na sumasaklaw sa malawak na hanay ng mga paksang may kaugnayan sa transportasyon. Kabilang sa mga mapagkukunan sa site na ito ang mga ulat tungkol sa enerhiya, kaligtasan ng pasahero, enerhiya, pagganap ng sistema, ekonomiya ng transportasyon, imprastraktura at transportasyon ng kargamento. Maaari pang pagbukud-bukurin at i-access ng mga gumagamit ang datos na inaalok sa site na ito ayon sa lokasyon at heograpiya. Ito ay isang site na nagbibigay-daan sa mga mananaliksik na malaman ang lahat ng maaari nilang asahan na malaman tungkol sa mga paksang may kaugnayan sa transportasyon. 104. Kalakalan sa Paglalakbay Ang Travel Trade ay isang site na nagho-host ng datos tungkol sa mga pag-alis ng mga mamamayan ng US mula 1996 hanggang 2016 sa pagsulat nito. Ang nakasaad na layunin ng mapagkukunang ito ay tulungan ang mga interesadong miyembro ng pangkalahatang publiko na maproseso at maunawaan kung paano gumagana ang pandaigdigang turismo at internasyonal na turismo sa mga nakaraang taon. Magagamit ito para sa parehong pag-download pati na rin para sa online na pagtingin, at madaling ma-access na impormasyon. Madaling magagamit ng mga mananaliksik ang datos na ito upang makahanap ng mga trend at gumawa ng mga paghahambing. 105. Skift Ang Skift ay isang site na nakatuon sa pagbibigay ng impormasyon at datos sa industriya ng paglalakbay. Bukod sa iba pang mga mapagkukunan ng datos, ang kumpanya ay nagho-host ng mga pananaliksik, kumperensya, at mga nakapagbibigay-kaalamang newsletter para sa mga subscriber at mananaliksik na mapagpipilian. Sinusuri ng Skift ang mga paksang gugustuhing malaman ng mga indibidwal sa sektor ng paglalakbay tulad ng kung saan parami nang parami ang mga taong naglalakbay, pagtukoy ng mga bagong merkado, at maraming karagdagang impormasyon tungkol sa teknolohiya sa paglalakbay na maaaring tuklasin ng mga mananaliksik. 106. Geoba.se Ang Geoba.se ay ang perpektong site para sa mga taong naghahanap ng mga katotohanan at walang iba kundi ang mga katotohanan tungkol sa isang lungsod o lokasyon. Gamit ang search engine sa homepage, ang paghahanap ng mga coordinate, impormasyon para sa paglalakbay, panahon, at maging ang lokal na kuha sa webcam ay ilang pindot lang ang layo. Nagho-host din ang site ng isang pahina na nagbibigay ng impormasyon tungkol sa mga ranggo sa mundo na maaaring paliitin ayon sa rehiyon at bansa. Sa madaling salita, ito ay isang mapagkukunan na magbibigay ng purong datos at istatistika. 107. Paglalakbay sa Estados Unidos Ang US Travel ay nagho-host ng isang site na pinapatakbo at pinapanatili ng Kagawaran ng Estado ng Estados Unidos. Ang nakasaad na misyon ng site ay naglalayong protektahan ang buhay ng mga mamamayan ng Estados Unidos na pupunta sa ibang bansa. Dahil dito, ang mapagkukunang ito ay nagho-host ng mga istatistika, impormasyon, at ulat sa mga paksang tulad ng mga pasaporte ng US, mga visa ng US, mga pag-aampon sa ibang bansa, mga pagkamatay sa ibang bansa, at mga pagdukot sa mga magulang at anak sa ibang bansa. Ang impormasyon ay maaaring gamitin habang nagpaplano ng mga biyahe ngunit maaari ding gamitin upang matukoy ang mga pangmatagalang trend gamit ang mga istatistika na sumasaklaw mula 1996 hanggang 2016. 108. Serbisyo ng Datos sa UK Pinopondohan ng Economic and Social Research Council, ang koleksyon ng UK Data Service ay naglalathala ng malawak na hanay ng datos. Ang site na ito ay may impormasyon na kinabibilangan ng mga materyales tulad ng datos ng negosyo hanggang sa mga cross-national survey, mga survey na inisponsor ng gobyerno ng UK, at maging ang datos ng senso ng UK. Sa madaling salita, ang website ay dinisenyo na isinasaalang-alang ang mga pangangailangan ng mga mag-aaral at mananaliksik. Bukod pa rito, may mga gabay, mapagkukunan, at mga instruksyon na nag-aalok ng mga gabay at mapagkukunan na makakatulong sa mga mananaliksik na maunawaan at magamit nang mabilis ang mga tool sa site na ito. 109. Data.gov.au Pinapatakbo at inilalathala ng gobyerno ng Australia, ang Data.gov.au ay nag-aalok ng madaling pag-access at paghahanap ng mga bukas na datos. Malinaw na itinuturo ng site na ito na ang datos ng gobyerno ay maaaring gamitin upang bumuo ng mga tool at application na magagamit naman para sa kapakinabangan ng mga Australyano. Hindi lamang mayroong access na ibinibigay sa mga bukas na dataset, kundi mayroon ding mga hindi pa nailathalang datos na maaaring ma-access nang may bayad. Para sa mga mananaliksik na gustong magsagawa ng mas malalim na pagsusuri, nag-aalok din ang site ng Data Toolkit. 110. Twitter Kilala ng lahat ang Twitter dahil sa mabibilis nitong mga pag-uusap, maiikling mensahe, at katayuan nito sa kulturang popular bilang sentro ng mga nagbabagang balita. Gayunpaman, ang hindi alam ng maraming tao ay mayroon ding mga tool para sa mga developer ang Twitter na nagpapadali sa pag-filter at pagtuklas ng impormasyon. Pinapayagan pa nga ng mga tool na ito ang mga mananaliksik na tingnan ang mga trend at mag-filter ayon sa heograpiya. Nagbabasa man ng mga trending hashtag o nagsasaliksik ng mga tool para sa mga developer, ang Twitter ay isang mapagkukunang ginagamit ng mga mamamahayag sa loob ng ilang panahon. 111. Instagram Hindi lang para sa paggusto ng mga cute na litrato ng pusa at mga kaibig-ibig na litrato ng sanggol ang Instagram. O kahit papaano, hindi naman kailangang maging ganoon. Ang app ay may nakakagulat na sopistikadong hanay ng mga tool ng developer na ginagawang madali itong maunawaan at magsaliksik tungkol sa audience. Bukod pa rito, ang mga hashtag at mga clue na ipinapakita ng mga larawang pino-post ng mga tao pati na rin ang mga indibidwal na na-tag dito ay maaaring maging kayamanan ng impormasyon. Ang Instagram ay isang kapaki-pakinabang na paraan upang matuklasan kung ano ang trending sa iba't ibang sektor. 112. Apat na Parisukat Para sa uri ng pananaliksik kung saan mahalaga ang lokasyon, ang Four Square ay isang kapaki-pakinabang na mapagkukunan ng datos dahil sa napakalaking database nito at lahat ng impormasyong naipon nito. Sa unang tingin, mayroon itong gabay sa lungsod na nagbibigay ng mga rekomendasyon para sa mga gumagamit tungkol sa lakas ng komunidad. Mayroon ding mga tool para sa mga developer ang Four Square na nagbibigay-daan para sa karagdagang pag-access ng impormasyon sa pamamagitan ng Places Database. Magagamit ito ng mga mamamahayag upang matuto nang higit pa tungkol sa mga partikular na lokasyon at tungkol sa mga taong gumagamit ng app. 113. New York Times Itinuturing ng marami bilang isang iginagalang na miyembro ng Fourth Estate, kakaunti ang mga mamamahayag na hindi pa nakakarinig tungkol sa New York Times. Gayunpaman, ang madalas na nakakaligtaan ay ang paggamit ng New York Times bilang pinagmumulan ng datos sa pamamagitan ng API nito. Makakahanap ang mga mananaliksik ng mga artikulo mula pa noong 1851 ayon sa buwan, makakahanap ng mga artikulo, at makakahanap pa ng mga review ng libro. Pinapayagan ng API na ito ang paghahanap batay sa mga view, share, at email at maging sa paghahanap at pag-access ng mga komento. 114. AP Ang Associated Press ay may permanenteng lugar sa kulturang popular bilang pinagmumulan ng napapanahon at tumpak na balita. Dahil sa mga tool nito bilang developer, isa rin itong kapaki-pakinabang na mapagkukunan ng datos para sa mga mamamahayag. Sa ngayon, magagamit na ng mga mananaliksik ang mga tool na ito upang lumikha ng sarili nilang pag-eedit habang nagda-download ng mga larawan at video. Ang antas ng nilalaman ay tila nakadepende sa uri ng planong ginagamit ng mga mananaliksik, ngunit pinapayagan pa rin ng Associated Press API ang mga user na dalhin ang proseso ng pananaliksik sa mas mataas na antas. 115. Limang Tatlumpu't Walo Maaaring pamilyar na ang mga mamamahayag kina Nate Silver at Five Thirty Eight at sa kanyang istatistikal na modelo dahil sa kanyang minsan ay hindi inaasahan ngunit kadalasang tamang mga hula. Ang Five Thirty Eight ay may GitHub na nagho-host ng mga dataset pati na rin ang coding na ginamit sa kasaysayan ng site. Nagtatampok ang mga dataset ng mga nakakatuwang paksa tulad ng datos tungkol sa mga masasamang drayber, ang Avengers, at ang survey tungkol sa etiketa sa paglipad. Kasabay nito, mayroon ding mga file na tumutugon sa medyo mas seryosong mga bagay tulad ng kaligtasan sa eroplano at mga krimen ng poot. 116. IMDb Ang IMDb ay itinuturing ng marami bilang ang pinakakomprehensibong site sa web pagdating sa industriya ng pelikula at pag-arte. Kung may pelikulang ipapalabas at gustong malaman ng mga tao kung sino ang gumaganap dito o makita ang pangkalahatang reaksyon ng mga manonood, malamang na mapupunta sila sa site na ito sa panahon ng kanilang paghahanap. Nagho-host din ang IMDb ng ilang dataset na nire-refresh araw-araw at available para sa komersyal at di-komersyal na paggamit. 117. KAPSARC Ang KAPSARC ay isang data portal na nagho-host ng kabuuang 923 dataset na may mga partikular na impormasyon tungkol sa datos ng enerhiya. Ang mga set na ito ay nahahati sa ilang pangkalahatang tema sa paggamit ng enerhiya, suplay ng enerhiya, at iba pang kaugnay na salik tulad ng mga patakaran, demograpiko, kapaligiran, kalakalan, tubig, at impormasyong pang-ekonomiya. Para sa mga mananaliksik na interesado sa enerhiya at kung paano ito ginagamit sa iba't ibang industriya at sektor, ang KAPSARC ay isa sa mga pinaka-komprehensibong mapagkukunan ng datos ng enerhiya sa web. 118. Makro ng Ari-arian Ang Asset Marco ay isang site na nagbibigay ng makasaysayang datos pinansyal at mga macroeconomic indicator. Saklaw ng datos na ito ang mahigit 75,000 stock, pera, kalakal, at bond na sumasaklaw sa buong mundo. Bukod pa rito, ang site ay mayroong mahigit 120,000 macroeconomic indicator na magagamit ng mga gumagamit upang tuklasin ang datos pinansyal ng iba't ibang bansa. Bukod sa lahat ng datos na ito sa pamilihang pinansyal, tinatalakay din ng site ang mga estratehiya sa pamumuhunan. Ang mapagkukunang ito ay kakaiba dahil sa napakaraming impormasyong matatagpuan. 119. Mga Serbisyo sa Web ng Pamahalaan ng US at Mga Pinagmumulan ng Datos ng XML Ang mga Web Services at XML Data Source ng Pamahalaan ng US ay naka-host sa isang site na tinatawag na USGovXML.com. Dito, maaaring mag-browse ang mga user sa iba't ibang XML data source at web service na ibinigay ng gobyerno ng US. Ang simpleng pangangalagang ito ay nagpapanatili sa mga web source na iyon na transparent at naa-access ng publiko. Para sa mga mananaliksik na regular na sumusubaybay sa index na ito sa pangkalahatan, posibleng makahanap ng kuwento sa data kung sakaling magkaroon ng biglaang pagbabago sa XML data. 120. Figshare Ang Figshare ay isang site na nagho-host ng mahigit 5,000 piraso ng siyentipikong nilalaman na magagamit para sa akademikong pananaliksik at sitasyon. Bukod sa impormasyon doon, ang site ay idinisenyo upang mag-alok sa mga mananaliksik ng isang lokasyon para sa layunin ng pag-iipon, pag-upload, pag-iimbak, at pamamahala ng pananaliksik na kanilang matutuklasan. Ang matematika, agham pangkalusugan, inhinyeriya, kemistri, agham biyolohikal, at agham panlipunan ay pawang nakalista bilang mga itinatampok na kategorya. Ang site na ito ay isang mahusay na mapagkukunan para sa mga mamamahayag na naghahanap ng mas maraming akademikong mapagkukunan na maaaring i-site. 121. LinkedData Ang LinkedData ay isang site na nakatuon sa ideya ng paghahanap ng mga bagong paraan upang ikonekta ang data sa Internet na hindi pa naka-link noon. Dito, makakahanap ang mga user ng mga tutorial, gabay, at data set na magpapasimula sa kwento. Ang lahat ng dataset ay nakatuon sa paksa ng pakikilahok sa komunidad ng naka-link na data, at bukod sa listahan ng pamimili ng naka-link na data, karamihan ay ikinategorya bilang mga dereferencable URI na mayroon man o walang komplementaryong format ng RDF. Para matuto nang higit pa tungkol sa komunidad na ito, dapat mong bisitahin ang site na ito. 122. Ang Web Miner Ang Web Miner ay ang perpektong lugar para sa mga mananaliksik na gustong kolektahin ang lahat ng generic na datos na mahahanap nila gamit ang programa. Ang site na ito ay nagho-host ng mga halimbawang database tulad ng mga restawran sa US, mga SWIFT code mula sa mga bangko sa buong mundo, mga gasolinahan sa US, mga atraksyong panturista sa Amerika, at mga Google Play app bukod sa iba pang malalaking listahan. Kung wala nang iba pa, ito ay isang site na magpapadali at magpapabilis para sa mga mamamahayag na suriin at tuklasin ang napakaraming datos sa mas maikling oras. 123. Sentro ng Datos Ipinagmamalaki ng Data Hub ang pagiging isang lugar kung saan maaaring mahanap at mailathala ng mga gumagamit ang datos nang mabilis at mahusay hangga't maaari. Ang site mismo ay nagho-host ng ilang set ng datos. Ang House Price Index (Case-Shiller), ang buwanang presyo ng ginto, at ang Current Trends in Atmospheric Carbon Dioxide ang tatlo sa pinakasikat. Bukod sa datos, nagho-host din ang site ng ilang mga tutorial na maaaring basahin ng mga gumagamit upang matuto nang higit pa tungkol sa pag-navigate sa iba't ibang uri ng datos na magagamit. 124. Pampublikong Enigma Sa site nito, tinatawag ng Enigma Public ang sarili nito bilang "ang pinakamalawak na koleksyon ng pampublikong datos" na makukuha sa web. Ang mga dataset ay nabibilang sa isa sa apat na malawak na kategorya sa FOIA, Essentials, Newsworthy, at Under the Radar. Kabilang sa ilan sa mga datos sa site na ito ang mga suweldo ng empleyado ng White House at mga Aktibong Lisensya ng Pederal na Baril. Pagkatapos gumawa ng libreng account, maa-access ng mga user ang alinman sa mga kategorya ng datos na naroon para matingnan. 125. Yahoo Pamilyar ang karamihan sa mga gumagamit ng web sa pangalang Yahoo dahil sa mga katulad ng Yahoo! News at Yahoo! Finance na kabilang sa maraming online property ng kumpanya. Kapansin-pansin sa mga mananaliksik at mamamahayag ang katotohanang nagho-host din ang Yahoo ng napakaraming dataset kabilang ang Yahoo! Music User Ratings of Songs with Artist, Album, and Genre Meta Information, v. 1.0 at ang Yahoo! Movies User Ratings and Descriptive Content Information, v.1.0 para pangalanan ang dalawa. Hindi magkakamali ang mga mamamahayag na naghahanap ng mga bagong istatistika sa mapagkukunang ito. 126. 1000 Genome Ang 1000 Genomes ay tahanan ng isang proyektong may parehong pangalan na nagsimula noong 2008 hanggang 2015. Ang layunin ng proyekto ay hanapin ang bawat genetic variation na maaaring mangyari sa kahit 1% ng mga populasyon na pinag-aaralan. Kasama ng mga publikasyong nabuo dahil sa proyektong ito, mayroon ding malalaking dataset na kinabibilangan ng magkakahiwalay na database ng mga variant cell, mga raw sequence file, at availability ng sample. Ang datos na ito ay maaaring i-browse o i-download. 127. CBOE Ang CBOE ay isang palitan ng futures na pangunahing nakatuon sa mga volatility futures. Sa partikular, ang site ay nagtatampok ng maraming materyales tungkol sa mga futures na itinatampok sa trademarked na Volatility Index ng site. Nagho-host ang site ng lahat ng uri ng datos sa merkado kabilang ang makasaysayang datos, pang-araw-araw na istatistika ng merkado, at VX Futures Daily Settlement Prices. Para sa mga mamamahayag na naghahanap ng de-kalidad na datos sa merkado, ang CBOE ay isang site na maaaring magbigay ng impormasyong iyon sa isang format na madaling sundin at maunawaan. 128. St. Louis Fed Ang Federal Reserve Bank ng St. Louis ay isa sa, kung hindi man ang pinakamahalagang sentro ng pananalapi sa rehiyon nito. Sa website, maaaring direktang basahin ng mga mananaliksik ang mga working paper, datos pang-ekonomiya, mga publikasyon, at mga serbisyo ng impormasyon. Sa madaling salita, hindi kakulangan ng impormasyon tungkol sa kasalukuyan at nakaraang pag-iisip ng St. Louis Fed sa mga tuntunin ng patakaran pati na rin ang kakayahang suriin ang pagiging epektibo ng St. Louis Federal Reserve Bank. Para sa mga mamamahayag sa negosyo, pananalapi, at ekonomiya, ito ay isang napakahusay na mapagkukunan ng impormasyon. 129. OANDA Ang OANDA ay isang sikat na online stock trading platform, na pangunahing ginagamit sa pangangalakal ng mga CFD at Foreign Exchange. Bukod sa maraming feature na idinagdag sa trader na may layuning makaakit ng mga online trader, ang OANDA ay nagho-host din ng maraming historical rates data pati na rin ng historical information sa currency converter sa site. Kasama ng lahat ng data na ito, nag-aalok din ang site ng impormasyon tungkol sa mga estratehiya sa pamumuhunan kasama ang mga balita at pagsusuri sa merkado. Hindi na kailangan ng account para ma-access ang karamihan sa data na ito. 130. ABS Ang Australian Bureau of Statistics, o ABS, na hindi naiiba sa katapat nitong Amerikano, ay nag-aalok ng obhetibong datos, impormasyong pang-ekonomiya, at pananaliksik sa malawak na hanay ng mga paksang may kaugnayan sa bansa. Direkta sa mismong site, maaaring maghanap ang mga mananaliksik ng mga datos pang-estadistika sa mga tagapagpahiwatig ng negosyo, pangangalagang pangkalusugan, pabahay, pananalapi, Pandaigdigang Kalakalan, pabahay, kalusugang pangkaisipan, pati na rin ang mga indeks ng presyo at implasyon. Maaaring magsagawa ng mga paghahanap ang mga mamamahayag upang makahanap ng mga lumang survey at impormasyon na maaari ring pagbukud-bukurin ang impormasyon ayon sa rehiyon. 131. Database ng London Orihinal na binuo at pinapatakbo ng Greater London Authority, ang London Database ay ang pagtatangka ng London na gawing mas madaling ma-access ng publiko ang datos ng London. Ang pangunahing layunin ay bigyan ang mga tao ng access sa impormasyong ito habang hinihikayat silang gamitin ito nang libre sa anumang paraan na gusto nila. Sa website na ito, maaaring maghanap ang mga gumagamit ng datos ayon sa mga paksang tulad ng Sining at Kultura, Krimen at Kaligtasan ng Komunidad, Edukasyon, at Kalusugan. Ang mga mamamahayag na interesado sa ganitong uri ng datos ay maaari na ngayong makakuha nito nang direkta mula sa lokal na pamahalaan. 132. Mga Estadistika ng New Zealand Ang gobyerno ng New Zealand ay nagho-host ng napakaraming estadistika at datos para sa mga mananaliksik upang masuri at masuri sa site na ito. Ang impormasyong ito ay maaaring salain gamit ang search bar sa itaas, sa pamamagitan ng pag-filter para sa lokasyon at rehiyon, pati na rin ayon sa paksa. Kabilang sa ilan sa mga paksa ang mga tagapagpahiwatig ng ekonomiya, kalusugan, kita at trabaho, mga sektor ng industriya, kapaligiran, at negosyo. Sa pagitan ng mga karagdagang mapagkukunan ng balita at mga paglabas na nagtatampok ng iba't ibang mga natuklasan at estadistika, matutuklasan ng mga mamamahayag ang lahat ng uri ng estadistika na partikular sa New Zealand sa pamamagitan ng site na ito. 133. Kawanihan ng Meterolohiya ng Pamahalaan ng Australia Pinapatakbo at pinapatakbo ng Pamahalaan ng Australia, ang website ng Australian Bureau of Meterology ay nagtatampok ng impormasyon tungkol sa panahon na may kinalaman sa iba't ibang lungsod at rehiyon ng Australia. Ayon sa site, ang ahensyang ito ay itinatag bilang isang paraan upang matulungan ang mga Australyano na makayanan ang klima sa kanilang paligid sa pamamagitan ng kombinasyon ng mga babala at payo. Dito makakahanap ang mga mananaliksik ng mga pana-panahong pananaw, imbakan ng tubig, mga pagtataya ng ulan, pabagu-bagong klima, at mga pana-panahong pagtataya ng daloy ng ilog. Sa site na ito makakahanap ka ng tumpak at kagalang-galang na saklaw tungkol sa panahon sa Australia. 134. GroupLens Ang site na ito ay nasa web sa kagandahang-loob ng GroupLens ng Department of Computer Science and Engineering ng University of Minnesota. Nag-aalok ang site ng mga publikasyon pati na rin ng mga dataset para sa mga layunin ng pananaliksik. Mayroong kabuuang humigit-kumulang anim na dataset. Sa mga pinangalanang set, may ilan na pinamagatang Book-Crossing, MovieLens, at HetRec 2011. Sa madaling salita, ito ay isang kapaki-pakinabang na mapagkukunan para sa mga mamamahayag na naghahangad na mas maunawaan kung paano gamitin ang ibinigay na datos. 135. KD Nuggets Ang KD Nuggets ay isang site na pangunahing nakatuon sa pagbibigay sa mga tao ng data science, business analytics, machine learning, at data mining. May isang pahina sa site na mayroong kumpletong listahan ng mga dataset na ginagamit ng mga tao upang mas masuri ang data mining at big data, kasama ang mga dataset tulad ng Bioassay Data, Asset Marco, DataMarket, Casualty Workbench, Data Ferrett, at Datamob na pawang naka-link. Isa itong kamangha-manghang mapagkukunan para sa mga mamamahayag na mas gustong magkaroon ng lahat ng impormasyon sa isang pahina lamang. 137. Microsoft Lahat ng gumagamit ng PC o laptop ay malamang nakarinig na ng tungkol sa Microsoft kahit papaano. Kapansin-pansin, bukod sa mga PC, laptop, at software, ang Microsoft ay nagho-host din ng maraming pananaliksik at publikasyon. Kabilang dito ang mga tagumpay tulad ng pagsisikap ng kumpanya na lumikha ng mga makinang may kakayahang bumasa at sumulat pati na rin ang cloud-based na data science. Mayroon ding karagdagang impormasyon tungkol sa mga tool na binubuo ng Microsoft tulad ng Visual Studio Code Tools at ang mga pag-unlad sa AI na kinakatawan ng mga ito. 138. RDataMining Tulad ng nakasaad sa lata, ang R Datamining ay isang mapagkukunan tungkol sa R at datamining. Ang site ay nagbibigay ng maraming halimbawa at dokumento na nagbibigay ng malalimang pananaw sa data mining at data mining gamit ang R. Bukod pa rito, mayroon ding mga link sa mga kurso sa pagsasanay tulad ng maikling kurso na inaalok ng University of Canberra. Kabilang dito ang mga link sa mga libreng dataset at presentasyon pati na rin ang mga dataset na sumasaklaw sa mga paksang tulad ng eroplano, airline, at datos ng ruta pati na rin ang mga link sa site tulad ng GeoDa. 139. Kolaboratibong Pananaliksik sa Computational Neuroscience – Pagbabahagi ng Datos Ang Collaborative Research in Computational Neuroscience, na kilala rin bilang CRCN, ay may ilang mga dataset na maaaring ma-access sa pamamagitan ng kanilang site. Ang mga dataset ay ikinakategorya ayon sa iba't ibang bahagi ng utak tulad ng visual cortex, hippocampus, motor cortex, avian, paggalaw ng mata, at aplysia bilang ilan lamang sa mga halimbawa. Kasama rin sa mga folder na ito ang mga hamon, tool, simulation, at mga pamamaraan. Ang kakayahang ibahagi ang datos na ito ay ginagawa itong isang mas mahusay na mapagkukunan na gamitin para sa pananaliksik. 140. Arkibos ng Bangko ng Datos ng Protina Ayon sa website nito, ang archive ng Protein Data Bank ay naging pangunahing mapagkukunan tungkol sa mga nucleic acid, ang mga 3D na istruktura ng mga protina, at mga kumplikadong asembliya simula pa noong 1971. Nabuo nang may tahasang misyon na panatilihin ang impormasyong ito sa pampublikong domain, maaaring pumunta rito ang mga mananaliksik upang tingnan ang mga ulat sa pagpapatunay at mga diksyunaryo ng datos online. Mayroon ding mga paglago ng datos at mga istatistika ng paggamit na magagamit para sa pag-uuri at pagsusuri batay sa web pati na rin para sa pag-download. Higit sa lahat, ang site ay palaging nagdaragdag ng mga bagong impormasyon. 141. Ang Proyekto ng PubChem Ang PubChem, bilang isang opisyal na proyekto, ay dinisenyo upang ipaalam sa publiko kung ano ang kayang gawin ng maliliit na molekula mula sa isang biyolohikal na pananaw. Ang site ay naka-link sa pamamagitan ng tatlong database kabilang ang PubChem Compound, PubChem Substance, at PubChem BioAssay. Bukod pa rito, ginagawang posible rin ng site na maghanap ng mga pagkakatulad sa pagitan ng iba't ibang protina. Para sa mga mananaliksik na nag-uunahan sa kanilang pagsusuri ng datos, nag-aalok din ang site ng libreng coding at mga tip. 142. Coremine Medical Ang Coremine Medical ay isang napakahalagang mapagkukunan para sa sinumang naghahanap ng impormasyon tungkol sa biyolohiya, kalusugan, at medisina. Ngayong naisama na sa kasalukuyang anyo nito ang kakayahan ng PubGene sa biomedical text mining, ang Coremine ay isa rin sa mga pinaka-flexible na mapagkukunan ng impormasyong biomedical. Ipapakita ng site na ito ang mga ugnayan sa pagitan ng mga konsepto at ideya sa isang biswal na nakakaengganyo at madaling maunawaang format na maaaring hindi napansin kung hindi. Isa ito sa mga pinaka-komprehensibong mapagkukunan ng datos na biomedical na magagamit ng mga mamamahayag. 143. Tu Tiempo Ang Tu Tiempo ay isang hindi kapani-paniwalang mapagkukunan ng datos ng panahon at klima para sa bawat bansa sa mundo. Gamit ang mapagkukunang ito, madaling makahanap ng taunang, buwanan, at pang-araw-araw na mga average para sa halos bawat lungsod at rehiyon sa mundo. Bukod pa rito, maaari ring maghanap ang mga gumagamit sa database ng mahigit 115 milyong talaan na puno ng makasaysayang datos na maaaring hanapin ng sinumang tao. Depende sa rehiyon na hinahanap, posibleng makahanap ng datos na nagmula pa noong 1929. 144. Mga Mapagkukunan ng Komplikadong Network Ito ay isang site na nagbibigay ng access sa medyo maramihang datos na unang ginamit sa mga eksperimentong nakabatay sa computer. Ang kumpletong listahan ng mga dataset na naglilista ng mga uri ng datos kabilang ang mga news graph, biological graph, citation graph, collaboration graph, engineered graph, at semantic graph. Ang pahina ay nagli-link din sa isang listahan ng mga mapagkukunan na naglalaman ng maraming impormasyon tulad ng dataset na sumuri sa humigit-kumulang 3 milyong patente sa US. Ipinagmamalaki rin ng pahina ang isang kahanga-hangang koleksyon ng mga Complex Network dataset. 145. Scopus Ang Scopus ay isang kasangkapan na nagbibigay-daan sa mga indibidwal na mabilis at madaling makahanap ng mga pananaliksik at akademikong sitasyon. Nag-aalok ang site ng isang napakalawak na database ng pananaliksik na naganap sa buong mundo sa iba't ibang larangan kabilang ang mga sektor tulad ng medisina, teknolohiya, agham panlipunan, at sining at humanidades. Gamitin ang Scopus upang makuha ang mga akademikong mapagkukunan na maaaring hindi napansin. Tutal, sa maraming lupon, ang kalidad ng isang akademikong mapagkukunan ay maaaring halos kasinghalaga ng impormasyong ibinibigay nito. 146. Stanford Ang reputasyon ng Stanford bilang isang prestihiyosong institusyong akademiko ay hindi basta-basta nangyari. Ang kahusayan ay makikita sa mga kursong may kaugnayan sa programming. Nagho-host din ang site ng ilang dataset na kinabibilangan ng mga detalye tulad ng impormasyon sa social network. May mga dataset na nakasentro sa mga social circle sa Facebook, kahilingan ng admin ng Wikipedia, mga social circle sa Twitter, at Google+. Ang mga network ng komunikasyon at ang Amazon Product Network ay mayroon ding sariling mga dataset. 147. Unibersidad ng Milano Ang Kagawaran ng Agham ng Impormasyon ng Unibersidad ng Milano ay nagpapatakbo ng isang web page na kilala bilang Laboratory for Web Algorithms. Ang site na ito ay tahanan ng maraming dataset na maaaring tuklasin. Kabilang dito ang mga graph na may kaugnayan sa mga social network, mga graph sa Facebook, mga snapshot mula sa proyektong DELIS, at isang maikling listahan ng iba't ibang datos. Ang impormasyong makukuha rito ay maaaring tingnan online at i-download kung nais, na ginagawa itong isa sa mga pinaka-naa-access na dataset sa uri nito sa web. 148. Repositoryo ng Datos ng UCI Network Ang UCI Network Data Repository ay isang site na nakatuon sa paggamit ng siyentipikong pamamaraan sa pag-aaral ng mga network. Sa pahina ng mga mapagkukunan, makakahanap ang mga mananaliksik ng mga link sa mga direktoryo ng dataset na pinili ng mga organisasyon at grupo ng pananaliksik pati na rin ng mga indibidwal. Mayroon din itong koleksyon ng mga dataset na karaniwang ginagamit para sa pagsusuri ng social media. Ang mga naghahanap ng datos ay matutuwa na malaman na ang mga set na ito ay maaari ding i-download. 149. CAIDA Ang CAIDA, o ang Center for Applied Internet Data Analysis, ay nangongolekta ng malawak na hanay ng datos mula sa iba't ibang lokasyon, kadalasan sa tulong ng iba't ibang organisasyon at indibidwal. May mga dataset na naka-host sa site na ito tulad ng AS Relationships, DDOS Attacks, Telescope at mga kaugnay nito kasama ang iba pang datos. Kabilang sa mga kategorya ang trapiko, topolohiya, seguridad, buod ng worm, at mga istatistika ng buod ng trapiko. Ang mga dataset ay maaaring mangailangan ng kahilingan sa pag-access, ngunit marami, kung hindi man karamihan, ay pampubliko. 150. Crawdad Ang Crawdad, o ang Community Resource for Archiveing Wireless Data sa Dartmouth, ay natatangi dahil sa pokus nito sa pagbibigay ng wireless data sa mga mananaliksik at iba pa na maaaring interesado sa paksa. Nag-aalok ang site ng ilang tool pati na rin ang access sa maraming dataset. Kabilang sa mga nakalistang set ay ang mga tinutukoy sa Educational Use, Bit Error Characterization, Network Diagnosis, Opportunistic Connectivity, Location-Aware Computing, at marami pang mapagpipilian. Pahahalagahan ng mga mananaliksik ang resource na ito habang mas sinisiyasat nila ito. 151. Pangasiwaan ng Impormasyon sa Enerhiya ng Estados Unidos Madalas tinutukoy bilang EIA, ang US Energy Information Administration ay nasa negosyo ng pagbibigay ng taunang datos ng mga utility sa kuryente sa publiko. Ang impormasyon sa datos na ito ay sumasaklaw sa mga stock ng fossil fuel, pagkonsumo ng gasolina, buwanan at taunang impormasyon sa pagbuo ng kuryente, at datos pangkapaligiran bukod sa iba pang mga opsyon. Ang datos ay naroon at magagamit para sa pagsusuri mula noong mga taong 2001 hanggang 2017. Ang kailangan lang gawin ng mga mananaliksik ay pumunta sa site at i-download ang impormasyon. 152. Datos ng Oseanograpiya ng Britanya Pinondohan ng National Environment Research Council, ang British Oceanographic Data ay isa sa mga pinakamadaling ma-access na mapagkukunan ng datos pandagat sa Internet. Dahil sa malawak na database nito na tumatalakay sa mga agos, mga profile ng CTD, internasyonal na datos ng lebel ng dagat, mga agos, at maging sa mga makasaysayang datos ng bottom pressure recorder. Bukod pa rito, may mga dataset na matatagpuan sa Published Data Library na nag-aalok ng karagdagang access sa katalogo. Posibleng isa ito sa pinakamalawak na mapagkukunan ng impormasyon pandagat na makukuha online. 153. Katotohanan Nagbibigay ang Factual ng datos ng lokasyon para sa pag-aanunsyo at para magamit sa mga mobile platform. Partikular na interesante sa mga mananaliksik ang mga tool ng developer na kinabibilangan ng Engine Mobile SDK at ang kumpletong propesyonal at pananaliksik na aplikasyon ng Observation Graph pati na rin ang Local Validation Stack. Gamit ang palayaw ng website na nagbibigay-diin sa pagkahilig ng kumpanya sa pagkuha ng datos sa buong mundo at paghahanap ng mga bagong paraan upang mailagay ito sa konteksto, ang Factual ay may malinaw na pangako sa datos at paghahanap ng mga bago at hindi pangkaraniwang pagkakataon upang magamit ito. 154. Mga Pandaigdigang Administratibong Lugar Ang Global Administrative Areas ay isang geodatabase na nagpapakita kung saan matatagpuan ang iba't ibang administratibong lugar sa mundo. Ang datos na nakalap mula sa ganitong uri ng database ay karaniwang ginagamit sa mga geographic information system. Kabilang dito ang mga bansa at higit pang hinahati sa mga probinsya, county, at departamento bukod sa iba pa. Ang magandang balita para sa mga mamamahayag ay ang lahat ng datos na ito ay makukuha nang libre at maaari ding gamitin para sa akademiko at pangkalahatang hindi pangkomersyal na paggamit. 155. Mga Heoname Ang Geonames ay isang site na tahanan ng isang heograpikal na database na may milyun-milyong entry, natatanging mga tampok, at alternatibong mga pangalan. Nag-aalok ng parehong opsyon sa pag-export at pag-access sa pamamagitan ng iba't ibang serbisyo sa web, ito ay isang database na nagpoproseso ng humigit-kumulang 150 milyong kahilingan bawat araw. Dahil sa mga kakayahan ng wiki ng database, ang mga gumagamit ay nakakagawa ng mga pagsasaayos at pagbabago sa mga entry sa database nang may relatibong kadalian. Ito ay isang mahusay na mapagkukunan para sa mga kakayahan sa pagho-host sa maraming wika lamang. 156. Datos ng Likas na Daigdig Ang Natural Earth Data ay isang dataset ng mapa na makukuha sa pampublikong domain at puno ng impormasyong idinisenyo para magamit sa software sa paggawa ng mapa para sa paglikha ng mga makabagong mapa. Ang mga biswal ng huling produkto ay maayos at maayos ang pagkakaayos at ang datos ay maaaring magamit kaagad. Kasama sa dataset na ito ang pagkakaroon ng datos ng katalinuhan at iba't ibang tema ng datos ng kultura, raster, at pisikal na vector. Orihinal na ginawa na isinasaalang-alang ang mga pangangailangan at kagustuhan ng mga kartograpo, ang dataset na ito ay kapaki-pakinabang sa sinumang may interes sa heograpiya. 157. Mapa ng Openstreet Ang Openstreet Map ay hindi na isang website kundi isang kolaborasyon sa pagitan ng mga gumagamit na ngayon ay nagbibigay ng mga serbisyo sa pagmamapa sa mga app, site, at iba't ibang hardware device. Kumukuha ang site na ito ng mga bagong data kapag naglalagay ang mga gumagamit ng impormasyon sa mga hindi gaanong kilalang landmark tulad ng mga istasyon ng tren, kalsada, at mga trail. Ang buong dataset ay makukuha nang libre sa site at maaaring i-download nang buo o bahagi. Para sa mga gustong mag-download ng data nang bahagya, posible ring i-download ayon sa rehiyon. 158. Lungsod ng Chicago Ang Lungsod ng Chicago ang tahanan ng kampeonatong Bulls ni Michael Jordan at ng sarili nitong kakaibang istilo ng pizza, at mayroon din itong sariling kumpletong data portal. Ang mga kategorya ng dataset ay sumasaklaw sa iba't ibang paksa na kinabibilangan ng Administrasyon at Pananalapi, Etika, Kalusugan at Serbisyong Pantao, Mga Parke at Libangan, Kaligtasan ng Publiko, at Preserbasyon ng Kasaysayan. Sa madaling salita, ang data portal ng Lungsod ng Chicago ay nagho-host ng halos anumang bagay na magiging interesante sa mga mananaliksik, tagagawa ng patakaran, at mga lokal na mamamahayag. 159. CKAN Ang CKAN ay mahalagang online na tahanan ng proyektong open data ng Lungsod ng Glasgow. Ang site na ito ay may mga dataset sa maraming paksa na magagamit ng mga negosyante, tagagawa ng patakaran, akademikong mananaliksik, at mga developer ng app. Sa 360 dataset na naka-host dito, ang ilan ay may kaugnayan sa pamamahala ng lungsod tulad ng dataset ng house stock by tenure habang ang iba tulad ng dataset ng cycling ay partikular na interesante sa mga lokal na residente. Mayroong lahat ng uri ng impormasyon dito para sa mga mamamahayag na nagbabalita sa mas lokal na lugar. 160. Pamahalaan ng India Ang Pamahalaan ng India ay may website na sumasaklaw sa mga mapagkukunan ng analytics at datos sa bersyon nito ng Open Data Project. Sa kasalukuyan, mayroong humigit-kumulang 137,940 na mapagkukunan na tiningnan nang milyun-milyong beses sa site. Karamihan sa mga file na ito ay maaari ding i-download sa site. Naghahanap ka man ng mga numero sa badyet ng gobyerno o naghahanap ng mga dataset na tumutugon sa kalusugan at kapakanan ng pamilya, malamang na ang site na ito ay may mga mapagkukunang maiaalok. 161. Mga Estadistika SA Ang site na ito ay puno ng mga napapanahong estadistika, publikasyon, at datos na nakalap ng gobyerno ng South Africa. Dito matutuklasan ng mga mananaliksik ang impormasyon tungkol sa lahat ng bagay mula sa mga survey sa pagkain at inumin hanggang sa mga tagapagpahiwatig ng ekonomiya, mga istatistika ng trabaho, bilang ng populasyon at mahahalagang istatistika ng kalusugan. Posibleng maghanap ng mga numero ayon sa lungsod, tema, at tagapagpahiwatig depende sa kung ano ang kinakailangan. Ang site na ito ay nagho-host ng maraming impormasyon tungkol sa senso habang naglalabas din ng mga publikasyong pang-estadistika, mga talatanungan, mga kodigo at klasipikasyon, at patakaran sa pagpepresyo. 162. Pagpapaunlad at Pananaliksik ng Patakaran Ang site na ito ay inilalathala sa ilalim ng payong ng Tanggapan ng Pagpapaunlad at Pananaliksik sa Patakaran ng Kagawaran ng Pabahay at Pagpapaunlad ng Estados Unidos. Naglalathala ito ng maraming bilang ng mga case study, mga publikasyong biannual, at mga peryodiko nang regular bawat taon. Nag-aalok din ito ng maraming bilang ng mga dataset na maaaring maging interesado ang mga mamamahayag, kabilang ang mga renta sa Fair Market, Mga Limitasyon sa Kita, Pag-renew ng Pondo, at Mga Salik ng Implasyon na ilan lamang sa mga set na maaaring ma-access ng publiko sa site na ito. 163. Mahalagang Datos ng Kalusugan ng Net Sa Vital Net Health Data, makakahanap ang mga mananaliksik ng maraming malalaking dataset na may kaugnayan sa kalusugan. Hindi lang lahat ng set na ito ang inilalaan ng site na ito, kundi nag-aalok din ito ng mga link sa mga set na maaaring bisitahin ng mga tao at makahanap ng impormasyon. Ang listahang ito na pinili ay nagli-link sa mga mapagkukunan tulad ng CDC Wonder, Eurocat, Health Data All Star, at pati na rin sa gawain ng mga organisasyong pangkawanggawa tulad ng North American Association of Central Cancer Registries. Isa ito sa mga pinakakomprehensibong mapagkukunan ng dataset ng kalusugan na magagamit. 164. Tulay na Analitiko Ang Analytic Bridge ay isang mapagkukunan na nakatuon sa business intelligence. Dito makikita ng mga mananaliksik ang mga talakayan tungkol sa machine learning at AI, mga link sa mga webinar at kumperensya, at maging ang isang tab para sa paghahanap ng trabaho. Nagho-host din ang site ng Data Science Central, na siyang bahagi ng site na nakatuon sa big data. Dahil sa aktibo at aktibong komunidad nito at sa pangako nitong magbigay ng balita at impormasyon, ang mga mamamahayag na interesado sa mga implikasyon ng data para sa negosyo ay maaaring makinabang nang malaki mula rito. 165. Archive.org Kilala pangunahin sa mga pagsisikap nitong maging isang online na pampublikong aklatan, ang archive.org ay tahanan ng maraming nailathalang akda pati na rin ng malaking koleksyon ng dataset. Ipinagmamalaki ng site ang mga resulta mula sa 2012 Internet Census pati na rin ang mga archive ng Dark Net Market mula 2011 hanggang 2015, at maging ang isang dataset ng mga pampublikong komento sa Reddit. May mga data dumps mula sa Music Brainz at isang dataset na naglalaman ng mga audio na larawan sa pabalat. Sa pagitan ng mga publikasyon at datos nito, ang archive.org ay maraming materyal na maaaring basahin ng mga mamamahayag. 166. Mga Torrent ng Akademiko Tinutukoy ng website na ito ang sarili nito bilang isang sistemang idinisenyo upang mapadali ang pagbabahagi at pag-download ng malalaking dataset. Gamit ang teknolohiyang torrent upang gawing simple ang pamamahagi ng data, ipinagmamalaki ng Academic Torrents ang pagpapahintulot sa mga mananaliksik na mabilis na i-download ang lahat ng kailangan nila. Nagho-host din ang site ng mga papel, kurso, at koleksyon para sa pagtingin. Ang isang mabilis na paghahanap sa mga magagamit na mapagkukunan ay magpapakita na maraming mga dataset at koleksyon ang magagamit para sa pag-download dito. 167. Dataverse Ang pinakamahusay na paraan upang lapitan ang Dataverse ay isipin ito na parang ibang uri ng aklatan. Dito, madaling makakapaghanap, makakatuklas, at makakapagbanggit ng datos ang mga mananaliksik habang sabay na ginagamit ang site na ito bilang imbakan ng kanilang sariling impormasyon. Kasama sa mga paksang sakop ang mga larangan tulad ng agham panlipunan, agham pang-agrikultura, medisina, kalusugan, at agham pang-buhay, pati na rin ang agham panglupa at pangkapaligiran. Kabilang sa mga malalaking pangalan na may mga publikasyon sa site na ito ang Gallup at ang US Department of Commerce, Bureau of Census, at Geography Division. 168. DATOS NG UC Katuwang ang Social Science Data Lab ng UC Berkeley, ang UC Data ang pinakamalaki at pinakakilalang archive ng unibersidad. Ang site na ito ay nagbibigay ng mga alok sa mga larangan ng estadistika at datos ng agham panlipunan. Sa site na ito, maaaring ma-access ng mga mananaliksik ang mga papel, ulat, at working paper na ginawa ng mga mananaliksik ng UC Data. Saklaw ng hilaw na datos ang maraming larangan ng pananaliksik na kinabibilangan ng Pangangalagang Pangkalusugan, Kapakanan at Seguro sa Lipunan, Demograpiko, Pagboto, at Teknolohiya ng Impormasyon kasama ang maraming iba pang mga paksa. 169. Kampo ng Pagbibiro Nag-aalok si Joe Kamp ng kumpletong gabay sa paghahanap ng datos at mga API tungkol sa soccer at football para sa layunin ng pagsusuri ng datos. Kung susundin ng mga mananaliksik ang mga link na ibinigay sa pahina, mayroong open source na datos na magagamit sa pamamagitan ng GitHub pati na rin ang access sa libre at komersyal na mga API para sa mas madaling pag-access. Dahil ang datos at coding ay makukuha sa isang kilalang site tulad ng GitHub, ang pagkuha ng ganitong uri ng datos ay naging mas madali na ngayon. 170. Sean Lahman Hindi naman palaging isang pangalan na naririnig ng mga tao araw-araw ang pangalang Sean Laham, ngunit ang kanyang site ay tahanan ng isa sa mga pinakakomprehensibo at malalimang istatistika ng batting at pitching sa Internet. Dahil sa mga bilang na sumasaklaw sa panahon mula 1871 hanggang 2016, ang datos ay literal na nagmula sa maraming siglo. Ang datos ay libreng ma-access at magamit sa ilalim ng lisensyang Creative Commons Share Alike 3.0 at maaaring direktang i-download sa SQL at Microsoft Access, ilan lamang ito sa mga halimbawa. Maaari ring i-download ang mga istatistika sa pamamagitan ng GitHub. 171. Retro Sheet Ang Retro Sheet ay isa sa pinakamalawak na mapagkukunan sa Internet para sa mga istatistika at datos ng baseball. Kasama sa site ang mga detalye tulad ng taunang mga roster at pagkakakilanlan ng mga umpire, manlalaro, at coach. Sa mga taon na ito ay may kaugnayan, ang datos para sa all-star game ay isinama sa mga event file kasama ang isang set ng mga event file para sa post-season at isang maliit na discrepancy file. Mayroon ding mga pagkakakilanlan ang Retro Sheet para sa mga ball park para sa bawat season. Paano naman ang thorough? 172. Hamon sa Datos ng Hubway Para sa mga hindi gaanong pamilyar sa programa, ang Hubway ay ang pangalan ng bike-share na nakabase sa metropolitan area ng Boston. Siyempre, hindi naitala at inilabas ng sistema ang impormasyon tungkol sa pagkakakilanlan, ngunit gayunpaman, ang Hubway ay mayroong pangunahing impormasyon sa bawat biyahe na isinagawa sa pagitan ng Hulyo 2011 at Setyembre 2012. Kabilang dito ang mga detalye tulad ng simula at katapusan ng biyahe pati na rin ang istasyon ng pagsundo, ilan lamang sa mga kategorya. 173. Bukas na mga Paglipad Ang Open Flights ay isang database na naglalaman ng impormasyon sa mahigit 10,000 terminal ng ferry, paliparan, at istasyon ng tren sa buong mundo. Mahahanap ng mga mananaliksik ang bersyong .csv na compatible sa Excel sa pamamagitan ng GitHub at maaari rin nilang i-download ang data nang direkta sa website. Gamit ang mapa sa homepage, posibleng makita kung aling mga partikular na lugar ang nasa listahan at umaabot pa nga sa site ang impormasyon ng ruta na magagamit. Maaaring kontakin ang mga may-ari ng site para sa mas updated na impormasyon. 174. MLVIS Ang MLVIS ay isang imbakan ng datos na pinagsasama ang visual analytics at data mining sa real time. Ginagawa nitong posible ang mas madaling maunawaang pag-unawa sa datos kahit na nagtatrabaho sa malalaking dataset. Ang benchmark data at non-relational machine data learning kasama ang iba't ibang uri ng datos tulad ng attributed at heterogeneous ay kabilang sa maraming feature at opsyon na magagamit sa site na ito. Para sa karagdagang kaginhawahan ng mga gumagamit, maaari ring i-download ang impormasyong ito sa iisang pare-parehong format. 175. Pagsisimula ng Bukas na Datos Ang Open Data Inception ay isang site na nag-aalok ng mga link sa mahigit 2600 na data portal. Sa pamamagitan ng paggamit ng search bar sa itaas, maaaring maghanap ang mga mananaliksik ng mga portal at dataset ayon sa kategorya at tema. Bukod pa rito, posible ring gamitin ang site bilang paraan ng paghahanap ng pinakabagong bersyon ng dataset na hinahanap. Samantalahin ang kakayahang tingnan ang mga data portal sa list format o sa interactive visual form at simulang hanapin ang mga kinakailangang datos. 176. OpenDataSoft Makukuha sa Pranses, Ingles, at Aleman, ang OpenDataSoft ay isang mapagkukunan na nag-aalok ng access sa 480 milyong talaan, 4 na milyong API cell, at 9,284 na dataset. Gamit ang search bar sa gitna ng homepage, maaaring maglagay ang mga mananaliksik ng keyword o kategorya at hanapin ang pinakaangkop na dataset mula roon. Para sa mga mamamahayag, ito ay isang mas mabilis na paraan upang mahanap ang mga pinaka-kaugnay na dataset na kinakailangan upang makumpleto ang pananaliksik na pinag-uusapan. Bisitahin ang site para matuto nang higit pa. 177. Nationmaster Ang NationMaster ay isang mapagkukunan ng ganap na pinagsama-samang datos mula sa mahigit 300 bansa na inorganisa sa mahigit 5,000 kategorya. Saklaw ng datos ang mga bilang na kinabibilangan ng porsyento ng mga namatay na naitala, mga istatistika ng Ikalawang Digmaang Pandaigdig, at maging ang impormasyon tungkol sa digmaang nuklear at pagsubok. Makakahanap din ang mga mananaliksik ng mga talahanayan, graph, at pie chart na magbibigay-daan para sa karagdagang pagpapakita ng datos. Sa madaling salita, napakaraming paksang sakop kaya palaging may bagong matutuklasan sa datos. 178. Followerwonk Matagal nang sikat na social media site ang Twitter para sa mga nagbabagang balita at paghahanap ng mga trending na kwento. Binibigyang-daan ng Followerwonk ang mga user na dalhin ang kanilang paggamit ng Twitter sa susunod na antas. Kabilang dito ang paghahanap ng mga user ng Twitter na makakausap, pag-aaral ng mga kasalukuyang follower, at pagpaplano ng aktibidad ng Twitter para sa pinakamataas na resulta. Sa mga panahong ito, maraming reporter at mamamahayag sa Twitter ang gumagamit ng site para sa networking at pagpapakalat ng mga kwento. Ginagawang mas produktibo ng Followerwonk ang mga user ng Twitter sa site. 179. Mga Infochimp Ang Infochimps ay isang site na nag-aalok ng mga serbisyong nakabatay sa cloud na maaaring bawasan para sa layuning masulit ang big data. Ito ay kapaki-pakinabang pagdating sa pag-deploy at pagsasama ng teknolohiya at mga aplikasyon ng big data. Kapag ang mga mananaliksik ay naghahanap ng napakaraming data o sinusuri ang mga trend sa big data, ito ay isang napakahalagang mapagkukunan. Mayroon ding maraming white paper at mga kaso na magagamit para matingnan ng mga mananaliksik sa site. 180. Mga naka-archive na istatistika ng pambansang pamahalaan Itinatag noong 2006, ang Archive-It ay isang serbisyong ibinibigay ng Internet Archive. Ang serbisyong ito ay tumutulong sa mga organisasyon at negosyo na lumikha ng mga digital na koleksyon at dahil dito, nagkaroon ito ng mga pagkakataong makipagtulungan sa mga non-profit, kolehiyo, unibersidad, at gobyerno. Maaaring maghanap ang mga mananaliksik sa ilan sa iba't ibang archive sa site tulad ng mga website mula sa karera ng kandidato sa kongreso noong 2014, ang Alabama State Archives, at ang Canadian Government Information PLN Web Archive. Ang site na ito ay isang kayamanan ng impormasyon para sa mga masigasig na mamamahayag. 181. Mga Pampublikong Lugar Ang Civic Commons ay may pahina na naglilista ng iba't ibang inisyatibo ng gobyerno tungkol sa open data. Ang mahahanap na listahan ng mga mapagkukunang ito ay nakaayos ayon sa bansa, lungsod, rehiyon, at binabanggit pa ang mga mapagkukunang inilaan ng mga intergovernmental na organisasyon. Para sa mga mamamahayag, ang site na ito ay kumakatawan sa isang mas mabilis na paraan upang malaman kung aling mga pamahalaan ang nakikilahok sa Open Data Project. Nagbibigay din ang site na ito ng access sa mga piraso ng lokal na data na hindi kinakailangang lumabas sa isang simpleng paghahanap sa Google. 182. Mga Pamahalaang Pangkalibutan ng Tagapangalaga Ang The Guardian ay isang sikat na pangalan sa mundo ng pamamahayag dahil sa reputasyon nito sa mga nagbabagang balita. Ang hindi gaanong namamalayan ng mga tao ay ang site na ito ay may seksyon na nag-aalok ng datos tungkol sa mga pamahalaan sa buong mundo. May mga artikulo tungkol sa epekto ng bilang ng mga walang tirahan, talakayan tungkol sa cyber-security, at maging ang masusing talakayan tungkol sa papel na ginagampanan ng datos at estadistika sa kasalukuyang klima sa politika at lipunan. Ang seksyon ng World Government ng The Guardian ay may kakayahang magpasimula ng talakayan at makahanap ng mga anggulo para sa mga kuwento. 183. Bukas na Datos ng Gobyerno (Hub) Ang site na ito ay kabilang sa isang grupo sa pamamagitan ng Open Knowledge Foundation na may layuning hikayatin at suportahan ang patuloy na pagpapaunlad ng datos ng bukas na pamahalaan. Dito, matutuklasan ng mga gumagamit ang mga link patungo sa isa sa pinakamalawak na listahan ng mga katalogo ng bukas na datos na magagamit. Kabilang sa mga karagdagang layunin na nabanggit sa site, hinahangad din ng grupo na makahanap ng impormasyon tungkol sa patakaran, mga pinakamahusay na kasanayan, at mga alituntunin. Nagbibigay ito sa mga mamamahayag ng malawak na access sa mas marami at mas mahusay na impormasyon. 184. Bukas na Pamahalaan – Pransya Ang website na ito ang online na tahanan ng proyektong open data na iniaalok ng Pamahalaan ng France. Posibleng suriin ang datos sa pamamagitan ng paghahanap sa ilalim ng mga kategorya tulad ng trabaho, agrikultura, edukasyon, paglalakbay at turismo. Ito ang datos na nagbibigay-daan para sa pagbuo at pagpapaunlad ng mas malalim na pag-unawa sa kung ano talaga ang sinasabi ng datos habang nagbibigay din ng puwang para sa mga paghahambing batay sa makasaysayang impormasyon. Sa madaling salita, ang mga mamamahayag ay may dahilan upang maging nasasabik sa pagtingin sa datos na ito. 185. Unibersidad ng Notre Dame Iniimbak ng site na ito ang datos ng pananaliksik na makukuha sa pamamagitan ng paggamit ng University of Notre Dame ng SourceForge.net. Ang datos ay inaalok sa pamamagitan ng mga relational database. Ang buwanang data dumps ay nagbibigay-daan din upang magkaroon ng mas mahusay na pag-unawa sa open source software at mga aplikasyon nito. Upang ma-access ang impormasyong ito, ang mga kahilingan para sa access ay dapat gawin nang nakasulat sa pamamagitan ng email. Gayunpaman, ang problema ay ang mga iskolar at akademikong mananaliksik lamang ang karapat-dapat para sa access sa datos. 186. Mga Ulat ng UFO Ang National UFO Reporting Center ay may online database na nagdedetalye sa mga karanasan ng mga tao sa mga hindi kilalang lumilipad na bagay. Maaaring gawing mas madali ng mga mananaliksik ang kanilang paghahanap sa database gamit ang alinman sa apat na kategorya sa petsa, hugis ng UFO, petsang nai-post, at maging ayon sa estado. Natatangi ang mga UFO dahil hindi nila nabibigong makuha ang imahinasyon ng publiko. Kung mayroong anumang kamakailang engkwentro sa ikatlong uri na nangyari sa malapit, ito ang lugar para malaman kung ano ang sinasabi ng mga tao. 187. WikiLeaks Kilalang-kilala at walang-hiya sa media dahil sa mga kontrobersiya at sa mga isiniwalat ng mga leak tungkol sa panloob na gawain ng gobyerno at iba pang sikat at makapangyarihang mga pigura sa lipunan, ang WikiLeaks ay may reputasyon na nauna rito. Bagama't ang mga data dumps ay bihirang ilabas nang tahimik, walang sinuman ang kumukuwestiyon sa katumpakan ng impormasyon. Para sa mga mamamahayag na naghahanap ng mga kuwentong agad na makakaakit ng interes, ang WikiLeaks ay isang napatunayang mapagkukunan. Kung wala nang iba pa, magiging kawili-wili itong basahin. 188. Ang Washington Post Kilala na ang pahayagan bilang isang mahusay na mapagkukunan ng mga breaking news at mga opinyon, ngunit kakaunti ang nakakaalam na ang Washington Post ay nagbibigay ng access sa mga hilaw na datos na madalas na binabanggit sa mga artikulo nito. Sa pahina ng datos, makakahanap ang mga mananaliksik ng datos sa mga kategorya tulad ng edukasyon, senso, kalusugan at kaligtasan, transportasyon at pag-unlad, mga makasaysayang database ng World Cup, at maging ang mga numerong nauukol sa gobyerno at politika. Sa madaling salita, ang pagkakaroon ng access sa mga numerong ito ay nakakatulong sa mga tao na magkaroon ng mas konkretong pag-unawa sa mga isyu sa balita. 189. Datos ng Klima Ang Climate Data ay isang dataset na nagbibigay ng komprehensibong impormasyon tungkol sa pandaigdigang temperatura. Sa kasalukuyang format, makikita ng mga user ang bawat mahalagang impormasyon tungkol sa klima sa pamamagitan ng mga grid habang nakikita rin ang mga average. Para sa mga naghahanap ng kasamang data, posible ring makakuha ng access sa parehong impormasyon para sa lupa at karagatan. Maaaring i-download ang impormasyong ito, ngunit para sa kaginhawahan, maaari rin itong direktang tingnan sa site. 190. Istruktura ng Protina Ang *Protein Structure* ay isang mapagkukunan na naglalayong suriin kung paano magagamit ang mga computer network kasabay ng biology. Ang pahina ay nagho-host ng isang imbakan na may data na maaaring ma-access sa pamamagitan ng mga link na ibinigay. Partikular na interesante para sa mga miyembro ng komunidad ng pananaliksik ay kung paano isinasama ng site ang ilang mga ideya tulad ng pagsusuri ng modelo at maipapatupad na biology sa pagkamit nito ng layuning ito. Para sa mga mamamahayag, ang site na ito ay sulit na tingnan upang obserbahan ang progreso at suriin ang data. 191. Suriin ang Datos ng Survey nang Libre Sa tulong ng site na ito, maaaring kumuha ang mga gumagamit ng kurso sa pagsusuri ng datos ng survey nang hindi kinakailangang magbayad para sa pribilehiyo. Libreng Pag-aralan ang Datos ng Survey kasama ang detalyadong Talaan ng mga Nilalaman, kabilang ang mga seksyon na may mga pamagat tulad ng Maps at Art of Survey – Weighted Maintenance, Balancing Respondent Confidentiality with Variance Estimation Precision, Structural Equation Models (SEM), at Complex Survey Data. Nag-aalok ang site ng isang magandang paalala para sa mga umaasang makakagamit ng mas maraming istatistikal na datos sa hinaharap. 192. UCLA Sa wiki site ng UCLA, makakahanap ang mga mananaliksik ng ilang dataset na magagamit para sa mga layunin ng demonstrasyon. Maraming simulated at observed data na mapagpipilian. Gamit ang mga mapagkukunang ito, posible para sa mga tao na gamitin ang mapagkukunang ito upang matuklasan ang data ng klima, data ng populasyon, biomedical data, neuroimaging data, data ng senso ng US, data ng halalan, at data ng ekonomiya kasama ng maraming iba pang mga kategorya. Sa huli, ang mga dataset na ito ay isang mapagkukunan na maaaring makinabang sa maraming tao. 193. Unibersidad ng Toronto Sa pahina ng site nito, ang University of Toronto ay nag-aalok sa mga mananaliksik ng access sa tinatawag nitong Delve Datasets. Ang mga koleksyon ng datos na ito ay bahagi ng isang mas malaking produkto na idinisenyo para sa layunin ng paghahambing sa pagitan ng mga pamamaraan ng pagkatuto. Sa huli, ang impormasyong ito ay naroon para sa pagbuo at pagsusuri ng iba't ibang pamamaraan sa pagkatuto. Sa madaling salita, ito ay isang matibay na mapagkukunan para sa mga mananaliksik na gustong mas maunawaan kung paano suriin at pangasiwaan ang mga dataset. 194. Serbisyo sa Konserbasyon ng Likas na Yaman Ang Natural Resources Conservation Service ay may isang site na nakatuon sa pagtataguyod ng konserbasyon habang nag-aalok ng impormasyon tungkol sa iba't ibang lumot, hornwort, vascular plants, lichens, at liverwort na makikita sa Estados Unidos. Ang site na ito ay nagho-host ng isang kumpletong database ng mga halaman at mga larawan ng mga halaman na matatagpuan sa site na may kasamang napakaraming impormasyon. Maaaring i-download ng mga mananaliksik ang database at makahanap ng napakaraming impormasyon sa mga paksang tulad ng mga alternatibong pananim. Sa esensya, ang website na ito ay naglalaman ng lahat ng kailangang malaman ng mga tao tungkol sa mga halaman. 195. Serbisyo sa Pananaliksik sa Agrikultura Gaya ng maaaring ipalagay mula sa pangalan ng ahensya, ang serbisyong ito ang humahawak sa mga pangangailangan sa pananaliksik para sa Kagawaran ng Agrikultura ng Estados Unidos. Sa tuwing may natutuklasang problema sa agrikultura, ito ang bahagi ng gobyerno na malamang na tumulong sa paghahanap ng solusyon. Ang site ay nagho-host ng ilang mga dataset na maaaring ma-access at ma-download nang direkta. Maaari ring gamitin ng mga mamamahayag ang site na ito upang mahanap ang lahat ng pinakabagong balita kaugnay ng mga isyung nakakaapekto sa agrikultura. 196. Aklatan ng Larawan ng Selula Nag-aalok ang site na ito ng pampublikong aklatan na nag-aalok ng mga mapagkukunan, impormasyon, at access sa mga imahe at animation na naglalarawan ng mga selula at proseso ng cellular. Ang selula ay dinisenyo na isinasaalang-alang ang dalawahang proseso ng pananaliksik at edukasyon, ang impormasyon dito ay halos palaging may kaugnayan sa mga talakayan tungkol sa kalusugan ng publiko at sakit. Ang mga materyales ay nagmula sa kombinasyon ng mga mapagkukunan kabilang ang mga makasaysayan at modernong publikasyon. Para sa isang masusing paliwanag na nagpapadali sa mga kumplikadong prosesong biyolohikal, hindi maaaring magkamali ang mga mamamahayag sa Cell Image Library. 197. Kumpletong Henomika Ito ang lokasyon ng isang kumpanya na itinuturing ang sarili bilang isang matatag na bahagi ng larangan ng biotech sa larangan ng human genome sequencing. Kapansin-pansin, ang Complete Genomics ay nakapagpaalam na sa publiko ng ilan sa mga whole genome sequence nito. Sa huli, nag-aalok ito ng lahat ng uri ng kapaki-pakinabang na kaalaman tungkol sa DNA at sa sequenced ng human genome. Ang tanging kondisyon sa materyal na ito ay ang mga mananaliksik na gumagamit ng impormasyong ito ay mag-ingat na magbigay ng wastong mga sanggunian sa Complete Genomics. 198. Array Express Ang Array Express ay isang imbakan na nag-iimbak ng impormasyon mula sa mga resulta ng mga eksperimento sa genomics na nangangailangan ng napakalaking sequencing o pagproseso. Sa site na ito, makakahanap ang mga gumagamit ng mahigit 70,000 na resulta ng mga eksperimento kasama ang mahigit 2 milyong sanaysay sa loob ng maraming terabyte ng mga imbakan ng datos. Higit pa rito, ang impormasyong ito ay libre para sa muling paggamit para sa mga layunin ng pananaliksik. Ito ay isang mahusay na mapagkukunan para sa lahat ng pinakabagong impormasyon tungkol sa genomics at ang pag-unlad na nagagawa sa larangan. 199. I-encode Ang Encyclopedia of DNA Elements, o ang ENCODE Consortium, ay resulta ng mga grupo ng pananaliksik mula sa buong mundo na nagtutulungan. Sa huli, ang layunin ay bumuo ng isang listahan ng lahat ng mga bahagi ng genome na may kinalaman sa paggana, kabilang ang masusing pagsusuri sa mga antas ng RNA, protina, mga elementong nagreregula sa mga selula, at ang aktibidad ng mga gene. May mga datos na maaaring hanapin, pati na rin ang isang encyclopedia na nag-aalok ng karagdagang impormasyon. 200. Mga Genome ng Grupo Ang Ensemble Genomes ay isang site na itinatag noong 2000 na tumatalakay sa mga genome ng mga vertebrate. Sa paglipas ng mga taon, ang mapagkukunang ito ay nagdagdag ng kasamang impormasyon tungkol sa invertebrate metazoan, mga halaman, bacteria, at fungi. Ang datos sa lahat ng mga paksang ito ay matatagpuan at maa-access sa pamamagitan ng pag-click sa mga link na makukuha sa site. Ang site na ito ay may mga tutorial, dataset sa lahat ng mga paksang sakop, at isang koleksyon ng mga dokumentong maaaring tingnan. Ang lahat ng mga salik na ito ay ginagawang isang kamangha-manghang mapagkukunan ng datos ang Ensemble Genomes para sa mga mamamahayag. 201. Konsorsyum ng Ontolohiya ng Gene Ang Gene Ontology ay isang site na umiiral para sa tahasang layunin ng paghahanap ng paraan upang maipakita ang kasalukuyang pag-unawa kung paano gumagana ang mga gene sa pamamagitan ng computer. Mayroon itong maraming publikasyon pati na rin ang karagdagang dokumentasyon na maaaring basahin ng mga tao. May mga anotasyon na direktang naka-host sa site. Ang magandang balita para sa mga mananaliksik na gustong masusing tingnan ang mga numero at hilaw na datos ay may mga file na maaaring i-download nang direkta sa website. 202. Aklatan ng Pinagsamang mga Lagda ng Cellular na Nakabatay sa Network Ang Harvard Medical School LINCS Center ay umiiral para sa layuning tulungan ang komunidad ng pananaliksik at ang pangkalahatang publiko na matuto nang higit pa tungkol sa kung paano tumutugon ang mga selula ng tao kapag sila ay naapektuhan ng mga droga. Gamit ang database ng HMS LINCS at ang tool ng project explorer, makakahanap ang mga mananaliksik ng mga publikasyon at buod ng proyekto pati na rin ang mga pangkalahatang mapagkukunan. Maaari ring gamitin ng mga mamamahayag ang site na ito upang makuha ang lahat ng pinakabagong balita at impormasyon na nagmumula sa pananaliksik na ito. 203. Proyekto sa Pagkakaiba-iba ng Genome ng Tao Malaki ang nagagawang pag-unlad ng Human Genome Diversity Project sa pamamagitan ng mga pagsisikap ng Stanford Human Genome Center. Ang site ay may mga sample na may libu-libong sample at marker. Lumalabas na ang mga ito ay maaaring i-download, obserbahan, at masusing suriin sa pamamagitan lamang ng pagsunod sa mga link na ibinigay sa pahina. Ito ay isang mahusay na mapagkukunan para sa mga mamamahayag na gustong maunawaan ang impormasyong nagmumula sa komunidad ng pananaliksik. 204. JCB DataViewer Ang JCB DataViewer ay nagbibigay-daan sa mga interesado sa sinasabi ng Journal of Cell Biology na makita ang datos ng imahe na nauugnay sa mga artikulong inilathala doon. Ang site ay may kumpletong gallery na maaaring i-scroll ng mga tao upang makita ang mga materyales. Bukod pa rito, mayroon ding opsyon ang mga manonood na magsagawa ng karagdagang pagsusuri sa datos habang binabasa nila ang site. Sa madaling salita, ang site na ito ay perpekto para sa pag-unawa sa mga sanggunian at pigura na nasa mga artikulo ng journal. 205. Portal ng Datos ng Genomic Data Commons Ang GDC Data Portal ay isang plataporma na idinisenyo upang tulungan ang mga mananaliksik at ang mga nasa larangan ng bioinformation na magsagawa ng pananaliksik tungkol sa kanser nang mas mahusay. Mayroong archive, API, pati na rin ang mga dokumentong magagamit para sa pagbabasa at iba pa. Ang pag-access sa site na ito ay nangangahulugan ng kakayahang makita ang parehong impormasyon na ginagamit ng mga mananaliksik ng kanser upang magsagawa ng kanilang sariling pananaliksik. Dito, mahahanap ng mga mamamahayag ang lahat ng datos na kanilang hinahanap at higit pa. 206. Opensp Ang Opensp ay isang proyektong pinapagana ng komunidad na idinisenyo para sa layunin ng pagbabahagi ng mga genotype. Ang mga taong na-type gamit ang FamilyTreeDNA, 23andMe, o deCODEme ay maaaring mag-upload ng impormasyong iyon sa site. Ang layunin ng paghiling sa mga tao na gawin ito ay upang ang site ay makapagtuon sa pagtingin kung may mga koneksyon na matatagpuan sa pagitan ng mga genotype at SNP, o mga single nucleotide polymorphism. Ang kakaibang interesante sa mga mamamahayag ay mayroong datos na magagamit para ma-download ng mga tao at masiyahan sa pagtingin. 207. Patnubay sa Landas Ang Pathguide ay isang site na nakatuon sa pagbibigay ng impormasyon tungkol sa mga metabolic at signaling pathway pati na rin ang mga interaksyon sa pagitan ng mga protina sa antas molekular. Ang pahinang ito ay naglalaman ng humigit-kumulang 697 na mapagkukunan na may kaugnayan sa pangunahing paksa. Ang mga database na naka-link sa site na ito ay karaniwang libre upang ma-access. Karamihan sa mga sanggunian na ibinigay sa listahan ng mapagkukunang ito ay pangunahing nakatuon sa interaksyon ng protina sa protina. Ang site na ito ay isang napakahalagang mapagkukunan para sa mga mahilig sa biology. 208. RCSB PBB Ito ay isang site na nakatuon sa pagbibigay-alam sa mga akademiko at sa publiko sa pangkalahatan tungkol sa lahat ng bagay na may kaugnayan sa mga nucleic acid at protina. Ang RCSB Protein Data Bank ay nag-aalok ng access sa iba't ibang mga tool na idinisenyo upang gawing mas madaling maunawaan ang aspetong ito ng biology kabilang ang mga tool sa visualization, 3D structure viewing, at isang ganap na mahahanap na archive na maaaring ikategorya ayon sa kategorya ng organismo. Bukod pa rito, ang site na ito ay nag-aalok ng mga updated na balita sa lahat ng pinakabagong mga pag-unlad sa larangang ito. 209. Konsorsyum ng Psychiatric Genomics Ang Psychiatric Genomics Consortium ay bunga ng pakikipagtulungan sa pagitan ng mga imbestigador at siyentipiko mula sa buong mundo na nagsasaliksik tungkol sa genetic component ng mga sakit sa pag-iisip. Sa huli, ang proyektong ito ay nakagawa ng 17 pangunahing papel at karagdagang 31 development paper na nag-aalok ng pangalawang pagsusuri at pamamaraan na may iisang mahalagang papel na nagmula sa lahat. Nag-aalok ang Consortium ng mga tool, download, at access sa mga natuklasan sa pamamagitan ng data access portal kung hihilingin. 210. Kemikal sa Pub Ang PubChem ay isang iginagalang na pangalan sa larangan ng medikal at biyolohikal na pananaliksik at matagal na itong umiiral. Dahil sa kakayahang maghanap ng mga istruktura pati na rin sa mga database ng Compound, BioAssay, at Substance, hindi magkakamali ang mga mananaliksik sa site na ito. Bukod pa rito, mayroong milyun-milyong entry na makikita sa bawat isa sa mga database na ito. Ang impormasyong ito ay maaaring tingnan sa pamamagitan ng mga tool tulad ng 3D conformer tools at BioAssay tools. Ang data ay maaari ding i-download. 211. KOSMIKO Gaya ng ipinahihiwatig ng pangalan, ang Catalogue of Somatic Mutations In Cancer, o COSMIC, ay nakatuon para sa pagsusulat at paggalugad ng mga epekto ng somatic mutations sa kanser. Ginagawang posible ng site na maghanap sa COSMIC na ikinategorya ayon sa uri ng kanser, gene, at mutation. May mga kagamitan sa COSMIC tulad ng genome browser at cancer browser. Bukod pa rito, mayroon ding datos sa gene curation, drug resistance, genome screens, mutational signatures, at gene fusion curation na maaaring i-download sa site. 212. Henomika ng Sensitivity ng Gamot sa Kanser Ang Genomics of Drug Sensitivity in Cancer ay nakatuon sa paghahanap ng mga biomarker na makakatulong sa mga doktor na matukoy ang uri ng gamot na panlaban sa kanser na mas malamang na tumugon ang mga pasyente. Maaaring gamitin ng mga mamamahayag ang mga tab ng balita upang manatiling napapanahon sa pagkakaroon ng mga bagong datos o mga pagbabago sa site. Bukod pa rito, mayroon ding kalipunan ng datos sa mga cell lines, isang database na nagsasalaysay ng mga katangian ng kanser, at maging isang listahan ng mga compound na lahat ay maaaring tingnan sa site. 213. Stowers Institute of Medical Research Ang website ng Stowers Institute for Medical Research ay nag-aalok sa mga nagsasaliksik na miyembro ng publiko ng libreng access sa datos na ginamit ng mga siyentipiko, mananaliksik, at genomics scientist nito para sa kanilang mga publikasyon. Para sa publiko sa pangkalahatan, sinisikap ng institusyon na ituro na ang Stowers Original Data Repository ay karaniwang libreng ma-access. Gayunpaman, ang ilan sa pinakamalalaking file sa database ay maaaring hindi direktang ma-access sa pamamagitan ng Internet at maaaring mangailangan ng karagdagang mga kaayusan. 214. Database ng SSBD Ang systems Science of Biological Dynamics database, na karaniwang tinutukoy bilang SSBD database sa madaling salita, ay nagbibigay ng isang hanay ng mga kagamitan at mapagkukunan na gagamitin para sa layunin ng pagsusuri ng mga mikroskopikong imahe at pagsusuri ng quantitative biological data. Ang mga imaheng matatagpuan sa site na ito ay nagmula sa iba't ibang mga mapagkukunan at kinabibilangan ng mga bagay tulad ng mga selula, single-molecule, at gene expression nuclei. Dahil ang datos sa site na ito ay nakuha mula sa computational simulation at mga eksperimento, makakasiguro ang mga mamamahayag na ang impormasyon dito ay patuloy na pinopino at ina-update. 215. Pagbabahagi ng mga Personal na Genome Ang Personal Genome Project ay isang site na nakatuon sa paglikha ng datos tungkol sa kalusugan, genome, at katangian na bukas at makukuha ng publiko. Sa malaking bahagi, ipinagpapatuloy ng site na ito ang proyekto sa tulong ng mga indibidwal na nagboluntaryong ipubliko ang kanilang impormasyon tungkol sa genome, at nag-aalok ito ng datos na natagpuan at matagumpay nitong nakuha sa publiko nang libre. Bukod sa agham, ang proyektong ito ay nag-aalok sa mga mamamahayag ng isang kawili-wiling pagtingin sa mga epekto ng paglikha ng isang pampublikong talaan ng impormasyon tungkol sa personal na genome. 216. UCSC Genome Browser Ang USCS Genome Browser ay nagbibigay-daan sa mga indibidwal na tingnan ang mga genome assembly. Bukod sa online na pagtingin, ang site ay nagbibigay din ng mga link na maaaring gamitin upang i-download ang mga sequence at anotasyon para sa mga parehong genome assembly. Ang mga link na ito ay nahahati sa mga kategorya ng tao, mammal, iba pang vertebrate, deuterostome, insekto, nematode, iba pang genome, at iba pang mga download. Ang mga tool at direktoryo sa site na ito ay libre rin para sa personal at hindi pangkomersyal na paggamit. Makikinabang ang mga mamamahayag mula sa pagiging lubusan at pagiging naa-access ng impormasyong ito. 217. UniProt Ang Universal Protein Resource, na kilala sa pangalang UniProt, ay ang lugar na dapat puntahan para sa impormasyon tungkol sa protein sequencing at anotasyon. Gamit ang impormasyong ibinigay ng tatlong database sa UniProt Reference Clusters, ang UniProt Knowledgebase, at ang UniProt Archive, ang site na ito ay may mga peptide at cluster searches bukod sa iba pang mga tampok. Maaaring gamitin ng mga mamamahayag ang site na ito upang beripikahin, tuklasin, at matuto nang higit pa tungkol sa mga bagong tuklas sa larangan ng protein sequencing at anotasyon. 218. Datos ng Indeks ng Klima ng mga Aktuwaryo Ang Actuaries Climate Index, na tinatawag ding ACI sa madaling salita, ay nagbibigay sa publiko at mga gumagawa ng desisyon ng impormasyon tungkol sa mga uso sa klima at ang epekto ng pagbabago ng klima sa Canada at US. Maaaring suriin ng mga mananaliksik ang impormasyong ibinibigay ng kagamitang pang-edukasyon na ito upang mahanap at matuklasan ang malalaking pagbabago sa dagat at panahon. Posibleng paliitin ang paghahanap ayon sa mga rehiyon at bahagi. Ang site na ito ay may mga dekada ng datos na magagamit nito at regular nitong ina-update ang impormasyon nito kada quarter. 219. Sentro ng Panahon sa Abyasyon Ang Aviation Weather Center ay nagbibigay ng tumpak, napapanahon, at napapanahong impormasyon tungkol sa panahon na maaasahan ng sistema ng himpapawid. Sa site na ito, maaaring tingnan ng mga gumagamit ang iba't ibang graph, forecast, at obserbasyon sa panahon na nakabalangkas sa paraang lubos na nauunawaan ng mga abyador. Posibleng tingnan ang impormasyong ibinibigay ng mga pinagmumulan ng datos ng site nang real time sa pamamagitan ng .csv o XML output. Maaaring manipulahin at obserbahan ng mga mananaliksik ang mga hilaw na numero nang mas malapitan sa pamamagitan ng opsyong ito sa pag-download. 220. Yunit ng Pananaliksik sa Klima Ang website ng Climatic Research Unit ay naroon para sa partikular na layunin ng pagsasagawa ng pananaliksik tungkol sa mga epekto ng pagbabago ng klima noong nakaraan, pag-aaral ng mga sanhi, at paghahanap ng mga solusyon sa mga isyu ng pagbabago ng klima sa kasalukuyan. Dito, maaaring basahin ng mga tao ang mga resulta ng pananaliksik, makakuha ng pangkalahatang-ideya ng paksa sa pamamagitan ng mga information sheet, magbasa ng mga publikasyon, at maging ma-access ang hilaw na datos. Ang mga mamamahayag na naghahanap ng hilaw na dataset ng panahon ay mapalad sa mapagkukunang ito. 221. Pagtatasa at Set ng Datos ng Klima sa Europa Sa website ng European Climate Assessment & Dataset, matutuklasan ng publiko ang impormasyon tungkol sa matinding pagbabago sa klima o sa panahon. May opsyon ang mga mananaliksik na gamitin ang kagamitan sa pananaliksik ng proyekto, na tinatawag na KNMI Climate Explorer, upang beripikahin ang datos, suriin ang mga pana-panahong pagtataya, at masusing tingnan pa ang mga epekto ng El Niño bukod sa iba pang mga aplikasyon. Dahil ina-update araw-araw ang dataset na ito, ang mga mamamahayag na gumagamit ng mapagkukunang ito ang unang makakaalam tungkol sa anumang mga senyales ng matinding pagbabago ng klima. 222. Mga Serbisyo sa Pag-browse ng Pandaigdigang Imahe Ang Global Imagery Browse Services, o GIBS sa madaling salita, ay isang mahalagang bahagi ng EOSDIS sa tungkulin nito bilang tagapagbigay ng mga serbisyo sa imahe na tumutugon at batay sa mga pamantayan ng komunidad. Sa madaling salita, pinapayagan ng GIBS ang mga ordinaryong tao na makipag-ugnayan sa mga imahe ng satellite na kinunan mula sa halos kahit saan sa mundo sa high definition. Dahil ang EOSDIS GIBS ay magagamit sa pamamagitan ng datos ng agham pang-lupa ng NASA, mas madali kaysa dati para sa mga mamamahayag at mananaliksik na matuto nang higit pa tungkol sa mundo sa real time. 223. Klima at Ekosistema ng Bering Sa ilalim ng Pambansang Pangasiwaan ng Karagatan at Atmospera ng Pamahalaan ng Estados Unidos, ipinapaalam ng website na ito sa mga mamamahayag at mananaliksik ang lahat ng nais nilang malaman tungkol sa kung paano tumutugon ang klima at ecosystem ng Dagat Bering sa mga pagbabagong naganap sa Arctic. Dito, posibleng magbasa ng mga sanaysay, magrepaso ng mga projection, at gamitin ang online data tool upang makita kung paano gumaganap ang iba't ibang index ng klima, biyolohikal, atmospera, datos ng karagatan, at wildlife sa Dagat Bering. 224. NCEI Ang NCEI, o ang National Centers for Environmental Information, ang huling resulta matapos ang pagsasama ng tatlong data center ng National Oceanic and Atmospheric Administration. Ang pahinang ito ay naglalaman ng serye ng mga link na nahahati sa 22 kategorya na mag-uugnay sa mga gumagamit sa iba't ibang mapagkukunan, mga pahinang interesado, at mga dataset ng klima at panahon. Malamang na mahahanap ng mga mamamahayag na naghahanap ng impormasyon tungkol sa klima, mga bagyo, presipitasyon, at iba pang mga alalahanin sa panahon ang kanilang hinahanap dito. 225. Laboratoryo ng Pananaliksik sa Sistema ng Daigdig Ang Global Monitoring Division ng National Oceanic and Atmospheric Administration ay nagbibigay ng impormasyon tungkol sa mga pangmatagalang trend ng mga puwersa ng pagbabago ng klima sa mundo sa pamamagitan ng pagsubaybay nito sa mga pangunahing sukatan sa atmospera. Kabilang sa mga ito ang carbon monoxide, methane, nitrous oxide, at carbon dioxide bilang halimbawa. Ang mga sukatang ito ay ginagamit upang sukatin ang mga bagay tulad ng pangmatagalang pagkaubos ng ozone, mga pinagmumulan at antas ng carbon dioxide, pati na rin ang mga sink. Ito ay isang mapagkukunan ng pagbabago ng klima na maaaring gamitin ng mga mamamahayag. 226. WorldClim – Pandaigdigang Datos ng Klima Gusto mo na ba ng mas mahusay na paraan para makita ang datos ng klima? Ang WorldClim ay isang software provider ng libreng datos na maaaring ilapat sa spatial modeling pati na rin sa paggawa ng mga mapa. Ang kasalukuyang bersyon ng libreng software na ito ay maaari lamang ilapat sa kasalukuyang klima habang ang lumang bersyon ay nagbibigay-daan sa pag-access sa datos ng klima mula sa nakaraan at kasalukuyan at nagbibigay-daan din sa mga user na makita ang estado ng mga hula sa klima sa hinaharap. Maaari lamang sundan ng mga mamamahayag ang link at i-download ang software. 227. Laboratoryo ng Pagtuklas ng Kaalaman Ang Knowledge Discovery Laboratory ay isang site na nakatuon sa pagpapaunlad ng mga makabagong teknolohiya, mga pangunahing kaalaman sa machine learning, at ang aplikasyon ng kaalamang iyon sa mga praktikal na larangan tulad ng agham ng network, pagtuklas ng pandaraya, at pagsusuri ng siyentipikong datos. Ang site ay nagho-host ng isang medyo malaking dataset sa DBLP na may 1.2 milyong bagay at 2.48 milyong link na kasama sa set. Para sa mga mananaliksik na may interes sa mga layunin ng Knowledge Discovery Laboratory, ang dataset na ito ay isang mahusay na mapagkukunan. 228. Hamon sa Pagpapatupad ng DIMACS Ang website ng ika-9 na Hamon sa Implementasyon ay tungkol sa pagtulong sa mga mananaliksik na matutunan kung paano lutasin ang mga problema sa pinakamaikling landas. Para sa mga tagalikha, ang site ay binuo nang may dalawang layunin sa isip. Una, upang mahanap ang pinakamahusay na mga solusyon na maaaring kopyahin. At pangalawa, upang gawing madali para sa mga mananaliksik na makipagtulungan at tumuklas ng mas epektibong mga solusyon. Ang mga mananaliksik na interesado na makita kung gaano kalaking pag-unlad ang nagawa dito ay maaaring suriin ang mga papel at ang mga dataset sa site. 229. Repositoryo ng Network Ang Network Repository ay isang site kung saan iniimbak ang siyentipikong datos na may karagdagan pang mga interactive na visual tool na maaaring ma-access at masuri ng mga gumagamit. Ang site na ito ay may dalawang katangian bilang ang unang repository ng uri nito at ang pinakamalaking repository sa web. Ang paggamit ng graphing data at madaling maunawaan at biswal na nakakaengganyong mga imahe, ang paggawa ng mga paghahambing at paghahanap ng mga bagong paraan upang mai-konteksto ang datos ay mas madali. Magagamit ng mga mamamahayag ang mapagkukunang ito upang makahanap ng mga kuwento sa loob ng siyentipikong datos. 230. Mga dataset ng Pajek Ang Pajek Datasets ay isang pahina na nagbibigay ng dataset na tumatalakay sa mga interaksyon sa pagitan ng mga protina na matatagpuan sa namumuong lebadura. Matapos magbigay ng maikling paliwanag tungkol sa epekto ng paghahanap ng mga bagong paraan ng pagtuklas ng mga interaksyon kasama ang mga dahilan kung bakit mahalaga ang kakayahang matukoy ang kahalagahan ng iba't ibang interaksyon ng protina sa protina, direktang inili-link ng site ang mga manonood sa isang dataset na maaaring i-download. Para sa karagdagang impormasyon, maaaring i-click ng mga mananaliksik ang link sa ibaba upang mabasa ang papel na inilathala tungkol sa paksa. 231. Datos ng Network ng Mejn Hangad ng site na ito na magbahagi ng mga link sa mga network dataset na ginamit at tinipon ng may-ari ng web. Ang mga tema ng mga dataset ay mula sa American College football, mga blog sa politika, at mga libro tungkol sa politika ng Amerika, hanggang sa mga social network, Les Miserables, at mga kolaborasyon sa teorya ng mataas na enerhiya. Ang mga indibidwal na may interes sa paggalugad ng mga ito ay magkakaroon ng maraming interesanteng tema ng dataset na mapagpipilian. Bukod pa rito, ang data ay libreng gamitin hangga't may mga sanggunian. 232. Ang Stanford GraphBase Ang Stanford GraphBase ay ang pangalang ibinigay sa isang grupo ng mga dataset at programa ni Donald Knuth ng Stanford. Kapag ginamit nang magkasama, ang mga programang ito at dataset ay kayang manipulahin at bumuo ng mga graph at network. Sa site na ito, ang mga kinakailangang materyales ay maaaring i-download sa pamamagitan ng mga link. Sa mga file na ito, makikita ng mga mananaliksik ang datos ng iskor sa football, datos ng diksyunaryo, datos na may kinalaman sa muling pagtatayo ng Mona Lisa, at marami pang iba. 233. Koleksyon ng SuiteSparse Matrix Dating kilala bilang University of Florida Sparse Matrix Collection, ang SuiteSparse Matrix Collection ay isang koleksyon ng mga matrice na may mga implikasyon sa totoong buhay. Ayon sa site, ang partikular na koleksyon na ito ay mas madalas na ginagamit para sa numerical linear algebra sa pagbuo at pagpino ng mga sparse matrix algorithm. Mas gusto ng mga gumagamit ang koleksyon dahil sa kapakinabangan nito sa pagpapatakbo at pagsubok sa mga resulta ng mga eksperimento. Ang mga dataset at matrix benchmark ay maaaring direktang i-download sa site. 234. Mga Dataset ng Graph Ito ay isang hanay ng mga dataset na pinaniniwalaan ng mga tagalikha ng web page na ito na maaaring maging relational o kayang isalin nang maayos sa representasyon ng graph. Nag-aalok ang Graph Datasets ng mga dataset tulad ng datos ng Predictive Toxicology Challenge, datos ng IMDb, datos ng mutagenesis, datos ng MovieLens, collaborative filtering, at datos ng protina sa mga mananaliksik na gustong matuto kung paano gamitin ang mga raw na numero. Ang mga file ay makukuha sa pahinang ito at pangunahing maaaring i-download sa XML format. 235. Balita sa Malaking Datos Ang Big Data News ay isang site na nakatuon sa big data at mga pangunahing kaalaman sa agham ng data. Ang site na ito ay tahanan ng mga pinakabagong balita at kinabibilangan ng mga talakayan tungkol sa deep learning at Artificial Intelligence. Bukod pa rito, ang Big Data News ay tahanan din ng isang napakalaking dataset na naglalaman ng kabuuang humigit-kumulang 3.5 bilyong web page. Ang lahat ng ito ay pinaghihiwalay ng mga antas na tinutukoy bilang page-level graph, subdomain-level graph, first-level subdomain graph, at pay-level-domain graph ayon sa pagkakabanggit. 236. Sentro para sa mga Komplikadong Network at Pananaliksik sa mga Sistema Ang CNetS, o ang Center for Complex Networks and Systems Research, ay tumatakbo sa ilalim ng payong ng Indiana University Network Science Institute at ng School of Informatics and Computing. Ang site ay nilayong maging isang mapagkukunan sa mga larangan ng data science, computational social science, at mga kumplikadong network at sistema na may impormasyon tungkol sa pagmimina at mga pattern ng trapiko online. Bukod pa rito, ang CNetS ay nagho-host din ng isang dataset na naglalaman ng humigit-kumulang 53.5 bilyong kahilingan sa network na ginawa ng mga gumagamit ng Indiana University. 237. OONI Explorer Ang OONI Explorer, isang bahagi ng Open Observatory of Network Interference, ay isang proyektong nakatuon sa pagbibigay ng libre at open source na software. Posible para sa mga gumagamit na gamitin ang software upang subukan ang kanilang kakayahan sa pagharang ng mga website at messaging app bukod sa iba pang mga application. Partikular na interesante sa mga taong interesado sa teknolohiyang ito ang pagkakaroon ng libreng access sa raw data na nakolekta ng OONI. Ilagay lamang ang impormasyon sa OONI Explorer at makipag-ugnayan sa data mula roon. 238. Mga Hamon sa Machine Learning Ang Challenges in Machine Learning ay nakatuon sa pananaliksik at pagpapaunlad ng machine learning. Sa site na ito, makakahanap ang mga mambabasa ng mga link sa software, mga libro, mga hamon sa machine learning, pati na rin ang mga abiso ng mga paparating na workshop. Nagbibigay pa nga ang site ng mga link sa mga hamon na nagpapahintulot sa mga pagsusumite pagkatapos ng petsa. Para sa mga mamamahayag na interesado sa pagtingin kung kayang gawin ng machine learning ang mga gawain tulad ng prediksyon sa pananalapi o pag-uuri ng web page, ito ay isang site na sulit bisitahin. 239. DataX Kasalukuyang nagtatrabaho sa ilalim ng payong ng CrowdANALYTIX, ang DataX ay bahagi ng makina ng isang inisyatibo na pinapagana ng komunidad na gumagamit ng kapangyarihan ng kolektibo upang lumikha ng mga pasadyang aplikasyon ng Artificial Intelligence, machine learning, at Neuro-Linguistic Programming. Ang papel ng DataX sa proseso ay ang pagpapanatili at pag-deploy na siya namang nagsisilbing gawing scalable ang mga solusyong ito. Para sa mga mamamahayag na maraming teksto, video, at data na kailangang ayusin, ang mga bot na magagamit sa pamamagitan ng CrowdANALYTIX at DataX ay maaaring makabawas sa oras ng pananaliksik nang kalahati. 240. Datos na Pinapatakbo Pinagsasama ng Driven Data ang crowdsourcing at data science sa paraang halos walang ibang site ang nakakagawa. Binibigyang-diin ang papel nito sa pagbibigay ng tulong sa mga organisasyong humaharap sa iba't ibang hamong panlipunan, nag-aalok ang site na ito ng tulong sa pamamagitan ng paggamit ng malaking komunidad ng data science nito upang lumikha ng mga istatistikal na modelo na lumulutas sa mga tanong na predictive. Tila pangunahing gumagana ang Driven Data sa mga non-profit, ngunit potensyal itong kapaki-pakinabang para sa sinumang may hilaw na data na nangangailangan ng pagpipino. Makikinabang ang mga mamamahayag sa pagsasaalang-alang sa mapagkukunang ito. 241. Bukas na Malaking Datos Ang Dandelion API ay isang application na humahawak sa semantic text analysis para sa big data. Ang ibig sabihin nito para sa mga taong may data na nangangailangan ng pagproseso ay kukuha ang program na ito ng mga hindi organisadong teksto at hahanap ng paraan para mailagay ito sa konteksto. Ang mga mamamahayag na nag-aanalisa ng maraming dokumento ay tiyak na makikinabang sa kakayahang iyon. Mayroon ding Open Big Data ang Dandelion API sa ilalim ng mga kategoryang Milano, Trento, at Europe. Bagama't bayad ang API na ito, mayroong pang-araw-araw na dami ng teksto na maaaring masuri nang libre. 242. Mga Modelo ng Daigdig Ang Earth Models ay nakatuon sa pagbabahagi at pag-iimbak ng software at mga dataset na may kaugnayan sa mundo. Kasama sa mga tool sa pagmomodelo na nabanggit sa site ang simulation software at pagproseso pati na rin ang virtual na data na humihiram nang malaki mula sa mga partikular na larangan ng pag-aaral tulad ng tectonics at seismology. Ang mga mamamahayag at mananaliksik na nais pahusayin ang kanilang kaalaman sa paksa ay maaaring gumamit ng mga publikasyon at artikulo sa site na ito upang gawin ito bago simulan ang mga tool sa pagmomodelo at visualization. 243. Sentro ng Datos at Aplikasyon ng Sosyoekonomiko (SEDAC) Ang Socioeconomic Data and Applications Center, o SEDAC, ay isa sa mga data center na nauugnay sa sistemang EOSDIS ng NASA. Sa site na ito, makakahanap ang mga mambabasa ng mga dataset na nag-aalok ng mga numero tungkol sa pagbabago ng klima o gridded demographic na impormasyon. Maaari ring hanapin ang mga dataset ayon sa mga temang tulad ng Pamamahala, Agrikultura, Paggamit ng Lupa, Kalusugan, Konserbasyon, at Klima, Tubig, Remote Sensing, at Kahirapan. May mga mapa, gallery, gabay na nagbibigay ng higit na konteksto sa datos, at mga karagdagang mapagkukunan at tool na maaaring ma-access ng mga mananaliksik sa site. 244. Portal ng AODN Ang AODN Portal, isang site na hawak ng Australian Ocean Data Network, ay isang site na nag-aalok ng access sa datos ng agham pangklima at karagatan ng Australia. Ang mga mananaliksik na makaka-access sa impormasyong ito ay magkakaroon din ng access sa datos ng IMOS at metadata, na isang balangkas ng pananaliksik na sinusuportahan ng maraming institusyon kabilang ang Pamahalaan ng Australia. Ang mga mananaliksik na pumipiling gamitin ang AODN Portal ay maaaring asahan na makatanggap ng mahusay na paghahatid ng datos ng karagatan sa isang madaling gamitin na interface. 245. Planet OS Nag-aalok ang Planet OS ng big data framework na nagbibigay-diin sa renewable energy. Ang pagpili ng niche na ito kasama ang kahusayan ng site ay nagpasikat dito sa mga kompanya ng enerhiya sa paghahanap ng mga bagong paraan upang mailarawan at mai-konteksto ang kanilang data. Bukod pa rito, mayroon din ang site na tinatawag na DataHub kung saan nagho-host ito ng malaking koleksyon ng mahigit 2,000 dataset. Kasama sa mga dataset na ito ang open data sa pamamagitan ng NASA at Copernicus at ang data ay kadalasang ina-update nang regular. 246. INSTITUSYONG SMITHSONIAN Matagal nang iginagalang ang Smithsonian bilang isang akademikong pangalan at pinahahalagahan sa buong mundo dahil sa dedikasyon nito sa pananaliksik at kasaysayan. Sa ilang aspeto, natural lamang na magkaroon ang Smithsonian ng isang website na nag-aalok ng ilan sa pinakamahusay na impormasyon tungkol sa pananaliksik sa bulkan online. Naglalathala ang site ng mga ulat, link sa pananaliksik, at mga database na kinabibilangan ng mga paghahanap para sa narrowed volcano, pagsabog, emission, at deformation na kasabay ng listahan at spreadsheet ng bulkan noong Holocene. Hindi na kakailanganin ng mga mamamahayag ng ibang mapagkukunan tungkol sa aktibidad ng bulkan. 247. Katalogo ng Lindol Na-update at pinapanatili ng Earthquake Hazards Program ng gobyerno ng US, ang Earthquake Catalog ay nagbibigay-daan sa mga mananaliksik na makita kung kailan at saan huling naganap ang isang lindol. Bagama't limitado sa 20,000 ang mga resulta ng paghahanap, ang paghahanap sa katalogo ay may kakayahang i-filter ang mga resulta ayon sa magnitude, petsa at oras, at maging ayon sa rehiyong heograpikal. Ang antas ng kakayahang umangkop na ito ay ginagawang partikular na kapaki-pakinabang ang mapagkukunang ito para sa mga mamamahayag na sumasaklaw sa isang natural na sakuna o isang lokal na lindol at naghahanap ng ilang impormasyon sa background. 248. Asosasyong Pang-ekonomiya ng Amerika Ang American Economic Association ay nagbibigay sa mga mananaliksik ng datos tungkol sa datos ng makroekonomiya para sa US at iba pang mga bansa sa buong mundo. Ang site na ito ay tila hindi gaanong gumagawa ng datos pang-ekonomiya kundi bumubuo lamang ito ng isang maikling listahan ng mga pinaka-maaasahan. Gayunpaman, dahil sa maraming site na nag-aalok ng impormasyong pang-ekonomiya sa Internet, ito ay isang mapagkukunan na maaaring asahan ng mga mamamahayag na magkaroon ng kredibilidad. Pumunta lamang sa site at i-click ang mga kategorya ng datos pang-ekonomiya nang naaayon. 249. Historicalstatistics.org Ang Historicalstatistics.org ay isang lubhang kapaki-pakinabang na site para sa paghahanap ng uri ng impormasyong pang-ekonomiya na nagpapakita ng isang kawili-wiling kaibahan sa kasalukuyan. Halimbawa, ang historical currency converter ng site ay nagbibigay-daan sa mga mananaliksik na malaman kung magkano ang maaaring mabili ngayon ng isang taong may $10 USD noong 1923. Nagho-host din ito ng mga publikasyon at papel na nagtatanong tungkol sa mga sukatan na ginagamit sa larangan ng kasaysayan ng ekonomiya kasama ang mga indeks ng presyo at impormasyon sa suplay ng pera na maaaring i-filter ayon sa bansa. 250. DB Nomics Paano kung ang lahat ng pampublikong datos pang-ekonomiya sa Internet ay maa-access at mahahanap mula sa iisang plataporma na maaaring i-navigate? Ang Db.nomics ay isang economic database aggregator na naglalayong gawin iyon mismo. Ang datos ay makukuha sa mga format tulad ng HTML, JSON, at CSV at awtomatikong ina-update habang ang mga nakaraang rebisyon ay ini-archive nang naaayon. Kabilang sa mga mapagkukunang pang-ekonomiya ang Federal Reserve, ang Bureau of Economic Analysis, ang International Monetary Fund at iba pa. Ang mga mananaliksik na naghahanap ng kagalang-galang na datos pang-ekonomiya ay hindi magkakamali sa Db.nomics. 251. Pinagsamang Sentro ng Utang Panlabas (JEDH) Binuo sa pamamagitan ng pinagsamang gawain ng Bank for International Settlements, ng Organization for Economic Cooperation and Development (OECD), ng International Monetary Fund, at ng World Bank, ginagawang madaling makuha ng publiko ng Joint External Debt Hub ang impormasyon tungkol sa datos ng utang at mga internasyonal na nagpapautang at may utang. Ang mga mamamahayag na sumusuri sa pananalapi ng iba't ibang bansa at nagtatangkang makakuha ng mas malalim na pag-unawa sa pandaigdigang kalagayang pinansyal ay makakahanap ng halos lahat ng nais nilang malaman dito. 252. Datos ng Pandaigdigang Kalakalan Kasama ang buong input ng isang nangungunang eksperto sa ekonomiya na si Jon Haveman, ang pahinang ito sa International Trade Data ay nagho-host ng datos na maaaring i-download at higit pang suriin. Kasama sa mga dataset ang datos ng taripa, mga talahanayan ng Penn World, mga utility, datos ng import, produktibidad ng pagmamanupaktura, mga klasipikasyon ng mga produkto, Rauch Product Differentiation Codes, datos ng NBER, ang 1997 commodity flow survey, kalakalan at imigrasyon, at ang kapaki-pakinabang na gravity model. Ang UNIX ang operating system na ginagamit upang i-compile ang mga ito, ngunit binabanggit ng site na dapat ding magkaroon ng access ang mga PC sa datos. 253. Mga Bukas na Korporasyon Sa OpenCorporates, may pagkakataon ang mga mananaliksik na maghanap at makahanap ng impormasyon sa isa sa pinakamalaking open database ng mga kumpanya sa buong mundo. Ang impormasyong ito ay ginagamit ng iba't ibang grupo sa buong mundo tulad ng mga bangko, imbestigador, NGO, at mga mamamahayag sa pagsisikap na makakuha ng impormasyon at impormasyon. May karagdagang benepisyo ang mga mamamahayag na ma-access ang datos nang real time sa tulong ng OpenCorporates API pati na rin sa pamamagitan ng bulk core data o iba pang core dataset. 254. Ang Ating Mundo sa Datos Ang Our World in Data ay kumukuha ng impormasyon mula sa iba't ibang mapagkukunan sa iba't ibang larangan at nagpapakita ng mga datos na may tiyak na dami tungkol dito. Mula sa mga numero tungkol sa pakikilahok ng mga kababaihan sa lakas-paggawa hanggang sa impormasyon tungkol sa pangkalahatang persepsyon ng korapsyon sa pampublikong sektor at hindi pagkakapantay-pantay ng kita sa buong mundo, kung ang paksa ay maaaring talakayin sa mga tuntunin ng datos, maaaring may entry ang website na ito para dito. Magagamit ng mga mamamahayag ang mapagkukunang ito upang makahanap ng mga istatistika at numero na may kaugnayan sa mga isyung panlipunan. 255. Science Po Ang Sciences Po, o mas kilala bilang Institute of Political Studies, ay isang paaralan na may hindi maikakailang impluwensya sa agham panlipunan. Sa kasong ito, ang pahina ni Thierry Mayer ay naglalaman ng mga data file na nagtatampok ng grabidad at mga regresyon ng mga tunggalian sa militar mula sa "Make Trade Not War" pati na rin ang mga dataset sa mga potensyal ng merkado at marami pang iba. Ang mga mamamahayag na naghahangad na mas maunawaan ang mga konklusyong naabot sa mga akademikong journal ay makakatuklas ng maraming impormasyon habang nagba-browse sa site na ito. 256. Sentro Para sa Pandaigdigang Datos Mula nang itatag ito noong 1999, ang Center for International Data ay nakatuon sa misyon nitong mangolekta, lumikha, mapabuti, at mamahagi ng internasyonal na datos pang-ekonomiya kapwa offline at online. Sa website, maaaring ma-access ng mga mambabasa ang impormasyon tulad ng datos ng Taripa ng US, mga import at export ng mundo at US, at maging ang impormasyon mula sa Penn World Table. Dahil ang impormasyong ito ay magagamit ng publiko para sa edukasyon at pananaliksik, maaaring ma-access at magamit ng mga mamamahayag ang datos na ito nang libre. 257. Obserbatoryo ng Komplikasyon sa Ekonomiya Ang Observatory of Economic Complexity, karaniwang tinutukoy bilang OEC, ay nagbibigay-daan sa mga mananaliksik, estudyante, ekonomista, at sinuman na mailarawan ang datos ng internasyonal na kalakalan. Dahil sa mga kapansin-pansing tema at interactive na interface nito, ang site na ito ay nagbibigay sa mga mananaliksik ng lehitimong pagkakataon upang galugarin ang impormasyon tungkol sa internasyonal na kalakalan sa mga paraang hindi pa talaga nakikita noon. Para sa mga mamamahayag na gustong makita ang mga datos pang-ekonomiya na nabubuhay habang hinahanap nila ito, ang OEC ay isang napakahalagang mapagkukunan. 258. Datos ng Scorecard ng Kolehiyo Ang mas mataas na edukasyon ay isang mainit na paksa sa maraming grupo, kung saan ang mga estudyante at pamilya ay parehong gustong malaman kung paano ang mga paaralan ay tumatakbo at kung gaano kahusay ang pag-aaral ng mga estudyante. Sa pamamagitan ng datos ng College Scorecard nito, ang Kagawaran ng Edukasyon ng Estados Unidos ay nagbibigay sa mga tagapagturo at estudyante ng lahat ng impormasyong ito at higit pa. Saklaw ng mga numerong ito ang kasalukuyang datos, datos ng scorecard, at mga kita pagkatapos ng pag-aaral, at bagong impormasyon ng National Student Loan Data System. Ito ay isang mapagkukunan ng napapanahong edukasyon pagkatapos ng sekondarya na dapat tiyaking gamitin ng mga mamamahayag. 259. Set ng Datos ng Enerhiya ng Gusali ng Komersyal Bilang isang dataset na pangunahing tumatalakay sa enerhiya, ang COMBED ay awtomatikong may natatanging katangian. Idagdag pa ang katotohanan na ang data nito ay nire-renew nang maraming beses kada minuto habang nagmumula sa isang komersyal na gusali, at nagiging malinaw na ang dataset na ito ay kakaiba. Para sa mga mamamahayag, ang impormasyong ito ay lubhang kapaki-pakinabang kapag naghahanda ng isang artikulo tungkol sa pagkonsumo ng enerhiya. Ang pag-access sa data ng COMBED ay kasingdali ng pag-download at pagbubukas ng isang Excel spreadsheet. 260. Set ng Datos ng DRED Ang bahaging DRED ng DRED Database ay nangangahulugang Dutch Residential Energy Dataset. Gaya ng ipinahihiwatig ng pamagat, sinusukat at pinag-aaralan ng datos na ito kung gaano karaming enerhiya ang nakokonsumo ng isang sambahayan sa Netherlands. Ang kapaligiran, occupancy, kuryente, at pangkalahatang impormasyon tungkol sa sambahayan ay minanmanan lahat sa dataset na ito mula Hulyo 5, 2015 hanggang Disyembre 5, 2015. Ang sinumang mamamahayag na nagsasaliksik ng pagkonsumo ng enerhiya ay makikinabang sa pagtingin sa mga raw na numerong ibinigay dito. Ang mga tagubilin para sa pag-download ng datos sa CSV ay matatagpuan direkta sa website. 261. Set ng Datos ng ECO Ang ECO, na nangangahulugang Electricity Consumption and Occupancy, ay isang proyektong pinapatakbo at pinapatakbo ng Distributed Systems Group. Ang pundasyon ng proyektong ito ay ang pagsubaybay ng mga mananaliksik sa mga karga at pagtuklas ng mga okupasyon sa anim na kabahayan sa Switzerland sa loob ng 8 buwan. Nag-aalok ang site na ito ng access sa impormasyong iyon pati na rin ang mga tagubilin at link sa mga kaugnay na publikasyon. Dahil sa visually interactive dashboard ng site, hindi dapat magkaroon ng problema ang mga mamamahayag sa pagsasalin ng pananaliksik sa isang bagay na nakakaengganyo. 262. Indian Dataset para sa Ambient Water at Energy Ang IAWE, na nangangahulugang Indian Dataset for Ambient Water and Energy, ay nilikha na may layuning subaybayan ang paggamit ng enerhiya ng isang tahanan sa New Dehli gamit ang mga sukat ng kuryente mula sa mga appliances, metro ng kuryente, at circuit panel. Dahil sa mga pagkawala ng kuryente, pagkakaiba sa supply ng tubig, pagbaba ng packet, at pagbabago-bago ng boltahe, ang iAWE ay nakaranas ng mga problemang natatangi sa pagsubaybay sa paggamit ng enerhiya sa India. Ito ay isang lubhang kapaki-pakinabang na datos para sa mga mamamahayag kapag tinatalakay ang mga pattern ng paggamit ng enerhiya. 263. Kuryente sa Antas ng Kagamitang Panbahay sa UK Ang UK Domestic Appliance-Level Electricity, o UK-DALE, ay ang tawag sa isang dataset na nagmomonitor at nagtatala kung gaano karaming kuryente ang kailangan sa isang grupo ng limang kabahayan. Kada anim na segundo, sinusukat ng UK-DALE ang demand mula sa parehong pangunahing power grid pati na rin sa mga indibidwal na appliances sa bahay. Ang mga mamamahayag na interesadong makita kung paano ginagamit ng mga kabahayan sa UK ang enerhiya ay tiyak na maaaring gumamit ng UK-DALE. Maa-access ang data at mayroong isang papel na naglalarawan sa sistema na magagamit para sa pagbabasa. 264. ArcGIS Ang ArcGIS Hub ay isang plataporma na magagamit ng mga organisasyon at indibidwal upang makamit ang mga layunin sa pamamagitan ng mga inisyatibo sa buong site. Gamit ang mga template ng pahina, sunud-sunod na gabay, at mga halimbawa na maaaring tingnan, ang site na ito ay isang mahusay na mapagkukunan para sa mga ambisyosong tagasulong ng social media. Samantala, ang impormasyong makukuha sa ilalim ng tab na Open Data ay nagho-host ng daan-daang dataset sa kategoryang "Disaster" pa lamang. Nagsasaliksik man ng datos ang mga mamamahayag o nag-aambag nito, ang ArcGIS Hub ay kapaki-pakinabang sa higit sa isa na paraan. 265. Cambridge GIS Ang Cambridge GIS ay ang open data repository ng Lungsod ng Cambridge, Massachusetts. Maliban sa mga file na masyadong malaki para ma-download sa pamamagitan ng GitHub repository na ito, karamihan sa mga dataset ng lungsod ay matatagpuan sa pahinang ito. Kasama sa mga indibidwal na dataset na makukuha rito ang mga komersyal na distrito, mga easement, mga zoning district, mga resulta ng senso, mga sementeryo, at iba pang mga landmark at tampok na maaaring masukat gamit ang datos. Ang isang mamamahayag na naghahalungkat ng lokal na impormasyon ay makakahanap ng lahat ng kanilang hinahanap at higit pa sa site na ito. 266. Geo-Wiki.org Bilang isang mapagkukunan, ang Geo-Wiki ay isang site na nakatuon sa tinatawag nitong "kilusan ng agham ng mamamayan". Dito, hinihikayat ang mga mamamayan na subukan ang kanilang kakayahan sa pagsubaybay sa kapaligiran. Makikita ng mga mananaliksik ang mga pinakabagong balita sa sidebar kasama ang mga pangalan ng mga publikasyon at mga libreng dataset at software download. Kabilang sa mga tool na ginagawang accessible ng site ang mga mapa, pag-upload ng personal na data, pagpapatunay, at mga hackathon na maaaring i-download sa format na Excel at mga zip file. 267. OpenStreetMap Ang mga sipi ng datos ng OpenStreetMap ay nagmula sa proyektong OpenStreetMap, ang patuloy na online na pagtatangka na lumikha ng mapa ng mundo sa pamamagitan ng mga pag-edit at pagsisikap ng pandaigdigang komunidad ng mga gumagamit. Upang makapagsimula sa pinagmumulan ng datos na ito, ang kailangan lang gawin ng mga tagapaglathala ng nilalaman ay piliin ang kanilang gustong kontinente at pagkatapos ay hanapin ang kanilang gustong bansa pagkatapos ng puntong iyon. Walang bayad para sa pag-download ng Geofabrik GmbH na ito at ang datos ay ina-update araw-araw bilang pangkalahatang tuntunin. 268. Bukas na Datos ng HIFLD Pinapatakbo at pinapanatili ng Department of Homeland Security, HIFLD, para sa Homeland Infrastructure Foundation-Level Data, inilalagay ang geospatial data sa pampublikong domain. Ang data na ito ay ipinamamahagi para sa partikular na layunin ng pagbibigay ng suporta at impormasyon para sa mga layunin ng pananaliksik at paghahanda sa komunidad. Maaaring i-download ang data na ito sa Shapefile at CSV at maaari rin itong tingnan sa web. Para sa mga publisher, ginagawang mas biswal at nakakaengganyo ng HIFLD Open Data ang geospatial data kaysa dati. 269. Mga OpenAddress Ang OpenAddresses ay dalubhasa sa imprastraktura at pangongolekta ng mga address. Dahil sa malaking tulong ng mga pagsisikap ng komunidad, ginagamit ng site na ito ang GitHub bilang plataporma ng pagbuo nito. Dito, maaaring maglagay ang mga tao ng mga address sa mapa pagkatapos itong idagdag sa database o maaari nilang kunin ang data at simulan agad ang geocoding. Dahil bukas na ang lahat ng data at address at nangangailangan lamang ng pagpapatungkol, ang mga regular na pag-update ng data at ang potensyal para sa mga pagsulong sa geocoding ay ginagawang isang napaka-interesante na proyekto ang OpenAddresses. 270. Bukas na Datos ng LMU Ang Open Data LMU ay lubos na umaasa sa datos mula sa OpenStreetMap upang makatulong sa pagbuo ng Fast Reverse Geocoder. Ang ibig sabihin nito ay ang aplikasyon ay may kakayahang mabilis na kumuha ng lokasyon sa mapa at maghanap ng kumpletong address batay sa puntong iyon. Maaari rin itong mailapat sa mga kapitbahayan at county. Ang web page na ito ay nagho-host ng maraming link na may kaugnayan sa aplikasyon na kinabibilangan ng source code, mga dataset, at mga lookup table at resolution ng OpenStreetMap. 271. Tagapagsaliksik ng Datos sa Kapaligiran Gamit ang Environmental Data Explorer, maaaring i-download at tuklasin ng mga mamamahayag, mananaliksik, at mag-aaral ang parehong mga dataset na ginagamit ng United Nations Environment Programme kasama ang mga kaakibat nitong organisasyon at kasosyo. Maaaring paliitin ang mga paghahanap ayon sa rehiyon at gawin gamit ang alinman o lahat ng 500 filter. Bukod pa rito, kasama sa mga dataset ang mga kategorya tulad ng kalusugan, GDP, klima, emisyon, at tubig-tabang na maaaring direktang matingnan sa site sa anyo ng graph, talahanayan, o mapa. 272. Grupo ng Bangko sa Pagpapaunlad ng Aprika Ang site ng African Development Bank Group ang unang hintuan ng isang mamamahayag kapag naghahanap ng impormasyong pang-estadistika at mga tagapagpahiwatig na may kaugnayan sa kontinente ng Africa. Maaaring i-filter ng mga gumagamit na nag-i-scroll sa katalogo ng datos ang mga dataset ayon sa pinagmulan, paksa, at rehiyon. Para sa sinumang naghahanap ng mas malalim na kaalaman sa paksang pinag-uusapan, nag-aalok din ang site ng mga link sa isang kahanga-hangang listahan ng mga publikasyon na kinabibilangan ng mga pamagat tulad ng African Economic Outlook at African Statistical Yearbook. 273. Mga Karaniwang Datos ng Henomiko (GDC) Ang Genomic Data Commons ng NCI ay tahanan ng isa sa mga pinakamasusing imbakan ng datos tungkol sa kanser sa web na nakatuon sa larangan ng mga pag-aaral ng genomic ng kanser. Ang data portal ng site na ito ay nagho-host ng libu-libong kaso at sumasaklaw sa 38 uri ng sakit kasama ang 39 na proyekto at libre itong ma-access. Dahil ang mga pagsusumite ng datos ay pangunahing ginagawa ng mga institusyon at mananaliksik, ang katumpakan ng impormasyong ito ay ginagawa itong isang mapagkukunan ng datos na mainam para sa mga mamamahayag. 274. Mga Database ng PhysioBank Ang mga database ng PhysioBank ay nagbibigay ng datos na pisyolohikal sa mga indibidwal sa pamamagitan ng pampublikong domain. Ang mga database na ito ay nahahati sa dalawang mas malalaking kategorya sa waveform at clinical. Kabilang sa mga subkategorya ng waveform ay ang mga database ng image, interbeat interval, synthetic, gait and balance, ECG, at multi-parameter. Ang isang bahagi ng purong impormasyong nagmumula rito ay kinabibilangan ng datos sa data ng vital sign sa tabi ng kama, oxygen saturation, at maging sa sakit sa puso. Ang mga mamamahayag at indibidwal na nagsasaliksik tungkol sa katawan ng tao ay maaaring makahanap ng ilang impormasyon dito. 275. Database ng Saklaw ng Medicare Ang database ng Medicare Coverage, na pinapanatili ng Centers for Medicare & Medicaid Services sa pamamagitan ng Department of Health and Human Services, ay nag-aalok sa mga mananaliksik ng kumpletong access sa napakaraming impormasyon tungkol sa mga serbisyong medikal. Mayroong impormasyon tungkol sa mga malalang kondisyon, paggastos sa gamot, mga elektronikong klinikal na template, sistema ng pangongolekta ng utang, at mga grant para sa pananaliksik at demonstrasyon na maaaring basahin tungkol dito. Para sa datos na direktang kinuha mula sa pinagmulan, ito ang pinaka-masinsinan at komprehensibong site sa uri nito online. 276. Bukas na Datos ng Pagbabayad Kapag karamihan sa mga tao ay pumupunta sa doktor, kadalasan ay hindi sila umuupo upang pag-isipan kung ang kanilang pangunahing doktor ay nakikinabang sa pananalapi pagkatapos makipagtulungan sa mga tagagawa ng pangangalagang pangkalusugan. Ipinapaalam ng Open Payments sa publiko ang tungkol sa anumang pagkain, pananaliksik, mga regalo, bayarin sa pagsasalita, at mga gastos sa paglalakbay na natanggap ng doktor o ospital mula sa mga kumpanya. Ang mga mamamahayag na naghahanap ng isang seryosong kuwento ay maaaring gumamit ng data explorer upang tingnan ang impormasyon o mag-click sa tab upang direktang i-download ang data. 277. Mga Logo ng Flickr Bahagyang nakasulat ito sa pangalan, ngunit ang FlickrLogos ay tumutukoy sa isang dataset na binubuo ng mga logo ng kumpanya na kinuhanan ng litrato sa iba't ibang posisyon. Pinapanatili ng Multimedia Computing and Computer Vision Lab ng Augsburg University, ang koleksyon na ito ay orihinal na tinipon na may layuning sanayin ang mga computer na makilala ang logo at teksto. Upang manatiling updated sa anumang pag-unlad na nagawa sa programang ito na karapat-dapat sa balita, hindi makasasama na i-download ang dataset na ito at tingnan kung tungkol saan ito. 278. ImageNet Ang ImageNet ay isang database na puno ng mga larawan na inorganisa ng WordNet. May mga taunang hamon sa site na maaaring tingnan kahit na matapos magsara at nakatuon sa paglikha ng mga algorithm na kayang magsagawa ng mga tinukoy na gawain. Ang ImageNet ay tahanan din ng maraming publikasyon, sitasyon, at mga slide. Ang mga tagapaglathala ng nilalaman na nakatuon sa teknolohiya ay may lahat ng dahilan upang gamitin ang opsyong explorer upang maunawaan ang istruktura ng WordNet pati na rin ang cloud map. 279. Dataset ng Stanford Dogs Ang dataset ng Stanford Dogs ay naglalaman ng napakaraming larawan at imahe ng iba't ibang lahi ng aso. Kasama ang 120 iba't ibang lahi ng aso kasama ang mahigit 20,000 indibidwal na larawan, ang database na pinapagana ng ImageNet na ito ay nagbibigay sa mga mananaliksik ng maraming larawan na magagamit habang tinuturuan ang mga makina kung paano kilalanin ang bawat lahi ng aso. Sa site, maaaring i-click at basahin kasama ng pag-download ng dataset ang mga link sa iba't ibang publikasyon na tumatalakay sa paggamit ng mga dataset upang turuan ang mga computer tungkol sa pagkilala ng imahe. 280. Database ng SUN Ang SUN database ay ang lugar ng isang proyektong binuo para sa komunidad ng pananaliksik upang makagawa ng mga hakbang sa mga larangan tulad ng computer vision at graphics, data mining, machine learning, at neuroscience bukod sa iba pa. Ipinagmamalaki ang mahigit 131,000 na mga imahe at halos 4,000 kategorya ng mga bagay sa mga index nito, ang site na ito ay lubos na komprehensibo. Para sa mga publisher na interesado sa database na ito at kung ano ang nagawa ng mga mananaliksik habang ginagamit ito, ito ay isang mapagkukunan ng datos na sulit tuklasin. 281. Ang Oxford-IIIT Pet Dataset Ang Oxford-IIIT Pet Dataset ay isang site na nagsisilbing pandagdag sa isang papel na inilathala sa 2012 IEEE Conference on Computer Vision and Pattern Recognition at nagho-host ng orihinal na dataset na ginamit para sa mga layunin ng papel. Ang mga larawang ito ay inorganisa sa humigit-kumulang 37 kategorya ng alagang hayop upang sumabay sa 200 pang mga larawan na nauugnay sa bawat klase na kasangkot. Bukod pa rito, ang datos na ito ay maaaring direktang ma-download sa pamamagitan ng mga link sa web page. 282. Ang Set ng Datos ng Visual Genome Ang Visual Genome API ay ang huling resulta ng pagsusumikap na ginawa ng ilang mga mag-aaral at mga associate professor mula sa Stanford University. Dahil sa ilang mga papel na naisulat sa pangalan nito sa paghahangad na lumikha ng isang API na may kakayahang suriin at ilarawan ang mga imahe, matagumpay na nasagot ng programa ang mahigit isang milyong tanong habang sinusuri ang mahigit 100,000 mga imahe. Ang API na ito ay kumakatawan sa pag-unlad sa larangan ng agham pangkompyuter at mga kaugnay na larangan nito at ang dataset ay maaaring direktang ma-download sa site. 283. Mga Mukha sa YouTube Ang YouTube Faces Database ay nakatuon sa pagbuo ng solusyon sa isyu ng awtomatikong pagkilala ng mukha sa mga video. Sa kabuuan, ang dataset ay mayroong mahigit 3,000 na video na kinuha mula sa YouTube na may halos 1600 indibidwal na may average na haba na humigit-kumulang 181 frame. Sa huli, ang layunin ay lumikha ng isang algorithm na may kakayahang lumikha ng mga label na tumutukoy sa taong nasa video. Ang data kasama ang impormasyon tungkol sa mga error pati na rin ang mga paraan ng paglalarawan ay maaaring mapanood nang direkta sa site. 284. Repositoryo ng dataset ng KEEL Ang KEEL dataset repository ay naglalaman ng dataset ng Java-based open source software na idinisenyo upang tumulong sa iba't ibang uri ng pagtuklas ng datos ng kaalaman. Ang KEEL, na kilala lamang bilang Knowledge Extraction based on Evolutionary Learning, ay maaaring sanayin upang matutunan kung paano magdagdag ng mga nawawalang halaga, hybrid model, at mga istatistikal na pamamaraan para sa pagsusuri ng mga eksperimento kasama ng maraming iba pang mga gawain. Ang mga na-download na dataset pati na rin ang isang kumpletong listahan ng mga algorithm na itinatampok sa KEEL ay maaaring direktang ma-download mula sa site. 285. Lending Club Ang pag-angkin ng Lending Club sa katanyagan ay ang katayuan nito bilang isang peer-to-peer lender na nagpapahintulot sa mga nanghihiram na makatanggap ng mga pautang kahit na wala silang sapat na credit score para humiram mula sa mga tradisyunal na nagpapautang. Kasama ng mga bagong aspeto ng kung paano gumagana ang site, nagbibigay din ito ng mga istatistika na kinabibilangan ng mga highlight ng platform, impormasyon ng tinanggihang pautang, mga numero ng pagganap ng mamumuhunan, at maging isang data dictionary na naglalaman ng mga makasaysayang datos. Ang mga numerong ito ay karaniwang nagsisimula sa 2007 at maaaring ma-download sa CSV. 286. Museo ng Kasaysayang Likas Ang Natural Museum of History ay itinuturing ng marami bilang isa sa mga pinakakilalang museo sa mundo, ngunit ang digitalisasyon at ang kakayahang suriin ang katalogo nito sa pamamagitan ng open data portal ay malamang na magiging bago sa maraming tao. Dahil sa 91 dataset na kinabibilangan ng mga koleksyon ng microfossil at fossil pati na rin ang mga talaan ng index lot bukod sa iba pang mga materyales, ang datos ay bukas sa publiko at libreng i-download sa iba't ibang format. 287. Ang mga Bokabularyo ng Getty Ang site na ito ay perpekto para sa mga mamamahayag at tagapaglathala na gustong manatili sa loob ng ilang mga alituntunin sa estilo kapag naglalarawan at nagkakategorya ng ilang sining, pangalan ng artista, arkitektura, materyales, at mga pangalang heograpiko. Direktang iniuugnay ng site na ito ang mga gumagamit sa mga kontroladong database ng bokabularyo na kailangang malaman ng mga mananaliksik at katalogo upang matugunan ang mga internasyonal na pamantayan. Dito, kahit papaano, walang tatalo sa Getty Vocabularies. Ang mga dataset ay maaaring tuklasin sa pamamagitan ng teksto o SPARQL at maaaring ma-download sa pamamagitan ng site. 288. Imbestigasyon sa Istilometriya ng CLiPS (CSI) Corpus Ang CLiPS Stylometry Investigation Corpus ay malamang na hindi ang naiisip ng karamihan kapag naririnig nila ang mga salitang CSI, ngunit ang CSI corpus ay isang dataset na binubuo ng mga review ng mga estudyante at sanaysay ng mga estudyante. Bukod sa teksto mismo, ang pagkakaroon ng meta-data at impormasyong naka-embed sa dokumento ay binanggit ng site na may maraming gamit. Iniaalok at ipinamahagi sa ilalim ng lisensyang Creative Commons, ang tanging hinihingi ng corpus kapalit ng paggamit ng dataset ay isang attribution. 289. Mga Universal Dependency v2 Ang Universal Dependencies v2 ay tumutukoy sa pangalawang na-update na bersyon ng proyektong Universal Dependencies, isang pagsisikap na bumuo ng isang anotasyon ng treebank na maaaring gamitin nang pare-pareho sa iba't ibang wika. Sa na-update na bersyon, makakahanap ang mga mananaliksik ng dose-dosenang UD treebank para sa iba't ibang wika kabilang ang Afrikaans, sinaunang Griyego, Hapones, Olandes, Finnish, at Tsino bukod pa sa Ingles. Ang pinakabagong bersyon ng Universal Dependencies ay matatagpuan at mada-download malapit sa ibaba ng web page na ito. 290. Webhose Ang Webhose ay isang napakahusay na mapagkukunan ng mga dataset na direktang kinuha mula sa mga repositoryo ng site at binuksan sa publiko. Maaaring pagbukud-bukurin ng mga mananaliksik ang mga artikulo ng balita ayon sa wika, kung saan ang Arabic, Pranses, at Dutch ay ilan lamang sa mga wikang may bilang ng artikulo na mahigit 100,000. Bukod pa rito, ang mga artikulo ng balita sa Ingles ay hinati pa sa mga kategorya tulad ng libangan at palakasan upang maisama sa mga post sa review at forum. Makikinabang ang mga digital publisher at mananaliksik sa paggalugad sa mga dataset na ito. 291. Datos ng Wiki Ang Wikidata ay isang hindi gaanong nabibigyang-halagang mapagkukunan ng nilalaman at mga ideya para sa mga tagapaglathala at mananaliksik. Ayon sa pahinang ito, mayroong ilang mga paraan upang ma-access ang materyal sa mga data dumps bagaman ang paggamit ng JSON ang pinakamahigpit na inirerekomenda ng site. Magagamit at ganap na libre para sa parehong hindi pangkomersyal at komersyal na paggamit, lahat ng datos na makukuha rito ay maaaring ma-access at ma-download nang libre sa ilalim ng lisensyang Creative Commons. 292. Mga Link sa Wiki Matatagpuan nang kumportable sa loob ng balangkas ng Google Code, ang Wiki Links ay isang open source na proyekto na naglalayong magbigay sa mga indibidwal ng access sa partikular at natatanging dataset na iyon. Sa web page na ito, maaaring i-download ng mga mananaliksik ang mga teksto ng README, mga data file, at ang lisensya ng Creative Commons nang buo. Maraming dapat abangan ang mga publisher o mga indibidwal na karaniwang mahilig sa teknolohiya kapag tinitingnan ang napakalaking dataset na ito. Mag-navigate lamang sa site, i-click, at simulang i-download ang mga file. 293. Wordnet Ang WordNet ay isang leksikon sa Ingles na binubuo ng mga bahagi ng wika, pang-abay, pangngalan, pang-uri, at pandiwa na ikinakategorya sa magkakaibang grupo na ginagamit upang ipahayag ang mga partikular na ideya. Ang resulta ay isang kapaki-pakinabang na kagamitan na nag-uuri ng mga salita ayon sa kung paano ginagamit ang mga ito at kung ano ang ibig sabihin ng mga ito sa halip na kung paano ang tunog ng mga ito kapag binibigkas. Ang mga aplikasyon ng WordNet sa linggwistikong programming ay nabanggit kasama ng maraming publikasyon at istatistika na makukuha sa site. 294. Allen Brain Atlas Ang Allen Brain Atlas, na nilikha ng Allen Institute for Brain Science Resources, ay isang kagamitan para sa pag-aaral at pag-aaral nang higit pa tungkol sa utak ng tao at kung paano ito tumutugon kapag malusog ang katawan ng tao pati na rin kapag may sakit. Gamit ang atlas, maaaring matutunan ng mga mananaliksik ang tungkol sa utak ng tao at ang pag-unlad nito pati na rin ang glioblastoma at ang epekto ng kanser sa utak. Maaaring bisitahin ng mga mamamahayag na sumasaklaw sa mga paksang ito ang site na ito para sa mga dataset at impormasyon. 295. NITRC Ang NITRC, o ang Neuroimaging Informatics Tools and Resources Clearinghouse, ay kung saan maaaring pumunta ang mga mamamahayag at tagapaglathala para sa neuroimaging. Pinagsama-sama at itinataguyod bilang isang inisyatibo para sa neuroimaging na pagbabahagi ng datos, ang site na ito ay tahanan ng datos mula sa ilang mga proyekto tulad ng 1000 Connectome Project, Addiction Connectome Preprocessed Initiative, pati na rin ang mga proyektong INDI-Prospective at Retrospective. Malaya ang mga indibidwal na i-download ang datos sa pamamagitan ng website. Ang mga neuroimage na kinunan sa iba't ibang yugto ay hindi pa naging ganito ka-accessible. 296. HCP Young Adult Ang proyektong Human Connectome Project Young Adult ay isang pagpapatuloy ng patuloy na pagsisikap na lumikha ng isang tumpak na mapa ng human connectome gaya ng makikita sa karamihan ng mga normal na nasa hustong gulang. Sa dalawang yugto, 1200 malulusog na nasa hustong gulang ang na-scan sa pamamagitan ng kombinasyon ng mga pamamaraan sa resting-state fMRI at diffusion imaging. Ang mga mamamahayag at tagapaglathala na naghahanap ng impormasyon tungkol sa utak ay hindi makakahanap ng ibang site na may mas maraming datos tungkol sa human connectome sa malulusog na mga kabataan. 297. Arkibos ng Datos ng NIMH Ang NIMH Data Archive, o NDA sa madaling salita, ay hindi lamang isang independiyenteng mapagkukunan ng datos kundi isang plataporma para sa pamamahagi at pag-iimbak ng datos. Sa website na ito, mayroong datos na nakolekta sa paglipas ng maraming papel at mga proyekto sa pananaliksik pati na rin ang pagkakaloob ng mga pamamaraan at kagamitan na nagbibigay-daan sa mas mahusay na pagsusuri at kolaborasyon. Ang mga buod ng datos ay malayang makukuha at maaaring gamitin ng mga tagapagbigay ng nilalaman na nag-uulat ng mga pinakabagong balita sa agham ang impormasyong ito upang magbalita. 298. Neurodata Ang NeuroData ay nakatuon sa pagsasagawa ng pananaliksik sa natatanging ugnayan sa pagitan ng isip at utak. Dahil sa pangako ng site sa bukas na agham at pananaliksik na maaaring kopyahin, ang mga tagapagbigay ng nilalaman ay may access sa isang publikasyon at ilang mga dataset na maaaring ma-access sa pamamagitan ng pagsunod sa mga link sa web page. Ang partikular na interesante sa mga nais makita mismo ang datos ay ang pagkakaroon ng mga libreng code at mga tool sa pagsusuri na ginagawang mas madali ang paggalugad sa gawain ng NeuroData. 299. NeuroElectro Ang NeuroElectro Project ay dinisenyo na may layuning kolektahin ang iba't ibang katangiang elektropisyolohikal na nauugnay sa iba't ibang uri ng neuron at pagsasama-samahin ito sa isang database. Nilalayon ng proyektong ito na pag-aralan ang ugnayan sa pagitan ng mga neuron sa pagsisikap na pag-aralan ang mga pagkakaiba sa pagitan ng iba't ibang uri ng neuron. Ang site ay nagli-link sa mga artikulo at naglilista ng mga uri ng neuron at mga katangiang elektropisyolohiya na natuklasan sa ngayon. Maaaring umasa ang mga tagapagbigay ng nilalaman sa site na ito bilang isang mapagkukunan ng datos sa mga ugnayan ng neuron-sa-neuron. 300. Serye ng mga Pag-aaral sa Imaging na Bukas ang Pag-access Ang Open Access Series of Imaging Studies, na kilala rin ng marami bilang OASIS, ay isang proyektong idinisenyo na may layuning gawing accessible sa komunidad ng mga siyentipiko sa pangkalahatan ang mga dataset ng mga MRI sa utak. Maaaring ma-access ng mga mamamahayag at mananaliksik ang mga publikasyon na naghahambing ng datos ng MRI sa pagitan ng mga nasa hustong gulang pati na rin ang isang komprehensibong fact sheet mula sa komprehensibong papel ng OASIS na naghahambing at nagkokontrast ng mga resulta mula sa mahigit 400 paksa. Ang impormasyon at mga tool ay maaaring i-download mula sa website sa iba't ibang format. 301. OpenfMRI Para sa mga mamamahayag na gustong ma-access ang mga MRI dataset nang walang anumang abala na nauugnay sa ibang mga site, ang pokus ng OpenfMRI.org sa paggawa ng mga MRI dataset na naa-access ng publiko ay isang positibong pag-unlad. Mula mismo sa mga mananaliksik, ang site na ito ay nagho-host ng iba't ibang mga dataset tulad ng classification learning dataset, ang mixed-gambles task, at ang balloon analog risk-taking task. Ang iba't ibang uri at dami ng data ay nagbibigay-daan sa mga mananaliksik na makahanap ng mga bagong paraan ng pagtatanong sa pamamagitan ng site na ito. 302. Studyforrest Hiniram ang pangalan nito nang husto mula sa sikat na pelikulang Forrest Gump, studyforrest naglalayong maunawaan kung ano ang kaya ng utak kapag kailangan nitong gumanap sa mas mataas na antas habang nakikipaglaban sa natural ngunit pantay na kumplikadong pagpapasigla. Gayunpaman, kinikilala ng site na ang dami ng datos ng fMRI na nakolekta mula sa mga pag-aaral na ito ay may mas malawak na aplikasyon kaysa sa tila sa una. Maaaring mag-browse ang mga tagapagbigay ng nilalaman sa 19 na publikasyon na gumamit ng studyforrest datos at maaari pa ngang direktang ma-access ang datos. 303. Bukas na Database ng Kristalograpiya Gaya ng natural na inaasahan mula sa pamagat, ang Crystallography Open Database ay isang koleksyon ng 385,697 metal-organic na mineral at compound, organiko, at inorganic na istrukturang kristal maliban sa mga biopolymer. Ang mga tagapagbigay ng nilalaman na naghahangad na matuto nang higit pa tungkol sa mga istrukturang kristal ay maaaring maghanap gamit ang structural formula o magpatakbo ng isang katugmang query sa paghahanap na may opsyon na mag-browse. Mayroon ding software at data sa site na ito na ginagawang lalong mahalaga ang website na ito sa larangan ng kimika. 304. Arkibo ng Eksoplaneta ng NASA Matagal nang itinuturing na isa sa mga pangunahing mapagkukunan ng impormasyon tungkol sa kalawakan, ipinagpapatuloy ng NASA ang tradisyon nito ng pagiging isang napakahalagang mapagkukunan gamit ang archive ng Exoplanet nito. Ang site na ito ay nagho-host ng isang serye ng mga interactive na tool at software tulad ng Transit and Ephemeris Service, ang Periodogram, ang Confirmed Planets Plotting Tool, at ang kakayahang interactive na mag-upload ng mga file at maghanap ng mga talahanayan. Maaaring gamitin ng mga content provider na naghahanap ng mga natatanging insight ang data na ito upang gawin ito sa susunod na pagkakataon na magkaroon ng malaking balita ang mga exoplanet. 305. Sloan Digital Sky Survey Ang kakayahang lumikha ng mga three-dimensional na mapa ng Uniberso ay posible para sa sinuman sa tulong ng Sloan Digital Sky Survey, o SDSS. Ang mga reporter at content provider ay maaaring ma-access ang mga algorithm, imaging data, dataset, tutorial, at karagdagang pagpapaunlad ng mga visual na materyales para sa layunin ng pagtuturo sa publiko kapwa pormal at impormal. Malinaw ding tinatalakay ng site ang paggawa ng data nito na maa-access ng publiko sa pamamagitan ng balita at social media. Ito ay isang napakahalagang visual tool para sa mga content provider. 306. StatSci.org Nag-aalok ang Statsci.org ng komprehensibong listahan ng mga mapagkukunan na maaaring ma-access at magamit ng publiko depende sa kanilang partikular na pangangailangan. Kabilang sa ilan sa mga impormasyon ang Electronic Dataset Service at mga case study na tinipon ng UCLA. Kasama sa mga raw dataset, mayroon ding mga aklat-aralin na naka-link sa pahinang ito. Kabilang dito ang mga pamagat tulad ng Handbook of Small Data Sets at Case Studies in Biometry. Hindi magkakamali ang mga tagapagbigay ng nilalaman na naghahanap ng istatistikal na pagsusuri dito. 307. ERIC Ang ERIC, na kilala rin bilang Institute of Education Sciences, ay isang mapagkukunan na nagsisilbing search engine para sa sinumang naghahanap ng impormasyon sa larangan ng edukasyon. Ang paunang paghahanap ay nagbibigay pa nga ng opsyon na i-filter lamang ang impormasyong sinuri ng mga kapwa eksperto pati na rin ang mga buong teksto batay sa ERIC. Dahil sa kung gaano kadalas lumalabas sa balita ang mga badyet sa edukasyon at mga pamamaraan ng pagtuturo, ito ay isang mapagkukunan ng datos na dapat tandaan ng mga mamamahayag. 308. NTIS Itinatag ilang sandali matapos ang Ikalawang Digmaang Pandaigdig, ang NTIS (National Technical Information Service) ay itinatag na may layuning gamitin ang datos upang matulungan ang mga pederal na ahensya na gumawa ng matalinong mga desisyon batay sa datos sa pamamagitan ng paggamit ng datos. Ang ahensyang ito ay orihinal na imbakan ng datos ng gobyerno ng US sa larangan ng siyentipikong pananaliksik. Sa kasalukuyan, ang site ay nagho-host ng milyun-milyong publikasyon sa napakaraming paksa. Ang makasaysayang impormasyon lamang ang dahilan kung bakit karapat-dapat ang site na ito bilang isang mapagkukunan ng datos para sa mga mamamahayag at tagapaglathala. 309. Sertipiko ng Bukas na Datos Ang website ng ODI (Open Data Institute) ay tahanan ng tinatawag na Open Data Certificate, isang libreng tool na makukuha online na binuo para sa layuning kritikal na suriin at kilalanin ang kalidad ng bukas na datos. Mula sa pananaw ng isang publisher o isang mamamahayag, ang site ay nagho-host din ng maraming dataset sa mga paksa mula sa mga listahan ng mga grant hanggang sa mga alerto sa allergy kasama ang mga listahan na maaaring ma-download sa format na CSV. 310. Arkibo ng GitHub Ang GitHub ay isa sa mga pinakasikat at kilalang imbakan ng datos at mga archive sa Internet dahil sa kadalian ng pakikipagtulungan, kapasidad sa pag-archive, at pagiging naa-access pagdating sa coding. Kabilang man ito sa mga pagtatangkang lumikha ng mga bot na maaaring magsagawa ng ilang partikular na gawain, o pagbuo ng mga application, ang GitHub ay isang site kung saan ang mga publisher ng nilalaman at mga mamamahayag ay madaling makakahanap ng mga produktong maaaring maging karapat-dapat sa balita. Maaaring ma-access ang archive sa pamamagitan ng pagsunod sa mga tagubilin sa tutorial para sa JSON o Big Query. 311. Mga SosyoPatern Ang SocioPatterns ay isang proyektong nakatuon sa paghahanap ng mga padron sa aktibidad ng tao at dinamikong panlipunan sa pamamagitan ng datos. Gaya ng inaasahan sa malawak na nakasaad na layunin, ang impormasyon ng site ay ginamit sa mga publikasyon na tumutugon sa iba't ibang paksa mula sa pagkalat ng sakit hanggang sa mga case study sa mga pagkakaiba sa pagitan ng online at offline na mga persona ng mga indibidwal. Ang mga dataset ay maaaring tingnan, gayundin ang mga nailathalang papel na naglalaman ng impormasyong malamang na makita ng mga tagapaglathala na may kaugnayan sa isang punto o sa iba pa. 312. Mapa ng Indie Ang Indie Map ay resulta ng pagkuha ng impormasyon mula sa mahigit 2,000 sa mga pinaka-abalang site ng IndieWeb at pag-roll up ng data sa mga interactive visual form tulad ng Social Graph API, isang dataset na may mga kakayahan sa SQL query, at ang hilaw na impormasyon na na-crawl sa kabuuang 5.7 milyong web page. Ang mga digital publisher na interesado sa open source software at kung ano ang maaaring sabihin ng data na ito tungkol sa mga online community na ito ay maaaring direktang ma-access ang impormasyon mula sa website. 313. Unibersidad ng Simon Fraser Patuloy na pinapaunlad ng Simon Fraser ang katayuan nito bilang isang kagalang-galang na unibersidad sa pamamagitan ng pagkakaroon ng dataset nito tungkol sa "Mga Istatistika at Social Network ng mga Video sa YouTube". Gamit ang impormasyon mula sa isang crawler na gumamit ng API ng YouTube upang maghanap ng mga video, ang mga file ay naglalaman ng data sa milyun-milyong video at mga dataset ng impormasyon ng user. Tinutukoy ng site na ang mga pag-download ng dataset ay para lamang sa mga layuning pang-akademiko, ngunit maaaring posible na makahanap ng mga mapagkukunan at sanggunian sa pamamahayag tungkol sa proyektong ito sa pamamagitan ng site. 314. ACLED Ang ACLED, o ang Armed Conflict Location and Event Data Project, ay nag-aalok ng pampublikong datos tungkol sa protesta at karahasang pampulitika sa umuunlad na mga bansa. Kasama sa impormasyong ibinigay dito ang mga bilang ng mga nasawi, impormasyon tungkol sa mga petsa at lugar ng karahasan o protesta, mga pangalan ng mga kaugnay na grupo, at datos tungkol sa mga kaguluhan at marahas na sagupaan na naganap. Ang ACLED ay nagbibigay ng access sa mga regular na ulat, publikasyon, at mga visual pati na rin sa datos na maaaring i-download sa site. 315. Institusyon ng Impormasyong Legal ng Canada Ang Canadian Legal Information Institute, o CanLII gaya ng tawag dito sa karaniwang wika, ay isang site na nagbibigay ng libreng access sa mga estatwa at mga regulasyon nito, mga kaso mula sa mga korte ng iba't ibang hurisdiksyon kabilang ang Korte Suprema ng Canada, mga korte probinsyal at apela, at Queen's Bench, kasama ang mga desisyon mula sa iba't ibang administratibong tribunal at mga lupong nilikha ng batas. Dahil sa 301 na database ng mga kaso at mahigit 140,000 desisyon ng korte na maaaring tingnan, makikinabang ang mga mamamahayag at digital publisher na sumasaklaw sa mga legal na paksa sa pag-bookmark ng site na ito. 316. Sentro para sa Sistematikong Kapayapaan Ang Center for Systemic Peace, o CSP, ay isang organisasyon na nakatuon sa pagsusuri ng mga pandaigdigang sistema para sa layuning tugunan ang isyu ng karahasang pampulitika. Sa site na ito, ang mga mamamahayag na nagsasaliksik sa larangang ito ay magkakaroon ng access sa pagsusuri sa tunggalian sa Africa, mga trend ng tunggalian sa pandaigdigang antas bukod sa iba pa kasama ang mga buod sa tatlong pangunahing publikasyon ng organisasyon tulad ng Ikatlong Digmaang Pandaigdig at ang Global Report and Virtual Library ng CSP. 317. Proyekto ng Mga Kaugnayan ng Digmaan Ang pokus ng proyektong Correlates of War, o COW, ay ang pagtulong sa pangangalap at pamamahagi ng quantitative data tulad ng sa larangan ng internasyonal na relasyon. Bilang pagsunod sa pangako nito sa paglalapat ng mga prinsipyong siyentipiko sa datos ng internasyonal na relasyon, ginagawang malayang maa-access ng COW ang mga dataset nito sa publiko. Ang mga database na ito ay naglalaman ng mga numero sa impormasyon na maaaring gamitin ng mga mamamahayag at mananaliksik tulad ng mga militarisadong tunggalian sa pagitan ng mga estado, mga miyembro ng sistema ng estado, mga pambansang materyal na kakayahan, at mga pormal na alyansa. 318. Survey sa Lipunan ng Europa Ang European Social Survey, o ang ESS, ay isang survey na isinasagawa sa buong Europa na may layuning sukatin ang iba't ibang mga gawi, saloobin, at paniniwala ng iba't ibang populasyon sa iba't ibang bansa. Dahil ang mga mamamahayag ay kadalasang interesado sa pagkuha ng opinyon ng publiko, ang ESS Topline Series na sumasaklaw sa mga paksang mula sa personal at panlipunang kagalingan ng mga Europeo, mga saloobin tungo sa kapakanan, at maging ang pagkakaroon ng ageism sa UK, ay maaaring magpalakas ng isang kuwento sa higit sa isa na paraan. 319. Pondo para sa Kapayapaan Ang Fund for Peace ay isang organisasyon na nakatuon sa pagpigil sa tunggalian at pagtutuon sa seguridad sa pamamagitan ng pagbuo ng mga kagamitang maaaring magamit upang mapagaan ang tunggalian. Sa buong karera ng FFP, nakipagtulungan ito sa mga mamamahayag, NGO, lokal na organisasyon at kanilang mga internasyonal na katapat, pati na rin sa mga pamahalaan. Naghahanap man ng mga trend, paghahambing na pagsusuri, at pandaigdigang datos, mahahanap ng mga mamamahayag at tagapaglathala ang mga materyales na gusto nila sa pamamagitan ng tool sa paggalugad ng datos na nasa loob ng browser ng site. 320. Ang Pangkalahatang Survey sa Lipunan Ang gawain ng General Social Survey (GSS) ay nakatuon sa pangangalap ng impormasyon sa iba't ibang aspeto ng modernong lipunang Amerikano bilang isang paraan upang manatiling updated sa mga trend at padron ng pag-uugali at pag-uugali sa populasyon. Dahil sa kasanayang ito ng pagsubaybay sa trend na nagsimula pa noong 1972, ang makasaysayang datos lamang ay isang malaking tulong na para sa mga mamamahayag na gustong tuklasin ang mga trend. Gamit ang GSS Data Explorer, ang mga mananaliksik at mamamahayag ay nakakapag-download, nakakapagsuri, at nakapagsusuri pa nga ng datos. 321. Gesis Ang GESIS ay isang institusyong pang-imprastraktura sa Alemanya na nakatuon sa agham panlipunan. Nag-aalok ito ng iba't ibang agham panlipunan, kasama ang mga gawaing pananaliksik at serbisyo na mula sa metodolohiya ng survey hanggang sa applied computer science, pangongolekta ng datos, pagpaplano ng pag-aaral, at pagsusuri ng datos, ilan lamang sa mga ginagawa ng GESIS. Ang mga mamamahayag na interesado sa mga paksang tulad ng pamamaraan ng GESIS sa metodolohiya, ang paggamit ng mga imigrante na sobra sa kwalipikasyon, at marami pang iba ay makakahanap ng maraming impormasyon sa seksyon ng publikasyon. 322. Pandaigdigang Kinabukasan ng Relihiyon Mula sa mga paksang tulad ng aborsyon hanggang sa edukasyon sa sekso, ang relihiyon ay laganap, kaya't kahit sa mga bansang halos sekular, ang pananaw ng isang tao sa mahihirap na paksang panlipunan ay maaaring maimpluwensyahan ng paniniwalang pangrelihiyon. Sa Global Religious Futures, sinusuri ng Pew Research Center ang mga uso sa mga saloobin at paniniwala ng mga tao na may kaugnayan sa mga pandaigdigang relihiyon. Ang mga mamamahayag na naghahanap upang suriin ang mga detalye tulad ng impluwensya ng Ebanghelikalismo sa politika o mga saloobin tungkol sa pagbato ay maaaring gumamit ng Data Explorer upang makahanap ng mga sagot sa mga numero. 323. Indeks Para sa Pamamahala ng Panganib Ang Index for Risk Management, na kilala rin bilang INFORM, ay isang lugar kung saan maaaring puntahan ng mga mananaliksik at mamamahayag ang mga pagtatasa ng panganib sa mga sitwasyon kung saan may panganib ng isang krisis o sakuna na dulot ng humanitarian. Nag-aalok ang organisasyon ng mga link sa datos tungkol sa mga paksang tulad ng mga rate ng pagkamatay ng bata, ang index ng hindi pagkakapantay-pantay ng kasarian, at mga dalas ng tagtuyot bukod sa iba pang mga numero. Posible ring makita at i-download ang datos ng INFORM o ma-access ito sa pamamagitan ng interactive na mapa ng site. 324. INED Ang INED, o ang French Institute for Demographic Studies, ay isa sa mga pinakamaraming mapagkukunan ng datos at estadistika na mahahanap ng isang mamamahayag sa Internet. Mahigit 70 publikasyon ang sinasaliksik at inilalathala bawat taon kasabay ng populasyon ng mundo sa format na graph, gayundin ang mga estadistika na sumusukat sa mga tanong tulad ng pagkakaiba ng fertility sa pagitan ng mga kasarian, kasama na ang mga balita at mga pamamaraan ng mapagkukunan. Ang mga mananaliksik na naghahanap ng tumpak na mga natuklasan mula sa isang mapagkakatiwalaang mapagkukunan ay makakahanap ng mga ito sa INED. 325. Arkibos ng mga Internasyonal na Network Nag-aalok ang Princeton's International Networks Archive ng kakaibang kombinasyon ng mga publikasyon, kasama ang mga pananaliksik tulad ng Human Development Report 1999 at Global Networks: A Journal of Transnational Affairs na maaaring basahin sa site na ito. Sa site na ito, masusuri ng mga mamamahayag ang komprehensibong pampublikong makasaysayan at napapanahong datos ng archive. Kabilang sa mga paksang sakop dito ang pangangalagang pangkalusugan, armas, libro, musika, migrasyon, rehiyon, Internet, politika, at transportasyon. Ang mga ito ay ilan lamang sa mga materyales na maaaring basahin ng mga mananaliksik dito. 326. Programa ng Internasyonal na Survey sa Lipunan Itinatag mula pa sa simula bilang isang paraan ng kolaborasyon sa pagitan ng mga tao ng iba't ibang bansa, ang International Social Survey Programme (ISSP) ay nagsagawa ng mga survey bawat taon sa iba't ibang paksang mahalaga sa larangan ng agham panlipunan. Kabilang sa mga paksa sa paglipas ng mga taon ang hindi pagkakapantay-pantay sa lipunan, pambansang pagkakakilanlan, pagkamamamayan, mga social network, at oryentasyon sa trabaho, bukod sa iba pang mga bagay. Ang mga natuklasan ng ISSP ay maaaring hanapin ayon sa taon o ayon sa paksa at maaaring i-download nang naaayon sa website. 327. Mga Asosasyon ng Pandaigdigang Pag-aaral Bilang mga mamamahayag o iba pang mananaliksik na naghahanap ng nakapagbibigay-kaalaman at intelektuwal na talakayan tungkol sa mga isyung may kaugnayan sa mga usaping transnasyonal, internasyonal, at pandaigdigan, pinagsasama-sama ng International Studies Association (ISA) ang kadalubhasaan ng mga mananaliksik, akademiko, at eksperto sa patakaran, bukod sa iba pang mga pangalan. Nagtatampok ang Encyclopedia of International Studies ng ISA ng mga sanaysay na sinuri ng mga kapwa mananaliksik na puno ng malalimang talakayan sa mga paksang may kinalaman sa pananaliksik sa larangang ito, pati na rin ang mga sanaysay na nagbibigay ng impormasyong isinalaysay mula sa mas makasaysayang pananaw. 328. Datos na Pang-industriya sa Web Ang lubhang kapaki-pakinabang na pahina ni Propesor James W. McGuire ng Wesleyan's University, na angkop na pinamagatang Cross-National Data on the Web, ay isang pahina ng mapagkukunan na puno ng mga link sa mga kaugnay na datos sa ekonomiya at pandaigdigang pag-unlad. Kabilang sa mga dataset na matutuklasan ng mga mamamahayag dito, mayroong datos tungkol sa pagpaplano ng pamilya, tagumpay sa edukasyon, kakulangan sa nutrisyon, tubig at sanitasyon, oryentasyon sa malayang pamilihan at impormasyong partikular sa Latin America at Caribbean, ilan lamang sa mga ito ang ilan sa listahan. Ang mga mapagkukunan ng datos na nakalista rito ay walang kapintasan. 329. Sentro ng Norwegian para sa Datos ng Pananaliksik Ang Norwegian Center for Research Data ay isang institusyon na sumusuporta at tumutulong sa mga mananaliksik sa iba't ibang larangan ng pagsasagawa ng empirical na pananaliksik tulad ng privacy, pagkolekta at pagsusuri ng datos, pagsusuri ng metodolohiya, at etika sa pananaliksik. Dito, makakahanap ang mga mananaliksik ng software at mga tool na binuo at inirerekomenda ng sentro upang isama sa isang malawak na koleksyon ng rehiyonal, indibidwal, at institusyonal na datos na maaaring ma-access nang libre. Ang mga natuklasan ng sentro sa Research and Privacy Annual Report ay palaging isang kawili-wiling basahin. 330. Mga IPUM Ang IPUMS ay hindi kinakailangang isang mapagkukunan ng datos sa diwa na inaasahan ng karamihan sa mga tao kapag narinig ang terminong ito, ngunit gayunpaman, isa itong kapaki-pakinabang na mapagkukunan para sa mga mamamahayag dahil sa papel nito bilang isang aggregator, archiver, at organizer ng datos na ibinibigay dito ng ibang mga entidad. Halimbawa, ang IPUMS USA ay nagsisilbing isang uri ng imbakan ng datos para sa microdata ng senso ng US, na ang datos ay mula pa noong 1790 at mula pa hanggang sa kasalukuyan. 331. ND-GAIN Ang ND-GAIN Country Index, isang inisyatibo na inayos ng University of Notre Dame Global Adaptation Initiative, ay sumusukat sa katatagan ng isang bansa sa pagbabago ng klima at iba pang puwersa ng globalisasyon. Kabilang sa indeks na ito ang mga marka ng kahinaan sa mga larangan tulad ng pagkain, kalusugan, imprastraktura, at mga ecosystem pati na rin ang mga marka ng kahandaan para sa hanggang 500,000 data point. Naglalaman ng dalawang dekada ng datos mula noong 1995 hanggang 2014 sa anyo ng mga CSV file, ang impormasyong ito ay maaaring i-download. 332. Pulisya ng UK Sa site na ito, maaaring ma-access ng mga mamamahayag at tagapaglathala ang bukas na datos tungkol sa kalagayan ng pagpupulis at krimen sa United Kingdom. Ang datos ay naglalaman ng mga kapaki-pakinabang na istatistika sa mga pangkat ng kapitbahayan, mga indibidwal na puwersa ng pulisya, mga bilang ng paghinto at paghalughog, pati na rin ang mga istatistika sa krimen at mga kinalabasan. Gamit ang site na ito, maaaring magsagawa ng mga paghahambing ang mga mamamahayag sa pagitan ng mga puwersa ng pulisya, at matukoy ang mga trend sa hustisyang kriminal. Ang pagkuha ng impormasyon ay kasing simple ng pagpili ng saklaw ng petsa, pagpili ng puwersa ng pulisya, at pagkatapos ay paghihintay sa file. 333. Pahina ng Pangkalahatang Pandaigdigang Datos ni Paul Hensel Ang Pangkalahatang Pahina ng Datos Internasyonal ni Paul Hensel ay isang serye ng mga link na naka-grupo sa ilalim ng mga pamagat na Mga Estado at Sistemang Internasyonal, Datos Heograpikong Internasyonal, Mga Kakayahan ng Estado, Mga Koleksyon ng Datos sa Agham Panlipunan, at Mga Alyansa, Kasunduan, at Organisasyon. Ang bawat mapagkukunang nakalista sa web page na ito ay naglalaman ng makabagong datos na awtomatikong magbibigay ng kredibilidad sa gawain ng isang mamamahayag. Ang mga mapagkukunang ito ay maaaring magsama ng anumang bagay mula sa software hanggang sa mga dataset at archive, ngunit ang bawat link na kasama rito ay kapaki-pakinabang. 334. TRAC Sa mundo pagkatapos ng 911, ang terorismo at ang mapaminsalang epekto nito sa mga lokal na populasyon ay nakakuha ng maraming atensyon sa media. Ang TRAC, sa trackingterrorism.org, ay nagbibigay sa mga mananaliksik ng malawak na pagsusuri at impormasyon tungkol sa mga paksang ito. Ang site na ito ay naglalaman ng impormasyon tungkol sa ilang libong iba't ibang grupo ng terorista. Ang presyong $500 para sa isang solong gumagamit ay maaaring medyo mahal sa simula ngunit sulit ang halagang ibinayad para sa mga nagsusulat tungkol sa karahasan at digmaan laban sa terorismo. 335. Kagawaran ng Hustisya Kriminal ng Texas Interesado ka ba sa panloob na paggana ng sistema ng Hustisya Kriminal ng Texas? Gusto mo bang malaman kung sino ang kasalukuyang nasa death row? Ang Department of Criminal Justice ng Estado ng Texas ay may maraming impormasyon mula sa mga huling pahayag ng mga bilanggo bago ang pagbitay, mga istatistika ng death row ayon sa kasarian at lahi, pati na rin ang mga karagdagang istatistika at factsheet ng pagbitay. Ang Texas Department of Criminal Justice ay isang maaasahang mapagkukunan para sa mga mamamahayag hangga't maaari. 336. Pinagsamang Sistema ng mga Organisasyon ng Lipunang Sibil Ang integrated Civil Society Organizations System, o iCSO, ay dinisenyo upang mapadali ang pakikipag-ugnayan ng mga organisasyon ng lipunang sibil sa Department of Economic and Social Affairs. Bukod sa bisa ng matatag na balangkas, kasama rin sa web page ang mga dataset at kategorya para sa karagdagang impormasyon. Maaaring pagbukud-bukurin ang datos ayon sa sektor, uri ng organisasyon, rehiyong sangkot, at katayuan ng organisasyon sa ECOSOC. Ito ay isang mapagkukunan ng datos na tiyak na magagamit ng mga mamamahayag para sa paghahanap ng mga mapagkukunan. 337. Mga Unibersidad sa Buong Mundo Ang Universities Worldwide ay isang database ng mga unibersidad sa buong mundo na maaaring hanapin para sa karagdagang impormasyon. Ang paghahanap ay maaaring gawin sa pamamagitan ng world listing o i-filter nang eksklusibo sa mga unibersidad sa Estados Unidos, at maaari ring magdagdag ang mga gumagamit ng sarili nilang mga link sa proseso. Ang mga data publisher na may malaking bilang ng mga estudyante, o maging ang mga mamamahayag na naghahanap upang beripikahin ang isang katotohanan, ay maaaring makinabang sa pagkakaroon ng access sa isang database tulad nito on-demand. 338. Programa ng Datos ng Salungatan sa Uppsala Ito ang website para sa Uppsala Conflict Data Program, na isa sa mga pinakakilalang tagapagbigay ng impormasyon tungkol sa organisadong karahasan. Sa nakalipas na 40 taon ng programa, naitatag din nito ang sarili para sa trabaho nito sa pagkolekta ng datos mula sa digmaang sibil. Maaaring gamitin ng mga mamamahayag ang mapagkukunang ito ng datos upang maghanap ng impormasyon tungkol sa mga partikular na tunggalian at mga aktor sa mga tunggalian na iyon at maaari ring ma-access ang datos na ito para sa layunin ng pag-download nito. 339. Pandaigdigang Pop Ang proyektong WorldPop, ang resulta ng pagsasama ng mga proyektong AsiaPop, AfriPop, at AmeriPop, ay nakatuon sa pag-archive ng mga spatial demographic dataset na siya namang may mga aplikasyon bilang paraan ng pagbibigay ng suporta sa mga pagsisikap sa pagtulong sa sakuna. Ang mga tagapaglathala ng nilalaman at mga mamamahayag na kasangkot sa mga layunin ng hustisyang panlipunan o kung hindi man ay nagsasaliksik ng mga mahusay na pagkakataon sa pagtulong sa sakuna ay maaaring maging interesado sa proyektong ito. Maaaring i-download ng mga mananaliksik ang datos o suriin ang mga case study online. 340. Draft Express Ang DraftExpress ay marahil pinakakilala sa Internet dahil sa pananaliksik nito, mga ulat sa pre-draft scouting, mga mock draft pick, at ang masusing pagpapanatili ng taas at sukat ng manlalaro kasabay ng makasaysayang datos nito. Ang mga potensyal na manlalaro na nabanggit sa site na ito ay nagmula sa NCAA, high school, at maging sa mga internasyonal na liga. Ang mga mamamahayag sa palakasan o mga tagapagbigay ng nilalaman na nagnanais na mag-alok ng komentaryo na may kaugnayan sa basketball ay maaaring bumaling sa mga istatistika ng DraftExpress habang tinatalakay ang mga manlalaro at mga kaganapan habang nagaganap ang mga ito sa loob ng isport. 341. Betfair Ang Betfair ay marahil pinakakilala bilang site na dapat puntahan para sa mga taya sa palakasan. Gayunpaman, ang interesante sa mga nagbibigay ng nilalaman at mga digital publisher, lalo na, ay ang pagkakaroon ng detalyadong makasaysayang impormasyon tungkol sa datos ng presyo at kasaysayan ng site. Maaaring ma-access at ma-download ang datos nang mayroon o walang detalyadong time-stamp habang nag-aalok din ng malawak na datos tungkol sa karera ng kabayo at iba pang mga alok sa merkado ng site mula Hunyo ng 2004 hanggang Oktubre ng 2017. 342. CRICSHEET Nag-aalok ang Cricsheet ng katulad na serbisyo sa ilang iba pang sports data hubs, ngunit ito ay isang site na eksklusibong dalubhasa sa pagbibigay ng datos ng cricket. Nag-aalok ang site ng mga istatistika at datos ng bawat bola mula sa ilang liga kabilang ang Indian Premier League, mga one-day internationals, pati na rin ang mga numero para sa mga koponan ng kalalakihan at kababaihan, ilan lamang ito sa mas malalaking kategorya. Ang mga content publisher na naghahanap ng makasaysayang datos ng cricket ay maaaring mag-download ng datos sa CSV o XML format. 343. Datos ng Serye ng Panahon sa Iba't Ibang Bansa Taglay ang datos tungkol sa mga tunggalian sa politika, ekonomiya, lehislatura, at lokal na saklaw ng mahigit 200 taon ng datos sa mahigit 200 bansa sa buong mundo, ang Cross-National Time-Series Data Archive ay isa sa mga pinakakomprehensibong dataset sa Internet. Ang datos ay nakaimbak, sa pinakamaginhawang paraan, sa isang Google Drive sheet na awtomatikong bubukas sa pag-click sa kategorya ng file. Kapalit ng isang sitasyon, ang impormasyong ito ay maaaring tingnan nang bahagya o buo depende sa mga pangangailangan ng mananaliksik. 344. Ford GoBike Ford GoBike ang tawag sa programang bike share na ginagamit sa Bay Area. Bagama't walang alinlangang ginagamit ng maraming tao ang programang ito upang manatiling malusog at maiwasan ang paggamit ng mga fossil fuel, sinusubaybayan ng bike share system ang datos ng biyahe. Siyempre, ang impormasyong ito ay hindi kasama ang anumang maaaring magpakilala sa mga sakay ngunit ang mga detalye tulad ng numero ng bisikleta, oras ng pagsisimula, oras ng pagtatapos, uri ng sakay, at mga istasyon ng pagdating at pag-alis ay kasama sa datos. Sulit itong tuklasin. 345. Trapikong Pandagat Ang Marine Traffic ay isang kumpanyang sumusubaybay at nagbabantay sa mga galaw ng mga sasakyang-dagat at mga paglalakbay sa karagatan gamit ang malaking datos. Ang uri ng impormasyong sakop ng mga serbisyo ng AIS API ng Marine Traffic ay kinabibilangan ng mga sasakyang-dagat, impormasyon tungkol sa mga paglalayag, at datos tungkol sa mga sasakyang-dagat na pinag-uusapan tulad ng inaasahang pagdating, maging ang mga insidente, mga larawan, mga detalye ng sasakyang-dagat, at mga pagtataya sa paglalayag. Gayunpaman, may mga plano sa pagpepresyo sa site na ito kaya hindi malinaw kung gaano karaming pananaliksik ang maaaring gawin nang libre. 346. Bixi Ang mga programa ng bixi bike share ay marahil ilan sa mga pinakakilalang programa ng bike share sa ilan sa mga pinakamalalaking lungsod sa North America. Kapansin-pansin, naglalabas din ang brand ng mga bukas na datos na nagbibigay ng impormasyon tungkol sa mga bagay tulad ng kasaysayan ng biyahe at katayuan ng istasyon pati na rin ang mga paghahambing na maaaring gawin sa pagitan ng mga miyembro at paminsan-minsang gumagamit. May dahilan ang mga lokal na mamamahayag na naghahanap ng impormasyon kung paano ginagamit at iniaangkop ng mga indibidwal ang mga programa ng bike share sa kanilang buhay para suriin ang datos na ito. 347. Database ng Aksidente Mula kay Amelia Earhart hanggang sa AirAsia Flight 8501 ng Indonesia, ang mga aksidente sa paglipad at eroplano ay isang paksang nakakaakit ng atensyon ng mga tao. Ini-archive at iniimbak ng Accident Database ang datos tungkol sa mga aksidente sa abyasyon na naganap sa pagitan ng mga taong 1920 at 2017. Kasama sa mga aksidenteng binilang sa database na ito ang mga aksidente sa sasakyang panghimpapawid na sibil at militar, mga aksidenteng kinasasangkutan ng pagkamatay ng mga kilalang tao o isang taong sikat, mga aksidente sa helikopter na may 10 o higit pang pagkamatay, mga naka-iskedyul at hindi naka-iskedyul na mga paglipad ng pasahero na nagtapos sa pagkamatay. 348. Transportasyon para sa London Ang Transport for London ang ahensya ng gobyerno na responsable sa pangangasiwa ng pampublikong transportasyon sa lugar ng Greater London. May mga mapa ng tren at tren na makikita sa website kasama ang gabay sa pagpaplano ng biyahe. Bukod sa lahat ng praktikal na serbisyong ito, ang site ay nagho-host din ng maraming bukas na datos kabilang ang pagbibisikleta, kalidad ng hangin, tub, at maging ang talaba. Sinumang interesado na makita kung paano ginagamit ng mga residente ng Greater London ang pampublikong transportasyon ay maaaring makinabang sa pagkakaroon ng access sa datos na ito. 349. CMAP Ang CMAP ay responsable sa pagsasagawa ng pagpaplano at organisasyon ng rehiyon sa mga county ng DuPage, Lake, McHenry, Kendall, Kane, Cook, at Will sa Illinois. Gaya ng makikita sa website, ang mga responsibilidad ng CMAP ay umaabot sa pagtugon sa mga isyu tulad ng pagpapaunlad ng komunidad, mga buwis at mga tagapagpahiwatig ng ekonomiya, at maging sa mga kalsada at transportasyon. Kaya naman ang mga bukas na datos tungkol sa mga lugar tulad ng mga tagapagpahiwatig ng rehiyon at paglalakbay ay kapaki-pakinabang sa isang mamamahayag na nagsisikap na maunawaan ang pangkalahatang larawan kung saan nababahala ang kinabukasan ng rehiyon. 350. Balangkas ng Pagsusuri ng Kargamento Dahil sa pakikipagtulungan sa pagitan ng Bureau of Transportation Statistics at ng Federal Highway Administration, ang Freight Analysis Framework ay nangongolekta ng datos na ginagamit upang masuri ang pangkalahatang kalusugan at pagganap ng sistema ng kargamento. Nangongolekta ang software na ito ng impormasyon tungkol sa mga detalye tulad ng uri ng kalakal at tonelada kumpara sa mga istasyon ng pag-alis at pagdating at ang datos na iyon ay ginawang magagamit ng publiko upang ma-access at ma-download nang buo o sa buod na anyo. 351. Agham ng Mozilla Ang Mozilla Science ay isang open source, open practice, collaborative software na nariyan upang tumulong sa pagbuo at pamamahagi ng iba't ibang mapagkukunan ng datos at mga natuklasan sa pananaliksik. Bukod sa mga interes sa transparency, ang desisyon na magbukas ng mga programa at i-crowdsource ang proseso ng pagpipino ay ginagawang mas madali ang pagpapabuti sa mga programang naroon na. Dahil sa mga proyektong magagamit sa iba't ibang larangan kabilang ang life sciences at medisina, bukod sa iba pa, may mga solusyon sa software dito na maaaring kumakatawan sa mga balitang pag-unlad sa larangan. 352. Mga Astig na Dataset Ang pagkahumaling pagdating sa mga Cool Dataset ay madaling makikita sa pangalan ng site. Sa pahinang ito, ang mga dataset ay nabibilang sa anim na pangkalahatang kategorya sa gobyerno, libangan, agham, mga isinumite ng gumagamit, iba't ibang impormasyon, at machine learning. Ang mga mamamahayag na gustong galugarin ang datos at kumuha ng mga kuwento ang makikinabang nang husto sa pagtingin sa mga iniaalok ng website na ito. May opsyon na galugarin ang mga dataset at, kung maaari, mag-ambag din ng mga dataset. 353. Bukas na Monitor ng Datos Ang OpenDataMonitor ay isang plataporma na kumukuha ng mga pampublikong dataset at ipinapakita ang mga ito sa paraang mas madaling maunawaan at sundan ng mga indibidwal. Maaaring pumunta ang mga mananaliksik sa plataporma upang makita ang buod ng kung ano ang kaya ng mga mapagkukunan ng open data, at makikita nila ang umiiral na data na ipinakita sa kanila sa mas nakakaengganyong paraan. Ipinapaliwanag ng site ang metodolohiya at mga benchmark nito, at hindi dapat magkaroon ng problema ang mga publisher sa paghahanap ng data na sulit i-publish. 354. CrunchBase Ang CrunchBase ay marahil pinakakilala dahil sa pagbibigay-diin nito sa mga estadistika at sa pangako nitong bigyan ang mga mambabasa nito ng access sa pinakamahusay na datos na magagamit. Ang mga indibidwal na mahilig sa negosyo ay pumupunta sa site na ito araw-araw upang matuto tungkol sa mga pinakabagong uso sa pamumuhunan at industriya. Dito, makakahanap ang mga mamamahayag at publisher ng mga balita at sariwang talakayan tungkol sa mga pinakabagong uso sa negosyo. Samantala, bilang bahagi ng bayad na opsyon nito, nagho-host din ang site ng malawak na mga dataset na maaaring masuri gamit ang mga software tool ng Crunchbase. 355. Indeks Ang Index ay isang plataporma na may kakaibang bentahe dahil mayroon itong maiaalok sa lahat, kabilang ang mga startup, mamumuhunan, analyst, at mga korporasyon. Nagho-host din ang site ng impormasyon tungkol sa mahigit 100,000 kumpanya sa sektor ng teknolohiya habang sabay na nag-aalok sa mga user ng kakayahang mag-uri-uri, bumuo, at mag-export ng mga spreadsheet. Ang mga publisher at mamamahayag na naghahanap ng mga headline para sa mga potensyal na anggulo ng kuwento ay maaaring mauna sa mga balita sa negosyo sa pamamagitan ng site na ito. Maaaring hindi pangkaraniwan ang Index, ngunit walang duda na ito ay isang kapaki-pakinabang na mapagkukunan. 356. SEMRUSH Ipinagmamalaki ng SEMrush ang pagiging isa sa mga pinaka-epektibong tool sa search intelligence na magagamit ng mga online marketer. Sa pagitan ng akademya at mga webinar, may pagkakataon ang mga mananaliksik na matutunan ang mga pangunahing kaalaman. Gayunpaman, ang mga seksyon ng blog at balita ay naglalaman ng sapat na impormasyon upang ang mga publisher at mamamahayag ay madaling manatiling updated sa lahat ng pinakabagong balita sa online advertising at SEO. Ang mga serbisyo ng SEMrush ay may kapalit, ngunit maraming de-kalidad na impormasyon ang ibinibigay nila nang libre. 357. Mga Ahref Ang Ahrefs ay marahil pinakamahusay na maibubuod bilang isang suite ng mga tool sa marketing na maaaring maging kapaki-pakinabang sa sinumang naglalathala ng nilalaman online. Nag-aalok ang site ng kombinasyon ng mga serbisyo tulad ng pananaliksik sa nilalaman, pagsubaybay sa web, pananaliksik sa keyword, at pananaliksik sa backlink upang matulungan ang mga gumagamit na i-reverse engineer ang tagumpay ng mga kakumpitensya. Marahil na pinaka-kapaki-pakinabang sa mga online publisher sa pangkalahatang iskema ng mga bagay, ang Ahrefs blog lamang ay kumakatawan sa mahusay na halaga para sa mga gusto ang kanilang marketing na ginawa nang may data-based na pananaw. 358. Listahan ng mga Anghel Ang AngelList, na may matalinong pagpili ng pangalan, ay karaniwang binubuo ng dalawang bahagi: Craigslist at LinkedIn, na may diin sa pagsasama-sama ng mga mamumuhunan, naghahanap ng trabaho, at mga startup sa isang lugar. Kasama ng kawili-wiling konsepto ng site na ito, maraming pagkakataon para sa mga mamamahayag na masigasig na tuklasin ang mga pinakasikat na startup at ang mga pinakabagong trend sa pamumuhunan bago pa man ito maging mainstream. Dahil sa prangka nitong interface at matibay na oryentasyon sa negosyo, ang site na ito ay kapaki-pakinabang para sa mga propesyonal sa maraming paraan. 359. Nakuha Sa halos lahat ng sektor, ang isang pagkuha ng negosyo ay maaaring magpabago sa isang buong industriya halos sa isang iglap. Ang Acquired ay isang site na gumaganap ng tungkulin na ipaalam sa publiko kapag may nagawang pagkuha sa sektor ng teknolohiya. Puno ng mga istatistika na maaaring matingnan sa site kasama ang kakayahang mag-filter ng mga paghahanap, ang mga mamamahayag na nagsusulat tungkol sa teknolohiya ay maaaring makinabang nang husto sa paggawa sa Acquired na regular na bahagi ng kanilang pang-araw-araw na pag-browse sa web. 360. Mattermark Ang Mattermark ay isang bayad na serbisyo na nagpapadali sa buhay para sa mga gumagawa ng desisyon sa kumpanya sa pamamagitan ng paggawa ng mga de-kalidad na listahan ng mga customer na isinasaalang-alang ang parehong kumpanya at ang kanilang mga pangunahing empleyado. Nagbibigay ng komprehensibong mga profile ng kumpanya, kakayahang umangkop sa API nito, at maging ang mga kakayahan sa pag-export para sa layunin ng paggawa ng mga update, ginagawa ng Mattermark ang lahat ng makakaya. Ang mga negosyong gustong mas mahusay na i-target ang kanilang outreach habang sinusubaybayan din ang mga resulta ng kanilang mga kampanya ay maaaring makinabang nang malaki sa pag-sign up dito. 361. Mga startup ng Fintech Ang FintechStartupsCo ay nagsisilbing isang uri ng aggregator na sumusubaybay kung gaano kalaki ang nalikom ng iba't ibang kumpanya sa kanilang mga IPO. Gamit ang minimalistang disenyo na lumilipat sa pagitan ng mga tab na "startup" at "news", ito ay isang mabilis at madaling paraan para sa mga mamamahayag na manatiling updated sa mga pinakabagong balita tungkol sa pangangalap ng pondo. Samantala, ang mga publisher na naghahanap ng mabilis na nilalaman at mga maikling kwento ay makikinabang din sa muling pagtingin sa kung ano ang inaalok ng site na ito. 362. Datafox Kung sakaling hindi pa lubusang naipapakita ng pangalan, ang DataFox ay isang kumpanyang nagsisikap na bigyan ang mga kliyente nito ng impormasyong kailangan nila upang mapakinabangan nang husto ang kanilang mga CRM at makagawa ng mga desisyong nakabatay sa datos. Nag-aalok ng mga serbisyong kinabibilangan ng conference at company intelligence, mga API, at mga signal ng kumpanya, ang kumpanyang ito ay epektibong isang one-stop shop para sa mga negosyong nagpapahusay sa kanilang mga gawain sa pagbebenta at outreach. Maaaring gusto rin itong subukan ng mga digital publisher at content provider. 363. Pagbubukas Ang OpenSpending ay isang libreng plataporma, na maaaring ma-access halos kahit saan sa mundo, na nagbibigay-daan sa mga gumagamit na maghanap at suriin ang datos pinansyal sa pampublikong domain. Para sa mga miyembro ng lipunan na hindi nagha-hack, ito ay isang makapangyarihang kasangkapan para sa pag-visualize at pagsusuri. Ang mga mamamahayag, sa partikular, ay maaaring gumamit ng OpenSpending upang makahanap ng mga kawili-wiling bagong pananaw at maghanap ng mga anggulo ng kuwento gaya ng direktang iminumungkahi ng kumpanya sa kanilang site. Bilang karagdagang bonus, ang mga mamamahayag ay kabilang sa mga propesyon na partikular na hinihiling sa forum. 364. ESPN Sports API Hindi kuntento sa pagiging pinakasikat na sports channel lamang sa cable, pinalalawak ng ESPN ang impluwensya nito sa coding at mga API. Sa Developer Center, nag-aalok ang site sa mga publisher ng kanilang mga pagpipilian ng ilang API na kinabibilangan ng mga tala sa pananaliksik, mga power ranking, mga draft pick, mga kalendaryo, at mga headline. Mayroon ding API na naglo-load ng mga profile ng atleta, mga talambuhay, at mga istatistika sa lahat ng pangunahing isport. Ang mga mamamahayag na naghahandang magsulat ng isang kuwento na may nilalamang pampalakasan ay makikinabang lamang sa pag-browse sa mga ito. 365. Sanggunian sa Palakasan Para sa mga mahilig sa pagkalkula ng numero sa isports na mahilig sa kanilang mga advanced na istatistika at mapagkukunan sa iisang lugar, ang Sports Reference ay isa sa mga pinakamahusay na site sa web. Gamit ang makasaysayang datos na kinabibilangan ng mga istatistika ng koponan at manlalaro sa opensa at depensa, maaaring gamitin ng mga mananaliksik sa isports ang site na ito nang malawak o makitid. Bukod pa rito, may mga numero para sa halos bawat pangunahing isport mula sa basketball hanggang baseball at magkakahiwalay na datos para sa iba't ibang isport sa kolehiyo. 366. Set ng Datos ng Milyong Kanta Ang angkop na pinangalanang "Million Songs Collection" ay naglalaman ng buong 28 dataset na naglalaman ng metadata at impormasyon tungkol sa mga audio feature ng eksaktong isang milyong kanta. Malaking resulta ng trabaho ng LabROSA ng Columbia University kasama ang Echo Nest, ang impormasyong ito ay maa-access at mai-host sa AWS system ng Amazon. Maaaring maghanap ang mga user ng impormasyon sa pamamagitan ng Infochimps na ginagawang mas madali itong ma-access para sa mga mamamahayag na naghahanap ng mga hindi kilalang trivia pati na rin para sa mga content publisher.




