Esistono molti tipi diversi di siti che forniscono una grande quantità di dati gratuiti, freemium e a pagamento che possono aiutare gli sviluppatori di contenuti e i giornalisti nei loro sforzi di reporting e narrazione. Il team di State of Digital Publishing desidera riconoscerli, in quanto derivati da ricerche manuali e dal riconoscimento del nostro pubblico esistente.
1. Kaggle Kaggle è un sito che permette agli utenti di scoprire il machine learning scrivendo e condividendo codice basato sul cloud. Basandosi principalmente sull'entusiasmo della sua numerosa community, il sito ospita concorsi a premi in denaro con dataset e, di conseguenza, raccoglie enormi quantità di dati. Che stiate cercando dati storici della Borsa di New York, una panoramica delle tendenze nella produzione di dolciumi negli Stati Uniti o codice all'avanguardia, questo sito è ricco di informazioni. 2. Wikipedia È impossibile trascorrere molto tempo su Internet senza imbattersi in una voce di Wikipedia. Con articoli che spaziano da biografie storiche complete di fonti e riferimenti a linee temporali del prossimo e lontano futuro, si può affermare con certezza che Wikipedia ha consolidato il suo status di enciclopedia web gratuita. Tra la voce che funge da panoramica generale dell'argomento e i numerosi libri e riferimenti online offerti dal sito, Wikipedia è la migliore amica di uno scrittore sotto molti aspetti. 3. Strisciare comune Come si può intuire dal nome del sito web, Common Crawl ricerca o "esplora" il web alla ricerca di dati che poi memorizza e crea in un repository aperto a cui gli utenti possono accedere. Due esempi di ciò che è possibile fare con questo sito: i marcatori di brevetti virtuali e gli elenchi completi di siti web che offrono feed RSS forniscono un piccolo esempio della potenza di questa applicazione. Se si desidera effettuare confronti tra dati o siti, questo è uno strumento accessibile per creare informazioni originali. 4. EDRM EDRM, acronimo di Electronic Discovery Reference Model, è un sito per professionisti legali dedicato a comprendere il potenziale dell'e-discovery e le regole e le aspettative che regolano la gestione delle informazioni. Inoltre, i membri di EDRM collaborano per sviluppare standard collaborativi, software e strumenti didattici progettati per promuovere gli obiettivi della comunità. Per raccogliere informazioni su come la tecnologia può e ha cambiato gli aspetti procedurali e amministrativi della pratica legale, questo è il sito che fa per voi. 5. Conduttore Mahout si concentra su un software con lo stesso nome che cerca di comprendere la logistica per costruire un ambiente in grado di creare applicazioni di apprendimento automatico ad alte prestazioni, scalabili e rapide. Per i ricercatori che desiderano compilare e manipolare i propri set di dati o cimentarsi in applicazioni di apprendimento automatico, questo software è particolarmente utile. Questo sito aiuterà gli utenti a raggiungere una buona padronanza di questo software. 6Il progetto Lemur Il Lemur Project è un database che si concentra sul supporto alla ricerca sul recupero di informazioni e sulla gestione delle tecnologie del linguaggio umano. Con circa 1 miliardo di pagine web e 10 lingue raccolte da gennaio a febbraio 2009, l'enorme quantità di materiale presente e di supporto lo rende un'eccellente risorsa per i ricercatori. Tra tutto questo e il supporto aggiuntivo disponibile sul sito, chiunque sia interessato alla tecnologia e al linguaggio umano avrà molto da offrire su questo sito. 7Progetto Gutenberg Project Gutenberg è una directory che contiene romanzi, articoli e altre opere di pubblico dominio. La collezione di oltre 54.000 eBook del sito spazia da opere note come quelle di Shakespeare, Mark Twain e Jane Austen a opere meno note di autori meno noti come Henri Bergson e Samuel Butler. Che si tratti di leggere un classico per curiosità o di fare ricerche su come si viveva nel XIX secolo, Project Gutenberg è una risorsa eccellente. 8. Set di dati di milioni di canzoni Questo è un sito web che ospita un dataset completo contenente le caratteristiche audio e i metadati di circa 1 milione di canzoni popolari. Oltre al dataset principale di un milione di canzoni, sono disponibili anche diversi dataset che la comunità ha contribuito a creare in categorie correlate, come cover, etichette di genere e testi, tra gli altri. Storici della musica, appassionati o ricercatori che desiderano queste informazioni potranno ordinare i dati con relativa facilità. Questo potrebbe essere il dataset più completo su questo argomento disponibile su Internet. 9. Amazzonia Tutti conoscono Amazon come rivenditore digitale, ma sapevate che ospita anche set di dati pubblici gratuiti accessibili a chiunque, senza dover archiviare o scaricare nulla sui propri dispositivi? Con dati che spaziano dal meteo, all'ambiente spaziale e alle informazioni meteorologiche, fino alle immagini incentrate sullo sviluppo di algoritmi di supporto alla visione artificiale, non mancano certo le opzioni per chi desidera un modo più pratico per analizzare enormi quantità di dati. 10. Governo Aperto Canada Nell'interesse di promuovere una maggiore trasparenza, coinvolgere più cittadini e incoraggiare il dialogo, il Governo canadese offre una vasta gamma di dati nell'ambito della sua iniziativa "Governo Aperto". Su questo sito è possibile trovare set di dati su questioni governative, come i livelli di capienza dei rifugi per senzatetto in Canada, nonché dati regionali sui livelli di partecipazione di anglofoni e francofoni al settore pubblico. Grazie all'accesso a set di dati di questo tipo, non è necessario dipendere dalle statistiche altrui per reperire informazioni. 11. Cataloghi dati Data Catalogs, ora Data Portals, offre agli utenti un sito pratico per consultare i portali di dati aperti di tutto il mondo. Grazie alla valutazione e alla cura dei portali da parte di vari livelli di governo, di numerose ONG e persino della Banca Mondiale, i dati disponibili per l'analisi sono di altissima qualità. Gli utenti hanno la possibilità di consultare i portali di dati o di contribuire. Dal punto di vista della ricerca, la varietà di argomenti e informazioni rende questo sito un punto di partenza particolarmente comodo per la ricerca di informazioni. 12. Data.gov.uk Data.gov.uk è un sito che consente ai cittadini di trovare e accedere ai dati pubblicati da vari enti pubblici, dipartimenti governativi, autorità locali e agenzie governative. Qui i ricercatori possono trovare informazioni sul clima economico per le piccole imprese, il commercio, le importazioni, l'industria e le esportazioni, o persino effettuare ricerche sui pagamenti superiori a 25.000 sterline effettuati dai dipartimenti governativi. Poiché il sito afferma esplicitamente che i dati possono essere utilizzati per la ricerca, le informazioni qui contenute potrebbero persino generare ulteriori idee man mano che i ricercatori le analizzano. 13. Dati.gov Questo sito è il luogo in cui il governo degli Stati Uniti fornisce dati aperti a cui il pubblico può accedere sotto forma di set di dati. Oltre ai dati grezzi, il sito offre anche una serie di strumenti che possono essere utilizzati per creare visualizzazioni di dati e applicazioni per il web e i dispositivi mobili. Non fatevi ingannare. I dati sono immensi e spaziano dai reclami sulle carte di credito ai dati sui programmi federali di prestito studentesco, in oltre 197.000 set di dati. Questo sito offre numerose opportunità di innovazione e analisi complete. 14. DataSF DataSF offre centinaia di set di dati relativi sia alla città che alla contea di San Francisco. Vuoi scoprire cosa hanno sostenuto i lobbisti locali e regionali? Hai bisogno di statistiche sulla criminalità? Sfoglia la scheda Showcase per scoprire cosa hanno realizzato le persone con i dati o usa il modulo per dare un contributo. Realizzato con Open Data e dotato di un'accademia, un blog e numerosi altri strumenti, questo sito è guidato in gran parte dalla collaborazione e dalla comunità. Questo lo rende una risorsa per i ricercatori. 15. DataFerrett DataFerrett si differenzia da molti altri siti in quanto non è tanto un archivio o una directory, quanto piuttosto uno strumento che consente agli utenti di personalizzare i dati provenienti da fonti locali, statali e federali attraverso l'analisi e l'estrazione dei dati. Questo strumento consente agli utenti di creare fogli di calcolo personalizzati e completi e quindi di trasformare le stesse informazioni in una mappa o un grafico senza dover scaricare o abilitare altri software. Organizzare enormi quantità di dati e trasformarli in qualcosa di facile lettura non è mai stato così facile. 16. Informazioni Attraverso l'Università del Maryland, Inforum rende disponibili al pubblico i dati economici degli Stati Uniti. Molte agenzie governative statunitensi hanno contribuito a questo sito, al punto che ora contiene migliaia di "serie temporali economiche", come le chiama, che includono dati sulla produzione industriale, indici dei prezzi, statistiche sul lavoro e indicatori aziendali. I dati sono disponibili gratuitamente e accessibili sia da un computer portatile che da un desktop. I ricercatori che desiderano esaminare attentamente i dati economici grezzi trovano una risorsa in Inforum. 17. Europeana Secondo i dati forniti dal sito, le collezioni di Europeana ammontano a oltre 50 milioni di record. Utilizzando i set di dati curati, i ricercatori possono trovare le informazioni che cercano in minor tempo. I set di dati includono categorie come modelli 3D, mappe italiane della Prima Guerra Mondiale e persino una raccolta di oltre 20.000 foto storiche provenienti da musei lituani, tra gli altri. Per ricerche storiche generali o come punto di partenza per esplorare l'enorme quantità di dati di Europeana, questa è un'eccellente risorsa. 18Il Guardiano Oltre alla sua copertura ininterrotta di notizie ed eventi dell'ultima ora, il Guardian ha anche un'intera sezione dedicata ai dettagli sui dati. Gli articoli spaziano da argomenti seri come l'efficacia delle politiche abitative contro i senzatetto a temi leggermente più leggeri come quali paesi abbiano il maggior numero di premi Nobel. Giornalisti e ricercatori non hanno carenza di informazioni da utilizzare nei propri progetti su questo sito. Con l'aiuto di una rapida ricerca, è possibile trovare dati praticamente su qualsiasi cosa. 19. Espressione genica Omnibus Ospitato dal National Center for Biotechnology Information, Gene Expression Omnibus è un sito che contiene "dati pubblici di genomica funzionale" conformi agli standard MIAME (Minimum Information About a Microarray Experiment). Il sito accetta anche dati arrayizzati o sequenziati, fornendo gli strumenti necessari per reperire e scaricare le informazioni. Chiunque sia interessato a studiare i genomi o ad acquisire informazioni sull'argomento troverà qui tutti i dati di cui ha bisogno, e anche di più. 20L'Università di Chicago Da tempo riconosciuto per il suo contributo all'innovazione e al progresso nel campo delle scienze sociali, il Center for Spatial Data Science (CSDS) dell'Università di Chicago esplora la prossima frontiera con la sua incursione nell'analisi e nella tecnologia spaziale. Il lavoro del CSDS trova applicazione praticamente in qualsiasi campo che abbia a che fare con lo spazio nell'approccio alle problematiche. Di conseguenza, settori come l'economia ambientale, la sanità pubblica e la criminologia hanno tutti beneficiato di queste applicazioni. L'impegno del CSDS nel software open source e nella distribuzione delle sue informazioni rende i dati forniti ancora più accessibili. 21. Connettere Utilizzando i dati raccolti dall'Istituto di Scienze e Tecnologie Web dell'Università di Coblenza-Landau, KONECT (Koblenz Network Collection) offre ricerche svolte nel campo della scienza delle reti e di argomenti correlati. Il progetto utilizza una serie di strumenti software proprietari per l'analisi delle reti per elaborare numeri e produrre grafici e algoritmi. KONECT ospita quindi i risultati del suo lavoro analitico direttamente sul sito web. Con oltre 200 set di dati tra cui scegliere, questa è una risorsa che vale la pena esplorare. 22. Dati MI MIdata è un sito che funge da repository per i dati destinati all'apprendimento automatico. Questi set di dati possono spaziare da una raccolta di espressioni facciali umane ad argomenti più scientifici come la previsione del legame molecolare. Con voci suddivise in categorie che offrono accesso a dati grezzi, tutorial nella sezione materiali e metodi, nonché attività e sfide di apprendimento, questo sito consente ai ricercatori di analizzare il repository alla ricerca di set di dati di interesse. 23. NASDAQ Il NASDAQ è una borsa valori di fama mondiale che da tempo rappresenta un'eccellente risorsa per giornalisti e ricercatori alla ricerca di dati dal mondo della finanza e degli affari. Qui troverete informazioni su IPO, dati storici sui prezzi e ultime notizie finanziarie che rendono questo sito una destinazione online di riferimento per i dati finanziari. Il NASDAQ Composite offre anche opzioni di dati a pagamento per coloro che desiderano effettuare analisi più approfondite. Si tratta di una risorsa molto rispettata e consolidata. 24NASA Fin dall'allunaggio, ormai tutti hanno sentito parlare di questa agenzia governativa e delle sue incursioni nello spazio. Tuttavia, è interessante per i giornalisti scoprire come la NASA sia anche una preziosa fonte di dati, grazie al suo Space Science Data Coordinated Archive. Qui, i ricercatori possono trovare dati di missioni spaziali in categorie come astrofisica, risorse di immagini ed eliofisica, tra le altre. Inoltre, sul sito sono disponibili numerosi white paper da abbinare ai nuovi dati inviati. 25Socrate Socrata è un sito che raccoglie i dati governativi disponibili e li trasforma in un formato che ne facilita l'analisi, la consultazione e la ricerca delle informazioni. Progettato specificamente per le esigenze di persone non esperte in ambito tecnico, come esperti di politiche pubbliche, ricercatori, imprenditori e cittadini interessati, Socrata utilizza il cloud per raccogliere dati da diverse fonti. Per i giornalisti che cercano di comprendere l'efficacia di diverse politiche, questa è una piattaforma utile. 26Quandl Quandle è un sito che offre principalmente dati economici e finanziari formattati tenendo conto delle esigenze dei professionisti degli investimenti. Basandosi su oltre 500 fonti informative provenienti da organizzazioni autorevoli come CLS Group, l'ONU, banche centrali e Zacks, tra le altre, per aggregare i propri dati, questa fonte di dati è perfetta per ricercatori e giornalisti che desiderano avere una visione d'insieme a colpo d'occhio. Grazie al componente aggiuntivo Excel del sito, accedere direttamente ai dati non è mai stato così facile per gli utenti. 27. Università Carnegie Mellon La Carnegie Mellon University gode di una meritata reputazione di eccellenza accademica. Ciò che molti non sanno è che StatLab della Carnegie Mellon è una risorsa utile per i giornalisti alla ricerca di dati. Questo archivio di dataset include dati su argomenti come gli stipendi dei giocatori nordamericani della MLB nel 1986, oltre a dati progettati per valutare l'accuratezza dei software statistici. In cambio del riconoscimento, questi dataset sono disponibili per l'uso pubblico. 28. UCI L'UC Irvine Machine Learning Repository, noto come UCI, è un sito che archivia una grande quantità di dati interessanti che i giornalisti possono utilizzare. Al momento della stesura di questo articolo, il sito ospita 394 set di dati e offre l'ulteriore vantaggio di avere un'interfaccia di facile consultazione. Alcuni dei set di dati più popolari includono informazioni su "Riconoscimento delle attività umane tramite smartphone", vino e marketing bancario, tra gli altri argomenti. In cambio dell'utilizzo di tutti questi dati, il sito richiede semplicemente una citazione. 29. UCR Se sei un giornalista interessato allo sviluppo del machine learning, la pagina UCR Time Series Classification/Clustering sarà un'ottima lettura. Il sito fornisce un utile documento informativo che ti fornirà tutte le informazioni di base necessarie. Oltre a una panoramica del contenuto delle informazioni, il sito offre anche la possibilità di scaricare direttamente i dati. Ricordati solo di utilizzare il formato di citazione richiesto dal sito se utilizzi questi set di dati. 30. Censimento degli Stati Uniti Hai bisogno di statistiche sulla ricchezza della popolazione? Vuoi conoscere l'esatta ripartizione per genere di un determinato settore? Il censimento degli Stati Uniti è un sito che contiene tutti questi dati e molto altro ancora, accessibili al pubblico. Ordina i dati per anno o regione e troverai rapidamente le statistiche che la maggior parte delle persone ignorava fossero state inserite nel censimento degli Stati Uniti in quel modo. Questi numeri erano disponibili in Excel e Microsoft Word, il che rende i dati ancora più accessibili per i giornalisti. 31. Wolfram Alpha Wolfram Alpha è in realtà un motore di calcolo che consente agli utenti di inserire i dati che desiderano conoscere e di ricevere un calcolo. Il motore elabora dati e analisi statistiche, elabora dati chimici, date e orari, e persino parole e linguistica, tra le altre cose. Per gli utenti che cercano di scoprire nuovi modi di gestire i dati, questo è particolarmente utile perché è in grado di generare nuovi calcoli con la semplice pressione di un pulsante. I giornalisti, in particolare, possono trarre grandi vantaggi dall'utilizzarlo come risorsa supplementare. 32. Guaire A quanto pare, Yelp non si limita a ristoranti e recensioni di attività commerciali. Questo sito di recensioni gestito dagli utenti conserva anche un set di dati che consente ai ricercatori di accedere a recensioni, dati degli utenti e attività commerciali per "scopi personali, educativi e accademici". Secondo i dati dell'azienda, si tratta di 4,7 milioni di recensioni e 156.000 attività commerciali in 12 aree metropolitane incluse nel set di dati. Con questi numeri, i materiali e le tendenze che i ricercatori potrebbero potenzialmente scoprire in questi dati potrebbero rivelarsi una piacevole sorpresa. 33. Mondo dei dati Volete avere un elenco delle pagine Facebook rimosse? Che ne dite di poter ordinare i dati economici degli Stati Uniti per contea? Data World è un sito che permette di condividere, ospitare, collaborare e tenere traccia dei dati. Il sito include anche una sezione per i giornalisti che illustra i motivi per cui Data World è utile per i membri della professione, evidenziando anche le capacità di hosting di un predittore FOIA semplificato e pagine progettate per facilitare l'organizzazione. Nel complesso, si tratta di un solido mix di dati e hosting di dati. 34. Il World Factbook Gestito e gestito dalla CIA, il World Factbook fornisce informazioni sulle strutture sociali, la storia, la situazione militare ed economica di 267 paesi, insieme a mappe, bandiere e una serie di fusi orari che seguono i materiali presenti sulla mappa del mondo. Il sito offre un'analisi approfondita e completa dell'argomento, andando oltre le nozioni di base. In breve, si tratta di una fonte di dati che dovrebbe essere presente nell'arsenale di ogni giornalista. 35. HealthData.gov Gestito dal Dipartimento della Salute e dei Servizi Umani degli Stati Uniti, HealthData.gov offre al pubblico l'accesso a "dati sanitari di alto valore" nella speranza di catturare l'attenzione di imprenditori, decisori politici e ricercatori. Almeno nell'ambito dello sviluppo di prodotti e servizi, è stato possibile esaminare questi dati e ottenere risultati. I giornalisti che desiderano essere all'avanguardia nel campo dei dati sanitari o che stanno esaminando una dichiarazione rilasciata da un funzionario sanitario possono utilizzare questo sito per trovare risposte. 36. UNICEF Questo è un sito che conferisce credibilità immediata ai giornalisti che utilizzano le informazioni che offre. Le statistiche trattate dall'UNICEF includono quelle relative a questioni di salute e diritti umani come istruzione, salute materna, povertà infantile, acqua e servizi igienico-sanitari e disabilità infantile, tra le molte altre categorie di dati che vengono conservate. È utile per i ricercatori perché è aggiornato e supportato da una delle organizzazioni più note al mondo. I giornalisti non possono sbagliare citando questa fonte di dati. 37. Organizzazione Mondiale della Sanità L'Organizzazione Mondiale della Sanità è un'organizzazione internazionale che raccoglie statistiche e informazioni sulla salute in tutto il mondo. Oltre alle informazioni disponibili direttamente sulla homepage, il sito offre anche dati tramite l'Osservatorio Globale della Salute. Questi dati includono informazioni sui passi che i Paesi stanno compiendo verso l'assistenza sanitaria universale, la ricerca e lo sviluppo in ambito sanitario, tra le altre categorie. I giornalisti troveranno qui numerose informazioni su epidemie, emergenze sanitarie e copertura sanitaria da una prospettiva internazionale. 38. Dati pubblici di Google Grazie alla disponibilità dei dati pubblici di Google, i giornalisti possono chiaramente fare affidamento su Google in più di un modo. Il colosso dei motori di ricerca dispone di dati pubblici disponibili e analizzabili, con oltre 100 set di dati pubblici a suo nome. Gli argomenti trattati spaziano da argomenti estremamente seri, come gli indicatori di sviluppo mondiale e gli indicatori di sviluppo umano, fino a quelli più interessanti, come i dati sulle strade più pericolose d'Europa. Tutto ciò che un ricercatore deve fare è effettuare una ricerca e vedere cosa contengono i dati pubblici di Google. 39. Gap Minder Gap Minder offre dati su numerosi indicatori locali e nazionali, oltre a link e informazioni su tutti i fornitori di dati. Utilizzando questo sito, i ricercatori possono consultare informazioni come l'età delle donne al momento del primo matrimonio, statistiche sul consumo di alcol e cause di morte infantile. Per i giornalisti che scrivono con un taglio internazionale o che si occupano di dati comparativi, questa è un'eccellente risorsa. Si tratta comunque di una fonte di dati utile. 40. Google Trends Google Trends è uno strumento che fornisce ai ricercatori informazioni su ciò che le persone stanno cercando in questo preciso istante. I ricercatori possono confrontare i dati con le tendenze passate e utilizzare lo strumento anche per fare stime in vista, ad esempio, delle festività natalizie, per vedere cosa accadrà alle ricerche in futuro. Google Trends offre grafici, argomenti di attualità e numerose opportunità per scoprire le notizie prima che diventino ufficialmente note. 41. Google Finanza Google Finance offre un'opportunità semplice e veloce per effettuare una ricerca più approfondita su un'azienda che ha entusiasmato gli investitori. Semplici modi per filtrare gli indicatori tecnici e leggere le ultime notizie sull'azienda in un'unica finestra semplice e intuitiva che consente di ordinare le informazioni in modo ancora più dettagliato. Inoltre, è gratuito. Per i giornalisti che desiderano approfondire le finanze di un'azienda quotata, Google Finance offre un'interfaccia intuitiva per accedere a queste informazioni. Purtroppo, Google ha recentemente interrotto alcune delle funzionalità principali, come il portafoglio finanziario. Eccone alcune alternative a Google Finance. 42. DBpedia Chiunque abbia mai desiderato un modo più semplice per effettuare ricerche su Wikipedia ha motivo di essere entusiasta di DBpedia. Grazie all'impegno della comunità, questo sito si propone di rendere possibile l'esecuzione di ricerche più sofisticate sui contenuti di Wikipedia. Con la versione inglese che vanta 4,58 milioni di voci con classificazioni e categorie associate, il sito è sulla buona strada per offrire una copertura completa basata sulle informazioni di Wikipedia. I giornalisti non possono sbagliarsi con questa fonte di dati. 43. Ricerca Pew Per molti, Pew Research è al vertice per quanto riguarda sondaggi, report e dati di ricerca. Il sito copre argomenti che spaziano dalle opinioni politiche alle tendenze sociali e agli sviluppi in vari settori lavorativi. Pew Research offre anche una funzione di ricerca che semplifica ulteriormente l'accesso alle informazioni. I giornalisti che desiderano statistiche e risultati aggiornati provenienti da una fonte affidabile e autorevole non possono sbagliarsi rivolgendosi a Pew Research. 44. Broad Institute Per i giornalisti che desiderano scoprire le ultime notizie sul cancro, i dataset del Broad Institute potrebbero essere il luogo ideale per reperire informazioni. Tra questi, sono inclusi anche dati su altri argomenti come la bioinformatica e la biologia computazionale, nonché sui tumori al cervello e sulla scoperta di pattern molecolari. In breve, questo sito offre ai giornalisti un aiuto prezioso nella ricerca di dati approfonditi sul cancro, utili per elaborare articoli a partire dai dati forniti dal Broad Institute. 45. UNdata UNdata offre informazioni su diversi paesi in tutto il mondo. Questi includono dati come indicatori tecnici, indicatori sociali ed economici per ciascun paese coinvolto. Per i giornalisti che lavorano su storie di interesse umano o storie che potrebbero trarre beneficio dall'essere corroborate da statistiche e dati aggiuntivi, UNdata è la scelta ideale. L'accuratezza dei dati e la reputazione delle Nazioni Unite rendono questa fonte di dati su cui i giornalisti possono contare durante le loro ricerche. 46. Google Scholar Immaginate se, invece di scorrere i siti web, fosse possibile effettuare una ricerca che non contenesse altro che articoli sottoposti a revisione paritaria e materiali accademici. Google Scholar permette di trovare articoli di riviste, white paper e pubblicazioni dei più importanti studiosi del mondo. Come di consueto per questa azienda, Google Scholar è il più intuitivo possibile: all'utente basta inserire una parola chiave per avviare la ricerca. Cercare articoli accademici non è mai stato così semplice. 47. Reddit Conosciuto più comunemente come "la prima pagina di Internet", Reddit è uno dei siti web più popolari su Internet. Oltre a essere un indicatore accurato di ciò che accade online, il sito ha anche un subreddit, o sottoforum, dedicato ai set di dati. Gli utenti possono richiedere set di dati, pubblicare risorse e discutere sull'utilizzo dei dati tramite formati come JSON. I ricercatori traggono grandi vantaggi dall'esaminare questa fonte di dati. 48. Mercato dei dati Qlik DataMarket consente di raccogliere e gestire dati da fonti esterne. Questa piattaforma consente agli utenti di prendere in prestito dati da diversi set di dati, con la possibilità di incrociarli con i dati già in loro possesso per affinare la propria percezione di contesto. Ancora meglio, sebbene si tratti di una piattaforma a pagamento, a seconda dell'argomento, Qlik DataMarket offre anche un'opzione gratuita. I giornalisti che esplorano i dati possono farlo a loro piacimento. 49. Hubspot Hubspot è sempre stato un punto di riferimento nel mondo del marketing aziendale. Dal punto di vista della ricerca, questo è un sito che fornisce ai ricercatori informazioni dettagliate su ciò che accade nel settore e su ciò di cui si parla in questo momento nel settore del marketing, in tempo reale. I giornalisti possono utilizzare questo sito per saperne di più sulle tendenze. In questo senso, Hubspot è un'ottima risorsa per i ricercatori. 50. Ufficio di statistica giudiziaria Forse non sorprende che il Bureau of Justice conservi una miriade di statistiche. Sul sito web dell'Ufficio è possibile trovare dati su arresti, decessi di detenuti, esecuzioni capitali, statistiche sulle forze dell'ordine e censimenti delle carceri. Il sistema di giustizia penale è un argomento di costante interesse sia per il pubblico che per chi vi è coinvolto. Questo è ciò che rende le statistiche del Bureau of Justice ancora più utili per i giornalisti che conducono ricerche sul sistema di giustizia penale. 51. Rapporto uniforme sui crimini L'Uniform Crime Report è una raccolta di statistiche sui reati contro la proprietà e sui crimini violenti, raccolta dall'FBI. Sebbene le forze dell'ordine di tutti gli Stati Uniti segnalino questi dati dal 1930, i risultati sono stati pubblicati a partire dal 1958. I giornalisti che desiderano approfondire i dati sulla criminalità hanno la possibilità di accedere e utilizzare lo strumento dati UCR per esplorare le informazioni disponibili su questo sito. 52. Segnalazione uniforme dei reati L'Uniform Crime Reporting è il risultato di un programma ideato dall'Associazione Internazionale dei Capi di Polizia nel 1929. I dati raccolti dall'FBI vengono pubblicati quattro volte all'anno. Oltre alle informazioni fornite dal programma UCR, il sito include anche rapporti sulle statistiche dei crimini d'odio, sul numero di agenti delle forze dell'ordine uccisi e aggrediti (LEOKA), nonché i risultati e i numeri forniti dal National Incident-Based Reporting System. 53. NACJD Il NACJD, o National Archive of Criminal Justice Data, è un sito che estrae informazioni da set di dati come l'Uniform Crime Reports (UCR) e il National Crime Victimization Survey (NCVS), per poi archiviare e distribuire le statistiche. Progettati per essere curati, archiviati e mantenuti per la massima accessibilità, i dati sono disponibili in diverse forme, tra cui sperimentale, qualitativa e longitudinale. In definitiva, questo offre a giornalisti e altri ricercatori un altro modo per visualizzare e accedere alle statistiche sulla giustizia penale. 54. Prima banca dati First Databank è un sito che si occupa di dati sui farmaci. Il sito mira a promuovere un processo decisionale più efficiente e maggiormente basato sui dati nel settore farmaceutico. Questo consente a medici e clinici di iniziare a pensare ai farmaci in modo diverso, grazie all'uso innovativo della tecnologia di First Databank. Da un punto di vista professionale, questo sito è particolarmente utile perché i suoi dati possono aiutare i team ad adattarsi alle nuove informazioni. Come minimo, si tratta di una risorsa utile per i giornalisti che scrivono nel settore farmaceutico. 55. FDA La FDA, nota come Food and Drug Administration, è l'agenzia responsabile della tutela della salute pubblica attraverso la supervisione e l'approvazione di farmaci, prodotti alimentari, integratori, vaccini e cosmetici, tra gli altri prodotti di consumo. Come risorsa, la FDA mette a disposizione del pubblico set di dati, fornendo anche dati tecnici per chi ha familiarità con i fogli di calcolo e con l'analisi delle informazioni che provengono da tali set. Questa è sicuramente una risorsa utile per i giornalisti. 56. Base di farmaci Vi siete mai chiesti esattamente quanto paga il Paese in seguito a un'epidemia di droga? Ci sono voci di persone che consumano droghe in modo diverso rispetto al passato? Drugbase offre un database ricco di statistiche sulle tendenze e sul consumo di droghe negli Stati Uniti. Sono disponibili infografiche e pubblicazioni su argomenti come la comorbilità tra dipendenza e malattie mentali o dati sulla guida in stato di ebbrezza (non in stato di ebbrezza). Questa è una risorsa che fornisce informazioni sufficienti per individuare le tendenze e fare confronti con i dati passati. 57. UNODC L'UNODC, ovvero l'Ufficio delle Nazioni Unite contro la Droga e il Crimine, ha un sito web dedicato al perseguimento del suo obiettivo di aiutare gli Stati membri ad adottare standard più rigorosi in materia di ricerca, raccolta dati e analisi forense. Su questo sito, i ricercatori possono trovare numerose statistiche e pubblicazioni che trattano argomenti come la raccolta dati, l'analisi delle tendenze e, ove possibile, i programmi di ricerca. Una risorsa ricca di informazioni su una varietà di argomenti relativi all'analisi forense e alla scienza in materia. 58. Fatti sulla guerra alla droga Drug War Facts è un sito che offre un'ampia discussione sulla guerra alla droga e sulle conseguenze di questa politica. Include statistiche e numeri su dettagli come il confronto tra il costo del trattamento e il costo dell'affidamento alle forze dell'ordine, dati sulle stime di spesa per il controllo della droga e una serie di informazioni su quasi tutti gli argomenti relativi alla guerra alla droga. Per molti, questo è il sito più completo sul web in materia di guerra alla droga. 59. Centro nazionale per le statistiche sull'istruzione Il National Centre for Education Statistics, spesso abbreviato in NCES, è il punto di riferimento per tutte le statistiche relative all'istruzione. Questo sito contiene statistiche sullo stato dei prestiti agli studenti, proiezioni sulle tendenze dell'istruzione, oltre a set di dati e strumenti di confronto che possono essere utilizzati per analisi più approfondite. I giornalisti possono utilizzare questa risorsa per scoprire tendenze, verificare dichiarazioni pubbliche, esaminare le pubblicazioni del National Centre for Education Statistics e trovare nuovi articoli nei dati. 60. Banca Mondiale La Banca Mondiale ospita numerose statistiche e dati raccolti dal Development Data Group nel settore finanziario e macroeconomico. È possibile ordinare i dati utilizzando gli hashtag. Gli utenti possono scegliere tra una varietà di indicatori ed effettuare una selezione per paese, al fine di esaminare le diverse misure del progresso dello sviluppo. Pertanto, questa è una risorsa di cui chiunque analizzi la situazione finanziaria e/o economica dei paesi membri può trarre vantaggio. 61. Ufficio di statistica del lavoro Il Bureau of Labor Statistics è la fonte di riferimento per i giornalisti per numeri e statistiche relativi alle attuali condizioni di lavoro, a ciò che accade nel mercato del lavoro e a come i prezzi cambiano e influenzano l'economia statunitense. Con il lavoro statistico dell'agenzia che risale al 1884, non mancano dati economici che i ricercatori possono consultare. Il sito archivia le informazioni in un'interfaccia intuitiva e aggiorna costantemente i dati disponibili per la ricerca. Questa è una fonte di dati che vale la pena esplorare. 62. I numeri Le uscite di successo attirano molta attenzione da parte dei media, ma è difficile valutare l'effettivo andamento di un'azienda senza i numeri. Ecco "The Numbers". Questo sito web offre ricerche e dati per l'industria cinematografica e dell'intrattenimento. I ricercatori possono esplorare stime di fatturato, aspettative per le prossime uscite e altri dati sugli investimenti tramite il motore di ricerca basato su SQL di OpusData. The Numbers è il primo sito da visitare per i ricercatori che cercano statistiche affidabili su film e pellicole. Questo è ciò che lo rende un'eccellente risorsa. 63. Film per sempre Film Forever è un sito che i ricercatori possono visitare per reperire informazioni di mercato e dati sull'industria cinematografica nel Regno Unito. Qui gli utenti possono trovare i dati settimanali degli incassi al botteghino delle 15 principali uscite nel Regno Unito, ricerche di pubblico, report, casi di studio e l'Annuario Statistico di punta dell'organizzazione. Inoltre, il sito dispone anche di un calendario che tiene gli spettatori informati sulla data di pubblicazione delle prossime statistiche. La nicchia di mercato di Film Forever lo rende una fonte di dati particolarmente utile. 64. IFPI IFPI è un sito che si vanta di essere sempre al passo con l'industria discografica mondiale. Gli utenti troveranno report pubblicati ricchi di approfondimenti sulla musica registrata, dati di vendita nazionali e globali, nonché report sul lato commerciale dell'industria musicale che mostrano come le aziende investono nella musica. Questi report permettono agli utenti di vedere cosa sta succedendo. Questo sito manterrà i ricercatori aggiornati in tempo reale su ciò che accade nell'industria musicale. 65. Statista Statista è un motore di ricerca simile a Google, solo che invece di pagine web, il sito restituisce dati e statistiche. Con la semplice pressione di un pulsante, gli utenti possono accedere immediatamente a oltre un milione di statistiche e dati. Gli utenti troveranno infografiche, statistiche sulla Cina, l'industria alimentare, i mercati di consumo e, a pagamento, dossier e report di settore disponibili per la consultazione. Che cerchiate informazioni sull'economia, sui social media o sul Big Mac, questo è il posto giusto. 66. EPA L'EPA, acronimo di United States Environmental Protection Agency, è l'agenzia governativa responsabile della protezione delle persone e dell'ambiente attraverso l'applicazione delle leggi emanate e approvate dal Congresso. Sul sito web dell'EPA, gli utenti possono consultare una serie di set di dati su argomenti che spaziano dall'agricoltura a temi più specifici come le emissioni annuali di sostanze chimiche tossiche e i metodi di gestione dei rifiuti. Questo sito è un'ottima scelta per i giornalisti che desiderano accedere a dati ambientali grezzi. 67. Centri per il controllo e la prevenzione delle malattie Questo sito web dei Centri per il Controllo e la Prevenzione delle Malattie si definisce uno "sportello unico per i dati sulla salute pubblica ambientale". Su questo sito, i ricercatori troveranno riferimenti ed elenchi di sistemi di dati che ricevono finanziamenti nazionali, tracciando e archiviando informazioni relative a problematiche di salute pubblica ambientale. Con un'attenzione particolare ai programmi che operano a livello nazionale e l'accessibilità tramite download diretto, questa è una risorsa su cui contare per le informazioni più aggiornate e accurate sul web. 68. Centri nazionali per la salute ambientale Istituiti dalla fusione di tre agenzie precedentemente indipendenti, i National Centers for Environmental Health sono il punto di riferimento per informazioni di alta qualità sull'ambiente. Offrendo dati completi che spaziano dai dati oceanici ai dati sui ghiacciai risalenti a milioni di anni fa, se il problema riguarda l'ambiente, è probabile che questo sito web contenga informazioni al riguardo. L'impegno dell'agenzia per l'accuratezza e l'eccellenza nella gestione di uno dei più grandi archivi del suo genere lo rende inoltre uno dei pochi siti online che possiede, aggiorna e gestisce questo tipo di dati. 69. Servizio meteorologico nazionale Il Servizio Meteorologico Nazionale della National Oceanic and Atmospheric Administration fornirà ai ricercatori tutto ciò che devono sapere sul meteo. Questo sito offre ricerche di dati che includono informazioni su categorie come avvisi e previsioni, clima, previsioni geografiche e altro ancora. Inoltre, è dotato di una mappa intuitiva e facile da consultare, con schede su cui è possibile cliccare per ottenere risultati diversi. Che si tratti di esaminare cosa è successo localmente o di trovare le previsioni per una città in un altro stato, questo sito fornirà informazioni rapidamente. 70. Meraviglia sotterranea Wunderground è una risorsa che si impegna a garantire che le informazioni meteorologiche siano disponibili a tutti, in tutto il mondo, con particolare attenzione anche alle aree meno coperte. Wunderground dichiara esplicitamente di aver adottato misure per garantire un'esperienza utente eccellente su più piattaforme digitali. Ciò significa che il sito è accessibile sia da dispositivi mobili che da PC, rendendolo una risorsa ideale per i giornalisti sempre in movimento. 71. Base meteorologica Weatherbase fornisce informazioni sulle condizioni meteo attuali, medie, informazioni sul clima e condizioni di viaggio per oltre 40.000 città in tutto il mondo con l'aiuto di una semplice barra di ricerca. Utilizzate il sito associato a cui rimanda il sito per trovare ulteriori informazioni di viaggio, tra cui convertitori di valuta, coordinate e informazioni sulle contee, tra le altre curiosità. Weatherbase può anche essere utilizzato per trovare luoghi di vacanza basandosi esclusivamente sulle condizioni meteo. Buona ricerca! 72. Atlante dell'energia Pubblicato dall'Agenzia Internazionale per l'Energia, l'Atlante dell'Energia offre ai ricercatori la possibilità di osservare il mondo attraverso le statistiche energetiche. Originariamente concepito per essere una fonte di dati complementare fin dalla sua creazione, il sito vanta un bilancio energetico animato basato sul flusso di Sankey e diversi database da abbinare alle pubblicazioni consultabili sulla pagina delle statistiche dell'Agenzia Internazionale per l'Energia. I ricercatori troveranno sia questo sito che quelli correlati estremamente utili per la ricerca sulle modalità di utilizzo dell'energia da parte di paesi e città. 73. Ufficio di analisi economica Il Bureau of Economic Analysis, o BEA in breve, pubblica un'ampia gamma di informazioni utili che consentono ai ricercatori di tenere il polso dell'economia nazionale. Su questo sito, sono disponibili dati sui conti economici degli Stati Uniti, tra cui dati sulla spesa dei consumatori, sul PIL e sulle immobilizzazioni, tra gli altri dati utili. I ricercatori possono effettuare ricerche per regione o settore, nonché per livello, con opzioni di ricerca internazionali, nazionali e regionali. Visitate la pagina dei dati interattivi per saperne di più sul Bureau. 74. Ufficio nazionale di ricerca economica Il sito web del National Bureau of Economic Research, o NBER, è una fonte di dati che affronta l'economia da un punto di vista analitico. Ospita dati su un'ampia gamma di argomenti economici, con voci come l'Indice di Governance Africana, il Ciclo Economico Ufficiale, gli Indici Sperimentali Coincidente, Leading e Recession, e il Macro History Database. L'NBER dispone di set di dati ufficiali pubblicati e compilati a proprio nome, nonché di indici compilati da altri editori. 75. Commissione per i titoli e gli scambi degli Stati Uniti La Securities and Exchange Commission degli Stati Uniti è un'agenzia che funge da organo di controllo per promuovere la trasparenza, l'equità e l'efficienza nei mercati. È interessante notare che il sito contiene un set di dati sui bilanci finanziari da gennaio 2009 a ottobre 2017, con aggiornamenti trimestrali. I ricercatori possono contare su questo sito per rimanere aggiornati sulle ultime notizie relative alle dichiarazioni e alle informazioni che può fornire sulle aziende e sullo stato delle loro finanze. 76. FMI Il Fondo Monetario Internazionale, noto anche come FMI, è un'organizzazione consolidata nel settore economico e finanziario internazionale. Sul sito web, i ricercatori possono trovare una vasta gamma di dati su questi argomenti. Gli utenti possono cercare i set di dati per indicatore e paese e consultare grafici e mappe durante le ricerche. Tra i set di dati più popolari figurano, tra gli altri, dati sulla direzione degli scambi commerciali, prezzi delle materie prime primarie, indicatori di solidità finanziaria, sondaggi e statistiche sulla finanza internazionale. 77. L'Atlante – Harvard Originariamente concepito da Harvard, l'Atlante è uno strumento online che permette di visualizzare e interagire con la situazione commerciale di un'azienda. Atlas raccoglie le informazioni e propone diversi prodotti che il Paese potrebbe potenzialmente realizzare per migliorare la propria economia. Questo strumento è utilizzato da politici, imprenditori, investitori e cittadini interessati a comprendere meglio il clima economico di un determinato Paese. Le questioni commerciali e le economie nazionali non sono mai state così accessibili. 78. Fare affari Doing Business è il risultato di uno sforzo volto a effettuare valutazioni oggettive delle normative aziendali. Il sito esamina quasi 200 economie e numerose città, misurando dettagli quali indicatori economici e classificando la facilità di fare impresa. Il sito consente agli utenti di esaminare gli effetti di vari tipi di normative aziendali tra paesi e ospita report, nonché ampi dati qualitativi. Inoltre, il sito consente anche di effettuare confronti nel tempo. 79. Comtrade Originariamente un progetto del Dipartimento per le Imprese, l'Energia e la Strategia Industriale del Regno Unito in collaborazione con il Dipartimento per il Commercio Internazionale, Comtrade è un'eccellente risorsa. Prendendo in prestito i dati dai Comtrade Data delle Nazioni Unite, il sito fornisce agli utenti un grafico interattivo che può essere utilizzato per cercare, confrontare e analizzare i numeri esatti del commercio e delle merci tra i paesi. Basta selezionare il paese segnalante, scegliere un paese partner ed effettuare il maggior numero di selezioni possibile. 80. Dati finanziari globali Global Financial Data è una fonte che non si limita a raccogliere dati finanziari standard, ma raccoglie anche informazioni finanziarie dal 1200 a oggi. Queste informazioni provengono da una varietà di fonti, tra cui libri, materiali d'archivio, riviste accademiche e periodici di informazione. Inoltre, il sito contiene set di dati che utilizzano il metodo statistico del collegamento a catena. Il risultato finale, dal punto di vista dell'utente, è una risorsa unica nel suo genere su Internet, grazie ai suoi dati esclusivi. 81. Visualizzare l'economia Visualizing Economics non è tanto una risorsa nel senso stretto del termine, quanto piuttosto un servizio incentrato sulla progettazione di grafici informativi e dashboard interattive. Inoltre, Visualizing Economics si occupa anche di analisi e progettazione con l'obiettivo specifico di rendere i dati economici più facili da comprendere. Attraverso questo sito, i giornalisti hanno la legittima opportunità di collaborare con un professionista con anni di esperienza nella traduzione dei dati economici in contenuti più accessibili al grande pubblico. 82. Portale europeo dei dati aperti Il Portale Open Data dell'UE è un progetto nato a seguito di una decisione della Commissione Europea. Su questo sito, le istituzioni dell'UE offrono dati per la consultazione e l'utilizzo pubblici, senza restrizioni di copyright e disponibili gratuitamente. I set di dati includono i dati di riferimento CORDIS, il registro per la trasparenza e persino un elenco completo delle persone, entità e gruppi contro cui l'UE ha emesso sanzioni finanziarie. Inoltre, i dati sono disponibili in diversi formati digitali. 83. Dati aperti Rete L'Open Data Network è un sito che consente agli utenti di ricercare dati per regione e città. Grazie a una homepage chiara e intuitiva, i ricercatori possono effettuare ricerche per categoria di dati, città e persino per domande campione. In ogni pagina, dopo aver esaminato le categorie di dati o le domande campione, sono presenti comodi link ad altri set di dati. L'organizzazione dei dati rende l'Open Data Network un sito che vale la pena esplorare. 84. Matrice terrestre Landmatrix è un sito che offre un database online per le transazioni immobiliari con l'obiettivo di promuovere una maggiore trasparenza nelle acquisizioni. In sostanza, questo strumento può essere utilizzato per visualizzare e comprendere le diverse transazioni immobiliari. I dati sono in continuo miglioramento, modifica e adattamento per migliorare l'accuratezza delle informazioni rese disponibili. Ad oggi, Landmatrix contiene informazioni su oltre 1.000 transazioni. È una fonte che vale la pena esplorare per i ricercatori. 85. Programma delle Nazioni Unite per lo sviluppo Il Programma delle Nazioni Unite per lo Sviluppo ospita numerosi dati utili sullo sviluppo umano in tutto il mondo, accessibili al pubblico. Con date che in molti di questi set di dati vanno generalmente dal 1990 al 2015, gli indici includono tabelle complete, come quelle relative alle tendenze dell'indice di sviluppo umano, dell'indice di disuguaglianza di genere e del divario di genere nel corso della vita. I ricercatori possono cercare i dati direttamente tramite la barra di ricerca e anche per paese, se intendono consultare il grafico. 86. OCED L'OCSE, nota come Organizzazione per la Cooperazione e lo Sviluppo Economico, ha un sito web dedicato ad assistere i governi nelle iniziative di lotta alla povertà e di prosperità attraverso la stabilità e la crescita economica. Su questo sito, i ricercatori troveranno materiali sottoposti a revisione paritaria, pubblicazioni, nonché standard e argomentazioni a favore della definizione di standard. L'OCSE ospita anche un factbook che fornisce un solido strumento di riferimento economico, da affiancare a una serie di indagini e previsioni sulle prospettive economiche disponibili sulle sue pagine. 87. Dipartimento della Salute e dei Servizi Umani degli Stati Uniti Il Dipartimento della Salute e dei Servizi Umani degli Stati Uniti gestisce un sito che fornisce informazioni sul Consiglio Presidenziale per il Fitness, lo Sport e la Nutrizione. I dati e i dati sono stati raccolti con l'assistenza di diversi esperti in settori correlati, come chef e atleti. Inoltre, il sito contiene anche una serie di statistiche. I ricercatori possono trovare informazioni sull'attività fisica dei bambini, sulle abitudini di rafforzamento muscolare degli adulti, nonché informazioni sulle abitudini alimentari del pubblico, sull'obesità e su numerosi altri dati e statistiche. 88. Partner nell'accesso alle informazioni per il personale sanitario pubblico Partners in Information Access for the Public Health Workforce è un progetto nato dalla collaborazione di organizzazioni sanitarie pubbliche, agenzie governative statunitensi e biblioteche specializzate in scienze della salute. Le pagine tematiche di questo sito includono argomenti come sovvenzioni e finanziamenti, promozione della salute ed educazione sanitaria, letteratura e linee guida. Nella sezione "Argomenti sulla salute pubblica", sono disponibili anche dati su argomenti come il bioterrorismo, la genomica della salute pubblica e la salute pubblica odontoiatrica, solo per citarne alcuni. 89. Fondazione per la Salute Unita Negli ultimi trent'anni, la United Health Foundation ha fornito informazioni sulle classifiche sanitarie da utilizzare come strumento di misurazione della salute pubblica. Il sito ospita numerosi report e pubblicazioni, tra cui report sulla salute di coloro che hanno prestato servizio, report di dirigenti, sulla salute di donne e bambini, relazioni annuali e persino note su argomenti importanti per il settore. Utilizzate la mappa interattiva per esplorare le aree geografiche e ottenere maggiori informazioni. È disponibile anche una barra di ricerca per una navigazione più approfondita se i ricercatori cercano informazioni più specifiche. 90. Medicare Negli Stati Uniti, Medicare è il principale strumento a cui molte persone fanno affidamento per l'assicurazione sanitaria e l'accesso alle cure mediche. Oltre ai servizi offerti in tempo reale, Medicare offre anche dati sugli standard e sulla qualità delle cure tra strutture e ospedali tramite la sua tabella di confronto e le sue regole. Si tratta del set di dati ufficiale utilizzato dal sito web Hospital Compare ed è ricco di dati che possono essere scaricati in Excel per una maggiore facilità di accesso. 91. Sorveglianza, epidemiologia e risultati finali (SEER) Surveillance, Epidemiology and End Results, noto anche come SEER, ha un sito particolarmente utile come fonte di informazioni statistiche sul cancro. Ospita riepiloghi statistici che consentono di effettuare ricerche sui numeri associati al cancro, ordinati in base alla sede del tumore, all'etnia, alla razza, all'età, al sesso e persino al tipo di dati. Il sito ospita anche pubblicazioni, set di dati e software che possono essere utilizzati dai ricercatori per analisi ancora più approfondite. 92. Amnesty International Amnesty International è un'organizzazione che da tempo si batte per i diritti umani e la giustizia in tutto il mondo. Ospita inoltre numerosi dati sullo stato dei diritti umani nel mondo, nonché informazioni su specifiche atrocità e crimini contro l'umanità in diversi periodi, come parte del suo rapporto annuale. I ricercatori possono utilizzare queste informazioni per effettuare confronti tra anni diversi e per osservare come i diversi paesi si siano evoluti o regrediti nel campo dei diritti umani. 93. Gruppo di analisi dei dati sui diritti umani Fin dalla sua fondazione, 25 anni fa, l'Human Rights Data Analysis Group ha applicato principi scientifici alle violazioni dei diritti umani in diversi paesi del mondo. Il sito ospita pubblicazioni pubblicate su autorevoli organi di stampa come il Washington Post e pubblicazioni ufficiali della casa editrice Macmillan, ordinate per anno. Oltre alle pubblicazioni organizzate risalenti ad anni fa, sono stati realizzati anche progetti in tutto il mondo. Per un approfondimento più tecnico sulle violazioni dei diritti umani, questa è un'ottima ricerca. 94. Dati sulle relazioni internazionali e sui diritti umani Questo sito ospita database compilati da numerose organizzazioni, università e persino agenzie governative di buona reputazione. Tra questi, il Manifesto Project, il Minorities (at Risk) Project, il Comparative Welfare States District e l'Armed Conflict Database. Alcuni progetti, come il Polity IV Project, risalgono al XIX secolo. Progetti come lo Stockholm International Peace Research Institute (SIPRI) misurano invece i trasferimenti di armi, la spesa militare internazionale e le tendenze in materia di sicurezza. Il modo migliore per comprendere i dati è visitare il sito ed esplorarlo. 95. Programma di dati sui conflitti di Uppsala Il Dipartimento di Ricerca sulla Pace e i Conflitti di Uppsala, spesso indicato come UCDP, ospita un enorme database chiamato UCDP Conflict Encyclopedia. Si tratta di un sito che consente agli utenti di consultare ed esplorare i dati già disaggregati dal dipartimento. I ricercatori possono essere consultati tramite il sito web e anche scaricati per ulteriori elaborazioni e analisi. Si tratta di una risorsa affidabile e consultabile per informazioni di qualità distribuite in modo accessibile. 96. Dipartimento del Lavoro degli Stati Uniti Il Dipartimento del Lavoro degli Stati Uniti ospita numerosi dati economici relativi a statistiche su disoccupazione e occupazione. Naturalmente, questi dati includono database che includono statistiche sui licenziamenti di massa, proiezioni sull'occupazione, posizioni vacanti e turnover sul posto di lavoro, statistiche nazionali sull'occupazione e persino statistiche di confronto internazionale sul lavoro. Il sito fornisce informazioni aggiornate e accurate, mentre il Dipartimento del Lavoro ne tiene traccia. Si tratta di una risorsa affidabile con il sostegno del governo per scopi di ricerca. 97. Amministrazione per le piccole imprese La Small Business Administration è da tempo una risorsa consolidata per imprenditori e aspiranti imprenditori. Questo sito ospita una miriade di statistiche sull'occupazione, oltre a informazioni che consentono ai ricercatori di condurre ricerche di mercato e analisi della concorrenza. Qui i ricercatori possono trovare numeri, statistiche e strumenti che possono essere utilizzati per reperire dati aggiuntivi. Per informazioni sulle statistiche delle piccole imprese dal punto di vista dei datori di lavoro e delle aziende, questa è un'eccellente risorsa a cui i giornalisti possono rivolgersi in qualsiasi momento. 98. Crowdpac Crowdpac è una piattaforma che permette ai candidati politici di raccogliere fondi e organizzarsi. Partendo dal presupposto che a ogni elezione ci siano diversi candidati al Congresso che sostanzialmente non incontrano opposizione, questo sito permette ai cittadini coinvolti di organizzare il proprio sostegno. Con articoli che trattano questioni politiche rilevanti come il gerrymandering, oltre ad argomenti aggiuntivi come i diritti civili e la sicurezza nazionale, questo sito rappresenta un'eccellente opportunità per comprendere e scoprire cosa sta succedendo nella scena politica di base. 99. Gallup Questo sito ospita i famosi sondaggi Gallup. Gallup è specializzata in analisi che consentono ai decisori aziendali di risolvere i problemi attraverso un approccio basato sui dati. Inoltre, lo strumento suggerito da Gallup è spesso utile per orientare le soluzioni. Questa è una fonte riconosciuta come il gold standard in materia di dati e analisi avanzate. Basta navigare sul sito per esplorare report su tutto, dallo stato del posto di lavoro a livello globale alla discussione sulla produttività negli Stati Uniti. 100. Biblioteca di Berkeley La Berkeley Library ospita sul suo sito una raccolta completa di statistiche e dati per la ricerca in Scienze Politiche. In questa pagina, i ricercatori troveranno numerosi link che offrono ai ricercatori l'accesso a numerosi set di dati, nonché la possibilità di crearne di propri. Tra questi, Historical Statistics of the United States (HSUS), Millennial Edition, Data Planet, ProQuest Statistical Insight e Inter-university Consortium for Political and Social Research. Ci sono diverse ore di dati da esaminare. 101. Servizi statali RAND Per chi non lo sapesse, la RAND Corporation è un'organizzazione specializzata nella ricerca sulle sfide delle politiche pubbliche. Con clienti e un portfolio che abbraccia tutti i livelli di governo, la società è una fonte di ricerca di qualità a supporto del processo decisionale. La filiale statunitense della società ospita un database di statistiche sul suo sito web. Qui i ricercatori possono trovare informazioni su istruzione K-12, sanità, economia ed economia, tra le altre categorie che affrontano questioni rilevanti per il bene pubblico. 102. Centro Roper per la ricerca sull'opinione pubblica Gestito e gestito dalla Cornell University, il Roper Center for Public Opinion Research è specializzato nella raccolta, distribuzione e conservazione di dati sull'opinione pubblica. Come esempio del tipo di informazioni che il Roper Center può scoprire, i ricercatori possono accedere ai dati delle elezioni statunitensi e a un link a un archivio di oltre 23.000 set di dati. Che i giornalisti cerchino le reazioni del pubblico alla politica o a un recente allarme sanitario, questo sito è quasi certamente in grado di fornire informazioni. 103. Governo dei trasporti Realizzato e gestito dal Bureau of Transportation, questo sito contiene dati che coprono un'ampia gamma di argomenti relativi ai trasporti. Le risorse presenti sul sito includono report su energia, sicurezza dei passeggeri, prestazioni del sistema, economia dei trasporti, infrastrutture e trasporto merci. Gli utenti possono anche ordinare e accedere ai dati offerti su questo sito per posizione geografica e area geografica. Questo sito consente ai ricercatori di scoprire tutto ciò che potrebbero aspettarsi di sapere su argomenti relativi ai trasporti. 104. Commercio di viaggi Travel Trade è un sito che ospita dati relativi alle partenze di cittadini statunitensi dal 1996 al 2016, al momento della stesura di questo articolo. L'obiettivo dichiarato di questa risorsa è aiutare il pubblico interessato a comprendere e analizzare il funzionamento del turismo globale e internazionale nel corso degli anni. Disponibile sia per il download che per la consultazione online, si tratta di informazioni accessibili. I ricercatori possono facilmente utilizzare questi dati per individuare tendenze ed effettuare confronti. 105. Skift Skift è un sito che si concentra sulla fornitura di informazioni e dati al settore dei viaggi. Tra le altre fonti di dati, l'azienda ospita ricerche, conferenze e newsletter informative tra cui abbonati e ricercatori possono scegliere. Skift esamina argomenti che gli operatori del settore dei viaggi vorrebbero conoscere, come le destinazioni in cui le persone viaggiano sempre di più, l'identificazione di nuovi mercati e molte altre informazioni sulla tecnologia di viaggio che i ricercatori hanno la possibilità di esplorare. 106. Geoba.se Geoba.se è il sito perfetto per chi desidera conoscere i fatti, nient'altro, su una città o un luogo. Utilizzando il motore di ricerca presente nella homepage, bastano pochi semplici tasti per trovare coordinate, informazioni di viaggio, meteo e persino filmati di webcam locali. Il sito ospita anche una pagina che fornisce informazioni sulle classifiche mondiali, che possono essere ristrette per regione e paese. In breve, questa è una risorsa che fornisce dati e statistiche puri. 107. Viaggi negli Stati Uniti US Travel ospita un sito gestito e mantenuto dal Dipartimento di Stato degli Stati Uniti. La missione dichiarata del sito è quella di proteggere la vita dei cittadini statunitensi che si recano all'estero. Pertanto, questa fonte ospita statistiche, informazioni e report su argomenti come passaporti statunitensi, visti statunitensi, adozioni internazionali, decessi all'estero e rapimenti internazionali di minori da parte di genitori. Le informazioni possono essere utilizzate durante la pianificazione dei viaggi, ma possono anche essere utilizzate per identificare tendenze a lungo termine, con statistiche che coprono il periodo dal 1996 al 2016. 108. Servizio dati del Regno Unito Finanziata dall'Economic and Social Research Council, la raccolta di dati del UK Data Service pubblica un'ampia gamma di dati. Questo sito contiene informazioni che spaziano dai dati aziendali alle indagini transnazionali, alle indagini sponsorizzate dal governo del Regno Unito e persino ai dati del censimento del Regno Unito. Fondamentalmente, il sito web è stato progettato tenendo conto delle esigenze di studenti e ricercatori. Inoltre, sono disponibili guide, risorse e materiali didattici che aiuteranno i ricercatori a comprendere e utilizzare rapidamente gli strumenti presenti sul sito. 109. Data.gov.au Gestito e pubblicato dal governo australiano, Data.gov.au offre facile accesso e ricerca di dati aperti. Questo sito sottolinea esplicitamente che i dati governativi possono essere utilizzati per sviluppare strumenti e applicazioni che a loro volta possono essere utilizzati a beneficio degli australiani. Non solo viene fornito l'accesso ai set di dati aperti, ma sono disponibili anche dati inediti accessibili a pagamento. Per i ricercatori che desiderano eseguire un'analisi ancora più approfondita, il sito offre anche un Data Toolkit. 110. Cinguettio Tutti conoscono Twitter per le sue conversazioni frenetiche, i messaggi brevi e il suo status nella cultura popolare come hub per le ultime notizie. Ciò che molti non sanno, tuttavia, è che Twitter offre anche strumenti per sviluppatori che semplificano il filtraggio e la ricerca di informazioni. Questi strumenti consentono persino ai ricercatori di visualizzare le tendenze e filtrare per area geografica. Che si tratti di leggere gli hashtag di tendenza o di esplorare gli strumenti per sviluppatori, Twitter è una risorsa che i giornalisti utilizzano da tempo. 111. Instagram Instagram non serve solo a mettere "mi piace" a foto di gattini e adorabili foto di bambini. O almeno, non dovrebbe esserlo. L'app offre una serie di strumenti di sviluppo sorprendentemente sofisticati che semplificano la comprensione e la ricerca sul pubblico. Inoltre, gli hashtag e gli indizi rivelati dalle foto pubblicate dalle persone, così come dalle persone che vengono taggate, possono essere una vera e propria miniera di informazioni. Instagram è un modo utile per scoprire le tendenze in diversi settori. 112. Quattro quadrati Per il tipo di ricerca in cui la posizione geografica è importante, Four Square è una fonte di dati utile grazie al suo enorme database e a tutte le informazioni che raccoglie. In superficie, offre una guida della città che fornisce agli utenti consigli sulla forza della comunità. Four Square offre anche strumenti per sviluppatori che consentono l'accesso a informazioni aggiuntive tramite il database dei luoghi. I giornalisti possono utilizzarlo per saperne di più su luoghi specifici e sulle persone che utilizzano l'app. 113. New York Times Considerato da molti un membro stimato del Quarto Potere, sono pochissimi i giornalisti che non abbiano mai sentito parlare del New York Times. Ciò che spesso viene trascurato, tuttavia, è l'utilizzo del New York Times come fonte di dati attraverso la sua API. I ricercatori possono trovare articoli risalenti al 1851 per mese, cercare articoli e persino trovare recensioni di libri. Questa API consente la ricerca in base a visualizzazioni, condivisioni ed email e persino di trovare e accedere ai commenti. 114. AP L'Associated Press occupa un posto fisso nella cultura popolare come fonte di notizie tempestive e accurate. Grazie ai suoi strumenti di sviluppo, è anche un'utile fonte di dati per i giornalisti. Al momento in cui scrivo, i ricercatori possono utilizzare questi strumenti per creare il proprio editing mentre scaricano immagini e video. Il livello di contenuto sembra dipendere dal tipo di piano utilizzato dai ricercatori, ma l'API dell'Associated Press consente comunque agli utenti di portare il processo di ricerca a un livello superiore. 115. Cinque trentotto I giornalisti potrebbero già conoscere Nate Silver, Five Thirty Eight e il suo modello statistico, grazie alle sue previsioni a volte inaspettate ma solitamente corrette. Five Thirty Eight ha un GitHub che ospita set di dati e codice utilizzato nel corso della storia del sito. I set di dati presentano argomenti divertenti come i dati sui cattivi conducenti, gli Avengers e il sondaggio sul galateo in volo. Allo stesso tempo, ci sono anche file che affrontano questioni leggermente più serie come la sicurezza aerea e i crimini d'odio. 116. IMDb IMDb è considerato da molti il sito più completo sul web per quanto riguarda il cinema e l'industria della recitazione. Se sta per uscire un film e qualcuno vuole sapere chi recita o conoscere la reazione generale del pubblico, è probabile che a un certo punto della sua ricerca finisca su questo sito. IMDb ospita anche una serie di set di dati che vengono aggiornati quotidianamente e sono disponibili per uso commerciale e non commerciale. 117. KAPSARC KAPSARC è un portale dati che ospita un totale di 923 set di dati con informazioni specifiche sui dati energetici. Questi set sono suddivisi in alcuni temi generali relativi all'uso dell'energia, all'approvvigionamento energetico e ad altri fattori rilevanti come politiche, dati demografici, ambiente, commercio, acqua e informazioni economiche. Per i ricercatori interessati all'energia e al suo utilizzo in diversi settori industriali e industriali, KAPSARC è una delle fonti di dati energetici più complete sul web. 118. Macro delle risorse Asset Marco è un sito che fornisce dati finanziari storici e indicatori macroeconomici. Questi dati coprono oltre 75.000 azioni, valute, materie prime e obbligazioni di tutto il mondo. Inoltre, il sito offre oltre 120.000 indicatori macroeconomici che gli utenti possono utilizzare per esplorare i dati finanziari di diversi paesi. Oltre a tutti questi dati sui mercati finanziari, il sito discute anche di strategie di investimento. Questa fonte è davvero unica per l'enorme quantità di informazioni che vi si possono trovare. 119. Servizi Web del governo degli Stati Uniti e fonti di dati XML I servizi web e le fonti di dati XML del governo statunitense sono ospitati su un sito chiamato USGovXML.com. Qui, gli utenti possono consultare le diverse fonti di dati XML e i servizi web forniti dal governo statunitense. Questo semplice atto di conservazione mantiene tali fonti web trasparenti e accessibili al pubblico. Per i ricercatori che monitorano regolarmente questo indice, è possibile trovare informazioni utili nei dati nel caso in cui si verifichi un'improvvisa modifica ai dati XML. 120. Figshare Figshare è un sito che ospita oltre 5.000 contenuti scientifici disponibili per la ricerca accademica e la citazione. Oltre alle informazioni presenti, il sito è progettato per offrire ai ricercatori un unico luogo in cui compilare, caricare, archiviare e gestire le ricerche che trovano. Matematica, scienze della salute, ingegneria, chimica, scienze biologiche e scienze sociali sono tutte elencate come categorie in evidenza. Questo sito è un'ottima risorsa per i giornalisti alla ricerca di ulteriori risorse accademiche da citare. 121. Dati collegati LinkedData è un sito dedicato all'idea di trovare nuovi modi per collegare dati Internet che prima non lo erano. Qui, gli utenti troveranno tutorial, guide e set di dati che daranno il via alla storia. I set di dati si concentrano tutti sul tema del coinvolgimento nella comunità dei dati collegati e, oltre alla lista della spesa per i dati collegati, la maggior parte è classificata come URI dereferenziabili, con o senza il formato RDF complementare. Per saperne di più su questa comunità, questo sito è una visita obbligata. 122. Il minatore del Web Web Miner è il luogo ideale per i ricercatori che desiderano raccogliere tutti i dati generici che riescono a reperire con il programma. Questo sito ospita database di esempio come ristoranti statunitensi, codici SWIFT di banche di tutto il mondo, stazioni di servizio statunitensi, attrazioni turistiche americane e app di Google Play, tra gli altri elenchi più ampi. Se non altro, è un sito che renderà più facile e veloce per i giornalisti setacciare e scoprire enormi quantità di dati in tempi notevolmente ridotti. 123. Hub dati Data Hub si vanta di essere un luogo in cui gli utenti possono trovare e pubblicare dati nel modo più rapido ed efficiente possibile. Il sito ospita diversi set di dati. L'indice dei prezzi delle case (Case-Shiller), il prezzo mensile dell'oro e le tendenze attuali dell'anidride carbonica atmosferica sono i tre più popolari. Oltre ai dati, il sito ospita anche una serie di tutorial che gli utenti possono consultare per saperne di più sulla navigazione tra i vari tipi di dati disponibili. 124. Enigma pubblico Sul suo sito, Enigma Public si definisce "la più ampia raccolta di dati pubblici" disponibile sul web. I set di dati rientrano in una delle quattro grandi categorie: FOIA, Essentials, Newsworthy e Under the Radar. Alcuni dei dati presenti su questo sito includono gli stipendi dei dipendenti della Casa Bianca e le licenze federali attive per armi da fuoco. Dopo aver creato un account gratuito, gli utenti possono accedere a qualsiasi categoria di dati disponibile per la consultazione. 125. Yahoo La maggior parte degli utenti web ha familiarità con il nome Yahoo per via di Yahoo! News e Yahoo! Finance, tra le numerose proprietà online dell'azienda. Di interesse per ricercatori e giornalisti è il fatto che Yahoo ospita anche un vasto numero di set di dati, tra cui Yahoo! Music User Ratings of Songs with Artist, Album, and Genre Meta Information, v. 1.0 e Yahoo! Movies User Ratings and Descriptive Content Information, v. 1.0, per citarne due. I giornalisti alla ricerca di nuove statistiche non possono sbagliarsi con questa fonte. 126. 1000 Genomi 1000 Genomes ospita un progetto con lo stesso nome, attivo dal 2008 al 2015. Lo scopo del progetto era quello di individuare ogni variazione genetica presente in almeno l'1% delle popolazioni studiate. Oltre alle pubblicazioni derivanti da questo progetto, sono stati raccolti anche enormi set di dati che includevano database separati di cellule varianti, file di sequenze grezze e disponibilità di campioni. Questi dati possono essere consultati o scaricati. 127. CBOE CBOE è una borsa futures che si concentra principalmente sui futures sulla volatilità. In particolare, il sito offre numerosi materiali sui futures presenti nel suo indice di volatilità brevettato. Il sito ospita dati di mercato di ogni tipo, inclusi dati storici, statistiche di mercato giornaliere e prezzi di regolamento giornalieri dei futures VX. Per i giornalisti alla ricerca di dati di mercato di qualità, CBOE è un sito in grado di fornire tali informazioni in un formato facile da seguire e comprendere. 128. Federazione Russa di St. Louis La Federal Reserve Bank di St. Louis è uno dei centri finanziari più importanti della regione, se non il più importante. Sul sito web, i ricercatori possono consultare direttamente documenti di lavoro, dati economici, pubblicazioni e servizi informativi. In altre parole, non mancano informazioni sul pensiero attuale e passato della Fed di St. Louis in termini di politica monetaria, nonché la possibilità di valutare l'efficacia della Federal Reserve Bank di St. Louis. Per i giornalisti economici, finanziari e di economia, questa è una risorsa di prim'ordine. 129. OANDA OANDA è una popolare piattaforma di trading azionario online, che opera principalmente con CFD e Forex. Oltre alle numerose funzionalità aggiunte al sito con l'intento di attrarre trader online, OANDA ospita anche numerosi dati storici sui tassi di cambio e informazioni storiche sul convertitore di valuta. Oltre a tutti questi dati, il sito offre anche informazioni sulle strategie di investimento, oltre a notizie e analisi di mercato. Per accedere alla maggior parte di questi dati non è nemmeno necessario un account. 130. ABS L'Australian Bureau of Statistics, o ABS, non diversamente dalla sua controparte americana, offre dati oggettivi, informazioni economiche e ricerche su un'ampia gamma di argomenti rilevanti per il Paese. Direttamente sul sito, i ricercatori possono consultare dati statistici su indicatori aziendali, assistenza sanitaria, edilizia abitativa, finanza, commercio internazionale, edilizia abitativa, salute mentale, nonché indici dei prezzi e inflazione. I giornalisti possono effettuare ricerche per trovare sondaggi e informazioni più datati, ordinando le informazioni anche per regione. 131. Database di Londra Originariamente concepito e gestito dalla Greater London Authority, il London Database rappresenta il tentativo di Londra di rendere i dati di Londra più accessibili al pubblico. L'obiettivo finale è quello di dare accesso a queste informazioni a tutti, incoraggiandoli a utilizzarle gratuitamente come desiderano. Su questo sito web, gli utenti possono cercare dati per argomenti come Arte e Cultura, Criminalità e Sicurezza della Comunità, Istruzione e Salute. I giornalisti interessati a questo tipo di dati possono ora ottenerli direttamente dall'amministrazione locale. 132. Statistiche NZ Il governo della Nuova Zelanda ospita su questo sito una grande quantità di statistiche e dati che i ricercatori possono approfondire e analizzare. Queste informazioni possono essere vagliate utilizzando la barra di ricerca in alto, filtrando per località e regione, nonché per argomento. Alcuni degli argomenti includono indicatori economici, salute, reddito e lavoro, settori industriali, ambiente e imprese. Tra le ulteriori fonti di notizie e i comunicati stampa che evidenziano vari risultati e statistiche, i giornalisti potranno scoprire ogni sorta di statistica specifica per la Nuova Zelanda attraverso questo sito. 133. Ufficio di meteorologia del governo australiano Gestito e amministrato in ultima analisi dal Governo australiano, il sito web dell'Australian Bureau of Meterology fornisce informazioni meteorologiche relative alle varie città e regioni del Paese. Secondo il sito, questa agenzia è stata istituita per aiutare gli australiani ad affrontare il clima circostante attraverso una combinazione di allerte e consigli. Qui i ricercatori potranno trovare previsioni stagionali, riserve idriche, precipitazioni, variabilità climatica e previsioni stagionali del flusso dei corsi d'acqua. Su questo sito troverete una copertura accurata e affidabile sul meteo australiano. 134. GroupLens Questo sito è disponibile sul web per gentile concessione di GroupLens del Dipartimento di Informatica e Ingegneria dell'Università del Minnesota. Il sito offre pubblicazioni e set di dati per scopi di ricerca. In totale sono disponibili circa sei set di dati. Tra i set citati, ce ne sono alcuni intitolati Book-Crossing, MovieLens e HetRec 2011. In breve, si tratta di una risorsa utile per i giornalisti che desiderano comprendere meglio come utilizzare i dati forniti. 135. KD Nuggets KD Nuggets è un sito che si concentra principalmente sulla fornitura di informazioni su data science, business analytics, machine learning e data mining. Una pagina del sito contiene un elenco completo dei set di dati che gli utenti possono utilizzare per approfondire l'argomento del data mining e dei big data, con link a set di dati come Bioassay Data, Asset Marco, DataMarket, Casualty Workbench, Data Ferrett e Datamob. Questa è una risorsa fantastica per i giornalisti che preferiscono avere tutte le informazioni in un'unica pagina. 137. Microsoft Chiunque abbia utilizzato un PC o un laptop ha probabilmente sentito parlare di Microsoft, almeno di sfuggita. È interessante notare che, oltre a PC, laptop e software, Microsoft ospita anche numerose ricerche e pubblicazioni. Tra queste, innovazioni come l'impegno dell'azienda nella creazione di macchine alfabetizzate e la scienza dei dati basata sul cloud. Sono disponibili anche informazioni aggiuntive sugli strumenti che Microsoft sta sviluppando, come Visual Studio Code Tools, e sugli sviluppi nell'intelligenza artificiale che rappresentano. 138. RDataMining Esattamente come suggerisce il nome, R Datamining è una risorsa su R e il data mining. Il sito offre numerosi esempi e documenti che offrono una prospettiva approfondita sul data mining e sul data mining con R. Inoltre, sono presenti link a corsi di formazione come il corso breve offerto dall'Università di Canberra. Questo include link a set di dati e presentazioni gratuiti, nonché set di dati che coprono argomenti come dati di aerei, compagnie aeree e rotte, nonché link a siti come GeoDa. 139. Ricerca collaborativa in neuroscienze computazionali – Condivisione dei dati Collaborative Research in Computational Neuroscience, noto anche come CRCN, dispone di numerosi set di dati accessibili tramite il proprio sito. I set di dati sono categorizzati in base alle varie parti del cervello, come la corteccia visiva, l'ippocampo, la corteccia motoria, la corteccia aviaria, i movimenti oculari e l'aplysia, solo per fare alcuni esempi. Queste cartelle includono anche sfide, strumenti, simulazioni e metodi. La possibilità di condividere questi dati li rende una risorsa ancora migliore da utilizzare per la ricerca. 140. Archivio della Protein Data Bank Secondo il suo sito web, l'archivio della Protein Data Bank è una risorsa di primaria importanza per gli acidi nucleici, le strutture 3D delle proteine e gli assemblaggi complessi fin dal 1971. Creato con l'esplicita missione di mantenere queste informazioni di pubblico dominio, i ricercatori possono accedere a questo sito per visualizzare report di convalida e dizionari di dati online. Sono inoltre disponibili statistiche sull'aumento dei dati e sull'utilizzo per l'ordinamento e l'analisi basati sul web, nonché per il download. Ma soprattutto, il sito aggiunge costantemente nuove informazioni. 141. Il progetto PubChem PubChem, come progetto ufficiale, è stato progettato per informare il pubblico sulle capacità delle piccole molecole dal punto di vista biologico. Il sito è collegato a tre database: PubChem Compound, PubChem Substance e PubChem BioAssay. Inoltre, il sito consente di ricercare le somiglianze tra diverse proteine. Per i ricercatori che desiderano portare l'analisi dei dati a un livello superiore, il sito offre anche coding e suggerimenti gratuiti. 142. Coremine Medical Coremine Medical è una risorsa inestimabile per chiunque cerchi informazioni su biologia, salute e medicina. Ora che la funzionalità di text mining biomedico di PubGene è stata implementata nella sua forma attuale, Coremine è anche una delle fonti di informazioni biomediche più flessibili in circolazione. Questo sito mostrerà collegamenti tra concetti e idee in un formato visivamente accattivante e di facile comprensione, che altrimenti potrebbe passare inosservato. È senza dubbio una delle fonti di dati biomedici più complete a disposizione dei giornalisti. 143. Il tuo tempo Tu Tiempo è un'incredibile fonte di dati meteorologici e climatici per ogni paese del mondo. Utilizzando questa risorsa, è facile trovare medie annuali, mensili e giornaliere per praticamente ogni città e regione del mondo. Inoltre, gli utenti possono anche effettuare ricerche in un database di oltre 115 milioni di record pieni di dati storici, consultabili da chiunque. A seconda della regione in cui si effettua la ricerca, è possibile trovare dati che risalgono fino al 1929. 144. Risorse di rete complesse Questo sito fornisce accesso a una notevole quantità di dati utilizzati per la prima volta nei suoi esperimenti al computer. L'elenco completo dei set di dati che elencano le tipologie di dati, tra cui grafici di notizie, grafici biologici, grafici di citazioni, grafici di collaborazione, grafici ingegnerizzati e grafici semantici. La pagina contiene anche link a un elenco di fonti che contengono numerose informazioni, come il set di dati che ha esaminato circa 3 milioni di brevetti statunitensi. La pagina vanta anche un'impressionante raccolta di set di dati di reti complesse. 145. Scopus Scopus è uno strumento che consente di trovare rapidamente e facilmente citazioni accademiche e di ricerca. Il sito offre un database incredibilmente ampio di ricerche svolte in tutto il mondo in diversi campi, tra cui medicina, tecnologia, scienze sociali, arti e discipline umanistiche. Utilizza Scopus per reperire fonti accademiche che potrebbero essere state trascurate. Dopotutto, in molti ambienti, la qualità di una fonte accademica può essere quasi importante quanto le informazioni che fornisce. 146. Stanford La reputazione di Stanford come prestigiosa istituzione accademica non è nata dal nulla. L'eccellenza si riflette nei suoi corsi di programmazione. Il sito ospita anche una serie di set di dati che includono dettagli come le informazioni sui social network. Ci sono set di dati incentrati sulle cerchie social di Facebook, sulle richieste di amministrazione di Wikipedia, sulle cerchie social di Twitter e su Google+. Anche le reti di comunicazione e l'Amazon Product Network dispongono di propri set di dati. 147. Università degli Studi di Milano Il Dipartimento di Scienze dell'Informazione dell'Università degli Studi di Milano gestisce e gestisce un sito web noto come Laboratorio di Algoritmi Web. Questo sito ospita numerosi set di dati che possono essere esplorati. Tra questi, grafici relativi ai social network, grafici di Facebook, snapshot del progetto DELIS e un breve elenco di dati vari. Le informazioni disponibili qui possono essere consultate online e scaricate, rendendolo uno dei set di dati più accessibili del suo genere sul web. 148. Archivio dati della rete UCI L'UCI Network Data Repository è un sito dedicato all'approccio scientifico allo studio delle reti. Nella pagina delle risorse, i ricercatori troveranno link a directory di dataset selezionati da organizzazioni e gruppi di ricerca, nonché da singoli individui. Contiene anche una raccolta di dataset tipicamente utilizzati per l'analisi dei social media. Chi desidera approfondire i dati sarà lieto di scoprire che questi set sono disponibili anche per il download. 149. CAIDA CAIDA, o Center for Applied Internet Data Analysis, raccoglie un'ampia gamma di dati da diverse sedi, spesso con l'assistenza di diverse organizzazioni e individui. Su questo sito sono ospitati set di dati come AS Relationships, DDOS Attacks, Telescope e i relativi dati correlati, oltre ad altri dati. Le categorie includono traffico, topologia, sicurezza, riepilogo dei worm e statistiche di riepilogo del traffico. I set di dati potrebbero richiedere l'accesso tramite richiesta, ma molti, se non la maggior parte, sono pubblici. 150. Gambero Crawdad, o Community Resource for Archiving Wireless Data At Dartmouth, è unico perché si concentra sulla fornitura di dati wireless a ricercatori e altri soggetti interessati all'argomento. Il sito offre numerosi strumenti e l'accesso a numerosi set di dati. Tra i set elencati ci sono quelli relativi a uso didattico, caratterizzazione degli errori di bit, diagnosi di rete, connettività opportunistica, elaborazione basata sulla posizione e altro ancora. I ricercatori apprezzeranno questa risorsa man mano che la approfondiranno. 151. Amministrazione per le informazioni sull'energia degli Stati Uniti Spesso definita EIA, la US Energy Information Administration fornisce al pubblico dati annuali sulle aziende elettriche. Le informazioni contenute in questi dati includono, tra le altre opzioni, le scorte di combustibili fossili, il consumo di carburante, informazioni mensili e annuali sulla produzione di elettricità e dati ambientali. I dati sono disponibili per l'analisi dal 2001 al 2017. Tutto ciò che i ricercatori devono fare è accedere al sito e scaricare le informazioni. 152. Dati oceanografici britannici Finanziato dal National Environment Research Council, British Oceanographic Data è una delle fonti di dati marini più accessibili su Internet. Con un ampio database che include correnti, profili CTD, dati internazionali sul livello del mare, correnti e persino dati storici provenienti dai registratori di pressione di fondo. Inoltre, sono disponibili set di dati nella Published Data Library, che offre un ulteriore accesso al catalogo. Questa è probabilmente una delle fonti di informazioni marine più complete disponibili online. 153. Fattuale Factual fornisce dati sulla posizione per la pubblicità e per l'utilizzo su piattaforme mobili. Di particolare interesse per i ricercatori sono gli strumenti di sviluppo che includono l'Engine Mobile SDK e le applicazioni professionali e di ricerca complete dell'Observation Graph, nonché del Local Validation Stack. Con un nome del sito web che sottolinea la passione dell'azienda per l'acquisizione di dati da tutto il mondo e la ricerca di nuovi modi per contestualizzarli, Factual ha un chiaro impegno nei confronti dei dati e nella ricerca di nuove e insolite opportunità di utilizzo. 154. Aree amministrative globali Le Aree Amministrative Globali (Global Administrative Areas) sono un geodatabase che mostra la posizione delle diverse aree amministrative del mondo. I dati raccolti da questo tipo di database vengono poi generalmente utilizzati nei sistemi informativi geografici. Questi includono i paesi e sono ulteriormente suddivisi in province, contee e dipartimenti, tra gli altri. La buona notizia per i giornalisti è che tutti questi dati sono disponibili gratuitamente e possono essere utilizzati anche per uso accademico e generale non commerciale. 155. Geonomi Geonames è un sito che ospita un database geografico con milioni di voci, caratteristiche uniche e nomi alternativi. Offrendo sia un'opzione di esportazione che l'accesso tramite una varietà di servizi web, questo database elabora circa 150 milioni di richieste al giorno. Grazie alle funzionalità wiki del database, gli utenti possono apportare modifiche e adattamenti alle voci del database con relativa facilità. Questa è un'ottima risorsa anche solo per le sue capacità di hosting multilingue. 156. Dati naturali della Terra Natural Earth Data è un set di dati cartografici di pubblico dominio, ricco di informazioni, progettato per l'utilizzo in software di cartografia per la creazione di mappe all'avanguardia. Le immagini del prodotto finale sono pulite e ben organizzate e i dati sono immediatamente utilizzabili. Questo set di dati include dati di intelligence e vari temi di dati vettoriali culturali, raster e fisici. Originariamente creato pensando alle esigenze e alle preferenze dei cartografi, questo set di dati è utile a chiunque sia interessato alla geografia. 157. Mappa di Openstreet OpenStreetMap è meno un sito web e più una collaborazione tra utenti che ora fornisce servizi di mappatura ad app, siti e vari dispositivi hardware. Questo sito acquisisce nuovi dati quando gli utenti inseriscono informazioni su punti di riferimento meno noti come stazioni ferroviarie, strade e sentieri. Il set di dati completo è disponibile gratuitamente sul sito e può essere scaricato per intero o in parte. Per coloro che scelgono di scaricare solo una parte dei dati, è possibile scaricarli anche per regione. 158. Città di Chicago La città di Chicago è la patria dei Bulls, campioni di Michael Jordan, e della sua pizza dallo stile unico, e dispone anche di un portale dati completo. Le categorie dei set di dati abbracciano una varietà di argomenti, tra cui Amministrazione e Finanza, Etica, Salute e Servizi Umani, Parchi e Attività Ricreative, Sicurezza Pubblica e Conservazione del Patrimonio Storico. In breve, il portale dati della città di Chicago ospita praticamente tutto ciò che potrebbe essere di interesse per ricercatori, responsabili politici e giornalisti locali. 159. CKAN CKAN è essenzialmente la sede online del progetto open data della città di Glasgow. Questo sito contiene set di dati su numerosi argomenti utili per imprenditori, decisori politici, ricercatori accademici e sviluppatori di app. Dei 360 set di dati ospitati, alcuni sono relativi alla governance cittadina, come il set di dati sul patrimonio immobiliare per tipologia di proprietà, mentre altri, come il set di dati sul ciclismo, sono di particolare interesse per i residenti locali. Qui si trovano informazioni di ogni tipo per i giornalisti che si occupano di questioni più locali. 160. Governo dell'India Il governo indiano ha un sito web che tratta di analisi e risorse di dati nella sua versione dell'Open Data Project. Attualmente, ci sono circa 137.940 risorse che sono state visualizzate milioni di volte sul sito. La stragrande maggioranza di questi file è anche disponibile per il download. Che si cerchino dati sul bilancio pubblico o set di dati che riguardano la salute e il benessere familiare, è probabile che questo sito abbia risorse da offrire. 161. Statistiche SA Questo sito è ricco di statistiche, pubblicazioni e dati aggiornati raccolti dal governo sudafricano. Qui i ricercatori troveranno informazioni su tutto, dai sondaggi su alimenti e bevande agli indicatori economici, alle statistiche sull'occupazione, ai dati demografici e importanti statistiche sanitarie. È possibile cercare i dati per città, tema e indicatore, a seconda delle esigenze. Questo sito ospita numerose informazioni sul censimento, pubblicando anche pubblicazioni statistiche, questionari, codici e classificazioni e politiche sui prezzi. 162. Sviluppo delle politiche e ricerca Questo sito è pubblicato sotto l'egida dell'Ufficio per lo Sviluppo e la Ricerca delle Politiche del Dipartimento per l'Edilizia Abitativa e lo Sviluppo degli Stati Uniti. Pubblica regolarmente ogni anno un gran numero di casi di studio, pubblicazioni semestrali e periodici. Offre inoltre un'ampia gamma di set di dati di interesse per i giornalisti, tra cui "Equity Market Rents", "Income Limits" e "Renewal Funding Inflation Factors", solo per citarne alcuni. 163. Dati sanitari vitali di rete Su Vital Net Health Data, i ricercatori troveranno numerosi e ampi set di dati relativi alla salute. Questo sito non ospita solo tutti questi set, ma offre anche link a set che gli utenti possono consultare e attraverso i quali trovare informazioni. Questo elenco curato include link a risorse come CDC Wonder, Eurocat, Health Data All Star e anche al lavoro di organizzazioni benefiche come la North American Association of Central Cancer Registries. Si tratta senza dubbio di una delle risorse di dataset sanitari più complete disponibili. 164. Ponte analitico Analytic Bridge è una risorsa dedicata alla business intelligence. Qui i ricercatori troveranno discussioni su machine learning e intelligenza artificiale, link a webinar e conferenze e persino una sezione per la ricerca di lavoro. Il sito ospita anche Data Science Central, la sezione del sito dedicata ai big data. Grazie alla sua community attiva e coinvolta e al suo impegno nel fornire notizie e informazioni, i giornalisti interessati alle implicazioni dei dati per il business potranno trarne grande vantaggio. 165. Archivio.org Noto principalmente per il suo impegno nel diventare una biblioteca pubblica online, archive.org ospita numerose opere pubblicate e una consistente raccolta di dati. Il sito vanta i risultati dell'Internet Census del 2012, nonché gli archivi del Dark Net Market dal 2011 al 2015, e persino un dataset di commenti pubblici su Reddit. Sono presenti anche dump di dati di Music Brainz e un dataset contenente immagini di copertine audio. Tra pubblicazioni e dati, archive.org offre ai giornalisti un'ampia gamma di materiale di consultazione. 166. Torrenti accademici Questo sito web si definisce un sistema progettato per semplificare la condivisione e il download di enormi set di dati. Utilizzando la tecnologia torrent per semplificare la distribuzione dei dati, Academic Torrents si vanta di consentire ai ricercatori di scaricare rapidamente tutto ciò di cui hanno bisogno. Il sito ospita anche articoli, corsi e raccolte per la consultazione. Una rapida ricerca tra le risorse disponibili rivelerà che ci sono moltissimi set di dati e raccolte disponibili per il download. 167. Dataverso Il modo migliore per approcciarsi a Dataverse è considerarlo come un altro tipo di biblioteca. Qui, i ricercatori possono cercare, scoprire e citare dati con facilità, utilizzando allo stesso tempo questo sito come archivio per le proprie informazioni. Gli argomenti trattati includono campi come le scienze sociali, le scienze agrarie, la medicina, la salute e le scienze della vita, nonché le scienze della terra e dell'ambiente. Tra i grandi nomi che hanno pubblicato su questo sito figurano Gallup e il Dipartimento del Commercio degli Stati Uniti, Bureau of Census, Divisione Geografia. 168. DATI UC Operando in collaborazione con il Social Science Data Lab dell'Università della California, Berkeley, UC Data è l'archivio più grande e noto dell'università. Questo sito offre servizi nei settori della statistica e dei dati delle scienze sociali. Su questo sito i ricercatori possono accedere ad articoli, report e working paper prodotti dai ricercatori di UC Data. I dati grezzi coprono numerose aree di ricerca, tra cui sanità, welfare e previdenza sociale, demografia, voto e tecnologie dell'informazione, tra molti altri argomenti. 169. Campo di scherzi Joe Kamp offre una guida completa per trovare dati e API sul calcio e sul football americano per l'analisi dei dati. Seguendo i link forniti nella pagina, i ricercatori possono accedere a dati open source tramite GitHub, oltre ad accedere ad API gratuite e commerciali per un accesso più semplice. Poiché i dati e il codice sono disponibili su un sito riconosciuto come GitHub, ottenere questo tipo di dati non è mai stato così facile. 170. Sean Lahman Sean Laham non è necessariamente un nome che si sente tutti i giorni, ma il suo sito ospita una delle statistiche più complete e approfondite su battitori e lanciatori su Internet. Con numeri che coprono il periodo dal 1871 al 2016, i dati risalgono letteralmente a secoli fa. I dati sono accessibili e utilizzabili gratuitamente con licenza Creative Commons Share Alike 3.0 e possono essere scaricati direttamente in SQL e Microsoft Access, per citarne alcuni. Le statistiche possono essere scaricate anche tramite GitHub. 171. Foglio retrò Retro Sheet è una delle fonti più complete su Internet per statistiche e dati sul baseball. Il sito include dettagli come i roster annuali e i dati identificativi di arbitri, giocatori e allenatori. Negli anni in cui è stato rilevante, i dati dell'All-Star Game sono stati inclusi nei file degli eventi, insieme a una serie di file degli eventi per la post-season e a un file per le piccole discrepanze. Retro Sheet include persino i dati identificativi degli stadi per ogni stagione. Che ne dite di una completezza così? 172. Sfida dei dati Hubway Per chi non conoscesse il programma, Hubway è il nome del bike sharing con sede nell'area metropolitana di Boston. Naturalmente, il sistema non registrava né rilasciava dati identificativi, ma Hubway conservava comunque le informazioni di base su ogni viaggio effettuato tra luglio 2011 e settembre 2012. Tra queste, dettagli come l'inizio e la fine del viaggio e la stazione di prelievo, per citare solo alcune categorie. 173. Voli aperti Open Flights è un database che contiene informazioni su oltre 10.000 terminal di traghetti, aeroporti e stazioni ferroviarie in tutto il mondo. I ricercatori possono trovare la versione .csv compatibile con Excel tramite GitHub e possono anche scaricare i dati direttamente dal sito web. Utilizzando la mappa sulla homepage, è possibile vedere quali luoghi specifici sono presenti nell'elenco e il sito fornisce persino informazioni sui percorsi. È possibile contattare i proprietari del sito per informazioni ancora più aggiornate. 174. MLVIS MLVIS è un repository di dati che combina l'analisi visiva con il data mining in tempo reale. Ciò consente di esplorare una comprensione più intuitiva dei dati anche lavorando con set di dati di grandi dimensioni. Tra le numerose funzionalità e opzioni disponibili su questo sito figurano dati di benchmark e apprendimento automatico di dati non relazionali, insieme a diverse tipologie di dati, come quelli attribuiti ed eterogenei. Per una maggiore comodità degli utenti, queste informazioni possono anche essere scaricate in un unico formato coerente. 175. Open Data Inception Open Data Inception è un sito che offre link a oltre 2600 portali di dati. Utilizzando la barra di ricerca in alto, i ricercatori possono cercare portali e dataset per categoria e per tema. Inoltre, è anche possibile utilizzare il sito per trovare la versione più aggiornata del dataset ricercato. Sfruttate la possibilità di visualizzare i portali di dati in formato elenco o in formato visivo interattivo e iniziate a trovare i dati necessari. 176. OpenDataSoft Disponibile in francese, inglese e tedesco, OpenDataSoft è una fonte che offre accesso a 480 milioni di record, 4 milioni di celle API e 9.284 set di dati. Utilizzando la barra di ricerca al centro della homepage, i ricercatori possono inserire una parola chiave o una categoria e trovare il set di dati più appropriato. Per i giornalisti, questo è un modo più rapido per trovare i set di dati più pertinenti necessari per completare la ricerca in questione. Visita il sito per saperne di più. 177. Maestro della nazione NationMaster è una fonte di dati completi provenienti da oltre 300 paesi, organizzati in oltre 5.000 categorie. I dati includono dati sulla percentuale di decessi registrati, statistiche sulla Seconda Guerra Mondiale e persino informazioni sulla guerra nucleare e sui test nucleari. I ricercatori troveranno anche tabelle, grafici e diagrammi a torta che consentiranno un'ulteriore visualizzazione dei dati. In parole povere, gli argomenti trattati sono così tanti che c'è sempre qualcosa di nuovo da scoprire nei dati. 178. Followerwonk Twitter è da tempo un popolare social media per le ultime notizie e la ricerca di storie di tendenza. Followerwonk permette agli utenti di portare il loro utilizzo di Twitter a un livello superiore. Questo include la ricerca di utenti Twitter con cui connettersi, lo studio dei follower attuali e la pianificazione delle attività su Twitter per ottenere i massimi risultati. Oggigiorno, molti reporter e giornalisti su Twitter utilizzano il sito per fare networking e diffondere storie. Followerwonk rende gli utenti di Twitter più produttivi sul sito. 179. Infoscimpanzé Infochimps è un sito che offre servizi basati su cloud che possono essere ridimensionati per sfruttare al meglio i big data. È utile quando si tratta di implementare e integrare tecnologie e applicazioni big data. Quando i ricercatori devono analizzare enormi quantità di dati o valutare le tendenze nei big data, questa è una risorsa inestimabile. Sul sito sono disponibili anche numerosi white paper e casi di studio. 180. Statistiche governative nazionali archiviate Fondato nel 2006, Archive-It è un servizio fornito da Internet Archive. Questo servizio aiuta organizzazioni e aziende a creare collezioni digitali e, di conseguenza, ha avuto l'opportunità di collaborare con organizzazioni non profit, college, università e governi. I ricercatori possono effettuare ricerche in alcuni dei diversi archivi presenti sul sito, come i siti web della campagna elettorale per il Congresso del 2014, gli Archivi di Stato dell'Alabama e il Canadian Government Information PLN Web Archive. Questo sito è una miniera di informazioni per giornalisti intraprendenti. 181. Beni comuni civici Civic Commons ha una pagina che elenca le varie iniziative governative sui dati aperti. Questo elenco di risorse consultabili è organizzato per paese, città, regione e menziona anche le risorse messe a disposizione dalle organizzazioni intergovernative. Per i giornalisti, questo sito rappresenta un modo più rapido per scoprire quali governi partecipano al Progetto Open Data. Il sito garantisce inoltre l'accesso a dati localizzati che non troverebbero necessariamente riscontro in una semplice ricerca su Google. 182. Governi mondiali custodi Il Guardian è un nome famoso nel mondo del giornalismo per la sua reputazione di fonte di notizie dell'ultima ora. Ciò che meno si sa è che il sito ha una sezione che offre dati sui governi di tutto il mondo. Ci sono articoli sull'impatto dei numeri dei senzatetto, discussioni sulla sicurezza informatica e persino approfondimenti sul ruolo che dati e statistiche svolgono nell'attuale clima politico e sociale. La sezione "Governo Mondiale" del Guardian è in grado di stimolare il dibattito e trovare spunti per le storie. 183. Dati governativi aperti (Hub) Questo sito appartiene a un gruppo tramite l'Open Knowledge Foundation che ha l'obiettivo di incoraggiare e sostenere lo sviluppo continuo di dati pubblici aperti. Qui, gli utenti troveranno link a uno degli elenchi più completi di cataloghi di dati aperti disponibili. Tra gli ulteriori obiettivi menzionati sul sito, il gruppo si propone anche di reperire informazioni su policy, buone pratiche e linee guida. Offre ai giornalisti un ampio accesso a informazioni più numerose e di migliore qualità. 184. Governo aperto – Francia Questo sito web è la sede online del progetto open data offerto dal governo francese. È possibile approfondire i dati effettuando ricerche per categorie come occupazione, agricoltura, istruzione, viaggi e turismo. Si tratta di dati che consentono di costruire e sviluppare una comprensione più articolata di ciò che i dati effettivamente dicono, lasciando anche spazio a confronti basati sulle informazioni storiche. In sostanza, i giornalisti hanno tutte le ragioni per essere entusiasti di esaminare questi dati. 185. Università di Notre Dame Questo sito archivia i dati di ricerca disponibili tramite SourceForge.net, utilizzato dall'Università di Notre Dame. I dati sono forniti tramite database relazionali. Gli aggiornamenti mensili dei dati consentono inoltre di acquisire una migliore comprensione del software open source e delle sue applicazioni. Per accedere a queste informazioni, è necessario inviare una richiesta scritta via e-mail. Il problema, tuttavia, è che i ricercatori accademici e accademici sono gli unici a poter accedere ai dati. 186. Rapporti sugli UFO Il National UFO Reporting Center ha un database online che racconta le esperienze delle persone con oggetti volanti non identificati. I ricercatori possono semplificare la ricerca nel database utilizzando una qualsiasi delle quattro categorie disponibili: data, forma dell'UFO, data di pubblicazione e persino stato. Gli UFO sono unici perché non deludono mai l'immaginazione del pubblico. Se ci sono stati recenti avvistamenti del terzo tipo nelle vicinanze, questo è il posto giusto per scoprire cosa ne pensano. 187. WikiLeaks Noto e famigerato sui media a causa delle controversie e di ciò che le fughe di notizie hanno rivelato sui meccanismi interni del governo e di altre figure famose e potenti della società, WikiLeaks ha una reputazione che lo precede. Sebbene le fughe di dati vengano raramente divulgate in modo discreto, nessuno mette mai in dubbio l'accuratezza delle informazioni. Per i giornalisti in cerca di storie che suscitino immediatamente interesse, WikiLeaks è una fonte affidabile. Se non altro, sarà una lettura interessante. 188. Il Washington Post Il giornale è già noto come un'eccellente fonte di notizie dell'ultima ora e articoli di opinione, ma pochi sanno che il Washington Post concede l'accesso ai dati grezzi spesso menzionati nei suoi articoli. Nella pagina dei dati, i ricercatori possono trovare dati in categorie come istruzione, censimento, salute e sicurezza, trasporti e sviluppo, database storici dei Mondiali e persino dati relativi a governo e politica. In parole povere, avere accesso a questi dati aiuta le persone a sviluppare una comprensione più concreta dei temi trattati nelle notizie. 189. Dati climatici Climate Data è un set di dati che fornisce informazioni complete sulla temperatura globale. Nel formato attuale, gli utenti possono visualizzare ogni informazione climatica importante attraverso le griglie, visualizzando anche le medie. Chi cerca i dati complementari può accedere alle stesse informazioni anche per la terraferma e l'oceano. Queste informazioni possono essere scaricate, ma per maggiore comodità possono anche essere visualizzate direttamente sul sito. 190. Struttura proteica Protein Structure è una fonte che si propone di esaminare come le reti informatiche possano essere utilizzate in combinazione con la biologia. La pagina ospita un archivio di dati accessibile tramite i link forniti. Di particolare interesse per i membri della comunità scientifica è il modo in cui il sito integra diverse idee, come l'analisi dei modelli e la biologia eseguibile, nel perseguimento di questo obiettivo. Per i giornalisti, questo sito merita di essere consultato per osservare i progressi ed esaminare i dati. 191. Analizza gratuitamente i dati del sondaggio Con l'aiuto di questo sito, gli utenti possono seguire un corso sull'analisi dei dati dei sondaggi senza dover pagare. Analyze Survey Data Free, con il suo indice dettagliato, include sezioni con titoli come "Mappe e Arte del sondaggio - Manutenzione ponderata", "Bilanciamento della riservatezza dei rispondenti con precisione nella stima della varianza", "Modelli di equazioni strutturali (SEM)" e "Dati complessi del sondaggio". Il sito offre un ottimo aggiornamento per coloro che prevedono di gestire più dati statistici in futuro. 192. UCLA Sul sito wiki dell'UCLA, i ricercatori troveranno diversi set di dati disponibili a scopo dimostrativo. C'è un'ampia scelta di dati simulati e osservati. Utilizzando queste risorse, è possibile accedere a dati climatici, demografici, biomedici, di neuroimaging, del censimento statunitense, elettorali e economici, tra le numerose altre categorie. In definitiva, questi set di dati rappresentano una risorsa di cui molte persone possono trarre beneficio. 193. Università di Toronto Sul suo sito, l'Università di Toronto offre ai ricercatori l'accesso a quelli che chiama "Delve Dataset". Queste raccolte di dati facevano parte di un prodotto più ampio, progettato allo scopo di confrontare i metodi di apprendimento. In definitiva, queste informazioni sono disponibili per lo sviluppo e la valutazione dei diversi approcci all'apprendimento. In breve, si tratta di una solida fonte per i ricercatori che desiderano comprendere meglio come analizzare e gestire i set di dati. 194. Servizio di conservazione delle risorse naturali Il Natural Resources Conservation Service ha un sito web che si concentra sulla promozione della conservazione, offrendo al contempo informazioni sui diversi muschi, antocerotidi, piante vascolari, licheni ed epatiche presenti negli Stati Uniti. Questo sito ospita un database completo di piante e immagini di piante che possono essere trovate sul sito, oltre a numerose informazioni. I ricercatori possono scaricare il database e trovare moltissime informazioni su argomenti come le colture alternative. In sostanza, questo sito web contiene tutto ciò che le persone devono sapere sulle piante. 195. Servizio di ricerca agricola Come si può intuire dal nome dell'agenzia, questo servizio gestisce le esigenze di ricerca del Dipartimento dell'Agricoltura degli Stati Uniti. Ogni volta che viene scoperto un problema agricolo, questo è il settore governativo che molto probabilmente contribuisce a trovare una soluzione. Il sito ospita numerosi set di dati accessibili e scaricabili direttamente. I giornalisti possono anche utilizzare questo sito per trovare tutte le ultime notizie relative alle problematiche che interessano l'agricoltura. 196. Libreria di immagini cellulari Questo sito offre una biblioteca pubblica che offre risorse, informazioni e accesso a immagini e animazioni che ritraggono cellule e processi cellulari. Cell è progettato tenendo conto del duplice processo di ricerca e formazione, e le informazioni qui contenute sono quasi sempre pertinenti durante le discussioni sulla salute pubblica e sulle malattie. I materiali provengono da una combinazione di fonti, tra cui pubblicazioni storiche e moderne. Per una spiegazione approfondita che semplifichi i complessi processi biologici, i giornalisti non possono sbagliarsi con la Cell Image Library. 197. Genomica completa Questo è il sito di un'azienda che si considera un punto di riferimento consolidato nel settore biotecnologico nel campo del sequenziamento del genoma umano. È interessante notare che Complete Genomics ha reso disponibili al pubblico numerose sequenze del suo intero genoma. In definitiva, questo offre ogni tipo di spunto utile sul DNA e sul genoma umano sequenziato. L'unica condizione per questo materiale è che i ricercatori che utilizzano queste informazioni si assicurino di fornire a Complete Genomics i riferimenti appropriati. 198. Array Express Array Express è un repository che archivia informazioni provenienti dai risultati di esperimenti di genomica che hanno richiesto enormi quantità di sequenziamento o elaborazione. Su questo sito, gli utenti troveranno i risultati di oltre 70.000 esperimenti, oltre a più di 2 milioni di saggi, all'interno di diversi terabyte di dati. Ancora meglio, queste informazioni sono liberamente riutilizzabili per scopi di ricerca. Questa è un'ottima risorsa per tutte le informazioni più recenti sulla genomica e sui progressi compiuti in questo campo. 199. Codificare L'Enciclopedia degli Elementi del DNA, o Consorzio ENCODE, è il risultato di gruppi di ricerca provenienti da tutto il mondo che lavorano in collaborazione tra loro. L'obiettivo finale è compilare un elenco di tutte le parti funzionali del genoma, che includa un esame approfondito dei livelli di RNA, delle proteine, degli elementi che regolano le cellule e dell'attività dei geni. Sono disponibili dati consultabili, oltre a un'enciclopedia che offre ulteriori informazioni. 200. Genomi d'insieme Ensemble Genomes è un sito fondato nel 2000 che si occupa dei genomi dei vertebrati. Nel corso degli anni, questa risorsa ha aggiunto informazioni complementari su metazoi invertebrati, piante, batteri e funghi. I dati su tutti questi argomenti sono reperibili e accessibili cliccando sui link disponibili sul sito. Il sito offre tutorial, set di dati su tutti gli argomenti trattati e una raccolta di documenti da consultare. Tutti questi fattori rendono Ensemble Genomes una fantastica fonte di dati per i giornalisti. 201. Consorzio di ontologia genetica Gene Ontology è un sito che esiste con lo scopo preciso di trovare un modo per rappresentare al computer le attuali conoscenze sul funzionamento dei geni. Contiene numerose pubblicazioni e ulteriore documentazione consultabile. Sono presenti annotazioni ospitate direttamente sul sito. La buona notizia per i ricercatori che desiderano analizzare più da vicino i numeri e i dati grezzi è che sono disponibili file scaricabili direttamente dal sito web. 202. Libreria di firme cellulari basate su reti integrate L'Harvard Medical School LINCS Center ha lo scopo di aiutare la comunità scientifica e il grande pubblico a saperne di più su come le cellule umane reagiscono quando vengono perturbate da farmaci. Utilizzando il database HMS LINCS e lo strumento di esplorazione dei progetti, i ricercatori possono trovare pubblicazioni e riassunti dei progetti, nonché risorse generali. I giornalisti possono anche utilizzare questo sito per accedere a tutte le ultime notizie e informazioni derivanti da questa ricerca. 203. Progetto sulla diversità del genoma umano Il Progetto sulla Diversità del Genoma Umano ha compiuto notevoli progressi grazie all'impegno dello Stanford Human Genome Center. Il sito contiene campioni composti da migliaia di campioni e marcatori. È possibile scaricarli, osservarli e analizzarli approfonditamente semplicemente seguendo i link forniti sulla pagina. Questa è un'ottima risorsa per i giornalisti che desiderano comprendere le informazioni provenienti dalla comunità scientifica. 204. Visualizzatore dati JCB JCB DataViewer consente a chi è interessato a ciò che il Journal of Cell Biology ha da dire di visualizzare i dati delle immagini associati agli articoli pubblicati. Il sito offre una galleria completa che gli utenti possono scorrere per visualizzare i materiali. Inoltre, gli utenti hanno anche la possibilità di effettuare ulteriori analisi dei dati durante la navigazione. In parole povere, questo sito è perfetto per comprendere i riferimenti bibliografici e le figure presenti negli articoli della rivista. 205. Portale dati Genomic Data Commons Il GDC Data Portal è una piattaforma progettata per aiutare i ricercatori e gli operatori del settore della bioinformazione a svolgere la ricerca sul cancro in modo più efficiente. È disponibile un archivio, un'API, documenti disponibili per la consultazione e altro ancora. L'accesso a questo sito significa poter accedere alle stesse informazioni che i ricercatori oncologi utilizzano per condurre le proprie ricerche. Qui, i giornalisti potranno trovare tutti i dati che cercano e molto altro ancora. 206. Opensp Opensp è un progetto promosso dalla comunità, ideato per condividere i genotipi. Le persone che sono state tipizzate utilizzando FamilyTreeDNA, 23andMe o deCODEme possono caricare tali informazioni sul sito. Lo scopo di questa richiesta è quello di consentire al sito di concentrarsi sulla ricerca di connessioni tra genotipi e SNP, ovvero polimorfismi a singolo nucleotide. Ciò che è di particolare interesse per i giornalisti è la possibilità di scaricare e consultare i dati. 207. Guida del percorso Pathguide è un sito dedicato a fornire informazioni sulle vie metaboliche e di segnalazione, nonché sulle interazioni tra proteine a livello molecolare. Questa pagina ospita un elenco di circa 697 risorse relative all'argomento principale. I database a cui si fa riferimento in questo sito sono generalmente gratuiti. La maggior parte dei riferimenti forniti in questo elenco di risorse si concentra principalmente sull'interazione tra proteine. Questo sito è una risorsa preziosa per gli appassionati di biologia. 208. RCSB PBB Questo è un sito dedicato a informare il mondo accademico e il grande pubblico su tutto ciò che riguarda gli acidi nucleici e le proteine. La banca dati proteica RCSB offre accesso a vari strumenti progettati per rendere questo aspetto della biologia più comprensibile, tra cui strumenti di visualizzazione, visualizzazione di strutture 3D e un archivio completamente consultabile, categorizzabile per categoria di organismo. Inoltre, questo sito offre notizie aggiornate su tutti gli ultimi sviluppi in questo campo. 209. Consorzio di genomica psichiatrica Il Consorzio di Genomica Psichiatrica è il risultato della collaborazione tra ricercatori e scienziati di tutto il mondo impegnati nella ricerca sulla componente genetica dei disturbi psichiatrici. Alla fine, questo progetto è stato in grado di produrre 17 articoli principali e altri 31 articoli di sviluppo che offrono analisi e metodologie secondarie, con un unico articolo fondamentale che ne è scaturito. Il Consorzio offre strumenti, download e accesso ai risultati tramite il portale di accesso ai dati su richiesta. 210. Pub Chem PubChem è un nome rispettato nel campo della ricerca medica e biologica da moltissimo tempo. Offrendo la possibilità di ricercare strutture e database di composti, analisi biologiche e sostanze, i ricercatori non possono sbagliarsi con questo sito. Inoltre, ci sono milioni di voci presenti in ciascuno di questi database. Queste informazioni possono essere visualizzate tramite strumenti come gli strumenti di conformatore 3D e gli strumenti di analisi biologica. I dati sono anche disponibili per il download. 211. COSMICO Come suggerisce il nome, il Catalogo delle Mutazioni Somatiche nel Cancro, o COSMIC, è dedicato alla cronistoria e all'esplorazione degli effetti delle mutazioni somatiche nel cancro. Il sito consente di effettuare ricerche su COSMIC categorizzate per tipo di cancro, gene e mutazione. COSMIC offre strumenti come il browser del genoma e il browser del cancro. Inoltre, sono disponibili sul sito per il download dati sulla cura genetica, la resistenza ai farmaci, gli screening del genoma, le firme mutazionali e la cura della fusione genica. 212. Genomica della sensibilità ai farmaci nel cancro La sezione "Genomics of Drug Sensitivity in Cancer" è dedicata alla ricerca di biomarcatori che possano aiutare i medici a identificare il tipo di farmaco antitumorale a cui i pazienti hanno maggiori probabilità di rispondere. I giornalisti possono utilizzare le schede delle notizie per rimanere aggiornati sulla presenza di nuovi dati o modifiche al sito. Inoltre, è disponibile anche una raccolta di dati sulle linee cellulari, un database che descrive le caratteristiche del cancro e persino un elenco di composti, tutti disponibili per la consultazione sul sito. 213. Istituto di ricerca medica Stowers Il sito web dello Stowers Institute for Medical Research offre ai ricercatori l'accesso gratuito ai dati che i suoi scienziati, ricercatori scientifici e genomici hanno utilizzato per le loro pubblicazioni. Per il grande pubblico, l'istituto sottolinea che l'archivio dati originale dello Stowers è generalmente gratuito. Detto questo, alcuni dei file più grandi del database potrebbero non essere accessibili direttamente tramite Internet e potrebbero richiedere accordi aggiuntivi. 214. Banca dati SSBD Il database di sistemi Science of Biological Dynamics, comunemente noto come database SSBD, fornisce una serie di strumenti e risorse da utilizzare per esaminare immagini microscopiche e valutare dati biologici quantitativi. Le immagini presenti su questo sito provengono da una varietà di fonti e includono oggetti come cellule, singole molecole e nuclei di espressione genica. Poiché i dati presenti su questo sito sono acquisiti tramite simulazioni computazionali ed esperimenti, i giornalisti possono essere certi che le informazioni qui contenute vengono costantemente perfezionate e aggiornate. 215. Condivisione dei genomi personali Il Personal Genome Project è un sito incentrato sulla creazione di dati sulla salute, sul genoma e sulle caratteristiche genetiche, aperti e accessibili al pubblico. Proseguendo il progetto in gran parte con l'assistenza di persone che si sono offerte volontarie per rendere pubbliche le proprie informazioni genomiche, questo sito offre gratuitamente al pubblico i dati che ha trovato e acquisito con successo. Oltre all'aspetto scientifico, questo progetto offre ai giornalisti un'interessante panoramica sugli effetti della creazione di un archivio pubblico di informazioni personali sul genoma. 216. Browser del genoma UCSC L'USCS Genome Browser consente agli utenti di visualizzare gli assemblaggi genomici. Oltre alla visualizzazione online, il sito fornisce anche link che possono essere utilizzati per scaricare le sequenze e le annotazioni per quegli stessi assemblaggi genomici. Questi link sono suddivisi nelle categorie: umano, mammiferi, altri vertebrati, deuterostomi, insetti, nematodi, altri genomi e altri download. Gli strumenti e le directory presenti su questo sito sono inoltre gratuiti per uso personale e non commerciale. I giornalisti possono trarre vantaggio dalla completezza e dall'accessibilità di queste informazioni. 217. UniProt L'Universal Protein Resource, noto con il nome UniProt, è il luogo ideale per reperire informazioni sul sequenziamento e l'annotazione delle proteine. Attingendo alle informazioni fornite da tre database negli UniProt Reference Clusters, nella UniProt Knowledgebase e nell'UniProt Archive, questo sito offre, tra le altre funzionalità, funzionalità di ricerca per peptidi e cluster. I giornalisti possono utilizzare questo sito per verificare, scoprire e approfondire le nuove scoperte nel campo del sequenziamento e dell'annotazione delle proteine. 218. Dati dell'indice climatico degli attuari L'Actuaries Climate Index, noto anche come ACI, fornisce al grande pubblico e ai decisori informazioni sulle tendenze climatiche e sugli effetti dei cambiamenti climatici in Canada e negli Stati Uniti. I ricercatori possono consultare le informazioni fornite da questo strumento didattico per individuare e scoprire cambiamenti significativi nel mare e nelle condizioni meteorologiche. È possibile restringere la ricerca per regioni e componenti. Questo sito dispone di decenni di dati e aggiorna regolarmente le sue informazioni trimestralmente. 219. Centro meteorologico aeronautico L'Aviation Weather Center fornisce informazioni meteorologiche accurate, tempestive e aggiornate su cui il sistema dello spazio aereo può fare affidamento. Su questo sito, gli utenti possono visualizzare vari grafici, previsioni e osservazioni meteorologiche, presentati in modo da essere facilmente fruibili dagli aviatori. È possibile visualizzare le informazioni fornite dalle fonti dati del sito in tempo reale tramite output .csv o XML. I ricercatori possono manipolare e osservare i dati grezzi più da vicino tramite questa opzione di download. 220. Unità di ricerca climatica Il sito web della Climatic Research Unit è stato creato appositamente per condurre ricerche sugli effetti del cambiamento climatico nel passato, studiarne le cause e trovare soluzioni ai problemi del cambiamento climatico nel presente. Qui, è possibile consultare i risultati della ricerca, ottenere una panoramica dell'argomento attraverso le schede informative, leggere pubblicazioni e persino accedere ai dati grezzi. I giornalisti alla ricerca di set di dati meteorologici grezzi troveranno in questa risorsa un valido aiuto. 221. Valutazione climatica europea e set di dati Sul sito web dell'European Climate Assessment & Dataset, il pubblico può scoprire informazioni sui cambiamenti climatici estremi o meteorologici. I ricercatori hanno la possibilità di utilizzare lo strumento di ricerca del progetto, chiamato KNMI Climate Explorer, per verificare i dati, esaminare le previsioni stagionali e persino analizzare più da vicino gli effetti di El Niño, tra le altre applicazioni. Poiché questo set di dati viene aggiornato quotidianamente, i giornalisti che utilizzano questa fonte saranno i primi a conoscere eventuali segnali di cambiamenti climatici estremi. 222. Servizi di ricerca immagini globali Global Imagery Browse Services, in breve GIBS, è una parte essenziale di EOSDIS nel suo ruolo di fornitore di servizi di imaging reattivi e basati su standard comunitari. In altre parole, GIBS consente alle persone comuni di interagire con immagini satellitari scattate praticamente da qualsiasi luogo sulla Terra in alta definizione. Poiché GIBS di EOSDIS è reso disponibile attraverso i dati di scienze della Terra della NASA, è più facile che mai per giornalisti e ricercatori saperne di più sul mondo in tempo reale. 223. Clima ed ecosistema di Bering Gestito dalla National Oceanic and Atmospheric Administration (NAAA) del governo degli Stati Uniti, questo sito web fornisce a giornalisti e ricercatori tutto ciò che potrebbero desiderare di sapere su come il clima e l'ecosistema del Mare di Bering stanno reagendo ai cambiamenti avvenuti nell'Artico. Qui è possibile leggere saggi, esaminare proiezioni e utilizzare lo strumento di dati online per vedere come vari indici climatici, dati biologici, atmosferici, oceanici e sulla fauna selvatica si stanno comportando nel Mare di Bering. 224. NCEI L'NCEI, o National Centers for Environmental Information, è il risultato finale della fusione dei tre centri dati della National Oceanic and Atmospheric Administration. Questa pagina ospita una serie di link suddivisi in 22 categorie che collegheranno gli utenti a diverse risorse, pagine di interesse e set di dati climatici e meteorologici. I giornalisti alla ricerca di informazioni su clima, tempeste, precipitazioni e una serie di altri problemi meteorologici troveranno probabilmente ciò che cercano qui. 225. Laboratorio di ricerca sul sistema terrestre La Divisione di Monitoraggio Globale della National Oceanic and Atmospheric Administration fornisce informazioni sulle tendenze a lungo termine delle forze del cambiamento climatico sulla Terra attraverso il monitoraggio di parametri atmosferici chiave. Tra questi, ad esempio, monossido di carbonio, metano, protossido di azoto e anidride carbonica. Questi parametri vengono poi utilizzati per misurare fattori come l'esaurimento dell'ozono a lungo termine, le fonti e i livelli di anidride carbonica, nonché i pozzi. Si tratta di una risorsa sui cambiamenti climatici che i giornalisti possono utilizzare. 226. WorldClim – Dati climatici globali Hai mai desiderato un modo migliore per visualizzare i dati climatici? WorldClim è un software che fornisce dati gratuiti che possono essere applicati alla modellazione spaziale e alla creazione di mappe. La versione attuale di questo software gratuito può essere applicata solo al clima attuale, mentre la versione precedente consente l'accesso ai dati climatici passati e presenti e consente agli utenti di visualizzare lo stato delle previsioni climatiche future. I giornalisti possono semplicemente seguire il link e scaricare il software. 227. Laboratorio di scoperta della conoscenza Il Knowledge Discovery Laboratory è un sito dedicato allo sviluppo di tecnologie innovative, ai fondamenti dell'apprendimento automatico e all'applicazione di tali conoscenze in ambiti pratici come la scienza delle reti, l'individuazione delle frodi e l'analisi dei dati scientifici. Il sito ospita un dataset piuttosto consistente nel DBLP, con 1,2 milioni di oggetti e 2,48 milioni di link inclusi. Per i ricercatori interessati agli obiettivi del Knowledge Discovery Laboratory, questo dataset rappresenta un'eccellente risorsa. 228. Sfida di implementazione DIMACS Il sito web della nona Implementation Challenge ha come obiettivo quello di aiutare i ricercatori a imparare a risolvere problemi di percorso minimo. Per i creatori, il sito è stato creato con due obiettivi in mente. In primo luogo, trovare le migliori soluzioni riproducibili. In secondo luogo, facilitare la collaborazione tra ricercatori e la scoperta di soluzioni più efficaci. I ricercatori interessati a vedere i progressi compiuti in questo ambito possono consultare gli articoli e i set di dati presenti sul sito. 229. Repository di rete Il Network Repository è un sito in cui vengono archiviati dati scientifici, con l'aggiunta di strumenti visivi interattivi a cui gli utenti possono accedere e che possono analizzare. Questo sito vanta la doppia particolarità di essere sia il primo repository del suo genere sia il più grande sul web. Utilizzando grafici di dati e immagini intuitive e visivamente accattivanti, è molto più facile effettuare confronti e trovare nuovi modi per contestualizzare i dati. I giornalisti possono utilizzare questa fonte per trovare articoli all'interno dei dati scientifici. 230. Set di dati Pajek Pajek Datasets è una pagina che fornisce un set di dati che affronta le interazioni tra le proteine presenti nel lievito in gemmazione. Dopo aver offerto una breve spiegazione di base sull'impatto della scoperta di nuovi metodi per rilevare le interazioni, insieme alle ragioni per cui è essenziale essere in grado di discernere l'importanza delle varie interazioni proteina-proteina, il sito rimanda direttamente a un set di dati disponibile per il download. Per saperne di più, i ricercatori possono cliccare sul link in fondo alla pagina per leggere l'articolo pubblicato sull'argomento. 231. Mejn Network Data Questo sito si propone di condividere link ai set di dati di rete utilizzati e compilati dal proprietario del sito. I temi dei set di dati spaziano dal football universitario americano, ai blog politici e ai libri sulla politica americana, fino ai social network, a Les Miserables e alle collaborazioni sulla teoria delle alte energie. Chi è interessato ad approfondire questi argomenti avrà a disposizione un'ampia scelta di dataset tematici. Inoltre, i dati sono liberamente utilizzabili purché siano citati. 232. Il GraphBase di Stanford Stanford GraphBase è il nome dato a una serie di set di dati e programmi da Donald Knuth di Stanford. Se utilizzati in combinazione tra loro, questi programmi e set di dati sono in grado di manipolare e generare grafici e reti. Su questo sito, i materiali necessari sono disponibili per il download tramite i link. In questi file, i ricercatori troveranno dati sui punteggi delle partite di calcio, dati di dizionari, dati relativi alla ricostruzione della Gioconda e molti altri. 233. Collezione SuiteSparse Matrix Precedentemente nota come University of Florida Sparse Matrix Collection, la SuiteSparse Matrix Collection è una raccolta di matrici che hanno implicazioni concrete. Secondo il sito, questa particolare raccolta viene utilizzata più spesso per l'algebra lineare numerica nello sviluppo e nel perfezionamento di algoritmi per matrici sparse. Gli utenti tendono ad apprezzare la raccolta per la sua utilità nell'esecuzione e nel test dei risultati degli esperimenti. I set di dati e i benchmark delle matrici sono disponibili per il download direttamente dal sito. 234. Set di dati grafici Si tratta di un set di dati che i creatori di questa pagina web ritengono siano relazionali o in grado di tradursi bene in rappresentazione grafica. Graph Datasets offre set di dati come i dati del Predictive Toxicology Challenge, i dati di IMDb, i dati di mutagenesi, i dati di MovieLens, il filtraggio collaborativo e i dati sulle proteine ai ricercatori che desiderano imparare a lavorare con i numeri grezzi. I file sono disponibili su questa pagina e possono essere scaricati principalmente in formato XML. 235. Notizie sui Big Data Big Data News è un sito incentrato sui big data e sui fondamenti della scienza dei dati. Questo sito ospita le ultime notizie e include discussioni su deep learning e intelligenza artificiale. Inoltre, Big Data News ospita anche un enorme set di dati che contiene un totale di circa 3,5 miliardi di pagine web. Queste sono tutte separate da livelli denominati rispettivamente grafico a livello di pagina, grafico a livello di sottodominio, grafico a livello di sottodominio di primo livello e grafico a livello di dominio a pagamento. 236. Centro per la ricerca su reti e sistemi complessi CNetS, o Center for Complex Networks and Systems Research, opera sotto l'egida dell'Indiana University Network Science Institute e della School of Informatics and Computing. Il sito si propone di essere una risorsa nei campi della scienza dei dati, delle scienze sociali computazionali e delle reti e dei sistemi complessi, con informazioni sul mining e sui modelli di traffico online. Inoltre, CNetS ospita anche un dataset contenente circa 53,5 miliardi di richieste di rete effettuate dagli utenti dell'Università dell'Indiana. 237. Esploratore OONI OONI Explorer, parte dell'Open Observatory of Network Interference, è un progetto dedicato alla fornitura di software libero e open source. Gli utenti possono quindi utilizzare il software per provare a bloccare siti web e app di messaggistica, tra le altre applicazioni. Di particolare interesse per gli interessati a questa tecnologia è la disponibilità di accesso gratuito ai dati grezzi raccolti da OONI. Basta inserire le informazioni in OONI Explorer e interagire con i dati da lì. 238. Sfide nell'apprendimento automatico Challenges in Machine Learning è dedicato alla ricerca e allo sviluppo del machine learning. Su questo sito, i lettori troveranno link a software, libri, sfide di machine learning, nonché notifiche sui prossimi workshop. Il sito fornisce anche link a sfide che consentono l'invio di contributi anche dopo la data di scadenza. Per i giornalisti interessati a scoprire se il machine learning può svolgere attività come la previsione finanziaria o la classificazione di pagine web, questo è un sito che merita sicuramente una visita. 239. DatiX Attualmente operante sotto l'egida di CrowdANALYTIX, DataX è la parte macchina di un'iniziativa guidata dalla comunità che sfrutta la potenza del collettivo per creare applicazioni personalizzate di Intelligenza Artificiale, apprendimento automatico e Programmazione Neuro-Linguistica. Il ruolo di DataX in questo processo è la manutenzione e l'implementazione, che a loro volta contribuiscono a rendere queste soluzioni scalabili. Per i giornalisti che hanno tonnellate di testo, video e dati da analizzare, i bot disponibili tramite CrowdANALYTIX e DataX possono dimezzare i tempi di ricerca. 240. Dati guidati Driven Data combina crowdsourcing e data science in un modo che quasi nessun altro sito riesce a fare. Sottolineando il suo ruolo nel fornire assistenza alle organizzazioni che affrontano diverse sfide sociali, questo sito offre supporto mettendo a frutto la sua nutrita comunità di data science per creare modelli statistici che risolvono quesiti predittivi. Driven Data sembra lavorare principalmente con organizzazioni non profit, ma è potenzialmente utile per chiunque disponga di dati grezzi da raffinare. I giornalisti possono trarre vantaggio dal tenere a mente questa fonte. 241. Big Data aperti Dandelion API è un'applicazione che gestisce l'analisi semantica del testo per i big data. Per chi ha dati da elaborare, questo significa che questo programma prenderà il testo disorganizzato e troverà un modo per contestualizzarlo. I giornalisti che analizzano molti documenti possono sicuramente trarre vantaggio da questa funzionalità. Dandelion API include anche Open Big Data nelle categorie Milano, Trento ed Europa. Sebbene questa API sia a pagamento, una certa quantità di testo al giorno può essere analizzata gratuitamente. 242. Modelli della Terra Earth Models si concentra sulla condivisione e l'archiviazione di software e set di dati relativi alla Terra. Gli strumenti di modellazione menzionati sul sito includono software di simulazione ed elaborazione, nonché dati virtuali che attingono ampiamente da aree di studio specifiche come la tettonica e la sismologia. Giornalisti e ricercatori che desiderano affinare le proprie conoscenze sull'argomento possono utilizzare le pubblicazioni e gli articoli presenti su questo sito prima di immergersi negli strumenti di modellazione e visualizzazione. 243. Centro dati e applicazioni socioeconomiche (SEDAC) Il Socioeconomic Data and Applications Center, o SEDAC, è uno dei data center associati al sistema EOSDIS della NASA. Su questo sito, i lettori troveranno set di dati che offrono dati sui cambiamenti climatici o informazioni demografiche in griglia. I set di dati possono anche essere ricercati per temi come Governance, Agricoltura, Uso del suolo, Salute, Conservazione e Clima, Acqua, Telerilevamento e Povertà. Sono disponibili mappe, gallerie, guide che forniscono un contesto più ampio ai dati, nonché risorse e strumenti aggiuntivi a cui i ricercatori possono accedere sul sito. 244. Portale AODN Il portale AODN, un sito gestito dall'Australian Ocean Data Network, offre accesso ai dati climatici e marini australiani. I ricercatori che accedono a queste informazioni avranno anche accesso ai dati IMOS e ai metadati, un framework di ricerca supportato da numerose istituzioni, tra cui il governo australiano. I ricercatori che scelgono di utilizzare il portale AODN possono contare su un'eccellente distribuzione dei dati oceanici in un'interfaccia intuitiva. 245. Planet OS Planet OS offre un framework per i big data con particolare attenzione alle energie rinnovabili. Questa scelta di nicchia, unita alla competenza del sito, lo ha reso popolare tra le aziende energetiche alla ricerca di nuovi modi per visualizzare e contestualizzare i propri dati. Inoltre, il sito offre anche il cosiddetto DataHub, che ospita una consistente raccolta di oltre 2.000 dataset. Questi dataset includono dati aperti provenienti da NASA e Copernicus e vengono spesso aggiornati regolarmente. 246. ISTITUTO SMITHSONIAN Lo Smithsonian è da tempo un nome accademico rispettato ed è apprezzato in tutto il mondo per il suo impegno nella ricerca e nella storia. Per certi versi, è naturale che lo Smithsonian abbia un sito web che offra alcune delle migliori informazioni online sulla ricerca vulcanica. Il sito pubblica report, link di ricerca e database che includono ricerche su vulcani, eruzioni, emissioni e deformazioni, da integrare con l'elenco e il foglio di calcolo dei vulcani dell'Olocene. I giornalisti non avranno bisogno di un'altra fonte sull'attività vulcanica. 247. Catalogo dei terremoti Aggiornato e gestito dall'Earthquake Hazards Program del governo degli Stati Uniti, l'Earthquake Catalog consente ai ricercatori di vedere quando e dove si è verificato l'ultimo terremoto. Sebbene i risultati della ricerca siano limitati a 20.000, la ricerca nel catalogo è in grado di filtrare i risultati per magnitudo, data e ora e persino per area geografica. Questo livello di flessibilità rende questa risorsa particolarmente utile per i giornalisti che si occupano di un disastro naturale o di un terremoto locale e sono alla ricerca di informazioni di base. 248. Associazione economica americana L'American Economic Association fornisce ai ricercatori dati macroeconomici per gli Stati Uniti e altri paesi del mondo. Questo sito non sembra produrre dati economici, ma piuttosto stilare una breve lista dei più affidabili. Tuttavia, alla luce dei numerosi siti che offrono informazioni economiche su Internet, questa è una risorsa da cui i giornalisti possono aspettarsi credibilità. Basta andare sul sito e cliccare sulle categorie di dati economici di conseguenza. 249. Statistiche storiche.org Historicalstatistics.org è un sito incredibilmente utile per trovare informazioni economiche che presentano un interessante contrasto con il presente. Ad esempio, il convertitore di valuta storico del sito permette ai ricercatori di scoprire quanto una persona con 10 dollari USA nel 1923 avrebbe potuto acquistare oggi. Ospita anche pubblicazioni e articoli che pongono domande sulle metriche utilizzate nel campo della storia economica, insieme a indici dei prezzi e informazioni sulla massa monetaria, filtrabili per Paese. 250. DB Nomics E se tutti i dati economici pubblici su Internet potessero essere accessibili e consultati da un'unica piattaforma navigabile? Db.nomics è un aggregatore di database economici che mira a fare esattamente questo. I dati sono disponibili in formati come HTML, JSON e CSV e si aggiornano automaticamente, mentre le revisioni precedenti vengono archiviate di conseguenza. Le fonti economiche includono la Federal Reserve, il Bureau of Economic Analysis, il Fondo Monetario Internazionale e altri. I ricercatori alla ricerca di dati economici affidabili non possono sbagliare con Db.nomics. 251. Hub congiunto del debito estero (JEDH) Sviluppato grazie al lavoro congiunto della Banca dei Regolamenti Internazionali, dell'Organizzazione per la Cooperazione e lo Sviluppo Economico (OCSE), del Fondo Monetario Internazionale e della Banca Mondiale, il Joint External Debt Hub rende accessibili al pubblico informazioni sui dati del debito e sui creditori e debitori internazionali. I giornalisti che desiderano approfondire le finanze di diverse nazioni e comprendere meglio il panorama finanziario internazionale troveranno qui praticamente tutto ciò che desiderano. 252. Dati sul commercio internazionale Realizzata con il contributo completo di uno dei massimi esperti economici, Jon Haveman, questa pagina sui dati del commercio internazionale ospita dati che possono essere scaricati e ulteriormente analizzati. I set di dati includono dati tariffari, tabelle Penn World, servizi di pubblica utilità, dati sulle importazioni, produttività manifatturiera, classificazioni delle merci, codici di differenziazione del prodotto Rauch, dati NBER, l'indagine sui flussi di merci del 1997, commercio e immigrazione e il modello gravitazionale utile. UNIX è il sistema operativo utilizzato per la compilazione, ma il sito sottolinea che anche i PC dovrebbero avere accesso ai dati. 253. Aziende aperte Su OpenCorporates, i ricercatori hanno il lusso di cercare e trovare informazioni in uno dei più grandi database aperti di aziende al mondo. Queste informazioni vengono poi utilizzate da diversi gruppi in tutto il mondo, come banche, investigatori, ONG e giornalisti, per raccogliere informazioni e ottenere intelligence. I giornalisti hanno l'ulteriore vantaggio di poter accedere ai dati in tempo reale grazie all'API di OpenCorporates, nonché tramite i dati core in blocco o altri set di dati core. 254. Il nostro mondo nei dati Our World in Data raccoglie informazioni da diverse fonti in diversi ambiti e ne presenta dati quantificati. Dai dati sulla partecipazione delle donne al mondo del lavoro alle informazioni sulla percezione generale della corruzione nel settore pubblico e sulla disuguaglianza di reddito a livello globale, se l'argomento può essere affrontato in termini di dati, questo sito web potrebbe avere una voce dedicata. I giornalisti possono utilizzare questa fonte per trovare statistiche e numeri relativi a questioni sociali. 255. Scienza Po Sciences Po, o come è più comunemente noto, l'Istituto di Studi Politici, è una scuola che ha un'influenza innegabile nelle scienze sociali. In questo caso, la pagina di Thierry Mayer include file di dati che presentano dati di regressione sulla gravità e sui conflitti militari tratti da "Make Trade Not War", nonché set di dati sui potenziali di mercato, tra molti altri. I giornalisti che desiderano comprendere meglio le conclusioni raggiunte nelle riviste accademiche scopriranno molte informazioni navigando su questo sito. 256. Centro per i dati internazionali Fin dal suo debutto nel 1999, il Center for International Data si è dedicato alla sua missione di raccogliere, creare, migliorare e distribuire dati economici internazionali, sia offline che online. Sul sito web, i lettori possono accedere a informazioni come i dati sulle tariffe doganali statunitensi, le importazioni ed esportazioni mondiali e statunitensi e persino informazioni tratte dal Penn World Table. Grazie alla messa a disposizione del pubblico per scopi didattici e di ricerca, i giornalisti possono accedere e utilizzare gratuitamente questi dati. 257. Osservatorio della complessità economica L'Osservatorio della Complessità Economica, comunemente noto come OEC, consente a ricercatori, studenti, economisti e chiunque altro di visualizzare i dati sul commercio internazionale. Con i suoi temi accattivanti e l'interfaccia interattiva, questo sito offre ai ricercatori un'opportunità concreta di esplorare le informazioni sul commercio internazionale in modi mai visti prima. Per i giornalisti che amano vedere i dati economici prendere vita mentre li cercano, l'OEC è una risorsa inestimabile. 258. Dati della scheda di valutazione del college L'istruzione superiore è un argomento scottante in molti ambienti, con studenti e famiglie che desiderano conoscere il rendimento delle scuole e il livello di apprendimento degli studenti. Attraverso i dati del College Scorecard, il Dipartimento dell'Istruzione degli Stati Uniti fornisce a docenti e studenti tutte queste informazioni e molto altro ancora. Questi dati coprono il periodo dal 1996 al 2016 e includono dati attuali, dati del College Scorecard, dati sui guadagni post-scolastici e nuove informazioni del National Student Loan Data System. Si tratta di una fonte di informazioni aggiornate sull'istruzione post-secondaria che i giornalisti dovrebbero assolutamente consultare. 259. Set di dati energetici degli edifici commerciali Essendo un set di dati che si occupa principalmente di energia, COMBED vanta automaticamente la pretesa di essere unico. Se a ciò si aggiunge il fatto che i suoi dati vengono aggiornati più volte al minuto pur provenendo da un edificio commerciale, diventa chiaro che questo set di dati è unico nel suo genere. Per i giornalisti, queste informazioni sono incredibilmente utili quando si prepara un articolo sul consumo energetico. Accedere ai dati di COMBED è facile come scaricare e aprire un foglio di calcolo Excel. 260. Set di dati DRED La sezione DRED del database DRED sta per Dutch Residential Energy Dataset (Dati sull'energia residenziale olandese). Come suggerisce il titolo, questi dati misurano e studiano la quantità di energia consumata da una singola famiglia olandese. Informazioni su ambiente, occupazione, elettricità e informazioni generali sulla famiglia sono state monitorate in questo set di dati dal 5 luglio 2015 al 5 dicembre 2015. Qualsiasi giornalista che si occupi di ricerche sul consumo energetico trarrà beneficio dalla consultazione dei dati grezzi forniti qui. Le istruzioni per scaricare i dati in formato CSV sono disponibili direttamente sul sito web. 261. Set di dati ECO ECO, acronimo di Electricity Consumption and Occupancy (Consumo di Elettricità e Occupazione), è un progetto gestito e gestito dal Distributed Systems Group. L'idea alla base di questo progetto prevedeva che i ricercatori monitorassero i carichi e rilevassero le occupazioni in sei famiglie svizzere nel corso di 8 mesi. Questo sito offre accesso a tali informazioni, nonché istruzioni e link a pubblicazioni correlate. Grazie alla dashboard visivamente interattiva del sito, i giornalisti non dovrebbero avere problemi a tradurre la ricerca in qualcosa di coinvolgente. 262. Set di dati indiano per l'acqua e l'energia ambientale IAWE, acronimo di Indian Dataset for Ambient Water and Energy, è stato creato con l'obiettivo di monitorare il consumo energetico di un'abitazione di Nuova Delhi tramite misurazioni dell'elettricità provenienti da elettrodomestici, contatore elettrico e quadro elettrico. A causa di interruzioni, differenze nell'approvvigionamento idrico, interruzioni di pacchetti e fluttuazioni di tensione, l'iAWE ha riscontrato problemi tipici del monitoraggio dei consumi energetici in India. Si tratta di dati estremamente utili per i giornalisti quando discutono dei modelli di consumo energetico. 263. Elettricità a livello di elettrodomestici nel Regno Unito UK Domestic Appliance-Level Electricity, o UK-DALE, è il nome dato a un set di dati che monitora e registra la domanda di energia in un gruppo di cinque famiglie. Ogni sei secondi, UK-DALE misura la domanda sia dalla rete elettrica principale che dai singoli elettrodomestici presenti in casa. I giornalisti interessati a vedere come le famiglie del Regno Unito utilizzano l'energia possono sicuramente trarre vantaggio da UK-DALE. I dati sono accessibili ed è disponibile un documento che descrive il sistema. 264. ArcGIS ArcGIS Hub è una piattaforma che organizzazioni e singoli individui possono utilizzare per raggiungere obiettivi attraverso iniziative a livello di sito. Con modelli di pagina, guide dettagliate ed esempi disponibili per la consultazione, questo sito è un'eccellente risorsa per ambiziosi promotori di iniziative social. Inoltre, le informazioni disponibili nella scheda Open Data ospitano centinaia di dataset nella sola categoria "Disastri". ArcGIS Hub è utile in diversi modi, sia per i giornalisti che ricercano dati sia per chi li contribuisce. 265. Cambridge GIS Cambridge GIS è il repository di dati aperti della città di Cambridge, Massachusetts. Ad eccezione dei file troppo grandi per essere scaricati tramite questo repository GitHub, la maggior parte dei set di dati della città è disponibile su questa pagina. I singoli set di dati disponibili includono distretti commerciali, servitù di passaggio, distretti di zonizzazione, risultati del censimento, cimiteri e altri punti di riferimento e caratteristiche che possono essere quantificati dai dati. Un giornalista alla ricerca di informazioni locali troverà tutto ciò che cerca e molto altro su questo sito. 266. Geo-Wiki.org Come risorsa, Geo-Wiki è un sito dedicato a quello che definisce il "movimento della citizen science". Qui, i cittadini sono incoraggiati a cimentarsi nel monitoraggio dell'ambiente. I ricercatori possono trovare le ultime notizie nella barra laterale, insieme ai nomi delle pubblicazioni e ai download gratuiti di dataset e software. Gli strumenti che il sito rende accessibili includono mappe, caricamento di dati personali, convalide e hackathon, scaricabili in formato Excel e file zip. 267. OpenStreetMap I dati estratti da OpenStreetMap provengono dal progetto OpenStreetMap, il tentativo online in corso di creare una mappa del mondo attraverso le modifiche e gli sforzi della comunità globale di utenti. Per iniziare a utilizzare questa fonte di dati, tutto ciò che gli editori di contenuti devono fare è scegliere il continente preferito e poi trovare il paese desiderato. Il download di questi dati è gratuito e, di norma, i dati vengono aggiornati quotidianamente. 268. Dati aperti HIFLD Gestito e mantenuto dal Dipartimento per la Sicurezza Interna, HIFLD (Homeland Infrastructure Foundation-Level Data) rende i dati geospaziali di pubblico dominio. Questi dati vengono distribuiti con l'esplicito scopo di fornire supporto e informazioni per la ricerca e la preparazione nella comunità. Questi dati possono essere scaricati in formato Shapefile e CSV e possono anche essere visualizzati sul web. Per gli editori, HIFLD Open Data rende i dati geospaziali più visivi e coinvolgenti che mai. 269. OpenAddresses OpenAddresses è specializzato nell'infrastruttura e nella raccolta di indirizzi. Basato in gran parte sull'impegno della comunità, questo sito utilizza GitHub come piattaforma di sviluppo. Qui, gli utenti possono posizionare gli indirizzi su una mappa dopo averli aggiunti al database oppure possono prelevare i dati e iniziare subito la geocodifica. Con tutti i dati e gli indirizzi aperti e che richiedono solo l'attribuzione, gli aggiornamenti regolari dei dati e il potenziale di progresso nella geocodifica rendono OpenAddresses un progetto molto interessante. 270. Open Data LMU Open Data LMU si basa in larga misura sui dati di OpenStreetMap per supportare lo sviluppo del Fast Reverse Geocoder. Ciò significa che l'applicazione è in grado di rilevare rapidamente una posizione su una mappa e di trovare un indirizzo completo in base a quel punto. Questo potrebbe potenzialmente essere applicato anche a quartieri e contee. Questa pagina web ospita una serie di link relativi all'applicazione, tra cui codice sorgente, set di dati, tabelle di ricerca e risoluzioni di OpenStreetMap. 271. Esploratore di dati ambientali Con Environmental Data Explorer, giornalisti, ricercatori e studenti possono scaricare ed esplorare gli stessi set di dati utilizzati dal Programma delle Nazioni Unite per l'Ambiente (UNEP) e dalle sue organizzazioni affiliate e partner. Le ricerche possono essere circoscritte per regione ed effettuate utilizzando uno o più dei 500 filtri disponibili. Inoltre, i set di dati includono categorie come salute, PIL, clima, emissioni e acqua dolce, che possono essere visualizzate direttamente sul sito in formato grafico, tabella o mappa. 272. Gruppo della Banca africana di sviluppo Il sito del Gruppo della Banca Africana di Sviluppo è la prima tappa per un giornalista alla ricerca di informazioni e indicatori statistici relativi al continente africano. Gli utenti, scorrendo il catalogo dati, possono filtrare i set di dati per fonte, argomento e regione. Per chiunque desideri approfondire l'argomento in questione, il sito offre anche link a un elenco impressionante di pubblicazioni, tra cui titoli come l'African Economic Outlook e l'African Statistical Yearbook. 273. Genomic Data Commons (GDC) Il sito Genomic Data Commons dell'NCI ospita uno dei più completi archivi di dati sul cancro disponibili sul web, focalizzato sull'area degli studi genomici sul cancro. Il portale dati di questo sito ospita migliaia di casi e copre 38 tipi di malattie, inclusi 39 progetti, ed è accessibile gratuitamente. Poiché i dati vengono inviati principalmente da istituzioni e ricercatori, l'accuratezza di queste informazioni lo rende una fonte di dati ideale per i giornalisti. 274. Database PhysioBank I database PhysioBank rendono i dati fisiologici accessibili al pubblico. Questi database sono suddivisi in due categorie principali: database di forme d'onda e database clinici. Tra le sottocategorie di forme d'onda ci sono database di immagini, database di intervalli interbattito, database sintetici, database di andatura ed equilibrio, database ECG e database multiparametrici. Un assaggio delle informazioni pure che ne derivano include dati sui parametri vitali rilevati al letto del paziente, sulla saturazione dell'ossigeno e persino sulle malattie cardiovascolari. Giornalisti e studiosi del corpo umano possono trovare qui alcune informazioni. 275. Banca dati sulla copertura Medicare Il database Medicare Coverage, gestito dai Centers for Medicare & Medicaid Services tramite il Dipartimento della Salute e dei Servizi Umani, offre ai ricercatori pieno accesso a una vasta gamma di informazioni sui servizi medici. Sono disponibili informazioni su patologie croniche, spesa farmaceutica, modelli clinici elettronici, sistema di recupero crediti e sovvenzioni per la ricerca e la dimostrazione. Per i dati tratti direttamente dalla fonte, questo è il sito online più completo e completo del suo genere. 276. Dati sui pagamenti aperti Quando la maggior parte delle persone va dal medico, in genere non si sofferma a riflettere se il proprio medico di base stia beneficiando finanziariamente della collaborazione con le aziende sanitarie. Open Payments informa il pubblico su eventuali pasti, ricerche, regali, compensi per conferenze e spese di viaggio che il medico o l'ospedale hanno ricevuto dalle aziende. I giornalisti alla ricerca di un articolo di forte impatto possono utilizzare il data explorer per visualizzare le informazioni o cliccare sulla scheda per scaricare direttamente i dati. 277. FlickrLogos È parzialmente scritto nel nome, ma FlickrLogos si riferisce a un set di dati composto da loghi aziendali fotografati in diverse posizioni. Gestita dal Multimedia Computing and Computer Vision Lab dell'Università di Augusta, questa raccolta è stata originariamente compilata con l'intento di addestrare i computer a riconoscere loghi e testo. Per rimanere aggiornati sui progressi compiuti da questo programma degno di nota, non può far male scaricare questo set di dati e scoprire di cosa si tratta. 278. ImageNet ImageNet è un database ricco di immagini organizzate da WordNet. Il sito ospita sfide annuali, consultabili anche dopo la chiusura, incentrate sulla creazione di algoritmi in grado di eseguire attività specifiche. ImageNet ospita anche numerose pubblicazioni, citazioni e slide. Gli editori di contenuti orientati alla tecnologia avrebbero ogni motivo di utilizzare l'opzione Explorer per comprendere la struttura di WordNet e la mappa del cloud. 279. Set di dati sui cani di Stanford Il dataset Stanford Dogs contiene tantissime immagini e foto di diverse razze canine. Con 120 diverse razze di cani incluse e oltre 20.000 immagini individuali, questo database basato su ImageNet offre ai ricercatori numerose immagini con cui lavorare mentre insegnano alle macchine a riconoscere ogni razza canina. Sul sito, è possibile cliccare e leggere i link a diverse pubblicazioni che illustrano l'uso dei dataset per insegnare ai computer il riconoscimento delle immagini, oltre a scaricare il dataset. 280. Banca dati SUN Il database SUN è il sito di un progetto creato per consentire alla comunità di ricerca di compiere progressi in settori come la visione artificiale e la grafica, il data mining, l'apprendimento automatico e le neuroscienze, tra gli altri. Con oltre 131.000 immagini e quasi 4.000 categorie di oggetti nei suoi indici, questo sito è il più completo possibile. Per gli editori interessati a questo database e a ciò che i ricercatori sono stati in grado di fare utilizzandolo, questa è una fonte di dati che vale la pena esplorare. 281. Il set di dati Oxford-IIIT Pet L'Oxford-IIIT Pet Dataset è un sito che funge da complemento a un articolo pubblicato alla Conferenza IEEE del 2012 su Computer Vision e Pattern Recognition e ospita il set di dati originale utilizzato per gli scopi dell'articolo. Queste immagini sono state organizzate in circa 37 categorie di animali domestici, a cui si aggiungono altre 200 immagini associate a ciascuna classe coinvolta. Inoltre, questi dati possono essere scaricati direttamente tramite i link presenti sulla pagina web. 282. Il set di dati del genoma visivo La Visual Genome API è il risultato finale del duro lavoro svolto da diversi studenti e professori associati della Stanford University. Con diversi articoli pubblicati nel tentativo di creare un'API in grado di valutare e descrivere le immagini, il programma ha risposto con successo a oltre un milione di domande, valutando oltre 100.000 immagini. Questa API rappresenta un progresso nel campo dell'informatica e dei settori correlati e il set di dati può essere scaricato direttamente dal sito. 283. Volti di YouTube Il database YouTube Faces si concentra sullo sviluppo di una soluzione al problema del riconoscimento facciale automatico nei video. Complessivamente, il dataset contiene oltre 3.000 video tratti da YouTube, con quasi 1.600 individui, per una lunghezza media di circa 181 fotogrammi. L'obiettivo finale è creare un algoritmo in grado di creare etichette che identifichino la persona presente nel video. I dati, insieme alle informazioni sugli errori e ai metodi di descrizione, sono tutti disponibili per la visualizzazione direttamente sul sito. 284. Repository del set di dati KEEL Il repository di dataset KEEL contiene il dataset di un software open source basato su Java, progettato per supportare vari tipi di scoperta di dati conoscitivi. KEEL, noto semplicemente come Knowledge Extraction based on Evolutionary Learning, può essere addestrato per apprendere come aggiungere valori mancanti, modelli ibridi e metodi statistici per la valutazione di esperimenti, tra le altre attività. I download dei dataset e un elenco completo degli algoritmi presenti in KEEL possono essere scaricati direttamente dal sito. 285. Lending Club Il punto di forza di Lending Club è il suo status di prestatore peer-to-peer, che consente ai richiedenti di ricevere prestiti anche quando non hanno necessariamente un punteggio di credito sufficiente per ottenere un prestito da istituti di credito tradizionali. Oltre agli aspetti innovativi del funzionamento del sito, fornisce anche statistiche che includono i punti salienti della piattaforma, informazioni sui prestiti rifiutati, dati sulle performance degli investitori e persino un dizionario dati con dati storici. Questi dati generalmente partono dal 2007 e possono essere scaricati in formato CSV. 286. Museo di storia naturale Il Museo di Storia Naturale è considerato da molti uno dei musei più noti al mondo, ma la digitalizzazione e la possibilità di consultarne il catalogo attraverso il portale open data sarebbero probabilmente una novità per molti. Con 91 set di dati che includono collezioni di microfossili e fossili, nonché record di lotti indicizzati e altri materiali, i dati sono aperti al pubblico e scaricabili gratuitamente in diversi formati. 287. I vocabolari Getty Questo sito è perfetto per giornalisti ed editori che desiderano attenersi a determinate linee guida stilistiche nella descrizione e nella categorizzazione di opere d'arte, nomi di artisti, architettura, materiali e nomi geografici. Questo sito collega gli utenti direttamente ai database di vocabolari controllati che ricercatori e catalogatori devono conoscere per soddisfare gli standard internazionali. Almeno qui, niente è meglio dei Getty Vocabularies. I set di dati possono essere esplorati tramite testo o SPARQL e scaricati tramite il sito. 288. Corpus di indagini stilometriche CLiPS (CSI) Il CLiPS Stylometry Investigation Corpus probabilmente non è ciò a cui la maggior parte delle persone pensa quando sente le parole CSI, ma il corpus CSI è comunque un set di dati composto da recensioni e saggi di studenti. Oltre al testo in sé, la presenza di metadati e informazioni incorporate nel documento è considerata dal sito un'utilità multipla. Offerto e distribuito con licenza Creative Commons, il corpus richiede solo l'attribuzione dell'opera in cambio dell'utilizzo del set di dati. 289. Dipendenze universali v2 Universal Dependencies v2 è la seconda versione aggiornata del progetto Universal Dependencies, un progetto volto a sviluppare un'annotazione treebank che possa essere utilizzata in modo coerente con diverse lingue. Nella versione aggiornata, i ricercatori troveranno decine di treebank UD per diverse lingue, tra cui afrikaans, greco antico, giapponese, olandese, finlandese e cinese, oltre all'inglese. La versione più recente di Universal Dependencies può essere scaricata in fondo a questa pagina web. 290. Tubo flessibile Webhose è una fonte di dati di prim'ordine, prelevata direttamente dai repository del sito e resa pubblica. I ricercatori possono ordinare gli articoli di notizie per lingua: arabo, francese e olandese sono solo alcune delle lingue, con oltre 100.000 numeri di articolo. Inoltre, gli articoli di notizie in inglese sono ulteriormente suddivisi in categorie come intrattenimento e sport, da abbinare alle recensioni e ai post del forum. Editori digitali e ricercatori possono trarre vantaggio dall'esplorazione di questi dataset. 291. Dati Wiki Wikidata è una fonte sottovalutata di contenuti e idee per editori e ricercatori. Secondo questa pagina, esistono diversi modi per accedere al materiale presente nei data dump, sebbene l'uso di JSON sia quello che il sito raccomanda più vivamente. Disponibili e totalmente gratuiti sia per uso commerciale che non commerciale, tutti i dati disponibili qui sono accessibili e scaricabili gratuitamente con licenza Creative Commons. 292. Link Wiki Situato comodamente all'interno del framework di Google Code, Wiki Links è un progetto open source che mira a fornire a chiunque l'accesso a quel particolare, unico set di dati. Su questa pagina web, i ricercatori possono scaricare i testi README, i file di dati e la licenza Creative Commons. Gli editori o, in generale, gli utenti interessati alla tecnologia hanno molto da offrire quando consultano questo enorme set di dati. Basta navigare nel sito, cliccare e iniziare a scaricare i file. 293. Wordnet WordNet è un lessico inglese composto da componenti linguistiche, avverbi, nomi, aggettivi e verbi, suddivisi in gruppi distinti che vengono poi utilizzati per esprimere idee specifiche. Il risultato finale è uno strumento utile che categorizza le parole in base al loro uso e al loro significato, piuttosto che in base al suono che assumono quando vengono pronunciate. Le applicazioni di WordNet nella programmazione linguistica sono illustrate insieme alle numerose pubblicazioni e statistiche disponibili sul sito. 294. Atlante del cervello di Allen L'Allen Brain Atlas, creato dall'Allen Institute for Brain Science Resources, è uno strumento per studiare e approfondire la conoscenza del cervello umano e di come risponde sia in condizioni di salute che in presenza di malattia. Utilizzando l'atlante, i ricercatori possono apprendere di più sul cervello umano e sul suo sviluppo, nonché sul glioblastoma e sugli effetti del cancro sul cervello. I giornalisti che si occupano di questi argomenti possono visitare questo sito per reperire dati e informazioni. 295. NITR Il NITRC, o Neuroimaging Informatics Tools and Resources Clearinghouse, è il punto di riferimento per giornalisti ed editori per la neuroimmagine. Creato e promosso come un'iniziativa per la condivisione di dati sulla neuroimmagine, questo sito ospita dati provenienti da diversi progetti come il 1000 Connectome Project, l'Addiction Connectome Preprocessed Initiative e, rispettivamente, i progetti INDI-Prospective e Retrospective. I dati possono essere scaricati gratuitamente tramite il sito web. Le neuroimmagini acquisite in diverse fasi non sono mai state così accessibili. 296. Operatore sanitario giovane adulto Il progetto Human Connectome Project Young Adult è la continuazione dell'impegno continuo per creare una mappa accurata del connettoma umano, così come sarebbe visibile nella maggior parte degli adulti normali. In due fasi, 1200 adulti sani sono stati sottoposti a scansione combinando tecniche di risonanza magnetica funzionale a riposo e imaging a diffusione. Giornalisti ed editori alla ricerca di informazioni sul cervello non troveranno un altro sito con più dati sul connettoma umano nei giovani adulti sani. 297. Archivio dati NIMH Il NIMH Data Archive, o NDA in breve, non è tanto una fonte di dati indipendente quanto una piattaforma per la distribuzione e l'archiviazione di dati. Su questo sito web, sono disponibili dati raccolti nel corso di numerosi articoli e progetti di ricerca, oltre a metodi e strumenti che consentono analisi e collaborazione migliori. I riepiloghi dei dati sono disponibili gratuitamente e i fornitori di contenuti che riportano le ultime novità scientifiche possono utilizzare queste informazioni per diffondere notizie. 298. Neurodati NeuroData si dedica alla ricerca sulla relazione unica tra mente e cervello. Grazie all'impegno del sito per la scienza aperta e la riproducibilità della ricerca, i fornitori di contenuti hanno accesso a una pubblicazione e a diversi set di dati, accessibili tramite i link presenti sulla pagina web. Di particolare interesse per coloro che desiderano consultare i dati in prima persona è la disponibilità di codice e strumenti di analisi gratuiti, che rendono l'esplorazione del lavoro di NeuroData ancora più semplice. 299. NeuroElectro Il progetto NeuroElectro è stato ideato con l'intento di raccogliere le varie caratteristiche elettrofisiologiche associate a diversi tipi di neuroni e di aggregarle in un unico database. Questo progetto mira a studiare la relazione tra i neuroni, nel tentativo di studiare le differenze tra i vari tipi di neuroni. Il sito contiene link ad articoli ed elenca i tipi di neuroni e le proprietà elettrofisiologiche finora scoperte. I fornitori di contenuti possono fare affidamento su questo sito come fonte di dati sulle relazioni tra neuroni. 300. Serie di studi di imaging ad accesso aperto La serie Open Access di studi di imaging, nota anche come OASIS, è un progetto ideato con l'obiettivo di rendere accessibili alla comunità scientifica i set di dati delle risonanze magnetiche cerebrali. Giornalisti e ricercatori possono accedere a pubblicazioni che confrontano i dati delle risonanze magnetiche tra adulti, nonché a una scheda informativa completa tratta dall'articolo completo di OASIS che confronta e mette a confronto i risultati di oltre 400 soggetti. Le informazioni e gli strumenti possono essere scaricati dal sito web in diversi formati. 301. OpenfMRI Per i giornalisti che desiderano accedere ai set di dati MRI senza le complicazioni associate ad altri siti, l'impegno di OpenfMRI.org nel rendere i set di dati MRI accessibili al pubblico rappresenta uno sviluppo positivo. Proveniente direttamente dai ricercatori stessi, questo sito ospita una varietà di set di dati, come il set di dati di apprendimento della classificazione, il compito di scommesse miste e il compito di assunzione di rischi analoghi al palloncino. La varietà e la quantità di dati consentono ai ricercatori di trovare nuove strade di indagine attraverso questo sito. 302. Studyforrest Prendendo in prestito il suo nome dal famoso film Forrest Gump, studioforrest cerca di comprendere di cosa è capace il cervello quando deve lavorare a un livello superiore, confrontandosi con una stimolazione naturale ma altrettanto complessa. Ciononostante, il sito riconosce che la quantità di dati fMRI raccolti da questi studi ha applicazioni più ampie di quanto sembri a prima vista. I fornitori di contenuti possono consultare le 19 pubblicazioni che hanno utilizzato studioforrest dati e può persino accedervi direttamente. 303. Database aperto di cristallografia Come ci si aspetterebbe dal titolo, il Crystallography Open Database è una raccolta di 385.697 minerali e composti metallo-organici, strutture cristalline organiche e inorganiche, con la notevole eccezione dei biopolimeri. I fornitori di contenuti che desiderano approfondire le strutture cristalline possono effettuare la ricerca per formula strutturale o eseguire una query di ricerca corrispondente con la possibilità di navigare. Questo sito contiene anche software e dati che lo rendono particolarmente prezioso nel campo della chimica. 304. Archivio degli esopianeti della NASA Considerata da tempo una delle principali fonti di informazioni sullo spazio, la NASA continua la sua tradizione di risorsa inestimabile con il suo archivio Exoplanet. Questo sito ospita una serie di strumenti e software interattivi come il Transit and Ephemeris Service, il Periodogram, il Confirmed Planets Plotting Tool e la possibilità di caricare file e tabelle di ricerca in modo interattivo. I fornitori di contenuti alla ricerca di approfondimenti esclusivi possono utilizzare questi dati per farlo la prossima volta che gli esopianeti faranno notizia. 305. Sloan Digital Sky Survey La creazione di mappe tridimensionali dell'Universo è alla portata di chiunque grazie allo Sloan Digital Sky Survey, o SDSS. Giornalisti e fornitori di contenuti possono accedere ad algoritmi, dati di imaging, set di dati, tutorial e all'ulteriore sviluppo di materiali visivi per l'educazione del pubblico, sia formale che informale. Il sito discute anche esplicitamente della possibilità di rendere i propri dati accessibili al pubblico tramite notizie e social media. Si tratta di uno strumento visivo inestimabile per i fornitori di contenuti. 306. StatSci.org Statsci.org offre un elenco completo di risorse a cui il pubblico può accedere e che può utilizzare in base alle proprie esigenze specifiche. Alcune delle informazioni includono l'Electronic Dataset Service e casi di studio compilati dall'UCLA. Oltre ai set di dati grezzi, questa pagina contiene anche link a libri di testo, tra cui "Handbook of Small Data Sets" e "Case Studies in Biometry". I fornitori di contenuti in cerca di informazioni statistiche non possono sbagliarsi dando un'occhiata a questo sito. 307. ERIC ERIC, noto anche come Institute of Education Sciences, è una risorsa che funge da motore di ricerca per chiunque cerchi informazioni nel campo dell'istruzione. La ricerca preliminare offre anche la possibilità di filtrare esclusivamente le informazioni sottoposte a revisione paritaria e i testi integrali basati su ERIC. Considerata la frequenza con cui i budget per l'istruzione e i metodi di insegnamento sembrano essere al centro dell'attenzione dei media, questa è una fonte di dati che i giornalisti dovrebbero tenere a mente. 308. NTIS Creato poco dopo la conclusione della Seconda Guerra Mondiale, il NTIS (National Technical Information Service) è stato creato con l'obiettivo di utilizzare i dati per aiutare le agenzie federali a prendere decisioni informate basate sui dati stessi. Originariamente, questa agenzia era il deposito dati del governo degli Stati Uniti nel campo della ricerca scientifica. Oggi, il sito ospita milioni di pubblicazioni su una miriade di argomenti. Le sole informazioni storiche rendono questo sito una fonte di dati valida per giornalisti ed editori. 309. Certificato Open Data Il sito web dell'ODI (Open Data Institute) ospita il cosiddetto Certificato Open Data, uno strumento gratuito disponibile online, sviluppato espressamente per esaminare criticamente e riconoscere la qualità dei dati aperti. Dal punto di vista di un editore o di un giornalista, il sito ospita anche numerosi set di dati su argomenti che spaziano dagli elenchi di sovvenzioni agli avvisi sulle allergie, oltre a elenchi scaricabili in formato CSV. 310. Archivio GitHub GitHub è senza dubbio uno dei repository e archivi di dati più popolari e conosciuti su Internet grazie alla sua facilità di collaborazione, alle capacità di archiviazione e all'accessibilità per quanto riguarda la codifica. Che si tratti di tentativi di creare bot in grado di eseguire determinate attività o di sviluppare applicazioni, GitHub è un sito in cui editori di contenuti e giornalisti possono facilmente imbattersi in prodotti potenzialmente degni di nota. L'archivio è accessibile seguendo le istruzioni del tutorial per JSON o Big Query. 311. SocioPatterns SocioPatterns è un progetto incentrato sull'individuazione di modelli nell'attività umana e nelle dinamiche sociali attraverso i dati. Come previsto da un obiettivo così ampio, le informazioni del sito sono state utilizzate in pubblicazioni che affrontano una vasta gamma di argomenti, dalla diffusione delle malattie a casi di studio sulle differenze tra la personalità online e quella offline degli individui. I set di dati sono disponibili per la consultazione, così come gli articoli pubblicati, contenenti informazioni che gli editori troveranno probabilmente rilevanti in un momento o nell'altro. 312. Mappa Indie Indie Map è il risultato dell'analisi di informazioni provenienti da oltre 2.000 dei siti più frequentati di IndieWeb e della loro trasformazione in formati visivi interattivi, come un'API Social Graph, un set di dati con funzionalità di query SQL e le informazioni grezze analizzate su un totale di 5,7 milioni di pagine web. Gli editori digitali interessati al software open source e a ciò che questi dati potrebbero rivelare su queste comunità online possono accedere alle informazioni direttamente dal sito web. 313. Università Simon Fraser Simon Fraser continua a consolidare il suo status di università prestigiosa con la disponibilità del suo dataset relativo a "Statistiche e social network dei video di YouTube". Estraendo informazioni da un crawler che ha utilizzato l'API di YouTube per trovare video, i file contengono dati su milioni di video e dataset di informazioni sugli utenti. Il sito specifica che il download del dataset è riservato esclusivamente a scopi accademici, ma è possibile trovare fonti giornalistiche e riferimenti su questo progetto tramite il sito. 314. ACLED ACLED, o Armed Conflict Location and Event Data Project, offre dati pubblici sulle proteste e la violenza politica nei paesi in via di sviluppo. Le informazioni fornite includono il numero di vittime, informazioni sulle date e sui luoghi delle violenze o delle proteste, i nomi dei gruppi coinvolti e dati sulle rivolte e sugli scontri violenti verificatisi. ACLED fornisce accesso a rapporti periodici, pubblicazioni e immagini, nonché ai dati disponibili per il download sul sito. 315. Istituto canadese di informazione giuridica Il Canadian Legal Information Institute, o CanLII come viene comunemente chiamato, è un sito che offre libero accesso a statuti e relativi regolamenti, giurisprudenza di tribunali di varie giurisdizioni, tra cui la Corte Suprema del Canada, le corti provinciali e d'appello e la Queen's Bench, insieme a sentenze di vari tribunali amministrativi e organi statutari. Con 301 banche dati giurisprudenziali e oltre 140.000 decisioni giudiziarie disponibili per la consultazione, giornalisti ed editori digitali che si occupano di argomenti legali trarranno beneficio dall'aggiunta di questo sito ai preferiti. 316. Centro per la pace sistemica Il Center for Systemic Peace, o CSP, è un'organizzazione che si dedica all'analisi dei sistemi globali allo scopo di affrontare il problema della violenza politica. Su questo sito, i giornalisti che svolgono ricerche in questo ambito avranno accesso ad analisi sui conflitti in Africa, sulle tendenze dei conflitti a livello globale, tra gli altri, insieme a riassunti delle tre principali pubblicazioni dell'organizzazione, come Third World War e il Global Report e la Biblioteca Virtuale del CSP. 317. Progetto Correlati della Guerra L'obiettivo del progetto Correlates of War, o COW, è quello di contribuire alla raccolta e alla distribuzione di dati quantitativi, come nel caso delle relazioni internazionali. In linea con il suo impegno nell'applicazione dei principi scientifici ai dati sulle relazioni internazionali, COW rende i suoi set di dati liberamente accessibili al pubblico. Questi database contengono dati su informazioni che giornalisti e ricercatori possono utilizzare, come i conflitti militarizzati tra stati, i membri del sistema statale, le capacità materiali nazionali e le alleanze formali. 318. Indagine sociale europea L'Indagine Sociale Europea, o ESS, è un'indagine condotta in tutta Europa con l'obiettivo di misurare i diversi modelli di comportamento, atteggiamenti e convinzioni delle diverse popolazioni in diverse nazioni. Poiché i giornalisti sono spesso interessati a conoscere l'opinione del pubblico, la serie ESS Topline, che copre argomenti che spaziano dal benessere personale e sociale degli europei, agli atteggiamenti nei confronti del welfare e persino alla presenza di discriminazione basata sull'età nel Regno Unito, può rafforzare una storia in più di un modo. 319. Fondo per la Pace Il Fondo per la Pace è un'organizzazione che si concentra sulla prevenzione dei conflitti e sulla sicurezza attraverso lo sviluppo di strumenti che possono essere utilizzati per mitigarli. Nel corso della sua carriera, il Fondo per la Pace ha collaborato con giornalisti, ONG, organizzazioni locali e le loro controparti internazionali, nonché con i governi. Che si tratti di cercare tendenze, analisi comparative e dati globali, giornalisti ed editori possono trovare i materiali desiderati tramite lo strumento di esplorazione dati integrato nel browser del sito. 320. L'indagine sociale generale Il lavoro del General Social Survey (GSS) si concentra sulla raccolta di informazioni su vari aspetti della moderna società americana, al fine di tenersi aggiornati sulle tendenze e sui modelli comportamentali e di atteggiamento della popolazione. Con questa pratica di monitoraggio delle tendenze che risale al 1972, i dati storici rappresentano da soli una miniera d'oro per i giornalisti che desiderano esplorare le tendenze. Utilizzando il GSS Data Explorer, ricercatori e giornalisti possono scaricare, esaminare e persino valutare i dati. 321. Gesis GESIS è un istituto infrastrutturale tedesco dedicato alle scienze sociali. Offre diverse discipline, oltre a lavori di ricerca e servizi che spaziano dalla metodologia di indagine all'informatica applicata, alla raccolta dati, alla pianificazione di studi e all'analisi dei dati, per citare solo alcune delle attività di GESIS. I giornalisti interessati ad argomenti come l'approccio metodologico di GESIS, l'utilizzo di immigrati sovraqualificati e altro ancora possono trovare numerose informazioni nella sezione pubblicazioni. 322. Futuri religiosi globali Da argomenti come l'aborto all'educazione sessuale, la religione è così pervasiva che persino nei paesi in gran parte laici la posizione di una persona su temi sociali difficili può essere influenzata dalla fede religiosa. In Global Religious Futures, il Pew Research Center esamina le tendenze negli atteggiamenti e nelle convinzioni delle persone in relazione alle religioni globali. I giornalisti che desiderano approfondire dettagli come l'influenza dell'evangelicalismo in politica o gli atteggiamenti verso la lapidazione possono utilizzare Data Explorer per trovare risposte nei numeri. 323. Indice per la gestione del rischio L'Index for Risk Management, noto anche come INFORM, è un punto di riferimento a cui ricercatori e giornalisti possono rivolgersi per la valutazione del rischio in situazioni di rischio di crisi umanitaria o catastrofe. L'organizzazione offre link a dati su argomenti come i tassi di mortalità infantile, l'indice di disuguaglianza di genere e la frequenza della siccità, tra gli altri dati. È anche possibile consultare e scaricare i dati di INFORM o accedervi tramite la mappa interattiva del sito. 324. INED L'INED, o Istituto Francese per gli Studi Demografici, è una delle fonti di dati e statistiche più prolifiche che un giornalista possa trovare su Internet. Con oltre 70 pubblicazioni analizzate e pubblicate ogni anno, che illustrano la popolazione mondiale in formato grafico, oltre a statistiche che misurano questioni come la differenza di fertilità tra i sessi, da abbinare a metodi di informazione e ricerca. I ricercatori che cercano risultati accurati da una fonte attendibile li troveranno nell'INED. 325. Archivio delle reti internazionali L'International Networks Archive di Princeton offre una combinazione unica di pubblicazioni, con ricerche come l'Human Development Report 1999 e Global Networks: A Journal of Transnational Affairs disponibili per la consultazione su questo sito. Su questo sito, i giornalisti potranno consultare i dati storici pubblici e aggiornati dell'archivio. Gli argomenti trattati includono sanità, armi, libri, musica, migrazioni, regioni, Internet, politica e trasporti, solo per citarne alcuni. 326. Programma internazionale di indagine sociale Fondato fin dall'inizio come strumento di collaborazione tra persone di diverse nazioni, l'International Social Survey Programme (ISSP) ha condotto ogni anno indagini su una varietà di argomenti rilevanti nel campo delle scienze sociali. Nel corso degli anni, gli argomenti trattati hanno incluso, tra gli altri, la disuguaglianza sociale, l'identità nazionale, la cittadinanza, le reti sociali e l'orientamento al lavoro. I risultati dell'ISSP possono essere ricercati per anno o per argomento e scaricati dal sito web. 327. Associazioni di studi internazionali Giornalisti o altri ricercatori alla ricerca di un dibattito informativo e intellettuale su temi inerenti a questioni transnazionali, internazionali e globali: l'International Studies Association (ISA) riunisce le competenze di ricercatori, accademici ed esperti di politica, tra gli altri. L'Enciclopedia degli Studi Internazionali dell'ISA presenta saggi sottoposti a revisione paritaria, ricchi di approfondimenti su argomenti riguardanti la ricerca in questo campo, nonché saggi che forniscono informazioni da una prospettiva più storica. 328. Dati transnazionali sul Web L'utilissima pagina del professor James W. McGuire della Wesleyan University, opportunamente intitolata "Dati transnazionali sul Web", è una risorsa ricca di link a dati rilevanti sull'economia e sullo sviluppo globale. Tra i set di dati che i giornalisti interessati potranno trovare qui, ci sono dati sulla pianificazione familiare, il rendimento scolastico, la denutrizione, l'acqua e i servizi igienico-sanitari, l'orientamento al libero mercato e informazioni specifiche per l'America Latina e i Caraibi, solo per citarne alcuni. Le fonti di dati qui elencate sono impeccabili. 329. Centro norvegese per i dati di ricerca Il Norwegian Center for Research Data è un'istituzione che supporta e supporta i ricercatori in diversi ambiti della ricerca empirica, come la privacy, la raccolta e l'analisi dei dati, la valutazione metodologica e l'etica nella ricerca. Qui, i ricercatori troveranno software e strumenti sviluppati e raccomandati dal centro, da integrare con un'ampia raccolta di dati regionali, individuali e istituzionali, accessibili gratuitamente. Anche i risultati del centro nel Rapporto Annuale sulla Ricerca e la Privacy sono sempre una lettura interessante. 330. IPUMS IPUMS non è necessariamente una fonte di dati nel senso che la maggior parte delle persone si aspetterebbe sentendo il termine, ma è comunque una fonte utile per i giornalisti grazie al suo ruolo di aggregatore, archiviatore e organizzatore dei dati forniti da altre entità. Ad esempio, IPUMS USA funge da sorta di archivio dati per i microdati del censimento statunitense, con dati che risalgono al 1790 e arrivano fino ai giorni nostri. 331. ND-GAIN L'indice nazionale ND-GAIN, un'iniziativa promossa dalla Global Adaptation Initiative dell'Università di Notre Dame, misura la resilienza di un paese ai cambiamenti climatici e ad altre forze della globalizzazione. Questo indice include punteggi di vulnerabilità in aree come alimentazione, salute, infrastrutture ed ecosistemi, nonché punteggi di preparazione per un massimo di 500.000 punti dati. Contenente due decenni di dati, dal 1995 al 2014, in formato CSV, queste informazioni sono disponibili per il download. 332. Polizia del Regno Unito Su questo sito, giornalisti ed editori possono accedere a dati aperti sullo stato delle attività di polizia e della criminalità nel Regno Unito. I dati contengono statistiche utili sulle squadre di quartiere, sulle singole forze di polizia, sul numero di fermi e perquisizioni, nonché statistiche sulla criminalità e sui relativi esiti. Utilizzando questo sito, i giornalisti possono effettuare confronti tra le forze di polizia e individuare le tendenze nella giustizia penale. Ottenere informazioni è semplice: basta scegliere l'intervallo di date, la forza di polizia e attendere il file. 333. Pagina dei dati internazionali generali di Paul Hensel La pagina "General International Data Page" di Paul Hensel è una serie di link raggruppati sotto le voci "Stati e Sistema Internazionale", "Dati Geografici Internazionali", "Capacità degli Stati", "Raccolte di Dati di Scienze Sociali" e "Alleanze, Trattati e Organizzazioni". Ogni risorsa elencata in questa pagina web contiene dati all'avanguardia che conferiscono automaticamente credibilità al lavoro di un giornalista. Queste fonti possono includere qualsiasi cosa, dai software ai set di dati e agli archivi, ma ogni link incluso qui è utile. 334. TRAC Nel mondo post-11 settembre, il terrorismo e i suoi effetti devastanti sulle popolazioni locali hanno ricevuto grande attenzione da parte dei media. TRAC, su trackingterrorism.org, fornisce ai ricercatori analisi e informazioni approfondite su questi argomenti. Questo sito contiene informazioni su diverse migliaia di gruppi terroristici. Il prezzo di 500 dollari per singolo utente potrebbe essere un po' alto all'inizio, ma vale ampiamente la pena pagare per chi scrive di violenza e guerra al terrorismo. 335. Dipartimento di giustizia penale del Texas Interessati al funzionamento interno del sistema giudiziario penale del Texas? Curiosi di scoprire chi si trova attualmente nel braccio della morte? Il Dipartimento di Giustizia Penale dello Stato del Texas dispone di numerose informazioni, dalle ultime dichiarazioni dei prigionieri prima dell'esecuzione, alle statistiche sul braccio della morte per genere ed etnia, oltre ad altre statistiche e schede informative sulle esecuzioni. Il Dipartimento di Giustizia Penale del Texas è una fonte affidabile per i giornalisti. 336. Sistema integrato delle organizzazioni della società civile Il Sistema integrato delle organizzazioni della società civile, o iCSO, è progettato per semplificare la comunicazione tra le organizzazioni della società civile e il Dipartimento degli Affari Economici e Sociali. Oltre all'efficacia del solido framework, la pagina web include set di dati e categorie per ulteriori informazioni. I dati possono essere ordinati per settore, tipo di organizzazione, regione interessata e status ECOSOC dell'organizzazione. Si tratta di una fonte di dati che i giornalisti possono sicuramente utilizzare per reperire fonti. 337. Università in tutto il mondo Universities Worldwide è un database di università di tutto il mondo a cui è possibile accedere per ulteriori informazioni. La ricerca può essere effettuata per elenco mondiale o filtrata esclusivamente per le università degli Stati Uniti, e gli utenti possono anche aggiungere i propri link durante il processo. Gli editori di dati con un numero considerevole di studenti, o anche i giornalisti che desiderano verificare un fatto, possono trarre vantaggio dalla possibilità di accedere a un database come questo on-demand. 338. Programma di dati sui conflitti di Uppsala Questo è il sito web dell'Uppsala Conflict Data Program, uno dei più noti fornitori di informazioni sulla violenza organizzata. Nel corso degli ultimi 40 anni di attività, il programma si è affermato anche per il suo lavoro di raccolta dati sulla guerra civile. I giornalisti possono utilizzare questa fonte di dati per cercare informazioni su conflitti e attori specifici, e possono anche accedervi per scaricarli. 339. Pop mondiale Il progetto WorldPop, risultato finale della fusione dei progetti AsiaPop, AfriPop e AmeriPop, è dedicato all'archiviazione di set di dati demografici spaziali che a loro volta trovano applicazione come mezzo per fornire supporto agli sforzi di soccorso in caso di calamità. Editori di contenuti e giornalisti impegnati in cause di giustizia sociale o che in altro modo ricercano opportunità efficaci di soccorso in caso di calamità potrebbero essere interessati a questo progetto. I ricercatori possono scaricare i dati o consultare i casi di studio online. 340. Bozza Express DraftExpress è forse più noto su Internet per le sue ricerche, i report di scouting pre-draft, le simulazioni di scelte al draft e la meticolosa manutenzione delle altezze e delle misure dei giocatori, in linea con i dati storici. I prospetti menzionati su questo sito provengono dalla NCAA, dalle scuole superiori e persino dai campionati internazionali. I giornalisti sportivi o i fornitori di contenuti che intendono offrire commenti relativi al basket possono consultare le statistiche di DraftExpress per discutere di giocatori ed eventi sportivi in tempo reale. 341. Scommessa Betfair è forse meglio conosciuto come il sito di riferimento per le scommesse sportive. Tuttavia, di particolare interesse per i fornitori di contenuti e gli editori digitali è la disponibilità di informazioni storiche dettagliate sui dati e sulla cronologia dei prezzi del sito. I dati sono accessibili e scaricabili con o senza la marca temporale dettagliata, offrendo anche dati approfonditi sulle corse dei cavalli e sulle altre offerte di mercato del sito da giugno 2004 a ottobre 2017. 342. CRICSHEET Cricsheet offre un servizio simile a quello di molti altri hub di dati sportivi, ma è un sito specializzato esclusivamente nella fornitura di dati sul cricket. Il sito offre statistiche e dati palla per palla da diversi campionati, tra cui l'Indian Premier League, le partite internazionali di un giorno, nonché dati per squadre maschili e femminili, solo per citare alcune delle categorie più ampie. Gli editori di contenuti alla ricerca di dati storici sul cricket possono scaricare i dati in formato CSV o XML. 343. Dati di serie temporali transnazionali Con dati politici, economici, legislativi e sui conflitti interni che coprono oltre 200 anni di dati in oltre 200 nazioni in tutto il mondo, il Cross-National Time-Series Data Archive è uno dei set di dati più completi su Internet. I dati vengono archiviati, il più comodamente possibile, in un foglio di Google Drive che si apre automaticamente cliccando sulla categoria del file. In cambio di una citazione, queste informazioni possono essere visualizzate in parte o per intero, a seconda delle esigenze del ricercatore. 344. Ford GoBike Ford GoBike è il nome del programma di bike sharing utilizzato nella Bay Area. Sebbene molte persone utilizzino senza dubbio questo programma per mantenersi in forma ed evitare di utilizzare combustibili fossili, il sistema di bike sharing ha monitorato i dati di viaggio. Naturalmente, queste informazioni non includono nulla che possa identificare i ciclisti, ma i dati includono dettagli come il numero della bicicletta, l'orario di partenza e di arrivo, il tipo di ciclista e le stazioni di arrivo e partenza. Vale la pena approfondire l'argomento. 345. Traffico marittimo Marine Traffic è un'azienda che traccia e tiene traccia dei movimenti delle navi e dei viaggi oceanici utilizzando i big data. Il tipo di informazioni coperte dai servizi API AIS di Marine Traffic includeva imbarcazioni, informazioni sui viaggi e dati sulle imbarcazioni in questione, come arrivi previsti, persino incidenti, foto, dettagli delle imbarcazioni e previsioni di viaggio. Tuttavia, questo sito offre piani tariffari, quindi non è chiaro quanta ricerca possa essere effettuata gratuitamente. 346. Bixi I programmi di bike sharing Bixi sono forse tra i più noti in alcune delle più grandi città del Nord America. È interessante notare che il marchio pubblica anche dati aperti che forniscono informazioni su aspetti come la cronologia dei viaggi e lo stato delle stazioni, nonché confronti che potrebbero essere effettuati tra utenti abbonati e utenti occasionali. I giornalisti locali che indagano su come le persone utilizzano e integrano i programmi di bike sharing nelle loro vite hanno tutte le ragioni per approfondire questi dati. 347. Banca dati degli incidenti Da Amelia Earhart al volo indonesiano AirAsia 8501, gli incidenti aerei e di volo sono un argomento che attira l'attenzione di tutti. L'Accident Database archivia e conserva i dati sugli incidenti aerei verificatisi tra il 1920 e il 2017. Gli incidenti conteggiati in questo database includono incidenti di dirigibili civili e militari, incidenti che hanno causato la morte di celebrità o personaggi famosi, incidenti di elicotteri con 10 o più vittime, voli passeggeri di linea e non di linea conclusi con un decesso. 348. Trasporti per Londra Transport for London è l'ente governativo responsabile della supervisione del trasporto pubblico nell'area della Grande Londra. Sul sito web sono disponibili mappe della metropolitana e dei treni, insieme a una guida alla pianificazione del viaggio. Oltre a tutti questi servizi pratici, il sito ospita anche numerosi dati aperti, tra cui dati su ciclismo, qualità dell'aria, tub e persino l'ostrica. Chiunque sia interessato a scoprire come i residenti della Grande Londra utilizzano il trasporto pubblico può trarre vantaggio dall'accesso a questi dati. 349. CMAP Il CMAP è responsabile della pianificazione e dell'organizzazione regionale nelle contee di DuPage, Lake, McHenry, Kendall, Kane, Cook e Will in Illinois. Come si può vedere dal sito web, le responsabilità del CMAP si estendono ad affrontare questioni come lo sviluppo della comunità, le tasse e gli indicatori economici, e persino strade e trasporti. Ecco perché i dati aperti relativi ad aree come gli indicatori regionali e i trasporti sono utili a un giornalista che cerca di comprendere il quadro generale per quanto riguarda il futuro della regione. 350. Quadro di analisi del trasporto merci Realizzato grazie alla collaborazione tra il Bureau of Transportation Statistics e la Federal Highway Administration, il Freight Analysis Framework raccoglie dati che vengono poi utilizzati per valutare lo stato di salute generale e le prestazioni del sistema di trasporto merci. Questo software raccoglie informazioni su dettagli come la tipologia di merce e il tonnellaggio rispetto alle stazioni di partenza e di arrivo, e tali dati sono stati a loro volta resi disponibili al pubblico per l'accesso e il download, in forma completa o riassuntiva. 351. Mozilla Science Mozilla Science è un software open source, open practice e collaborativo, ideato per supportare lo sviluppo e la distribuzione di diverse fonti di dati e risultati di ricerca. A parte gli interessi di trasparenza, la decisione di aprire i programmi e di ricorrere al crowdsourcing per il processo di perfezionamento semplifica il miglioramento dei programmi già esistenti. Con progetti disponibili in una varietà di campi, tra cui scienze della vita e medicina, ci sono soluzioni software che potrebbero rappresentare un progresso degno di nota in questo campo. 352. Set di dati interessanti L'attrattiva di Cool Datasets è facilmente intuibile dal nome del sito. In questa pagina, i set di dati rientrano in sei categorie generali: governo, intrattenimento, scienza, contributi degli utenti, vari e apprendimento automatico. I giornalisti che desiderano esplorare i dati e ricavare storie trarranno il massimo vantaggio dalla consultazione di ciò che questo sito web ha da offrire. È possibile esplorare i set di dati e, se possibile, anche contribuire con i propri. 353. Monitor dati aperti OpenDataMonitor è una piattaforma che utilizza set di dati pubblici e li presenta in un modo più intuitivo e facile da seguire per gli utenti. I ricercatori possono accedere alla piattaforma per visualizzare un riepilogo delle potenzialità delle risorse di dati aperti e visualizzare i dati esistenti in un formato visivamente più accattivante. Il sito illustra la metodologia e i benchmark, e gli editori non dovrebbero avere problemi a trovare dati che valga la pena pubblicare. 354. CrunchBase CrunchBase è forse meglio conosciuto per la sua attenzione alle statistiche e per il suo impegno nel fornire ai lettori l'accesso ai migliori dati disponibili. Gli imprenditori visitano questo sito ogni giorno per conoscere le ultime tendenze in materia di investimenti e settore. Qui, giornalisti ed editori troveranno notizie e discussioni aggiornate sulle ultime tendenze aziendali. Nel frattempo, come parte della sua opzione a pagamento, il sito ospita anche ampi set di dati che possono essere analizzati utilizzando gli strumenti software di Crunchbase. 355. Indice Index è una piattaforma con una proposta di vendita unica perché ha qualcosa da offrire a tutti, dalle startup agli investitori, dagli analisti alle aziende. Il sito ospita anche informazioni su oltre 100.000 aziende del settore tecnologico, offrendo allo stesso tempo agli utenti la possibilità di ordinare, creare ed esportare fogli di calcolo. Editori e giornalisti che sfogliano i titoli alla ricerca di potenziali spunti di riflessione possono anticipare le notizie economiche grazie a questo sito. Index può essere insolito, ma non c'è dubbio che sia una risorsa utile. 356. SEMRUSH SEMrush si vanta di essere uno degli strumenti di search intelligence più consolidati a disposizione degli operatori di marketing online. Tra corsi accademici e webinar, i ricercatori hanno ogni opportunità di apprendere i fondamenti. Tuttavia, le sezioni blog e news contengono informazioni sufficienti a consentire a editori e giornalisti di rimanere facilmente aggiornati su tutte le ultime novità in materia di pubblicità online e SEO. I servizi di SEMrush hanno un costo, ma offrono gratuitamente numerose informazioni di qualità. 357. Ahrefs Ahrefs può forse essere riassunto al meglio come una suite di strumenti di marketing potenzialmente utili a chiunque pubblichi contenuti online. Il sito offre una combinazione di servizi come la ricerca di contenuti, il monitoraggio web, la ricerca di parole chiave e la ricerca di backlink per aiutare gli utenti a ricostruire il successo dei concorrenti. Probabilmente più utile per gli editori online nel complesso, il blog di Ahrefs rappresenta da solo un valore eccellente per coloro che amano il marketing basato sui dati. 358. Elenco degli angeli AngelList, con il suo nome scelto con intelligenza, è fondamentalmente due parti Craigslist e una parte LinkedIn, con l'obiettivo di riunire investitori, persone in cerca di lavoro e startup in un unico posto. Oltre a questo interessante concept, offre numerose opportunità per i giornalisti intraprendenti di scoprire le startup più promettenti e le ultime tendenze di investimento prima che diventino mainstream. Con la sua interfaccia intuitiva e il suo forte orientamento al business, questo sito è utile per i professionisti sotto diversi aspetti. 359. Acquisito In quasi tutti i settori, un'acquisizione aziendale può cambiare un intero settore praticamente da un giorno all'altro. Acquired è un sito che si occupa di tenere informati i cittadini quando viene effettuata un'acquisizione nel settore tecnologico. Ricco di statistiche consultabili sul sito e con la possibilità di filtrare le ricerche, i giornalisti che scrivono di tecnologia trarranno il massimo vantaggio dall'inserire Acquired nella loro navigazione web quotidiana. 360. Mattermark Mattermark è un servizio a pagamento che semplifica la vita dei decision maker aziendali producendo elenchi di clienti di qualità che tengono conto sia delle aziende che dei loro dipendenti chiave. Offrendo profili aziendali completi, flessibilità tramite API e persino funzionalità di esportazione per gli aggiornamenti, Mattermark offre tutto ciò che serve. Le aziende che desiderano indirizzare meglio il proprio target e monitorare al contempo i risultati delle proprie campagne possono trarre notevoli vantaggi dall'iscrizione a questo servizio. 361. Startup fintech FintechStartupsCo funge da aggregatore che tiene traccia di quanto le diverse aziende sono riuscite a raccogliere con le loro IPO. Con un design minimalista che alterna le schede "startup" e "news", questo sito è un modo semplice e veloce per i giornalisti di rimanere aggiornati sulle ultime notizie di raccolta fondi. Nel frattempo, anche gli editori alla ricerca di contenuti e storie rapide trarranno vantaggio da un'ulteriore occhiata a ciò che questo sito ha da offrire. 362. Datafox Nel caso in cui il nome non bastasse, DataFox è un'azienda che si impegna a fornire ai propri clienti aziendali le informazioni necessarie per ottimizzare i loro CRM e, in generale, prendere decisioni basate sui dati. Offrendo servizi che includono intelligence per conferenze e aziende, API e segnali aziendali, questa azienda è di fatto un punto di riferimento unico per le aziende che stanno rinnovando le proprie attività di vendita e outreach. Anche gli editori digitali e i fornitori di contenuti potrebbero volerla valutare. 363. Apertura finale OpenSpending è una piattaforma gratuita, accessibile praticamente da qualsiasi parte del mondo, che consente agli utenti di cercare ed esaminare dati finanziari di pubblico dominio. Per i non hacker, si tratta di un potente strumento di visualizzazione e analisi. I giornalisti, in particolare, possono utilizzare OpenSpending per trovare nuovi spunti interessanti e approfondire le proprie storie, come l'azienda suggerisce direttamente sul suo sito. Come ulteriore vantaggio, i giornalisti sono tra le professioni specificamente richieste sul forum. 364. API sportiva ESPN Non contenta di essere solo il canale sportivo più popolare via cavo, ESPN sta espandendo la sua influenza anche nel campo della programmazione e delle API. Nel Developer Center, il sito offre agli editori la possibilità di scegliere tra diverse API, tra cui note di ricerca, classifiche di potenza, scelte al draft, calendari e titoli. C'è persino un'API che carica profili di atleti, biografie e statistiche di tutti i principali sport. I giornalisti che si preparano a scrivere un articolo con contenuti sportivi non possono che trarre vantaggio dalla consultazione di queste API. 365. Riferimento sportivo Per gli amanti dello sport che desiderano statistiche e risorse avanzate in un unico posto, Sports Reference è uno dei migliori siti sul web. Con dati storici che includono statistiche di squadre e giocatori in attacco e difesa, i ricercatori sportivi possono spaziare a piacimento. Inoltre, sono disponibili dati per praticamente tutti i principali sport, dal basket al baseball, e dati separati anche per diversi sport universitari. 366. Set di dati di milioni di canzoni L'appropriatamente chiamata "Million Songs Collection" contiene ben 28 set di dati di metadati e informazioni sulle caratteristiche audio di esattamente un milione di brani. Frutto in gran parte del lavoro svolto dal LabROSA della Columbia University in collaborazione con Echo Nest, queste informazioni sono accessibili e ospitate sul sistema AWS di Amazon. Gli utenti possono effettuare ricerche tramite Infochimps, il che le rende ancora più accessibili sia ai giornalisti alla ricerca di curiosità poco note, sia agli editori di contenuti.




