SODP logo

    Topp datakilder for journalister i 2018 (350+ kilder)

     Det finnes mange forskjellige typer nettsteder som tilbyr et vell av gratis, freemium og betalte data som kan hjelpe målgruppeutviklere og journalister med rapporterings- og historiefortellingsarbeidet,…
    Oppdatert: 1. desember 2025
    Vahe Arabian

    Opprettet av

    Vahe Arabian

    Vahe Arabian

    Faktasjekket av

    Vahe Arabian

    Vahe Arabian

    Redigert av

    Vahe Arabian

     Det finnes mange forskjellige typer nettsteder som tilbyr et vell av gratis, freemium og betalte data som kan hjelpe publikumsutviklere og journalister med rapporterings- og historiefortellingsarbeidet. Teamet hos State of Digital Publishing ønsker å anerkjenne disse, som er avledet fra manuelle søk og anerkjennelse fra vårt eksisterende publikum.

    1. Kaggle Kaggle er et nettsted som lar brukere oppdage maskinlæring mens de skriver og deler skybasert kode. Nettstedet er hovedsakelig avhengig av entusiasmen til det store fellesskapet, og arrangerer datasettkonkurranser med pengepremier, og som et resultat har det enorme mengder data samlet inn. Enten du leter etter historiske data fra New York-børsen, en oversikt over trender innen godteriproduksjon i USA eller banebrytende kode, er dette nettstedet fullt av informasjon. 2. Wikipedia Det er umulig å være på internett lenge uten å støte på en Wikipedia-artikkel. Med artikler som spenner fra fullstendig kildehenvisning og referanser til historiske biografier til tidslinjer for nær og fjern fremtid, kan man trygt si at Wikipedia har sementert sin status som et gratis nettbasert leksikon. Mellom oppføringen som fungerer som den generelle oversikten over emnet og de mange bøkene og nettreferansene nettstedet tilbyr, er Wikipedia en forfatters beste venn på mange måter. 3. Vanlig kryp Som navnet på nettstedet antar, søker eller «gjennomsøker» Common Crawl nettet etter data som deretter lagres og bygges i et åpent arkiv som brukerne har tilgang til. For to eksempler på hva som er mulig med dette nettstedet, gir virtuelle patentmarkører og omfattende lister over nettsteder som tilbyr RSS-feeder et lite utvalg av hvor kraftig dette programmet er. Hvis det er data- eller nettstedssammenligninger du ønsker å gjøre, er dette et tilgjengelig verktøy for å lage original informasjon. 4. EDRM EDRM, en forkortelse for Electronic Discovery Reference Model, er et nettsted for juridiske fagfolk som er dedikert til å realisere potensialet til e-discovery og reglene og forventningene rundt hvordan informasjon styres. I tillegg samarbeider EDRM-medlemmer for å utvikle samarbeidsstandarder, programvare og pedagogiske verktøy som er utformet for å fremme fellesskapets mål. For å samle informasjon om måtene teknologi kan og har endret de prosessuelle og administrative aspektene ved juridisk praksis, er dette nettstedet du bør besøke. 5. Mahout Mahout fokuserer på et program med samme navn som forsøker å finne ut logistikken ved å bygge et miljø som er i stand til å lage maskinlæringsapplikasjoner med høy ytelse som kan skaleres og opprettes raskt. For forskere som ønsker å kompilere og manipulere sine egne datasett eller prøve seg på maskinlæringsapplikasjoner, er dette programmet spesielt nyttig. Dette nettstedet vil hjelpe enkeltpersoner godt på vei til å bli dyktige med denne programvaren. 6Lemurprosjektet Lemur-prosjektet er en database som fokuserer på å støtte forskning på innhenting av informasjon og håndtering av menneskelige språkteknologier. Med nettsider som teller omtrent 1 milliard og 10 språk samlet fra januar 2009 til februar 2009, gjør den store mengden materiale som er til stede og støtte den til en utmerket ressurs for forskere. Mellom alt dette og den ekstra støtten som finnes på nettstedet, vil alle som er interessert i teknologi og menneskelige språk ha mye å jobbe med på dette nettstedet. 7Prosjekt Gutenberg Project Gutenberg er en katalog som inneholder romaner, artikler og andre verk som er offentlig tilgjengelige. Nettstedets samling av e-bøker på over 54 000 spenner fra kjente verker som Shakespeare, Mark Twain og Jane Austen til mindre kjente verk av mer obskure navn som Henri Bergson og Samuel Butler. Enten du leter etter en klassisk roman for å være belest eller forsker på hvordan folk opplevde livet på 1800-tallet, er Project Gutenberg en utmerket ressurs. 8Datasett for millioner av sanger Dette er et nettsted som inneholder et komplett datasett som inneholder lydfunksjoner og metadata for omtrent 1 million populære sanger. I tillegg til det primære datasettet med millioner av sanger, finnes det også en rekke datasett som fellesskapet har bidratt med i relaterte kategorier som coverlåter, sjangeretiketter og tekster blant annet. Musikkhistorikere, hobbyister eller forskere som ønsker denne informasjonen, vil kunne sortere dataene relativt enkelt. Dette kan godt være det mest omfattende datasettet om dette emnet på hele Internett. 9. Amazonas Alle kjenner Amazon som en digital forhandler, men visste du at Amazon også tilbyr gratis offentlige datasett som er åpne for alle å få tilgang til uten å måtte lagre eller laste ned noe på sine egne enheter? Med data som spenner fra vær, rommiljø og meteorologisk informasjon til bilder fokusert på å utvikle algoritmer som hjelper med datasyn, er det ingen mangel på alternativer for de som ønsker en mer praktisk måte å analysere enorme mengder data på. 10. Åpen offentlig sektor i Canada For å fremme mer åpenhet, få flere borgere til å engasjere seg og oppmuntre til dialog, tilbyr den kanadiske regjeringen omfattende data som en del av sitt initiativ for åpen offentlig forvaltning. På dette nettstedet finner du datasett om myndighetsrelaterte spørsmål, som kapasitetsnivået til hjemløseboliger i Canada, samt regionale tall om deltakelsesnivået til anglofone og fransktalende i offentlig sektor. Med tilgang til slike datasett er det ikke nødvendig å være avhengig av andres statistikk for å finne informasjon. 11. Datakataloger Data Catalogs, nå Data Portals, tilbyr brukere et praktisk nettsted for å bla gjennom åpne dataportaler fra hele verden. Siden portalene vurderes og kurateres av ulike myndighetsnivåer, en rekke frivillige organisasjoner og til og med Verdensbanken, er dataene som er tilgjengelige for analyse av ekstremt høy kvalitet. Brukere har muligheten til å bla gjennom eller bidra til dataportaler. Fra et forskningsperspektiv gjør variasjonen i emner og informasjon dette nettstedet til et spesielt praktisk sted å starte et informasjonssøk. 12Data.gov.uk Data.gov.uk er et nettsted som lar enkeltpersoner finne og få tilgang til data som ulike offentlige organer, myndigheter, lokale myndigheter og offentlige etater publiserer. Her kan forskere finne informasjon om det økonomiske klimaet for små bedrifter, handel, import, industri og eksport, eller til og med gjøre undersøkelser om betalinger over £25 000 foretatt av myndigheter. Siden nettstedet eksplisitt sier at dataene kan brukes til forskning, kan informasjonen som dekkes her til og med generere flere ideer etter hvert som forskere går gjennom den. 13Data.gov Dette nettstedet er der den amerikanske regjeringen tilbyr åpne data som offentligheten kan få tilgang til i form av datasett. I tillegg til rådataene tilbyr nettstedet også en rekke verktøy som kan brukes til å lage datavisualiseringer samt bygge applikasjoner for nett og mobil. Ta ikke feil. Dataene er enorme, med informasjon som spenner fra kredittkortklager til data om føderale studielånsprogrammer i over 197 000 datasett. Dette nettstedet tilbyr mange muligheter for innovasjon og omfattende analyse. 14DataSF DataSF tilbyr hundrevis av datasett knyttet til både byen og fylket San Francisco. Interessert i å se hva lokale og regionale lobbyister har presset på for? Trenger du statistikk om kriminalitet? Bla gjennom Showcase-fanen for å se hva folk har oppnådd med dataene, eller bruk skjemaet for å gi et bidrag. Dette nettstedet er laget med åpne data og tilbyr et akademi, en blogg og en rekke andre verktøy, og er i stor grad drevet av samarbeid og fellesskap. Dette gjør det til en ressurs for forskere. 15. DataFerrett DataFerrett er forskjellig fra mange nettsteder ved at det ikke er et arkiv eller en katalog, men snarere et verktøy som lar brukere tilpasse data fra lokale, statlige og føderale kilder gjennom dataanalyse og -utvinning. Dette verktøyet lar brukere lage tilpassede og omfattende regneark og deretter gjøre den samme informasjonen om til et kart eller en graf uten å måtte laste ned eller aktivere annen programvare. Det har aldri vært enklere å organisere massive datainnganger og gjøre dem om til noe som er lettlest. 16. Inforum Gjennom University of Maryland gjør Inforum amerikanske økonomiske data tilgjengelig for offentligheten. Mange amerikanske myndigheter har bidratt til dette nettstedet, slik at nettstedet nå inneholder tusenvis av «økonomiske tidsserier», som de kaller dem, og disse inneholder tall for industriproduksjon, prisindekser, arbeidsstatistikk og næringslivsindikatorer. Dataene er fritt tilgjengelige og kan nås med enten en personlig bærbar eller stasjonær datamaskin. Forskere som ønsker å få en god oversikt over de rådataene, har en ressurs i Inforum. 17. Europeisk Ifølge nettstedets egne tall utgjør Europeanas samlinger totalt over 50 millioner poster. Ved å bruke de kuraterte datasettene her, kan forskere finne informasjonen de leter etter på kortere tid. Datasettene her inkluderer kategorier som 3D-modeller, italienske kart over første verdenskrig og til og med en samling på over 20 000 historiske bilder fra blant annet litauiske museer. For enten generelle historiske søk eller som et utgangspunkt for å gå gjennom Europeanas massive poster, er dette en utmerket ressurs å ha. 18The Guardian I tillegg til sin kontinuerlige dekning av nyheter og hendelser, har Guardian også en hel seksjon viet til datautdrag. Artikkelen her spenner fra seriøse temaer som effektiviteten av boligpolitikk mot hjemløshet til litt mer muntre emner som hvilke land som har flest nobelprisvinnere. Journalister og forskere har ingen mangel på informasjon å bruke i sine egne prosjekter fra dette nettstedet. Ved hjelp av et raskt søk er det mulig å finne data om omtrent hva som helst. 19Genekspresjonsomnibus Gene Expression Omnibus, som drives av National Center for Biotechnology Information, er et nettsted som inneholder «offentlige funksjonelle genomdata» som er i samsvar med MIAME-standardene (Minimum Information About a Microarray Experiment). Nettstedet godtar også data som er arrayert eller sekvensert, samtidig som det gir verktøyene som er nødvendige for å finne og laste ned informasjonen. De som er interessert i å studere genomer eller tilegne seg informasjon om emnet, vil ha alle dataene de trenger her og mer til. 20Universitetet i Chicago University of Chicagos Center for Spatial Data Science (CSDS), som lenge har vært anerkjent for sine bidrag til innovasjon og fremskritt innen samfunnsvitenskapelige felt, utforsker den neste grensen med sitt satsing på romlig analyse og teknologi. CSDS sitt arbeid har anvendelser innen praktisk talt alle felt som må håndtere romlige problemstillinger. Følgelig har felt som miljøøkonomi, folkehelse og kriminologi alle dratt nytte av disse anvendelsene. CSDS' dedikasjon til åpen kildekode-programvare og distribusjon av informasjonen gjør dataene de tilbyr enda mer tilgjengelige. 21Konect Ved å bruke data samlet inn av Institutt for webvitenskap og -teknologi ved Universitetet i Koblenz-Landau, tilbyr KONECT (Koblenz Network Collection) forskning innen nettverksvitenskap og relaterte fag. Prosjektet bruker en rekke egne programvareverktøy for nettverksanalyse for å analysere tall og produsere tegnede plott og algoritmer. KONECT er deretter vert for resultatene av sitt analytiske arbeid direkte på nettstedet. Med over 200 datasett å velge mellom, er dette en ressurs som er verdt å utforske. 22MIdata MIdata er et nettsted som fungerer som et arkiv for data som skal brukes av maskinlæringsdata. Disse datasettene kan variere fra en samling av menneskelige ansiktsuttrykk til mer vitenskapelige emner som å forutsi hvordan molekyler vil binde seg. Med oppføringer delt inn i kategorier som gir tilgang til rådata, veiledninger i material- og metodedelen, samt læringsoppgaver og utfordringer, lar dette nettstedet forskere analysere arkivet for datasett som er av interesse. 23NASDAQ NASDAQ er en verdensberømt børs som lenge har vært en utmerket ressurs for journalister og forskere på jakt etter data fra finans- og næringslivet. Her finner du informasjon om børsnoteringer, historiske prisdata og de siste finansnyhetene som gjør dette nettstedet til et populært nettsted for finansdata. NASDAQ Composite tilbyr også betalte dataalternativer for de som ønsker å gjøre en dypere analyse. Dette er en svært respektert og veletablert ressurs. 24NASA Alle har hørt om dette statlige byrået og dets reiser ut i verdensrommet helt tilbake til månelandingen. Av interesse for journalister er imidlertid hvordan NASA også er en verdifull datakilde gjennom sitt Space Science Data Coordinated Archive. Her kan forskere finne data fra romvitenskapelige oppdrag i kategorier som astrofysikk, bilderessurser og heliofysikk, blant annet. I tillegg finnes det også en rekke hvitbøker tilgjengelig på nettstedet som følger med de nye dataene som sendes inn. 25Sokrate Socrata er et nettsted som tar tilgjengelige myndighetsdata og setter dem i et format som gjør det enklere for folk å analysere, klikke seg gjennom og finne informasjonen de leter etter. Socrata er spesielt utviklet med tanke på behovene til ikke-tekniske individer som offentlig politikkeksperter, forskere, gründere og engasjerte borgere, og bruker skyen til å samle data fra en rekke kilder. For journalister som prøver å forstå effektiviteten av ulike tiltak, er dette en nyttig plattform. 26Quandl Quandle er et nettsted som primært tilbyr økonomiske og finansielle data formatert med tanke på behovene til investeringsrådgivere. Denne datakilden er avhengig av over 500 informasjonskilder fra troverdige organisasjoner som CLS Group, FN, sentralbanker og Zacks blant andre for å samle dataene sine, og er perfekt for forskere og journalister som ønsker å få et overblikk over helheten. Takket være nettstedets Excel-tillegg har det aldri vært enklere for brukerne å få direkte tilgang til dataene. 27. Carnegie Mellon-universitetet Carnegie Mellon University har et velfortjent rykte som en utmerket akademisk institusjon. Det mange ikke vet er at Carnegie Mellons StatLab er en nyttig ressurs for journalister som leter etter data. Dette datasettarkivet inneholder data om problemstillinger som MLB-lønningene til nordamerikanske spillere i 1986, samt data som er utviklet for bruk i evaluering av nøyaktigheten til statistikkprogramvare. Mot anerkjennelse er disse datasettene tilgjengelige for offentlig bruk. 28. UCI UC Irvine Machine Learning Repository, også kjent som UCI, er et nettsted som lagrer massevis av interessante data som journalister kan bruke. Nettstedet har i skrivende stund 394 datasett, og har den ekstra fordelen av et grensesnitt som er enkelt å søke i. Noen av de mer populære datasettene inkluderer informasjon om «gjenkjenning av menneskelig aktivitet ved hjelp av smarttelefoner», vin og bankmarkedsføring blant andre emner. I bytte mot å bruke alle disse dataene ber nettstedet bare om en kildehenvisning. 29. UCR Hvis du er journalist og ser på utviklingen av maskinlæring, vil UCR Time Series Classification/Clustering-siden være utmerket lesning. Nettstedet tilbyr et nyttig informasjonsdokument som gir deg all bakgrunnsinformasjonen du trenger å vite. Sammen med en oversikt over hva informasjonen inneholder, tilbyr nettstedet også muligheten til å laste ned dataene direkte. Bare husk å bruke siteringsformatet nettstedet ber om hvis du bruker disse datasettene. 30. Amerikansk folketelling Trenger du statistikk om befolkningsformue? Vil du vite den nøyaktige kjønnsfordelingen i et bestemt felt? Den amerikanske folketellingen er et nettsted som har alle disse dataene og mer tilgjengelig for offentligheten. Sorter dataene etter år eller region, så vil du raskt kunne finne statistikken som folk flest ikke engang visste var tatt med i den amerikanske folketellingen slik den var. Disse tallene var tilgjengelige i Excel og Microsoft Word som alternativer som gjør dataene enda mer tilgjengelige for journalister. 31. Wolfram Alpha Wolfram Alpha er faktisk en beregningsmotor som lar brukere legge inn dataene de ønsker å vite og motta en beregning. Motoren utfører statistiske data og analyser, kjemi, datoer og klokkeslett, og til og med ord og lingvistikk blant annet. For brukere som prøver å avdekke nye måter å håndtere data på, er dette spesielt nyttig på grunn av hvordan den bare kan spytte ut nye beregninger med et knappetrykk. Spesielt journalister kan tjene mye på å bruke dette som en tilleggsressurs. 32. Yelp Det viser seg at Yelp er mer enn bare restauranter og brukeranmeldelser av bedrifter. Dette brukerdrevne anmeldelsesnettstedet lagrer også et datasett som gir forskere tilgang til anmeldelser, brukerdata og bedrifter for «personlige, pedagogiske og akademiske formål». Basert på selskapets telling er det 4,7 millioner anmeldelser og 156 000 bedrifter i 12 storbyområder inkludert i datasettet. Med disse tallene kan materialene og trendene forskere potensielt kan oppdage i disse dataene være en hyggelig overraskelse. 33. Dataverden Vil du ha en liste over fjernede Facebook-sider? Hvordan høres det ut å kunne sortere amerikanske økonomiske data etter fylke? Data World er et nettsted som lar folk dele, være vert for, samarbeide og holde oversikt over data. Nettstedet inneholder til og med en seksjon for journalister som beskriver hvorfor Data World er nyttig for medlemmer av yrket, samtidig som det peker på hostingfunksjonene til en strømlinjeformet FOIA-prediktor, samt sider som er utformet for å hjelpe med organisering. Alt i alt er dette en solid blanding av data og datahosting. 34. Verdensfaktaboken World Factbook, som drives av CIA, gir deg informasjon om samfunnsstrukturer, historie, militære og økonomiske situasjoner i 267 land, sammen med kart, flagg og et sett med tidssoner som følger materialene på verdenskartet. Nettstedet tilbyr et grundig og dyptgående blikk på emnet på en måte som går utover det grunnleggende. Kort sagt, dette er en datakilde som burde være i enhver journalists arsenal. 35. Helsedata.gov HealthData.gov, som administreres av det amerikanske helse- og omsorgsdepartementet, tilbyr offentligheten tilgang til «høyverdige helsedata» i håp om å fange oppmerksomheten til gründere, beslutningstakere og forskere. I det minste innen produkt- og tjenesteutvikling har folk kunnet undersøke disse dataene og få resultater. Journalister som ønsker å være i forkant av helsedata eller som vurderer en uttalelse som en helsepersonell har gitt ut, kan bruke dette nettstedet for å finne svar. 36. UNICEF Dette er et nettsted som gir journalister som bruker informasjonen det tilbyr umiddelbar troverdighet. Statistikken som UNICEF dekker inkluderer de som er knyttet til helse- og menneskerettigheter, som utdanning, morshelse, barnefattigdom, vann og sanitærforhold og funksjonshemming blant mange andre kategorier av statistikk som føres. Det er nyttig for forskere fordi det er oppdatert og støttes av en av de mest kjente organisasjonene på planeten. Journalister kan ikke ta feil ved å sitere denne datakilden. 37. Verdens helseorganisasjon Verdens helseorganisasjon er en internasjonal organisasjon som samler helsestatistikk og informasjon over hele verden. Bortsett fra informasjonen som finnes direkte på hjemmesiden, tilbyr nettstedet også data gjennom Global Health Observatory. Disse dataene inkluderer informasjon om tiltakene landene tar mot universell helsehjelp, helseforskning og -utvikling blant andre kategorier. Journalister vil finne mye informasjon om utbrudd, helsekriser og helsedekning fra et internasjonalt perspektiv her. 38. Googles offentlige data Med tilgjengeligheten av Google Public Data kan journalister tydeligvis stole på Google på flere måter. Søkemotorgiganten har offentlige data tilgjengelig for analyse med over 100 offentlige datasett. Datamaterialet spenner fra det ekstremt alvorlige med World Development Indicators og Human Development Indicators til det interessante med data om de farligste veiene i Europa. Alt en forsker trenger å gjøre er å kjøre et søk og se hva Google Public Data har. 39. Gap Minder Gap Minder tilbyr data om en rekke lokale og nasjonale indikatorer sammen med lenker og informasjon om alle dataleverandørene. Ved å bruke dette nettstedet kan forskere se informasjon som hvor gamle kvinner er når de gifter seg for første gang, statistikk om alkoholforbruk og dødsårsaker hos barn. For journalister som skriver med et internasjonalt vinkling eller som lager sammenlignende data, er dette en utmerket ressurs. Dette er en nyttig datakilde uansett. 40. Google Trender Google Trends er et verktøy som gir forskere innsikt i hva folk leter etter akkurat nå. Forskere kan sammenligne dataene med trender som har skjedd tidligere, og de kan også bruke verktøyet til å lage estimater i forkant av, for eksempel høytiden, for å se hva som vil skje med søk i fremtiden. Google Trends tilbyr grafer, hete temaer og mange muligheter til å avdekke nyhetene før de offisielt er nyheter. 41. Google Finans Google Finance tilbyr en rask og enkel mulighet til å gjøre et mer grundig søk på et selskap som investorer har skrytt av. Enkle måter å filtrere tekniske indikatorer og gjennomgå de siste nyhetene om selskapet i ett enkelt og greit vindu som lar deg sortere informasjonen enda mer. I tillegg er det gratis. For journalister som ønsker å undersøke finansene til et børsnotert selskap, tilbyr Google Finance et intuitivt grensesnitt for å få tilgang til denne informasjonen. Dessverre har Google nylig avviklet noen av kjernefunksjonene, som for eksempel finansportefølje. Her er noen alternativer til Google Finans. 42. DBpedia Alle som noen gang har ønsket seg en enklere måte å søke på Wikipedia på, har grunn til å være begeistret for DBpedia. Drevet av fellesskapets engasjement, søker dette nettstedet å gjøre det mulig å kjøre mer sofistikerte søk mot Wikipedia-innhold. Med den engelske versjonen som kan skryte av 4,58 millioner oppføringer med klassifiseringer og tilhørende kategorier, er nettstedet godt på vei til å tilby omfattende dekning basert på informasjonen på Wikipedia. Journalister kan ikke gå feil med denne datakilden. 43. Pew Research For mange er Pew Research i den øvre sjiktet når det gjelder undersøkelser, rapporter og forskningsdata. Nettstedet dekker emner som spenner fra politiske meninger til sosiale trender og utviklinger i ulike bransjer på arbeidsplassen. Pew Research har også en søkefunksjon som gjør det enklere enn noensinne å få tilgang til informasjon. Journalister som ønsker oppdatert statistikk og funn som kommer fra en kilde som er pålitelig og anerkjent, kan ikke gå feil med å henvende seg til Pew Research. 44. Bredt institutt For journalister som ønsker å finne de siste nyhetene om kreft, kan Broad Institutes datasett være det perfekte stedet å finne informasjonen. Dette inkluderer også informasjon om andre emner som bioinformatikk og beregningsbiologi, samt hjernekreft og oppdagelse av molekylære mønstre. Kort sagt gir dette nettstedet journalister et forsprang når det gjelder å finne dyptgående data om kreft for å lage historier ut av dataene fra Broad Institute. 45. UNdata UNdata tilbyr informasjon om forskjellige land rundt om i verden. Dette inkluderer data som tekniske indikatorer, sosiale indikatorer og økonomiske indikatorer for hvert involvert land. For journalister som jobber med historier av menneskelig interesse eller historier som kan ha nytte av å bli underbygget av ytterligere statistikk og data, er UNdata det ideelle valget. Dataenes nøyaktighet samt FNs omdømme gjør dette til en datakilde som journalister kan stole på når de gjør research. 46. Google Scholar Tenk deg om det i stedet for å bla gjennom nettsider var mulig å få opp et søk som ikke hadde annet enn fagfellevurderte artikler og akademisk materiale. Google Scholar gjør det mulig for folk å finne tidsskriftartikler, rapporter og publikasjoner av verdens ledende forskere. Som vanligvis er tilfelle for dette selskapet, er Google Scholar så intuitivt som det kan bli, der brukeren bare trenger å skrive inn et nøkkelord for å sette i gang. Å søke etter akademiske artikler har aldri vært enklere. 47. Reddit Reddit, oftest kjent som «forsiden av internett», er et av de mest populære nettstedene på internett. I tillegg til å være en nøyaktig indikator på hva som skjer på nettet, har nettstedet også en subreddit, eller et underforum, som er dedikert til datasett. Brukere kan be om datasett, legge ut ressurser og ha diskusjoner om å jobbe med data gjennom formater som JSON. Forskere har mye å tjene på å lese gjennom denne datakilden. 48. Datamarked Qlik DataMarket gjør det mulig å samle inn og håndtere data fra eksterne kilder. Denne plattformen lar brukere låne fra flere datasett med muligheten til å kryssreferere dem mot dataene de allerede har for å forbedre sin forståelse av en større kontekst. Enda bedre, selv om dette er en betalt plattform avhengig av emnet, finnes det også et gratis alternativ med Qlik Datamarket. Journalister som utforsker dataene kan gjøre det så mye de vil. 49. Hubspot Hubspot har alltid vært en tankeleder innen markedsføring for bedrifter. Fra et forskningsperspektiv er dette et nettsted som forteller forskere alt om hva som skjer i bransjen, samt hva folk i markedsføringsbransjen snakker om akkurat nå i sanntid. Journalister kan bruke dette nettstedet til å lære mer om trendene. I den forbindelse er Hubspot en flott ressurs for forskere. 50. Justisstatistikkbyrået Kanskje ikke overraskende fører Justisdepartementet massevis av statistikk. På byråets nettsted finner du tall om arrestasjoner, dødsfall blant innsatte, henrettelser med dødsstraff, statistikk over politiet og folketellinger i fengslene. Strafferettssystemet er et tema som stadig fascinerer både publikum og de involverte. Det er det som gjør Justisdepartementets statistikk enda mer nyttig for journalister som forsker på strafferettssystemet. 51. Enhetlig kriminalrapport Uniform Crime Report er en samling av statistikk om eiendomskriminalitet og voldelig kriminalitet som er samlet inn av FBI. Selv om politimyndigheter fra hele USA har rapportert disse dataene siden 1930, kan funnene som er publisert helt tilbake til 1958 søke i [navn på statistikk]. Journalister som ønsker å utforske kriminalitetsdataene har muligheten til å få tilgang til og bruke UCR-dataverktøyet for å utforske informasjonen som er tilgjengelig på dette nettstedet. 52. Enhetlig kriminalrapportering Uniform Crime Reporting er resultatet av et program som ble utviklet av International Association of Chiefs of Police i 1929. Tallene som FBI samler inn her publiseres fire ganger i året. I tillegg til informasjonen fra UCR-programmet, inneholder nettstedet også rapporter om statistikk for hatkriminalitet, antall drepte og overfalte politibetjenter (LEOKA), samt resultater og tall fra National Incident-Based Reporting System. 53. NACJD NACJD, eller National Archive of Criminal Justice Data, er et nettsted som henter informasjon fra datasett som Uniform Crime Reports (UCR) og National Crime Victimization Survey (NCVS), og deretter lagrer og distribuerer statistikken. Dataene er designet for å bli kuratert, lagret og vedlikeholdt for optimal tilgjengelighet, og finnes i flere former, inkludert eksperimentelle, kvalitative og longitudinelle. Til syvende og sist gir dette journalister og andre forskere en annen måte å visualisere og få tilgang til strafferettsstatistikk. 54. Første database First Databank er et nettsted som omhandler legemiddeldata. Nettstedet har som mål å fremme mer effektiv og datadrevet beslutningstaking innen legemidler. Dette lar leger og klinikere begynne å tenke på legemidler på en annen måte gjennom bruk av First Databanks innovative bruk av teknologi. Fra et profesjonelt synspunkt er dette nettstedet spesielt nyttig på grunn av hvordan dataene kan hjelpe team med å tilpasse seg når ny informasjon kommer. Dette er i det minste en nyttig ressurs for journalister som skriver innen legemiddelbransjen. 55. FDA FDA, kjent som Food and Drug Administration, er etaten som er ansvarlig for å beskytte folkehelsen gjennom tilsyn og godkjenning av legemidler, matvarer, kosttilskudd, vaksiner og kosmetikk blant andre forbrukerprodukter. Som en ressurs har FDA datasett tilgjengelig for publikum, samtidig som de tilbyr tekniske data for folk som er komfortable med å jobbe med regneark og analysere informasjonen som kommer fra datasettene. Dette er definitivt en nyttig ressurs for journalister. 56. Legemiddelbase Har du noen gang lurt på nøyaktig hvor mye landet betaler i kjølvannet av en narkotikaepidemi? Finnes det rykter om at folk bruker narkotika annerledes enn før? Drugbase tilbyr en database som er full av statistikk om trender og bruk av narkotika i USA. Det finnes infografikk samt publikasjoner om emner som komorbiditet av avhengighet og psykisk lidelse eller fakta om ruspåvirket (ikke fyllekjøring). Dette er en ressurs som gir nok informasjon til å oppdage trender og sammenligne med tidligere data. 57. UNODC UNODC, eller FNs kontor for narkotika og kriminalitet, har et nettsted dedikert til å fremme målet sitt om å hjelpe medlemslandene med å innføre strengere standarder for forskning, datainnsamling og rettsmedisin. På dette nettstedet kan forskere finne en rekke statistikker og publikasjoner som dekker emner som datainnsamling, trendanalyse og forskningsprogrammer der det er mulig. En ressurs som er full av informasjon om en rekke rettsmedisinske emner samt vitenskapen bak emnet. 58. Fakta om narkotikakrigen Drug War Facts er et nettsted som tilbyr omfattende diskusjon om krigen mot narkotika, samt konsekvensene av politikken. Dette inkluderer statistikk og tall om detaljer som sammenligninger mellom behandlingskostnadene i forhold til kostnadene ved å stole på politiet, tall om estimater av utgifter til narkotikakontroll og en mengde informasjon om omtrent alle emner relatert til krigen mot narkotika. For mange er dette det mest omfattende nettstedet på nettet med hensyn til krigen mot narkotika. 59. Nasjonalt senter for utdanningsstatistikk National Centre for Education Statistics, ofte omtalt som NCES, er stedet å gå for all utdanningsrelatert statistikk. Dette nettstedet har statistikk om tilstanden til studielån, prognoser for utdanningstrender, samt datasett og sammenligningsverktøy som kan brukes til å gjøre mer dyptgående analyser. Journalister kan bruke denne ressursen til å avdekke trender, bekrefte offentlige uttalelser, gjennomgå publikasjonene til National Centre for Education Statistics og finne nye historier i dataene. 60. Verdensbanken Verdensbanken inneholder en rekke statistikker og data samlet av Development Data Group innen finanssektoren så vel som makroøkonomi. Det er mulig å sortere data ved hjelp av emneknagger. Brukere kan velge mellom en rekke indikatorer og gjøre et valg per land for å gjennomgå de ulike målene på utviklingsfremgang. Som sådan er dette en ressurs som alle som ser på den økonomiske og/eller finansielle tilstanden til medlemslandene kan dra nytte av å ha tilgang til. 61. Bureau of Labor Statistics Bureau of Labor Statistics er journalistenes viktigste kilde til tall og statistikk knyttet til dagens arbeidsforhold, hva som skjer i arbeidsmarkedet, samt hvordan priser endrer seg og påvirker den amerikanske økonomien. Med byråets statistiske arbeid som går tilbake til 1884, er det ingen mangel på økonomiske data der for forskere å granske. Nettstedet lagrer informasjonen i et brukervennlig grensesnitt og oppdaterer kontinuerlig dataene som er tilgjengelige for søk. Dette er en datakilde verdt å utforske. 62. Tallene Storfilmer får mye medieoppmerksomhet, men det er vanskelig å si hvor bra et selskap faktisk har gjort det uten tall. Skriv inn «The Numbers». Dette nettstedet tilbyr forskning og data for film- og underholdningsbransjen. Forskere kan utforske inntektsestimater, forventninger til kommende utgivelser og andre investeringsdata via OpusDatas SQL-baserte søkemotorkapasitet. The Numbers er det første stedet forskere bør besøke for pålitelig statistikk om filmer. Det er det som gjør det til en utmerket ressurs. 63. Film for alltid Film Forever er et nettsted som forskere kan besøke for markedsinformasjon og data for filmbransjen i Storbritannia. Her kan brukere finne ukentlige billettinntektstall for de 15 største britiske utgivelsene, publikumsundersøkelser, rapporter, casestudier og organisasjonens flaggskip Statistical Yearbook. I tillegg har nettstedet også en kalender som holder seerne informert om når neste statistikk vil bli utgitt. Film Forevers nisje gjør det til en spesielt verdifull datakilde. 64. IFPI IFPI er et nettsted som er stolt av å ha fingeren på pulsen til den verdensomspennende platebransjen. Brukere vil finne publiserte rapporter fulle av innsikt i innspilt musikk, nasjonale og globale salgsdata, samt rapporter om forretningssiden av musikkbransjen som viser hvordan selskapene investerer i musikk. Disse rapportene lar brukerne se hva som skjer. Dette nettstedet vil holde forskere oppdatert på hva som skjer i musikkbransjen i sanntid. 65. Statista Statista er en søkemotor som Google, bare at nettstedet returnerer data og statistikk i stedet for nettsider. Med et enkelt knappetrykk kan brukerne få umiddelbar tilgang til over én million statistikker og fakta. Brukerne finner infografikk, statistikk om Kina, matindustrien, forbrukermarkeder, og mot et gebyr er det også tilgjengelig dokumentasjon og bransjerapporter. Enten du leter etter informasjon om økonomi, sosiale medier eller Big Mac, er dette stedet å gjøre det. 66. EPA EPA, som er en forkortelse for United States Environmental Protection Agency, er det statlige organet som er ansvarlig for å beskytte mennesker og miljøet ved å håndheve lovene som er opprettet og vedtatt av Kongressen. På EPAs nettsted kan brukere se gjennom en rekke datasett om emner som spenner fra landbruk til emner så snevre som årlige utslipp av giftige kjemikalier og avfallshåndteringsmetoder. Dette nettstedet er et utmerket valg for journalister som ønsker tilgang til rådata om miljøet. 67. Sentre for sykdomskontroll og forebygging Dette nettstedet for Centers for Disease Control and Prevention omtaler seg selv som en «one-stop-shop for miljømessige folkehelsedata». På dette nettstedet finner forskere referanser og lister til datasystemer som mottar nasjonale midler, samtidig som de sporer og lagrer informasjon som er relatert til bekymringer knyttet til miljømessig folkehelse. Med fokus på programmer som opererer på nasjonalt nivå og tilgjengelighet gjennom direkte nedlastingsmuligheter, er dette en ressurs man kan stole på for den nyeste og mest nøyaktige informasjonen på nettet. 68. Nasjonale sentre for miljøhelse National Centers for Environmental Health ble opprettet etter sammenslåingen av tre tidligere uavhengige etater, og er stedet å gå for informasjon av høy kvalitet om miljøet. De tilbyr omfattende data som spenner fra havdata til isregistreringer fra millioner av år siden. Hvis problemet gjelder miljøet, er det stor sannsynlighet for at dette nettstedet vil ha informasjon om det. Etatens forpliktelse til nøyaktighet og dyktighet i forvaltningen av et av de største arkivene i sitt slag gjør det også til et av få nettsteder på nettet som besitter, oppdaterer og vedlikeholder denne typen data. 69. Nasjonal værtjeneste Den nasjonale værtjenesten i National Oceanic and Atmospheric Administration (NOAA) vil fortelle forskere alt de trenger å vite om været. Dette nettstedet tilbyr datasøk som inkluderer informasjon om kategorier som advarsler og værmeldinger, klima, geografiske værmeldinger og mer. I tillegg kommer det med et intuitivt og lettforståelig kart med faner som kan klikkes på for forskjellige resultater. Enten du ser på hva som skjedde lokalt eller finner værmeldingen for en by i en annen stat, vil dette nettstedet raskt avdekke informasjon. 70. Vidundergrunn Wunderground er en ressurs som er dedikert til å sørge for at værinformasjon er tilgjengelig for alle over hele verden, med fokus også på områder som ikke får mye dekning. Wunderground oppgir eksplisitt at de har tatt grep for å sikre at brukeropplevelsen er utmerket på flere digitale plattformer. Dette betyr at nettstedet er tilgjengelig via mobil så vel som via PC, noe som gjør det til en ideell ressurs for journalister som er på farten. 71. Værbase Weatherbase gir informasjon om gjeldende forhold, gjennomsnitt, klimainformasjon og reiseforhold for over 40 000 byer rundt om i verden ved hjelp av et enkelt søkefelt. Bruk det tilhørende nettstedet som nettstedet lenker til for å finne ytterligere reiseinformasjon, som valutaomregner, koordinater og fylkesinformasjon blant andre morsomme fakta. Weatherbase kan også brukes til å finne steder å feriere utelukkende basert på hvordan været vil bli. Lykke til med søket! 72. Energiatlas Energiatlaset, som publiseres under Det internasjonale energibyrået, gir forskere muligheten til å se verden gjennom energistatistikk. Nettstedet, som opprinnelig var utformet som en komplementær datakilde fra oppstartsdatoen, kan skilte med en animert Sankey-strømningsenergibalanse samt flere databaser som følger med publikasjonene, og som kan leses på Det internasjonale energibyråets statistikkside. Forskere vil finne både dette nettstedet og dets tilhørende nettsteder svært nyttige når de forsker på hvordan land og byer bruker energi. 73. Byrået for økonomisk analyse Bureau of Economic Analysis, eller BEA forkortet, publiserer et bredt spekter av nyttig informasjon som lar forskere holde fingeren på pulsen i landets økonomi. På dette nettstedet finner du tall om amerikanske økonomiske regnskaper, inkludert tall om forbruk, BNP og anleggsmidler, blant andre nyttige data. Forskere kan søke etter region eller bransje, samt etter nivå med internasjonale, nasjonale og regionale søkealternativer. Prøv den interaktive datasiden for å finne ut mer om byrået. 74. Nasjonalt byrå for økonomisk forskning Nettstedet til National Bureau of Economic Research, eller NBER, er en datakilde som tilnærmer seg økonomi fra et analytisk synspunkt. Den inneholder data om et bredt spekter av økonomiske emner med oppføringer som Index of African Governance, Official Business Cycle, Experimental Coincident, Leading and Recession Indexes og Macro History Database. NBER har offisielle datasett publisert og samlet under eget navn, samt indekser samlet av andre utgivere. 75. Det amerikanske verdipapir- og børstilsynet Det amerikanske finanstilsynet (Securities and Exchange Commission) er et slags byrå som fungerer som en slags vaktbikkje for å fremme åpenhet, rettferdighet og effektivitet i markedene. Interessant nok har nettstedet et datasett for regnskaper som dateres fra januar 2009 til oktober 2017, med oppdateringer hvert kvartal. Forskere kan stole på dette nettstedet for å holde seg oppdatert på de siste nyhetene om innleveringer og informasjonen det kan gi deg om selskaper og deres økonomiske tilstand. 76. IMF Det internasjonale pengefondet, også kjent som IMF, er en veletablert organisasjon innen den internasjonale økonomiske og finansielle sektoren. På nettstedet kan forskere finne en rekke data om disse emnene. Brukere kan søke i datasett etter indikator og land, og bla gjennom diagrammer og kart mens de forsker. Populære datasett inkluderer handelsretning, råvarepriser, indikatorer for økonomisk soliditet, undersøkelser og internasjonal finansstatistikk, blant annen verdifull informasjon. 77. Atlasen – Harvard Atlas, som opprinnelig ble unnfanget av Harvard, er et nettbasert verktøy som lar folk visualisere og samhandle med et selskaps handelssituasjon. Atlas vil deretter ta informasjonen og foreslå forskjellige produkter som landet potensielt kan produsere for å forbedre økonomien. Dette er et verktøy som brukes av beslutningstakere, forretningsfolk, investorer og engasjerte medlemmer av offentligheten som ønsker å få en bedre forståelse av det økonomiske klimaet i et gitt land. Spørsmål om handel og nasjonaløkonomi har aldri vært mer tilgjengelige. 78. Å drive forretninger «Doing Business» er et resultat av en innsats for å gjøre objektive evalueringer av forretningsreguleringer. Nettstedet undersøker nesten 200 økonomier og en rekke byer, og måler detaljer som økonomiske indikatorer, samt rangerer hvor enkelt det er å drive forretninger. Dette nettstedet lar brukere undersøke effektene av ulike typer forretningsreguleringer mellom land, og inneholder rapporter samt omfattende kvalitative data. I tillegg gjør nettstedet det også mulig å gjøre sammenligninger over tid. 79. Comtrade Comtrade, som opprinnelig var et prosjekt fra Storbritannias Department for Business, Energy, and Industrial Strategy i samarbeid med Department for International Trade, er en utmerket ressurs. Nettstedet låner data fra FNs Comtrade Data, og gir brukerne et interaktivt diagram som kan brukes til å søke, sammenligne og analysere de nøyaktige tallene for handel og varer mellom land. Bare velg rapporteringslandet, velg et partnerland og gjør så mange valg som mulig. 80. Globale finansielle data Global Financial Data er en kilde som ikke bare samler standard økonomiske data, men også økonomisk informasjon fra 1200-tallet og frem til i dag. Denne informasjonen er hentet fra en rekke kilder, inkludert bøker, arkiverte materialer, akademiske tidsskrifter og nyhetsmagasiner. I tillegg har nettstedet datasett som bruker den statistiske metoden kjedekobling. Sluttresultatet, fra brukerens perspektiv, er en ressurs som er ulik alle andre på internett i kraft av sine eksklusive data. 81. Visualisering av økonomi Visualizing Economics er mindre en ressurs i begrepet dataoppdagelsesforståelse og mer en tjeneste som fokuserer på å designe informasjonsgrafikk og interaktive dashbord. I tillegg utfører Visualizing Economics også analyser og design med det uttrykkelige formålet å gjøre økonomiske data lettere å forstå. Gjennom dette nettstedet har journalister en legitim mulighet til å samarbeide med en profesjonell som har årelang erfaring med å oversette økonomiske data til noe mer tilgjengelig for allmennheten. 82. EUs portal for åpne data EUs portal for åpne data er et prosjekt som ble opprettet i etterkant av en beslutning tatt av Europakommisjonen. På dette nettstedet tilbyr EU-institusjoner data for offentlig visning og bruk uten opphavsrettsbegrensninger og tilgjengelig uten kostnad. Datasettene inkluderer CORDIS-referansedataene, åpenhetsregisteret og til og med en fullstendig liste over personer, enheter og grupper som EU har innført økonomiske sanksjoner mot. I tillegg er dataene tilgjengelige i en rekke digitale formater. 83. Åpne data Nettverk Open Data Network er et nettsted som lar brukere slå opp data etter region og by. Med en tydelig og intuitiv hjemmeside kan forskere søke etter datakategori, by og til og med etter eksempelspørsmål. På hver side, etter å ha gått gjennom enten datakategoriene eller eksempelspørsmålene, finner du også praktiske lenker til enda flere datasett. Bare organiseringen av dataene gjør Open Data Network til et nettsted som er vel verdt å utforske. 84. Landmatrise Landmatrix er et nettsted som tilbyr en online database for tomteavtaler med den hensikt å fremme mer åpenhet om oppkjøp. I hovedsak kan dette verktøyet brukes til å visualisere og forstå de ulike tomteavtalene. Dataene forbedres, endres og justeres stadig for å forbedre nøyaktigheten av informasjonen som gjøres tilgjengelig. Til dags dato har Landmatrix informasjon om over 1000 avtaler. Det er en kilde verdt å utforske for forskere. 85. FNs utviklingsprogram FNs utviklingsprogram (UNEP) inneholder mye nyttig data om menneskelig utvikling rundt om i verden som publikum kan utforske. Med datoer som vanligvis strekker seg fra 1990 til 2015 i mange av disse datasettene, inkluderer indeksene fullstendige tabeller som trender i indeksen for menneskelig utvikling, indeksen for kjønnsulikhet og kjønnsgapet over livsløpet. Forskere kan søke i dataene direkte via søkefeltet og også gå etter land hvis hensikten er å gå gjennom diagrammet. 86. OCED OECD, kjent som Organisasjonen for økonomisk samarbeid og utvikling, har et nettsted som fokuserer på å hjelpe myndigheter med fattigdomsbekjempende tiltak og velstand gjennom økonomisk stabilitet og vekst. På dette nettstedet finner forskere fagfellevurdert materiale, publikasjoner, samt standarder og argumenter for å sette standarder. OECD har også en faktabok som gir et solid økonomisk referanseverktøy som går sammen med en rekke undersøkelser og spådommer om økonomiske utsikter som finnes på sidene deres. 87. Det amerikanske departementet for helse og menneskelige tjenester Det amerikanske helse- og omsorgsdepartementet driver et nettsted som gir informasjon om presidentens råd for fitness, sport og ernæring. Med fakta og data samlet med bistand fra flere eksperter innen relaterte felt, som kokker og idrettsutøvere. I tillegg har nettstedet også en rekke statistikker. Forskere kan finne fakta om barns fysiske aktivitet, voksnes muskelstyrkende vaner, samt informasjon om publikums kostholdsvaner, samt fedme blant en rekke andre fakta og statistikker. 88. Partnere innen informasjonstilgang for folkehelsearbeidere Partnere i informasjonstilgang for folkehelsearbeidsstyrken er et prosjekt som ble til som et resultat av folkehelseorganisasjoner, amerikanske myndigheter og biblioteker som spesialiserer seg på helsevitenskap. Temasidene på dette nettstedet inkluderer emner som tilskudd og finansiering, helsefremmende tiltak og helseopplæring, samt litteratur og retningslinjer. Gjennom seksjonen Folkehelseemner finnes det også data om emner som bioterrorisme, folkehelsegenomikk og tannhelse, for å nevne noen. 89. United Health Foundation I løpet av de siste tre tiårene har United Health Foundation gitt informasjon om helserangeringer som et middel for å måle folkehelse. Nettstedet inneholder en rekke rapporter og publikasjoner som inkluderer rapporter om helsen til de som har tjenestegjort, rapporter om seniorer, kvinners og barns helse, årsrapporter og til og med briefinger om viktige emner innen feltet. Bruk det interaktive kartet for å utforske etter region og lære mer informasjon. Det finnes også en søkefelt for videre navigering hvis forskere leter etter noe mer spesifikt. 90. Medicare I USA er Medicare det primære forsikringsmiddelet mange er avhengige av for helseforsikring og tilgang til medisinsk behandling. I tillegg til tjenestene de tilbyr i sanntid, tilbyr Medicare også data om standarder og kvalitet på behandling på tvers av fasiliteter og sykehus via sammenligningstabellen og -regelen. Det er det offisielle datasettet som brukes av nettstedet Hospital Compare, og det er fullt av data som kan lastes ned til Excel for ytterligere enkel tilgang. 91. Overvåking, epidemiologi og sluttresultater (SEER) Surveillance, Epidemiology and End Results, også kjent som SEER, har et nettsted som er spesielt nyttig som en kilde til informasjon om statistikk om kreft. Det inneholder statistiske sammendrag som tillater forskning på tall assosiert med kreft, som kan sorteres etter kreftsted, etnisitet, rase, alder, kjønn og til og med etter datatype. Nettstedet er også vert for publikasjoner, datasett og programvare som kan brukes av forskere for enda dypere analyse. 92. Amnesty International Amnesty International er en organisasjon som lenge har vært en forkjemper for menneskerettigheter og rettferdighet over hele verden. Den inneholder også mye data om statusen for menneskerettigheter rundt om i verden, samt informasjon om spesifikke grusomheter og forbrytelser mot menneskeheten på ulike tidspunkt, som en del av sin årsrapport. Forskere kan bruke informasjonen til å sammenligne mellom ulike år og for å se hvordan ulike land har utviklet seg eller gått tilbake på menneskerettighetsområdet. 93. Menneskerettighetsdataanalysegruppe Siden oppstarten for 25 år siden har Human Rights Data Analysis Group anvendt vitenskapelige prinsipper på menneskerettighetsbrudd i forskjellige land rundt om i verden. Nettstedet inneholder publikasjoner som har blitt publisert i anerkjente medier som Washington Post og formelle publikasjoner gjennom Macmillan-utgivere, sortert etter år. I tillegg til de organiserte publikasjonene som går tilbake til år, har det også vært prosjekter som pågår over hele verden. For et mer teknisk blikk på menneskerettighetsbrudd, er dette et godt søk. 94. Internasjonale relasjoner og menneskerettighetsdata Dette nettstedet inneholder databaser samlet av en rekke anerkjente organisasjoner, universiteter og til og med offentlige etater. Eksempler på disse er Manifestprosjektet, Minorities (at Risk) Project, Comparative Welfare States District og Armed Conflict Database. Det finnes noen prosjekter som Polity IV-prosjektet som går tilbake til 1800-tallet. I mellomtiden måler prosjekter som Stockholm International Peace Research Institute (SIPRI) våpenoverføringer, internasjonale militærutgifter og sikkerhetstrender. Den beste måten å sette pris på dataene på er å gå til nettstedet og utforske. 95. Uppsala konfliktdataprogram Uppsala-avdelingen for freds- og konfliktforskning, ofte omtalt som UCDP, er vert for en massiv database kalt UCDP Conflict Encyclopedia. Dette er et nettsted som lar brukere klikke seg gjennom og utforske dataene som avdelingen allerede har oppdelt. Forskere kan klikkes på via nettstedet og også lastes ned for videre manipulering og analyse. Dette er en ressurs som kan stoles på og refereres til for kvalitetsinformasjon distribuert på en tilgjengelig måte. 96. Det amerikanske arbeidsdepartementet Det amerikanske arbeidsdepartementet inneholder mye økonomisk data om statistikk om arbeidsledighet og sysselsetting. Disse tallene inkluderer naturligvis databaser som inkluderer statistikk over masseoppsigelser, sysselsettingsprognoser, ledige stillinger og turnover på arbeidsplassen, nasjonal sysselsettingsstatistikk og til og med internasjonal arbeidsstatistikk. Nettstedet gir informasjon som er oppdatert og nøyaktig, mens arbeidsdepartementet holder oversikt over alt. Dette er en anerkjent ressurs med statlig støtte for forskningsformål. 97. Småbedriftsadministrasjon Small Business Administration har lenge vært en velprøvd ressurs for gründere og andre håpefulle gründere. Dette nettstedet inneholder massevis av statistikk om sysselsetting, samt informasjon som lar forskere gjøre markedsundersøkelser og konkurranseanalyser. Her kan forskere finne tall, statistikk og verktøy som kan brukes til å avdekke ytterligere data. For informasjon om statistikk for små bedrifter fra et arbeidsgiver- og forretningsperspektiv, er dette en utmerket ressurs som journalister kan henvende seg til når som helst. 98. Folkemengdepac Crowdpac er en plattform som lar politiske kandidater samle inn penger og organisere seg. Med utgangspunkt i ideen om at det finnes en rekke kongresskandidater ved hvert valg som i utgangspunktet stiller uten motkandidater, lar denne nettsiden engasjerte borgere organisere seg. Med artikler som diskuterer relevante politiske spørsmål som valgkretsvalg i tillegg til tilleggsemner som sivile rettigheter og nasjonal sikkerhet, representerer denne nettsiden en utmerket mulighet til å forstå og finne ut hva som skjer i den politiske grasrotscenen. 99. Gallup Dette nettstedet er hjemmet til de berømte Gallup-undersøkelsene. Gallup spesialiserer seg på analyser som lar beslutningstakere i organisasjoner løse problemer gjennom en databasert tilnærming til problemløsning. Videre er verktøyet som foreslås av Gallup ofte nyttig for å fremme løsninger. Dette er en kilde som er anerkjent som gullstandarden innen data og avansert analyse. Bare bla gjennom nettstedet for å utforske rapporter om alt fra tilstanden til den globale arbeidsplassen til diskusjon om produktivitet i USA. 100. Berkeley-biblioteket Berkeley Library har en komplett samling av statistikk og data for statsvitenskapelig forskning på nettstedet sitt. På denne siden finner forskere en rekke lenker som gir tilgang til en rekke datasett, samt muligheten til å bygge dine egne. Blant disse er Historical Statistics of the United States (HSUS), Millennial Edition, Data Planet, ProQuest Statistical Insight og Inter-university Consortium for Political and Social Research. Det er flere timer med data å gå gjennom. 101. RAND statlige tjenester For de som ikke vet det, er RAND Corporation en organisasjon som spesialiserer seg på forskning på utfordringer knyttet til offentlig politikk. Med kunder og en portefølje som spenner over alle forvaltningsnivåer, er selskapet en kilde til kvalitetsforskning for beslutningstaking. Den amerikanske avdelingen av selskapet har et sett med databasestatistikk på nettstedet sitt. Her kan forskere finne informasjon om utdanning fra barnehage til videregående, helse, næringsliv og økonomi blant andre kategorier som tar for seg problemstillinger som er relevante for det offentlige beste. 102. Roper-senteret for forskning på offentlig mening Roper Center for Public Opinion Research, som drives av Cornell University, spesialiserer seg på å samle inn, distribuere og bevare data om den offentlige meningen. Som et eksempel på den typen informasjon Roper Center kan avdekke, kan forskere få tilgang til data fra det amerikanske valget, samt en lenke til et arkiv med over 23 000 datasett. Enten journalister ser etter offentlige reaksjoner på politikk eller på en nylig helsekrise, er det nesten sikkert at dette nettstedet har informasjon. 103. Samferdselsmyndighetene Dette nettstedet, som drives av Bureau of Transportation, har data som spenner over et bredt spekter av transportrelaterte emner. Ressursene på dette nettstedet inkluderer rapporter om energi, passasjersikkerhet, systemytelse, transportøkonomi, infrastruktur og godstransport. Brukere kan til og med sortere og få tilgang til dataene som tilbys på dette nettstedet etter sted og geografi. Dette er et nettsted som lar forskere finne ut alt de kan forvente å vite om transportrelaterte emner. 104. Reisebransjen Travel Trade er et nettsted som inneholder data om amerikanske statsborgeres avreiser fra 1996 til 2016 i skrivende stund. Det uttalte målet med denne ressursen er å hjelpe interesserte medlemmer av allmennheten med å forstå hvordan global turisme og internasjonal turisme har fungert gjennom årene. Dette er en lett tilgjengelig informasjonskilde som er tilgjengelig både for nedlasting og for visning på nett. Forskere kan enkelt bruke disse dataene til å finne trender og gjøre sammenligninger. 105. Skift Skift er et nettsted som fokuserer på å tilby informasjon og data til reiselivsbransjen. Blant andre datakilder arrangerer selskapet forskning, konferanser og informative nyhetsbrev som abonnenter og forskere kan velge mellom. Skift undersøker emner som enkeltpersoner i reiselivsbransjen ønsker å vite, for eksempel hvor folk reiser i økende grad, identifisering av nye markeder og mye tilleggsinformasjon om reiseteknologi som forskere har muligheten til å utforske. 106. Geoba.se Geoba.se er det perfekte nettstedet for folk som ønsker fakta og ingenting annet enn fakta om en by eller et sted. Ved å bruke søkemotoren på hjemmesiden er det bare noen få enkle tastetrykk å finne koordinater, reiseinformasjon, vær og til og med lokale webkameraopptak. Nettstedet har også en side som gir informasjon om verdensrangeringer som kan snevres inn etter region og land. Kort sagt, dette er en ressurs som gir rene data og statistikk. 107. Reise i USA US Travel er vert for et nettsted som drives og vedlikeholdes av det amerikanske utenriksdepartementet. Nettstedets uttalte oppgave er å beskytte livene til amerikanske statsborgere som reiser utenlands. Som sådan inneholder denne kilden statistikk, informasjon og rapporter om emner som amerikanske pass, amerikanske visum, internasjonale adopsjoner, dødsfall i utlandet og internasjonale bortføringer av foreldre og barn. Informasjonen kan brukes under planlegging av reiser, men kan også brukes til å identifisere langsiktige trender med statistikken som spenner fra 1996 til 2016. 108. Britisk datatjeneste UK Data Service Collection, som er finansiert av Economic and Social Research Council, publiserer et bredt spekter av data. Dette nettstedet har informasjon som inkluderer materiale som forretningsdata til tverrnasjonale undersøkelser, undersøkelser sponset av den britiske regjeringen og til og med britiske folketellingsdata. Nettstedet ble i utgangspunktet designet med tanke på studenters og forskeres behov. I tillegg finnes det veiledninger, ressurser og instruksjoner som tilbyr veiledninger og ressurser som vil hjelpe forskere med å forstå og bruke verktøyene på dette nettstedet raskt. 109. Data.gov.au Data.gov.au drives og publiseres av den australske regjeringen, og tilbyr enkel tilgang til og søking i åpne data. Dette nettstedet påpeker eksplisitt at myndighetsdata kan brukes til å utvikle verktøy og applikasjoner som igjen kan brukes til fordel for australiere. Ikke bare gis det tilgang til de åpne datasettene, men det finnes også upubliserte data som kan tilgås mot et gebyr. For forskere som ønsker å utføre en enda dypere analyse, tilbyr nettstedet også et dataverktøysett. 110. Twitter Alle kjenner Twitter for sine fartsfylte samtaler, korte meldinger og dens status i populærkulturen som et knutepunkt for nyheter. Det mange imidlertid ikke vet, er at Twitter også har utviklerverktøy som gjør det enklere å filtrere og oppdage informasjon. Disse verktøyene lar til og med forskere se trender og filtrere etter geografi. Enten de leser seg opp på trendende emneknagger eller utforsker utviklerverktøyene, er Twitter en ressurs journalister har brukt en god stund. 111. Instagram Instagram er ikke bare for å like søte kattebilder og bedårende babybilder. Eller i det minste trenger det ikke å være det. Appen har et overraskende sofistikert sett med utviklerverktøy som gjør det enkelt å forstå og gjøre research på publikum. I tillegg kan emneknagger og ledetråder avslørt av bildene folk legger ut, samt personene som blir tagget i dem, være en skattkiste av informasjon. Instagram er en nyttig måte å avdekke hva som er trendy i ulike sektorer. 112. Fire kvadrater For den typen forskning der plassering er viktig, er Four Square en nyttig datakilde på grunn av den massive databasen og all informasjonen den har samlet. På overflaten har den en byguide som gir anbefalinger til brukere om styrken til fellesskapet. Four Square har også utviklerverktøy som gir tilgang til ytterligere informasjon gjennom stedsdatabasen. Journalister kan bruke dette til å lære mer om bestemte steder og om personene som bruker appen. 113. New York Times Mange anser New York Times som et ansett medlem av den fjerde makt, men det er svært få journalister som ikke har hørt om den. Det som ofte overses, er imidlertid bruken av New York Times som datakilde gjennom API-et. Forskere kan finne artikler som går tilbake til 1851 per måned, søke i artikler og til og med finne bokanmeldelser. Dette API-et tillater søking basert på visninger, delinger og e-poster, og til og med å finne og få tilgang til kommentarer. 114. AP Associated Press har en permanent plass i populærkulturen som en kilde til aktuelle og nøyaktige nyheter. Takket være utviklerverktøyene er det også en nyttig datakilde for journalister. I skrivende stund kan forskere bruke disse verktøyene til å lage sine egne redigeringer mens de laster ned bilder og videoer. Innholdsnivået ser ut til å avhenge av hvilken type plan forskerne bruker, men Associated Press API lar likevel brukere ta forskningsprosessen til et nytt nivå. 115. Fem trettiåtte Journalister er kanskje allerede kjent med Nate Silver og Five Thirty Eight og hans statistiske modell på grunn av hans til tider uventede, men vanligvis korrekte spådommer. Five Thirty Eight har en GitHub som inneholder datasett samt koding som har blitt brukt i løpet av nettstedets historie. Datasettene inneholder morsomme emner som data om dårlige sjåfører, Avengers og undersøkelsen om flyetikette. Samtidig finnes det også filer som tar for seg litt mer alvorlige saker som flysikkerhet og hatkriminalitet. 116. IMDb IMDb regnes av mange som det mest omfattende nettstedet på nettet med hensyn til film- og skuespillerbransjen. Hvis det kommer en film og folk vil vite hvem som spiller i den eller se den generelle reaksjonen til kinopublikummet, er det stor sannsynlighet for at de kommer til å lande på dette nettstedet på et tidspunkt i løpet av søket sitt. IMDb er også vert for en rekke datasett som oppdateres hver dag og er tilgjengelige for kommersiell og ikke-kommersiell bruk. 117. KAPSARC KAPSARC er en dataportal som inneholder totalt 923 datasett med spesifikk informasjon om energidata. Disse settene er delt inn i noen få generelle temaer innen energibruk, energiforsyning og andre relevante faktorer som politikk, demografi, miljø, handel, vann og økonomisk informasjon. For forskere som er interessert i energi og hvordan den brukes på tvers av ulike bransjer og sektorer, er KAPSARC en av de mest omfattende energidatakildene på nettet. 118. Makro for eiendel Asset Marco er et nettsted som tilbyr historiske økonomiske data og makroøkonomiske indikatorer. Disse dataene dekker mer enn 75 000 aksjer, valutaer, råvarer og obligasjoner over hele verden. I tillegg har nettstedet mer enn 120 000 makroøkonomiske indikatorer som brukere kan bruke til å utforske økonomiske data fra forskjellige land. I tillegg til alle disse finansmarkedsdataene diskuterer nettstedet også investeringsstrategier. Denne kilden er veldig unik på grunn av den store mengden informasjon som kan finnes. 119. Amerikanske myndigheters webtjenester og XML-datakilder Den amerikanske regjeringens webtjenester og XML-datakilder ligger på nettstedet USGovXML.com. Her kan brukere bla gjennom de forskjellige XML-datakildene og webtjenestene som den amerikanske regjeringen har levert. Denne enkle bevaringshandlingen holder disse nettkildene transparente og tilgjengelige for publikum. Forskere som regelmessig overvåker denne indeksen generelt, er det mulig å finne en historie i dataene i tilfelle det skjer en plutselig endring i XML-dataene. 120. Figshare Figshare er et nettsted som inneholder over 5000 vitenskapelige ressurser tilgjengelig for akademisk forskning og sitering. I tillegg til informasjonen der, er nettstedet utformet for å tilby forskere ett enkelt sted for å samle, laste opp, lagre og administrere forskningen de finner. Matematikk, helsevitenskap, ingeniørfag, kjemi, biologiske vitenskaper og samfunnsvitenskap er alle oppført som utvalgte kategorier. Dette nettstedet er en flott kilde for journalister som leter etter flere akademiske ressurser å bruke. 121. Lenkede data LinkedData er et nettsted dedikert til ideen om å finne nye måter å koble sammen internettdata som ikke var koblet sammen før. Her finner brukerne veiledninger, guider og datasett som setter historien i gang. Datasettene fokuserer alle på temaet å bli involvert i det koblede datafellesskapet, og i tillegg til handlelisten for koblede data er de fleste kategorisert som derefererbare URI-er enten med eller uten det komplementære RDF-formatet. For å lære mer om dette fellesskapet, er dette nettstedet et must å se. 122. Nettgruvearbeideren Web Miner er det perfekte stedet for forskere som ønsker å samle alle de generiske dataene de kan finne med programmet. Dette nettstedet inneholder eksempeldatabaser som amerikanske restauranter, SWIFT-koder fra banker over hele verden, amerikanske bensinstasjoner, amerikanske turistattraksjoner og Google Play-apper blant andre enorme lister. Om ikke annet, er det et nettsted som vil gjøre det enklere og raskere for journalister å sile gjennom og avdekke enorme mengder data på betydelig kortere tid. 123. Datasenter Data Hub er stolt av å være et sted hvor brukere kan finne og publisere data så raskt og effektivt som mulig. Nettstedet inneholder en rekke datasett. Boligprisindeksen (Case-Shiller), den månedlige gullprisen og de nåværende trendene i atmosfærisk karbondioksid er de tre mest populære. I tillegg til dataene inneholder nettstedet også en rekke veiledninger som brukere kan gå gjennom for å lære mer om å navigere i de ulike datatypene som er tilgjengelige. 124. Enigma Public På nettstedet sitt omtaler Enigma Public seg selv som «den bredeste samlingen av offentlige data» som er tilgjengelig på nettet. Datasettene faller inn under en av fire hovedkategorier i FOIA, Essentials, Newsworthy og Under the Radar. Noen av dataene på dette nettstedet inkluderer lønninger til ansatte i Det hvite hus og aktive føderale skytevåpenlisenser. Etter å ha opprettet en gratis konto, kan brukerne få tilgang til hvilken som helst av datakategoriene som er der for visning. 125. Yahoo De fleste nettbrukere kjenner navnet Yahoo på grunn av blant annet Yahoo! News og Yahoo! Finance, som er blant selskapets mange nettsider. Av interesse for forskere og journalister er det faktum at Yahoo også er vert for et stort antall datasett, inkludert Yahoo! Music User Ratings of Songs with Artist, Album, and Genre Meta Information, v. 1.0 og Yahoo! Movies User Ratings and Descriptive Content Information, v.1.0 for å nevne to. Journalister som leter etter ny statistikk kan ikke gå feil med denne kilden. 126. 1000 genomer 1000 Genomes er hjemsted for et prosjekt med samme navn som gikk fra 2008 til 2015. Formålet med prosjektet var å finne alle genetiske variasjoner som kunne forekomme i minst 1 % av populasjonene som ble studert. Sammen med publikasjonene som ble laget på grunn av dette prosjektet, fantes det også massive datasett som inkluderte separate databaser med variantceller, råsekvensfiler og tilgjengelighet av prøver. Disse dataene kan enten blas gjennom eller lastes ned. 127. CBOE CBOE er en futuresbørs som primært fokuserer på volatilitetsfutures. Nettstedet har spesielt mye materiale om futures som er omtalt på nettstedets varemerkebeskyttede volatilitetsindeks. Nettstedet inneholder markedsdata av alle slag, inkludert historiske data, daglig markedsstatistikk og daglige oppgjørspriser for VX Futures. For journalister som søker markedsdata av høy kvalitet, er CBOE et nettsted som kan tilby denne informasjonen i et format som er lett å følge og forstå. 128. St. Louis sentralbank Federal Reserve Bank of St. Louis er et av, om ikke det viktigste, finanssentrene i regionen. På nettstedet kan forskere lese arbeidsdokumenter, økonomiske data, publikasjoner og informasjonstjenester direkte. Med andre ord er det ingen mangel på informasjon om nåværende og tidligere tenkning hos St. Louis Fed når det gjelder politikk, samt evnen til å evaluere effektiviteten til St. Louis Federal Reserve Bank. For journalister innen næringsliv, finans og økonomi er dette en førsteklasses informasjonskilde. 129. OANDA OANDA er en populær nettbasert aksjehandelsplattform, hovedsakelig for handel med CFD-er og valutahandel. I tillegg til de mange funksjonene som er lagt til traderen med den hensikt å tiltrekke seg netthandlere, er OANDA også vert for mye historisk kursdata samt historisk informasjon om valutakonvertereren på nettstedet. Sammen med alle disse dataene tilbyr nettstedet også informasjon om investeringsstrategier sammen med nyheter og markedsanalyser. En konto er ikke engang nødvendig for å få tilgang til mesteparten av disse dataene. 130. ABS Det australske statistikkbyrået, eller ABS, ikke ulikt sin amerikanske motpart, tilbyr objektive data, økonomisk informasjon og forskning om et bredt spekter av emner som er relevante for landet. Direkte på selve nettstedet kan forskere slå opp statistiske data om næringslivsindikatorer, helsevesen, bolig, finans, internasjonal handel, bolig, mental helse, samt prisindekser og inflasjon. Journalister kan søke for å finne eldre undersøkelser og informasjon som også kan sortere informasjon etter region. 131. London-databasen London-databasen, som opprinnelig ble unnfanget og drevet av Greater London Authority, er Londons forsøk på å gjøre Londons data mer tilgjengelige for offentligheten. Det endelige målet er å gi folk tilgang til denne informasjonen, samtidig som de oppmuntres til å bruke den gratis på hvilken som helst måte de ønsker. På dette nettstedet kan brukere søke i data etter emner som kunst og kultur, kriminalitet og samfunnssikkerhet, utdanning og helse. Journalister som er interessert i denne typen data, kan nå få dem direkte fra lokale myndigheter. 132. Statistikk NZ New Zealands myndigheter har massevis av statistikk og data som forskere kan grave i og analysere på dette nettstedet. Denne informasjonen kan siles gjennom ved hjelp av søkefeltet øverst, ved å filtrere etter sted og region, samt etter emne. Noen av emnene inkluderer økonomiske indikatorer, helse, inntekt og arbeid, industrisektorer, miljø og næringsliv. Mellom de ekstra nyhetskildene og pressemeldingene som fremhever ulike funn og statistikk, vil journalister avdekke all slags New Zealand-spesifikk statistikk gjennom dette nettstedet. 133. Det australske regjeringens meteorologiske byrå Nettstedet til Australian Bureau of Meterology, som i hovedsak drives av den australske regjeringen, inneholder værinformasjon for de ulike byene og regionene i Australia. Ifølge nettstedet ble dette byrået opprettet som et middel for å hjelpe australiere med å takle klimaet rundt seg gjennom en kombinasjon av advarsler og råd. Her vil forskere kunne finne sesongmessige utsikter, vannlagring, nedbørsprognoser, klimavariabilitet og sesongmessige prognoser for elvestrømmer. På dette nettstedet finner du nøyaktig og pålitelig dekning av australsk vær. 134. GruppeLinse Dette nettstedet er tilgjengelig på nettet, med tillatelse fra GroupLens ved University of Minnesotas avdeling for informatikk og ingeniørfag. Nettstedet tilbyr publikasjoner samt datasett for forskningsformål. Det er totalt omtrent seks datasett. Blant de navngitte settene er det noen få med tittelene Book-Crossing, MovieLens og HetRec 2011. Kort sagt, dette er en nyttig ressurs for journalister som ønsker å bedre forstå hvordan de skal bruke dataene som gis. 135. KD Nuggets KD Nuggets er et nettsted som primært fokuserer på å tilby folk kunnskap om datavitenskap, forretningsanalyse, maskinlæring og datautvinning. Det finnes en side på nettstedet som har en komplett liste over datasett som folk bruker for å utforske datautvinning og stordata mer, med datasett som Bioassay Data, Asset Marco, DataMarket, Casualty Workbench, Data Ferrett og Datamob som alle er lenket til. Dette er en fantastisk ressurs for journalister som foretrekker å ha all informasjonen på én side. 137. Microsoft Alle som har brukt en PC eller bærbar PC har sikkert hørt om Microsoft, i hvert fall i forbifarten. Interessant nok, i tillegg til PC-er, bærbare datamaskiner og programvare, er Microsoft også vert for mye forskning og publikasjoner. Dette inkluderer gjennombrudd som selskapets søken etter å skape kunnskapsrike maskiner, samt skybasert datavitenskap. Det finnes også ytterligere informasjon om verktøy Microsoft utvikler, som Visual Studio Code Tools, og utviklingen innen AI som de representerer. 138. RDataMining Akkurat som det står på boksen, er R Datamining en ressurs om R og datautvinning. Nettstedet tilbyr en rekke eksempler og dokumenter som gir et dyptgående perspektiv på datautvinning og datautvinning med R. I tillegg finnes det også lenker til opplæringskurs som det korte kurset som tilbys av University of Canberra. Dette inkluderer lenker til gratis datasett og presentasjoner, samt datasett som dekker emner som fly-, flyselskaps- og rutedata, samt lenker til nettsteder som GeoDa. 139. Samarbeidsforskning i beregningsorientert nevrovitenskap – datadeling Collaborative Research in Computational Neuroscience, også kjent som CRCN, har en rekke datasett som er tilgjengelige via nettstedet deres. Datasettene er kategorisert etter de ulike delene av hjernen, som den visuelle cortex, hippocampus, motorisk cortex, fugl, øyebevegelser og aplysi, for bare å nevne noen få eksempler. Disse mappene inneholder også utfordringer, verktøy, simuleringer og metoder. Muligheten til å dele disse dataene gjør dem til en enda bedre ressurs å bruke til forskning. 140. Protein Data Bank-arkivet Ifølge nettstedet sitt har Protein Data Bank-arkivet vært en fremste ressurs for nukleinsyrer, proteiners 3D-strukturer og komplekse sammensetninger siden 1971. Siden det eksplisitte målet er å holde denne informasjonen offentlig tilgjengelig, kan forskere gå hit for å se valideringsrapporter og dataordbøker på nett. Det finnes også datavekst og bruksstatistikk tilgjengelig for nettbasert sortering og analyse, samt for nedlasting. Best av alt, nettstedet legger stadig til ny informasjon. 141. PubChem-prosjektet PubChem, som et offisielt prosjekt, ble utformet med det formål å informere offentligheten om hva små molekyler er i stand til å gjøre fra et biologisk synspunkt. Nettstedet er koblet til av tre databaser, inkludert PubChem Compound, PubChem Substance og PubChem BioAssay. I tillegg gjør nettstedet det også mulig å søke etter likheter mellom forskjellige proteiner. For forskere som tar dataanalysen sin til neste nivå, tilbyr nettstedet også gratis koding og tips. 142. Coremine Medical Coremine Medical er en uvurderlig ressurs for alle som søker etter informasjon om biologi, helse og medisin. Nå som PubGenes biomedisinske tekstutvinningsfunksjonalitet er rullet inn i sin nåværende form, er Coremine også en av de mest fleksible kildene til biomedisinsk informasjon som finnes. Dette nettstedet vil vise koblinger mellom konsepter og ideer i et visuelt engasjerende og lettforståelig format som kanskje ikke ville blitt lagt merke til ellers. Det er lett en av de mest omfattende biomedisinske datakildene som er tilgjengelige for journalister. 143. Din tid Tu Tiempo er en utrolig kilde til vær- og klimadata for alle land i verden. Ved hjelp av denne ressursen er det enkelt å finne årlige, månedlige og daglige gjennomsnitt for så å si alle byer og regioner i verden. I tillegg kan brukere også søke gjennom databasen med over 115 millioner poster fulle av historiske data som alle kan søke gjennom. Avhengig av regionen som søkes i, er det mulig å finne data som går så langt tilbake som 1929. 144. Komplekse nettverksressurser Dette er et nettsted som gir tilgang til ganske mye av dataene som først ble brukt i deres databaserte eksperimenter. Den fullstendige listen over datasett som viser datatypene, inkludert nyhetsgrafer, biologiske grafer, sitasjonsgrafer, samarbeidsgrafer, konstruerte grafer og semantiske grafer. Siden lenker også til en liste over kilder som inneholder mye informasjon, for eksempel datasettet som undersøkte omtrent 3 millioner amerikanske patenter. Siden kan også skryte av en imponerende samling av komplekse nettverksdatasett. 145. Scopus Scopus er et verktøy som lar enkeltpersoner raskt og enkelt finne forskning og akademiske sitater. Nettstedet tilbyr en utrolig omfattende database med forskning som har funnet sted over hele verden innen en rekke felt som inkluderer sektorer som medisin, teknologi, samfunnsvitenskap, kunst og humaniora. Bruk Scopus til å fange opp akademiske kilder som kanskje har blitt oversett. Tross alt kan kvaliteten på en akademisk kilde i mange kretser være nesten like viktig som informasjonen den gir. 146. Stanford Stanfords rykte som en prestisjefylt akademisk institusjon kom ikke helt tilfeldig. Fortreffeligheten skinner gjennom i deres programmeringsrelaterte kurs. Nettstedet er også vert for en rekke datasett som inkluderer detaljer som informasjon om sosiale nettverk. Det finnes datasett som fokuserer på sosiale sirkler på Facebook, Wikipedia-administratorforespørsler, Twitter-sosiale sirkler og Google+. Kommunikasjonsnettverk og Amazon Product Network har også sine egne datasett. 147. Universitetet i Milano Institutt for informasjonsvitenskap ved Universitetet i Milano driver og driver en nettside kjent som Laboratoriet for webalgoritmer. Denne siden inneholder en rekke datasett som er der for utforskning. Disse inkluderer grafer knyttet til sosiale nettverk, Facebook-grafer, øyeblikksbilder fra DELIS-prosjektet og en kort liste over diverse data. Informasjonen som er tilgjengelig her kan sees på nettet og lastes ned hvis du ønsker det, noe som gjør dette til et av de mest tilgjengelige datasettene av sitt slag på nettet. 148. UCI-nettverksdatalager UCI Network Data Repository er et nettsted dedikert til å ta en vitenskapelig tilnærming til studiet av nettverk. På ressurssiden finner forskere lenker til datasettkataloger valgt av forskningsorganisasjoner og -grupper, så vel som av enkeltpersoner. Det har også en samling datasett som vanligvis ville blitt brukt til analyse av sosiale medier. De som graver i dataene, vil bli glade for å finne at disse settene også er tilgjengelige for nedlasting. 149. CAIDA CAIDA, eller Center for Applied Internet Data Analysis, samler inn et bredt spekter av data fra en rekke forskjellige steder, ofte med hjelp fra forskjellige organisasjoner og enkeltpersoner. Det finnes datasett på dette nettstedet, som AS Relationships, DDOS Attacks, Telescope og relaterte datasett, sammen med andre data. Kategoriene inkluderer trafikk, topologi, sikkerhet, ormesammendrag og trafikksammendragsstatistikk. Datasett kan kreve forespørselstilgang, men mange, om ikke de fleste, er offentlige. 150. Crawdad Crawdad, eller Community Resource for Archiving Wireless Data At Dartmouth, er unik på grunn av fokuset på å tilby trådløse data til forskere og andre som kan ha interesse for emnet. Nettstedet tilbyr en rekke verktøy samt tilgang til en rekke datasett. Blant settene som er oppført, er de som refereres til pedagogisk bruk, bitfeilkarakterisering, nettverksdiagnose, opportunistisk tilkobling, stedsbevisst databehandling og mer å velge mellom. Forskere vil sette pris på denne ressursen jo mer de dykker ned i den. 151. Det amerikanske energiinformasjonsadministrasjonen Det amerikanske energiinformasjonsdepartementet (Energy Information Administration), ofte kalt EIA, tilbyr årlige data om strømforsyning til offentligheten. Informasjonen i disse dataene dekker blant annet fossile brensellagre, drivstofforbruk, månedlig og årlig informasjon om strømproduksjon og miljødata. Dataene er tilgjengelige for analyse fra årene 2001 til 2017. Alt forskerne trenger å gjøre er å navigere til nettstedet og laste ned informasjonen. 152. Britiske oseanografiske data British Oceanographic Data, som er finansiert av National Environment Research Council, er en av de mest tilgjengelige kildene til marin data på internett. Med en omfattende database som tar for seg strømninger, CTD-profiler, internasjonale havnivådata, strømninger og til og med historiske bunntrykksregistreringsdata. I tillegg finnes det datasett i Published Data Library, som gir ytterligere tilgang til katalogen. Dette er muligens en av de mest omfattende kildene til marin informasjon som er tilgjengelig på nett. 153. Faktuell Factual tilbyr posisjonsdata for annonsering og bruk på mobile plattformer. Av spesiell interesse for forskere er utviklerverktøyene som inkluderer Engine Mobile SDK og de komplette profesjonelle og forskningsapplikasjonene til Observation Graph samt Local Validation Stack. Med et nettstednavn som understreker selskapets lidenskap for å ta data fra hele verden og finne nye måter å sette dem i kontekst, har Factual en klar forpliktelse til data og å finne nye og uortodokse muligheter til å bruke dem. 154. Globale administrative områder Globale administrative områder er en geodatabase som viser hvor de ulike administrative områdene i verden ligger. Dataene som samles inn fra denne typen database brukes deretter vanligvis i geografiske informasjonssystemer. Disse inkluderer land og er videre delt inn i provinser, fylker og departementer blant annet. Den gode nyheten for journalister er at alle disse dataene er tilgjengelige gratis og kan også brukes til akademisk og generell ikke-kommersiell bruk. 155. Geonavn Geonames er et nettsted som inneholder en geografisk database med millioner av oppføringer, unike funksjoner og alternative navn. Dette er en database som behandler omtrent 150 millioner forespørsler hver dag, og tilbyr både et eksportalternativ og tilgang gjennom en rekke webtjenester. Takket være databasens wiki-funksjoner kan brukere gjøre justeringer og endringer i databaseoppføringene relativt enkelt. Dette er en flott ressurs alene på grunn av de flerspråklige hostingmulighetene. 156. Naturlige jorddata Natural Earth Data er et kartdatasett som er tilgjengelig i det offentlige domene og fullt av informasjon designet for bruk i kartleggingsprogramvare for å lage toppmoderne kart. Det visuelle bildet av det endelige produktet er ryddig og velorganisert, og dataene kan brukes umiddelbart. Dette datasettet inkluderer tilstedeværelsen av etterretningsdata og ulike kulturelle, raster- og fysiske vektordatatemaer. Dette datasettet ble opprinnelig laget med tanke på kartografers behov og preferanser, og er nyttig for alle som er interessert i geografi. 157. Openstreet-kart Openstreet Map er mindre en nettside og mer et samarbeid mellom brukere som nå tilbyr karttjenester til apper, nettsteder og diverse maskinvareenheter. Dette nettstedet samler inn nye data når brukere legger inn informasjon om mindre kjente landemerker som jernbanestasjoner, veier og stier. Hele datasettet er tilgjengelig gratis på nettstedet og kan lastes ned enten helt eller delvis. For de som velger å laste ned en delvis del av dataene, er det også mulig å laste ned etter region. 158. Byen Chicago Chicago er hjemmet til Michael Jordans mesterskaps-Bulls og byens unike pizzastil, og byen har også en komplett dataportal. Datasettkategorier spenner over en rekke emner som inkluderer administrasjon og finans, etikk, helse og sosiale tjenester, parker og rekreasjon, offentlig sikkerhet og historisk bevaring. Kort sagt, Chicagos dataportal inneholder praktisk talt alt som kan være av interesse for forskere, beslutningstakere og lokale journalister. 159. CKAN CKAN er i hovedsak netthjemmet til Glasgows åpne dataprosjekt. Dette nettstedet har datasett om en rekke emner som er nyttige for gründere, beslutningstakere, akademiske forskere og apputviklere. Av de 360 ​​datasettene som er lagret her, er noen relatert til bystyring, som datasettet for boligmasse etter andel, mens andre, som datasettet for sykkelturer, er av spesiell interesse for lokale innbyggere. Det finnes all slags informasjon her for journalister som dekker et mer lokalt område. 160. Indias regjering Indias regjering har et nettsted som dekker analyse- og dataressurser i sin versjon av Open Data Project. For øyeblikket er det omtrent 137 940 ressurser som har blitt vist millioner av ganger på nettstedet. De aller fleste av disse filene er også tilgjengelige for nedlasting på nettstedet. Enten du leter etter tall om statsbudsjettet eller søker etter datasett som omhandler helse og familievelferd, er sjansen stor for at dette nettstedet har ressurser å tilby. 161. Statistikk SA Dette nettstedet er fullt av oppdatert statistikk, publikasjoner og data samlet inn av den sørafrikanske regjeringen. Her vil forskere avdekke informasjon om alt fra mat- og drikkeundersøkelser til økonomiske indikatorer, sysselsettingsstatistikk, befolkningstall og viktig helsestatistikk. Det er mulig å søke i tallene etter by, tema og indikator, avhengig av hva som er nødvendig. Dette nettstedet inneholder mye informasjon om folketellingen, samtidig som det publiserer statistiske publikasjoner, spørreskjemaer, koder og klassifiseringer, samt prispolitikk. 162. Policyutvikling og forskning Dette nettstedet publiseres under paraplyen til det amerikanske bolig- og utviklingsdepartementets kontor for politikkutvikling og forskning. Det publiserer et stort antall casestudier, halvårlige publikasjoner og tidsskrifter regelmessig hvert år. Det tilbyr også et stort antall datasett som journalister kan være interessert i, og markedsleie, inntektsgrenser og inflasjonsfaktorer for fornyelsesfinansiering er bare noen av settene publikum har tilgang til på dette nettstedet. 163. Viktige netthelsedata Hos Vital Net Health Data finner forskere en mengde store helserelaterte datasett. Dette nettstedet er ikke så mye vert for alle disse settene, men tilbyr lenker til sett som folk kan besøke og finne informasjon gjennom. Denne kuraterte listen lenker til ressurser som CDC Wonder, Eurocat, Health Data All Star, og også arbeidet til veldedige organisasjoner som North American Association of Central Cancer Registries. Dette er uten tvil en av de mest omfattende helsedatasettressursene som finnes. 164. Analytisk bro Analytic Bridge er en ressurs dedikert til forretningsintelligens. Her finner forskere diskusjoner om maskinlæring og AI, lenker til webinarer og konferanser, og til og med en jobbsøk-fane. Nettstedet er også vert for Data Science Central, som er den delen av nettstedet som fokuserer på stordata. Med sitt aktive og engasjerte fellesskap og sin forpliktelse til å tilby nyheter og informasjon, kan journalister med interesse for implikasjonene av data for næringslivet tjene mye på dette. 165. Arkiv.org archive.org er først og fremst kjent for sine forsøk på å bli et offentlig nettbibliotek, og huser en rekke publiserte verk samt en betydelig datasamling. Nettstedet kan skryte av resultater fra Internett-tellingen i 2012, samt arkiver fra Dark Net Market fra 2011 til 2015, og til og med et datasett med offentlige Reddit-kommentarer. Det finnes datadumper fra Music Brainz og et datasett som inneholder lydbilder av omslag. Blant publikasjonene og dataene har archive.org mye materiale journalister kan gå gjennom. 166. Akademiske torrenter Dette nettstedet omtaler seg selv som et system designet for å gjøre det enklere å dele og laste ned enorme datasett. Academic Torrents bruker torrentteknologi for å forenkle distribusjonen av data, og er stolte av å la forskere laste ned alt de trenger raskt. Nettstedet er også vert for artikler, kurs og samlinger for visning. Et raskt søk gjennom tilgjengelige ressurser vil avsløre at det finnes tonnevis av datasett og samlinger tilgjengelig for nedlasting her. 167. Dataverse Den beste måten å tilnærme seg Dataverse på er å tenke på det som en annen type bibliotek. Her kan forskere enkelt søke etter, oppdage og sitere data, samtidig som de bruker dette nettstedet som et arkiv for sin egen informasjon. Emnet som dekkes inkluderer felt som samfunnsvitenskap, landbruksvitenskap, medisin, helse- og biovitenskap, samt jord- og miljøvitenskap. Store navn med publikasjoner på dette nettstedet inkluderer Gallup og det amerikanske handelsdepartementet, Bureau of Census, Geography Division. 168. UC-DATA UC Data, som opererer i samarbeid med UC Berkeleys Social Science Data Lab, er universitetets største og mest kjente arkiv. Dette nettstedet tilbyr tjenester innen statistikk og samfunnsvitenskapelige data. På dette nettstedet kan forskere få tilgang til artikler, rapporter og arbeidsdokumenter produsert av UC Data-forskerne. Rådataene dekker en rekke forskningsområder som helsevesen, velferd og sosialforsikring, demografi, stemmegivning og informasjonsteknologi blant en rekke andre emner. 169. Spøkeleir Joe Kamp tilbyr en fullstendig guide til å finne fotballdata og API-er for dataanalyse. Hvis forskere følger lenkene på siden, finnes det åpen kildekode-data tilgjengelig via GitHub, samt tilgang til gratis og kommersielle API-er for enklere tilgang. Siden dataene og kodingen er tilgjengelig på et anerkjent nettsted som GitHub, har det aldri vært enklere å få tak i denne typen data. 170. Sean Lahman Sean Laham er ikke nødvendigvis et navn folk hører hver dag, men nettstedet hans inneholder en av de mest omfattende og dyptgående batting- og pitchingstatistikkene på internett. Med tall som dekker perioden fra 1871 til 2016, går dataene bokstavelig talt århundrer tilbake i tid. Dataene er gratis å få tilgang til og bruke under Creative Commons Share Alike 3.0-lisensen og kan lastes ned direkte i SQL og Microsoft Access for å nevne noen. Statistikken kan også lastes ned via GitHub. 171. Retro ark Retro Sheet er en av de mest omfattende kildene på internett for baseballstatistikk og -data. Nettstedet inneholder detaljer som årlige lagoppstillinger og identifikasjon av dommere, spillere og trenere. I de årene det var relevant, ble dataene for All-Star-kampen inkludert i arrangementsfilene sammen med et sett med arrangementsfiler for sluttspillet og en liten avviksfil. Retro Sheet har til og med identifikasjoner for baseballbaner for hver sesong. Er det grundig? 172. Hubway Data Challenge For de som ikke er like kjent med programmet, er Hubway navnet på sykkeldelingstjenesten som holder til i storbyområdet Boston. Systemet registrerte og utgav selvsagt ikke identifiserende informasjon, men Hubway har likevel grunnleggende informasjon om alle turer som ble foretatt mellom juli 2011 og september 2012. Dette inkluderte detaljer som start- og slutttidspunktet for turen, samt hentestasjonen, for å nevne noen få kategorier. 173. Åpne flyreiser Open Flights er en database som inneholder informasjon om mer enn 10 000 fergeterminaler, flyplasser og togstasjoner over hele verden. Forskere kan finne den Excel-kompatible .csv-versjonen via GitHub, og de kan også laste ned dataene direkte på nettsiden. Ved å bruke kartet på hjemmesiden er det mulig å se hvilke spesifikke steder som er på listen, og nettstedet går til og med så langt som å ha ruteinformasjon tilgjengelig. Nettstedseierne kan kontaktes for enda mer oppdatert informasjon. 174. MLVIS MLVIS er et datalager som kombinerer visuell analyse med datautvinning i sanntid. Dette gjør det mulig å utforske mer intuitive forståelser av data, selv når man arbeider med enorme datasett. Referansedata og ikke-relasjonell maskindatalæring, sammen med ulike datatyper som attribuert og heterogen, er blant de mange funksjonene og alternativene som er tilgjengelige gjennom dette nettstedet. For brukervennlighet kan denne informasjonen også lastes ned i ett konsistent format. 175. Åpne data-oppstart Open Data Inception er et nettsted som tilbyr lenker til godt over 2600 dataportaler. Ved å bruke søkefeltet øverst kan forskere søke etter portaler og datasett etter kategori og tema. I tillegg er det også mulig å bruke nettstedet som et middel for å finne den mest oppdaterte versjonen av datasettet det søkes etter. Dra nytte av muligheten til å se dataportaler i listeformat eller i interaktiv visuell form, og begynn å finne de nødvendige dataene. 176. OpenDataSoft OpenDataSoft er tilgjengelig på fransk, engelsk og tysk, og er en kilde som gir tilgang til 480 millioner poster, 4 millioner API-celler og 9 284 datasett. Ved å bruke søkefeltet midt på hjemmesiden kan forskere skrive inn et nøkkelord eller en kategori og finne det mest passende datasettet derfra. For journalister er dette en raskere måte å finne de mest relevante datasettene som trengs for å fullføre den aktuelle forskningen. Besøk nettstedet for å lære mer. 177. Nasjonsmester NationMaster er en kilde til fullstendig sammenstilte data fra over 300 land, organisert i over 5000 kategorier. Dataene dekker tall som inkluderer prosentandelen av registrerte dødsfall, statistikk fra andre verdenskrig og til og med informasjon om atomkrig og testing. Forskere finner også tabeller, grafer og sektordiagrammer som gir mulighet for ytterligere visualisering av dataene. Enkelt sagt er det så mange emner som dekkes at det alltid er noe nytt å finne i dataene. 178. Følgerwonk Twitter har lenge vært et populært nettsted for sosiale medier for å finne nyheter og trending-historier. Followerwonk lar brukere ta Twitter-bruken sin til neste nivå. Dette inkluderer å finne Twitter-brukere å komme i kontakt med, studere nåværende følgere og planlegge Twitter-aktivitet for maksimale resultater. I disse dager er det mange reportere og journalister på Twitter som bruker nettstedet til nettverksbygging og for å få ut historier. Followerwonk gjør Twitter-brukere mer produktive på nettstedet. 179. Infochimps Infochimps er et nettsted som tilbyr skybaserte tjenester som kan skaleres ned for å få mest mulig ut av stordata. Det er nyttig når det gjelder å distribuere og integrere stordatateknologi og -applikasjoner. Når forskere søker gjennom enorme mengder data eller evaluerer trender innen stordata, er dette en uvurderlig ressurs å ha. Det finnes også en rekke hvitbøker og casestudier tilgjengelig for forskere på nettstedet. 180. Arkivert nasjonal myndighetsstatistikk Archive-It ble grunnlagt i 2006 og er en tjeneste levert av Internet Archive. Denne tjenesten hjelper organisasjoner og bedrifter med å lage digitale samlinger, og som et resultat har den hatt muligheter til å samarbeide med ideelle organisasjoner, høyskoler, universiteter og myndigheter. Forskere kan søke i noen av de forskjellige arkivene på nettstedet, for eksempel nettsteder fra kongressvalget i 2014, Alabama State Archives og Canadian Government Information PLN Web Archive. Dette nettstedet er en skattkiste av informasjon for driftige journalister. 181. Borgerlige fellesområder Civic Commons har en side som viser de ulike myndighetenes initiativer for åpne data. Denne søkbare listen over ressurser er organisert etter land, by, region, og nevner til og med ressursene som er gjort tilgjengelige av mellomstatlige organisasjoner. For journalister representerer dette nettstedet en raskere måte å finne ut hvilke myndigheter som deltar i Open Data Project. Dette nettstedet gir også tilgang til lokaliserte data som ikke nødvendigvis ville dukket opp i et enkelt Google-søk. 182. Verge verdensregjeringer The Guardian er et kjent navn i journalistikkens verden for sitt rykte for å ha de siste nyhetene. Det som færre vet er at nettstedet har en seksjon som tilbyr data om og om regjeringer over hele verden. Det finnes artikler om virkningen av hjemløshetstall, diskusjoner om cybersikkerhet og til og med tankevekkende diskusjoner om hvilken rolle data og statistikk spiller i det nåværende politiske og sosiale klimaet. The Guardians seksjon om verdensregjering er i stand til å sette i gang diskusjoner og finne vinkler for historier. 183. Åpne offentlige data (hub) Dette nettstedet tilhører en gruppe via Open Knowledge Foundation med mål om å oppmuntre til og støtte den fortsatte utviklingen av åpne offentlige data. Her vil brukerne finne lenker til en av de mest omfattende listene over åpne datakataloger som er tilgjengelige. Blant de ytterligere målene som er nevnt på nettstedet, søker gruppen også å finne informasjon om politikk, beste praksis og retningslinjer. Det gir journalister omfattende tilgang til mer og bedre informasjon. 184. Åpen offentlig forvaltning – Frankrike Denne nettsiden er netthjemmet til det åpne dataprosjektet som tilbys av den franske regjeringen. Det er mulig å dykke ned i dataene ved å søke under kategorier som sysselsetting, landbruk, utdanning, reiseliv og turisme. Dette er data som gir mulighet for å bygge og utvikle en mer nyansert forståelse av hva dataene faktisk sier, samtidig som det gir rom for sammenligninger basert på historisk informasjon. I utgangspunktet har journalister all grunn til å være begeistret for å gå gjennom disse dataene. 185. Universitetet i Notre Dame Dette nettstedet lagrer forskningsdataene som er tilgjengelige gjennom University of Notre Dames bruk av SourceForge.net. Dataene tilbys gjennom relasjonsdatabaser. De månedlige datadumpene gjør det også mulig å få en bedre forståelse av programvare med åpen kildekode og dens applikasjoner. For å få tilgang til denne informasjonen må forespørsler om tilgang gjøres skriftlig via e-post. Haken er imidlertid at bare akademiske forskere er kvalifisert for tilgang til dataene. 186. UFO-rapporter Det nasjonale UFO-rapporteringssenteret har en nettbasert database som beskriver folks erfaringer med uidentifiserte flygende objekter. Forskere kan effektivisere databasesøket sitt ved å bruke en av fire kategorier: dato, UFO-ens form, den publiserte datoen og til og med etter stat. UFO-er er unike fordi de alltid klarer å fange publikums fantasi. Hvis det har vært noen nylige møter av den tredje typen i nærheten, er dette stedet å finne ut hva folk har sagt. 187. WikiLeaks WikiLeaks er beryktet og beryktet i media på grunn av kontroversene og hva lekkasjene har avslørt om hvordan myndighetene og andre kjente og mektige personer i samfunnet fungerer, men har et rykte som går forut for det. Selv om datadumpene sjelden slippes stille, er det ingen som stiller spørsmål ved nøyaktigheten av informasjonen. For journalister som leter etter historier som umiddelbart vil vekke interesse, er WikiLeaks en velprøvd kilde. Om ikke annet, vil det være interessant lesning. 188. Washington Post Avisen er allerede kjent som en utmerket kilde til nyheter og meningsartikler, men få vet at Washington Post gir tilgang til rådataene som ofte nevnes i artiklene deres. På datasiden kan forskere finne data i kategorier som utdanning, folketelling, helse og sikkerhet, transport og utvikling, historiske VM-databaser og til og med tall knyttet til myndigheter og politikk. Enkelt sagt, det å ha tilgang til disse tallene hjelper folk med å utvikle en mer konkret forståelse av problemstillingene i nyhetene. 189. Klimadata Klimadata er et datasett som gir omfattende informasjon om global temperatur. I dagens format kan brukerne se all viktig klimainformasjon gjennom rutenettene, samtidig som de kan se gjennomsnittene. For de som søker etter tilhørende data, er det mulig å få tilgang til den samme informasjonen for land og hav. Denne informasjonen kan lastes ned, men for enkelhets skyld kan den også vises direkte på nettstedet. 190. Proteinstruktur Proteinstruktur er en kilde som søker å undersøke hvordan datanettverk kan brukes i forbindelse med biologi. Siden inneholder et datalager som kan nås via lenkene som er oppgitt. Av spesiell interesse for medlemmer av forskningsmiljøet er hvordan nettstedet innlemmer flere ideer som modellanalyse og utførbar biologi i sin jakt på dette målet. For journalister er dette nettstedet vel verdt å ta en titt på for å observere fremgang og undersøke data. 191. Analyser undersøkelsesdata gratis Med hjelp av dette nettstedet kan brukere ta et kurs i å analysere spørreundersøkelsesdata uten å måtte betale for privilegiet. Analyser spørreundersøkelsesdata gratis med sin detaljerte innholdsfortegnelse, inkluderer seksjoner med titler som Kart og Kunsten å undersøke – Vektet vedlikehold, Balansering av respondentkonfidensialitet med variansestimeringspresisjon, Strukturelle ligningsmodeller (SEM) og Komplekse spørreundersøkelsesdata. Nettstedet tilbyr en flott oppfriskning for de som forventer å håndtere mer statistiske data i fremtiden. 192. UCLA På UCLAs wiki-nettsted finner forskere en rekke datasett tilgjengelig for demonstrasjonsformål. Det finnes mange simulerte og observerte data å velge mellom. Ved å bruke disse ressursene er det mulig for folk å bruke denne ressursen til å avdekke klimadata, befolkningsdata, biomedisinske data, nevroavbildningsdata, amerikanske folketellingsdata, valgdata og økonomiske data blant en rekke andre kategorier. Til syvende og sist er disse datasettene en ressurs som mange kan dra nytte av å bruke. 193. Universitetet i Toronto På nettsiden sin tilbyr University of Toronto forskere tilgang til det de kaller Delve-datasett. Disse datasamlingene var en del av et større produkt utviklet for å sammenligne læringsmetodene. Til syvende og sist er denne informasjonen der for utvikling og evaluering av de ulike tilnærmingene til læring. Kort sagt, dette er en solid kilde for forskere som ønsker å bedre forstå hvordan man analyserer og håndterer datasett. 194. Tjenesten for bevaring av naturressurser Naturressursbeskyttelsestjenesten har en nettside som fokuserer på å fremme bevaring, samtidig som den tilbyr informasjon om de forskjellige mosene, hornurtene, karplantene, lavene og levermosene som finnes i USA. Denne nettsiden inneholder en komplett database med planter og bilder av planter som kan finnes på nettsiden, i tillegg til massevis av informasjon. Forskere kan laste ned databasen og finne massevis av informasjon om emner som alternative avlinger. I hovedsak har denne nettsiden alt folk trenger å vite om planter. 195. Landbruksforskningstjenesten Som navnet på byrået antar, håndterer denne tjenesten forskningsbehovene til det amerikanske landbruksdepartementet. Når et landbruksproblem oppdages, er det den delen av myndighetene som mest sannsynlig har bidratt til å finne en løsning. Nettstedet inneholder en rekke datasett som kan nås og lastes ned direkte. Journalister kan også bruke dette nettstedet til å finne de siste nyhetene knyttet til problemstillinger som påvirker landbruket. 196. Cellebildebibliotek Dette nettstedet tilbyr et offentlig bibliotek som tilbyr ressurser, informasjon og tilgang til bilder og animasjoner som skildrer celler og cellulære prosesser. Cellen er designet med tanke på den doble prosessen med forskning og utdanning, og informasjonen her er nesten alltid relevant under diskusjoner om folkehelse og sykdom. Materialene kommer fra en kombinasjon av kilder, inkludert historiske og moderne publikasjoner. For en grundig forklaring som forenkler kompliserte biologiske prosesser, kan ikke journalister gå feil med Cell Image Library. 197. Komplett genomikk Dette er nettstedet til et selskap som anser seg selv som en etablert del av bioteknologiområdet innen sekvensering av menneskelig genom. Interessant nok har Complete Genomics gjort ganske mange av sine fullgenomsekvenser tilgjengelige for offentligheten. Til syvende og sist gir dette all slags nyttig innsikt i DNA og det sekvenserte menneskelige genomet. Den eneste betingelsen for dette materialet er at forskere som bruker denne informasjonen, sørger for å gi Complete Genomics riktige referanser. 198. Array Express Array Express er et arkiv som lagrer informasjon fra resultatene av genomiske eksperimenter som krevde enorme mengder sekvensering eller prosessering. På dette nettstedet vil brukerne finne resultatene av over 70 000 eksperimenter i tillegg til mer enn 2 millioner essays i flere terabyte med datalagre. Enda bedre, denne informasjonen er gratis for gjenbruk til forskningsformål. Dette er en flott ressurs for all den nyeste informasjonen om genomikk og fremgangen som gjøres innen feltet. 199. Kode Encyclopedia of DNA Elements, eller ENCODE Consortium, er et resultat av forskningsgrupper fra hele verden som jobber i samarbeid med hverandre. Målet er å lage en liste over alle funksjonelle deler av genomet, inkludert nøye undersøkelse av RNA-nivåer, protein, elementene som regulerer celler og geners aktivitet. Det finnes data som kan søkes gjennom, samt et leksikon som tilbyr ytterligere informasjon. 200. Ensemblegenomer Ensemble Genomes er et nettsted etablert i 2000 som omhandler genomene til virveldyr. Gjennom årene har denne ressursen lagt til tilleggsinformasjon om virvelløse metazoer, planter, bakterier og sopp. Dataene om alle disse emnene kan finnes og nås ved å klikke gjennom lenkene som er tilgjengelige på nettstedet. Dette nettstedet har veiledninger, datasett om alle emnene som dekkes, og en samling dokumenter å bla gjennom. Alle disse faktorene gjør Ensemble Genomes til en fantastisk datakilde for journalister. 201. Genontologikonsortium Gene Ontology er et nettsted som eksisterer med det uttrykkelige formålet å finne en måte å representere den nåværende forståelsen av hvordan gener fungerer via datamaskiner. Det har en rekke publikasjoner samt tilleggsdokumentasjon som folk kan lese. Det finnes merknader direkte på nettstedet. Den gode nyheten for forskere som ønsker å se nærmere på tallene og rådataene, er at det finnes filer tilgjengelig for nedlasting direkte på nettstedet. 202. Bibliotek med integrerte nettverksbaserte mobilsignaturer Harvard Medical School LINCS Center eksisterer for å hjelpe forskningsmiljøet og allmennheten med å lære mer om hvordan menneskeceller reagerer når de har blitt påvirket av legemidler. Ved å bruke HMS LINCS-databasen og Project Explorer-verktøyet kan forskere finne publikasjoner og prosjektsammendrag samt generelle ressurser. Journalister kan også bruke dette nettstedet til å få tak i alle de siste nyhetene og informasjonen som kommer ut av denne forskningen. 203. Prosjekt for mangfold av menneskelig genom Human Genome Diversity Project har gjort store fremskritt takket være innsatsen til Stanford Human Genome Center. Nettstedet har prøver som har tusenvis av prøver og markører. Det viser seg at disse kan lastes ned og observeres og analyseres grundig ved å følge lenkene som er gitt på siden. Dette er en flott ressurs for journalister som ønsker å forstå informasjonen som kommer fra forskningsmiljøet. 204. JCB DataViewer JCB DataViewer lar de som er interessert i hva Journal of Cell Biology har å si se bildedataene knyttet til artiklene som er publisert der. Nettstedet har et komplett galleri som man kan bla gjennom for å se materialene. I tillegg har brukerne også muligheten til å analysere dataene ytterligere mens de leser nettstedet. Enkelt sagt er dette nettstedet perfekt for å forstå referansene og figurene som finnes i tidsskriftets artikler. 205. Genomiske data Commons-dataportal GDC Data Portal er en plattform som er utviklet for å hjelpe forskere og de innen bioinformasjonsfeltet med å utføre kreftforskning mer effektivt. Det finnes et arkiv, et API, samt dokumenter tilgjengelig for lesing og så videre. Tilgang til dette nettstedet betyr at man kan se den samme informasjonen som kreftforskere bruker til å utføre sin egen forskning. Her vil journalister kunne finne alle dataene de leter etter, og mer til. 206. Opensp Opensp er et fellesskapsdrevet prosjekt designet for å dele genotyper. Personer som har blitt typet ved hjelp av FamilyTreeDNA, 23andMe eller deCODEme kan laste opp denne informasjonen til nettstedet. Formålet med å be folk om å gjøre dette er slik at nettstedet kan fokusere på å se om det kan finnes sammenhenger mellom genotyper og SNP-er, eller enkeltnukleotidpolymorfismer. Det som er av unik interesse for journalister er at det finnes data tilgjengelig for folk å laste ned og se gjennom. 207. Stiguide Pathguide er et nettsted dedikert til å gi informasjon om metabolske og signalveier, samt interaksjoner mellom proteiner på molekylært nivå. Denne siden inneholder en liste med omtrent 697 ressurser relatert til hovedemnet. Databasene som det er lenket til på dette nettstedet er generelt sett gratis å få tilgang til. De fleste referansene på denne ressurslisten fokuserer primært på protein-til-protein-interaksjon. Dette nettstedet er en uvurderlig ressurs for biologientusiaster. 208. RCSB PBB Dette er et nettsted dedikert til å informere akademikere og allmennheten om alt relatert til nukleinsyrer og proteiner. RCSB Protein Data Bank tilbyr tilgang til diverse verktøy som er utviklet for å gjøre dette aspektet av biologi mer forståelig, inkludert visualiseringsverktøy, 3D-strukturvisning og et fullt søkbart arkiv som kan kategoriseres etter organismekategori. I tillegg tilbyr dette nettstedet oppdaterte nyheter om all den siste utviklingen innen dette feltet. 209. Konsortium for psykiatrisk genomikk Psychiatric Genomics Consortium er et resultat av et samarbeid mellom forskere og vitenskapsfolk fra hele verden som jobber med forskning på den genetiske komponenten av psykiatriske lidelser. Dette prosjektet klarte til slutt å produsere 17 hovedartikler og ytterligere 31 utviklingsartikler som tilbyr sekundæranalyse og metode, med én enkelt milepælsartikkel som kom ut av alt. Konsortiet tilbyr verktøy, nedlastinger og tilgang til funnene via datatilgangsportalen på forespørsel. 210. Kjemi PubChem er et respektert navn innen medisinsk og biologisk forskning, og har vært det lenge. Forskere kan ikke gå feil med dette nettstedet, og tilbyr muligheten til å søke i strukturer så vel som i databasene for forbindelser, bioanalyser og stoffer. I tillegg finnes det millioner av oppføringer i hver av disse databasene. Denne informasjonen kan sees gjennom verktøy som 3D-konformerverktøy og bioanalyseverktøy. Dataene er også tilgjengelige for nedlasting. 211. KOSMISK Som navnet antyder, er Catalogue of Somatic Mutations In Cancer, eller COSMIC, dedikert til å kronisere og utforske effektene av somatiske mutasjoner i kreft. Nettstedet gjør det mulig å søke i COSMIC kategorisert etter krefttype, gen og mutasjon. Det finnes verktøy på COSMIC som genomleseren og kreftleseren. I tillegg finnes det også data om genkurering, medikamentresistens, genomscreening, mutasjonssignaturer og genfusjonskurering tilgjengelig for nedlasting på nettstedet. 212. Genomikk for legemiddelfølsomhet ved kreft Genomics of Drug Sensitivity in Cancer er dedikert til å finne biomarkører som kan hjelpe leger med å identifisere hvilken type kreftmedisin som pasienter har større sannsynlighet for å reagere på. Journalister kan bruke nyhetsfanene for å holde seg oppdatert på tilstedeværelsen av nye data eller endringer på nettstedet. I tillegg finnes det også en samling av data om cellelinjer, en database som kroniserer kreftens trekk, og til og med en liste over forbindelser som alle er tilgjengelige for visning på nettstedet. 213. Stowers institutt for medisinsk forskning Stowers Institute for Medical Researchs nettsted tilbyr forskere gratis tilgang til dataene som deres forskere, forskere og genomforskere har brukt i publikasjonene sine. For allmennheten gjør instituttet seg umåtelig oppmerksom på at Stowers Original Data Repository vanligvis er gratis å få tilgang til. Når det er sagt, er det ikke sikkert at noen av de største filene i databasen er tilgjengelige direkte via Internett på en enkel måte, og det kan kreve ytterligere ordninger. 214. SSBD-database Systemdatabasen Science of Biological Dynamics, vanligvis forkortet som SSBD-databasen, tilbyr en rekke verktøy og ressurser som kan brukes til å undersøke mikroskopiske bilder og evaluere kvantitative biologiske data. Bildene på dette nettstedet kommer fra en rekke kilder og inkluderer objekter som celler, enkeltmolekyler og genuttrykkskjerner. Siden dataene på dette nettstedet er hentet fra beregningssimulering og eksperimenter, kan journalister være trygge på at informasjonen her kontinuerlig forbedres og oppdateres. 215. Deling av personlige genomer Personal Genome Project er et nettsted som fokuserer på å lage helse-, genom- og egenskapsdata som er åpne og tilgjengelige for offentligheten. Dette nettstedet fortsetter i stor grad prosjektet med hjelp fra personer som har meldt seg frivillig til å offentliggjøre sin genomiske informasjon, og tilbyr dataene de har funnet og innhentet gratis til offentligheten. Bortsett fra vitenskapen gir dette prosjektet journalister et interessant blikk på effektene av å opprette en offentlig registrering av personlig genominformasjon. 216. UCSC Genome Browser USCS Genome Browser lar enkeltpersoner se genomsamlinger. I tillegg til visning på nett, tilbyr nettstedet også lenker som kan brukes til å laste ned sekvenser og annoteringer for de samme genomsamlingene. Disse lenkene er delt inn i kategoriene mennesker, pattedyr, andre virveldyr, deuterostomer, insekter, nematoder, andre genomer og andre nedlastinger. Verktøyene og katalogene på dette nettstedet er også gratis for personlig og ikke-kommersiell bruk. Journalister kan dra nytte av grundigheten og tilgjengeligheten til denne informasjonen. 217. UniProt Universal Protein Resource, kjent under navnet UniProt, er stedet å gå for informasjon om proteinsekvensering og annotering. Dette nettstedet, som henter informasjon fra tre databaser i UniProt Reference Clusters, UniProt Knowledgebase og UniProt Archive, er utstyrt med peptid- og klyngesøk blant andre funksjoner. Journalister kan bruke dette nettstedet til å bekrefte, oppdage og lære mer om nye oppdagelser innen proteinsekvensering og annotering. 218. Aktuarenes klimaindeksdata Actuaries Climate Index, også kalt ACI, gir allmennheten og beslutningstakere informasjon om klimatrender og effekten av klimaendringer i Canada og USA. Forskere kan bruke informasjonen som gis av dette pedagogiske verktøyet for å finne og oppdage massive endringer i sjø og vær. Det er mulig å begrense søket etter regioner og komponenter. Dette nettstedet har flere tiår med data tilgjengelig, og det oppdaterer rutinemessig informasjonen kvartalsvis. 219. Værsenter for luftfart Aviation Weather Center gir nøyaktig, tidsriktig og oppdatert værinformasjon som luftromssystemet kan stole på. På dette nettstedet kan brukere se de ulike grafene, prognosene og værobservasjonene, utformet på en måte som flygere kan sette pris på. Det er mulig å se informasjonen fra nettstedets datakilder i sanntid via enten .csv- eller XML-utdata. Forskere kan manipulere og observere rådataene nærmere gjennom dette nedlastingsalternativet. 220. Klimaforskningsenhet Nettstedet til Klimaforskningsenheten har som mål å forske på effektene av klimaendringer i fortiden, studere årsakene og finne løsninger på klimaendringer i dag. Her kan man lese om resultatene av forskningen, få en oversikt over emnet gjennom informasjonsark, lese publikasjoner og til og med få tilgang til rådata. Journalister som leter etter rå værdatasett har flaks med denne ressursen. 221. Europeisk klimavurdering og datasett På nettstedet til European Climate Assessment & Dataset kan publikum finne informasjon om ekstreme endringer i enten klima eller vær. Forskere har muligheten til å bruke prosjektets forskningsverktøy, kalt KNMI Climate Explorer, til å verifisere data, undersøke sesongprognoser og til og med se nærmere på effektene av El Niño blant andre bruksområder. Siden dette datasettet oppdateres daglig, vil journalister som bruker denne kilden være de første til å vite om tegn på ekstreme klimaendringer. 222. Globale bilder Bla gjennom tjenester Global Imagery Browse Services, forkortet GIBS, er en viktig del av EOSDIS i dens rolle som leverandør av bildetjenester som er responsive og basert på fellesskapsstandarder. Med andre ord lar GIBS vanlige folk samhandle med satellittbilder tatt fra praktisk talt hvor som helst på jorden i høy oppløsning. Siden EOSDIS GIBS gjøres tilgjengelig gjennom NASAs jordvitenskapelige data, er det enklere enn noensinne for journalister og forskere å lære mer om verden i sanntid. 223. Bering klima og økosystem Dette nettstedet, som opererer under den amerikanske regjeringens nasjonale oseaniske og atmosfæriske administrasjon (National Oceanic and Atmospheric Administration), forteller journalister og forskere alt de noen gang måtte ønske å vite om hvordan Beringhavets klima og økosystem reagerer på endringene som har skjedd i Arktis. Her er det mulig å lese essays, gjennomgå prognoser og bruke det elektroniske dataverktøyet for å se hvordan ulike klimaindekser, biologiske, atmosfæriske, havdata og dyreliv har det i Beringhavet. 224. NCEI NCEI, eller National Centers for Environmental Information, er det endelige resultatet etter sammenslåingen av National Oceanic and Atmospheric Administrations tre datasentre. Denne siden inneholder en serie lenker delt inn i 22 kategorier som vil koble brukere til forskjellige ressurser, interessante sider og datasett om klima og vær. Journalister som leter etter informasjon om klima, stormer, nedbør og en rekke andre værproblemer, vil sannsynligvis finne det de leter etter her. 225. Jordsystemets forskningslaboratorium Den globale overvåkingsavdelingen i National Oceanic and Atmospheric Administration gir informasjon om de langsiktige trendene i klimaendringene på jorden gjennom overvåking av viktige atmosfæriske målinger. Blant disse er karbonmonoksid, metan, lystgass og karbondioksid som eksempler. Disse målingene brukes deretter til å måle ting som langsiktig ozonnedbrytning, karbondioksidkilder og -nivåer, samt opptak. Dette er en ressurs for klimaendringer som journalister kan bruke. 226. WorldClim – Globale klimadata Har du noen gang ønsket deg en bedre måte å visualisere klimadata på? WorldClim er en programvareleverandør av gratis data som deretter kan brukes til romlig modellering samt til å lage kart. Den nåværende versjonen av denne gratisprogramvaren kan bare brukes på dagens klima, mens den gamle versjonen gir tilgang til klimadata fra fortiden og nåtiden, og lar også brukerne se statusen for fremtidige klimaprognoser. Journalister kan bare følge lenken og laste ned programvaren. 227. Kunnskapsoppdagelseslaboratorium Knowledge Discovery Laboratory er et nettsted dedikert til utvikling av innovative teknologier, det grunnleggende innen maskinlæring og anvendelse av denne kunnskapen innen praktiske områder som nettverksvitenskap, svindeldeteksjon og analyse av vitenskapelige data. Nettstedet inneholder et ganske stort datasett i DBLP med 1,2 millioner objekter og 2,48 millioner lenker inkludert i settet. For forskere som er interessert i Knowledge Discovery Laboratorys mål, er dette datasettet en utmerket ressurs. 228. DIMACS-implementeringsutfordring Nettstedet til den 9. implementeringsutfordringen handler om å hjelpe forskere med å lære hvordan de kan løse problemer med korteste vei. For skaperne ble nettstedet bygget med to mål i tankene. For det første å finne de best reproduserbare løsningene. Og for det andre å gjøre det enkelt for forskere å samarbeide og oppdage mer effektive løsninger. Forskere som er interessert i å se hvor mye fremgang som gjøres med dette, kan se gjennom artiklene og datasettene på nettstedet. 229. Nettverksarkiv Nettarkivet er et nettsted der vitenskapelige data lagres med tillegg av interaktive visuelle verktøy som brukere kan få tilgang til og analysere. Dette nettstedet har den doble forskjellen å være både det første arkivet i sitt slag og også det største på nettet. Det er mye enklere å bruke grafiske data og intuitive, visuelt engasjerende bilder, foreta sammenligninger og finne nye måter å kontekstualisere data på. Journalister kan bruke denne kilden til å finne historier i de vitenskapelige dataene. 230. Pajek-datasett Pajek Datasets er en side som tilbyr et datasett som tar for seg interaksjonene mellom proteiner som finnes i spirende gjær. Etter å ha gitt en kort bakgrunnsforklaring om virkningen av å finne nye metoder for å oppdage interaksjoner, sammen med årsakene til hvorfor det er viktig å kunne skjelne viktigheten av ulike protein-til-protein-interaksjoner, lenker nettstedet brukerne direkte til et datasett som er tilgjengelig for nedlasting. For å lære mer kan forskere klikke på lenken nederst for å lese artikkelen som er publisert om emnet. 231. Mejn-nettverksdata Dette nettstedet har som mål å dele lenker til nettverksdatasettene som netteieren har brukt og samlet. Temaene i datasettene spenner fra amerikansk collegefotball, politiske blogger og bøker om amerikansk politikk, til sosiale nettverk, Les Misérables og samarbeid om høyenergiteori. Personer som er interessert i å utforske disse vil ha mange interessante datasetttemaer å velge mellom. I tillegg er dataene frie å bruke så lenge det finnes referanser. 232. Stanford GraphBase Stanford GraphBase er navnet som har blitt gitt til en rekke datasett og programmer av Stanfords Donald Knuth. Når disse programmene og datasettene brukes i kombinasjon med hverandre, kan de manipulere og generere grafer og nettverk. På dette nettstedet er nødvendig materiale tilgjengelig for nedlasting via lenkene. I disse filene vil forskere finne data om fotballresultater, ordbokdata, data som omhandler rekonstruksjonen av Mona Lisa og mye annet. 233. SuiteSparse Matrix-samlingen SuiteSparse Matrix Collection, tidligere kjent som University of Florida Sparse Matrix Collection, er en samling matriser som har implikasjoner for det virkelige liv. Ifølge nettstedet brukes denne samlingen oftere enn ikke til numerisk lineær algebra i utvikling og forbedring av sparse matrisealgoritmer. Brukere liker samlingen for dens nyttighet i å kjøre og teste resultatene av eksperimenter. Datasettene og matrise-referansepunktene kan lastes ned direkte på nettstedet. 234. Grafdatasett Dette er et sett med datasett som skaperne av denne nettsiden mente enten var relasjonelle eller kunne oversettes godt til grafrepresentasjon. Graph Datasets tilbyr datasett som Predictive Toxicology Challenge-data, IMDb-data, mutagenesedata, MovieLens-data, samarbeidende filtrering og proteindata til forskere som ønsker å lære å jobbe med rådata. Filene er gjort tilgjengelige på denne siden og er primært tilgjengelige for nedlasting i XML-format. 235. Nyheter om stordata Big Data News er et nettsted som fokuserer på stordata og det grunnleggende innen datavitenskap. Dette nettstedet inneholder de siste nyhetene og inkluderer diskusjoner om dyp læring og kunstig intelligens. I tillegg inneholder Big Data News et massivt datasett som inneholder totalt omtrent 3,5 milliarder nettsider. Disse er alle atskilt av nivåer som henholdsvis refereres til som sidenivågraf, underdomenenivågraf, førstenivå underdomenegraf og lønnsnivådomenegraf. 236. Senter for komplekse nettverk og systemforskning CNetS, eller Center for Complex Networks and Systems Research, opererer under paraplyen til Indiana University Network Science Institute og School of Informatics and Computing. Nettstedet er ment å være en ressurs innen datavitenskap, beregningsbasert samfunnsvitenskap og komplekse nettverk og systemer med informasjon om utvinning og trafikkmønstre på nettet. I tillegg er CNetS også vert for et datasett som inneholder omtrent 53,5 milliarder nettverksforespørsler gjort av brukere ved Indiana University. 237. OONI Utforsker OONI Explorer, en del av Open Observatory of Network Interference, er et prosjekt dedikert til å tilby gratis og åpen kildekode-programvare. Det er mulig for brukere å bruke programvaren til å prøve seg på å blokkere nettsteder og meldingsapper blant andre applikasjoner. Av spesiell interesse for folk som er interessert i denne teknologien, er tilgjengeligheten av gratis tilgang til rådataene som OONI har samlet inn. Bare skriv inn informasjonen i OONI Explorer og samhandle med dataene derfra. 238. Utfordringer innen maskinlæring Challenges in Machine Learning er dedikert til forskning og utvikling av maskinlæring. På dette nettstedet finner leserne lenker til programvare, bøker, maskinlæringsutfordringer, samt varsler om kommende workshops. Nettstedet inneholder til og med lenker til utfordringer som tillater innsending etter dato. For journalister som er interessert i å se om maskinlæring kan utføre oppgaver som økonomisk prediksjon eller klassifisering av nettsider, er dette et nettsted som er vel verdt et besøk. 239. DataX DataX, som for tiden jobber under CrowdANALYTIX, er maskindelen av et fellesskapsdrevet initiativ som utnytter kollektivets kraft til å lage tilpassede applikasjoner for kunstig intelligens, maskinlæring og nevro-lingvistisk programmering. DataXs rolle i prosessen er vedlikehold og utrulling, som igjen bidrar til å gjøre disse løsningene skalerbare. For journalister som har tonnevis av tekst, video og data å sortere gjennom, kan robotene som er tilgjengelige gjennom CrowdANALYTIX og DataX halvere forskningstiden. 240. Drevet data Driven Data kombinerer crowdsourcing med datavitenskap på en måte som nesten ingen andre nettsteder gjør. Dette nettstedet legger vekt på sin rolle i å yte bistand til organisasjoner som takler ulike sosiale utfordringer, og tilbyr hjelp ved å sette sitt betydelige datavitenskapsfellesskap i arbeid med å lage statistiske modeller som løser prediktive spørsmål. Driven Data ser ut til å fungere primært med ideelle organisasjoner, men det er potensielt nyttig for alle som har rådata som trenger forbedring. Journalister kan dra nytte av å huske på denne kilden. 241. Åpne stordata Dandelion API er et program som håndterer semantisk tekstanalyse for stordata. Dette betyr at programmet tar uorganisert tekst og finner en måte å sette den i kontekst på for folk som trenger behandling. Journalister som analyserer mange dokumenter kan definitivt dra nytte av denne funksjonen. Dandelion API har også åpne stordata under kategoriene Milano, Trento og Europa. Selv om dette API-et er betalt, er det en daglig mengde tekst som kan analyseres gratis. 242. Jordmodeller Earth Models fokuserer på deling og lagring av programvare og datasett knyttet til jorden. Modelleringsverktøyene som nevnes på nettstedet inkluderer simuleringsprogramvare og -prosessering, samt virtuelle data som i stor grad låner fra spesifikke studieområder som tektonikk og seismologi. Journalister og forskere som ønsker å forbedre kunnskapen sin om emnet, kan bruke publikasjonene og artiklene på dette nettstedet til å gjøre det før de går i gang med modellerings- og visualiseringsverktøyene. 243. Senter for sosioøkonomiske data og applikasjoner (SEDAC) Sosioøkonomisk data- og applikasjonssenter, eller SEDAC, er et av datasentrene tilknyttet NASAs EOSDIS-system. På dette nettstedet finner leserne datasett som tilbyr tall om klimaendringer eller rutenettbasert demografisk informasjon. Datasettene kan også søkes etter temaer som styring, landbruk, arealbruk, helse, bevaring og klima, vann, fjernmåling og fattigdom. Det finnes kart, gallerier, guider som gir mer kontekst til dataene, og ytterligere ressurser og verktøy som forskere kan få tilgang til på nettstedet. 244. AODN-portalen AODN-portalen, et nettsted som drives av Australian Ocean Data Network, er et nettsted som tilbyr tilgang til australsk klimavitenskap og havdata. Forskere som har tilgang til denne informasjonen, vil også ha tilgang til IMOS-data og metadata, som er et forskningsrammeverk som støttes av flere institusjoner, inkludert den australske regjeringen. Forskere som velger å bruke AODN-portalen kan forvente å motta utmerket levering av havdata i et intuitivt grensesnitt. 245. Planet OS Planet OS tilbyr et rammeverk for stordata med vekt på fornybar energi. Dette nisjevalget kombinert med nettstedets kompetanse har gjort det populært blant energiselskaper som leter etter nye måter å visualisere og kontekstualisere dataene sine på. I tillegg har nettstedet også det som kalles DataHub, hvor det er vert for en betydelig samling på over 2000 datasett. Disse datasettene inkluderer åpne data fra NASA og Copernicus, og dataene oppdateres ofte jevnlig. 246. SMITHSONIAN-INSTITUSJONEN Smithsonian har lenge vært et respektert akademisk navn og er verdsatt over hele verden for sin forpliktelse til forskning og historie. På noen måter er det bare naturlig at Smithsonian har et nettsted som tilbyr noe av den beste informasjonen om vulkanforskning på nettet. Nettstedet publiserer rapporter, forskningslenker og databaser som inkluderer snevrede søk etter vulkaner, utbrudd, utslipp og deformasjoner, som følger med listen og regnearket for holocen vulkaner. Journalister trenger ikke en annen kilde om vulkansk aktivitet. 247. Jordskjelvkatalog Jordskjelvkatalogen, som oppdateres og vedlikeholdes av den amerikanske regjeringens program for jordskjelvfarer, lar forskere se når og hvor et jordskjelv sist inntraff. Selv om søkeresultatene er begrenset til 20 000, kan katalogsøket filtrere resultater etter magnitude, dato og klokkeslett, og til og med etter geografisk region. Denne fleksibiliteten gjør denne ressursen spesielt nyttig for journalister som dekker en naturkatastrofe eller et lokalt jordskjelv og leter etter bakgrunnsinformasjon. 248. Amerikansk økonomisk forening American Economic Association gir forskere data om makroøkonomiske data for USA og andre land rundt om i verden. Dette nettstedet ser ikke ut til å produsere økonomiske data så mye som det kuraterer en kort liste over de mest pålitelige. Men i lys av de mange nettstedene som tilbyr økonomisk informasjon på Internett, er dette en ressurs som journalister kan forvente har troverdighet. Bare gå til nettstedet og klikk deg gjennom kategoriene av økonomiske data deretter. 249. Historicalstatistics.org Historicalstatistics.org er et utrolig nyttig nettsted for å finne den typen økonomisk informasjon som gir en interessant kontrast til nåtiden. For eksempel lar nettstedets historiske valutaomregner forskere finne ut hvor mye en person med 10 USD i 1923 kunne kjøpe i dag. Det inneholder også publikasjoner og artikler som stiller spørsmål om beregningene som brukes innen økonomisk historie, sammen med prisindekser og informasjon om pengemengde som kan filtreres etter land. 250. DB Nomics Hva om alle offentlige økonomiske data på Internett kunne nås og søkes i fra én enkelt, navigerbar plattform? Db.nomics er en økonomisk databaseaggregator som har som mål å gjøre nettopp det. Dataene er tilgjengelige i formater som HTML, JSON og CSV, og oppdateres automatisk, mens tidligere revisjoner arkiveres deretter. Økonomiske kilder inkluderer Federal Reserve, Bureau of Economic Analysis, Det internasjonale pengefondet og andre. Forskere som leter etter pålitelige økonomiske data, kan ikke gå feil med Db.nomics. 251. Felles knutepunkt for ekstern gjeld (JEDH) Joint External Debt Hub, som er utviklet gjennom et samarbeid mellom Banken for internasjonale oppgjør, Organisasjonen for økonomisk samarbeid og utvikling (OECD), Det internasjonale pengefondet og Verdensbanken, gjør informasjon om gjeldsdata og internasjonale kreditorer og skyldnere tilgjengelig for offentligheten. Journalister som undersøker finansene til forskjellige nasjoner og prøver å få en dypere forståelse av det internasjonale finanslandskapet, vil finne så godt som alt de ønsker å vite her. 252. Internasjonale handelsdata Denne siden om internasjonale handelsdata, satt sammen med innspill fra en ledende økonomisk ekspert i Jon Haveman, inneholder data som kan lastes ned og analyseres videre. Datasettene inkluderer tolldata, Penn World-tabeller, forsyningsselskaper, importdata, produksjonsproduktivitet, vareklassifiseringer, Rauch Product Differensiering Codes, NBER-data, varestrømsundersøkelsen fra 1997, handel og immigrasjon, og den nyttige gravitasjonsmodellen. UNIX er operativsystemet som brukes til å kompilere disse, men nettstedet bemerker at PC-er også bør ha tilgang til dataene. 253. Åpne selskaper På OpenCorporates har forskere den luksusen å kunne søke og finne informasjon i en av de største åpne databasene for selskaper over hele verden. Denne informasjonen brukes deretter av ulike grupper over hele verden, som banker, etterforskere, frivillige organisasjoner og journalister, i et forsøk på å innhente etterretning og informasjon. Journalister har den ekstra fordelen av å kunne få tilgang til dataene i sanntid ved hjelp av OpenCorproates API, samt gjennom bulk-kjernedata eller andre kjernedatasett. 254. Vår verden i data «Our World in Data» henter informasjon fra en rekke kilder innen en rekke områder og presenterer kvantifiserte data om dette. Fra tall om kvinners deltakelse i arbeidsstyrken til informasjon om generell korrupsjonsoppfatning i offentlig sektor og global inntektsulikhet, hvis emnet kan diskuteres i form av data, kan dette nettstedet ha en oppføring for det. Journalister kan bruke denne kilden til å finne statistikk og tall knyttet til sosiale spørsmål. 255. Science Po Sciences Po, eller som det ofte kalles, Institute of Political Studies, er en skole med ubestridelig innflytelse innen samfunnsvitenskapene. I dette tilfellet inneholder Thierry Mayers side datafiler som inneholder regresjonsdata om gravitasjon og militære konflikter fra «Make Trade Not War», samt datasett om markedspotensialer, blant flere andre. Journalister som ønsker å bedre forstå konklusjonene i akademiske tidsskrifter, vil avdekke mye informasjon når de surfer på dette nettstedet. 256. Senter for internasjonale data Helt siden debuten i 1999 har Center for International Data vært dedikert til sitt oppdrag med å samle inn, lage, forbedre og distribuere internasjonale økonomiske data både offline og online. På nettstedet kan leserne få tilgang til informasjon som amerikanske tolldata, verdens- og amerikansk import og eksport, og til og med informasjon fra Penn World Table. Siden denne informasjonen blir gjort tilgjengelig for publikum for utdanning og forskning, kan journalister få tilgang til og bruke disse dataene gratis. 257. Observatorium for økonomisk kompleksitet Observatoriet for økonomisk kompleksitet, ofte referert til som OEC, lar forskere, studenter, økonomer og alle andre visualisere internasjonale handelsdata. Med sine iøynefallende temaer og interaktive grensesnitt gir dette nettstedet forskere en legitim mulighet til å utforske internasjonal handelsinformasjon på måter som aldri har blitt sett før. For journalister som liker å kunne se økonomiske data komme til live mens de søker etter dem, er OEC en uvurderlig ressurs. 258. Data om poengkort for høyskoler Høyere utdanning er et hett tema i mange kretser, og både studenter og familier ønsker å vite hvordan skolene står seg og hvor godt elevene lærer. Gjennom sine College Scorecard-data gir det amerikanske utdanningsdepartementet lærere og studenter all denne informasjonen og mer. Disse tallene dekker 1996 til 2016 og inkluderer nåværende data, scorecard-data og inntekter etter skoletid, samt ny informasjon fra National Student Loan Data System. Det er en kilde til oppdatert høyere utdanning som journalister bør sørge for å bruke. 259. Energidatasett for næringsbygg Som et datasett som primært omhandler energi, har COMBED et automatisk krav på unikhet. Legg til at dataene fornyes flere ganger i minuttet mens de kommer fra en næringsbygning, og det blir tydelig at dette datasettet er unikt. For journalister er denne informasjonen utrolig nyttig å ha når de skriver en artikkel om energiforbruk. Å få tilgang til COMBEDs data er like enkelt som å laste ned og åpne et Excel-regneark. 260. DRED-datasett DRED-delen av DRED-databasen står for Dutch Residential Energy Dataset. Som tittelen antyder, måler og studerer disse dataene hvor mye energi en enkelt nederlandsk husholdning forbruker. Atmosfære, belegg, strøm og generell husholdningsinformasjon ble overvåket i dette datasettet fra 5. juli 2015 til 5. desember 2015. Journalister som forsker på energiforbruk vil ha nytte av å sjekke ut rådallene som er oppgitt her. Instruksjoner for nedlasting av dataene i CSV-format finner du direkte på nettstedet. 261. ECO-datasett ECO, som står for Electricity Consumption and Occupancy, er et prosjekt som drives og drives av Distributed Systems Group. Forutsetningen for dette prosjektet var at forskere overvåket belastningene og oppdaget belastninger i seks sveitsiske husholdninger i løpet av åtte måneder. Dette nettstedet gir tilgang til denne informasjonen, samt instruksjoner og lenker til relaterte publikasjoner. Takket være nettstedets visuelt interaktive dashbord, burde journalister ikke ha noen problemer med å oversette forskningen til noe engasjerende. 262. Indisk datasett for omgivelsesvann og energi IAWE, som står for Indian Dataset for Ambient Water and Energy, ble opprettet med mål om å overvåke energiforbruket i et hjem i New Delhi med strømmålinger fra apparater, strømmåleren og sikringsskapet. På grunn av strømbrudd, forskjeller i vannforsyningen, pakkefall og spenningsvariasjoner, møtte iAWE på problemer som var unike for sporing av energiforbruk i India. Dette er utrolig nyttige data for journalister å ha når de diskuterer energibruksmønstre. 263. Elektrisitet på husholdningsapparatnivå i Storbritannia UK Domestic Appliance-Level Electricity, eller UK-DALE, er navnet på et datasett som overvåker og registrerer hvor mye strøm som trengs i en gruppe på fem husholdninger. Hvert sjette sekund måler UK-DALE strømbehovet fra både hovedstrømnettet og de individuelle apparatene i huset. Journalister som er interessert i å se hvordan britiske husholdninger bruker energi, kan definitivt ha nytte av UK-DALE. Dataene er tilgjengelige, og det finnes en artikkel som beskriver systemet tilgjengelig for lesing. 264. ArcGIS ArcGIS Hub er en plattform som organisasjoner og enkeltpersoner kan bruke for å nå mål gjennom nettstedsomfattende initiativer. Med sidemaler, trinnvise veiledninger og eksempler tilgjengelig for visning, er dette nettstedet en utmerket ressurs for ambisiøse sosiale engasjerte. Samtidig inneholder informasjonen som er tilgjengelig under fanen Åpne data hundrevis av datasett bare i kategorien «Katastrofe». Enten journalister forsker på data eller bidrar med dem, er ArcGIS Hub nyttig på mer enn én måte. 265. Cambridge GIS Cambridge GIS er Cambridge City, Massachusetts' åpne datalager. Med unntak av filene som er for store til å lastes ned via dette GitHub-lageret, finner du de fleste av byens datasett på denne siden. De individuelle datasettene som er tilgjengelige her inkluderer kommersielle distrikter, servitutter, reguleringsdistrikter, folketellingsresultater, kirkegårder og andre landemerker og funksjoner som kan kvantifiseres med data. En journalist som graver etter lokal informasjon vil finne alt de leter etter og mer på dette nettstedet. 266. Geo-Wiki.org Geo-Wiki er en ressurs som er dedikert til det den kaller «borgervitenskapsbevegelsen». Her oppfordres innbyggere til å prøve seg på å overvåke miljøet. Forskere kan finne de siste nyhetene i sidefeltet sammen med navnene på publikasjonene og gratis nedlastinger av datasett og programvare. Verktøyene som nettstedet gjør tilgjengelige inkluderer kart, opplasting av personopplysninger, valideringer og hackathons som kan lastes ned i Excel-format og zip-filer. 267. OpenStreetMap OpenStreetMap-datautdragene kommer fra OpenStreetMap-prosjektet, det pågående nettbaserte forsøket på å lage et kart over verden gjennom redigering og innsats fra det globale brukerfellesskapet. For å komme i gang med denne datakilden trenger innholdsutgivere bare å velge sitt foretrukne kontinent og deretter finne sitt foretrukne land etter det tidspunktet. Det er ingen gebyrer for nedlasting av denne Geofabrik GmbH, og dataene oppdateres daglig som en generell regel. 268. HIFLD Åpne data HIFLD, som drives og vedlikeholdes av Department of Homeland Security, for Homeland Infrastructure Foundation-Level Data, plasserer geospatiale data offentlig tilgjengelige. Disse dataene distribueres med det uttrykkelige formålet å gi støtte og informasjon til forsknings- og forberedelsesformål i lokalsamfunnet. Disse dataene kan lastes ned til Shapefile og CSV, og de kan også vises på nettet. For utgivere gjør HIFLD Open Data geospatiale data mer visuelle og engasjerende enn noensinne. 269. Åpne adresser OpenAddresses spesialiserer seg på adresseinfrastruktur og -innsamling. Dette nettstedet, som i stor grad er drevet av fellesskapets innsats, bruker GitHub som utviklingsplattform. Her kan folk plassere adresser på et kart etter å ha lagt det til i databasen, eller de kan ta dataene og begynne å geokoding direkte med en gang. Med alle dataene og adressene åpne og kun krever attribusjon, gjør de regelmessige dataoppdateringene og potensialet for fremskritt innen geokoding OpenAddresses til et svært interessant prosjekt. 270. Åpne data LMU Åpne data LMU er i stor grad avhengig av data fra OpenStreetMap for å hjelpe til med utviklingen av Fast Reverse Geocoder. Dette betyr at applikasjonen raskt kan ta en posisjon på et kart og finne en fullstendig adresse basert på det punktet. Dette kan potensielt også brukes på nabolag og fylker. Denne nettsiden inneholder en rekke lenker relatert til applikasjonen, inkludert kildekode, datasett og OpenStreetMap-oppslagstabeller og -løsninger. 271. Miljødatautforsker Med Environmental Data Explorer kan journalister, forskere og studenter laste ned og utforske de samme datasettene som FNs miljøprogram bruker sammen med sine tilknyttede organisasjoner og partnere. Søk kan snevres inn etter region og gjøres ved hjelp av ett eller alle 500 filtre. I tillegg inkluderer datasettene kategorier som helse, BNP, klima, utslipp og ferskvann, som kan vises direkte på nettstedet enten i graf-, tabell- eller kartform. 272. Den afrikanske utviklingsbankgruppen Nettstedet til African Development Bank Group er journalistens første stopp når de leter etter statistisk informasjon og indikatorer knyttet til det afrikanske kontinentet. Brukere som blar gjennom datakatalogen kan filtrere datasett etter kilde, emne og region. For alle som ønsker dypere kunnskap om emnet, tilbyr nettstedet også lenker til en imponerende liste over publikasjoner som inkluderer titler som African Economic Outlook og African Statistical Yearbook. 273. Genomic Data Commons (GDC) NCIs Genomic Data Commons huser et av de mest grundige kreftdatalagrene på nettet, som fokuserer på genomstudier av kreft. Nettstedets dataportal inneholder tusenvis av tilfeller og dekker 38 sykdomstyper i 39 prosjekter, og er gratis å bruke. Siden datainnsendinger hovedsakelig gjøres av institusjoner og forskere, gjør nøyaktigheten av denne informasjonen den til en datakilde som er ideell for journalister å ha i baklommen. 274. PhysioBank-databaser PhysioBank-databasene gjør fysiologiske data tilgjengelige for enkeltpersoner via det offentlige domene. Disse databasene er delt inn i to større kategorier: bølgeform og klinisk. Blant underkategoriene for bølgeform er det bilde-, interslagintervalldatabaser, syntetiske databaser, gang- og balansedatabaser, EKG-databaser og multiparameterdatabaser. En smakebit på den rene informasjonen som kommer ut av dette inkluderer data om vitale tegn ved sengen, oksygenmetning og til og med hjerte- og karsykdommer. Journalister og enkeltpersoner som forsker på menneskekroppen kan finne noe informasjon her. 275. Medicare-dekningdatabase Medicare Coverage-databasen, som vedlikeholdes av Centers for Medicare & Medicaid Services gjennom Department of Health and Human Services, gir forskere full tilgang til massevis av informasjon om medisinske tjenester. Det finnes informasjon om kroniske tilstander, medisinutgifter, elektroniske kliniske maler, inkassosystemet og forsknings- og demonstrasjonsstipend du kan lese deg opp på. For data hentet direkte fra kilden er dette det mest grundige og omfattende nettstedet av sitt slag på nettet. 276. Åpne betalingsdata Når folk flest går til legen, setter de seg vanligvis ikke ned for å tenke på om fastlegen deres drar økonomisk nytte av å samarbeide med helseprodusenter. Åpne betalinger informerer publikum om eventuelle måltider, forskning, gaver, foredragshonorarer og reiseutgifter som legen eller sykehuset har mottatt fra selskaper. Journalister som er på jakt etter en fengende historie kan enten bruke datautforskeren for å se informasjonen eller klikke på fanen for å laste ned dataene direkte. 277. FlickrLogoer Det står delvis i navnet, men FlickrLogos refererer til et datasett som består av firmalogoer som er fotografert i en rekke forskjellige posisjoner. Denne samlingen vedlikeholdes av Augsburg Universitets Multimedia Computing and Computer Vision Lab, og ble opprinnelig satt sammen med den hensikt å trene datamaskiner til å gjenkjenne logo og tekst. For å holde deg oppdatert på eventuelle fremskritt som gjøres med dette nyhetsverdige programmet, kan det ikke skade å laste ned dette datasettet og se hva det handler om. 278. ImageNet ImageNet er en database full av bilder som er organisert av WordNet. Det finnes årlige utfordringer på nettstedet som kan sees selv etter at det er stengt, og som fokuserer på å lage algoritmer som kan utføre spesifikke oppgaver. ImageNet er også hjemsted for en rekke publikasjoner, sitater og lysbilder. Teknologiorienterte innholdsutgivere ville ha all grunn til å bruke utforskeralternativet for å forstå WordNet-strukturen så vel som skykartet. 279. Stanford Dogs-datasett Stanford Dogs-datasettet inneholder tonnevis av bilder og bilder av forskjellige hunderaser. Med 120 forskjellige hunderaser inkludert sammen med over 20 000 individuelle bilder, gir denne ImageNet-drevne databasen forskere mange bilder å jobbe med mens de lærer maskiner hvordan de skal gjenkjenne hver hunderase. På nettstedet kan du klikke på lenker til forskjellige publikasjoner som diskuterer bruken av datasett for å lære datamaskiner om bildegjenkjenning, og lese dem samtidig med nedlastingen av datasettet. 280. SUN-databasen SUN-databasen er stedet for et prosjekt som er satt sammen for at forskningsmiljøet skal gjøre fremskritt innen områder som datasyn og grafikk, datautvinning, maskinlæring og nevrovitenskap, blant annet. Med over 131 000 bilder og nesten 4000 kategorier av objekter i indeksene, er dette nettstedet så omfattende som det kan bli. For utgivere som er interessert i denne databasen og hva forskere har kunnet gjøre mens de har brukt den, er dette en datakilde som er verdt å utforske. 281. Oxford-IIIT kjæledyrdatasettet Oxford-IIIT Pet Dataset er et nettsted som fungerer som et supplement til en artikkel som ble publisert på IEEE-konferansen om datasyn og mønstergjenkjenning i 2012, og inneholder det originale datasettet som ble brukt i denne artikkelen. Disse bildene er organisert i omtrent 37 kjæledyrkategorier, i tillegg til ytterligere 200 bilder knyttet til hver involverte klasse. Videre kan disse dataene lastes ned direkte via lenkene på nettsiden. 282. Det visuelle genomdatasettet Visual Genome API er sluttresultatet av det harde arbeidet som er lagt ned av flere studenter og førsteamanuenser fra Stanford University. Med flere artikler bak seg i søket etter å lage et API som er i stand til å evaluere og beskrive bilder, har programmet besvart over en million spørsmål samtidig som det har evaluert over 100 000 bilder. Dette API-et representerer fremskritt innen informatikk og relaterte felt, og datasettet kan lastes ned direkte fra nettstedet. 283. YouTube-ansikter YouTube Faces Database fokuserer på å utvikle en løsning på problemet med automatisk ansiktsgjenkjenning i videoer. Totalt sett inneholder datasettet over 3000 videoer hentet fra YouTube av nesten 1600 individer med en gjennomsnittlig lengde på omtrent 181 bilder. Målet er å lage en algoritme som er i stand til å lage etiketter som identifiserer personen som er i videoen. Dataene, sammen med informasjon om feil og beskrivelsesmetoder, er tilgjengelige for visning direkte på nettstedet. 284. KEEL-datasettlager KEEL-datasettarkivet inneholder datasettet med Java-basert åpen kildekode-programvare som er utviklet for å hjelpe til med ulike typer kunnskapsdataoppdagelse. KEEL, kjent som Kunnskapsutvinning basert på evolusjonær læring, kan trenes til å lære å legge til manglende verdier, hybridmodeller og statistiske metoder for å evaluere eksperimenter blant en rekke andre oppgaver. Nedlastingene av datasettet samt en fullstendig liste over algoritmene i KEEL kan lastes ned direkte fra nettstedet. 285. Utlånsklubb Lending Clubs berømmelse skyldes statusen som en peer-to-peer-långiver som lar låntakere motta lån selv om de ikke nødvendigvis har kredittscoren til å låne fra tradisjonelle långivere. I tillegg til nyhetene ved hvordan nettstedet fungerer, tilbyr det også statistikk som inkluderer plattformhøydepunkter, informasjon om avviste lån, tall for investorers ytelse og til og med en dataordbok som inneholder historiske data. Disse tallene starter vanligvis fra 2007 og kan lastes ned i CSV-format. 286. Naturhistorisk museum Naturhistorisk museum regnes av mange som et av de mest gjenkjennelige museene i verden, men digitaliseringen og muligheten til å se katalogen gjennom den åpne dataportalen ville sannsynligvis være nytt for mange. Med 91 datasett som inkluderer mikrofossil- og fossilsamlinger samt indekspartier blant annet materiale, er dataene åpne for publikum og kan lastes ned gratis i flere formater. 287. Getty-vokabularene Dette nettstedet er perfekt for journalister og forleggere som ønsker å holde seg innenfor visse stilretningslinjer når de beskriver og kategoriserer spesifikk kunst, kunstnernavn, arkitektur, materialer og geografiske navn. Dette nettstedet kobler brukere direkte til de kontrollerte vokabulardatabasene som forskere og katalogiserere trenger å vite om for å oppfylle internasjonale standarder. Her er det i hvert fall ingen som slår Getty-vokabularene. Datasettene kan utforskes via tekst eller SPARQL og kan lastes ned via nettstedet. 288. CLiPS Stylometriundersøkelse (CSI) Korpus CLiPS Stylometry Investigation Corpus er sannsynligvis ikke det folk flest tenker på når de hører ordene CSI, men CSI-korpuset er likevel et datasett bestående av studentanmeldelser og studentessays. Foruten selve teksten, bemerker nettstedet at tilstedeværelsen av metadata og informasjon innebygd i dokumentet har flere bruksområder. Tilbys og distribueres under Creative Commons-lisensen, alt korpuset ber om i bytte for å bruke datasettet er en kreditering. 289. Universelle avhengigheter v2 Universal Dependencies v2 refererer til den andre oppdaterte versjonen av Universal Dependencies-prosjektet, et forsøk på å utvikle en trebankannotasjon som kan brukes konsekvent med flere forskjellige språk. I den oppdaterte versjonen vil forskere finne dusinvis av UD-trebanker for forskjellige språk, inkludert afrikaans, gammelgresk, japansk, nederlandsk, finsk og kinesisk i tillegg til engelsk. Den nyeste versjonen av Universal Dependencies kan finnes og lastes ned nederst på denne nettsiden. 290. Nettslange Webhose er en førsteklasses kilde til datasett hentet direkte fra nettstedets databaser og tilgjengelig for publikum. Forskere kan sortere nyhetsartikler etter språk, og arabisk, fransk og nederlandsk er bare noen få av språkene med artikkelnumre på over 100 000. I tillegg er de engelske nyhetsartiklene videre delt inn i kategorier som underholdning og sport for å følge anmeldelser og foruminnlegg. Digitale utgivere og forskere kan dra nytte av å utforske disse datasettene. 291. Wiki-data Wikidata er en undervurdert kilde til innhold og ideer for både utgivere og forskere. Ifølge denne siden finnes det en rekke måter å få tilgang til materialet i datadumpene på, selv om bruk av JSON er den som nettstedet anbefaler på det sterkeste. Alle dataene som er tilgjengelige her, er tilgjengelige og helt gratis for både ikke-kommersiell og kommersiell bruk, og kan lastes ned gratis under Creative Commons-lisensen. 292. Wiki-lenker Wiki Links er et åpen kildekode-prosjekt, komfortabelt plassert innenfor rammen av Google Code, som har som mål å gi enkeltpersoner tilgang til dette unike datasettet. På denne nettsiden kan forskere laste ned README-tekstene, datafilene og Creative Commons-lisensen. Utgivere eller generelt teknologiorienterte personer har mye å se frem til når de blar gjennom dette massive datasettet. Bare naviger gjennom nettstedet, klikk og begynn å laste ned filene. 293. Ordnett WordNet er et engelsk leksikon som består av språkkomponenter, adverb, substantiver, adjektiver og verb som er kategorisert i distinkte grupperinger som deretter brukes til å uttrykke bestemte ideer. Sluttresultatet er et nyttig verktøy som kategoriserer ord etter hvordan de brukes og hva de betyr, i stedet for hvordan de høres ut når de uttales. Bruksområdene til WordNet i språklig programmering er nevnt sammen med de mange publikasjonene og statistikken som er tilgjengelig på nettstedet. 294. Allen Brain Atlas Allen Brain Atlas, laget av Allen Institute for Brain Science Resources, er et verktøy for å studere og lære mer om den menneskelige hjernen og hvordan den reagerer når menneskekroppen er frisk, samt når det er sykdom. Ved hjelp av atlaset kan forskere lære om den menneskelige hjernen og dens utvikling, samt glioblastom og effekten av kreft på hjernen. Journalister som dekker disse emnene kan besøke dette nettstedet for datasett og informasjon. 295. NITRC NITRC, eller Neuroimaging Informatics Tools and Resources Clearinghouse, er stedet journalister og utgivere kan henvende seg til for nevroavbildning. Dette nettstedet, som er satt sammen og promotert som et initiativ for datadeling av nevroavbildning, inneholder data fra flere prosjekter som 1000 Connectome Project, Addiction Connectome Preprocessed Initiative, samt henholdsvis INDI-Prospective og Retrospective-prosjektene. Enkeltpersoner kan fritt laste ned dataene via nettstedet. Nevroavbildninger tatt på ulike stadier har aldri vært så tilgjengelige. 296. HCP Unge voksne Human Connectome Project Young Adult-prosjektet er en fortsettelse av det pågående arbeidet med å lage et nøyaktig kart over det menneskelige connectome slik det ville sees hos de fleste normale voksne. Gjennom to faser ble 1200 friske voksne skannet ved hjelp av en kombinasjon av teknikker innen hviletilstand fMRI og diffusjonsavbildning. Journalister og utgivere som leter etter informasjon om hjernen, vil ikke finne et annet nettsted med mer data om det menneskelige connectome hos friske unge voksne. 297. NIMH-dataarkiv NIMH Data Archive, eller NDA, er ikke så mye en uavhengig datakilde som en plattform for distribusjon og lagring av data. På dette nettstedet finner du data som er samlet inn gjennom flere artikler og forskningsprosjekter, samt metoder og verktøy som muliggjør bedre analyse og samarbeid. Datasammendrag er fritt tilgjengelige, og innholdsleverandører som rapporterer om det siste innen vitenskap kan bruke denne informasjonen til å komme med nyheter. 298. Nevrodata NeuroData er dedikert til å forske på det unike forholdet mellom sinn og hjerne. Takket være nettstedets forpliktelse til åpen vitenskap og reproduserbar forskning, har innholdsleverandører tilgang til en publikasjon og flere datasett som kan nås ved å følge lenkene på nettsiden. Av spesiell interesse for de som ønsker å se dataene selv, er tilgjengeligheten av gratis kode og analyseverktøy som gjør det enda enklere å utforske NeuroDatas arbeid. 299. NeuroElectro NeuroElectro-prosjektet er utformet med den hensikt å samle de ulike elektrofysiologiske egenskapene knyttet til ulike nevrontyper og aggregere dem i én enkelt database. Dette prosjektet søker å studere forholdet mellom nevroner i et forsøk på å studere forskjellene mellom ulike nevrontyper. Nettstedet lenker til artikler og lister opp nevrontypene og elektrofysiologiske egenskaper som er oppdaget så langt. Innholdsleverandører kan stole på dette nettstedet som en kilde til data om forholdet mellom nevroner. 300. Åpen tilgangsserie av bildestudier Open Access Series of Imaging Studies, også kjent av mange som OASIS, er et prosjekt som ble utviklet med mål om å gjøre datasett av MR-bilder av hjernen tilgjengelige for det vitenskapelige miljøet generelt. Journalister og forskere kan få tilgang til publikasjoner som sammenligner MR-data mellom voksne, samt et omfattende faktaark fra OASIS' omfattende artikkel som sammenligner og kontrasterer resultater fra over 400 personer. Informasjonen og verktøyene kan lastes ned fra nettstedet i flere formater. 301. OpenfMRI For journalister som ønsker å få tilgang til MR-datasett uten bryderiet forbundet med noen andre nettsteder, er OpenfMRI.orgs fokus på å gjøre MR-datasett tilgjengelige for offentligheten en positiv utvikling. Dette nettstedet, som kommer direkte fra forskerne selv, er vert for en rekke datasett, som klassifiseringslæringsdatasettet, blandede spilloppgaver og ballonganalog risikotaking-oppgaven. Mangfoldet og mengden data gjør det mulig for forskere å finne nye undersøkelsesmuligheter gjennom dette nettstedet. 302. Studyforrest Navnet er i stor grad lånt fra den berømte filmen Forrest Gump, studyforrest søker å forstå hva hjernen er i stand til når den må prestere på et høyere nivå samtidig som den håndterer naturlig, men like kompleks stimulering. Likevel erkjenner nettstedet at mengden fMRI-data som er samlet inn fra disse studiene har bredere bruksområder enn det ser ut til ved første øyekast. Innholdsleverandører kan bla gjennom de 19 publikasjonene som har brukt studyforrest data og kan til og med få direkte tilgang til dataene. 303. Krystallografi åpen database Som det naturlig nok kan forventes ut fra tittelen, er Crystallography Open Database en samling av 385 697 metallorganiske mineraler og forbindelser, organiske og uorganiske krystallstrukturer med det bemerkelsesverdige unntaket av biopolymerer. Innholdsleverandører som ønsker å lære mer om krystallstrukturer kan søke etter strukturformelen eller kjøre et samsvarende søk med muligheten til å bla gjennom. Det finnes også programvare og data på dette nettstedet som gjør dette nettstedet spesielt verdifullt innen kjemi. 304. NASAs eksoplanetarkiv NASA, som lenge har blitt ansett som en av de fremste informasjonskildene om verdensrommet, fortsetter sin tradisjon med å være en uvurderlig ressurs med sitt eksoplanetarkiv. Dette nettstedet inneholder en rekke interaktive verktøy og programvare som Transit and Ephemeris Service, Periodogram, Confirmed Planets Plotting Tool og muligheten til å laste opp filer og søke i tabeller interaktivt. Innholdsleverandører som søker etter unik innsikt kan bruke disse dataene til å gjøre det neste gang eksoplaneter tilfeldigvis skaper store nyheter. 305. Sloan Digital Sky Survey Muligheten til å lage tredimensjonale kart over universet er mulig for alle å gjøre ved hjelp av Sloan Digital Sky Survey, eller SDSS. Både journalister og innholdsleverandører kan få tilgang til algoritmer, bildedata, datasett, veiledninger og videreutvikling av visuelt materiale for å utdanne publikum både formelt og uformelt. Nettstedet diskuterer også eksplisitt å gjøre dataene tilgjengelige for publikum via nyheter og sosiale medier. Dette er et uvurderlig visuelt verktøy for innholdsleverandører. 306. StatSci.org Statsci.org tilbyr en omfattende liste over ressurser som publikum kan få tilgang til og bruke, avhengig av deres spesifikke behov. Noe av informasjonen inkluderer Electronic Dataset Service og casestudier samlet av UCLA. I tillegg til rådatasettene finnes det også lenker til lærebøker på denne siden. Dette inkluderer titler som Handbook of Small Data Sets og Case Studies in Biometry. Innholdsleverandører som er på jakt etter statistikk, kan ikke gå feil hvis de tar en titt på dette. 307. ERIK ERIC, også kjent som Institute of Education Sciences, er en ressurs som fungerer som en søkemotor for alle som leter etter informasjon innen utdanningsfeltet. Det foreløpige søket gir til og med muligheten til å filtrere utelukkende etter fagfellevurdert informasjon samt ERIC-baserte fulltekster. I lys av hvor ofte utdanningsbudsjetter og undervisningsmetoder ser ut til å være i nyhetene, er dette en datakilde journalister bør huske på. 308. NTIS NTIS (National Technical Information Service) ble opprettet kort tid etter slutten av andre verdenskrig, med mål om å bruke data til å hjelpe føderale etater med å ta informerte, databaserte beslutninger gjennom bruk av data. Dette byrået var opprinnelig den amerikanske regjeringens datalager innen vitenskapelig forskning. I dag inneholder nettstedet millioner av publikasjoner om en rekke emner. Bare den historiske informasjonen gjør dette nettstedet velfortjent som en datakilde for journalister og utgivere. 309. Åpent datasertifikat Nettstedet til ODI (Open Data Institute) inneholder det som kalles Open Data Certificate, et gratis verktøy tilgjengelig på nett som ble utviklet med det uttrykkelige formålet å kritisk undersøke og anerkjenne kvaliteten på åpne data. Fra et utgiver- eller journalistperspektiv inneholder nettstedet også en rekke datasett om emner som spenner fra lister over tilskudd til allergivarsler, sammen med lister som kan lastes ned i CSV-format. 310. GitHub-arkivet GitHub er uten tvil et av de mest populære og kjente datalagrene og arkivene på Internett på grunn av dets enkle samarbeid, arkivkapasitet og tilgjengelighet når det gjelder koding. Enten det innebærer forsøk på å lage roboter som kan utføre bestemte oppgaver, eller utvikling av applikasjoner, er GitHub et nettsted der innholdsutgivere og journalister enkelt kan snuble over potensielt nyhetsverdige produkter. Arkivet kan nås ved å følge veiledningsinstruksjonene for enten JSON eller Big Query. 311. Sosiomønstre SocioPatterns er et prosjekt som fokuserer på å finne mønstre i menneskelig aktivitet og sosial dynamikk gjennom data. Som forventet med et så bredt uttalt mål, har nettstedets informasjon blitt brukt i publikasjoner som tar for seg en rekke emner, fra spredning av sykdommer til casestudier om forskjellene mellom individers online og offline personaer. Datasettene er tilgjengelige for visning, i likhet med publiserte artikler som inneholder informasjon som utgivere sannsynligvis vil finne relevant på et eller annet tidspunkt. 312. Indie-kart Indie Map er et resultat av å hente informasjon fra over 2000 av IndieWebs mest travle nettsteder og rulle dataene inn i interaktive visuelle former som et Social Graph API, et datasett med SQL-spørringsmuligheter og den rådata informasjonen som ble gjennomsøkt på totalt 5,7 millioner nettsider. Digitale utgivere som er interessert i programvare med åpen kildekode og hva disse dataene kan si om disse nettsamfunnene, kan få tilgang til informasjonen direkte fra nettstedet. 313. Simon Fraser-universitetet Simon Fraser fortsetter å bygge på sin status som et anerkjent universitet med tilgjengeligheten av datasettet sitt angående «Statistikk og sosiale nettverk for YouTube-videoer». Filene henter informasjon fra en robotsøkeprogram som brukte YouTubes API for å finne videoer, og inneholder data om millioner av videoer og brukerinformasjonsdatasett. Nettstedet spesifiserer at nedlastinger av datasett kun er for akademiske formål, men det kan være mulig å finne journalistiske kilder og referanser om dette prosjektet gjennom nettstedet. 314. ACLED ACLED, eller Armed Conflict Location and Event Data Project, tilbyr offentlige data om protester og politisk vold i utviklingsland. Informasjonen som gis her inkluderer tall for dødsfall, informasjon om datoer og steder for volden eller protesten, navn på relevante grupper og data om opptøyer og voldelige sammenstøt som har funnet sted. ACLED gir tilgang til regelmessige rapporter, publikasjoner og visuelle elementer, samt data som er tilgjengelige for nedlasting på nettstedet. 315. Kanadisk juridisk informasjonsinstitutt Canadian Legal Information Institute, eller CanLII som det kalles i vanlig språkbruk, er et nettsted som gir gratis tilgang til lover og deres forskrifter, rettspraksis fra domstoler i ulike jurisdiksjoner, inkludert Canadas høyesterett, provinsielle og ankedomstoler og Queen's Bench, samt kjennelser fra ulike administrative tribunaler og lovbestemte organer. Med 301 rettspraksisdatabaser og over 140 000 rettsavgjørelser tilgjengelig for visning, vil journalister og digitale utgivere som dekker juridiske emner dra nytte av å bokmerke dette nettstedet. 316. Senter for systemisk fred Center for Systemic Peace, eller CSP, er en organisasjon som har dedikert seg til å analysere globale systemer med det formål å ta opp problemet med politisk vold. På dette nettstedet vil journalister som forsker på dette området ha tilgang til analyser av konflikt i Afrika, konflikttrender på globalt nivå blant annet, samt sammendrag av organisasjonens tre hovedpublikasjoner som Third World War og CSPs Global Report and Virtual Library. 317. Korrelater av krigsprosjektet Fokuset til Correlates of War, eller COW-prosjektet, er å hjelpe til med innsamling og distribusjon av kvantitative data innen internasjonale relasjoner. I tråd med sin forpliktelse til å anvende vitenskapelige prinsipper på data om internasjonale relasjoner, gjør COW sine datasett fritt tilgjengelige for publikum. Disse databasene inneholder tall om informasjon som journalister og forskere kan bruke, for eksempel militariserte konflikter mellom stater, medlemmer av statssystemer, nasjonale materielle evner og formelle allianser. 318. Europeisk sosialundersøkelse Den europeiske sosiale undersøkelsen, eller ESS, er en undersøkelse som gjennomføres over hele Europa med mål om å måle de ulike atferdsmønstrene, holdningene og oppfatningene til ulike befolkningsgrupper i ulike nasjoner. Siden journalister ofte er interessert i å få publikums meninger, kan ESS Topline-serien, som dekker emner som spenner fra europeernes personlige og sosiale velvære, holdninger til velferd og til og med forekomsten av aldersdiskriminering i Storbritannia, styrke en historie på mer enn én måte. 319. Fredsfond Fund for Peace er en organisasjon som fokuserer på å forebygge konflikt og konsentrere seg om sikkerhet gjennom utvikling av verktøy som kan brukes til å redusere konflikter. I løpet av FFPs karriere har de jobbet i partnerskap med journalister, frivillige organisasjoner, lokale organisasjoner og deres internasjonale motparter, samt myndigheter. Enten de leter etter trender, sammenlignende analyser og globale data, kan journalister og utgivere finne materialene de ønsker gjennom nettstedets nettleserbaserte datautforskningsverktøy. 320. Den generelle sosiale undersøkelsen Arbeidet til General Social Survey (GSS) fokuserer på å samle inn informasjon om ulike aspekter ved det moderne amerikanske samfunnet som et middel til å holde seg oppdatert på holdnings- og atferdstrender og -mønstre i befolkningen. Med denne praksisen med trendsporing som går tilbake til 1972, er de historiske dataene alene en gullgruve for journalister som ønsker å utforske trender. Ved hjelp av GSS Data Explorer kan forskere og journalister laste ned, undersøke og til og med evaluere data. 321. Gesis GESIS er et tysk infrastrukturinstitutt dedikert til samfunnsvitenskapene. Det tilbyr ulike samfunnsvitenskapelige fag, i tillegg til forskningsarbeid og tjenester som spenner fra spørreundersøkelsesmetodikk til anvendt informatikk, datainnsamling, studieplanlegging og dataanalyse for å nevne noe av det GESIS gjør. Journalister som er interessert i emner som GESIS' tilnærming til metodikk, utnyttelse av overkvalifiserte innvandrere og mer, kan finne mye informasjon i publikasjonsseksjonen. 322. Globale religiøse fremtider Fra temaer som abort til seksualundervisning er religion så utbredt at selv i stort sett sekulære land kan en persons holdning til vanskelige sosiale emner påvirkes av religiøs tro. I Global Religious Futures undersøker Pew Research Center trender i folks holdninger og tro knyttet til globale religioner. Journalister som ønsker å undersøke detaljer som evangelikalismens innflytelse i politikken eller holdninger til steining, kan bruke Data Explorer til å finne svar i tallene. 323. Indeks for risikostyring Indeksen for risikostyring, også kjent som INFORM, er et sted forskere og journalister kan gå til for risikovurderinger i situasjoner der det er risiko for en humanitær krise eller katastrofe. Organisasjonen tilbyr lenker til data om emner som barnedødelighet, kjønnsulikhetsindeksen og tørkefrekvenser blant andre tall. Det er også mulig å se og laste ned INFORMs data eller få tilgang til dem via nettstedets interaktive kart. 324. INED INED, eller det franske instituttet for demografiske studier, er en av de mest produktive kildene til data og statistikk som en journalist kan finne på internett. Med over 70 publikasjoner som blir undersøkt og publisert hvert år, som går gjennom verdens befolkning i grafformat, samt statistikk som måler spørsmål som fruktbarhetsforskjeller mellom kjønnene, for å gå gjennom nyheter og ressursmetoder. Forskere som jakter på nøyaktige funn fra en pålitelig kilde, vil finne dem hos INED. 325. Arkiv for internasjonale nettverk Princetons International Networks Archive tilbyr en unik kombinasjon av publikasjoner, med forskning som Human Development Report 1999 og Global Networks: A Journal of Transnational Affairs tilgjengelig for lesing på dette nettstedet. På dette nettstedet vil journalister kunne fordype seg i arkivets omfattende offentlige historiske og oppdaterte data. Emner som dekkes her inkluderer helsevesen, våpen, bøker, musikk, migrasjon, regioner, internett, politikk og transport er bare et utvalg av materialene som forskere kan lese her. 326. Det internasjonale programmet for sosiale undersøkelser International Social Survey Programme (ISSP) ble grunnlagt som et samarbeidsmiddel mellom mennesker fra forskjellige nasjoner, og har gjennomført undersøkelser hvert år om en rekke emner som er viktige innen samfunnsvitenskapene. Temaer gjennom årene har blant annet inkludert sosial ulikhet, nasjonal identitet, statsborgerskap, sosiale nettverk og arbeidsorientering. ISSPs funn kan søkes etter år eller emne, og kan lastes ned på nettstedet. 327. Internasjonale studieforeninger International Studies Association (ISA) er et selskap for journalister eller andre forskere som ønsker informativ og intellektuell diskusjon om problemstillinger knyttet til transnasjonale, internasjonale og globale spørsmål. ISAs Encyclopedia of International Studies inneholder fagfellevurderte essays fulle av dyptgående diskusjoner om emner knyttet til forskning på dette feltet, samt essays som gir informasjon fra et mer historisk perspektiv. 328. Tverrnasjonale data på nettet Professor James W. McGuires utrolig nyttige side, passende nok kalt Cross-National Data on the Web, er en ressursside full av lenker til relevante økonomiske og globale utviklingsdata. Blant datasettene journalister vil kunne oppdage her, finner man data om familieplanlegging, utdanningsresultater, underernæring, vann og sanitærforhold, frimarkedsorientering og informasjon spesifikk for Latin-Amerika og Karibia, for å nevne noen fra listen. Datakildene som er oppført her er upåklagelige. 329. Norsk senter for forskningsdata Norsk senter for forskningsdata er en institusjon som støtter og hjelper forskere innen ulike områder innen empirisk forskning, som personvern, datainnsamling og -analyse, metodologivurdering og etikk i forskning. Her finner forskere programvare og verktøy utviklet og anbefalt av senteret, i tillegg til en omfattende samling av regionale, individuelle og institusjonelle data som er gratis tilgjengelige. Senterets funn i årsrapporten om forskning og personvern er også alltid interessant lesning. 330. IPUMS IPUMS er ikke nødvendigvis en datakilde i den forstand folk flest ville forvente når de hørte begrepet, men det er likevel en nyttig kilde for journalister på grunn av dens rolle som en aggregator, arkiverer og organisator av dataene som andre enheter gir den. Et godt eksempel er IPUMS USA som et slags datalager for amerikanske folketellingsmikrodata, med data som går så langt tilbake som 1790 og helt frem til i dag. 331. ND-GAIN ND-GAIN Country Index, et initiativ arrangert av University of Notre Dame Global Adaptation Initiative, måler et lands motstandskraft mot klimaendringer og andre globaliseringskrefter. Denne indeksen inkluderer sårbarhetspoeng på områder som mat, helse, infrastruktur og økosystemer, samt beredskapspoeng for så mange som 500 000 datapunkter. Denne informasjonen inneholder to tiår med data fra årene 1995 til 2014 i form av CSV-filer, og er tilgjengelig for nedlasting. 332. Politiet i Storbritannia På dette nettstedet kan journalister og utgivere få tilgang til åpne data om tilstanden til politiarbeid og kriminalitet i Storbritannia. Dataene inneholder nyttig statistikk om nabolagsteam, individuelle politistyrker, antall stopp og søk, samt statistikk om kriminalitet og utfall. Ved å bruke dette nettstedet kan journalister sammenligne politistyrker og oppdage trender innen strafferettssystemet. Å få informasjon er så enkelt som å velge datoperiode, velge politistyrke og deretter vente på filen. 333. Paul Hensels generelle internasjonale dataside Paul Hensels side om generelle internasjonale data er en serie lenker gruppert under overskriftene Stater og det internasjonale systemet, internasjonale geografiske data, statlige kapasiteter, samfunnsvitenskapelige datasamlinger og allianser, traktater og organisasjoner. Hver ressurs som er oppført på denne nettsiden inneholder toppmoderne data som automatisk vil gi troverdighet til en journalists arbeid. Disse kildene kan inkludere alt fra programvare til datasett og arkiver, men alle lenker som er inkludert her er nyttige. 334. TRAC I tiden etter 9/11-katastrofen har terrorisme og dens ødeleggende effekter på lokalbefolkningen fått mye oppmerksomhet i media. TRAC, på trackingterrorism.org, gir forskere omfattende analyser og informasjon om disse emnene. Dette nettstedet inneholder informasjon om flere tusen forskjellige terroristgrupper. Enbrukerprisen på $500 kan være litt høy i utgangspunktet, men er vel verdt prisen for de som skriver om vold og krigen mot terror. 335. Texas' strafferettsdepartement Interessert i hvordan strafferettssystemet i Texas fungerer på innsiden? Nysgjerrig på å finne ut hvem som for tiden sitter i dødscelle? Texas' strafferettsdepartement har mye informasjon fra de siste uttalelsene fra fanger før henrettelse, dødscellestatistikk etter kjønn og rase, samt ytterligere henrettelsesstatistikk og faktaark. Texas' strafferettsdepartement er en av de mest pålitelige kildene for journalister. 336. Integrert system for sivilsamfunnsorganisasjoner Det integrerte systemet for sivilsamfunnsorganisasjoner, eller iCSO, er utformet for å gjøre det enklere for sivilsamfunnsorganisasjoner å kommunisere med Department of Economic and Social Affairs. I tillegg til effektiviteten til det robuste rammeverket, inneholder nettsiden datasett og kategorier for ytterligere informasjon. Dataene kan sorteres etter sektor, organisasjonstype, region involvert og organisasjonens ECOSOC-status. Dette er en datakilde som journalister definitivt kan bruke for å finne kilder. 337. Universiteter over hele verden Universities Worldwide er en database over universiteter over hele verden som kan søkes i for ytterligere informasjon. Søket kan gjøres via verdensomspennende lister eller filtreres utelukkende til universiteter i USA, og brukere kan også legge til sine egne lenker i prosessen. Datautgivere med en betydelig studentgruppe, eller til og med journalister som ønsker å bekrefte et faktum, kan alle dra nytte av å kunne få tilgang til en database som denne på forespørsel. 338. Uppsala konfliktdataprogram Dette er nettsiden til Uppsala Conflict Data Program, som er en av de mest kjente leverandørene av informasjon om organisert vold. I løpet av programmets siste 40 år har det også etablert seg for sitt arbeid med å samle inn data fra borgerkrigen. Journalister kan bruke denne datakilden til å søke etter informasjon om spesifikke konflikter og aktører i disse konfliktene, og kan også få tilgang til disse dataene for å laste dem ned. 339. Verdenspop WorldPop-prosjektet, sluttresultatet av en sammenslåing av AsiaPop-, AfriPop- og AmeriPop-prosjektene, er dedikert til arkivering av romlige demografiske datasett som igjen har anvendelser som et middel for å gi støtte til katastrofehjelpsarbeid. Innholdsutgivere og journalister som er involvert i sosiale rettferdighetssaker eller som på annen måte forsker på effektive katastrofehjelpsmuligheter, vil være interessert i dette prosjektet. Forskere kan laste ned dataene eller gjennomgå casestudiene på nettet. 340. Utkast Express DraftExpress er kanskje mest kjent på internett for sin research, speiderrapporter før draften, simulerte draftvalg og sin grundige vedlikehold av spillernes høyder og mål i henhold til sine historiske data. Prospektene som er nevnt på dette nettstedet kommer fra NCAA, videregående skoler og til og med internasjonale ligaer. Sportsjournalister eller innholdsleverandører som har til hensikt å tilby basketballrelaterte kommentarer, kan henvende seg til DraftExpress-statistikk mens de diskuterer spillere og hendelser etter hvert som de skjer i sporten. 341. Betfair Betfair er kanskje mest kjent som nettstedet man bør gå til for sportsveddemål. Av interesse for innholdsleverandører og digitale utgivere spesielt er imidlertid tilgjengeligheten av detaljert historisk informasjon om nettstedets prisdata og historikk. Dataene kan nås og lastes ned med eller uten detaljert tidsstempel, samtidig som de tilbyr omfattende data om hesteveddeløp og nettstedets andre markedstilbud fra juni 2004 til oktober 2017. 342. KRIKKARK Cricsheet tilbyr en lignende tjeneste som en rekke andre sportsdatasentre, men det er et nettsted som spesialiserer seg utelukkende på å tilby cricketdata. Nettstedet tilbyr statistikk og ball-for-ball-data fra en rekke ligaer, inkludert den indiske Premier League, endagskamper, samt tall for herre- og damelag, for å nevne noen av de større kategoriene. Innholdsutgivere som søker historiske cricketdata kan laste ned dataene i enten CSV- eller XML-format. 343. Tverrnasjonale tidsseriedata Med data om politiske, økonomiske, lovgivende og innenlandske konflikter som dekker over 200 år med data i over 200 nasjoner rundt om i verden, er Cross-National Time-Series Data Archive et av de mest omfattende datasettene på Internett. Dataene lagres, mest praktisk, i et Google Drive-ark som åpnes automatisk når man klikker på filkategorien. I bytte mot en sitering kan denne informasjonen sees delvis eller i sin helhet, avhengig av forskerens behov. 344. Ford GoBike Ford GoBike er navnet på sykkeldelingsprogrammet som brukes i Bay Area. Selv om mange utvilsomt bruker dette programmet for å holde seg i form og unngå å bruke fossilt brensel, har sykkeldelingssystemet holdt oversikt over turdataene. Denne informasjonen inkluderer selvfølgelig ingenting som kan identifisere syklistene, men detaljer som sykkelnummer, starttid, sluttid, syklisttype og ankomst- og avgangsstasjoner er inkludert i dataene. Det er verdt å utforske. 345. Maritim trafikk Marine Traffic er et selskap som sporer og holder oversikt over bevegelsene til fartøy og sjøreiser ved hjelp av stordata. Informasjonstypen som dekkes av Marine Traffics AIS API-tjenester inkluderer fartøy, informasjon om reisene og data om de aktuelle fartøyene, som forventede ankomster, til og med hendelser, bilder, fartøydetaljer og reiseprognoser. Det finnes imidlertid prisplaner på dette nettstedet, så det er uklart hvor mye research som kan gjøres gratis. 346. Bixi Bixis sykkeldelingsprogrammer er kanskje noen av de mest kjente sykkeldelingsprogrammene i noen av de største byene i Nord-Amerika. Interessant nok publiserer merket også åpne data som gir informasjon om ting som turhistorikk og stasjonsstatus, samt sammenligninger som kan gjøres mellom medlemmer og sporadiske brukere. Lokale journalister som undersøker hvordan enkeltpersoner bruker og integrerer sykkeldelingsprogrammer i livene sine, har all grunn til å fordype seg i disse dataene. 347. Ulykkesdatabase Fra Amelia Earhart til Indonesias AirAsia Flight 8501 er fly- og flyulykker et tema som tiltrekker seg folks oppmerksomhet. Ulykkesdatabasen arkiverer og lagrer data om flyulykker som har skjedd mellom årene 1920 og 2017. Ulykker som ble telt i denne databasen inkluderte sivile og militære luftskipulykker, ulykker som involverte dødsfall blant kjendiser eller noen kjente personer, helikopterulykker med 10 eller flere dødsfall, ruteflyvninger og ikke-ruteflyvninger med passasjerer som endte med dødsfall. 348. Transport for London Transport for London er det statlige organet som er ansvarlig for å føre tilsyn med offentlig transport i Stor-London-området. Det finnes kart over T-bane og tog på nettstedet, sammen med en reiseplanleggingsguide. I tillegg til alle disse praktiske tjenestene, inneholder nettstedet også mye åpne data, inkludert sykling, luftkvalitet, tubing og til og med østers. Alle som er interessert i å se hvordan innbyggere i Stor-London bruker offentlig transport, kan dra nytte av å ha tilgang til disse dataene. 349. CMAP CMAP er ansvarlig for regional planlegging og organisering i fylkene DuPage, Lake, McHenry, Kendall, Kane, Cook og Will i Illinois. Som det fremgår av nettstedet, omfatter CMAPs ansvar også problemstillinger som samfunnsutvikling, skatter og økonomiske indikatorer, og til og med veier og kollektivtransport. Derfor er åpne data om områder som regionale indikatorer og reiseliv nyttige for en journalist som prøver å forstå det store bildet når det gjelder regionens fremtid. 350. Rammeverk for fraktanalyse Fraktanalyserammeverket, som ble opprettet takket være et samarbeid mellom Bureau of Transportation Statistics og Federal Highway Administration, samler inn data som deretter brukes til å vurdere den generelle tilstanden og ytelsen til godstransportsystemet. Denne programvaren samler inn informasjon om detaljer som varetype og tonnasje sammenlignet med avgangs- og ankomststasjoner, og disse dataene har igjen blitt gjort tilgjengelige for publikum for tilgang og nedlasting enten i sin helhet eller i sammendragsform. 351. Mozilla Science Mozilla Science er en åpen kildekode, åpen praksis og samarbeidsprogramvare som er der for å hjelpe til med utvikling og distribusjon av ulike datakilder og forskningsfunn. Bortsett fra åpenhetsinteresser, gjør beslutningen om å åpne opp programmer og crowdsource forbedringsprosessen det enklere å forbedre programmene som allerede finnes. Med prosjekter tilgjengelig innen en rekke felt, inkludert biovitenskap og medisin blant andre, finnes det programvareløsninger her som kan representere nyhetsverdige fremskritt innen feltet. 352. Kule datasett At det er så attraktivt med Cool Datasets er lett å se fra nettstedets navn. På denne siden faller datasettene inn under seks generelle kategorier innen offentlig forvaltning, underholdning, vitenskap, brukerinnlegg, diverse og maskinlæring. Journalister som ønsker å utforske dataene og finne historier, vil tjene mest på å sjekke ut hva dette nettstedet har å tilby. Det er et alternativ å utforske datasettene og, om mulig, også bidra med datasett. 353. Åpen datamonitor  OpenDataMonitor er en plattform som tar offentlige datasett og presenterer dem på en måte som er mer intuitiv og enkel for enkeltpersoner å følge. Forskere kan gå til plattformen for å se et sammendrag av hva de åpne dataressursene er i stand til, og de vil kunne se eksisterende data presentert for dem på en mer visuelt engasjerende måte. Nettstedet forklarer metodikken og referansepunktene, og utgivere burde ikke ha problemer med å finne data som er verdt å publisere. 354. CrunchBase  CrunchBase er kanskje mest kjent for sin vektlegging av statistikk og sin forpliktelse til å gi leserne tilgang til de beste tilgjengelige dataene. Forretningsinteresserte personer kommer til dette nettstedet hver dag for å lære om de nyeste trendene innen investering og industri. Her vil journalister og utgivere finne nyheter og ferske diskusjoner om de nyeste forretningstrendene. Som en del av det betalte alternativet har nettstedet også omfattende datasett som kan analyseres ved hjelp av Crunchbases programvareverktøy. 355. Indeks Index er en plattform med et unikt salgsargument fordi den har noe å tilby alle, fra oppstartsbedrifter, investorer, analytikere og selskaper. Nettstedet inneholder også informasjon om over 100 000 selskaper i teknologisektoren, samtidig som det gir brukerne muligheten til å sortere, bygge og eksportere regneark. Utgivere og journalister som skumleser overskrifter for potensielle historievinkler kan komme seg foran forretningsnyheter gjennom dette nettstedet. Index er kanskje uvanlig, men det er ingen tvil om at det er en nyttig ressurs. 356. SEMRUSH SEMrush er stolte av å være et av de mest veletablerte verktøyene for søkeintelligens som er tilgjengelige for nettmarkedsførere. Med akademiet og webinarene har forskere alle muligheter til å lære det grunnleggende. Blogg- og nyhetsseksjonene inneholder imidlertid nok informasjon til at utgivere og journalister enkelt kan holde seg oppdatert på alle de siste nyhetene innen nettannonsering og SEO. SEMrushs tjenester koster penger, men de tilbyr mye kvalitetsinformasjon gratis. 357. Ahrefs Ahrefs kan kanskje best oppsummeres som en pakke med markedsføringsverktøy som potensielt er nyttige for alle som publiserer innhold på nett. Nettstedet tilbyr en kombinasjon av tjenester som innholdsanalyse, nettovervåking, søkeordanalyse og tilbakekoblingsanalyse for å hjelpe brukere med å reversere konkurrentenes suksess. Sannsynligvis mest nyttig for nettutgivere i det store bildet, representerer Ahrefs-bloggen alene utmerket verdi for de som liker markedsføringen sin gjort med en databasert vinkling. 358. Engleliste AngelList, med sitt smart valgte navn, er i utgangspunktet to deler Craigslist og én del LinkedIn, med vekt på å bringe investorer, jobbsøkere og oppstartsbedrifter sammen på ett sted. Sammen med dette interessante nettstedskonseptet er det mange muligheter for driftige journalister til å oppdage de heteste oppstartsbedriftene og de nyeste investeringstrendene før de blir vanlige. Med sitt enkle grensesnitt og sin sterke forretningsorientering er dette nettstedet nyttig for fagfolk på mer enn én måte. 359. Ervervet I så godt som alle sektorer kan et bedriftsoppkjøp endre en hel bransje praktisk talt over natten. Acquired er et nettsted som tar på seg oppgaven med å holde offentligheten informert når et oppkjøp er gjort i teknologisektoren. Full av statistikk som kan sees på nettstedet i tillegg til muligheten til å filtrere søk, vil journalister som skriver om teknologi tjene mest på å gjøre Acquired til en fast del av sin daglige nettsurfing. 360. Mattermark Mattermark er en betalt tjeneste som gjør livet enklere for beslutningstakere i bedrifter ved å produsere kundelister av høy kvalitet som tar hensyn til både bedrifter og deres nøkkelansatte. Mattermark tilbyr omfattende bedriftsprofiler, fleksibilitet med API-et og til og med eksportmuligheter for oppdateringer, og gjør alt de kan. Bedrifter som ønsker å målrette sin kontakt bedre samtidig som de sporer resultatene av kampanjene sine, vil tjene mye på å registrere seg for dette. 361. Fintech-oppstartsbedrifter FintechStartupsCo fungerer som en type aggregator som holder oversikt over hvor mye ulike selskaper har klart å hente inn i sine børsnoteringer. Med et minimalistisk design som veksler mellom fanene «oppstartsbedrifter» og «nyheter», er dette en rask og enkel måte for journalister å holde seg oppdatert på de siste nyhetene om innsamlingsaksjoner. Samtidig kan utgivere som søker raskt innhold og korte historier også tjene på å ta en ny titt på hva dette nettstedet har å tilby. 362. Datafox I tilfelle navnet ikke avslørte alt, er DataFox et selskap som streber etter å gi sine forretningskunder informasjonen de trenger for å maksimere CRM-ene sine og generelt ta datadrevne beslutninger. Dette selskapet tilbyr tjenester som inkluderer konferanse- og bedriftsinformasjon, API-er og bedriftssignaler, og er effektivt en komplett løsning for bedrifter som fornyer salgs- og oppsøkende arbeid. Digitale utgivere og innholdsleverandører vil kanskje også sjekke det ut. 363. Åpen sending OpenSpending er en gratis plattform som er tilgjengelig praktisk talt hvor som helst i verden, og som lar brukere søke og undersøke offentlige økonomiske data. For ikke-hackere er dette et kraftig verktøy for visualisering og analyse. Journalister kan spesielt bruke OpenSpending til å finne interessante nye innsikter og forfølge historievinkler slik selskapet foreslår direkte på nettstedet sitt. Som en ekstra bonus er journalister blant yrkesgruppene som er spesifikt etterspurt på forumet. 364. ESPN Sports API ESPN er ikke fornøyd med å bare være den mest populære sportskanalen på kabel, men utvider sin innflytelse til koding og API-er. I utviklersenteret tilbyr nettstedet utgivere et utvalg av flere API-er som inkluderer forskningsnotater, rangeringer, draftvalg, kalendere og overskrifter. Det finnes til og med et API som laster inn utøverprofiler, biografier og statistikk i alle de store idrettene. Journalister som forbereder seg på å skrive en historie med sportsinnhold kan bare dra nytte av å bla gjennom disse. 365. Sportsreferanse For sportsentusiaster som liker å ha avansert statistikk og ressurser samlet på ett sted, er Sports Reference et av de beste nettstedene på nettet. Med historiske data som inkluderer lag- og spillerstatistikk om angrep og forsvar, kan sportsforskere gå så bredt eller så snevert som de vil med dette nettstedet. I tillegg finnes det tall for praktisk talt alle større idretter fra basketball til baseball og separate data for forskjellige universitetsidretter. 366. Datasett for millioner av sanger Den passende navngitte «Million Songs Collection» inneholder hele 28 datasett med metadata og informasjon om lydfunksjonene til nøyaktig én million sanger. Denne informasjonen, som i stor grad er et resultat av Columbia Universitys LabROSA-arbeid sammen med Echo Nest, er tilgjengelig og lagret på Amazons AWS-system. Brukere kan søke etter informasjonen gjennom Infochimps, noe som gjør den enda mer tilgjengelig for journalister som leter etter obskure quizzer, samt innholdsutgivere.