Es gibt viele verschiedene Arten von Websites, die eine Fülle von kostenlosen, Freemium- und kostenpflichtigen Daten bereitstellen, die Zielgruppenentwicklern und Journalisten bei ihren Recherchen und Storytelling-Aktivitäten helfen können. Das Team von State of Digital Publishing möchte diese Websites, die aus manuellen Recherchen und Empfehlungen unserer bestehenden Leserschaft stammen, anerkennen.
1. Kaggle
Kaggle ist eine Plattform, die es Nutzern ermöglicht, maschinelles Lernen zu entdecken, indem sie cloudbasierten Code schreiben und teilen. Dank der Begeisterung ihrer großen Community veranstaltet die Seite Wettbewerbe mit Geldpreisen und verfügt daher über riesige Datenmengen. Ob historische Daten der New Yorker Börse, ein Überblick über Trends in der Süßwarenproduktion in den USA oder hochmoderner Code – diese Seite bietet eine Fülle an Informationen.
2. Wikipedia
Es ist heutzutage unmöglich, länger im Internet zu surfen, ohne auf einen Wikipedia-Artikel zu stoßen. Von umfassend recherchierten und referenzierten historischen Biografien bis hin zu Zeitleisten der nahen und fernen Zukunft – Wikipedia hat sich als kostenlose Online-Enzyklopädie etabliert. Dank der Artikel, die einen allgemeinen Überblick über das jeweilige Thema bieten, und der zahlreichen Bücher und Online-Referenzen, die die Seite bereitstellt, ist Wikipedia in vielerlei Hinsicht ein unverzichtbares Hilfsmittel für Autoren.
3. Gemeinsamer Kriechgang
Wie der Name der Website bereits vermuten lässt, durchsucht Common Crawl das Web nach Daten, die anschließend in einem offenen Repository gespeichert und zusammengestellt werden, auf das Nutzer zugreifen können. Virtuelle Patentmarkierungen und umfassende Listen von Websites mit RSS-Feeds verdeutlichen die Leistungsfähigkeit dieser Anwendung. Wenn Sie Daten oder Websites vergleichen möchten, bietet Ihnen Common Crawl ein benutzerfreundliches Werkzeug zur Erstellung eigener Informationen.
4. EDRM
EDRM (Electronic Discovery Reference Model) ist eine Website für Juristen, die sich mit dem Potenzial von E-Discovery und den damit verbundenen Regeln und Erwartungen für den Umgang mit Informationen auseinandersetzen. EDRM-Mitglieder entwickeln gemeinsam Standards, Software und Schulungsmaterialien, um die Ziele der Community zu fördern. Wenn Sie Informationen darüber erhalten möchten, wie Technologie die Verfahrens- und Verwaltungsabläufe in der Rechtspraxis verändert hat und verändern kann, sind Sie hier genau richtig.
5. Mahout
Mahout konzentriert sich auf eine gleichnamige Software, die die Logistik für den Aufbau einer Umgebung optimiert, in der leistungsstarke, skalierbare und schnell erstellbare Anwendungen für maschinelles Lernen entwickelt werden können. Für Forschende, die eigene Datensätze erstellen und bearbeiten oder erste Erfahrungen mit Anwendungen für maschinelles Lernen sammeln möchten, ist diese Software besonders nützlich. Diese Website hilft Nutzern, sich schnell mit der Software vertraut zu machen.
6Das Lemurenprojekt
Das Lemur-Projekt ist eine Datenbank, die die Forschung im Bereich Informationsgewinnung und Sprachverarbeitungstechnologien unterstützt. Mit rund einer Milliarde Webseiten und Daten in zehn Sprachen, die zwischen Januar und Februar 2009 erfasst wurden, bietet das Projekt dank seines enormen Umfangs an Material und der umfassenden Unterstützung eine hervorragende Ressource für Forschende. Darüber hinaus bietet die Website allen Interessierten an Technologie und Sprachen vielfältige Möglichkeiten für ihre Arbeit.
7Projekt Gutenberg
Project Gutenberg ist ein Verzeichnis gemeinfreier Romane, Aufsätze und anderer Werke. Die Sammlung von über 54.000 E-Books umfasst bekannte Werke von Autoren wie Shakespeare, Mark Twain und Jane Austen ebenso wie weniger bekannte Texte von weniger bekannten Schriftstellern wie Henri Bergson und Samuel Butler. Ob man nun einen Klassiker lesen möchte, um belesen zu sein, oder recherchieren will, wie die Menschen im 19. Jahrhundert lebten – Project Gutenberg ist eine hervorragende Ressource.
8. Million Song Dataset
Diese Website bietet einen umfassenden Datensatz mit Audio-Features und Metadaten von rund einer Million populärer Songs. Neben diesem Hauptdatensatz enthält sie zahlreiche weitere Datensätze, die von der Community in verwandten Kategorien wie Coverversionen, Genrebezeichnungen und Songtexten beigesteuert wurden. Musikhistoriker, Hobbyisten und Forscher können die Daten dank dieser Informationen relativ einfach sortieren. Es handelt sich hierbei möglicherweise um den umfangreichsten Datensatz zu diesem Thema im gesamten Internet.
9. Amazonas
Amazon ist allgemein als Online-Händler bekannt, aber wussten Sie auch, dass Amazon kostenlose, öffentliche Datensätze bereitstellt, auf die jeder zugreifen kann, ohne etwas auf seinen Geräten speichern oder herunterladen zu müssen? Die Daten reichen von Wetter-, Weltraum- und meteorologischen Informationen bis hin zu Bildmaterial, das für die Entwicklung von Algorithmen zur Bildverarbeitung genutzt wird. Es gibt also zahlreiche Möglichkeiten für alle, die große Datenmengen bequem analysieren möchten.
10. Open Government Canada
Um mehr Transparenz zu fördern, die Bürgerbeteiligung zu stärken und den Dialog anzuregen, stellt die kanadische Regierung im Rahmen ihrer Initiative für offene Regierungsführung umfangreiche Daten zur Verfügung. Auf dieser Website finden Sie Datensätze zu regierungsrelevanten Themen, beispielsweise zur Auslastung von Obdachlosenunterkünften in Kanada sowie zu regionalen Zahlen zur Beteiligung von Anglophonen und Frankophonen am öffentlichen Dienst. Dank des Zugangs zu solchen Datensätzen sind Sie nicht mehr auf Statistiken anderer angewiesen, um Informationen zu finden.
11. Datenkataloge
Data Catalogs, jetzt Data Portals, bietet Nutzern eine komfortable Plattform zum Durchsuchen offener Datenportale aus aller Welt. Da die Portale von verschiedenen Regierungsstellen, zahlreichen NGOs und sogar der Weltbank geprüft und gepflegt werden, sind die verfügbaren Daten von extrem hoher Qualität. Nutzer können Datenportale durchsuchen oder selbst Daten beisteuern. Für die Forschung ist diese Plattform aufgrund der Vielfalt an Themen und Informationen ein besonders geeigneter Ausgangspunkt für die Informationssuche.
12Data.gov.uk
Data.gov.uk ist eine Website, die es Nutzern ermöglicht, Daten verschiedener öffentlicher Einrichtungen, Ministerien, Kommunen und Behörden zu finden und darauf zuzugreifen. Forscher können hier Informationen zum Wirtschaftsklima für kleine Unternehmen, zum Handel, zu Importen, Industrie und Exporten finden oder sogar Zahlungen von Regierungsbehörden über 25.000 £ untersuchen. Da die Website ausdrücklich darauf hinweist, dass die Daten für Forschungszwecke genutzt werden dürfen, können die hier enthaltenen Informationen Forschern sogar neue Ideen liefern.
13Data.gov
Auf dieser Website stellt die US-Regierung offene Daten in Form von Datensätzen zur Verfügung, auf die die Öffentlichkeit zugreifen kann. Neben den Rohdaten bietet die Website zahlreiche Tools zur Datenvisualisierung sowie zur Entwicklung von Web- und Mobilanwendungen. Die Datenmenge ist enorm und umfasst über 197.000 Datensätze, die von Kreditkartenbeschwerden bis hin zu Daten des staatlichen Studienkreditprogramms reichen. Diese Website bietet vielfältige Möglichkeiten für Innovationen und umfassende Analysen.
14DataSF
DataSF bietet Hunderte von Datensätzen zur Stadt und zum Bezirk San Francisco. Möchten Sie sehen, wofür sich lokale und regionale Lobbyisten einsetzen? Benötigen Sie Kriminalitätsstatistiken? Im Bereich „Showcase“ finden Sie Beispiele für die Nutzung der Daten. Über das Formular können Sie selbst einen Beitrag leisten. Die Website basiert auf offenen Daten und bietet neben einer Akademie und einem Blog zahlreiche weitere Tools. Sie lebt maßgeblich von Zusammenarbeit und Community und ist daher eine wertvolle Ressource für Forschende.
15. DataFerrett
DataFerrett unterscheidet sich von vielen anderen Websites dadurch, dass es weniger ein Datenarchiv oder Verzeichnis als vielmehr ein Werkzeug ist, mit dem Nutzer Daten aus lokalen, bundesstaatlichen und nationalen Quellen durch Datenanalyse und -extraktion anpassen können. Mit diesem Werkzeug lassen sich individuelle und umfassende Tabellen erstellen und dieselben Informationen anschließend in eine Karte oder ein Diagramm umwandeln, ohne dass zusätzliche Software heruntergeladen oder aktiviert werden muss. Noch nie war es so einfach, große Datenmengen zu organisieren und übersichtlich darzustellen.
16. Inforum
Inforum, ein Projekt der University of Maryland, stellt US-amerikanische Wirtschaftsdaten öffentlich zur Verfügung. Zahlreiche US-Regierungsbehörden haben zu dieser Plattform beigetragen, sodass sie mittlerweile Tausende von sogenannten „wirtschaftlichen Zeitreihen“ umfasst. Diese enthalten Zahlen zu Industrieproduktion, Preisindizes, Arbeitsmarktstatistiken und Konjunkturindikatoren. Die Daten sind frei zugänglich und können sowohl mit einem Laptop als auch mit einem Desktop-PC abgerufen werden. Forscher, die die Rohdaten der Wirtschaftsdaten detailliert analysieren möchten, finden in Inforum eine wertvolle Ressource.
17. Europeana
Laut eigenen Angaben umfasst Europeanas Sammlung über 50 Millionen Datensätze. Mithilfe der hier bereitgestellten kuratierten Datensätze finden Forschende die gesuchten Informationen in kürzerer Zeit. Die Datensätze beinhalten Kategorien wie 3D-Modelle, italienische Karten aus dem Ersten Weltkrieg und sogar eine Sammlung von über 20.000 historischen Fotos aus litauischen Museen. Ob für allgemeine historische Recherchen oder als Ausgangspunkt für die Durchsicht der umfangreichen Europeana-Sammlungen – diese Ressource ist hervorragend geeignet.
18The Guardian
Neben der ununterbrochenen Berichterstattung über aktuelle Nachrichten und Ereignisse bietet der Guardian auch einen eigenen Bereich mit Datenanalysen. Die Beiträge reichen von ernsten Themen wie der Wirksamkeit von Wohnungspolitiken im Kampf gegen Obdachlosigkeit bis hin zu etwas unterhaltsameren Themen wie der Frage, welches Land die meisten Nobelpreisträger hat. Journalisten und Forscher finden auf dieser Website eine Fülle von Informationen für ihre eigenen Projekte. Mit einer kurzen Suche lassen sich Daten zu nahezu jedem Thema finden.
19Gene Expression Omnibus
Die vom National Center for Biotechnology Information (NCBI) betriebene Gene Expression Omnibus (GEO) ist eine Website mit öffentlich zugänglichen funktionellen Genomikdaten, die den MIAME-Standards (Minimum Information About a Microarray Experiment) entsprechen. Die Website akzeptiert sowohl Array- als auch Sequenzierungsdaten und bietet die notwendigen Werkzeuge zum Auffinden und Herunterladen dieser Informationen. Wer sich für die Genomforschung oder die Suche nach Informationen zu diesem Thema interessiert, findet hier alle benötigten Daten und noch vieles mehr.
20Die Universität von Chicago
Das Center for Spatial Data Science (CSDS) der Universität Chicago, das seit Langem für seine Beiträge zu Innovation und Fortschritt in den Sozialwissenschaften bekannt ist, erschließt mit seinen Forschungen im Bereich räumlicher Analysen und Technologien neue Wege. Die Arbeit des CSDS findet Anwendung in nahezu allen Bereichen, die sich mit räumlichen Aspekten auseinandersetzen müssen. So haben beispielsweise Umweltökonomie, öffentliche Gesundheit und Kriminologie von diesen Anwendungen profitiert. Durch das Engagement des CSDS für Open-Source-Software und die Verbreitung seiner Informationen werden die bereitgestellten Daten noch zugänglicher.
21. Konect
KONECT (Koblenz Network Collection) nutzt Daten des Instituts für Webwissenschaft und -technologien der Universität Koblenz-Landau und bietet Forschungsergebnisse aus dem Bereich der Netzwerkforschung und verwandter Gebiete. Das Projekt verwendet eigene Software-Tools zur Netzwerkanalyse, um Daten auszuwerten und Grafiken sowie Algorithmen zu erstellen. Die Ergebnisse der Analysen werden direkt auf der Website von KONECT veröffentlicht. Mit über 200 Datensätzen ist diese Ressource definitiv einen Besuch wert.
22.MIdata
MIdata ist eine Website, die als Datenrepository für maschinelles Lernen dient. Die Datensätze reichen von Sammlungen menschlicher Gesichtsausdrücke bis hin zu wissenschaftlichen Themen wie der Vorhersage von Molekülbindungen. Die Einträge sind in Kategorien unterteilt und bieten Zugriff auf Rohdaten, Tutorials im Abschnitt „Material und Methoden“ sowie Lernaufgaben und Herausforderungen. So können Forschende die Datenbank gezielt nach relevanten Datensätzen durchsuchen.
23NASDAQ
Die NASDAQ ist eine weltbekannte Börse und seit Langem eine hervorragende Quelle für Journalisten und Forscher, die Daten aus der Finanz- und Wirtschaftswelt suchen. Hier finden Sie Informationen zu Börsengängen (IPOs), historische Kursdaten und aktuelle Finanznachrichten, die diese Website zu einer zentralen Anlaufstelle für Finanzdaten im Internet machen. NASDAQ Composite bietet darüber hinaus kostenpflichtige Datenoptionen für alle, die eine tiefergehende Analyse wünschen. Es handelt sich um eine hoch angesehene und etablierte Informationsquelle.
24NASA
Seit der Mondlandung ist die NASA und ihre Weltraummissionen mittlerweile allgemein bekannt. Für Journalisten ist jedoch besonders interessant, dass die NASA mit ihrem Space Science Data Coordinated Archive (SSDC) auch eine wertvolle Datenquelle darstellt. Hier finden Forscher Daten zu Weltraummissionen in Kategorien wie Astrophysik, Bildressourcen und Heliophysik. Zusätzlich stehen auf der Website zahlreiche Whitepapers zu den neuen Daten zur Verfügung.
25Sokrata
Socrata ist eine Website, die verfügbare Regierungsdaten in einem Format aufbereitet, das die Analyse, das Navigieren und das Auffinden der gesuchten Informationen erleichtert. Speziell für die Bedürfnisse von technisch weniger versierten Nutzern wie Politikexperten, Forschern, Unternehmern und engagierten Bürgern entwickelt, nutzt Socrata die Cloud, um Daten aus verschiedenen Quellen zusammenzuführen. Für Journalisten, die die Wirksamkeit unterschiedlicher politischer Maßnahmen untersuchen möchten, ist dies eine hilfreiche Plattform.
26. Quandl
Quandle ist eine Website, die vorwiegend Wirtschafts- und Finanzdaten aufbereitet und speziell auf die Bedürfnisse von Investmentexperten zugeschnitten hat. Die Daten stammen aus über 500 Informationsquellen von renommierten Organisationen wie der CLS Group, den Vereinten Nationen, Zentralbanken und Zacks und eignen sich daher ideal für Forscher und Journalisten, die sich schnell einen Überblick verschaffen möchten. Dank des Excel-Add-ins ist der direkte Datenzugriff für Nutzer so einfach wie nie zuvor.
27. Carnegie Mellon Universität
Die Carnegie Mellon University genießt einen wohlverdienten Ruf als exzellente akademische Einrichtung. Weniger bekannt ist jedoch, dass das StatLab der Carnegie Mellon University eine wertvolle Ressource für Journalisten auf der Suche nach Daten darstellt. Dieses Datenarchiv enthält unter anderem Daten zu den Gehältern nordamerikanischer MLB-Spieler im Jahr 1986 sowie Daten, die zur Überprüfung der Genauigkeit von Statistiksoftware dienen. Gegen Nennung der Quelle stehen diese Datensätze der Öffentlichkeit zur Verfügung.
28. UCI
Das UC Irvine Machine Learning Repository (UCI) ist eine Website mit einer Fülle interessanter Daten, die Journalisten nutzen können. Die Website umfasst aktuell 394 Datensätze und zeichnet sich durch eine benutzerfreundliche Suchoberfläche aus. Zu den beliebtesten Datensätzen gehören Informationen zu Themen wie „Erkennung menschlicher Aktivitäten mithilfe von Smartphones“, Wein und Bankmarketing. Für die Nutzung dieser Daten wird lediglich um eine Quellenangabe gebeten.
29. UCR
Journalisten, die sich mit der Entwicklung von maschinellem Lernen beschäftigen, finden auf der UCR-Seite zur Zeitreihenklassifizierung und -clusterung wertvolle Informationen. Die Website bietet ein hilfreiches Dokument mit allen notwendigen Hintergrundinformationen. Neben einer Übersicht über die Inhalte können die Daten auch direkt heruntergeladen werden. Bitte beachten Sie, dass Sie beim Verwenden dieser Datensätze das von der Website vorgegebene Zitierformat verwenden müssen.
30. US-Volkszählung
Benötigen Sie Statistiken zum Wohlstand der Bevölkerung? Möchten Sie die genaue Geschlechterverteilung in einem bestimmten Berufsfeld erfahren? Die Website des US Census Bureau stellt all diese und weitere Daten öffentlich zur Verfügung. Sortieren Sie die Daten nach Jahr oder Region, und Sie finden schnell Statistiken, deren genaue Erfassung im US Census Bureau den meisten Menschen gar nicht bewusst war. Diese Zahlen stehen auch in Excel- und Microsoft Word-Formaten zur Verfügung, was den Zugriff für Journalisten zusätzlich erleichtert.
31. Wolfram Alpha
Wolfram Alpha ist eine Rechenmaschine, die es Nutzern ermöglicht, die gewünschten Daten einzugeben und Berechnungen zu erhalten. Sie bietet unter anderem statistische Datenanalysen, chemische Berechnungen, Datums- und Zeitangaben sowie Wort- und Sprachanalysen. Für Nutzer, die neue Wege der Datenverarbeitung entdecken möchten, ist sie besonders nützlich, da sie auf Knopfdruck neue Berechnungen liefert. Journalisten können insbesondere von der Nutzung als ergänzende Ressource profitieren.
32. Jaulen
Yelp ist weit mehr als nur eine Plattform für Restaurant- und Unternehmensbewertungen. Das nutzergenerierte Bewertungsportal verwaltet auch einen Datensatz, der Forschern Zugang zu Bewertungen, Nutzerdaten und Unternehmen für „persönliche, Bildungs- und akademische Zwecke“ ermöglicht. Laut Unternehmensangaben umfasst der Datensatz 4,7 Millionen Bewertungen und 156.000 Unternehmen in zwölf Metropolregionen. Angesichts dieser Zahlen könnten die Erkenntnisse und Trends, die Forscher in diesen Daten gewinnen, durchaus positiv überraschen.
33. Datenwelt
Sie möchten eine Liste gelöschter Facebook-Seiten? Oder US-Wirtschaftsdaten nach Landkreisen sortieren? Data World ist eine Plattform, die es Nutzern ermöglicht, Daten zu teilen, zu hosten, gemeinsam zu bearbeiten und zu verwalten. Die Seite bietet sogar einen Bereich für Journalisten, der die Vorteile von Data World für Berufsangehörige erläutert und neben Hosting-Funktionen auch einen optimierten FOIA-Predictor sowie Hilfestellungen zur Datenorganisation vorstellt. Kurzum: eine gelungene Kombination aus Daten und Datenhosting.
34. Das World Factbook
Das von der CIA betriebene World Factbook bietet Informationen zu Gesellschaftsstrukturen, Geschichte, Militär und Wirtschaft von 267 Ländern, ergänzt durch Karten, Flaggen und eine Zeitzonenübersicht. Die Website bietet einen umfassenden und detaillierten Einblick in das Thema, der weit über die Grundlagen hinausgeht. Kurz gesagt: Diese Datenquelle sollte in keiner journalistischen Ausrüstung fehlen.
35. HealthData.gov
HealthData.gov, betrieben vom US-Gesundheitsministerium, bietet der Öffentlichkeit Zugang zu hochwertigen Gesundheitsdaten und möchte damit das Interesse von Unternehmern, politischen Entscheidungsträgern und Forschern wecken. Insbesondere im Bereich der Produkt- und Dienstleistungsentwicklung konnten Nutzer diese Daten bereits analysieren und daraus Erkenntnisse gewinnen. Journalisten, die sich über aktuelle Gesundheitsdaten informieren oder Aussagen von Gesundheitsexperten überprüfen möchten, finden auf dieser Website Antworten.
36. UNICEF
Diese Website verleiht Journalisten, die die hier angebotenen Informationen nutzen, sofort Glaubwürdigkeit. Die von UNICEF erfassten Statistiken umfassen unter anderem Daten zu Gesundheit und Menschenrechten wie Bildung, Müttergesundheit, Kinderarmut, Wasser und Sanitärversorgung sowie Kinderbehinderung. Sie ist für Forscher wertvoll, da sie stets aktuell ist und von einer der bekanntesten Organisationen der Welt unterstützt wird. Journalisten können mit dieser Datenquelle nichts falsch machen.
37. Weltgesundheitsorganisation
Die Weltgesundheitsorganisation (WHO) ist eine internationale Organisation, die weltweit Gesundheitsstatistiken und -informationen sammelt. Neben den Informationen auf der Startseite bietet die Website auch Daten über das Globale Gesundheitsobservatorium. Diese Daten umfassen unter anderem Informationen zu den Maßnahmen, die Länder für eine allgemeine Gesundheitsversorgung ergreifen, sowie zu Gesundheitsforschung und -entwicklung. Journalisten finden hier zahlreiche Informationen zu Krankheitsausbrüchen, Gesundheitsnotständen und der Gesundheitsversorgung aus internationaler Perspektive.
38. Google Public Data
Dank der Verfügbarkeit von Google Public Data können Journalisten Google in vielerlei Hinsicht nutzen. Der Suchmaschinenriese stellt über 100 öffentliche Datensätze zur Analyse bereit. Die Daten reichen von hochsensiblen Themen wie Weltentwicklungsindikatoren und Indikatoren für menschliche Entwicklung bis hin zu interessanten Informationen wie den gefährlichsten Straßen Europas. Forscher müssen lediglich eine Suche durchführen und die Ergebnisse von Google Public Data einsehen.
39. Lückenbewahrer
Gap Minder bietet Daten zu einer Reihe lokaler und nationaler Indikatoren sowie Links und Informationen zu allen Datenanbietern. Forscher können über diese Website beispielsweise Informationen zum Heiratsalter von Frauen, Statistiken zum Alkoholkonsum und Todesursachen bei Kindern einsehen. Für Journalisten mit internationalem Fokus oder die vergleichende Datenanalyse ist dies eine hervorragende Ressource. Unabhängig davon ist es eine nützliche Datenquelle.
40. Google Trends
Google Trends ist ein Tool, das Forschern Einblicke in die aktuellen Suchanfragen der Nutzer gibt. Sie können die Daten mit vergangenen Trends vergleichen und das Tool auch nutzen, um beispielsweise für die Feiertage Prognosen zu erstellen und so die zukünftige Entwicklung der Suchanfragen vorherzusagen. Google Trends bietet Grafiken, Trendthemen und zahlreiche Möglichkeiten, Neuigkeiten zu entdecken, bevor sie offiziell veröffentlicht werden.
41. Google Finance
Google Finance bietet eine schnelle und einfache Möglichkeit, detailliertere Recherchen zu Unternehmen durchzuführen, die bei Anlegern für Begeisterung sorgen. Technische Indikatoren lassen sich einfach filtern, und die neuesten Unternehmensnachrichten können in einem übersichtlichen Fenster abgerufen werden, das eine noch präzisere Sortierung der Informationen ermöglicht. Zudem ist der Dienst kostenlos. Journalisten, die die Finanzen eines börsennotierten Unternehmens recherchieren möchten, finden in Google Finance eine intuitive Benutzeroberfläche für den Zugriff auf diese Informationen. Leider hat Google kürzlich einige Kernfunktionen, wie beispielsweise das Finanzportfolio, eingestellt. Hier sind einige
Alternativen zu Google Finance.
42. DBpedia
Wer sich schon immer eine einfachere Möglichkeit gewünscht hat, Wikipedia-Suchen durchzuführen, wird von DBpedia begeistert sein. Dank des Engagements der Community ermöglicht diese Website komplexere Suchvorgänge in Wikipedia-Inhalten. Mit 4,58 Millionen Einträgen inklusive Klassifizierungen und Kategorien in der englischen Version ist die Seite auf dem besten Weg, eine umfassende Abdeckung der Wikipedia-Informationen zu bieten. Journalisten können mit dieser Datenquelle nichts falsch machen.
43. Pew Research
Für viele zählt Pew Research zu den führenden Institutionen für Umfragen, Berichte und Forschungsdaten. Die Website deckt ein breites Themenspektrum ab, von politischen Meinungen über gesellschaftliche Trends bis hin zu Entwicklungen in verschiedenen Branchen. Dank der Suchfunktion von Pew Research ist der Zugriff auf Informationen so einfach wie nie zuvor. Journalisten, die aktuelle Statistiken und Erkenntnisse aus einer vertrauenswürdigen und renommierten Quelle benötigen, sind bei Pew Research genau richtig.
44. Broad Institute
Für Journalisten, die sich über aktuelle Entwicklungen im Bereich Krebs informieren möchten, sind die Datensätze des Broad Institute eine ideale Informationsquelle. Sie umfassen auch Informationen zu weiteren Themen wie Bioinformatik und Computerbiologie sowie zu Hirntumoren und der Entdeckung molekularer Muster. Kurz gesagt: Diese Website bietet Journalisten einen entscheidenden Vorteil beim Zugriff auf detaillierte Krebsdaten, die sie für ihre Berichterstattung nutzen können.
45. UNdata
UNdata bietet Informationen zu verschiedenen Ländern weltweit. Dazu gehören Daten wie technische, soziale und wirtschaftliche Indikatoren für jedes Land. Für Journalisten, die über Reportagen mit menschlichem Bezug oder Geschichten berichten, die von zusätzlichen Statistiken und Daten profitieren würden, ist UNdata die ideale Wahl. Die Genauigkeit der Daten und der gute Ruf der Vereinten Nationen machen UNdata zu einer verlässlichen Datenquelle für Journalisten.
46. Google Scholar
Stellen Sie sich vor, anstatt Webseiten zu durchforsten, könnten Sie eine Suche starten, die ausschließlich begutachtete Artikel und wissenschaftliche Materialien anzeigt. Google Scholar ermöglicht es, Zeitschriftenartikel, Whitepaper und Publikationen führender Wissenschaftler weltweit zu finden. Wie von diesem Unternehmen gewohnt, ist Google Scholar äußerst intuitiv: Nutzer müssen lediglich ein Stichwort eingeben, um loszulegen. Die Suche nach wissenschaftlichen Artikeln war noch nie so einfach.
47. Reddit
Reddit, oft auch als „Startseite des Internets“ bezeichnet, ist eine der beliebtesten Websites im Internet. Neben seiner Fähigkeit, ein genaues Bild der Online-Aktivitäten zu zeichnen, bietet die Seite auch ein Subreddit (Unterforum) speziell für Datensätze. Nutzer können dort Datensätze anfordern, Ressourcen veröffentlichen und sich über die Arbeit mit Daten in Formaten wie JSON austauschen. Forscher profitieren enorm von dieser Datenquelle.
48. Datenmarkt
Qlik DataMarket ermöglicht es Ihnen, Daten aus externen Quellen zu sammeln und zu verarbeiten. Die Plattform erlaubt es Nutzern, auf verschiedene Datensätze zuzugreifen und diese mit ihren bereits vorhandenen Daten abzugleichen, um einen umfassenderen Überblick zu erhalten. Obwohl die Plattform je nach Themengebiet kostenpflichtig ist, bietet Qlik DataMarket auch eine kostenlose Version an. Journalisten können die Daten nach Herzenslust analysieren.
49. Hubspot
HubSpot gilt seit jeher als Meinungsführer in der Marketingwelt. Für Forschungszwecke ist die Plattform eine hervorragende Informationsquelle, die Forschern alle aktuellen Entwicklungen in der Branche sowie die Themen, über die Marketingexperten gerade sprechen, in Echtzeit liefert. Auch Journalisten können die Seite nutzen, um sich über Trends zu informieren. Kurz gesagt: HubSpot ist eine wertvolle Ressource für Forscher.
50. Statistikbüro des Justizministeriums
Es überrascht wohl kaum, dass das Justizministerium unzählige Statistiken führt. Auf der Website des Ministeriums finden sich Zahlen zu Verhaftungen, Todesfällen von Gefangenen, Hinrichtungen, Statistiken zur Strafverfolgung und Gefängnisbelegung. Das Strafrechtssystem fasziniert die Öffentlichkeit und die damit befassten Personen gleichermaßen. Daher sind die Statistiken des Justizministeriums besonders wertvoll für Journalisten, die zum Strafrechtssystem recherchieren.
51. Einheitlicher Kriminalitätsbericht
Der Uniform Crime Report (UCR) ist eine Sammlung von Statistiken zu Eigentums- und Gewaltdelikten, die vom FBI erhoben werden. Obwohl Strafverfolgungsbehörden in den gesamten USA diese Daten bereits seit 1930 melden, wurden die Ergebnisse ab 1958 veröffentlicht und können online recherchiert werden. Journalisten, die die Kriminalitätsdaten analysieren möchten, können das UCR-Datentool nutzen, um die auf dieser Website verfügbaren Informationen zu durchsuchen.
52. Einheitliche Kriminalitätsberichterstattung
Das Programm „Uniform Crime Reporting“ (UCR) wurde 1929 von der International Association of Chiefs of Police (IACP) ins Leben gerufen. Die vom FBI erhobenen Daten werden viermal jährlich veröffentlicht. Neben den UCR-Informationen bietet die Website auch Berichte zu Hassverbrechen, zu getöteten und angegriffenen Polizeibeamten (LEOKA) sowie Ergebnisse und Zahlen des National Incident-Based Reporting System (NIBS).
53. NACJD
Das NACJD (National Archive of Criminal Justice Data) ist eine Website, die Informationen aus Datensätzen wie den Uniform Crime Reports (UCR) und der National Crime Victimization Survey (NCVS) bezieht, speichert und die Statistiken bereitstellt. Die Daten sind so konzipiert, dass sie kuratiert, gespeichert und gepflegt werden, um optimale Zugänglichkeit zu gewährleisten. Sie liegen in verschiedenen Formaten vor, darunter experimentelle, qualitative und longitudinale Daten. Journalisten und anderen Forschern bietet das NACJD eine weitere Möglichkeit, Statistiken zur Strafjustiz zu visualisieren und darauf zuzugreifen.
54. Erste Datenbank
First Databank ist eine Website für Arzneimitteldaten. Ziel der Website ist es, effizientere und datengestützte Entscheidungen im pharmazeutischen Bereich zu fördern. Ärzte und Kliniker können so mithilfe der innovativen Technologie von First Databank Arzneimittel aus einer neuen Perspektive betrachten. Aus professioneller Sicht ist die Website besonders nützlich, da die Daten Teams helfen, sich an neue Erkenntnisse anzupassen. Auch für Journalisten, die über Pharmazeutika berichten, ist sie eine wertvolle Ressource.
55. FDA
Die FDA (Food and Drug Administration) ist die Behörde, die für den Schutz der öffentlichen Gesundheit durch die Überwachung und Zulassung von Arzneimitteln, Lebensmitteln, Nahrungsergänzungsmitteln, Impfstoffen, Kosmetika und anderen Konsumgütern zuständig ist. Die FDA stellt Datensätze zur Verfügung, die öffentlich eingesehen werden können, und bietet darüber hinaus technische Daten für diejenigen an, die mit Tabellenkalkulationen vertraut sind und die Informationen aus den Datensätzen analysieren können. Dies ist insbesondere für Journalisten eine wertvolle Ressource.
56. Drugbase
Haben Sie sich jemals gefragt, wie viel das Land im Zuge einer Drogenepidemie genau ausgibt? Gibt es Gerüchte, dass sich der Drogenkonsum verändert hat? Drugbase bietet eine Datenbank mit zahlreichen Statistiken zu Trends und Konsumverhalten in den USA. Neben Infografiken finden Sie dort auch Publikationen zu Themen wie der Komorbidität von Sucht und psychischen Erkrankungen oder Fakten zu Drogen- (nicht Alkohol-)Fahren. Diese Ressource liefert ausreichend Informationen, um Trends zu erkennen und Vergleiche mit früheren Daten anzustellen.
57. UNODC
Das UNODC (Büro der Vereinten Nationen für Drogen- und Verbrechensbekämpfung) betreibt eine Website, die sich der Förderung seines Ziels widmet, Mitgliedstaaten bei der Einführung strengerer Standards in Forschung, Datenerhebung und forensischer Diagnostik zu unterstützen. Auf dieser Website finden Forschende zahlreiche Statistiken und Publikationen zu Themen wie Datenerhebung, Trendanalyse und – soweit möglich – Forschungsprogrammen. Sie bietet eine umfassende Informationsquelle zu einer Vielzahl forensischer Themen sowie zu den wissenschaftlichen Grundlagen des Fachgebiets.
58. Fakten zum Drogenkrieg
Drug War Facts ist eine Website, die sich ausführlich mit dem Krieg gegen Drogen und seinen Folgen auseinandersetzt. Sie bietet Statistiken und Zahlen zu Details wie Kostenvergleichen zwischen Behandlungskosten und den Kosten polizeilicher Maßnahmen, Schätzungen der Ausgaben für die Drogenbekämpfung und eine Fülle von Informationen zu nahezu allen Aspekten des Krieges gegen Drogen. Für viele ist dies die umfassendste Website im Internet zum Thema Krieg gegen Drogen.
59. Nationales Zentrum für Bildungsstatistik
Das Nationale Zentrum für Bildungsstatistik (NCES) ist die zentrale Anlaufstelle für alle Statistiken rund um das Thema Bildung. Die Website bietet Statistiken zum Stand der Studienkredite, Prognosen zu Bildungstrends sowie Datensätze und Vergleichstools für weiterführende Analysen. Journalisten können diese Ressource nutzen, um Trends aufzudecken, öffentliche Aussagen zu überprüfen, Veröffentlichungen des NCES einzusehen und neue Geschichten in den Daten zu entdecken.
60. Weltbank
Die Weltbank stellt zahlreiche Statistiken und Daten bereit, die von der Development Data Group im Finanzsektor und in der Makroökonomie zusammengestellt werden. Die Daten lassen sich mithilfe von Hashtags filtern. Nutzer können aus verschiedenen Indikatoren wählen und nach Ländern filtern, um die unterschiedlichen Messgrößen des Entwicklungsfortschritts zu analysieren. Somit ist diese Ressource für alle, die sich mit der Finanz- und/oder Wirtschaftslage der Mitgliedsländer befassen, von großem Nutzen.
61. Statistikamt des US-Arbeitsministeriums
Das Bureau of Labor Statistics (BLS) ist für Journalisten eine unverzichtbare Quelle für Zahlen und Statistiken zu aktuellen Arbeitsbedingungen, Entwicklungen auf dem Arbeitsmarkt sowie Preisänderungen und deren Auswirkungen auf die US-Wirtschaft. Da die statistische Arbeit der Behörde bis ins Jahr 1884 zurückreicht, bietet sie Forschern eine Fülle an Wirtschaftsdaten. Die Website präsentiert die Informationen in einer benutzerfreundlichen Oberfläche und aktualisiert die verfügbaren Daten fortlaufend. Diese Datenquelle ist definitiv einen Blick wert.
62. Die Zahlen
Blockbuster-Veröffentlichungen erhalten viel mediale Aufmerksamkeit, doch ohne Zahlen lässt sich der tatsächliche Erfolg eines Unternehmens nur schwer beurteilen. Hier kommt „The Numbers“ ins Spiel. Diese Website bietet Recherchen und Daten für die Film- und Unterhaltungsbranche. Forscher können Umsatzprognosen, Erwartungen für kommende Veröffentlichungen und weitere Investitionsdaten mithilfe der SQL-basierten Suchmaschine von OpusData analysieren. „The Numbers“ ist die erste Anlaufstelle für Forscher, die verlässliche Statistiken zu Filmen suchen. Das macht die Website zu einer exzellenten Ressource.
63. Film Forever
Film Forever ist eine Website, die Forschern Marktinformationen und Daten zur britischen Filmindustrie bietet. Nutzer finden hier wöchentliche Einspielergebnisse der 15 erfolgreichsten britischen Filme, Publikumsforschung, Berichte, Fallstudien und das Flaggschiff der Organisation, das Statistische Jahrbuch. Zusätzlich bietet die Website einen Kalender, der die Besucher über die Veröffentlichung der nächsten Statistiken informiert. Film Forevers Spezialisierung macht die Plattform zu einer besonders wertvollen Datenquelle.
64. IFPI
IFPI ist eine Website, die sich selbst als besonders nah am Puls der weltweiten Musikindustrie versteht. Nutzer finden hier veröffentlichte Berichte mit umfassenden Einblicken in die Welt der Musikaufnahmen, nationale und internationale Verkaufszahlen sowie Analysen der wirtschaftlichen Aspekte der Musikindustrie, die aufzeigen, wie Unternehmen in Musik investieren. Diese Berichte ermöglichen es Nutzern, die aktuellen Entwicklungen zu verfolgen. Die Website hält Forscher in Echtzeit über die Geschehnisse in der Musikindustrie auf dem Laufenden.
65. Statista
Statista ist eine Suchmaschine ähnlich wie Google, liefert aber anstelle von Webseiten Daten und Statistiken. Mit einem Klick erhalten Nutzer sofortigen Zugriff auf über eine Million Statistiken und Fakten. Sie finden Infografiken, Statistiken zu China, der Lebensmittelindustrie und Konsummärkten. Gegen Gebühr sind auch Dossiers und Branchenberichte verfügbar. Ob Informationen zur Wirtschaft, zu sozialen Medien oder zum Big Mac – hier werden Sie fündig.
66. EPA
Die EPA (Employment Protection Agency), die US-amerikanische Umweltbehörde, ist für den Schutz von Mensch und Umwelt zuständig. Sie setzt die vom Kongress erlassenen Gesetze durch. Auf der Website der EPA finden Nutzer zahlreiche Datensätze zu Themen von der Landwirtschaft bis hin zu spezifischen Fragestellungen wie jährlichen Freisetzungen giftiger Chemikalien und Abfallmanagementmethoden. Die Website ist besonders für Journalisten geeignet, die auf Rohdaten zum Thema Umwelt zugreifen möchten.
67. Zentren für Krankheitskontrolle und -prävention
Diese Website der US-amerikanischen Zentren für Krankheitskontrolle und -prävention (CDC) bezeichnet sich selbst als zentrale Anlaufstelle für Daten zum Thema Umweltgesundheit. Forschende finden hier Verweise und Listen zu Datensystemen, die nationale Fördermittel erhalten und Informationen zu umweltbezogenen Gesundheitsthemen erfassen und speichern. Mit dem Fokus auf nationale Programme und der Möglichkeit zum direkten Download ist diese Website eine verlässliche Quelle für aktuelle und präzise Informationen im Internet.
68. Nationale Zentren für Umweltgesundheit
Die National Centers for Environmental Health (NCEH), entstanden aus dem Zusammenschluss dreier ehemals unabhängiger Behörden, sind die zentrale Anlaufstelle für hochwertige Umweltinformationen. Mit umfassenden Daten, die von Ozeandaten bis hin zu Millionen Jahre alten Eisarchiven reichen, bietet diese Website mit hoher Wahrscheinlichkeit Informationen zu allen Umweltthemen. Das Engagement der NCEH für Genauigkeit und Exzellenz bei der Pflege eines der größten Archive seiner Art macht sie zudem zu einer der wenigen Online-Plattformen, die diese Art von Daten besitzen, aktualisieren und pflegen.
69. Nationaler Wetterdienst
Der Nationale Wetterdienst der Nationalen Ozean- und Atmosphärenbehörde (NOAA) stellt Forschern alle relevanten Wetterinformationen zur Verfügung. Die Website bietet Suchfunktionen mit Informationen zu Kategorien wie Warnungen und Vorhersagen, Klima, geografischen Vorhersagen und vielem mehr. Zusätzlich verfügt sie über eine intuitive, übersichtliche Karte mit Registerkarten, die per Klick verschiedene Ergebnisse liefern. Ob Sie lokale Ereignisse überprüfen oder die Vorhersage für eine Stadt in einem anderen Bundesstaat suchen – diese Website liefert schnell die benötigten Informationen.
70. Wunderground
Wunderground ist eine Plattform, die sich zum Ziel gesetzt hat, Wetterinformationen weltweit zugänglich zu machen und dabei auch Regionen mit geringer Berichterstattung zu berücksichtigen. Wunderground betont ausdrücklich, Maßnahmen ergriffen zu haben, um eine optimale Nutzererfahrung auf verschiedenen digitalen Plattformen zu gewährleisten. Die Website ist sowohl mobil als auch über PCs erreichbar und somit eine ideale Ressource für Journalisten, die viel unterwegs sind.
71. Wetterbasis
Weatherbase bietet mit einer einfachen Suchleiste Informationen zu aktuellen Wetterbedingungen, Durchschnittswerten, Klimadaten und Reisehinweisen für über 40.000 Städte weltweit. Auf der verlinkten Partnerseite finden Sie weitere Reiseinformationen wie Währungsrechner, Koordinaten, Informationen zu Landkreisen und vieles mehr. Mit Weatherbase können Sie auch Urlaubsziele allein anhand der Wettervorhersage finden. Viel Spaß beim Stöbern!
72. Energieatlas
Der von der Internationalen Energieagentur (IEA) herausgegebene Energieatlas bietet Forschern die Möglichkeit, die Welt anhand von Energiestatistiken zu betrachten. Ursprünglich als ergänzende Datenquelle konzipiert, verfügt die Website über eine animierte Sankey-Fluss-Energiebilanz sowie mehrere Datenbanken, die die auf der Statistikseite der IEA verfügbaren Publikationen ergänzen. Forscher werden sowohl diese Website als auch ihre Begleitseiten als äußerst hilfreich empfinden, wenn sie die Energienutzung von Ländern und Städten untersuchen.
73. Büro für Wirtschaftsanalyse
Das Bureau of Economic Analysis (BEA) veröffentlicht eine Vielzahl nützlicher Informationen, die es Forschern ermöglichen, die US-Wirtschaftslage stets im Blick zu behalten. Auf dieser Website finden sich Daten zu US-Wirtschaftskennzahlen, darunter Informationen zu Konsumausgaben, BIP und Anlagevermögen sowie weitere relevante Daten. Forscher können nach Region, Branche oder Ebene suchen – mit internationalen, nationalen und regionalen Suchoptionen. Auf der interaktiven Datenseite erfahren Sie mehr über das BEA.
74. Nationales Büro für Wirtschaftsforschung
Die Website des National Bureau of Economic Research (NBER) ist eine Datenquelle, die sich der Wirtschaftswissenschaft aus analytischer Perspektive nähert. Sie bietet Daten zu einer Vielzahl wirtschaftlicher Themen, darunter der Index für afrikanische Regierungsführung, der offizielle Konjunkturzyklus, experimentelle Konjunktur-, Früh- und Rezessionsindizes sowie die Datenbank zur Makroökonomiegeschichte. Das NBER veröffentlicht und kompiliert eigene Datensätze und bietet darüber hinaus Indizes anderer Herausgeber an.
75. US-Börsenaufsichtsbehörde
Die US-amerikanische Börsenaufsichtsbehörde (Securities and Exchange Commission, SEC) fungiert als eine Art Kontrollinstanz, die Transparenz, Fairness und Effizienz an den Finanzmärkten fördert. Interessanterweise bietet die Website einen Datensatz mit Finanzberichten von Januar 2009 bis Oktober 2017, der vierteljährlich aktualisiert wird. Forscher können diese Website nutzen, um stets über aktuelle Meldungen und die daraus gewonnenen Informationen zu Unternehmen und deren Finanzlage informiert zu sein.
76. IWF
Der Internationale Währungsfonds (IWF) ist eine etablierte Organisation im internationalen Wirtschafts- und Finanzsektor. Auf seiner Website finden Forschende zahlreiche Daten zu diesen Themen. Sie können Datensätze nach Indikator und Land durchsuchen und Diagramme und Karten während ihrer Recherche nutzen. Zu den beliebten Datensätzen gehören unter anderem Handelsentwicklungen, Rohstoffpreise, Indikatoren für die Finanzstabilität, Umfragen und Statistiken zur internationalen Finanzwirtschaft.
77. Der Atlas – Harvard
Der ursprünglich von Harvard entwickelte Atlas ist ein Online-Tool, mit dem Nutzer die Handelssituation eines Unternehmens visualisieren und interaktiv analysieren können. Anschließend schlägt der Atlas anhand dieser Informationen verschiedene Produkte vor, die das Land möglicherweise herstellen könnte, um seine Wirtschaft zu stärken. Dieses Tool wird von politischen Entscheidungsträgern, Geschäftsleuten, Investoren und engagierten Bürgern genutzt, die sich ein besseres Verständnis des wirtschaftlichen Klimas eines Landes verschaffen möchten. Fragen zum Handel und zur Volkswirtschaft waren noch nie so leicht zugänglich.
78. Geschäftstätigkeit
Doing Business ist das Ergebnis von Bemühungen um eine objektive Bewertung von Unternehmensregulierungen. Die Website untersucht fast 200 Volkswirtschaften und zahlreiche Städte anhand von Wirtschaftsindikatoren und erstellt ein Ranking der Rahmenbedingungen für Unternehmen. Nutzer können die Auswirkungen verschiedener Arten von Unternehmensregulierungen in unterschiedlichen Ländern vergleichen. Die Website bietet Berichte und umfangreiche qualitative Daten und ermöglicht zudem Vergleiche über verschiedene Zeiträume.
79. Comtrade
Comtrade, ursprünglich ein Projekt des britischen Ministeriums für Wirtschaft, Energie und Industriestrategie in Zusammenarbeit mit dem Ministerium für Internationalen Handel, ist eine hervorragende Informationsquelle. Die Website nutzt Daten der UN-Datenbank Comtrade und bietet Nutzern ein interaktives Diagramm, mit dem sie die genauen Zahlen zum Handel und Warenverkehr zwischen Ländern suchen, vergleichen und analysieren können. Wählen Sie einfach das Berichtsland, ein Partnerland und so viele weitere Optionen wie möglich aus.
80. Globale Finanzdaten
Global Financial Data ist eine Quelle, die nicht nur Standard-Finanzdaten zusammenstellt, sondern Finanzinformationen vom 13. Jahrhundert bis heute umfasst. Diese Informationen stammen aus verschiedenen Quellen, darunter Bücher, Archivmaterialien, Fachzeitschriften und Nachrichtenmagazine. Darüber hinaus bietet die Website Datensätze, die auf der statistischen Methode der Kettenverknüpfung basieren. Das Ergebnis ist für den Nutzer eine einzigartige Ressource im Internet, die sich durch ihre exklusiven Daten auszeichnet.
81. Visualisierung der Wirtschaftswissenschaften
Visualizing Economics ist weniger eine Ressource zur Datenrecherche im eigentlichen Sinne, sondern vielmehr ein Service, der sich auf die Gestaltung von Infografiken und interaktiven Dashboards spezialisiert hat. Darüber hinaus bietet Visualizing Economics Analysen und Designs mit dem Ziel an, Wirtschaftsdaten verständlicher zu machen. Über diese Website erhalten Journalisten die Möglichkeit, mit einem Experten zusammenzuarbeiten, der über jahrelange Erfahrung in der Aufbereitung von Wirtschaftsdaten für die breite Öffentlichkeit verfügt.
82. EU-Portal für offene Daten
Das EU-Open-Data-Portal ist ein Projekt, das nach einer Entscheidung der Europäischen Kommission ins Leben gerufen wurde. Auf dieser Website stellen EU-Institutionen Daten zur öffentlichen Einsicht und Nutzung ohne Urheberrechtsbeschränkungen und kostenlos zur Verfügung. Zu den Datensätzen gehören die CORDIS-Referenzdaten, das Transparenzregister und eine vollständige Liste der Personen, Organisationen und Gruppen, gegen die die EU finanzielle Sanktionen verhängt hat. Die Daten sind zudem in verschiedenen digitalen Formaten verfügbar.
83. Offene Daten Netzwerk
Das Open Data Network ist eine Website, die es Nutzern ermöglicht, Daten nach Region und Stadt zu suchen. Dank der übersichtlichen und intuitiven Startseite können Forschende nach Datenkategorien, Städten und sogar anhand von Beispielfragen suchen. Auf jeder Seite finden sich nach dem Durchblättern der Datenkategorien oder Beispielfragen praktische Links zu weiteren Datensätzen. Allein die übersichtliche Datenorganisation macht das Open Data Network zu einer Website, die einen Besuch wert ist.
84. Landmatrix
Landmatrix ist eine Website mit einer Online-Datenbank für Grundstücksgeschäfte, die mehr Transparenz bei Grundstückskäufen fördern soll. Mit diesem Tool lassen sich verschiedene Grundstücksgeschäfte visualisieren und analysieren. Die Daten werden kontinuierlich aktualisiert und angepasst, um die Genauigkeit der bereitgestellten Informationen zu verbessern. Aktuell enthält Landmatrix Informationen zu über 1.000 Transaktionen. Für Forscher ist sie eine lohnende Ressource.
85. Entwicklungsprogramm der Vereinten Nationen
Das Entwicklungsprogramm der Vereinten Nationen (UNDP) stellt der Öffentlichkeit zahlreiche nützliche Daten zur menschlichen Entwicklung weltweit zur Verfügung. Die Datensätze umfassen in der Regel den Zeitraum von 1990 bis 2015 und enthalten umfassende Tabellen, beispielsweise zu Trends im Index der menschlichen Entwicklung, im Index der Geschlechterungleichheit und zur geschlechtsspezifischen Lebensverlaufsdifferenz. Forschende können die Daten direkt über die Suchleiste durchsuchen und bei Bedarf auch nach Ländern filtern, um die Diagramme einzusehen.
86. OECD
Die OECD (Organisation für wirtschaftliche Zusammenarbeit und Entwicklung) bietet auf ihrer Website Unterstützung für Regierungen bei Armutsbekämpfungsinitiativen und der Förderung von Wohlstand durch wirtschaftliche Stabilität und Wachstum. Forschende finden dort von Experten begutachtete Materialien, Publikationen sowie Standards und Argumente für deren Festlegung. Die OECD stellt außerdem ein Factbook bereit, das als solides wirtschaftliches Nachschlagewerk dient und zahlreiche Studien und Prognosen zur wirtschaftlichen Entwicklung ergänzt.
87. US-Gesundheitsministerium
Das US-amerikanische Ministerium für Gesundheit und Soziale Dienste betreibt eine Website mit Informationen des Präsidentenrats für Fitness, Sport und Ernährung. Die Website bietet Fakten und Daten, die mit Unterstützung von Experten aus verschiedenen Bereichen wie Köchen und Sportlern zusammengetragen wurden. Darüber hinaus enthält sie zahlreiche Statistiken. Forscher finden dort unter anderem Informationen zur körperlichen Aktivität von Kindern, zu den muskelstärkenden Gewohnheiten von Erwachsenen sowie zu den Ernährungsgewohnheiten der Bevölkerung und zum Thema Übergewicht.
88. Partner beim Informationszugang für das Personal im öffentlichen Gesundheitswesen
„Partners in Information Access for the Public Health Workforce“ ist ein Projekt, das aus der Zusammenarbeit von Organisationen des öffentlichen Gesundheitswesens, US-Regierungsbehörden und auf Gesundheitswissenschaften spezialisierten Bibliotheken entstanden ist. Die Themenseiten dieser Website umfassen unter anderem Fördermittel und Finanzierung, Gesundheitsförderung und -erziehung sowie Literatur und Leitlinien. Im Bereich „Themen der öffentlichen Gesundheit“ finden sich zudem Daten zu Themen wie Bioterrorismus, Genomik im öffentlichen Gesundheitswesen und zahnärztlicher Gesundheitsversorgung, um nur einige zu nennen.
89. United Health Foundation
Seit drei Jahrzehnten stellt die United Health Foundation Informationen zu Gesundheitsrankings bereit, die als Instrument zur Messung der öffentlichen Gesundheit dienen. Die Website bietet zahlreiche Berichte und Publikationen, darunter Berichte zur Gesundheit von Angehörigen der Streitkräfte, Berichte von Führungskräften, Berichte zur Frauen- und Kindergesundheit, Jahresberichte sowie Kurzdarstellungen zu wichtigen Themen des Fachgebiets. Nutzen Sie die interaktive Karte, um regionale Informationen zu erkunden. Für eine detailliertere Navigation steht Ihnen außerdem eine Suchleiste zur Verfügung.
90. Medicare
In den Vereinigten Staaten ist Medicare für viele Menschen die wichtigste Krankenversicherung und der wichtigste Zugang zu medizinischer Versorgung. Neben den Echtzeit-Services bietet Medicare auch Daten zu Standards und Behandlungsqualität in verschiedenen Einrichtungen und Krankenhäusern über eine Vergleichstabelle und -regeln. Dieser offizielle Datensatz wird von der Website „Hospital Compare“ verwendet und kann zur einfacheren Auswertung in Excel heruntergeladen werden.
91. Überwachung, Epidemiologie und Endergebnisse (SEER)
Das Programm „Surveillance, Epidemiology and End Results“ (SEER) bietet eine besonders nützliche Website mit Statistiken zu Krebserkrankungen. Dort finden sich statistische Zusammenfassungen, die die Recherche nach Krebszahlen ermöglichen. Die Daten können nach Krebslokalisation, ethnischer Zugehörigkeit, Hautfarbe, Alter, Geschlecht und sogar nach Datentyp sortiert werden. Die Website stellt außerdem Publikationen, Datensätze und Software für weiterführende Analysen bereit.
92. Amnesty International
Amnesty International setzt sich seit Langem weltweit für Menschenrechte und Gerechtigkeit ein. Die Organisation stellt zudem umfangreiche Daten zum globalen Menschenrechtsstatus sowie Informationen zu konkreten Gräueltaten und Verbrechen gegen die Menschlichkeit in ihrem Jahresbericht bereit. Forschende können diese Informationen nutzen, um Vergleiche zwischen verschiedenen Jahren anzustellen und die Entwicklung – oder auch Rückschritte – der Menschenrechtslage in verschiedenen Ländern zu analysieren.
93. Arbeitsgruppe für Menschenrechtsdatenanalyse
Seit ihrer Gründung vor 25 Jahren wendet die Human Rights Data Analysis Group wissenschaftliche Prinzipien auf Menschenrechtsverletzungen in verschiedenen Ländern weltweit an. Die Website bietet Publikationen, die in renommierten Medien wie der Washington Post erschienen sind, sowie offizielle Veröffentlichungen des Macmillan-Verlags, sortiert nach Jahr. Neben diesen umfangreichen Publikationen gab es auch Projekte, die weltweit durchgeführt wurden. Für einen tieferen Einblick in Menschenrechtsverletzungen ist diese Website eine hervorragende Anlaufstelle.
94. Internationale Beziehungen und Menschenrechtsdaten
Diese Website beherbergt Datenbanken, die von zahlreichen renommierten Organisationen, Universitäten und sogar Regierungsbehörden zusammengestellt wurden. Beispiele hierfür sind das Manifesto Project, das Minorities (at Risk) Project, der Comparative Welfare States District und die Armed Conflict Database. Einige Projekte, wie das Polity IV Project, reichen bis ins 19. Jahrhundert zurück. Projekte wie das Stockholmer Internationale Friedensforschungsinstitut (SIPRI) erfassen Waffentransfers, internationale Militärausgaben und Sicherheitstrends. Am besten erkunden Sie die Website selbst, um sich einen Eindruck von den Daten zu verschaffen.
95. Uppsala-Konfliktdatenprogramm
Das Institut für Friedens- und Konfliktforschung der Universität Uppsala (UCDP) betreibt eine umfangreiche Datenbank, die UCDP-Konflikt-Enzyklopädie. Auf dieser Website können Nutzer die vom Institut aufbereiteten Daten durchsuchen und erkunden. Forscherprofile sind über die Website abrufbar, und die Daten können zur weiteren Bearbeitung und Analyse heruntergeladen werden. Die UCDP ist eine verlässliche und leicht zugängliche Informationsquelle.
96. US-Arbeitsministerium
Das US-Arbeitsministerium stellt umfangreiche Wirtschaftsdaten zu Arbeitslosigkeit und Beschäftigung bereit. Diese Daten umfassen Datenbanken mit Statistiken zu Massenentlassungen, Beschäftigungsprognosen, offenen Stellen und Personalfluktuation, nationalen Beschäftigungsstatistiken sowie internationalen Arbeitsmarktvergleichen. Die Website bietet aktuelle und präzise Informationen, die vom Arbeitsministerium kontinuierlich aktualisiert werden. Es handelt sich um eine anerkannte und staatlich geförderte Quelle für Forschungszwecke.
97. Verwaltung für kleine Unternehmen
Die US-amerikanische Behörde für Kleinunternehmensförderung (Small Business Administration, SBA) ist seit Langem eine bewährte Anlaufstelle für Unternehmer und angehende Gründer. Ihre Website bietet zahlreiche Statistiken zur Beschäftigung sowie Informationen, die es Forschern ermöglichen, Marktforschung und Wettbewerbsanalysen durchzuführen. Hier finden Forscher Zahlen, Statistiken und Tools, mit denen sich zusätzliche Daten gewinnen lassen. Für Informationen zu Statistiken über Kleinunternehmen aus Arbeitgeber- und Unternehmenssicht ist dies eine hervorragende Ressource, auf die Journalisten jederzeit zurückgreifen können.
98. Crowdpac
Crowdpac ist eine Plattform, die es politischen Kandidaten ermöglicht, Spenden zu sammeln und sich zu organisieren. Ausgehend von der Annahme, dass bei jeder Wahl zahlreiche Kongresskandidaten praktisch ohne Gegenkandidaten antreten, bietet diese Seite engagierten Bürgern die Möglichkeit, Unterstützung zu mobilisieren. Mit Artikeln zu relevanten politischen Themen wie Wahlkreismanipulation und weiteren Bereichen wie Bürgerrechten und nationaler Sicherheit bietet diese Seite eine hervorragende Gelegenheit, die politische Basisbewegung zu verstehen und sich darüber zu informieren.
99. Gallup
Diese Website beherbergt die renommierten Gallup-Umfragen. Gallup ist spezialisiert auf Analysen, die es Entscheidungsträgern in Unternehmen ermöglichen, Probleme datenbasiert zu lösen. Darüber hinaus ist das von Gallup empfohlene Tool oft hilfreich, um Lösungen zu entwickeln. Diese Quelle gilt als Goldstandard für Daten und fortgeschrittene Analysen. Stöbern Sie einfach auf der Website und entdecken Sie Berichte zu verschiedensten Themen – von der globalen Arbeitswelt bis hin zur Produktivität in den USA.
100. Berkeley-Bibliothek
Die Berkeley Library bietet auf ihrer Website eine umfassende Sammlung von Statistiken und Daten für die politikwissenschaftliche Forschung. Auf dieser Seite finden Forschende zahlreiche Links, die Zugang zu verschiedenen Datensätzen ermöglichen und es ihnen erlauben, eigene Datensätze zu erstellen. Zu diesen Datensätzen gehören unter anderem die Historical Statistics of the United States (HSUS), die Millennial Edition, Data Planet, ProQuest Statistical Insight und das Inter-university Consortium for Political and Social Research. Es stehen mehrere Stunden an Daten zur Verfügung.
101. RAND State Services
Für alle, die es noch nicht wissen: Die RAND Corporation ist eine Organisation, die sich auf die Erforschung von Herausforderungen der öffentlichen Politik spezialisiert hat. Mit Kunden und einem Portfolio, das alle Regierungsebenen umfasst, liefert die Corporation hochwertige Forschungsergebnisse für Entscheidungsprozesse. Die US-amerikanische Niederlassung der Corporation stellt auf ihrer Website eine Datenbank mit Statistiken bereit. Hier finden Forschende unter anderem Informationen zu Themen wie Schulbildung (K-12), Gesundheit, Wirtschaft und Ökonomie, die sich mit Fragen des Gemeinwohls befassen.
102. Roper-Zentrum für Meinungsforschung
Das Roper Center for Public Opinion Research, das von der Cornell University betrieben wird, ist auf die Erhebung, Verbreitung und Archivierung von Daten zur öffentlichen Meinung spezialisiert. Forscher haben beispielsweise Zugriff auf Daten der US-Wahlen sowie auf ein Archiv mit über 23.000 Datensätzen. Ob Journalisten nun die öffentliche Reaktion auf politische Themen oder aktuelle Gesundheitswarnungen untersuchen – auf dieser Website finden sie mit hoher Wahrscheinlichkeit die passenden Informationen.
103. Transportwesen
Diese vom Verkehrsministerium betriebene Website bietet Daten zu einem breiten Spektrum an verkehrsbezogenen Themen. Zu den Ressourcen gehören Berichte über Energie, Fahrgastsicherheit, Systemleistung, Verkehrswirtschaft, Infrastruktur und Güterverkehr. Nutzer können die Daten nach Standort und Region sortieren und abrufen. Die Website ermöglicht es Forschern, alle relevanten Informationen zu verkehrsbezogenen Themen zu finden.
104. Reisebranche
Travel Trade ist eine Website mit Daten zu Ausreisen von US-Bürgern aus den Jahren 1996 bis 2016 (Stand: heute). Ziel dieser Ressource ist es, interessierten Bürgern Einblicke in die Entwicklung des globalen und internationalen Tourismus zu geben. Die Informationen stehen sowohl zum Download als auch online zur Verfügung und sind somit leicht zugänglich. Forscher können die Daten nutzen, um Trends zu erkennen und Vergleiche anzustellen.
105. Skift
Skift ist eine Website, die sich auf die Bereitstellung von Informationen und Daten für die Reisebranche spezialisiert hat. Neben anderen Datenquellen bietet das Unternehmen Studien, Konferenzen und informative Newsletter für Abonnenten und Forscher an. Skift untersucht Themen, die für Akteure der Reisebranche relevant sind, wie beispielsweise die zunehmenden Reisetrends, die Erschließung neuer Märkte und zahlreiche weitere Informationen zu Reisetechnologien, die Forschern zur Verfügung stehen.
106. Geoba.se
Geoba.se ist die ideale Seite für alle, die sich ausschließlich über Fakten zu einer Stadt oder einem Ort informieren möchten. Mit der Suchfunktion auf der Startseite lassen sich Koordinaten, Reiseinformationen, Wetterdaten und sogar lokale Webcam-Bilder mit wenigen Klicks finden. Die Seite bietet außerdem Informationen zu weltweiten Rankings, die nach Region und Land gefiltert werden können. Kurz gesagt: Diese Ressource liefert Ihnen fundierte Daten und Statistiken.
107. USA-Reisen
US Travel betreibt eine Website des US-Außenministeriums. Ziel der Website ist es, die Sicherheit von US-Bürgern im Ausland zu gewährleisten. Daher bietet sie Statistiken, Informationen und Berichte zu Themen wie US-Pässe, US-Visa, internationale Adoptionen, Todesfälle im Ausland und Kindesentführungen durch Eltern im Ausland. Die Informationen können bei der Reiseplanung genutzt werden, aber auch zur Erkennung langfristiger Trends anhand der Statistiken von 1996 bis 2016.
108. UK-Datendienst
Die vom Economic and Social Research Council finanzierte Datensammlung des UK Data Service veröffentlicht ein breites Spektrum an Daten. Die Website bietet Informationen zu verschiedenen Themen, darunter Unternehmensdaten, länderübergreifende Umfragen, vom britischen Staat geförderte Studien und sogar Daten der britischen Volkszählung. Die Website wurde speziell für die Bedürfnisse von Studierenden und Forschenden konzipiert. Darüber hinaus stehen Anleitungen, Ressourcen und Tutorials zur Verfügung, die Forschenden helfen, die Tools der Website schnell zu verstehen und anzuwenden.
109. Data.gov.au
Data.gov.au, betrieben und herausgegeben von der australischen Regierung, bietet einfachen Zugriff auf offene Daten und deren Suchfunktion. Die Website weist ausdrücklich darauf hin, dass die Regierungsdaten zur Entwicklung von Tools und Anwendungen genutzt werden können, die wiederum der australischen Bevölkerung zugutekommen. Neben dem Zugriff auf offene Datensätze sind auch unveröffentlichte Daten gegen Gebühr verfügbar. Forschern, die eine noch tiefergehende Analyse durchführen möchten, bietet die Website zudem ein Daten-Toolkit an.
110. Twitter
Twitter ist allgemein bekannt für seine rasanten Konversationen, kurzen Nachrichten und seinen Status als zentrale Anlaufstelle für Eilmeldungen. Was viele jedoch nicht wissen: Twitter bietet auch Entwicklertools, die das Filtern und Entdecken von Informationen erleichtern. Mit diesen Tools können Forscher sogar Trends analysieren und nach geografischen Kriterien filtern. Ob beim Lesen über Trend-Hashtags oder beim Erkunden der Entwicklertools – Twitter ist eine Ressource, die Journalisten schon seit Langem nutzen.
111. Instagram
Instagram ist nicht nur zum Liken von süßen Katzenbildern und niedlichen Babyfotos da. Oder zumindest muss es das nicht sein. Die App bietet überraschend ausgefeilte Entwicklertools, mit denen man die Zielgruppe leicht verstehen und analysieren kann. Hashtags und die Hinweise, die sich aus den geposteten Fotos und den darauf markierten Personen ergeben, sind zudem eine wahre Fundgrube an Informationen. Instagram ist ein nützliches Werkzeug, um Trends in verschiedenen Bereichen zu entdecken.
112. Vier Quadrate
Für Recherchen, bei denen der Standort eine wichtige Rolle spielt, ist Foursquare aufgrund seiner riesigen Datenbank und der darin gesammelten Informationen eine wertvolle Datenquelle. Die Plattform bietet einen Stadtführer mit Empfehlungen basierend auf der jeweiligen Community. Foursquare stellt außerdem Entwicklertools zur Verfügung, die über die Ortsdatenbank Zugriff auf zusätzliche Informationen ermöglichen. Journalisten können diese nutzen, um mehr über bestimmte Orte und die Nutzer der App zu erfahren.
113. New York Times
Die New York Times gilt vielen als angesehenes Mitglied der vierten Gewalt und ist unter Journalisten weithin bekannt. Oft wird jedoch die Nutzung der New York Times als Datenquelle über ihre API übersehen. Forscher können Artikel bis zurück ins Jahr 1851 monatsweise finden, Artikel durchsuchen und sogar Buchrezensionen abrufen. Die API ermöglicht die Suche anhand von Aufrufen, Shares und E-Mails sowie den Zugriff auf Kommentare.
114. AP
Die Associated Press hat sich als Quelle für aktuelle und präzise Nachrichten einen festen Platz in der Popkultur erobert. Dank ihrer Entwicklertools ist sie auch eine wertvolle Datenquelle für Journalisten. Aktuell können Forscher diese Tools nutzen, um beim Herunterladen von Bildern und Videos eigene Bearbeitungen vorzunehmen. Der Umfang der Inhalte scheint vom verwendeten Abonnement abzuhängen, doch die Associated Press API ermöglicht es Nutzern dennoch, den Rechercheprozess deutlich zu verbessern.
115. Fünf Achtunddreißig
Journalisten dürften Nate Silver und FiveThirtyEight sowie sein statistisches Modell aufgrund seiner mitunter unerwarteten, aber meist zutreffenden Vorhersagen bereits kennen. FiveThirtyEight betreibt ein GitHub-Repository, auf dem Datensätze und Quellcode aus der Geschichte der Website zu finden sind. Die Datensätze umfassen amüsante Themen wie Daten zu schlechten Autofahrern, den Avengers und eine Umfrage zur Flugetikette. Daneben gibt es aber auch Dateien zu ernsteren Themen wie Flugsicherheit und Hassverbrechen.
116. IMDb
IMDb gilt vielen als die umfassendste Website im Internet, wenn es um die Film- und Schauspielbranche geht. Wenn ein Film in die Kinos kommt und man wissen möchte, wer mitspielt oder wie das Kinopublikum reagiert, landet man mit hoher Wahrscheinlichkeit irgendwann auf dieser Seite. IMDb bietet außerdem zahlreiche Datensätze, die täglich aktualisiert werden und sowohl für kommerzielle als auch für nichtkommerzielle Zwecke zur Verfügung stehen.
117. KAPSARC
KAPSARC ist ein Datenportal mit insgesamt 923 Datensätzen, die spezifische Informationen zu Energiedaten enthalten. Diese Datensätze sind in verschiedene Themenbereiche unterteilt, darunter Energieverbrauch, Energieversorgung und weitere relevante Faktoren wie Politik, Demografie, Umwelt, Handel, Wasser und Wirtschaftsinformationen. Für Forschende, die sich für Energie und deren Nutzung in verschiedenen Branchen und Sektoren interessieren, ist KAPSARC eine der umfassendsten Energiedatenquellen im Internet.
118. Asset Macro
Asset Marco ist eine Website, die historische Finanzdaten und makroökonomische Indikatoren bereitstellt. Diese Daten umfassen über 75.000 Aktien, Währungen, Rohstoffe und Anleihen weltweit. Darüber hinaus bietet die Website mehr als 120.000 makroökonomische Indikatoren, mit denen Nutzer die Finanzdaten verschiedener Länder analysieren können. Neben all diesen Finanzmarktdaten werden auch Anlagestrategien erläutert. Diese Quelle ist aufgrund des enormen Informationsumfangs einzigartig.
119. Webdienste der US-Regierung und XML-Datenquellen
Die Webdienste und XML-Datenquellen der US-Regierung werden auf der Website USGovXML.com gehostet. Dort können Nutzer die verschiedenen XML-Datenquellen und Webdienste der US-Regierung durchsuchen. Diese einfache Archivierungsmaßnahme gewährleistet die Transparenz und Zugänglichkeit dieser Webquellen für die Öffentlichkeit. Forscher, die diesen Index regelmäßig überwachen, können so bei plötzlichen Änderungen der XML-Daten relevante Erkenntnisse gewinnen.
120. Figshare
Figshare ist eine Plattform mit über 5.000 wissenschaftlichen Inhalten für akademische Forschung und Zitation. Neben den bereitgestellten Informationen bietet die Seite Forschern eine zentrale Anlaufstelle zum Sammeln, Hochladen, Speichern und Verwalten ihrer Forschungsergebnisse. Mathematik, Gesundheitswissenschaften, Ingenieurwissenschaften, Chemie, Biowissenschaften und Sozialwissenschaften sind als Hauptkategorien aufgeführt. Die Seite ist eine hervorragende Quelle für Journalisten, die nach weiteren wissenschaftlichen Quellen suchen.
121. LinkedData
LinkedData ist eine Website, die sich der Suche nach neuen Wegen zur Verknüpfung bisher unverknüpfter Internetdaten widmet. Hier finden Nutzer Tutorials, Anleitungen und Datensätze, die den Einstieg erleichtern. Die Datensätze konzentrieren sich alle auf die Mitarbeit in der Linked-Data-Community und sind neben einer Linked-Data-Einkaufsliste größtenteils als dereferenzierbare URIs kategorisiert, entweder mit oder ohne das zugehörige RDF-Format. Um mehr über diese Community zu erfahren, ist diese Website ein Muss.
122. Der Web Miner
Web Miner ist die ideale Plattform für Forscher, die möglichst viele generische Daten mit dem Programm finden möchten. Die Website bietet Beispieldatenbanken wie US-Restaurants, SWIFT-Codes von Banken weltweit, US-Tankstellen, amerikanische Sehenswürdigkeiten und Google Play-Apps sowie viele weitere umfangreiche Listen. Kurz gesagt: Sie erleichtert Journalisten die Suche und Auswertung riesiger Datenmengen erheblich.
123. Daten-Hub
Data Hub versteht sich als Plattform, auf der Nutzer Daten schnell und effizient finden und veröffentlichen können. Die Website selbst bietet eine Vielzahl von Datensätzen. Der Hauspreisindex (Case-Shiller), der monatliche Goldpreis und die aktuellen Trends des atmosphärischen Kohlendioxids gehören zu den drei beliebtesten. Zusätzlich zu den Daten stellt die Website zahlreiche Tutorials bereit, die Nutzern helfen, sich mit den verschiedenen verfügbaren Datentypen vertraut zu machen.
124. Enigma Public
Auf seiner Website bezeichnet sich Enigma Public als die umfangreichste Sammlung öffentlicher Daten im Internet. Die Datensätze lassen sich in vier Kategorien einteilen: Informationsfreiheitsgesetz (FOIA), Grundlagen, Nachrichtenwert und weniger bekannte Daten. Zu den verfügbaren Daten gehören beispielsweise Gehälter von Mitarbeitern des Weißen Hauses und Informationen zu gültigen Waffenscheinen des Bundes. Nach der kostenlosen Registrierung können Nutzer auf alle verfügbaren Datenkategorien zugreifen.
125. Yahoo
Die meisten Internetnutzer kennen Yahoo durch Dienste wie Yahoo! News und Yahoo! Finance, die zu den zahlreichen Online-Angeboten des Unternehmens gehören. Für Forscher und Journalisten ist besonders interessant, dass Yahoo auch eine Vielzahl von Datensätzen hostet, darunter beispielsweise die Yahoo! Music-Nutzerbewertungen von Songs mit Metadaten zu Künstler, Album und Genre (Version 1.0) und die Yahoo! Movies-Nutzerbewertungen und beschreibenden Inhaltsinformationen (Version 1.0). Journalisten, die nach neuen Statistiken suchen, finden in dieser Quelle garantiert die passenden Informationen.
126. 1000 Genome
Das 1000-Genomes-Projekt lief von 2008 bis 2015 und hatte zum Ziel, alle genetischen Variationen zu erfassen, die in mindestens 1 % der untersuchten Populationen vorkommen könnten. Neben den daraus entstandenen Publikationen wurden umfangreiche Datensätze erstellt, die separate Datenbanken mit Variantenzellen, Rohsequenzdateien und Informationen zur Probenverfügbarkeit enthielten. Diese Daten können durchsucht oder heruntergeladen werden.
127. CBOE
Die CBOE ist eine Terminbörse, die sich hauptsächlich auf Volatilitäts-Futures konzentriert. Insbesondere bietet die Website umfangreiches Material zu den Futures, die im markenrechtlich geschützten Volatilitätsindex der Website enthalten sind. Die Website stellt Marktdaten aller Art bereit, darunter historische Daten, tägliche Marktstatistiken und die täglichen Abrechnungspreise der VX-Futures. Journalisten, die qualitativ hochwertige Marktdaten suchen, finden diese auf der CBOE in einem leicht verständlichen Format.
128. St. Louis Fed
Die Federal Reserve Bank von St. Louis ist eines der wichtigsten, wenn nicht sogar das wichtigste Finanzzentrum der Region. Auf ihrer Website können Forscher Arbeitspapiere, Wirtschaftsdaten, Publikationen und Informationsdienste direkt einsehen. Kurz gesagt: Es mangelt nicht an Informationen über die aktuelle und vergangene Politik der Federal Reserve Bank von St. Louis sowie an der Möglichkeit, ihre Effektivität zu bewerten. Für Wirtschafts-, Finanz- und Finanzjournalisten ist dies eine erstklassige Informationsquelle.
129. OANDA
OANDA ist eine beliebte Online-Handelsplattform für Aktien, die sich hauptsächlich auf den Handel mit CFDs und Devisen spezialisiert hat. Neben zahlreichen Funktionen, die speziell für Online-Trader entwickelt wurden, bietet OANDA auch umfangreiche historische Kursdaten sowie historische Informationen im Währungsrechner. Zusätzlich zu diesen Daten stellt die Plattform Informationen zu Anlagestrategien, Nachrichten und Marktanalysen bereit. Für den Zugriff auf die meisten dieser Daten ist nicht einmal ein Konto erforderlich.
130. ABS
Das australische Statistikamt (ABS) bietet, ähnlich wie sein amerikanisches Pendant, objektive Daten, Wirtschaftsinformationen und Forschungsergebnisse zu einer Vielzahl von Themen, die für das Land relevant sind. Direkt auf der Website können Forschende statistische Daten zu Konjunkturindikatoren, Gesundheitswesen, Wohnen, Finanzen, internationalem Handel, psychischer Gesundheit sowie Preisindizes und Inflation abrufen. Journalisten können ältere Erhebungen und Informationen recherchieren und die Ergebnisse nach Regionen filtern.
131. Londoner Datenbank
Die ursprünglich von der Greater London Authority konzipierte und betriebene London Database ist Londons Versuch, die Daten der Stadt der Öffentlichkeit besser zugänglich zu machen. Ziel ist es, den Bürgern Zugang zu diesen Informationen zu ermöglichen und sie zu ermutigen, diese kostenlos und nach Belieben zu nutzen. Auf dieser Website können Nutzer Daten zu Themen wie Kunst & Kultur, Kriminalität und öffentliche Sicherheit, Bildung und Gesundheit durchsuchen. Journalisten, die an diesen Daten interessiert sind, können sie nun direkt von der Stadtverwaltung beziehen.
132. Stats NZ
Die neuseeländische Regierung stellt auf dieser Website eine Fülle von Statistiken und Daten für Forscher bereit. Diese Informationen lassen sich mithilfe der Suchleiste oben durchsuchen und nach Ort, Region und Thema filtern. Zu den Themen gehören unter anderem Wirtschaftsindikatoren, Gesundheit, Einkommen und Arbeit, Branchen, Umwelt und Wirtschaft. Dank zusätzlicher Nachrichtenquellen und Veröffentlichungen mit verschiedenen Erkenntnissen und Statistiken finden Journalisten auf dieser Website zahlreiche neuseelandspezifische Daten.
133. Australisches Regierungsbüro für Meteorologie
Die Website des australischen Wetterdienstes (Australian Bureau of Meteorology), der von der australischen Regierung betrieben wird, bietet Wetterinformationen für verschiedene Städte und Regionen Australiens. Laut Website wurde diese Behörde gegründet, um die australische Bevölkerung durch Warnungen und Ratschläge beim Umgang mit dem australischen Klima zu unterstützen. Hier finden Sie saisonale Vorhersagen, Informationen zu Wasserspeichern, Niederschlagsprognosen, Klimavariabilität und saisonalen Flusspegelvorhersagen. Die Website bietet Ihnen zuverlässige und präzise Informationen zum australischen Wetter.
134. Gruppenlinse
Diese Website wird mit freundlicher Genehmigung von GroupLens, einem Projekt des Fachbereichs Informatik und Ingenieurwesen der Universität Minnesota, bereitgestellt. Sie bietet Publikationen und Datensätze für Forschungszwecke. Insgesamt stehen etwa sechs Datensätze zur Verfügung. Darunter befinden sich beispielsweise die Datensätze Book-Crossing, MovieLens und HetRec 2011. Kurz gesagt: Diese Website ist eine hilfreiche Ressource für Journalisten, die die Nutzung der bereitgestellten Daten besser verstehen möchten.
135. KD Nuggets
KD Nuggets ist eine Website, die sich vor allem auf Data Science, Business Analytics, Machine Learning und Data Mining konzentriert. Auf einer Seite findet sich eine vollständige Liste von Datensätzen, die für die weitere Erforschung von Data Mining und Big Data genutzt werden. Verlinkt sind unter anderem Datensätze wie Bioassay Data, Asset Marco, DataMarket, Casualty Workbench, Data Ferrett und Datamob. Für Journalisten, die alle Informationen übersichtlich auf einer Seite finden möchten, ist dies eine hervorragende Ressource.
137. Microsoft
Wer schon einmal einen PC oder Laptop benutzt hat, kennt Microsoft wahrscheinlich zumindest vom Hörensagen. Interessanterweise bietet Microsoft neben PCs, Laptops und Software auch zahlreiche Forschungsprojekte und Publikationen an. Dazu gehören bahnbrechende Entwicklungen wie das Bestreben des Unternehmens, intelligente Maschinen zu entwickeln, sowie cloudbasierte Datenwissenschaft. Außerdem gibt es Informationen zu Tools wie Visual Studio Code Tools und den damit verbundenen Fortschritten im Bereich der künstlichen Intelligenz.
138. RDataMining
Wie der Name schon sagt, ist R Datamining eine Ressource zu R und Data Mining. Die Website bietet zahlreiche Beispiele und Dokumente, die einen tiefen Einblick in Data Mining und Data Mining mit R geben. Zusätzlich gibt es Links zu Schulungen, wie beispielsweise dem Kurzlehrgang der University of Canberra. Dazu gehören Links zu kostenlosen Datensätzen und Präsentationen sowie Datensätzen zu Themen wie Flugzeug-, Airline- und Streckendaten. Außerdem gibt es Links zu Websites wie GeoDa.
139. Gemeinsame Forschung in der Computerneurowissenschaft – Datenaustausch
Das Collaborative Research in Computational Neuroscience (CRCN) stellt zahlreiche Datensätze auf seiner Website zur Verfügung. Diese Datensätze sind nach verschiedenen Hirnregionen kategorisiert, darunter beispielsweise der visuelle Kortex, der Hippocampus, der motorische Kortex, Vogel-, Augenbewegungs- und Aplysia-Daten. Die Ordner enthalten außerdem Herausforderungen, Tools, Simulationen und Methoden. Durch die Möglichkeit, diese Daten zu teilen, wird die Nutzung für Forschungszwecke noch wertvoller.
140. Archiv der Proteindatenbank
Laut ihrer Website ist die Protein Data Bank (PDB) seit 1971 eine führende Ressource für Nukleinsäuren, die 3D-Strukturen von Proteinen und komplexen Molekülstrukturen. Gegründet mit dem ausdrücklichen Ziel, diese Informationen öffentlich zugänglich zu machen, können Forschende hier Validierungsberichte und Datenwörterbücher online einsehen. Zudem stehen Datenwachstums- und Nutzungsstatistiken zur webbasierten Sortierung und Analyse sowie zum Download bereit. Und das Beste: Die Website wird ständig um neue Informationen ergänzt.
141. Das PubChem-Projekt
PubChem ist ein offizielles Projekt, das die Öffentlichkeit über die biologischen Wirkungen kleiner Moleküle informieren soll. Die Website ist mit drei Datenbanken verknüpft: PubChem Compound, PubChem Substance und PubChem BioAssay. Darüber hinaus ermöglicht sie die Suche nach Ähnlichkeiten zwischen verschiedenen Proteinen. Forschern, die ihre Datenanalyse vertiefen möchten, bietet die Website außerdem kostenlose Codebeispiele und hilfreiche Tipps.
142. Coremine Medical
Coremine Medical ist eine unschätzbare Ressource für alle, die Informationen zu Biologie, Gesundheit und Medizin suchen. Dank der Integration der biomedizinischen Textanalysefunktion von PubGene in die aktuelle Form zählt Coremine zu den flexibelsten Quellen für biomedizinische Informationen. Die Website präsentiert Verknüpfungen zwischen Konzepten und Ideen in einem visuell ansprechenden und leicht verständlichen Format, die sonst möglicherweise unbemerkt geblieben wären. Sie ist zweifellos eine der umfassendsten biomedizinischen Datenquellen für Journalisten.
143. Tu Tiempo
Tu Tiempo ist eine unglaubliche Quelle für Wetter- und Klimadaten aus allen Ländern der Welt. Mit dieser Ressource lassen sich Jahres-, Monats- und Tagesdurchschnittswerte für nahezu jede Stadt und Region weltweit leicht finden. Darüber hinaus können Nutzer die Datenbank mit über 115 Millionen Datensätzen durchsuchen, die historische Daten enthalten und für jeden zugänglich sind. Je nach Region lassen sich Daten bis ins Jahr 1929 zurückverfolgen.
144. Komplexe Netzwerkressourcen
Diese Website bietet Zugriff auf einen Großteil der Daten, die ursprünglich in computergestützten Experimenten verwendet wurden. Die vollständige Liste der Datensätze umfasst verschiedene Datentypen, darunter Nachrichtengraphen, biologische Graphen, Zitationsgraphen, Kollaborationsgraphen, technische Graphen und semantische Graphen. Die Seite verlinkt außerdem auf eine Liste von Quellen mit umfangreichen Informationen, beispielsweise zu einem Datensatz, der rund 3 Millionen US-Patente analysiert hat. Darüber hinaus bietet die Seite eine beeindruckende Sammlung von Datensätzen zu komplexen Netzwerken.
145. Scopus
Scopus ist ein Tool, mit dem man schnell und einfach Forschungsergebnisse und wissenschaftliche Zitate finden kann. Die Website bietet eine unglaublich umfangreiche Datenbank mit Forschungsergebnissen aus aller Welt in zahlreichen Fachgebieten, darunter Medizin, Technologie, Sozialwissenschaften sowie Kunst und Geisteswissenschaften. Nutzen Sie Scopus, um wissenschaftliche Quellen zu erfassen, die Ihnen vielleicht entgangen sind. Denn in vielen Kreisen ist die Qualität einer wissenschaftlichen Quelle fast genauso wichtig wie die darin enthaltenen Informationen.
146. Stanford
Stanfords Ruf als angesehene akademische Institution ist nicht zufällig entstanden. Die Exzellenz zeigt sich in den Programmierkursen. Die Website bietet zudem zahlreiche Datensätze mit Informationen zu sozialen Netzwerken. Es gibt Datensätze zu sozialen Kreisen auf Facebook, Wikipedia-Admin-Anfragen, Twitter-Kreisen und Google+. Auch Kommunikationsnetzwerke und das Amazon-Produktnetzwerk verfügen über eigene Datensätze.
147. Universität Mailand
Das Institut für Informationswissenschaften der Universität Mailand betreibt die Webseite „Labor für Webalgorithmen“. Diese Webseite bietet zahlreiche Datensätze, die zum Erkunden einladen. Dazu gehören Graphen sozialer Netzwerke, Facebook-Graphen, Momentaufnahmen aus dem DELIS-Projekt sowie eine Auswahl weiterer Daten. Die hier verfügbaren Informationen können online eingesehen und bei Bedarf heruntergeladen werden. Damit zählt diese Webseite zu den am einfachsten zugänglichen Datensätzen ihrer Art im Internet.
148. UCI-Netzwerkdatenrepository
Das UCI Network Data Repository ist eine Website, die sich der wissenschaftlichen Erforschung von Netzwerken widmet. Auf der Ressourcenseite finden Forschende Links zu Datensatzverzeichnissen, die von Forschungsorganisationen, Gruppen und Einzelpersonen zusammengestellt wurden. Es enthält außerdem eine Sammlung von Datensätzen, die typischerweise für die Analyse sozialer Medien verwendet werden. Wer sich näher mit den Daten beschäftigt, wird feststellen, dass diese Datensätze auch zum Download bereitstehen.
149. CAIDA
CAIDA (Center for Applied Internet Data Analysis) sammelt vielfältige Daten aus verschiedenen Quellen, oft mit Unterstützung von Organisationen und Einzelpersonen. Auf dieser Website finden sich Datensätze wie AS-Beziehungen, DDoS-Angriffe, Telescope und verwandte Datensätze sowie weitere Daten. Die Kategorien umfassen Datenverkehr, Topologie, Sicherheit, Wurm-Zusammenfassungen und Verkehrsstatistiken. Für einige Datensätze ist ein Zugriff erforderlich, viele, wenn nicht die meisten, sind jedoch öffentlich zugänglich.
150. Flusskrebs
Crawdad, die Community-Ressource zur Archivierung drahtloser Daten an der Dartmouth University, ist einzigartig, da sie sich auf die Bereitstellung drahtloser Daten für Forschende und andere Interessierte konzentriert. Die Website bietet zahlreiche Tools sowie Zugriff auf viele Datensätze. Darunter befinden sich Datensätze für Bildungszwecke, Bitfehlercharakterisierung, Netzwerkdiagnose, opportunistische Konnektivität, standortbezogenes Computing und weitere. Forschende werden diese Ressource umso mehr schätzen, je tiefer sie in sie eintauchen.
151. US-Energieinformationsbehörde
Die US-Energieinformationsbehörde (EIA), oft auch als Energieinformationsbehörde bezeichnet, stellt der Öffentlichkeit jährlich Daten zu Stromversorgern zur Verfügung. Diese Daten umfassen unter anderem Informationen zu fossilen Brennstoffvorräten, Brennstoffverbrauch, monatlichen und jährlichen Daten zur Stromerzeugung sowie Umweltdaten. Die Daten sind für Analysen aus den Jahren 2001 bis 2017 verfügbar. Forschende müssen lediglich die Website aufrufen und die Informationen herunterladen.
152. Britische ozeanographische Daten
Die vom National Environment Research Council finanzierten British Oceanographic Data gehören zu den am besten zugänglichen Quellen für Meeresdaten im Internet. Ihre umfangreiche Datenbank umfasst Strömungen, CTD-Profile, internationale Meeresspiegeldaten und sogar historische Daten von Bodendruckmessgeräten. Zusätzlich bietet die Published Data Library weitere Datensätze und damit zusätzlichen Zugriff auf den Katalog. Es handelt sich hierbei wohl um eine der umfangreichsten online verfügbaren Quellen für Meeresinformationen.
153. Faktisch
Factual stellt Standortdaten für Werbung und mobile Plattformen bereit. Besonders interessant für Forscher sind die Entwicklertools, darunter das Engine Mobile SDK und die umfassenden professionellen und Forschungsanwendungen des Observation Graph sowie des Local Validation Stack. Mit einem Website-Namen, der die Leidenschaft des Unternehmens für die weltweite Datennutzung und die Suche nach neuen, kontextbezogenen Ansätzen unterstreicht, beweist Factual sein klares Engagement für Daten und die Erschließung neuer, unkonventioneller Anwendungsmöglichkeiten.
154. Globale Verwaltungsbereiche
Global Administrative Areas ist eine Geodatenbank, die die Lage der verschiedenen Verwaltungseinheiten weltweit darstellt. Die aus dieser Datenbank gewonnenen Daten werden typischerweise in Geoinformationssystemen (GIS) verwendet. Diese umfassen Länder, die unter anderem in Provinzen, Landkreise und Departements unterteilt sind. Journalisten profitieren davon, dass all diese Daten kostenlos verfügbar sind und für akademische und allgemeine nichtkommerzielle Zwecke genutzt werden dürfen.
155. Geonames
Geonames ist eine Website mit einer geografischen Datenbank, die Millionen von Einträgen, einzigartigen Merkmalen und alternativen Namen umfasst. Sie bietet sowohl eine Exportfunktion als auch Zugriff über verschiedene Webdienste und verarbeitet täglich rund 150 Millionen Anfragen. Dank der Wiki-Funktionen der Datenbank können Nutzer die Einträge relativ einfach anpassen und ändern. Allein schon wegen der Mehrsprachigkeit ist Geonames eine wertvolle Ressource.
156. Natürliche Erddaten
Natural Earth Data ist ein frei verfügbarer Kartendatensatz mit umfangreichen Informationen, der speziell für die Verwendung in Kartensoftware zur Erstellung hochmoderner Karten entwickelt wurde. Die Visualisierungen des Endprodukts sind übersichtlich und gut strukturiert, und die Daten sind sofort einsatzbereit. Dieser Datensatz enthält Geheimdienstinformationen sowie verschiedene kulturelle, Raster- und physische Vektordaten. Ursprünglich für die Bedürfnisse und Präferenzen von Kartografen erstellt, ist dieser Datensatz für alle Geografieinteressierten nützlich.
157. OpenStreetMap
OpenStreetMap ist weniger eine Website als vielmehr eine gemeinschaftliche Nutzung, die Kartendienste für Apps, Websites und verschiedene Geräte bereitstellt. Die Plattform erhält neue Daten, sobald Nutzer Informationen zu weniger bekannten Sehenswürdigkeiten wie Bahnhöfen, Straßen und Wegen eingeben. Der vollständige Datensatz ist kostenlos auf der Website verfügbar und kann vollständig oder teilweise heruntergeladen werden. Wer nur einen Teil der Daten herunterladen möchte, kann dies auch regionsspezifisch tun.
158. Stadt Chicago
Die Stadt Chicago ist die Heimat der von Michael Jordan gegründeten Chicago Bulls, die die Meisterschaft gewannen, und ihrer einzigartigen Pizza-Spezialität. Darüber hinaus verfügt sie über ein eigenes, umfassendes Datenportal. Die Datensätze decken ein breites Themenspektrum ab, darunter Verwaltung und Finanzen, Ethik, Gesundheit und Soziales, Parks und Erholung, öffentliche Sicherheit und Denkmalpflege. Kurz gesagt: Das Datenportal der Stadt Chicago bietet praktisch alles, was für Forscher, politische Entscheidungsträger und lokale Journalisten von Interesse sein könnte.
159. CKAN
CKAN ist die zentrale Online-Plattform für das Open-Data-Projekt der Stadt Glasgow. Die Website bietet Datensätze zu zahlreichen Themen, die für Unternehmer, politische Entscheidungsträger, Wissenschaftler und App-Entwickler gleichermaßen nützlich sind. Von den 360 hier gehosteten Datensätzen beziehen sich einige auf die Stadtverwaltung, wie beispielsweise der Datensatz zum Wohnungsbestand nach Eigentumsverhältnissen, während andere, wie der Datensatz zum Radverkehr, insbesondere für die Anwohner von Interesse sind. Journalisten, die über lokale Themen berichten, finden hier vielfältige Informationen.
160. Regierung von Indien
Die indische Regierung betreibt eine Website mit Analysen und Datenressourcen im Rahmen ihres Open-Data-Projekts. Aktuell sind dort rund 137.940 Ressourcen verfügbar, die bereits millionenfach aufgerufen wurden. Die meisten dieser Dateien können auch heruntergeladen werden. Ob Sie nun Zahlen zum Staatshaushalt oder Datensätze zu Gesundheit und Familienwohlfahrt suchen – die Website bietet mit hoher Wahrscheinlichkeit die passenden Ressourcen.
161. Stats SA
Diese Website bietet eine Fülle aktueller Statistiken, Veröffentlichungen und Daten der südafrikanischen Regierung. Forscher finden hier Informationen zu verschiedensten Themen, von Lebensmittel- und Getränkeumfragen über Wirtschaftsindikatoren und Beschäftigungsstatistiken bis hin zu Bevölkerungszahlen und wichtigen Gesundheitsstatistiken. Die Daten lassen sich je nach Bedarf nach Stadt, Thema und Indikator durchsuchen. Die Website enthält zahlreiche Informationen zur Volkszählung und veröffentlicht darüber hinaus statistische Publikationen, Fragebögen, Codes und Klassifizierungen sowie Informationen zur Preispolitik.
162. Politikentwicklung und Forschung
Diese Website wird vom Büro für Politikentwicklung und Forschung des US-Ministeriums für Wohnungsbau und Stadtentwicklung (Department of Housing and Development) herausgegeben. Sie veröffentlicht regelmäßig zahlreiche Fallstudien, halbjährliche Publikationen und Fachzeitschriften. Darüber hinaus bietet sie eine Vielzahl von Datensätzen, die für Journalisten von Interesse sind. Beispiele hierfür sind ortsübliche Vergleichsmieten, Einkommensgrenzen und Inflationsfaktoren für die Mittel für Stadterneuerungsprojekte.
163. Vital Net Gesundheitsdaten
Bei Vital Net Health Data finden Forschende zahlreiche große Datensätze zum Thema Gesundheit. Die Website hostet diese Datensätze nicht selbst, sondern bietet vielmehr Links zu ihnen, über die man Informationen abrufen kann. Die kuratierte Liste verweist auf Ressourcen wie CDC Wonder, Eurocat, Health Data All Star sowie auf die Arbeit von gemeinnützigen Organisationen wie der North American Association of Central Cancer Registries. Dies ist zweifellos eine der umfassendsten Ressourcen für Gesundheitsdaten.
164. Analytische Brücke
Analytic Bridge ist eine Ressource speziell für Business Intelligence. Hier finden Forschende Diskussionen zu maschinellem Lernen und KI, Links zu Webinaren und Konferenzen sowie eine Jobbörse. Die Website beherbergt außerdem Data Science Central, den Bereich, der sich auf Big Data konzentriert. Dank der aktiven und engagierten Community und des Engagements für die Bereitstellung von Nachrichten und Informationen profitieren Journalisten, die sich für die Auswirkungen von Daten auf Unternehmen interessieren, erheblich von dieser Plattform.
165. Archive.org
archive.org, vor allem bekannt für seine Bemühungen, eine öffentliche Online-Bibliothek zu werden, beherbergt zahlreiche Veröffentlichungen sowie eine umfangreiche Datensammlung. Die Website präsentiert Ergebnisse des Internet Census von 2012, Archive des Darknet-Marktes aus den Jahren 2011 bis 2015 und sogar einen Datensatz mit öffentlichen Reddit-Kommentaren. Es gibt Daten von Music Brainz und einen Datensatz mit Audio-Coverbildern. Mit seinen Veröffentlichungen und Daten bietet archive.org Journalisten reichlich Material.
166. Akademische Torrents
Diese Website bezeichnet sich selbst als System, das das Teilen und Herunterladen großer Datensätze vereinfacht. Academic Torrents nutzt Torrent-Technologie, um die Datenverteilung zu vereinfachen und Forschern den schnellen Download aller benötigten Ressourcen zu ermöglichen. Die Seite bietet außerdem wissenschaftliche Artikel, Kurse und Sammlungen zum Ansehen an. Eine kurze Suche in den verfügbaren Ressourcen zeigt, dass hier unzählige Datensätze und Sammlungen zum Download bereitstehen.
167. Dataverse
Dataverse lässt sich am besten wie eine Bibliothek betrachten. Forschende können hier Daten einfach suchen, entdecken und zitieren und die Plattform gleichzeitig als Archiv für ihre eigenen Informationen nutzen. Die abgedeckten Themenbereiche umfassen unter anderem Sozialwissenschaften, Agrarwissenschaften, Medizin, Gesundheits- und Lebenswissenschaften sowie Erd- und Umweltwissenschaften. Zu den namhaften Institutionen, die auf dieser Plattform publizieren, gehören Gallup und das US-Handelsministerium, genauer gesagt das Bureau of Census, Abteilung Geographie.
168. UC-Daten
UC Data, in Zusammenarbeit mit dem Social Science Data Lab der UC Berkeley, ist das größte und bekannteste Archiv der Universität. Die Website bietet Zugriff auf Daten aus den Bereichen Statistik und Sozialwissenschaften. Forschende können hier auf die von den UC Data-Forschenden erstellten Artikel, Berichte und Arbeitspapiere zugreifen. Die Rohdaten decken zahlreiche Forschungsbereiche ab, darunter Gesundheitswesen, Sozialhilfe und Sozialversicherung, Demografie, Wahlverhalten und Informationstechnologie sowie viele weitere Themen.
169. Witzlager
Joe Kamp bietet einen umfassenden Leitfaden zum Auffinden von Fußballdaten und APIs für die Datenanalyse. Über die bereitgestellten Links gelangen Forschende zu Open-Source-Daten auf GitHub sowie zu kostenlosen und kommerziellen APIs für einen einfacheren Zugriff. Da Daten und Quellcode auf einer bekannten Plattform wie GitHub verfügbar sind, war der Zugang zu diesen Daten noch nie so einfach.
170. Sean Lahman
Sean Laham ist vielleicht nicht jedem ein Begriff, aber seine Website bietet eine der umfassendsten und detailliertesten Statistiken zu Schlag- und Wurfleistungen im Internet. Die Daten decken den Zeitraum von 1871 bis 2016 ab und reichen somit buchstäblich Jahrhunderte zurück. Sie sind unter der Creative Commons Share Alike 3.0-Lizenz frei zugänglich und nutzbar und können unter anderem direkt in SQL und Microsoft Access heruntergeladen werden. Die Statistiken sind auch über GitHub verfügbar.
171. Retro Sheet
Retro Sheet ist eine der umfangreichsten Quellen für Baseballstatistiken und -daten im Internet. Die Seite enthält Details wie jährliche Kaderlisten und Informationen zu Schiedsrichtern, Spielern und Trainern. In den Jahren, in denen es relevant war, waren die Daten zum All-Star-Spiel zusammen mit den Daten der Nachsaison und einer kleinen Diskrepanzdatei in den Ereignisdateien enthalten. Retro Sheet bietet sogar Informationen zu den Stadien jeder Saison. Ist das nicht umfassend?
172. Hubway-Datenherausforderung
Für diejenigen, die mit dem Programm nicht so vertraut sind: Hubway ist der Name des Fahrradverleihsystems im Großraum Boston. Das System erfasste und veröffentlichte selbstverständlich keine personenbezogenen Daten, verfügte aber dennoch über die grundlegenden Informationen zu jeder Fahrt, die zwischen Juli 2011 und September 2012 unternommen wurde. Dazu gehörten unter anderem Details wie Start- und Zielort sowie die Abholstation.
173. Offene Flüge
Open Flights ist eine Datenbank mit Informationen zu über 10.000 Fährterminals, Flughäfen und Bahnhöfen weltweit. Forscher finden die Excel-kompatible .csv-Version auf GitHub und können die Daten auch direkt von der Website herunterladen. Mithilfe der Karte auf der Startseite lassen sich die einzelnen Orte in der Liste anzeigen. Die Website bietet sogar Routeninformationen an. Für noch aktuellere Informationen können die Website-Betreiber kontaktiert werden.
174. MLVIS
MLVIS ist ein Datenrepository, das visuelle Analysen mit Data Mining in Echtzeit kombiniert. Dadurch lassen sich Daten auch bei der Arbeit mit riesigen Datensätzen intuitiver verstehen. Benchmark-Daten und maschinelles Lernen nicht-relationaler Daten sowie verschiedene Datentypen wie attributierte und heterogene Daten gehören zu den zahlreichen Funktionen und Optionen dieser Plattform. Für zusätzlichen Komfort können die Informationen auch in einem einheitlichen Format heruntergeladen werden.
175. Inception für offene Daten
Open Data Inception ist eine Website mit Links zu weit über 2600 Datenportalen. Mithilfe der Suchleiste oben können Forschende Portale und Datensätze nach Kategorie und Thema durchsuchen. Darüber hinaus bietet die Website die Möglichkeit, die aktuellste Version des gesuchten Datensatzes zu finden. Nutzen Sie die Option, Datenportale als Liste oder interaktiv visualisiert anzuzeigen, und beginnen Sie mit der Suche nach den benötigten Daten.
176. OpenDataSoft
OpenDataSoft ist in Französisch, Englisch und Deutsch verfügbar und bietet Zugriff auf 480 Millionen Datensätze, 4 Millionen API-Zellen und 9.284 Datensätze. Über die Suchleiste in der Mitte der Startseite können Forschende ein Stichwort oder eine Kategorie eingeben und so den passenden Datensatz finden. Journalisten können damit besonders schnell die relevanten Datensätze für ihre Recherchen finden. Besuchen Sie die Website, um mehr zu erfahren.
177. Nationmaster
NationMaster ist eine Quelle für vollständig aufbereitete Daten aus über 300 Ländern, die in über 5.000 Kategorien unterteilt sind. Die Daten umfassen unter anderem Zahlen zum Prozentsatz registrierter Todesfälle, Statistiken zum Zweiten Weltkrieg und sogar Informationen zu Atomkrieg und Atomtests. Forscher finden zudem Tabellen, Grafiken und Kreisdiagramme zur weiteren Visualisierung der Daten. Kurz gesagt: Die Bandbreite der abgedeckten Themen ist so groß, dass es immer wieder Neues zu entdecken gibt.
178. Followerwonk
Twitter ist seit Langem ein beliebtes soziales Netzwerk für Eilmeldungen und Trendthemen. Followerwonk ermöglicht es Nutzern, ihre Twitter-Nutzung zu optimieren. Dazu gehört das Finden von Kontakten zu anderen Nutzern, die Analyse der eigenen Follower und die Planung von Twitter-Aktivitäten für maximale Ergebnisse. Viele Reporter und Journalisten nutzen Twitter heutzutage zum Netzwerken und um ihre Geschichten zu verbreiten. Followerwonk steigert die Produktivität der Twitter-Nutzer.
179. Infochimps
Infochimps ist eine Plattform, die cloudbasierte Dienste anbietet, die sich flexibel an die Bedürfnisse von Big-Data-Nutzern anpassen lassen. Sie ist besonders hilfreich bei der Implementierung und Integration von Big-Data-Technologien und -Anwendungen. Für Forschende, die riesige Datenmengen durchsuchen oder Trends im Bereich Big Data analysieren, ist Infochimps eine unschätzbare Ressource. Auf der Website finden sich zudem zahlreiche Whitepaper und Fallstudien.
180. Archivierte Statistiken der nationalen Regierung
Archive-It, gegründet 2006, ist ein Service des Internet Archive. Er unterstützt Organisationen und Unternehmen beim Erstellen digitaler Sammlungen und hat dadurch bereits mit gemeinnützigen Organisationen, Hochschulen, Universitäten und Regierungsbehörden zusammengearbeitet. Forschende können verschiedene Archive auf der Website durchsuchen, darunter Webseiten zum US-Kongresswahlkampf 2014, das Staatsarchiv von Alabama und das PLN-Webarchiv der kanadischen Regierung. Für engagierte Journalisten ist diese Website eine wahre Fundgrube an Informationen.
181. Bürgergemeinschaften
Civic Commons bietet eine Seite mit einer Übersicht verschiedener Open-Data-Initiativen der Regierungen. Diese durchsuchbare Ressourcenliste ist nach Land, Stadt und Region geordnet und verweist auch auf Ressourcen zwischenstaatlicher Organisationen. Journalisten können über diese Seite schnell herausfinden, welche Regierungen am Open-Data-Projekt teilnehmen. Zudem bietet sie Zugang zu lokalen Daten, die bei einer einfachen Google-Suche nicht unbedingt gefunden würden.
182. Guardian Weltregierungen
Der Guardian ist in der Welt des Journalismus für seine Berichterstattung über aktuelle Ereignisse bekannt. Weniger bekannt ist jedoch, dass die Website auch eine Rubrik mit Daten zu Regierungen weltweit bietet. Dort finden sich Artikel über die Auswirkungen der Obdachlosenzahlen, Diskussionen zur Cybersicherheit und sogar fundierte Debatten über die Rolle von Daten und Statistiken im aktuellen politischen und gesellschaftlichen Klima. Die Rubrik „Weltregierungen“ des Guardian eignet sich hervorragend, um Diskussionen anzustoßen und neue Blickwinkel für Geschichten zu finden.
183. Open Government Data (Hub)
Diese Website gehört zu einer Gruppe der Open Knowledge Foundation, die die Weiterentwicklung offener Regierungsdaten fördern und unterstützen möchte. Hier finden Nutzer Links zu einer der umfangreichsten Listen offener Datenkataloge. Zu den weiteren Zielen der Gruppe, die auf der Website genannt wird, gehört die Recherche zu Richtlinien, Best Practices und Leitlinien. Journalisten erhalten hier umfassenden Zugang zu mehr und besseren Informationen.
184. Offene Regierung – Frankreich
Diese Website ist die Online-Plattform des Open-Data-Projekts der französischen Regierung. Die Daten lassen sich anhand von Kategorien wie Beschäftigung, Landwirtschaft, Bildung, Reisen und Tourismus durchsuchen. Sie ermöglichen ein differenzierteres Verständnis der Aussagekraft der Daten und bieten gleichzeitig Raum für Vergleiche auf Basis historischer Informationen. Journalisten haben also allen Grund, sich für diese Daten zu interessieren.
185. Universität Notre Dame
Diese Website speichert die Forschungsdaten, die über die Nutzung von SourceForge.net durch die University of Notre Dame verfügbar sind. Die Daten werden über relationale Datenbanken bereitgestellt. Die monatlichen Daten-Exporte ermöglichen zudem ein besseres Verständnis von Open-Source-Software und ihren Anwendungen. Um auf diese Informationen zuzugreifen, muss eine schriftliche Anfrage per E-Mail gestellt werden. Allerdings ist der Zugriff auf die Daten ausschließlich wissenschaftlichen Forschern vorbehalten.
186. UFO-Berichte
Das Nationale UFO-Meldezentrum bietet eine Online-Datenbank mit Berichten über Begegnungen mit unidentifizierten Flugobjekten. Forscher können ihre Suche in der Datenbank optimieren, indem sie nach Datum, Form des UFOs, Veröffentlichungsdatum oder sogar nach Bundesstaat filtern. UFOs faszinieren die Öffentlichkeit immer wieder aufs Neue. Sollten in Ihrer Nähe kürzlich UFO-Sichtungen stattgefunden haben, finden Sie hier die Berichte der Betroffenen.
187. WikiLeaks
WikiLeaks ist aufgrund der Kontroversen und der Enthüllungen über die internen Abläufe von Regierungen und anderen einflussreichen Persönlichkeiten in den Medien berüchtigt und genießt einen Ruf, der ihm vorauseilt. Obwohl die Veröffentlichungen selten still und leise erfolgen, zweifelt niemand an der Richtigkeit der Informationen. Für Journalisten, die nach Geschichten suchen, die sofort Aufmerksamkeit erregen, ist WikiLeaks eine bewährte Quelle. Und wenn schon nichts anderes, so bietet es doch interessante Lektüre.
188. Die Washington Post
Die Zeitung ist bereits als exzellente Quelle für aktuelle Nachrichten und Meinungsbeiträge bekannt, doch nur wenige wissen, dass die Washington Post Zugang zu den Rohdaten gewährt, die häufig in ihren Artikeln erwähnt werden. Auf der Datenseite finden Forschende Daten zu Kategorien wie Bildung, Volkszählung, Gesundheit und Sicherheit, Verkehr und Entwicklung, historische Datenbanken zur Fußball-Weltmeisterschaft und sogar Zahlen zu Regierung und Politik. Kurz gesagt: Der Zugang zu diesen Zahlen hilft, ein konkreteres Verständnis der aktuellen Themen zu entwickeln.
189. Klimadaten
Die Klimadaten sind ein Datensatz mit umfassenden Informationen zur globalen Temperatur. Im aktuellen Format können Nutzer alle wichtigen Klimainformationen in den Rastergrafiken einsehen und gleichzeitig die Durchschnittswerte abrufen. Für diejenigen, die nach den zugehörigen Daten suchen, ist es möglich, auf dieselben Informationen für Land und Ozean zuzugreifen. Diese Informationen können heruntergeladen oder – für mehr Komfort – direkt auf der Website angezeigt werden.
190. Proteinstruktur
Protein Structure ist eine Quelle, die untersucht, wie Computernetzwerke in Verbindung mit Biologie eingesetzt werden können. Die Seite bietet ein Datenarchiv, das über die bereitgestellten Links zugänglich ist. Besonders interessant für Forschende ist, wie die Seite verschiedene Ansätze wie Modellanalyse und ausführbare Biologie in ihre Zielsetzung integriert. Auch für Journalisten ist die Seite einen Besuch wert, um Fortschritte zu verfolgen und Daten zu analysieren.
191. Kostenlose Auswertung von Umfragedaten
Mithilfe dieser Website können Nutzer kostenlos einen Kurs zur Analyse von Umfragedaten belegen. „Umfragedaten kostenlos analysieren“ bietet ein detailliertes Inhaltsverzeichnis mit Abschnitten wie „Karten und die Kunst der Umfrage – Gewichtete Datenpflege“, „Ausgewogenes Verhältnis zwischen Vertraulichkeit der Befragten und Präzision der Varianzschätzung“, „Strukturgleichungsmodelle (SEM)“ und „Komplexe Umfragedaten“. Die Website eignet sich hervorragend zur Auffrischung des Wissens für alle, die zukünftig vermehrt mit statistischen Daten arbeiten werden.
192. UCLA
Auf der UCLA-Wiki-Seite finden Forschende zahlreiche Datensätze zu Demonstrationszwecken. Es stehen viele simulierte und beobachtete Daten zur Auswahl. Mithilfe dieser Ressourcen können beispielsweise Klimadaten, Bevölkerungsdaten, biomedizinische Daten, Daten aus der Neurobildgebung, Daten der US-Volkszählung, Wahldaten und Wirtschaftsdaten aus vielen weiteren Kategorien analysiert werden. Letztendlich stellen diese Datensätze eine wertvolle Ressource dar, von der viele profitieren können.
193. Universität von Toronto
Auf ihrer Webseite bietet die Universität Toronto Forschern Zugang zu den sogenannten Delve-Datensätzen. Diese Datensammlungen waren Teil eines größeren Projekts, das zum Vergleich verschiedener Lernmethoden entwickelt wurde. Letztendlich dienen diese Informationen der Entwicklung und Evaluation unterschiedlicher Lernansätze. Kurz gesagt: Sie stellen eine wertvolle Quelle für Forscher dar, die die Analyse und den Umgang mit Datensätzen besser verstehen möchten.
194. Naturschutzdienst
Der US-amerikanische Naturschutzdienst (Natural Resources Conservation Service) betreibt eine Website, die sich auf die Förderung des Naturschutzes konzentriert und Informationen zu verschiedenen Moosen, Hornmoosen, Gefäßpflanzen, Flechten und Lebermoosen in den Vereinigten Staaten bietet. Die Website enthält eine umfassende Pflanzendatenbank mit zahlreichen Abbildungen und weiterführenden Informationen. Forschende können die Datenbank herunterladen und finden darin viele Informationen zu Themen wie alternativen Nutzpflanzen. Kurz gesagt: Diese Website bietet alles Wissenswerte über Pflanzen.
195. Landwirtschaftlicher Forschungsdienst
Wie der Name der Behörde bereits vermuten lässt, deckt dieser Dienst den Forschungsbedarf des US-Landwirtschaftsministeriums ab. Sobald ein landwirtschaftliches Problem auftritt, ist diese Regierungsstelle höchstwahrscheinlich an der Lösungsfindung beteiligt. Die Website bietet zahlreiche Datensätze, die direkt abgerufen und heruntergeladen werden können. Journalisten können die Website ebenfalls nutzen, um sich über aktuelle Nachrichten zu landwirtschaftlichen Themen zu informieren.
196. Zellbildbibliothek
Diese Website bietet eine öffentliche Bibliothek mit Ressourcen, Informationen und Zugang zu Bildern und Animationen von Zellen und zellulären Prozessen. Sie ist sowohl für Forschung als auch für Lehre konzipiert und die hier bereitgestellten Informationen sind in Diskussionen über öffentliche Gesundheit und Krankheiten fast immer relevant. Die Materialien stammen aus verschiedenen Quellen, darunter historische und moderne Publikationen. Journalisten finden in der Zellbildbibliothek eine umfassende und verständliche Erklärung komplexer biologischer Prozesse.
197. Vollständige Genomik
Dies ist die Website eines Unternehmens, das sich als etablierter Akteur im Bereich der Biotechnologie, insbesondere der Sequenzierung des menschlichen Genoms, versteht. Bemerkenswerterweise hat Complete Genomics zahlreiche seiner vollständigen Genomsequenzen öffentlich zugänglich gemacht. Dies ermöglicht vielfältige und wertvolle Einblicke in die DNA und das sequenzierte menschliche Genom. Die einzige Bedingung für die Nutzung dieser Informationen ist, dass Forschende Complete Genomics als Quelle korrekt angeben.
198. Array Express
Array Express ist ein Repository, das Informationen aus Genomik-Experimenten speichert, die umfangreiche Sequenzierungen und Datenverarbeitungen erforderten. Auf dieser Website finden Nutzer die Ergebnisse von über 70.000 Experimenten sowie mehr als 2 Millionen Studien in mehreren Terabyte an Daten. Diese Informationen stehen zur freien Verwendung für Forschungszwecke zur Verfügung. Array Express ist eine hervorragende Ressource für alle aktuellen Informationen zur Genomik und den Fortschritten auf diesem Gebiet.
199. Kodieren
Die Enzyklopädie der DNA-Elemente (ENCODE-Konsortium) ist das Ergebnis der Zusammenarbeit von Forschungsgruppen aus aller Welt. Ziel ist es, eine Liste aller funktionellen Bestandteile des Genoms zu erstellen, die die detaillierte Untersuchung von RNA-Mengen, Proteinen, zellregulierenden Elementen und der Genaktivität umfasst. Die Daten sind durchsuchbar und bieten darüber hinaus weiterführende Informationen in der Enzyklopädie.
200. Ensemble-Genome
Ensemble Genomes ist eine im Jahr 2000 gegründete Website, die sich mit den Genomen von Wirbeltieren befasst. Im Laufe der Jahre wurden ergänzende Informationen zu wirbellosen Metazoen, Pflanzen, Bakterien und Pilzen hinzugefügt. Die Daten zu all diesen Themen sind über die auf der Website verfügbaren Links leicht zugänglich. Die Website bietet Tutorials, Datensätze zu allen behandelten Themen sowie eine Sammlung von Dokumenten zum Durchstöbern. All dies macht Ensemble Genomes zu einer hervorragenden Datenquelle für Journalisten.
201. Gen-Ontologie-Konsortium
Die Gene Ontology ist eine Website, die sich der computergestützten Darstellung des aktuellen Wissensstands über die Funktionsweise von Genen widmet. Sie bietet zahlreiche Publikationen und weiterführende Dokumentationen. Die Website enthält direkt auf der Website bereitgestellte Annotationen. Für Forschende, die die Zahlen und Rohdaten genauer analysieren möchten, stehen die Dateien direkt auf der Website zum Download bereit.
202. Bibliothek integrierter netzwerkbasierter zellulärer Signaturen
Das LINCS Center der Harvard Medical School hat es sich zum Ziel gesetzt, die Forschungsgemeinschaft und die Öffentlichkeit darüber zu informieren, wie menschliche Zellen auf die Einwirkung von Medikamenten reagieren. Mithilfe der HMS LINCS-Datenbank und des Projekt-Explorers finden Forschende Publikationen, Projektzusammenfassungen und allgemeine Ressourcen. Journalisten können die Website ebenfalls nutzen, um sich über aktuelle Forschungsergebnisse zu informieren.
203. Human Genome Diversity Project
Das Human Genome Diversity Project hat dank der Bemühungen des Stanford Human Genome Center große Fortschritte erzielt. Die Website bietet Tausende von Proben und Markern. Diese können heruntergeladen, eingesehen und umfassend analysiert werden, indem man einfach den bereitgestellten Links folgt. Dies ist eine wertvolle Ressource für Journalisten, die die Informationen der Forschungsgemeinschaft verstehen möchten.
204. JCB DataViewer
JCB DataViewer ermöglicht es allen Interessierten, die Inhalte des Journal of Cell Biology zu betrachten und die zugehörigen Bilddaten der dort veröffentlichten Artikel einzusehen. Die Website bietet eine umfassende Galerie, durch die man scrollen kann, um die Materialien zu betrachten. Darüber hinaus besteht die Möglichkeit, die Daten während des Besuchs der Website weiter zu analysieren. Kurz gesagt: Diese Website eignet sich hervorragend, um die in den Artikeln des Journals enthaltenen Referenzen und Abbildungen zu verstehen.
205. Genomic Data Commons Datenportal
Das GDC-Datenportal ist eine Plattform, die Forschende und Bioinformatiker bei ihrer Krebsforschung unterstützt. Es bietet ein Archiv, eine API sowie zahlreiche Dokumente zum Lesen und vieles mehr. Der Zugriff auf diese Website ermöglicht es, dieselben Informationen einzusehen, die Krebsforschende für ihre eigene Forschung nutzen. Journalisten finden hier alle benötigten Daten und darüber hinaus weitere relevante Informationen.
206. OpenSP
OpenSP ist ein Community-Projekt zum Austausch von Genotypen. Nutzer, deren Genotyp über FamilyTreeDNA, 23andMe oder deCODEme bestimmt wurde, können diese Informationen auf die Website hochladen. Ziel ist es, mögliche Zusammenhänge zwischen Genotypen und SNPs (Einzelnukleotid-Polymorphismen) zu untersuchen. Für Journalisten ist besonders interessant, dass die Daten zum Download und zur Analyse bereitstehen.
207. Pfadführer
Pathguide ist eine Website, die Informationen zu Stoffwechsel- und Signalwegen sowie zu Proteininteraktionen auf molekularer Ebene bereitstellt. Diese Seite bietet eine Liste mit ca. 697 Ressourcen zu diesem Thema. Die verlinkten Datenbanken sind in der Regel kostenlos zugänglich. Die meisten der aufgeführten Referenzen konzentrieren sich auf Protein-Protein-Interaktionen. Diese Website ist eine unschätzbare Ressource für alle Biologiebegeisterten.
208. RCSB PBB
Diese Website informiert Wissenschaftler und die breite Öffentlichkeit über Nukleinsäuren und Proteine. Die RCSB Proteindatenbank bietet Zugang zu verschiedenen Tools, die diesen Bereich der Biologie verständlicher machen, darunter Visualisierungswerkzeuge, 3D-Strukturdarstellung und ein vollständig durchsuchbares Archiv, das nach Organismen kategorisiert werden kann. Darüber hinaus bietet diese Website aktuelle Nachrichten zu allen neuesten Entwicklungen auf diesem Gebiet.
209. Psychiatrisches Genomik-Konsortium
Das Psychiatric Genomics Consortium ist das Ergebnis der Zusammenarbeit von Forschern und Wissenschaftlern aus aller Welt, die die genetische Komponente psychiatrischer Erkrankungen untersuchen. Im Rahmen dieses Projekts wurden 17 Hauptpublikationen und 31 weitere Publikationen mit Sekundäranalysen und Methoden veröffentlicht. Eine wegweisende Publikation bildete das Ergebnis dieser Zusammenarbeit. Das Konsortium stellt auf Anfrage Tools, Downloads und Zugang zu den Forschungsergebnissen über das Datenportal zur Verfügung.
210. Pub Chem
PubChem genießt seit Langem einen hervorragenden Ruf in der medizinischen und biologischen Forschung. Mit der Möglichkeit, Strukturen sowie die Datenbanken für Verbindungen, Bioassays und Substanzen zu durchsuchen, ist diese Website für Forschende eine unverzichtbare Ressource. Jede dieser Datenbanken enthält Millionen von Einträgen. Diese Informationen lassen sich mithilfe von Tools wie den 3D-Konformer- und Bioassay-Tools visualisieren. Die Daten stehen außerdem zum Download bereit.
211. KOSMISCH
Wie der Name schon sagt, widmet sich der Catalogue of Somatic Mutations In Cancer (COSMIC) der Erfassung und Erforschung der Auswirkungen somatischer Mutationen bei Krebs. Die Website ermöglicht die Suche in COSMIC nach Krebsart, Gen und Mutation. COSMIC bietet Tools wie den Genom-Browser und den Krebs-Browser. Darüber hinaus stehen auf der Website Daten zu Genkuratierung, Arzneimittelresistenz, Genom-Screenings, Mutationssignaturen und Genfusionskuratierung zum Download bereit.
212. Genomik der Arzneimittelempfindlichkeit bei Krebs
Das Projekt „Genomik der Arzneimittelempfindlichkeit bei Krebs“ widmet sich der Suche nach Biomarkern, die Ärzten helfen, das Krebsmedikament zu identifizieren, auf das Patienten mit höherer Wahrscheinlichkeit ansprechen. Journalisten können sich über die News-Registerkarte über neue Daten und Änderungen auf der Website informieren. Darüber hinaus bietet die Website eine Sammlung von Daten zu Zelllinien, eine Datenbank mit Informationen zu den Merkmalen von Krebs sowie eine Liste von Wirkstoffen.
213. Stowers Institut für medizinische Forschung
Die Website des Stowers Institute for Medical Research bietet interessierten Nutzern kostenlosen Zugang zu den Daten, die die Wissenschaftler, Forschungswissenschaftler und Genomforscher des Instituts für ihre Publikationen verwendet haben. Das Institut betont ausdrücklich, dass der Zugriff auf das Stowers Original Data Repository in der Regel kostenlos ist. Allerdings sind einige der größten Dateien in der Datenbank möglicherweise nicht direkt über das Internet zugänglich und erfordern gegebenenfalls zusätzliche Vorkehrungen.
214. SSBD-Datenbank
Die Datenbank „Systems Science of Biological Dynamics“ (SSBD) bietet eine Reihe von Werkzeugen und Ressourcen zur Untersuchung mikroskopischer Bilder und zur Auswertung quantitativer biologischer Daten. Die hier verfügbaren Bilder stammen aus verschiedenen Quellen und umfassen Objekte wie Zellen, Einzelmoleküle und Genexpressionskerne. Da die Daten auf dieser Website aus Computersimulationen und Experimenten gewonnen werden, können Journalisten sicher sein, dass die Informationen ständig aktualisiert und verfeinert werden.
215. Teilen persönlicher Genome
Das Personal Genome Project ist eine Website, die sich auf die Erstellung öffentlich zugänglicher Gesundheits-, Genom- und Merkmalsdaten konzentriert. Das Projekt wird größtenteils mit Unterstützung von Personen fortgeführt, die sich freiwillig bereit erklärt haben, ihre Genominformationen zu veröffentlichen. Die Website stellt die gefundenen und erfolgreich erfassten Daten kostenlos zur Verfügung. Abgesehen von der Wissenschaft bietet das Projekt Journalisten interessante Einblicke in die Auswirkungen der öffentlichen Erfassung persönlicher Genominformationen.
216. UCSC Genome Browser
Der USCS Genome Browser ermöglicht es Nutzern, Genomsequenzen einzusehen. Neben der Online-Ansicht bietet die Website auch Links zum Herunterladen der Sequenzen und Annotationen dieser Genomsequenzen. Diese Links sind in die Kategorien Mensch, Säugetiere, andere Wirbeltiere, Deuterostomier, Insekten, Nematoden, andere Genome und weitere Downloads unterteilt. Die Tools und Verzeichnisse dieser Website sind für den privaten und nicht-kommerziellen Gebrauch kostenlos. Journalisten profitieren von der Vollständigkeit und Zugänglichkeit dieser Informationen.
217. UniProt
Die universelle Proteinressource UniProt ist die zentrale Anlaufstelle für Informationen zur Proteinsequenzierung und -annotation. Sie greift auf die Daten dreier Datenbanken zurück: der UniProt-Referenzcluster, der UniProt-Wissensdatenbank und des UniProt-Archivs. Die Website bietet unter anderem Suchfunktionen für Peptide und Cluster. Journalisten können UniProt nutzen, um neue Erkenntnisse im Bereich der Proteinsequenzierung und -annotation zu überprüfen, zu entdecken und mehr darüber zu erfahren.
218. Daten des Aktuars-Klimaindex
Der Actuaries Climate Index (ACI) informiert die Öffentlichkeit und Entscheidungsträger über Klimatrends und die Auswirkungen des Klimawandels in Kanada und den USA. Forschende können die bereitgestellten Informationen nutzen, um tiefgreifende Veränderungen von Meer und Wetter zu erkennen. Die Suche lässt sich nach Regionen und Komponenten eingrenzen. Die Website greift auf jahrzehntelange Daten zurück und aktualisiert ihre Informationen vierteljährlich.
219. Luftfahrtwetterzentrum
Das Luftfahrtwetterzentrum stellt präzise, zeitnahe und aktuelle Wetterinformationen bereit, auf die sich das Luftraumsystem verlassen kann. Auf dieser Website können Nutzer verschiedene Grafiken, Vorhersagen und Beobachtungen zum Wetter einsehen, die speziell für Piloten verständlich aufbereitet sind. Die von den Datenquellen der Website bereitgestellten Informationen können in Echtzeit im CSV- oder XML-Format abgerufen werden. Forscher können die Rohdaten mithilfe der Download-Option genauer analysieren und bearbeiten.
220. Klimaforschungseinheit
Die Website der Klimaforschungseinheit dient ausschließlich der Erforschung der Auswirkungen des Klimawandels in der Vergangenheit, der Untersuchung seiner Ursachen und der Suche nach Lösungen für aktuelle Klimaprobleme. Hier können Interessierte die Forschungsergebnisse nachlesen, sich anhand von Informationsblättern einen Überblick über das Thema verschaffen, Publikationen lesen und sogar auf die Rohdaten zugreifen. Journalisten, die nach Wetterdaten suchen, finden hier eine wertvolle Ressource.
221. Europäische Klimabewertung und Datensatz
Auf der Website des Europäischen Klimabewertungs- und Datensatzes (ECADS) können sich Interessierte über extreme Klima- und Wetterveränderungen informieren. Forschende haben die Möglichkeit, das Forschungstool des Projekts, den KNMI Climate Explorer, zu nutzen, um Daten zu überprüfen, saisonale Vorhersagen zu analysieren und unter anderem die Auswirkungen von El Niño genauer zu untersuchen. Da dieser Datensatz täglich aktualisiert wird, erfahren Journalistinnen und Journalisten, die diese Quelle nutzen, als Erste von Anzeichen extremer Klimaveränderungen.
222. Globale Bildsuchdienste
Global Imagery Browse Services (GIBS) ist ein wesentlicher Bestandteil von EOSDIS und stellt als Anbieter responsiver und auf Community-Standards basierender Bilddienste bereit. Anders ausgedrückt: GIBS ermöglicht es jedermann, hochauflösende Satellitenbilder von nahezu jedem Ort der Erde zu nutzen. Da EOSDIS GIBS über die Erdbeobachtungsdaten der NASA bereitgestellt wird, ist es für Journalisten und Forscher einfacher denn je, in Echtzeit mehr über die Welt zu erfahren.
223. Bering-Klima und Ökosystem
Diese Website, die von der Nationalen Ozean- und Atmosphärenbehörde (NOAA) der US-Regierung betrieben wird, bietet Journalisten und Forschern umfassende Informationen darüber, wie das Klima und das Ökosystem der Beringsee auf die Veränderungen in der Arktis reagieren. Hier können Leser Artikel lesen, Prognosen einsehen und mithilfe des Online-Datentools die Entwicklung verschiedener Klimaindizes sowie biologischer, atmosphärischer und ozeanografischer Daten und der Tierwelt in der Beringsee verfolgen.
224. NCEI
Das NCEI (National Centers for Environmental Information) entstand aus dem Zusammenschluss der drei Datenzentren der National Oceanic and Atmospheric Administration (NOAA). Diese Seite bietet eine Reihe von Links in 22 Kategorien, die Nutzer zu verschiedenen Ressourcen, relevanten Seiten sowie Klima- und Wetterdatensätzen führen. Journalisten, die Informationen zu Klima, Stürmen, Niederschlag und anderen Wetterphänomenen suchen, werden hier voraussichtlich fündig.
225. Erdsystemforschungslabor
Die Abteilung für globales Monitoring der Nationalen Ozean- und Atmosphärenbehörde (NOAA) liefert Informationen zu den langfristigen Trends der Klimaveränderungen auf der Erde durch die Überwachung wichtiger atmosphärischer Messgrößen. Dazu gehören beispielsweise Kohlenmonoxid, Methan, Lachgas und Kohlendioxid. Anhand dieser Messgrößen werden unter anderem der langfristige Ozonabbau, Kohlendioxidquellen und -konzentrationen sowie -senken bestimmt. Journalisten können diese Informationsquelle zum Klimawandel nutzen.
226. WorldClim – Globale Klimadaten
Wollten Sie Klimadaten schon immer besser visualisieren? WorldClim ist eine Software, die kostenlose Daten bereitstellt, die sich für räumliche Modellierung und Kartenerstellung eignen. Die aktuelle Version dieser kostenlosen Software kann nur auf das gegenwärtige Klima angewendet werden, während die ältere Version Zugriff auf Klimadaten aus Vergangenheit und Gegenwart ermöglichte und Nutzern zudem den Stand zukünftiger Klimaprognosen anzeigte. Journalisten können die Software einfach über den Link herunterladen.
227. Wissensfindungslabor
Das Knowledge Discovery Laboratory (KDL) widmet sich der Entwicklung innovativer Technologien, den Grundlagen des maschinellen Lernens und der Anwendung dieses Wissens in praktischen Bereichen wie Netzwerkforschung, Betrugserkennung und der Analyse wissenschaftlicher Daten. Das KDL beherbergt einen umfangreichen Datensatz im DBLP mit 1,2 Millionen Objekten und 2,48 Millionen Links. Für Forschende, die sich für die Ziele des KDL interessieren, ist dieser Datensatz eine hervorragende Ressource.
228. Herausforderung bei der DIMACS-Implementierung
Die Website der 9. Implementation Challenge unterstützt Forschende beim Lösen von Kürzeste-Wege-Problemen. Die Entwickler verfolgten dabei zwei Ziele: Erstens, die besten reproduzierbaren Lösungen zu finden, und zweitens, die Zusammenarbeit von Forschenden zu erleichtern und so die Entwicklung effektiverer Lösungen zu fördern. Interessierte können die auf der Website verfügbaren Veröffentlichungen und Datensätze einsehen und sich über die Fortschritte informieren.
229. Netzwerk-Repository
Das Netzwerk-Repository ist eine Plattform, auf der wissenschaftliche Daten gespeichert und durch interaktive Visualisierungswerkzeuge ergänzt werden, die Nutzern zur Analyse zur Verfügung stehen. Diese Plattform zeichnet sich dadurch aus, dass sie sowohl die erste als auch die größte ihrer Art im Internet ist. Durch die Verwendung von grafischen Darstellungen und intuitiven, visuell ansprechenden Bildern wird es deutlich einfacher, Vergleiche anzustellen und neue Wege der Kontextualisierung von Daten zu finden. Journalisten können diese Quelle nutzen, um Geschichten innerhalb der wissenschaftlichen Daten zu entdecken.
230. Pajek-Datensätze
Pajek Datasets ist eine Webseite mit einem Datensatz zu den Proteininteraktionen in Bäckerhefe. Nach einer kurzen Erläuterung der Bedeutung neuer Methoden zur Erkennung von Interaktionen und der Wichtigkeit der Unterscheidung verschiedener Protein-Protein-Interaktionen verlinkt die Webseite direkt zum herunterladbaren Datensatz. Weiterführende Informationen finden Sie in der zugehörigen wissenschaftlichen Publikation, die Sie über den Link am Ende der Seite erreichen.
231. Mejn Netzwerkdaten
Diese Website bietet Links zu den vom Website-Betreiber verwendeten und zusammengestellten Netzwerkdatensätzen. Die Themen der Datensätze reichen von American College Football, politischen Blogs und Büchern zur amerikanischen Politik bis hin zu sozialen Netzwerken, Les Misérables und Kooperationen im Bereich der Hochenergietheorie. Interessierte finden hier eine große Auswahl an Datensätzen zu verschiedenen Themen. Die Daten dürfen kostenlos genutzt werden, sofern die Quelle angegeben wird.
232. Die Stanford GraphBase
Die Stanford GraphBase ist der Name einer Sammlung von Datensätzen und Programmen, die von Donald Knuth von der Stanford University entwickelt wurden. In Kombination miteinander können diese Programme und Datensätze Graphen und Netzwerke bearbeiten und generieren. Die benötigten Materialien stehen auf dieser Website über die angegebenen Links zum Download bereit. Die Dateien enthalten unter anderem Daten zu Fußballergebnissen, Wörterbuchdaten und Daten zur Rekonstruktion der Mona Lisa.
233. SuiteSparse Matrix Collection
Die SuiteSparse Matrix Collection, ehemals bekannt als University of Florida Sparse Matrix Collection, ist eine Sammlung von Matrizen mit praktischen Anwendungsbereichen. Laut Website wird diese Sammlung häufig in der numerischen linearen Algebra zur Entwicklung und Optimierung von Algorithmen für dünnbesetzte Matrizen verwendet. Nutzer schätzen die Sammlung besonders für ihre Nützlichkeit beim Durchführen und Testen von Experimenten. Die Datensätze und Matrix-Benchmarks stehen direkt auf der Website zum Download bereit.
234. Graphdatensätze
Dies ist eine Sammlung von Datensätzen, die nach Ansicht der Ersteller dieser Webseite entweder relational sind oder sich gut in eine Graphdarstellung übertragen lassen. Graph Datasets bietet Forschern, die lernen möchten, mit Rohdaten zu arbeiten, Datensätze wie die Daten der Predictive Toxicology Challenge, IMDb-Daten, Mutagenesedaten, MovieLens-Daten, Daten zum kollaborativen Filtern und Proteindaten. Die Dateien stehen auf dieser Seite zum Download bereit und sind hauptsächlich im XML-Format verfügbar.
235. Neuigkeiten zu Big Data
Big Data News ist eine Website, die sich auf Big Data und die Grundlagen der Datenwissenschaft konzentriert. Hier finden Sie aktuelle Nachrichten sowie Diskussionen zu Deep Learning und Künstlicher Intelligenz. Darüber hinaus bietet Big Data News einen riesigen Datensatz mit insgesamt rund 3,5 Milliarden Webseiten. Diese sind in verschiedene Ebenen unterteilt: Seiten-, Subdomain-, Subdomain- und Domain-Graphen der ersten Ebene.
236. Zentrum für Forschung zu komplexen Netzwerken und Systemen
CNetS, das Center for Complex Networks and Systems Research, ist Teil des Indiana University Network Science Institute und der School of Informatics and Computing. Die Website dient als Ressource für Datenwissenschaft, computergestützte Sozialwissenschaft sowie komplexe Netzwerke und Systeme und bietet Informationen zu Datenanalyse und Online-Verkehrsmustern. Darüber hinaus hostet CNetS einen Datensatz mit rund 53,5 Milliarden Netzwerk-Anfragen von Nutzern der Indiana University.
237. OONI Explorer
OONI Explorer, ein Teil des Open Observatory of Network Interference (OONI), ist ein Projekt, das sich der Bereitstellung freier Open-Source-Software widmet. Nutzer können die Software verwenden, um unter anderem Webseiten und Messenger-Apps zu blockieren. Besonders interessant für alle, die sich für diese Technologie interessieren, ist der freie Zugriff auf die von OONI gesammelten Rohdaten. Geben Sie einfach die Informationen in OONI Explorer ein und analysieren Sie die Daten.
238. Herausforderungen im maschinellen Lernen
„Challenges in Machine Learning“ widmet sich der Forschung und Entwicklung im Bereich des maschinellen Lernens. Auf dieser Website finden Leser Links zu Software, Büchern, Wettbewerben im Bereich maschinelles Lernen sowie Hinweise auf bevorstehende Workshops. Die Website bietet sogar Links zu Wettbewerben, bei denen Beiträge auch nach Ablauf der Frist eingereicht werden können. Journalisten, die sich dafür interessieren, ob maschinelles Lernen Aufgaben wie Finanzprognosen oder die Klassifizierung von Webseiten bewältigen kann, sollten diese Website unbedingt besuchen.
239. DataX
DataX, aktuell Teil von CrowdANALYTIX, fungiert als die technische Komponente einer gemeinschaftlich getragenen Initiative. Diese nutzt die kollektive Kraft, um maßgeschneiderte Anwendungen für Künstliche Intelligenz, Maschinelles Lernen und Neurolinguistisches Programmieren (NLP) zu entwickeln. DataX übernimmt dabei Wartung und Bereitstellung und trägt so zur Skalierbarkeit der Lösungen bei. Journalisten, die Unmengen an Texten, Videos und Daten sichten müssen, können mit den Bots von CrowdANALYTIX und DataX ihre Recherchezeit halbieren.
240. Gesteuerte Daten
Driven Data kombiniert Crowdsourcing mit Data Science auf eine Weise, die kaum eine andere Plattform bietet. Die Seite legt Wert darauf, Organisationen bei der Bewältigung verschiedener sozialer Herausforderungen zu unterstützen und nutzt ihre umfangreiche Data-Science-Community, um statistische Modelle zur Beantwortung von Vorhersagefragen zu entwickeln. Driven Data scheint primär mit gemeinnützigen Organisationen zusammenzuarbeiten, ist aber potenziell für alle nützlich, die Rohdaten aufbereiten möchten. Journalisten sollten diese Quelle im Hinterkopf behalten.
241. Offene Big Data
Die Dandelion API ist eine Anwendung zur semantischen Textanalyse von Big Data. Für Anwender mit zu verarbeitenden Daten bedeutet dies, dass das Programm unstrukturierte Texte in einen Kontext setzt. Journalisten, die große Mengen an Dokumenten analysieren, profitieren besonders von dieser Funktion. Die Dandelion API bietet außerdem Open Big Data in den Kategorien Mailand, Trient und Europa an. Obwohl die API kostenpflichtig ist, steht täglich ein bestimmtes Textvolumen zur kostenlosen Analyse zur Verfügung.
242. Erdmodelle
Earth Models konzentriert sich auf den Austausch und die Speicherung von Software und Datensätzen mit Bezug zur Erde. Die auf der Website erwähnten Modellierungswerkzeuge umfassen Simulationssoftware und -verarbeitung sowie virtuelle Daten, die stark auf spezifischen Forschungsbereichen wie Tektonik und Seismologie basieren. Journalisten und Forscher, die ihr Wissen zu diesem Thema vertiefen möchten, können die Publikationen und Artikel auf dieser Website nutzen, bevor sie sich mit den Modellierungs- und Visualisierungswerkzeugen auseinandersetzen.
243. Zentrum für sozioökonomische Daten und Anwendungen (SEDAC)
Das Socioeconomic Data and Applications Center (SEDAC) ist eines der Datenzentren des NASA-Systems EOSDIS. Auf dieser Website finden Nutzer Datensätze mit Zahlen zum Klimawandel und rasterbasierten demografischen Informationen. Die Datensätze lassen sich nach Themen wie Regierungsführung, Landwirtschaft, Landnutzung, Gesundheit, Naturschutz, Klima, Wasser, Fernerkundung und Armut durchsuchen. Karten, Galerien und Leitfäden bieten zusätzlichen Kontext zu den Daten. Darüber hinaus stehen Forschern auf der Website weitere Ressourcen und Tools zur Verfügung.
244. AODN-Portal
Das AODN-Portal, eine Website des Australian Ocean Data Network, bietet Zugang zu australischen Klimaforschungs- und Meeresdaten. Forschende, die auf diese Informationen zugreifen, erhalten auch Zugriff auf die IMOS-Daten und die Metadaten. Dieses Forschungsframework wird von mehreren Institutionen, darunter der australischen Regierung, unterstützt. Forschende, die das AODN-Portal nutzen, können eine optimale Bereitstellung der Meeresdaten über eine intuitive Benutzeroberfläche erwarten.
245. Planet OS
Planet OS bietet ein Big-Data-Framework mit Schwerpunkt auf erneuerbaren Energien. Diese Spezialisierung und die Expertise der Plattform haben sie bei Energieunternehmen beliebt gemacht, die nach neuen Wegen suchen, ihre Daten zu visualisieren und in den Kontext zu setzen. Zusätzlich verfügt die Plattform über den sogenannten DataHub mit einer umfangreichen Sammlung von über 2.000 Datensätzen. Diese Datensätze umfassen offene Daten von NASA und Copernicus und werden regelmäßig aktualisiert.
246. SMITHSONIAN INSTITUTION
Das Smithsonian genießt seit Langem hohes Ansehen in der Wissenschaft und wird weltweit für sein Engagement in Forschung und Geschichte geschätzt. Daher ist es naheliegend, dass das Smithsonian eine Website betreibt, die einige der besten Online-Informationen zur Vulkanforschung bietet. Die Website veröffentlicht Berichte, Links zu Forschungsarbeiten und Datenbanken mit präzisen Suchfunktionen für Vulkane, Ausbrüche, Emissionen und Deformationen, ergänzt durch eine Liste und Tabelle holozäner Vulkane. Journalisten benötigen keine weitere Quelle für Informationen zur vulkanischen Aktivität.
247. Erdbebenkatalog
Der vom Erdbebengefahrenprogramm der US-Regierung aktualisierte und gepflegte Erdbebenkatalog ermöglicht es Forschern, Ort und Zeitpunkt des letzten Erdbebens einzusehen. Die Suchergebnisse sind zwar auf 20.000 Einträge begrenzt, die Suche kann jedoch nach Stärke, Datum und Uhrzeit sowie nach geografischer Region gefiltert werden. Diese Flexibilität macht die Ressource besonders hilfreich für Journalisten, die über Naturkatastrophen oder lokale Erdbeben berichten und Hintergrundinformationen suchen.
248. Amerikanische Wirtschaftsvereinigung
Die American Economic Association stellt Forschern makroökonomische Daten für die USA und andere Länder weltweit zur Verfügung. Die Website scheint selbst keine Wirtschaftsdaten zu erstellen, sondern vielmehr eine Auswahl der zuverlässigsten Quellen zusammenzustellen. Angesichts der Vielzahl an Websites mit Wirtschaftsinformationen im Internet ist dies jedoch eine Quelle, die Journalisten als glaubwürdig einstufen können. Besuchen Sie einfach die Website und klicken Sie sich durch die verschiedenen Kategorien von Wirtschaftsdaten.
249. Historicalstatistics.org
Historicalstatistics.org ist eine äußerst nützliche Website, um Wirtschaftsinformationen zu finden, die einen interessanten Kontrast zur Gegenwart bieten. Beispielsweise ermöglicht der historische Währungsrechner der Website Forschern herauszufinden, wie viel man heute mit 10 US-Dollar aus dem Jahr 1923 kaufen könnte. Die Website bietet außerdem Publikationen und Abhandlungen zu den in der Wirtschaftsgeschichte verwendeten Kennzahlen sowie Preisindizes und Informationen zur Geldmenge, die nach Ländern gefiltert werden können.
250. DB Nomics
Was wäre, wenn alle öffentlich zugänglichen Wirtschaftsdaten im Internet über eine einzige, benutzerfreundliche Plattform abgerufen und durchsucht werden könnten? Db.nomics ist ein Aggregator für Wirtschaftsdatenbanken, der genau dies ermöglicht. Die Daten sind in Formaten wie HTML, JSON und CSV verfügbar und werden automatisch aktualisiert, während frühere Versionen entsprechend archiviert werden. Zu den Quellen gehören unter anderem die Federal Reserve, das Bureau of Economic Analysis und der Internationale Währungsfonds. Forscher, die nach verlässlichen Wirtschaftsdaten suchen, sind mit Db.nomics bestens beraten.
251. Gemeinsamer Hub für Auslandsschulden (JEDH)
Das Joint External Debt Hub, ein Gemeinschaftsprojekt der Bank für Internationalen Zahlungsausgleich (BIZ), der Organisation für wirtschaftliche Zusammenarbeit und Entwicklung (OECD), des Internationalen Währungsfonds (IWF) und der Weltbank, stellt der Öffentlichkeit Informationen zu Schuldendaten sowie internationalen Gläubigern und Schuldnern zur Verfügung. Journalisten, die sich mit den Finanzen verschiedener Länder befassen und ein tieferes Verständnis der internationalen Finanzlandschaft gewinnen möchten, finden hier nahezu alle benötigten Informationen.
252. Internationale Handelsdaten
Diese Seite zu internationalen Handelsdaten, die unter maßgeblicher Mitwirkung des führenden Wirtschaftsexperten Jon Haveman erstellt wurde, bietet Daten zum Herunterladen und Analysieren. Die Datensätze umfassen Zolldaten, Penn-World-Tabellen, Daten zu Versorgungsunternehmen, Importdaten, Produktivitätsdaten des verarbeitenden Gewerbes, Warenklassifizierungen, Rauch-Produktdifferenzierungscodes, NBER-Daten, die Warenstromerhebung von 1997, Daten zu Handel und Einwanderung sowie das nützliche Gravitationsmodell. Die Daten wurden unter UNIX kompiliert, sind aber laut Website auch auf PCs zugänglich.
253. Offene Unternehmen
Auf OpenCorporates haben Forscher die Möglichkeit, in einer der größten offenen Unternehmensdatenbanken weltweit nach Informationen zu suchen. Diese Informationen werden anschließend von verschiedenen Gruppen weltweit genutzt, darunter Banken, Ermittler, NGOs und Journalisten, um Erkenntnisse und Informationen zu gewinnen. Journalisten profitieren zusätzlich davon, mithilfe der OpenCorporates-API sowie über die zentralen Datensätze oder andere Kerndatensätze in Echtzeit auf die Daten zugreifen zu können.
254. Unsere Welt in Daten
Our World in Data sammelt Informationen aus verschiedenen Quellen und Bereichen und präsentiert quantifizierte Daten dazu. Von Zahlen zur Erwerbsbeteiligung von Frauen über Informationen zur allgemeinen Korruptionswahrnehmung im öffentlichen Sektor bis hin zur globalen Einkommensungleichheit – wenn sich ein Thema anhand von Daten beschreiben lässt, findet sich auf dieser Website möglicherweise ein Eintrag dazu. Journalisten können diese Quelle nutzen, um Statistiken und Zahlen zu sozialen Themen zu finden.
255. Science Po
Sciences Po, besser bekannt als Institut für Politikwissenschaft, ist eine Hochschule mit unbestreitbarem Einfluss in den Sozialwissenschaften. Auf der Webseite von Thierry Mayer finden sich beispielsweise Datensätze mit Regressionsdaten zu Gravitation und militärischen Konflikten aus dem Projekt „Make Trade Not War“ sowie Datensätze zu Marktpotenzialen und vielem mehr. Journalisten, die die Schlussfolgerungen wissenschaftlicher Zeitschriften besser verstehen möchten, werden hier zahlreiche Informationen finden.
256. Zentrum für internationale Daten
Seit seiner Gründung im Jahr 1999 widmet sich das Center for International Data der Aufgabe, internationale Wirtschaftsdaten sowohl offline als auch online zu sammeln, zu erstellen, zu verbessern und zu verbreiten. Auf der Website finden Leser Informationen wie US-Zolldaten, weltweite und US-amerikanische Import- und Exportdaten sowie Daten der Penn World Table. Diese Informationen stehen der Öffentlichkeit für Bildungs- und Forschungszwecke zur Verfügung; Journalisten können kostenlos darauf zugreifen und sie nutzen.
257. Observatorium für wirtschaftliche Komplexität
Das Observatory of Economic Complexity (OEC) ermöglicht es Forschern, Studierenden, Wirtschaftswissenschaftlern und allen anderen Interessierten, internationale Handelsdaten zu visualisieren. Mit seinen ansprechenden Designs und der interaktiven Benutzeroberfläche bietet die Website Forschern eine völlig neue Möglichkeit, internationale Handelsinformationen zu erkunden. Für Journalisten, die Wirtschaftsdaten gerne anschaulich erleben, ist das OEC eine unschätzbare Ressource.
258. College-Scorecard-Daten
Hochschulbildung ist in vielen Kreisen ein heiß diskutiertes Thema. Studierende und ihre Familien möchten wissen, wie die Hochschulen im Vergleich abschneiden und wie gut die Studierenden lernen. Das US-Bildungsministerium stellt Lehrenden und Studierenden mit seinen Daten des College Scorecard all diese Informationen und mehr zur Verfügung. Die Zahlen umfassen den Zeitraum von 1996 bis 2016 und beinhalten aktuelle Daten, Scorecard-Ergebnisse, Informationen zu den Einkünften nach dem Studium sowie neue Daten des National Student Loan Data System. Es handelt sich um eine aktuelle Quelle für Hochschulbildung, die Journalisten unbedingt nutzen sollten.
259. Datensatz zur Energieeffizienz von Gewerbegebäuden
Da sich COMBED primär mit Energie befasst, ist der Datensatz von Natur aus einzigartig. Hinzu kommt, dass die Daten mehrmals pro Minute aktualisiert werden und aus einem Gewerbegebäude stammen – dieser Datensatz ist also wirklich einzigartig. Für Journalisten sind diese Informationen äußerst hilfreich bei der Recherche zu Artikeln über Energieverbrauch. Der Zugriff auf die COMBED-Daten ist denkbar einfach: Man muss lediglich eine Excel-Tabelle herunterladen und öffnen.
260. DRED-Datensatz
Der Begriff DRED in DRED Database steht für Dutch Residential Energy Dataset (Niederländischer Datensatz zum Energieverbrauch von Privathaushalten). Wie der Name schon sagt, erfasst und analysiert dieser Datensatz den Energieverbrauch eines einzelnen Haushalts in den Niederlanden. Umgebungsbedingungen, Belegung, Stromverbrauch und allgemeine Haushaltsinformationen wurden in diesem Datensatz vom 5. Juli 2015 bis zum 5. Dezember 2015 erfasst. Journalisten, die zum Thema Energieverbrauch recherchieren, können die hier bereitgestellten Rohdaten nutzen. Anweisungen zum Herunterladen der Daten im CSV-Format finden Sie direkt auf der Website.
261. ECO-Datensatz
ECO (Electricity Consumption and Occupancy) ist ein Projekt der Distributed Systems Group. Im Rahmen dieses Projekts überwachten Forscher acht Monate lang den Stromverbrauch und die Anwesenheit in sechs Schweizer Haushalten. Diese Website bietet Zugriff auf diese Daten sowie Anleitungen und Links zu weiterführenden Publikationen. Dank des interaktiven Dashboards können Journalisten die Forschungsergebnisse problemlos ansprechend aufbereiten.
262. Indischer Datensatz für Umgebungswasser und Energie
IAWE (Indian Dataset for Ambient Water and Energy) wurde entwickelt, um den Energieverbrauch eines Haushalts in Neu-Delhi anhand von Strommessungen an Haushaltsgeräten, dem Stromzähler und dem Sicherungskasten zu überwachen. Aufgrund von Stromausfällen, Unterschieden in der Wasserversorgung, Paketverlusten und Spannungsschwankungen stieß IAWE auf Probleme, die spezifisch für die Erfassung des Energieverbrauchs in Indien sind. Journalisten können diese Daten dennoch für ihre Berichterstattung über Energieverbrauchsmuster nutzen.
263. Stromverbrauch von Haushaltsgeräten im Vereinigten Königreich
UK Domestic Appliance-Level Electricity (UK-DALE) ist ein Datensatz, der den Stromverbrauch von fünf Haushalten erfasst und aufzeichnet. Alle sechs Sekunden misst UK-DALE den Verbrauch sowohl des öffentlichen Stromnetzes als auch der einzelnen Haushaltsgeräte. Journalisten, die sich für den Energieverbrauch britischer Haushalte interessieren, können UK-DALE nutzen. Die Daten sind frei zugänglich, und eine Beschreibung des Systems ist verfügbar.
264. ArcGIS
ArcGIS Hub ist eine Plattform, mit der Organisationen und Einzelpersonen ihre Ziele durch unternehmensweite Initiativen erreichen können. Mit Seitenvorlagen, Schritt-für-Schritt-Anleitungen und Beispielen bietet diese Website eine hervorragende Ressource für ambitionierte Akteure im sozialen Bereich. Die Informationen unter dem Reiter „Open Data“ umfassen allein in der Kategorie „Katastrophen“ Hunderte von Datensätzen. Ob Journalisten Daten recherchieren oder beisteuern – ArcGIS Hub ist in vielerlei Hinsicht nützlich.
265. Cambridge GIS
Cambridge GIS ist das Open-Data-Repository der Stadt Cambridge, Massachusetts. Mit Ausnahme von Dateien, die zu groß für den Download über dieses GitHub-Repository sind, finden Sie die meisten Datensätze der Stadt auf dieser Seite. Die hier verfügbaren Datensätze umfassen Gewerbegebiete, Wegerechte, Bebauungspläne, Volkszählungsergebnisse, Friedhöfe sowie weitere Sehenswürdigkeiten und Merkmale, die sich anhand von Daten quantifizieren lassen. Journalisten, die nach lokalen Informationen suchen, finden hier alles, was sie benötigen, und noch vieles mehr.
266. Geo-Wiki.org
Geo-Wiki ist eine Ressource, die sich der sogenannten „Citizen-Science-Bewegung“ widmet. Hier werden Bürgerinnen und Bürger dazu ermutigt, sich aktiv an der Umweltbeobachtung zu beteiligen. Forschende finden in der Seitenleiste aktuelle Nachrichten sowie Namen von Publikationen und kostenlose Datensätze und Software zum Download. Zu den bereitgestellten Tools gehören Karten, die Möglichkeit zum Hochladen eigener Daten, Validierungen und Hackathons, die als Excel- und ZIP-Dateien heruntergeladen werden können.
267. OpenStreetMap
Die OpenStreetMap-Daten stammen aus dem OpenStreetMap-Projekt, dem fortlaufenden Versuch, durch die Bearbeitung und Mitarbeit der globalen Nutzergemeinschaft eine Weltkarte zu erstellen. Um diese Datenquelle zu nutzen, müssen Herausgeber lediglich den gewünschten Kontinent und anschließend das gewünschte Land auswählen. Der Download dieser Daten der Geofabrik GmbH ist kostenlos und die Daten werden in der Regel täglich aktualisiert.
268. HIFLD Open Data
Das vom US-Heimatschutzministerium betriebene und gepflegte Projekt HIFLD (Homeland Infrastructure Foundation-Level Data) stellt Geodaten der Öffentlichkeit zur Verfügung. Diese Daten werden mit dem ausdrücklichen Ziel verbreitet, die Öffentlichkeit bei Forschung und Planung zu unterstützen und zu informieren. Sie können als Shapefile oder CSV heruntergeladen und online eingesehen werden. Für Herausgeber macht HIFLD Open Data Geodaten anschaulicher und ansprechender als je zuvor.
269. OpenAddresses
OpenAddresses ist auf Adressinfrastruktur und -erfassung spezialisiert. Die Website, die maßgeblich von der Community getragen wird, nutzt GitHub als Entwicklungsplattform. Hier können Nutzer Adressen nach dem Hinzufügen zur Datenbank auf einer Karte platzieren oder die Daten direkt für die Geokodierung verwenden. Da alle Daten und Adressen offen zugänglich sind und lediglich eine Quellenangabe erfordern, machen die regelmäßigen Datenaktualisierungen und das Potenzial für zukünftige Geokodierungsfortschritte OpenAddresses zu einem äußerst interessanten Projekt.
270. Offene Daten LMU
Open Data LMU nutzt OpenStreetMap intensiv für die Entwicklung des Fast Reverse Geocoders. Die Anwendung kann somit schnell einen Standort auf einer Karte ermitteln und daraus die vollständige Adresse ableiten. Dies ist potenziell auch auf Stadtteile und Landkreise anwendbar. Auf dieser Webseite finden Sie zahlreiche Links zur Anwendung, darunter Quellcode, Datensätze sowie OpenStreetMap-Lookup-Tabellen und -Auflösungen.
271. Umweltdaten-Explorer
Mit dem Environmental Data Explorer können Journalisten, Forscher und Studierende dieselben Datensätze herunterladen und erkunden, die auch das Umweltprogramm der Vereinten Nationen (UNEP) sowie seine Partnerorganisationen nutzen. Die Suche lässt sich nach Region eingrenzen und mithilfe von 500 Filtern durchführen. Die Datensätze umfassen Kategorien wie Gesundheit, BIP, Klima, Emissionen und Süßwasser, die direkt auf der Website als Diagramm, Tabelle oder Karte angezeigt werden können.
272. Afrikanische Entwicklungsbankgruppe
Die Website der Afrikanischen Entwicklungsbank ist für Journalisten die erste Anlaufstelle, wenn sie statistische Informationen und Indikatoren für den afrikanischen Kontinent suchen. Nutzer können die Datensätze im Datenkatalog nach Quelle, Thema und Region filtern. Für alle, die sich eingehender mit dem jeweiligen Thema befassen möchten, bietet die Website zudem Links zu einer beeindruckenden Liste von Publikationen, darunter Titel wie der „African Economic Outlook“ und das „African Statistical Yearbook“.
273. Genomic Data Commons (GDC)
Das Genomic Data Commons des NCI beherbergt eine der umfassendsten Krebsdatenbanken im Internet mit Schwerpunkt auf genomischen Krebsstudien. Das Datenportal umfasst Tausende von Fällen und deckt 38 Krankheitsarten in 39 Projekten ab. Der Zugriff ist kostenlos. Da die Daten hauptsächlich von Institutionen und Forschern beigesteuert werden, ist die hohe Genauigkeit der Informationen eine ideale Datenquelle für Journalisten.
274. PhysioBank-Datenbanken
Die PhysioBank-Datenbanken stellen physiologische Daten öffentlich zur Verfügung. Diese Datenbanken sind in zwei Hauptkategorien unterteilt: Wellenform- und klinische Daten. Zu den Unterkategorien der Wellenformdaten gehören Bilddatenbanken, Datenbanken zu Herzschlagintervallen, synthetische Daten, Gang- und Gleichgewichtsdaten, EKG-Datenbanken sowie Datenbanken mit mehreren Parametern. Die hier verfügbaren Informationen umfassen unter anderem Daten zu Vitalparametern am Krankenbett, Sauerstoffsättigung und sogar Herz-Kreislauf-Erkrankungen. Journalisten und Forscher, die sich mit dem menschlichen Körper befassen, können hier relevante Informationen finden.
275. Medicare-Abdeckungsdatenbank
Die von den Centers for Medicare & Medicaid Services (CMS) des US-Gesundheitsministeriums (Department of Health and Human Services) geführte Medicare-Datenbank bietet Forschern umfassenden Zugriff auf eine Fülle von Informationen zu medizinischen Leistungen. Sie enthält Daten zu chronischen Erkrankungen, Arzneimittelausgaben, elektronischen klinischen Vorlagen, dem Inkassosystem sowie Forschungs- und Demonstrationsförderungen. Für Daten direkt aus der Quelle ist dies die gründlichste und umfassendste Website ihrer Art im Internet.
276. Offene Zahlungsdaten
Wenn die meisten Menschen zum Arzt gehen, machen sie sich in der Regel keine Gedanken darüber, ob ihr Hausarzt finanziell von Kooperationen mit Herstellern von Gesundheitsprodukten profitiert. Open Payments informiert die Öffentlichkeit über alle Mahlzeiten, Forschungsprojekte, Geschenke, Honorare für Vorträge und Reisekosten, die Ärzte oder Krankenhäuser von Unternehmen erhalten haben. Journalisten, die auf der Suche nach einer brisanten Geschichte sind, können die Informationen entweder über den Daten-Explorer einsehen oder die Daten direkt herunterladen.
277. FlickrLogos
Der Name verrät es bereits: FlickrLogos ist ein Datensatz mit Firmenlogos, die aus verschiedenen Perspektiven fotografiert wurden. Die Sammlung wird vom Multimedia Computing and Computer Vision Lab der Universität Augsburg gepflegt und wurde ursprünglich für das Training von Computern zur Logo- und Texterkennung erstellt. Um über die Fortschritte dieses interessanten Programms informiert zu bleiben, lohnt es sich, den Datensatz herunterzuladen und ihn genauer anzusehen.
278. ImageNet
ImageNet ist eine Datenbank mit Bildern, die mithilfe von WordNet organisiert wurden. Auf der Website finden jährlich Wettbewerbe statt, die auch nach deren Ende noch einsehbar sind und sich auf die Entwicklung von Algorithmen zur Erfüllung bestimmter Aufgaben konzentrieren. ImageNet beherbergt außerdem zahlreiche Publikationen, Zitate und Präsentationsfolien. Für technisch orientierte Content-Ersteller bietet sich die Explorer-Funktion an, um die WordNet-Struktur und die Cloud-Karte zu analysieren.
279. Stanford Dogs Datensatz
Der Stanford Dogs-Datensatz enthält unzählige Bilder verschiedener Hunderassen. Mit 120 verschiedenen Rassen und über 20.000 Einzelbildern bietet diese auf ImageNet basierende Datenbank Forschern eine Fülle an Material, um Maschinen die Erkennung der einzelnen Hunderassen beizubringen. Auf der Website finden sich Links zu verschiedenen Publikationen, die die Verwendung von Datensätzen für das Training der Bilderkennung behandeln. Der Datensatz kann dort ebenfalls heruntergeladen werden.
280. SUN-Datenbank
Die SUN-Datenbank ist das Ergebnis eines Forschungsprojekts, das die Forschungsgemeinschaft in Bereichen wie Computer Vision und Computergrafik, Data Mining, maschinellem Lernen und Neurowissenschaften unterstützen soll. Mit über 131.000 Bildern und fast 4.000 Objektkategorien in ihren Indizes ist diese Datenbank äußerst umfassend. Für Verlage, die sich für diese Datenbank und die Forschungsergebnisse ihrer Nutzer interessieren, ist sie eine lohnende Datenquelle.
281. Der Oxford-IIIT-Haustierdatensatz
Das Oxford-IIIT Pet Dataset ist eine Website, die eine auf der IEEE-Konferenz für Computer Vision und Mustererkennung 2012 veröffentlichte Arbeit ergänzt und den Originaldatensatz der Arbeit enthält. Die Bilder sind in etwa 37 Haustierkategorien unterteilt, zu denen jeweils 200 Bilder gehören. Die Daten können direkt über die Links auf der Webseite heruntergeladen werden.
282. Der Visual Genome Dataset
Die Visual Genome API ist das Ergebnis der intensiven Arbeit mehrerer Studierender und Dozenten der Stanford University. Mit zahlreichen Veröffentlichungen zur Entwicklung einer API zur Auswertung und Beschreibung von Bildern hat das Programm bereits über eine Million Fragen beantwortet und dabei über 100.000 Bilder analysiert. Diese API stellt einen Fortschritt in der Informatik und verwandten Gebieten dar. Der Datensatz kann direkt von der Website heruntergeladen werden.
283. YouTube-Gesichter
Die YouTube-Gesichterdatenbank konzentriert sich auf die Entwicklung einer Lösung für das Problem der automatischen Gesichtserkennung in Videos. Der Datensatz umfasst über 3.000 Videos von YouTube mit fast 1.600 Personen und einer durchschnittlichen Länge von ca. 181 Einzelbildern. Ziel ist die Entwicklung eines Algorithmus, der Labels erstellt, die die Person im Video identifizieren. Die Daten sowie Informationen zu Fehlern und Beschreibungsmethoden können direkt auf der Website eingesehen werden.
284. KEEL-Datensatz-Repository
Das KEEL-Datensatz-Repository enthält den Datensatz der Java-basierten Open-Source-Software, die verschiedene Arten der Wissensgewinnung unterstützt. KEEL (Knowledge Extraction based on Evolutionary Learning) kann trainiert werden, um unter anderem fehlende Werte zu ergänzen, Hybridmodelle zu erstellen und statistische Methoden zur Auswertung von Experimenten anzuwenden. Der Datensatz sowie eine vollständige Liste der in KEEL verwendeten Algorithmen können direkt von der Website heruntergeladen werden.
285. Kreditclub
Lending Club ist bekannt für sein Konzept als Peer-to-Peer-Kreditplattform, die es Kreditnehmern ermöglicht, Kredite zu erhalten, selbst wenn ihre Bonität für traditionelle Banken nicht ausreicht. Neben der innovativen Funktionsweise der Plattform bietet sie auch Statistiken mit Plattform-Highlights, Informationen zu abgelehnten Krediten, Kennzahlen zur Investorenperformance und sogar ein Datenwörterbuch mit historischen Daten. Diese Daten beginnen in der Regel ab 2007 und können als CSV-Datei heruntergeladen werden.
286. Naturkundemuseum
Das Naturhistorische Museum gilt vielen als eines der bekanntesten Museen der Welt, doch die Digitalisierung und die Möglichkeit, seinen Katalog über das Open-Data-Portal einzusehen, dürfte für viele neu sein. Die 91 Datensätze umfassen unter anderem Sammlungen von Mikrofossilien und Fossilien sowie Verzeichnisse von Exponaten. Die Daten sind öffentlich zugänglich und können kostenlos in verschiedenen Formaten heruntergeladen werden.
287. Die Getty-Vokabular
Diese Website ist ideal für Journalisten und Verlage, die bei der Beschreibung und Kategorisierung von Kunstwerken, Künstlernamen, Architektur, Materialien und geografischen Bezeichnungen bestimmte Stilrichtlinien einhalten möchten. Sie verlinkt direkt zu den kontrollierten Vokabulardatenbanken, die Forscher und Katalogisierer kennen sollten, um internationale Standards zu erfüllen. Die Getty-Vokabularien sind hierfür unübertroffen. Die Datensätze können per Text oder SPARQL durchsucht und über die Website heruntergeladen werden.
288. CLiPS-Stilometrie-Untersuchung (CSI)-Korpus
Das CLiPS Stylometrie-Untersuchungskorpus entspricht wahrscheinlich nicht dem, was die meisten Menschen unter CSI verstehen, aber es handelt sich dennoch um einen Datensatz aus studentischen Rezensionen und Essays. Neben dem Text selbst bieten auch die im Dokument enthaltenen Metadaten und Informationen vielfältige Nutzungsmöglichkeiten. Das Korpus wird unter der Creative-Commons-Lizenz angeboten und verbreitet; die einzige Gegenleistung für die Nutzung ist die Nennung der Quelle.
289. Universelle Abhängigkeiten v2
Universal Dependencies v2 bezeichnet die zweite aktualisierte Version des Universal Dependencies-Projekts, das eine Treebank-Annotation entwickelt, die konsistent für verschiedene Sprachen verwendet werden kann. In der aktualisierten Version finden Forschende neben Englisch auch Dutzende von UD-Treebanks für verschiedene Sprachen, darunter Afrikaans, Altgriechisch, Japanisch, Niederländisch, Finnisch und Chinesisch. Die neueste Version von Universal Dependencies kann am Ende dieser Webseite gefunden und heruntergeladen werden.
290. Webhose
Webhose ist eine erstklassige Quelle für Datensätze, die direkt aus den Repositorien der Website stammen und öffentlich zugänglich sind. Forschende können Nachrichtenartikel nach Sprache sortieren; Arabisch, Französisch und Niederländisch sind nur einige der Sprachen mit über 100.000 Artikeln. Darüber hinaus sind die englischsprachigen Nachrichtenartikel in Kategorien wie Unterhaltung und Sport unterteilt, ergänzt durch Rezensionen und Forenbeiträge. Digitale Verlage und Forschende können von der Nutzung dieser Datensätze profitieren.
291. Wiki-Daten
Wikidata ist eine unterschätzte Quelle für Inhalte und Ideen, sowohl für Verlage als auch für Forschende. Laut dieser Seite gibt es verschiedene Möglichkeiten, auf die Daten zuzugreifen, wobei die Verwendung von JSON besonders empfohlen wird. Alle hier verfügbaren Daten sind für nicht-kommerzielle und kommerzielle Zwecke kostenlos zugänglich und können unter der Creative-Commons-Lizenz heruntergeladen werden.
292. Wiki-Links
Wiki Links ist ein Open-Source-Projekt, das sich nahtlos in Google Code einfügt und Nutzern Zugang zu diesem einzigartigen Datensatz bietet. Auf dieser Webseite können Forschende die README-Dateien, die Datendateien und die Creative-Commons-Lizenz herunterladen. Verlage und technisch interessierte Personen können sich auf viele interessante Inhalte in diesem umfangreichen Datensatz freuen. Einfach auf der Webseite navigieren, klicken und die Dateien herunterladen.
293. Wordnet
WordNet ist ein englisches Lexikon, das die Sprachbausteine Adverbien, Substantive, Adjektive und Verben umfasst. Diese sind in verschiedene Kategorien eingeteilt und dienen dazu, bestimmte Ideen auszudrücken. Das Ergebnis ist ein nützliches Werkzeug, das Wörter nach ihrer Verwendung und Bedeutung kategorisiert, nicht nach ihrer Aussprache. Die Anwendungsmöglichkeiten von WordNet in der linguistischen Programmierung werden ebenso erläutert wie die zahlreichen Publikationen und Statistiken, die auf der Website verfügbar sind.
294. Allen-Gehirnatlas
Der Allen Brain Atlas, entwickelt vom Allen Institute for Brain Science Resources, ist ein Werkzeug zur Erforschung des menschlichen Gehirns und seiner Funktionsweise im gesunden Zustand sowie bei Erkrankungen. Mithilfe des Atlas können Forschende mehr über das menschliche Gehirn und seine Entwicklung sowie über Glioblastome und deren Auswirkungen auf das Gehirn erfahren. Journalisten, die über diese Themen berichten, finden auf dieser Website Datensätze und weitere Informationen.
295. NITRC
Das NITRC (Neuroimaging Informatics Tools and Resources Clearinghouse) ist die zentrale Anlaufstelle für Journalisten und Verlage im Bereich der Neurobildgebung. Die Website, die als Initiative zum Datenaustausch in der Neurobildgebung konzipiert und beworben wird, beherbergt Daten aus verschiedenen Projekten wie dem 1000 Connectome Project, der Addiction Connectome Preprocessed Initiative sowie den INDI-Projekten (prospektiv und retrospektiv). Die Daten können kostenlos über die Website heruntergeladen werden. Neurobildgebungen aus verschiedenen Entwicklungsstadien waren noch nie so leicht zugänglich.
296. HCP Junge Erwachsene
Das Human Connectome Project Young Adult-Projekt setzt die laufenden Bemühungen fort, eine präzise Karte des menschlichen Konnektoms zu erstellen, wie es bei den meisten gesunden Erwachsenen vorliegt. In zwei Phasen wurden 1200 gesunde Erwachsene mittels einer Kombination aus funktioneller Magnetresonanztomographie (fMRT) im Ruhezustand und Diffusionsbildgebung untersucht. Journalisten und Verlage, die Informationen über das Gehirn suchen, werden keine andere Quelle mit mehr Daten zum menschlichen Konnektom bei gesunden jungen Erwachsenen finden.
297. NIMH-Datenarchiv
Das NIMH-Datenarchiv (NDA) ist weniger eine unabhängige Datenquelle als vielmehr eine Plattform zur Verbreitung und Speicherung von Daten. Auf dieser Website finden sich Daten, die im Laufe zahlreicher Publikationen und Forschungsprojekte gesammelt wurden, sowie Methoden und Werkzeuge für eine verbesserte Analyse und Zusammenarbeit. Datenzusammenfassungen sind frei zugänglich, und Anbieter von Inhalten zu aktuellen wissenschaftlichen Entwicklungen können diese Informationen nutzen, um Neuigkeiten zu verbreiten.
298. Neurodaten
NeuroData widmet sich der Erforschung der einzigartigen Beziehung zwischen Geist und Gehirn. Dank des Engagements der Website für Open Science und reproduzierbare Forschung haben Inhaltsanbieter Zugriff auf eine Publikation und mehrere Datensätze, die über die Links auf der Webseite zugänglich sind. Besonders interessant für alle, die die Daten selbst einsehen möchten, ist die Verfügbarkeit von kostenlosem Code und Analysetools, die die Erkundung der Arbeit von NeuroData noch einfacher machen.
299. NeuroElektro
Das NeuroElectro-Projekt hat zum Ziel, die verschiedenen elektrophysiologischen Eigenschaften unterschiedlicher Neuronenarten zu erfassen und in einer zentralen Datenbank zusammenzuführen. Es untersucht die Beziehungen zwischen Neuronen, um die Unterschiede zwischen verschiedenen Neuronenarten zu erforschen. Die Website verlinkt zu Artikeln und listet die bisher entdeckten Neuronenarten und ihre elektrophysiologischen Eigenschaften auf. Anbieter von Inhalten können diese Website als Datenquelle zu neuronalen Beziehungen nutzen.
300. Open-Access-Reihe von Bildgebungsstudien
Die Open Access Series of Imaging Studies (OASIS) ist ein Projekt, das Datensätze von MRT-Aufnahmen des Gehirns der wissenschaftlichen Gemeinschaft zugänglich machen soll. Journalisten und Forscher können auf Publikationen zugreifen, die MRT-Daten von Erwachsenen vergleichen, sowie auf ein umfassendes Datenblatt aus der OASIS-Studie, die Ergebnisse von über 400 Probanden vergleicht. Die Informationen und Tools stehen in verschiedenen Formaten auf der Website zum Download bereit.
301. OpenfMRI
Für Journalisten, die unkompliziert auf MRT-Datensätze zugreifen möchten, ist OpenfMRI.orgs Fokus auf die öffentliche Zugänglichkeit dieser Datensätze eine positive Entwicklung. Die Website, die direkt von den Forschern selbst stammt, bietet eine Vielzahl von Datensätzen, darunter den Datensatz für Klassifikationslernen, die Mixed-Gambles-Aufgabe und die Ballon-Analog-Risiko-Taking-Aufgabe. Dank der Vielfalt und Menge der Daten können Forscher über diese Website neue Forschungsansätze entwickeln.
302. Studyforest
Der Name ist stark an den berühmten Film Forrest Gump angelehnt
Studyforest Ziel ist es zu verstehen, wozu das Gehirn fähig ist, wenn es unter hoher Belastung und gleichzeitig komplexen natürlichen Reizen Höchstleistungen erbringen muss. Die Website räumt jedoch ein, dass die in diesen Studien gesammelten fMRT-Daten ein breiteres Anwendungsgebiet haben, als es zunächst den Anschein hat. Inhaltsanbieter können die 19 Publikationen durchsuchen, die diese Daten verwendet haben
Studyforest Daten und können sogar direkt auf die Daten zugreifen.
303. Crystallography Open Database
Wie der Name schon vermuten lässt, ist die Crystallography Open Database eine Sammlung von 385.697 metallorganischen Mineralien und Verbindungen sowie organischen und anorganischen Kristallstrukturen – mit Ausnahme von Biopolymeren. Anbieter von Inhalten, die mehr über Kristallstrukturen erfahren möchten, können anhand der Strukturformel suchen oder eine Suchanfrage mit anschließender Suchfunktion durchführen. Die Website bietet außerdem Software und Daten, die sie insbesondere für die Chemie wertvoll machen.
304. NASA-Exoplanetenarchiv
Die NASA, die seit Langem als eine der wichtigsten Informationsquellen zum Weltraum gilt, setzt ihre Tradition als unschätzbare Ressource mit ihrem Exoplanetenarchiv fort. Die Website bietet eine Reihe interaktiver Tools und Software, darunter den Transit- und Ephemeridendienst, das Periodogramm, das Tool zur Darstellung bestätigter Planeten sowie die Möglichkeit, Dateien interaktiv hochzuladen und Tabellen zu durchsuchen. Anbieter von Inhalten, die nach einzigartigen Erkenntnissen suchen, können diese Daten nutzen, sobald Exoplaneten wieder für Schlagzeilen sorgen.
305. Sloan Digital Sky Survey
Die Erstellung dreidimensionaler Karten des Universums ist mithilfe des Sloan Digital Sky Survey (SDSS) für jeden möglich. Journalisten und Content-Anbieter haben Zugriff auf Algorithmen, Bilddaten, Datensätze, Tutorials und die Weiterentwicklung von Bildmaterial, um die Öffentlichkeit formell und informell zu informieren. Die Website beschreibt auch explizit, wie die Daten über Nachrichten und soziale Medien öffentlich zugänglich gemacht werden können. Für Content-Anbieter ist dies ein unschätzbares visuelles Werkzeug.
306. StatSci.org
Statsci.org bietet eine umfassende Liste an Ressourcen, die öffentlich zugänglich sind und je nach Bedarf genutzt werden können. Dazu gehören unter anderem der Electronic Dataset Service und von der UCLA zusammengestellte Fallstudien. Neben den Rohdatensätzen finden sich auf dieser Seite auch Links zu Lehrbüchern, beispielsweise zum „Handbook of Small Data Sets“ und zu Fallstudien in der Biometrie. Anbieter von Inhalten mit statistischen Daten sollten hier unbedingt vorbeischauen.
307. Eric
ERIC, das Institut für Erziehungswissenschaften, ist eine Ressource, die als Suchmaschine für alle dient, die Informationen im Bildungsbereich suchen. Die Vorabsuche bietet sogar die Möglichkeit, ausschließlich nach peer-reviewten Informationen oder ERIC-basierten Volltexten zu filtern. Angesichts der häufigen Berichterstattung über Bildungsbudgets und Lehrmethoden ist dies eine Datenquelle, die Journalisten unbedingt berücksichtigen sollten.
308. NTIS
Der kurz nach dem Ende des Zweiten Weltkriegs gegründete NTIS (National Technical Information Service) hatte zum Ziel, Bundesbehörden mithilfe von Daten fundierte, datenbasierte Entscheidungen zu ermöglichen. Ursprünglich diente die Behörde als Datenarchiv der US-Regierung im Bereich der wissenschaftlichen Forschung. Heute bietet die Website Millionen von Publikationen zu einer Vielzahl von Themen. Allein die historischen Informationen machen sie zu einer wertvollen Datenquelle für Journalisten und Verlage.
309. Zertifikat für offene Daten
Die Website des ODI (Open Data Institute) bietet das sogenannte Open Data Certificate an, ein kostenloses Online-Tool zur kritischen Prüfung und Bewertung der Qualität offener Daten. Für Verlage und Journalisten stellt die Website zudem zahlreiche Datensätze zu verschiedensten Themen bereit, von Förderlisten bis hin zu Allergiewarnungen, die im CSV-Format heruntergeladen werden können.
310. GitHub-Archiv
GitHub zählt aufgrund seiner einfachen Zusammenarbeit, seiner Archivierungskapazitäten und seiner Zugänglichkeit für Programmierer zu den beliebtesten und bekanntesten Datenrepositorien und Archiven im Internet. Ob es nun um die Entwicklung von Bots für bestimmte Aufgaben oder um die Entwicklung von Anwendungen geht – GitHub ist eine Plattform, auf der Content-Ersteller und Journalisten leicht auf potenziell interessante Projekte stoßen können. Der Zugriff auf das Archiv erfolgt über die Tutorials für JSON oder BigQuery.
311. Soziale Muster
SocioPatterns ist ein Projekt, das sich darauf konzentriert, Muster in menschlichen Aktivitäten und sozialen Dynamiken anhand von Daten zu erkennen. Wie bei einem so breit gefassten Ziel zu erwarten, wurden die Informationen der Website bereits in Publikationen zu verschiedensten Themen genutzt – von der Ausbreitung von Krankheiten bis hin zu Fallstudien über die Unterschiede zwischen dem Online- und Offline-Verhalten von Personen. Die Datensätze sowie die veröffentlichten Artikel, die Informationen enthalten, die für Verlage wahrscheinlich zu einem späteren Zeitpunkt relevant sein werden, sind einsehbar.
312. Indie-Karte
Indie Map ist das Ergebnis der Auswertung von Daten von über 2.000 der meistbesuchten IndieWeb-Websites. Diese Daten werden in interaktiven, visuellen Formaten wie einer Social Graph API, einem Datensatz mit SQL-Abfragefunktionen und den Rohdaten von insgesamt 5,7 Millionen Webseiten aufbereitet. Digitale Verlage, die sich für Open-Source-Software und die Aussagekraft dieser Daten für Online-Communities interessieren, können direkt über die Website darauf zugreifen.
313. Simon Fraser Universität
Simon Fraser baut seinen Ruf als angesehene Universität weiter aus, indem es seinen Datensatz zu „Statistiken und sozialen Netzwerken von YouTube-Videos“ veröffentlicht. Die Daten stammen von einem Crawler, der die YouTube-API zur Videosuche nutzte, und enthalten Informationen zu Millionen von Videos sowie Nutzerdaten. Die Website weist ausdrücklich darauf hin, dass der Datensatz ausschließlich für akademische Zwecke heruntergeladen werden darf. Es ist jedoch möglich, über die Website journalistische Quellen und Referenzen zu diesem Projekt zu finden.
314. ACLED
ACLED (Armed Conflict Location and Event Data Project) stellt öffentlich zugängliche Daten zu Protesten und politischer Gewalt in Entwicklungsländern bereit. Die hier bereitgestellten Informationen umfassen Zahlen zu Todesopfern, Angaben zu Datum und Ort der Gewalttaten oder Proteste, Namen der beteiligten Gruppen sowie Daten zu Aufständen und gewaltsamen Auseinandersetzungen. ACLED bietet regelmäßigen Zugriff auf Berichte, Publikationen und Grafiken sowie auf Daten, die auf der Website heruntergeladen werden können.
315. Kanadisches Institut für Rechtsinformationen
Das Canadian Legal Information Institute (CanLII) bietet kostenlosen Zugang zu Gesetzen und Verordnungen, Rechtsprechung verschiedener Gerichtsbarkeiten, darunter des Obersten Gerichtshofs von Kanada, der Provinz- und Berufungsgerichte sowie des Queen’s Bench, und zu Urteilen verschiedener Verwaltungsgerichte und gesetzlich eingerichteter Gremien. Mit 301 Fallrechtdatenbanken und über 140.000 einsehbaren Gerichtsentscheidungen ist diese Website besonders für Journalisten und Online-Verlage, die über juristische Themen berichten, empfehlenswert.
316. Zentrum für Systemischen Frieden
Das Center for Systemic Peace (CSP) ist eine Organisation, die sich der Analyse globaler Systeme zur Bekämpfung politischer Gewalt widmet. Journalisten, die in diesem Bereich forschen, finden hier Analysen zu Konflikten in Afrika, globalen Konflikttrends und Zusammenfassungen der drei wichtigsten Publikationen der Organisation: „Third World War“ und „CSP’s Global Report and Virtual Library“.
317. Korrelate des Kriegsprojekts
Das Projekt „Correlates of War“ (COW) hat sich zum Ziel gesetzt, die Erhebung und Verbreitung quantitativer Daten im Bereich der internationalen Beziehungen zu unterstützen. Gemäß seinem Anspruch, wissenschaftliche Prinzipien auf Daten aus diesem Bereich anzuwenden, stellt COW seine Datensätze der Öffentlichkeit frei zur Verfügung. Diese Datenbanken enthalten Zahlen und Informationen, die Journalisten und Forscher nutzen können, beispielsweise zu militärischen Konflikten zwischen Staaten, Mitgliedern von Staatensystemen, nationalen materiellen Kapazitäten und formellen Bündnissen.
318. Europäische Sozialerhebung
Die Europäische Sozialerhebung (ESS) ist eine europaweite Umfrage, die Verhaltensmuster, Einstellungen und Überzeugungen verschiedener Bevölkerungsgruppen in unterschiedlichen Ländern erfasst. Da Journalisten häufig an der öffentlichen Meinung interessiert sind, kann die ESS-Topline-Serie, die Themen wie das persönliche und soziale Wohlergehen der Europäer, die Einstellung zum Sozialsystem und sogar Altersdiskriminierung in Großbritannien behandelt, eine Berichterstattung in mehrfacher Hinsicht bereichern.
319. Fonds für den Frieden
Der Fund for Peace (FFP) ist eine Organisation, die sich auf Konfliktprävention und Sicherheit konzentriert und Instrumente zur Konfliktminderung entwickelt. Im Laufe seiner Geschichte hat der FFP mit Journalisten, Nichtregierungsorganisationen, lokalen Organisationen und ihren internationalen Partnern sowie Regierungen zusammengearbeitet. Journalisten und Verlage finden mithilfe des browserbasierten Datenanalysetools der Website schnell und einfach die gewünschten Informationen zu Trends, vergleichenden Analysen und globalen Daten.
320. Die Allgemeine Sozialerhebung
Die Arbeit des General Social Survey (GSS) konzentriert sich auf die Erfassung von Informationen zu verschiedenen Aspekten der modernen amerikanischen Gesellschaft, um Einstellungs- und Verhaltenstrends in der Bevölkerung zu verfolgen. Da diese Trendanalyse bis ins Jahr 1972 zurückreicht, stellen die historischen Daten eine wahre Fundgrube für Journalisten dar, die Trends untersuchen möchten. Mithilfe des GSS Data Explorers können Forscher und Journalisten Daten herunterladen, analysieren und sogar auswerten.
321. Gesis
GESIS ist ein deutsches Infrastrukturinstitut für Sozialwissenschaften. Es bietet verschiedene sozialwissenschaftliche Leistungen sowie Forschungsarbeiten und Services an, die von Umfragemethodik über angewandte Informatik, Datenerhebung und Studienplanung bis hin zur Datenanalyse reichen. Journalisten, die sich für Themen wie die Methodik von GESIS, den Einsatz hochqualifizierter Migranten und ähnliches interessieren, finden zahlreiche Informationen im Publikationsbereich.
322. Globale religiöse Zukunftsperspektiven
Von Themen wie Abtreibung bis Sexualerziehung – Religion ist so allgegenwärtig, dass selbst in weitgehend säkularen Ländern die Haltung einer Person zu schwierigen gesellschaftlichen Fragen von religiösen Überzeugungen beeinflusst werden kann. In der Studie „Global Religious Futures“ untersucht das Pew Research Center Trends in den Einstellungen und Überzeugungen der Menschen im Zusammenhang mit den Weltreligionen. Journalisten, die Details wie den Einfluss des Evangelikalismus auf die Politik oder die Haltung zur Steinigung untersuchen möchten, können mithilfe des Daten-Explorers Antworten in den Zahlen finden.
323. Index für Risikomanagement
Der Index für Risikomanagement (INFORM) ist eine Anlaufstelle für Forscher und Journalisten, die Risikobewertungen in Situationen mit humanitärer Krisen- oder Katastrophengefahr durchführen möchten. Die Organisation bietet Links zu Daten über Themen wie Kindersterblichkeitsraten, den Index der Geschlechterungleichheit und Dürrehäufigkeit. Die Daten von INFORM können eingesehen und heruntergeladen oder über die interaktive Karte der Website abgerufen werden.
324. INED
Das INED, das französische Institut für demografische Studien, ist eine der ergiebigsten Daten- und Statistikquellen im Internet. Jährlich werden über 70 Publikationen veröffentlicht, die neben grafischen Darstellungen der Weltbevölkerung auch Statistiken zu Fragen wie Fruchtbarkeitsunterschieden zwischen den Geschlechtern sowie Nachrichten und Ressourcenanalysen bieten. Forscher, die verlässliche und akkurate Ergebnisse suchen, werden beim INED fündig.
325. Archiv der internationalen Netzwerke
Das Archiv für Internationale Netzwerke der Princeton University bietet eine einzigartige Kombination von Publikationen, darunter Forschungsarbeiten wie den Bericht über die menschliche Entwicklung 1999 und die Fachzeitschrift „Global Networks: A Journal of Transnational Affairs“, die auf dieser Website abrufbar sind. Journalisten können hier die umfassenden, öffentlich zugänglichen historischen und aktuellen Daten des Archivs durchsuchen. Zu den behandelten Themen gehören unter anderem Gesundheitswesen, Waffen, Bücher, Musik, Migration, Regionen, Internet, Politik und Transport – dies sind nur einige Beispiele der Materialien, die Forschern hier zur Verfügung stehen.
326. Internationales Sozialerhebungsprogramm
Das International Social Survey Programme (ISSP), das von Anfang an als Plattform für die Zusammenarbeit zwischen Menschen verschiedener Nationen gegründet wurde, führt jährlich Umfragen zu einer Vielzahl von Themen durch, die für die Sozialwissenschaften von Bedeutung sind. Zu den Themen der vergangenen Jahre gehörten unter anderem soziale Ungleichheit, nationale Identität, Staatsbürgerschaft, soziale Netzwerke und Arbeitsorientierung. Die Ergebnisse des ISSP können nach Jahr oder Thema durchsucht und auf der Website heruntergeladen werden.
327. Internationale Studienvereinigungen
Journalisten und andere Forscher, die nach informativen und anregenden Diskussionen zu transnationalen, internationalen und globalen Themen suchen, finden in der International Studies Association (ISA) die Expertise von Forschern, Akademikern, Politikexperten und weiteren Fachleuten. Die ISA-Enzyklopädie der Internationalen Studien enthält von Experten begutachtete Aufsätze mit tiefgründigen Diskussionen zu Forschungsthemen in diesem Bereich sowie Beiträge mit historischer Perspektive.
328. Länderübergreifende Daten im Web
Die äußerst hilfreiche Webseite von Professor James W. McGuire von der Wesleyan University mit dem treffenden Titel „Cross-National Data on the Web“ ist eine Ressourcenseite mit zahlreichen Links zu relevanten Daten über Wirtschaft und globale Entwicklung. Journalisten finden hier unter anderem Daten zu Familienplanung, Bildungserfolg, Unterernährung, Wasserversorgung und Sanitäranlagen, Marktorientierung sowie spezifische Informationen zu Lateinamerika und der Karibik. Die aufgeführten Datenquellen sind absolut zuverlässig.
329. Norwegisches Zentrum für Forschungsdaten
Das Norwegische Zentrum für Forschungsdaten unterstützt Forschende in verschiedenen Bereichen der empirischen Forschung, darunter Datenschutz, Datenerhebung und -analyse, Methodenbewertung und Forschungsethik. Hier finden Forschende vom Zentrum entwickelte und empfohlene Software und Tools sowie eine umfangreiche Sammlung regionaler, individueller und institutioneller Daten, die kostenlos zugänglich sind. Auch die Ergebnisse des jährlichen Forschungs- und Datenschutzberichts des Zentrums sind stets lesenswert.
330. IPUMS
IPUMS ist nicht unbedingt eine Datenquelle im herkömmlichen Sinne, aber dennoch eine nützliche Ressource für Journalisten, da es Daten anderer Organisationen aggregiert, archiviert und organisiert. So fungiert IPUMS USA beispielsweise als eine Art Datenarchiv für US-Volkszählungsdaten, deren Daten bis ins Jahr 1790 zurückreichen und bis in die Gegenwart reichen.
331. ND-GAIN
Der ND-GAIN-Länderindex, eine Initiative der Globalen Anpassungsinitiative der Universität Notre Dame, misst die Widerstandsfähigkeit eines Landes gegenüber dem Klimawandel und anderen Globalisierungskräften. Dieser Index umfasst Vulnerabilitätswerte in Bereichen wie Ernährung, Gesundheit, Infrastruktur und Ökosysteme sowie Bereitschaftswerte für bis zu 500.000 Datenpunkte. Die Daten aus zwei Jahrzehnten (1995 bis 2014) stehen als CSV-Dateien zum Download bereit.
332. Polizei Großbritannien
Auf dieser Website erhalten Journalisten und Verlage Zugriff auf offene Daten zum Thema Polizeiarbeit und Kriminalität im Vereinigten Königreich. Die Daten enthalten nützliche Statistiken zu Nachbarschaftsteams, einzelnen Polizeibehörden, Zahlen zu Personenkontrollen sowie Statistiken zu Kriminalität und deren Folgen. Journalisten können mithilfe dieser Website Vergleiche zwischen Polizeibehörden anstellen und Trends im Strafrechtssystem erkennen. Der Zugriff auf die Informationen ist denkbar einfach: Man wählt den gewünschten Zeitraum und die Polizeibehörde aus und wartet anschließend auf die Datei.
333. Paul Hensels Allgemeine Internationale Datenseite
Paul Hensels „General International Data Page“ ist eine Linksammlung, die unter den Überschriften „Staaten und das internationale System“, „Internationale Geodaten“, „Staatliche Kapazitäten“, „Sozialwissenschaftliche Datensammlungen“ sowie „Bündnisse, Verträge und Organisationen“ gruppiert ist. Jede auf dieser Webseite aufgeführte Ressource enthält hochaktuelle Daten, die die Glaubwürdigkeit journalistischer Arbeit automatisch untermauern. Diese Quellen können von Software über Datensätze bis hin zu Archiven reichen, doch jeder hier enthaltene Link ist nützlich.
334. TRAC
In der Zeit nach dem 11. September haben Terrorismus und seine verheerenden Auswirkungen auf die Bevölkerung viel mediale Aufmerksamkeit erfahren. TRAC (trackingterrorism.org) bietet Forschern umfassende Analysen und Informationen zu diesem Thema. Die Website enthält Informationen zu mehreren tausend verschiedenen Terrorgruppen. Der Preis von 500 US-Dollar für eine Einzelnutzerlizenz mag zunächst hoch erscheinen, ist aber für alle, die über Gewalt und den Krieg gegen den Terror schreiben, durchaus gerechtfertigt.
335. Texas Department of Criminal Justice
Interessieren Sie sich für die internen Abläufe des texanischen Strafjustizsystems? Möchten Sie wissen, wer sich aktuell im Todestrakt befindet? Das texanische Justizministerium verfügt über umfangreiche Informationen, darunter die letzten Aussagen von Gefangenen vor ihrer Hinrichtung, Statistiken zum Todestrakt nach Geschlecht und ethnischer Zugehörigkeit sowie weitere Hinrichtungsstatistiken und Informationsblätter. Das texanische Justizministerium ist eine der verlässlichsten Quellen für Journalisten.
336. Integriertes System zivilgesellschaftlicher Organisationen
Das integrierte System für zivilgesellschaftliche Organisationen (iCSO) erleichtert die Kommunikation zwischen zivilgesellschaftlichen Organisationen und der Abteilung für wirtschaftliche und soziale Angelegenheiten. Neben dem effektiven, robusten Rahmenwerk bietet die Webseite Datensätze und Kategorien für weiterführende Informationen. Die Daten lassen sich nach Sektor, Organisationstyp, Region und dem Status der Organisation im Wirtschafts- und Sozialrat (ECOSOC) sortieren. Journalisten können diese Datenquelle zur Quellensuche nutzen.
337. Universitäten weltweit
Universities Worldwide ist eine Datenbank mit Universitäten weltweit, die nach weiteren Informationen durchsucht werden kann. Die Suche kann weltweit oder gefiltert nach Universitäten in den Vereinigten Staaten erfolgen. Nutzer können zudem eigene Links hinzufügen. Datenverlage mit einer großen Anzahl von Studierenden oder Journalisten, die Fakten überprüfen möchten, profitieren gleichermaßen vom bedarfsgerechten Zugriff auf eine solche Datenbank.
338. Uppsala-Konfliktdatenprogramm
Dies ist die Website des Uppsalaer Konfliktdatenprogramms, einer der bekanntesten Informationsquellen zu organisierter Gewalt. Im Laufe der letzten 40 Jahre hat sich das Programm auch durch seine Datenerhebung zum Bürgerkrieg einen Namen gemacht. Journalisten können diese Datenquelle nutzen, um Informationen zu spezifischen Konflikten und den darin beteiligten Akteuren zu suchen und die Daten herunterzuladen.
339. Weltbevölkerung
Das WorldPop-Projekt, hervorgegangen aus dem Zusammenschluss der Projekte AsiaPop, AfriPop und AmeriPop, widmet sich der Archivierung räumlicher demografischer Datensätze, die wiederum zur Unterstützung von Katastrophenhilfemaßnahmen eingesetzt werden können. Für Verlage und Journalisten, die sich für soziale Gerechtigkeit engagieren oder nach effizienten Möglichkeiten der Katastrophenhilfe suchen, ist dieses Projekt von Interesse. Forscher können die Daten herunterladen oder die Fallstudien online einsehen.
340. Draft Express
DraftExpress ist im Internet vor allem für seine Analysen, Scouting-Berichte vor dem Draft, Mock-Draft-Picks und die sorgfältige Pflege der Spielerdaten (Größe und Maße) in Verbindung mit historischen Daten bekannt. Die auf dieser Seite genannten Talente stammen aus der NCAA, High Schools und sogar internationalen Ligen. Sportjournalisten und Content-Ersteller, die Basketball-Kommentare verfassen möchten, können die Statistiken von DraftExpress nutzen, um Spieler und Ereignisse im Basketball zu analysieren.
341. Betfair
Betfair ist wohl am bekanntesten als Anlaufstelle für Sportwetten. Besonders interessant für Content-Anbieter und digitale Verlage sind jedoch die detaillierten historischen Informationen zu den Preisdaten und der Historie der Website. Die Daten können mit oder ohne detaillierten Zeitstempel abgerufen und heruntergeladen werden und bieten darüber hinaus umfangreiche Daten zu Pferderennen und den anderen Marktangeboten der Website von Juni 2004 bis Oktober 2017.
342. CRICSHEET
Cricsheet bietet einen ähnlichen Service wie viele andere Sportdatenportale, ist aber auf Cricket-Daten spezialisiert. Die Seite stellt Statistiken und Spielverlaufsdaten aus verschiedenen Ligen bereit, darunter die Indian Premier League, One-Day Internationals sowie Daten für Herren- und Damenteams, um nur einige der wichtigsten Kategorien zu nennen. Herausgeber, die historische Cricket-Daten suchen, können diese im CSV- oder XML-Format herunterladen.
343. Länderübergreifende Zeitreihendaten
Mit politischen, wirtschaftlichen, legislativen und innerstaatlichen Konfliktdaten aus über 200 Jahren und mehr als 200 Ländern weltweit ist das Cross-National Time-Series Data Archive eines der umfassendsten Datensätze im Internet. Die Daten sind praktischerweise in einem Google Drive-Tabellenblatt gespeichert, das sich beim Anklicken der Dateikategorie automatisch öffnet. Gegen Angabe der Quelle können diese Informationen je nach Bedarf des Forschers teilweise oder vollständig eingesehen werden.
344. Ford GoBike
Ford GoBike ist der Name des Fahrradverleihsystems in der Bay Area. Viele nutzen es zweifellos, um fit zu bleiben und fossile Brennstoffe zu vermeiden. Das System erfasst dabei auch die Fahrtdaten. Diese Daten enthalten zwar keine Informationen, die die Nutzer identifizieren könnten, aber Details wie Fahrradnummer, Start- und Endzeit, Nutzertyp sowie Ankunfts- und Abfahrtsstationen sind enthalten. Das ist durchaus interessant.
345. Schiffsverkehr
Marine Traffic ist ein Unternehmen, das mithilfe von Big Data Schiffsbewegungen und Seereisen verfolgt und analysiert. Die über die AIS-API-Dienste von Marine Traffic bereitgestellten Informationen umfassen Schiffe, Reiseinformationen sowie Daten zu den jeweiligen Schiffen, wie z. B. erwartete Ankünfte, Zwischenfälle, Fotos, Schiffsdaten und Reisevorhersagen. Da die Website kostenpflichtige Tarife anbietet, ist unklar, in welchem Umfang die Recherche kostenlos möglich ist.
346. Bixi
Die Fahrradverleihsysteme von Bixi gehören zu den bekanntesten in einigen der größten Städte Nordamerikas. Interessanterweise veröffentlicht das Unternehmen auch offene Daten, die Informationen zu Fahrtverlauf und Stationsstatus sowie Vergleiche zwischen Mitgliedern und Gelegenheitsnutzern ermöglichen. Lokale Journalisten, die untersuchen, wie Einzelpersonen Fahrradverleihsysteme nutzen und in ihren Alltag integrieren, haben allen Grund, diese Daten genauer zu betrachten.
347. Unfalldatenbank
Von Amelia Earhart bis zum Absturz von AirAsia Flug 8501 – Flugunfälle sind ein Thema, das die Öffentlichkeit immer wieder beschäftigt. Die Unfalldatenbank archiviert und speichert Daten zu Flugunfällen, die sich zwischen 1920 und 2017 ereignet haben. Zu den in dieser Datenbank erfassten Unfällen zählen zivile und militärische Luftschiffunfälle, Unfälle mit Todesopfern unter Prominenten oder bekannten Persönlichkeiten, Hubschrauberunfälle mit zehn oder mehr Toten sowie planmäßige und außerplanmäßige Passagierflüge mit Todesfolge.
348. Transport für London
Transport for London (TfL) ist die Regierungsbehörde, die für den öffentlichen Nahverkehr im Großraum London zuständig ist. Auf der Website finden sich U-Bahn- und Bahnpläne sowie ein Fahrplaner. Neben diesen praktischen Diensten bietet die Website auch zahlreiche offene Daten, unter anderem zu Radfahren, Luftqualität, TÜB und sogar Austern. Jeder, der sich dafür interessiert, wie die Einwohner des Großraums London den öffentlichen Nahverkehr nutzen, kann von diesen Daten profitieren.
349. CMAP
CMAP ist für die regionale Planung und Organisation in den Countys DuPage, Lake, McHenry, Kendall, Kane, Cook und Will in Illinois zuständig. Wie der Website zu entnehmen ist, umfasst das Aufgabengebiet von CMAP auch Themen wie Gemeindeentwicklung, Steuern und Wirtschaftsindikatoren sowie Straßen und öffentlichen Nahverkehr. Daher sind die offenen Daten zu regionalen Indikatoren und Verkehrsentwicklung für Journalisten, die sich ein umfassendes Bild von der Zukunft der Region machen möchten, von großem Nutzen.
350. Frachtanalyse-Rahmenwerk
Das Freight Analysis Framework, entstanden aus der Zusammenarbeit des Bureau of Transportation Statistics und der Federal Highway Administration, sammelt Daten zur Bewertung des allgemeinen Zustands und der Leistungsfähigkeit des Güterverkehrssystems. Die Software erfasst Informationen zu Güterarten und Tonnagen im Vergleich zu Abfahrts- und Ankunftsbahnhöfen. Diese Daten stehen der Öffentlichkeit zum vollständigen Zugriff oder zum Download zur Verfügung.
351. Mozilla Science
Mozilla Science ist eine Open-Source-Software, die auf kollaborativen Methoden und offenen Verfahren basiert und die Entwicklung und Verbreitung verschiedener Datenquellen und Forschungsergebnisse unterstützt. Neben dem Transparenzaspekt erleichtert die Entscheidung, Programme zu öffnen und den Optimierungsprozess per Crowdsourcing zu gestalten, die Verbesserung bestehender Programme. Mit Projekten in einer Vielzahl von Bereichen, darunter Lebenswissenschaften und Medizin, bietet Mozilla Science Softwarelösungen, die potenziell bemerkenswerte Fortschritte in ihrem Fachgebiet darstellen.
352. Coole Datensätze
Die Attraktivität von Cool Datasets wird schon durch den Namen der Website deutlich. Die Datensätze sind in sechs Kategorien unterteilt: Regierung, Unterhaltung, Wissenschaft, Nutzereinsendungen, Sonstiges und Maschinelles Lernen. Journalisten, die die Daten analysieren und daraus Geschichten ableiten möchten, profitieren besonders von den Angeboten dieser Website. Es besteht die Möglichkeit, die Datensätze zu erkunden und – falls gewünscht – auch eigene Datensätze beizusteuern.
353. Open Data Monitor
OpenDataMonitor ist eine Plattform, die öffentliche Datensätze intuitiv und verständlich aufbereitet. Forschende erhalten hier einen Überblick über die Möglichkeiten offener Datenressourcen und können die vorhandenen Daten visuell ansprechender darstellen lassen. Die Website erläutert ihre Methodik und Benchmarks, sodass Verlage problemlos relevante Daten finden.
354. CrunchBase
Crunchbase ist vor allem für seinen Fokus auf Statistiken und sein Engagement bekannt, seinen Lesern Zugang zu den besten verfügbaren Daten zu bieten. Geschäftsleute besuchen die Seite täglich, um sich über die neuesten Trends in den Bereichen Investitionen und Industrie zu informieren. Journalisten und Verlage finden hier Nachrichten und aktuelle Diskussionen zu den neuesten Wirtschaftstrends. Im Rahmen der kostenpflichtigen Option bietet die Seite zudem umfangreiche Datensätze, die mit den Software-Tools von Crunchbase analysiert werden können.
355. Index
Index ist eine Plattform mit einem einzigartigen Verkaufsargument, da sie für jeden etwas bietet – von Startups über Investoren und Analysten bis hin zu Konzernen. Die Website stellt Informationen zu über 100.000 Unternehmen im Technologiesektor bereit und ermöglicht Nutzern gleichzeitig das Sortieren, Erstellen und Exportieren von Tabellenkalkulationen. Verlage und Journalisten, die Schlagzeilen nach potenziellen Story-Ansätzen durchsuchen, können sich über diese Website einen Vorsprung in der Wirtschaftsnachrichten verschaffen. Index mag ungewöhnlich sein, ist aber zweifellos eine wertvolle Ressource.
356. Semrush
SEMrush versteht sich als eines der etabliertesten Tools für Suchmaschinenoptimierung im Online-Marketing. Dank der Akademie und der Webinare haben Interessierte beste Möglichkeiten, die Grundlagen zu erlernen. Blog und News bieten zudem ausreichend Informationen, damit Verlage und Journalisten stets über die neuesten Entwicklungen in Online-Werbung und SEO informiert sind. Die Dienstleistungen von SEMrush sind kostenpflichtig, es gibt aber auch viele kostenlose und hochwertige Informationen.
357. Ahrefs
Ahrefs lässt sich wohl am besten als eine Sammlung von Marketing-Tools beschreiben, die potenziell für jeden nützlich sind, der online Inhalte veröffentlicht. Die Website bietet eine Kombination aus Diensten wie Content-Recherche, Web-Monitoring, Keyword-Recherche und Backlink-Analyse, um Nutzern zu helfen, den Erfolg ihrer Konkurrenten zu analysieren. Besonders für Online-Publisher ist Ahrefs im Großen und Ganzen von großem Nutzen; allein der Ahrefs-Blog bietet einen hervorragenden Mehrwert für alle, die ihr Marketing datenbasiert gestalten möchten.
358. Engelliste
AngelList, dessen Name Programm ist, vereint im Grunde Elemente von Craigslist und LinkedIn und bringt Investoren, Jobsuchende und Startups an einem Ort zusammen. Neben diesem interessanten Konzept bietet die Plattform ambitionierten Journalisten zahlreiche Möglichkeiten, die vielversprechendsten Startups und neuesten Investmenttrends zu entdecken, bevor sie den Mainstream erreichen. Dank der intuitiven Benutzeroberfläche und der starken Geschäftsorientierung ist AngelList für Berufstätige in vielerlei Hinsicht nützlich.
359. Erworben
In nahezu allen Branchen kann eine Unternehmensübernahme eine ganze Branche quasi über Nacht verändern. Acquired ist eine Website, die es sich zur Aufgabe gemacht hat, die Öffentlichkeit über Übernahmen im Technologiesektor zu informieren. Sie bietet zahlreiche Statistiken und Filterfunktionen für die Suche. Journalisten, die über Technologie berichten, profitieren besonders davon, Acquired regelmäßig zu besuchen.
360. Mattermark
Mattermark ist ein kostenpflichtiger Dienst, der Unternehmensentscheidern die Arbeit erleichtert, indem er hochwertige Kundenlisten erstellt, die sowohl Unternehmen als auch deren Schlüsselmitarbeiter berücksichtigen. Mit umfassenden Unternehmensprofilen, flexibler API und Exportfunktionen für Aktualisierungen bietet Mattermark ein umfassendes Leistungsspektrum. Unternehmen, die ihre Kundenansprache optimieren und gleichzeitig die Ergebnisse ihrer Kampagnen verfolgen möchten, profitieren erheblich von dieser Lösung.
361. Fintech-Startups
FintechStartupsCo fungiert als eine Art Aggregator, der die Finanzierungssummen verschiedener Unternehmen bei ihren Börsengängen (IPOs) erfasst. Mit seinem minimalistischen Design, das zwischen den Tabs „Startups“ und „News“ wechselt, bietet es Journalisten eine schnelle und einfache Möglichkeit, sich über aktuelle Finanzierungsnachrichten zu informieren. Auch Verlage, die nach schnellen Inhalten und kurzen Geschichten suchen, können von diesem Angebot profitieren.
362. Datafox
Falls der Name es nicht schon verrät: DataFox ist ein Unternehmen, das seinen Geschäftskunden die Informationen liefert, die sie benötigen, um ihre CRM-Systeme optimal zu nutzen und datenbasierte Entscheidungen zu treffen. Mit Dienstleistungen wie Konferenz- und Unternehmensinformationen, APIs und Unternehmenssignalen ist DataFox quasi ein Komplettanbieter für Unternehmen, die ihre Vertriebs- und Kundenkommunikationsarbeit modernisieren. Auch digitale Verlage und Content-Anbieter sollten sich DataFox einmal genauer ansehen.
363. Offene Sendung
OpenSpending ist eine kostenlose Plattform, die praktisch überall auf der Welt zugänglich ist und es Nutzern ermöglicht, öffentlich zugängliche Finanzdaten zu suchen und zu analysieren. Für alle, die keine Hacker sind, ist dies ein leistungsstarkes Werkzeug zur Visualisierung und Analyse von Daten. Insbesondere Journalisten können OpenSpending nutzen, um interessante neue Erkenntnisse zu gewinnen und, wie vom Unternehmen direkt auf der Website vorgeschlagen, Story-Ansätze zu verfolgen. Ein weiterer Vorteil: Journalisten gehören zu den Berufsgruppen, die im Forum explizit angesprochen werden.
364. ESPN Sports API
ESPN, nicht nur der beliebteste Sportsender im Kabelfernsehen, weitet seinen Einfluss auch auf Programmierung und APIs aus. Im Entwicklerzentrum bietet die Website Verlagen eine Auswahl an APIs, darunter Analysen, Power-Rankings, Draft-Tipps, Kalender und Schlagzeilen. Es gibt sogar eine API, die Athletenprofile, Biografien und Statistiken aller wichtigen Sportarten lädt. Journalisten, die einen Sportartikel vorbereiten, profitieren von diesem Angebot.
365. Sportreferenz
Für sportbegeisterte Statistikfans, die ihre umfangreichen Daten und Ressourcen an einem Ort finden möchten, ist Sports Reference eine der besten Webseiten. Mit historischen Daten, darunter Team- und Spielerstatistiken für Angriff und Verteidigung, können Sportforscher hier ihre Analysen so umfassend oder detailliert durchführen, wie sie möchten. Darüber hinaus bietet die Seite Statistiken für nahezu alle wichtigen Sportarten, von Basketball bis Baseball, sowie separate Daten für verschiedene College-Sportarten.
366. Millionen Songs Datensatz
Die treffend benannte „Million Songs Collection“ umfasst 28 Datensätze mit Metadaten und Informationen zu den Audioeigenschaften von genau einer Million Songs. Diese Informationen, die größtenteils aus der Zusammenarbeit des LabROSA-Projekts der Columbia University mit Echo Nest hervorgegangen sind, werden auf Amazons AWS-System bereitgestellt und sind dort verfügbar. Nutzer können die Informationen über Infochimps durchsuchen, was sie sowohl für Journalisten auf der Suche nach ungewöhnlichen Details als auch für Content-Publisher noch zugänglicher macht.