Hay muchos tipos diferentes de sitios que ofrecen una gran cantidad de datos gratuitos, freemium y pagos que pueden ayudar a los desarrolladores de audiencias y a los periodistas con sus esfuerzos de informes y narración. El equipo de State of Digital Publishing desea reconocerlos, ya que se derivan de búsquedas manuales y el reconocimiento de nuestra audiencia existente.
1. Kaggle
Kaggle es un sitio que permite a los usuarios descubrir el aprendizaje automático mientras escriben y comparten código en la nube. Basándose principalmente en el entusiasmo de su numerosa comunidad, el sitio organiza concursos de conjuntos de datos con premios en efectivo, lo que resulta en una enorme cantidad de datos recopilados. Ya sea que busque datos históricos de la Bolsa de Valores de Nueva York, un resumen de las tendencias de producción de dulces en EE. UU. o código de vanguardia, este sitio está repleto de información.
2. Wikipedia
Es imposible estar mucho tiempo en internet sin encontrar un artículo de Wikipedia. Con artículos que abarcan desde biografías históricas con fuentes completas y referencias hasta cronologías del futuro cercano y lejano, se puede afirmar que Wikipedia ha consolidado su estatus como enciclopedia web gratuita. Entre la entrada que ofrece una visión general del tema y los numerosos libros y referencias en línea que ofrece el sitio, Wikipedia es, en muchos aspectos, la mejor amiga del escritor.
Como se desprende del nombre del sitio web, Common Crawl busca o "rastrea" datos en la web, que luego almacena y crea en un repositorio abierto al que los usuarios pueden acceder. Dos ejemplos de las posibilidades de este sitio: marcadores virtuales de patentes y listas completas de sitios web que ofrecen feeds RSS, ofrecen una pequeña muestra de la potencia de esta aplicación. Si desea realizar comparaciones de datos o sitios, esta es una herramienta accesible para crear información original.
4. EDRM
EDRM, abreviatura de Modelo de Referencia de Descubrimiento Electrónico, es un sitio para profesionales del derecho dedicado a comprender el potencial del descubrimiento electrónico y las normas y expectativas que rigen la gestión de la información. Además, los miembros de EDRM colaboran para desarrollar estándares colaborativos, software y herramientas educativas diseñadas para promover los objetivos de la comunidad. Para obtener información sobre cómo la tecnología puede y ha estado cambiando los aspectos procesales y administrativos de la práctica legal, este es el sitio que desea visitar.
Mahout se centra en un software del mismo nombre que intenta descifrar la logística para construir un entorno capaz de crear aplicaciones de aprendizaje automático de alto rendimiento, escalables y de rápida creación. Para investigadores que deseen compilar y manipular sus propios conjuntos de datos o probar aplicaciones de aprendizaje automático, este software es especialmente útil. Este sitio web ayudará a quienes estén en vías de dominar este software.
El Proyecto Lémur es una base de datos que se centra en apoyar la investigación sobre la recuperación de información y el manejo de las tecnologías del lenguaje humano. Con aproximadamente mil millones de páginas web en 10 idiomas, recopiladas entre enero y febrero de 2009, la gran cantidad de material y apoyo disponible lo convierte en un excelente recurso para investigadores. Gracias a todo esto y al apoyo adicional que ofrece el sitio, cualquier persona interesada en la tecnología y los lenguajes humanos encontrará mucho material útil en este sitio.
El Proyecto Gutenberg es un directorio que presenta novelas, artículos y otras obras de dominio público. La colección de más de 54.000 libros electrónicos del sitio abarca desde obras conocidas como Shakespeare, Mark Twain y Jane Austen hasta obras menos conocidas de autores menos conocidos como Henri Bergson y Samuel Butler. Ya sea para leer una novela clásica o para investigar cómo vivía la gente en el siglo XIX, el Proyecto Gutenberg es un recurso excelente.
8Conjunto de datos de un millón de canciones
Este sitio web alberga un conjunto de datos completo con las características de audio y los metadatos de aproximadamente un millón de canciones populares. Además del conjunto de datos principal de un millón de canciones, también hay varios conjuntos de datos aportados por la comunidad en categorías relacionadas, como versiones, sellos discográficos y letras, entre otras. Los historiadores musicales, aficionados o investigadores que deseen esta información podrán ordenar los datos con relativa facilidad. Este podría ser el conjunto de datos más completo sobre este tema en todo Internet.
9. Amazonas
Todo el mundo conoce a Amazon como minorista digital, pero ¿sabías que también alberga conjuntos de datos públicos y gratuitos a los que cualquiera puede acceder sin tener que almacenar ni descargar nada en sus dispositivos? Con datos que abarcan desde el clima, el entorno espacial y la información meteorológica hasta imágenes enfocadas en el desarrollo de algoritmos que facilitan la visión artificial, existen numerosas opciones para quienes buscan una forma más cómoda de analizar grandes cantidades de datos.
Con el fin de promover una mayor transparencia, fomentar la participación ciudadana y fomentar el diálogo, el Gobierno de Canadá ofrece una amplia gama de datos como parte de su iniciativa de Gobierno Abierto. En este sitio web, encontrará conjuntos de datos sobre temas gubernamentales, como la capacidad de los albergues para personas sin hogar en Canadá, así como cifras regionales sobre la participación de anglófonos y francófonos en el sector público. Con acceso a conjuntos de datos de esta naturaleza, no es necesario depender de estadísticas externas para encontrar información.
Catálogos de Datos, ahora Portales de Datos, ofrece a los usuarios un sitio práctico para explorar portales de datos abiertos de todo el mundo. Dado que los portales son evaluados y gestionados por diversos niveles de gobierno, diversas ONG e incluso el Banco Mundial, los datos disponibles para su análisis son de altísima calidad. Los usuarios pueden explorar o contribuir a los portales de datos. Desde el punto de vista de la investigación, la variedad de temas e información hace de este sitio un lugar especialmente práctico para iniciar una búsqueda de información.
Data.gov.uk es un sitio que permite a las personas encontrar y acceder a datos publicados por diversos organismos públicos, departamentos gubernamentales, autoridades locales y agencias gubernamentales. Aquí, los investigadores pueden encontrar información sobre el clima económico de las pequeñas empresas, el comercio, las importaciones, la industria y las exportaciones, o incluso investigar los pagos superiores a 25.000 libras esterlinas realizados por los departamentos gubernamentales. Dado que el sitio web indica explícitamente que los datos pueden utilizarse para la investigación, la información aquí presentada puede incluso generar más ideas a medida que los investigadores la analizan.
Este sitio es donde el Gobierno de EE. UU. proporciona datos abiertos a los que el público puede acceder en forma de conjuntos de datos. Además de los datos sin procesar, el sitio también ofrece diversas herramientas que permiten realizar visualizaciones de datos y crear aplicaciones para la web y dispositivos móviles. No se equivoquen. La información es inmensa, desde quejas sobre tarjetas de crédito hasta datos del programa federal de préstamos estudiantiles en más de 197 000 conjuntos de datos. Este sitio ofrece numerosas oportunidades para la innovación y el análisis exhaustivo.
14. DataSF
DataSF ofrece cientos de conjuntos de datos sobre la ciudad y el condado de San Francisco. ¿Le interesa saber qué han estado impulsando los grupos de presión locales y regionales? ¿Necesita estadísticas sobre delincuencia? Explore la pestaña "Exhibición" para ver los logros de las personas con los datos o utilice el formulario para contribuir. Creado con datos abiertos y con una academia, un blog y otras herramientas, este sitio se basa principalmente en la colaboración y la comunidad. Esto lo convierte en un recurso valioso para los investigadores.
15. Datos Ferrett
DataFerrett se diferencia de muchos sitios web en que no es un repositorio ni un directorio, sino una herramienta que permite a los usuarios personalizar datos de fuentes locales, estatales y federales mediante el análisis y la extracción de datos. Esta herramienta permite crear hojas de cálculo personalizadas y completas, y luego convertir la misma información en un mapa o gráfico sin necesidad de descargar ni habilitar ningún otro software. Organizar grandes cantidades de datos y convertirlos en algo fácil de leer nunca ha sido tan fácil.
16. Inforum
A través de la Universidad de Maryland, Inforum pone a disposición del público datos económicos de EE. UU. Numerosas agencias gubernamentales estadounidenses han contribuido a este sitio, hasta el punto de que ahora contiene miles de "series temporales económicas", como las denomina, que contienen cifras sobre producción industrial, índices de precios, estadísticas laborales e indicadores empresariales. Los datos son de libre acceso y se puede acceder a ellos desde una computadora portátil o de escritorio. Los investigadores que deseen analizar en detalle los datos económicos sin procesar tienen un recurso en Inforum.
17. Europea
Según las propias cifras del sitio, las colecciones de Europeana abarcan un total de más de 50 millones de registros. Gracias a los conjuntos de datos seleccionados, los investigadores pueden encontrar la información que buscan rápidamente. Los conjuntos de datos incluyen categorías como modelos 3D, mapas italianos de la Primera Guerra Mundial e incluso una colección de más de 20.000 fotos históricas de museos lituanos, entre otros. Tanto para búsquedas históricas generales como para explorar los extensos registros de Europeana, este es un excelente recurso.
Además de su cobertura continua de noticias y eventos de última hora, The Guardian también cuenta con una sección completa dedicada a reseñas de datos. Los artículos abarcan desde temas serios como la eficacia de las políticas de vivienda para las personas sin hogar hasta temas más informales como qué países tienen más ganadores del Premio Nobel. Periodistas e investigadores encontrarán en este sitio información de sobra para sus proyectos. Con una búsqueda rápida, es posible encontrar datos sobre prácticamente cualquier tema.
19. Ómnibus de expresión genética
Organizado por el Centro Nacional de Información Biotecnológica, el sitio web Gene Expression Omnibus contiene datos genómicos funcionales públicos que cumplen con los estándares MIAME (Información Mínima sobre un Experimento de Microarrays). El sitio también acepta datos en array o secuenciados, y proporciona las herramientas necesarias para encontrar y descargar la información. Quienes estén interesados en estudiar genomas o adquirir información sobre el tema encontrarán aquí toda la información que necesitan y mucho más.
Reconocido desde hace tiempo por sus contribuciones a la innovación y el progreso en las ciencias sociales, el Centro de Ciencia de Datos Espaciales (CSDS) de la Universidad de Chicago explora nuevas fronteras con su incursión en el análisis y la tecnología espacial. El trabajo del CSDS tiene aplicaciones en prácticamente cualquier campo que tenga que lidiar con el espacio al abordar estos problemas. En consecuencia, campos como la economía ambiental, la salud pública y la criminología se han beneficiado de estas aplicaciones. La dedicación del CSDS al software de código abierto y la distribución de su información hacen que los datos sean aún más accesibles.
21. Konect
Mediante el uso de datos recopilados por el Instituto de Ciencias y Tecnologías Web de la Universidad de Koblenz-Landau, KONECT (Colección de Redes de Koblenz) ofrece investigaciones realizadas en el campo de la ciencia de redes y temas afines. El proyecto utiliza diversas herramientas de análisis de redes de software propias para analizar números y generar gráficos y algoritmos. KONECT aloja los resultados de su trabajo analítico directamente en su sitio web. Con más de 200 conjuntos de datos para elegir, este es un recurso que vale la pena explorar.
MIdata es un sitio que funciona como repositorio de datos destinados al aprendizaje automático. Estos conjuntos de datos abarcan desde una compilación de expresiones faciales humanas hasta temas más científicos, como la predicción de la unión de moléculas. Con entradas divididas en categorías que ofrecen acceso a datos sin procesar, tutoriales en la sección de materiales y métodos, así como tareas y desafíos de aprendizaje, este sitio permite a los investigadores explorar el repositorio en busca de conjuntos de datos de interés.
23. NASDAQ
El NASDAQ es una bolsa de valores de renombre mundial que desde hace tiempo ha sido un excelente recurso para periodistas e investigadores que buscan datos del mundo financiero y empresarial. Aquí encontrará información sobre OPI, datos históricos de precios y las últimas noticias financieras, lo que convierte a este sitio en un recurso online de referencia para obtener datos financieros. NASDAQ Composite también ofrece opciones de pago para quienes deseen realizar un análisis más profundo. Es un recurso muy respetado y consolidado.
24. NASA
Desde el alunizaje, todo el mundo conoce esta agencia gubernamental y sus incursiones en el espacio exterior. Sin embargo, a los periodistas les interesa saber que la NASA también es una valiosa fuente de datos a través de su Archivo Coordinado de Datos de Ciencias Espaciales. Aquí, los investigadores pueden encontrar datos de misiones espaciales en categorías como astrofísica, recursos de imagen y heliofísica, entre otras. Además, el sitio web contiene numerosos libros blancos que acompañan a los nuevos datos que se envían.
Socrata es un sitio que recopila los datos gubernamentales disponibles y los presenta en un formato que facilita el análisis, la navegación y la búsqueda de la información. Diseñado específicamente para personas sin conocimientos técnicos, como expertos en políticas públicas, investigadores, emprendedores y ciudadanos preocupados, Socrata utiliza la nube para recopilar datos de diversas fuentes. Para los periodistas que buscan comprender la eficacia de diferentes políticas, esta plataforma es útil.
26. Quandl
Quandle es un sitio web que ofrece principalmente datos económicos y financieros, diseñados para profesionales de la inversión. Basándose en más de 500 fuentes de información de organizaciones de prestigio como CLS Group, la ONU, bancos centrales y Zacks, entre otras, para la agregación de sus datos, esta fuente es perfecta para investigadores y periodistas que desean obtener una visión general de un vistazo. Gracias al complemento de Excel del sitio, acceder a los datos directamente nunca ha sido tan fácil para los usuarios.
27. Universidad Carnegie Mellon
La Universidad Carnegie Mellon goza de una merecida reputación como excelente institución académica. Lo que mucha gente desconoce es que el StatLab de Carnegie Mellon es un recurso útil para periodistas que buscan datos. Este archivo de datos incluye información sobre temas como los salarios de los jugadores norteamericanos en la MLB en 1986, así como datos diseñados para evaluar la precisión del software estadístico. A cambio de su reconocimiento, estos conjuntos de datos están disponibles para uso público.
28. UCI
El Repositorio de Aprendizaje Automático de la UC Irvine, conocido como UCI, es un sitio que almacena una gran cantidad de datos interesantes que los periodistas pueden usar. Alberga 394 conjuntos de datos al momento de escribir este artículo y cuenta con la ventaja adicional de una interfaz fácil de buscar. Algunos de los conjuntos de datos más populares incluyen información sobre "Reconocimiento de Actividad Humana con Smartphones", vino y marketing bancario, entre otros temas. A cambio de usar todos estos datos, el sitio simplemente solicita una cita.
Si eres periodista y te interesa el desarrollo del aprendizaje automático, la página de Clasificación/Agrupamiento de Series Temporales de la UCR te resultará una excelente lectura. El sitio ofrece un útil documento informativo con toda la información necesaria. Además de una descripción general del contenido de la información, el sitio también ofrece la posibilidad de descargar los datos directamente. Recuerda usar el formato de cita que solicita el sitio si utilizas estos conjuntos de datos.
30. Censo de EE. UU
¿Necesita estadísticas sobre la riqueza poblacional? ¿Quiere saber la distribución exacta por género de un campo en particular? El censo de EE. UU. es un sitio que ofrece todos estos datos y más para consulta pública. Ordene los datos por año o región y encontrará rápidamente las estadísticas que la mayoría de la gente desconocía que se incluyeron en el censo de EE. UU. de la forma en que se incluyeron. Estas cifras estaban disponibles en Excel y Microsoft Word como opciones, lo que facilita aún más el acceso a los datos para los periodistas.
31. Wolfram Alpha
Wolfram Alpha es un motor computacional que permite a los usuarios introducir los datos que desean conocer y obtener un cálculo. El motor procesa datos y análisis estadísticos, química, fechas y horas, e incluso palabras y lingüística, entre otras cosas. Para quienes buscan nuevas formas de gestionar datos, esto resulta especialmente útil, ya que puede generar nuevos cálculos con solo pulsar un botón. Los periodistas, en particular, se beneficiarán enormemente al utilizarlo como recurso complementario.
32. Gañido
Resulta que Yelp es mucho más que solo restaurantes y reseñas de negocios. Este sitio web de reseñas, impulsado por los usuarios, también mantiene un conjunto de datos que permite a los investigadores acceder a reseñas, datos de usuarios y negocios para fines personales, educativos y académicos. Según el recuento de la compañía, el conjunto de datos incluye 4,7 millones de reseñas y 156.000 negocios en 12 áreas metropolitanas. Con estas cifras, los materiales y las tendencias que los investigadores podrían descubrir en estos datos podrían ser una grata sorpresa.
33. Mundo de datos
¿Quieres tener una lista de las páginas de Facebook eliminadas? ¿Qué te parece poder ordenar los datos económicos de EE. UU. por condado? Data World es un sitio que permite compartir, alojar, colaborar y realizar un seguimiento de datos. El sitio incluso incluye una sección para periodistas que explica por qué Data World es útil para los profesionales, además de destacar las posibilidades de alojamiento de un predictor optimizado de la Ley de Libertad de Información (FOIA), así como páginas diseñadas para facilitar la organización. En definitiva, se trata de una excelente combinación de datos y alojamiento de datos.
Dirigido y operado por la CIA, el World Factbook ofrece información sobre las estructuras sociales, la historia, la situación militar y económica de 267 países, junto con mapas, banderas y un conjunto de husos horarios que se basan en los materiales del mapamundi. El sitio ofrece una visión exhaustiva y profunda del tema, que va más allá de lo básico. En resumen, esta es una fuente de datos imprescindible para cualquier periodista.
Administrado por el Departamento de Salud y Servicios Humanos de EE. UU., HealthData.gov ofrece al público acceso a datos de salud de alto valor con la esperanza de captar la atención de emprendedores, legisladores e investigadores. Al menos en el ámbito del desarrollo de productos y servicios, se han podido examinar estos datos y obtener resultados. Los periodistas que deseen mantenerse a la vanguardia de los datos de salud o que estén revisando una declaración de un funcionario de salud pueden usar este sitio para encontrar respuestas.
36. UNICEF
Este sitio web otorga credibilidad inmediata a los periodistas que utilizan la información que ofrece. Las estadísticas que UNICEF publica incluyen temas de salud y derechos humanos como educación, salud materna, pobreza infantil, agua y saneamiento, y discapacidad infantil, entre muchas otras categorías de estadísticas. Es útil para investigadores porque está actualizado y cuenta con el respaldo de una de las organizaciones más reconocidas del mundo. Los periodistas no se equivocarán al citar esta fuente de datos.
37. Organización Mundial de la Salud
La Organización Mundial de la Salud es una organización internacional que recopila estadísticas e información sanitaria a nivel mundial. Además de la información disponible directamente en su página de inicio, el sitio también ofrece datos a través del Observatorio Mundial de la Salud. Estos datos incluyen información sobre las medidas que están adoptando los países para lograr la atención sanitaria universal, la investigación y el desarrollo en salud, entre otras categorías. Los periodistas encontrarán aquí abundante información sobre brotes, emergencias sanitarias y cobertura sanitaria desde una perspectiva internacional.
Con la disponibilidad de Google Public Data, los periodistas pueden confiar plenamente en Google de múltiples maneras. El gigante de las búsquedas cuenta con datos públicos disponibles para su análisis, con más de 100 conjuntos de datos públicos a su disposición. El contenido de los datos abarca desde los más complejos, como los Indicadores de Desarrollo Mundial y los Indicadores de Desarrollo Humano, hasta los más interesantes, como los datos sobre las carreteras más peligrosas de Europa. Basta con realizar una búsqueda para ver qué ofrece Google Public Data.
39. Gap Minder
Gap Minder ofrece datos sobre diversos indicadores locales y nacionales, junto con enlaces e información sobre todos los proveedores de datos. En este sitio, los investigadores pueden consultar información como la edad de las mujeres al casarse por primera vez, estadísticas sobre el consumo de alcohol y las causas de muerte infantil. Para periodistas que escriben con un enfoque internacional o que elaboran datos comparativos, este es un recurso excelente. Es una fuente de datos útil en cualquier situación.
Google Trends es una herramienta que ofrece a los investigadores información sobre lo que buscan las personas en este momento. Los investigadores pueden comparar los datos con las tendencias del pasado y también usar la herramienta para realizar estimaciones antes de, por ejemplo, la temporada navideña, para ver qué ocurrirá con las búsquedas en el futuro. Google Trends ofrece gráficos, temas de actualidad y numerosas oportunidades para descubrir las noticias antes de que se publiquen oficialmente.
41. Google Finance
Google Finance ofrece una forma rápida y sencilla de realizar una búsqueda más exhaustiva de una empresa que ha sido elogiada por los inversores. Ofrece formas sencillas de filtrar indicadores técnicos y consultar las últimas noticias sobre la empresa en una ventana sencilla y directa que permite ordenar aún más la información. Además, es gratuito. Para los periodistas que desean investigar las finanzas de una empresa que cotiza en bolsa, Google Finance ofrece una interfaz intuitiva para acceder a esta información. Lamentablemente, Google ha descontinuado recientemente algunas funciones principales, como la cartera financiera. Aquí tienes algunas alternativas a Google Finance .
42. DBpedia
Cualquiera que haya deseado una forma más sencilla de realizar búsquedas en Wikipedia tiene motivos para estar entusiasmado con DBpedia. Impulsado por el compromiso de la comunidad, este sitio busca posibilitar búsquedas más sofisticadas en el contenido de Wikipedia. Con la versión en inglés, que cuenta con 4,58 millones de entradas con clasificaciones y categorías asociadas, el sitio está en camino de ofrecer una cobertura completa basada en la información de Wikipedia. Los periodistas no se equivocarán con esta fuente de datos.
43. Pew Research
Para muchos, Pew Research es una fuente líder en encuestas, informes y datos de investigación. El sitio abarca temas que abarcan desde opiniones políticas hasta tendencias sociales y desarrollos en diversos sectores laborales. Pew Research también cuenta con una función de búsqueda que facilita el acceso a la información. Los periodistas que buscan estadísticas y hallazgos actualizados provenientes de una fuente confiable y de buena reputación no se equivocarán al recurrir a Pew Research.
44. Instituto Broad
Para los periodistas que desean conocer las últimas noticias sobre el cáncer, los conjuntos de datos del Instituto Broad podrían ser el lugar ideal para encontrar la información. Esto también incluye información sobre temas como la bioinformática y la biología computacional, así como el cáncer cerebral y el descubrimiento de patrones moleculares. En resumen, este sitio ofrece a los periodistas una ventaja para encontrar datos detallados sobre el cáncer y crear artículos a partir de los datos proporcionados por el Instituto Broad.
45. Datos de las Naciones Unidas
UNdata ofrece información sobre diferentes países del mundo. Esto incluye datos como indicadores técnicos, sociales y económicos de cada país. Para periodistas que trabajan en historias de interés humano o que podrían beneficiarse de la sustentación con estadísticas y datos adicionales, UNdata es la opción ideal. La precisión de los datos, así como la reputación de la ONU, la convierten en una fuente de datos confiable para los periodistas durante sus investigaciones.
46. Google Académico
Imagine si, en lugar de navegar por sitios web, fuera posible realizar una búsqueda que solo mostrara artículos revisados por pares y materiales académicos. Google Académico permite encontrar artículos de revistas, libros blancos y publicaciones de los académicos más destacados del mundo. Como suele ser habitual en esta empresa, Google Académico es sumamente intuitivo: el usuario solo necesita introducir una palabra clave para comenzar. Buscar artículos académicos nunca ha sido tan sencillo.
47. Reddit
Conocido comúnmente como "la portada de internet", Reddit es uno de los sitios web más populares de internet. Además de ser un indicador preciso de lo que sucede en línea, el sitio también cuenta con un subreddit, o subforo, dedicado a conjuntos de datos. Los usuarios pueden solicitar conjuntos de datos, publicar recursos y debatir sobre cómo trabajar con datos en formatos como JSON. Los investigadores se benefician enormemente al examinar esta fuente de datos.
48. Mercado de datos
Qlik DataMarket permite recopilar y gestionar datos de fuentes externas. Esta plataforma permite a los usuarios tomar prestados datos de varios conjuntos de datos y compararlos con los que ya poseen para mejorar su comprensión del contexto. Mejor aún, aunque se trata de una plataforma de pago, dependiendo del tema, Qlik DataMarket también ofrece una opción gratuita. Los periodistas que exploren los datos pueden hacerlo a su antojo.
49. Hubspot
Hubspot siempre ha sido un referente en el mundo del marketing empresarial. Desde la perspectiva de la investigación, este sitio informa a los investigadores sobre las últimas novedades del sector, así como de qué se habla en tiempo real en el sector del marketing. Los periodistas pueden usar este sitio para conocer las tendencias. En este sentido, Hubspot es un excelente recurso para los investigadores.
50. Oficina de Estadísticas de Justicia
Como era de esperar, la Oficina de Justicia mantiene una gran cantidad de estadísticas. En su sitio web, encontrará cifras sobre arrestos, muertes de reclusos, ejecuciones con pena capital, estadísticas policiales y censos de prisiones. El sistema de justicia penal es un tema de constante fascinación tanto para el público como para quienes lo integran. Por eso, las estadísticas de la Oficina de Justicia son aún más útiles para los periodistas que investigan el sistema de justicia penal.
51. Informe uniforme sobre delitos
El Informe Uniforme de Delitos (UCR) es una recopilación de estadísticas sobre delitos contra la propiedad y delitos violentos recopiladas por el FBI. Si bien las agencias policiales de todo Estados Unidos han reportado estos datos desde 1930, los hallazgos se han publicado desde 1958. Los periodistas que deseen explorar los datos sobre delitos pueden acceder y utilizar la herramienta de datos UCR para explorar la información disponible en este sitio.
52. Informe uniforme sobre delitos
El Informe Uniforme de Delitos es el resultado de un programa ideado por la Asociación Internacional de Jefes de Policía en 1929. Las cifras que recopila el FBI se publican cuatro veces al año. Además de la información proporcionada por el programa UCR, el sitio también incluye informes sobre estadísticas de delitos de odio, el Índice de Agentes de la Ley Muertos y Agredidos (LEOKA), así como los resultados y cifras del Sistema Nacional de Informes Basados en Incidentes.
53. NACJD
El NACJD, o Archivo Nacional de Datos de Justicia Penal, es un sitio que extrae información de conjuntos de datos como los Informes Uniformes de Delitos (UCR) y la Encuesta Nacional de Victimización Criminal (NCVS), y luego almacena y distribuye las estadísticas. Diseñados para ser seleccionados, almacenados y mantenidos para una máxima accesibilidad, los datos se presentan en diversas formas, incluyendo experimentales, cualitativas y longitudinales. En definitiva, esto ofrece a periodistas y otros investigadores otra forma de visualizar y acceder a las estadísticas de justicia penal.
First Databank es un sitio web que gestiona datos sobre medicamentos. Su objetivo es promover una toma de decisiones más eficiente y basada en datos en el sector farmacéutico. Esto permite a médicos y profesionales clínicos empezar a pensar en los fármacos de forma diferente gracias a la innovadora tecnología de First Databank. Desde una perspectiva profesional, este sitio es especialmente útil porque sus datos pueden ayudar a los equipos a adaptarse a la nueva información. Como mínimo, es un recurso útil para periodistas que escriben en el sector farmacéutico.
55. FDA
La FDA, conocida como la Administración de Alimentos y Medicamentos (FDA), es la agencia responsable de proteger la salud pública mediante la supervisión y aprobación de medicamentos, productos alimenticios, suplementos, vacunas y cosméticos, entre otros productos de consumo. Como recurso, la FDA ofrece bases de datos para consulta pública, además de proporcionar información técnica para quienes se familiarizan con el uso de hojas de cálculo y el análisis de la información proveniente de dichas bases. Este es sin duda un recurso útil para periodistas.
¿Alguna vez te has preguntado cuánto paga exactamente el país tras una epidemia de drogas? ¿Hay rumores de que la gente consume drogas de forma diferente a como lo hacía antes? Drugbase ofrece una base de datos repleta de estadísticas sobre las tendencias y el consumo de drogas en Estados Unidos. Incluye infografías y publicaciones sobre temas como la comorbilidad de la adicción y las enfermedades mentales, o datos sobre conducir bajo los efectos de las drogas (no del alcohol). Este recurso proporciona suficiente información para detectar tendencias y comparar datos históricos.
57. ONUDD
La UNODC, u Oficina de las Naciones Unidas contra la Droga y el Delito, cuenta con un sitio web dedicado a promover su objetivo de ayudar a los Estados miembros a adoptar estándares más rigurosos de investigación, recopilación de datos y análisis forense. En este sitio, los investigadores pueden encontrar numerosas estadísticas y publicaciones que abarcan temas como la recopilación de datos, el análisis de tendencias y los programas de investigación, siempre que sea posible. Se trata de un recurso repleto de información sobre diversos temas relacionados con la ciencia forense, así como sobre la disciplina científica de la materia.
58. Datos sobre la guerra contra las drogas
Drug War Facts es un sitio web que ofrece un amplio análisis de la guerra contra las drogas, así como de sus consecuencias. Incluye estadísticas y cifras sobre detalles como comparaciones entre el costo del tratamiento y el costo de depender de las fuerzas del orden, estimaciones del gasto en control de drogas y una gran cantidad de información sobre prácticamente todos los temas relacionados con la guerra contra las drogas. Para muchos, este es el sitio web más completo sobre la guerra contra las drogas.
59. Centro Nacional de Estadísticas de Educación
El Centro Nacional de Estadísticas Educativas, a menudo conocido como NCES, es el lugar ideal para consultar cualquier estadística relacionada con la educación. Este sitio ofrece estadísticas sobre el estado de los préstamos estudiantiles, proyecciones de tendencias educativas, además de conjuntos de datos y herramientas de comparación que permiten realizar análisis más profundos. Los periodistas pueden usar este recurso para descubrir tendencias, verificar declaraciones públicas, revisar las publicaciones del Centro Nacional de Estadísticas Educativas y encontrar nuevas historias en los datos.
60. Banco mundial
El Banco Mundial alberga numerosas estadísticas y datos recopilados por el Grupo de Datos de Desarrollo, tanto en el sector financiero como en el macroeconomía. Es posible filtrar los datos mediante etiquetas. Los usuarios pueden elegir entre diversos indicadores y seleccionarlos por país para revisar las diferentes medidas de progreso del desarrollo. Por lo tanto, este es un recurso al que cualquier persona que investigue la situación financiera o económica de los países miembros puede acceder con facilidad.
61. Oficina de Estadísticas Laborales
La Oficina de Estadísticas Laborales es la fuente predilecta de los periodistas para obtener cifras y estadísticas sobre las condiciones laborales actuales, la situación del mercado laboral y cómo los precios cambian y afectan a la economía estadounidense. Dado que el trabajo estadístico de la agencia se remonta a 1884, abundan los datos económicos que los investigadores pueden consultar. El sitio web almacena la información en una interfaz intuitiva y actualiza constantemente los datos disponibles para su búsqueda. Vale la pena explorar esta fuente de datos.
62. Los números
Los estrenos taquilleros reciben mucha atención mediática, pero es difícil determinar el éxito real de una empresa sin cifras. Aquí es donde entra "The Numbers". Este sitio web ofrece investigación y datos para la industria cinematográfica y del entretenimiento. Los investigadores pueden explorar estimaciones de ingresos, expectativas para próximos estrenos y otros datos de inversión mediante el motor de búsqueda basado en SQL de OpusData. The Numbers es el primer lugar al que los investigadores acuden para obtener estadísticas fiables sobre películas. Por eso es un recurso excelente.
Film Forever es un sitio web que los investigadores pueden visitar para obtener información de mercado y datos sobre la industria cinematográfica del Reino Unido. Aquí, los usuarios pueden encontrar las cifras semanales de taquilla de los 15 principales estrenos del Reino Unido, estudios de audiencia, informes, casos prácticos y el anuario estadístico insignia de la organización. Además, el sitio también cuenta con un calendario que mantiene a los espectadores informados sobre la próxima publicación de estadísticas. El nicho de mercado de Film Forever lo convierte en una fuente de datos especialmente valiosa.
64. Federación Internacional de la Industria de la Industria Farmacéutica (IFPI)
La IFPI es un sitio web que se enorgullece de estar al tanto de la industria discográfica mundial. Los usuarios encontrarán informes publicados con información detallada sobre música grabada, datos de ventas nacionales e internacionales, así como informes sobre el sector empresarial de la industria musical que muestran cómo las empresas invierten en ella. Estos informes permiten a los usuarios estar al tanto de las novedades. Este sitio mantendrá a los investigadores al día sobre lo que ocurre en la industria musical en tiempo real.
65. Statista
Statista es un motor de búsqueda similar a Google, solo que en lugar de páginas web, el sitio muestra datos y estadísticas. Con solo pulsar un botón, los usuarios pueden acceder inmediatamente a más de un millón de estadísticas y datos. Encontrarán infografías, estadísticas sobre China, la industria alimentaria, los mercados de consumo y, por una tarifa, también pueden consultarse expedientes e informes del sector. Ya sea que busque información sobre la economía, las redes sociales o el Big Mac, este es el lugar ideal.
66. Agencia de Protección Ambiental
La EPA, abreviatura de la Agencia de Protección Ambiental de los Estados Unidos, es la agencia gubernamental responsable de proteger a las personas y al medio ambiente mediante la aplicación de las leyes promulgadas y aprobadas por el Congreso. En su sitio web, los usuarios pueden consultar diversos conjuntos de datos sobre temas que abarcan desde la agricultura hasta temas tan específicos como las emisiones anuales de sustancias químicas tóxicas y los métodos de gestión de residuos. Este sitio es una excelente opción para periodistas que desean acceder a datos ambientales sin procesar.
67. Centros para el Control y la Prevención de Enfermedades
Este sitio web de los Centros para el Control y la Prevención de Enfermedades se presenta como una fuente integral de datos de salud pública ambiental. En él, los investigadores encontrarán referencias y listas de sistemas de datos que reciben fondos nacionales, a la vez que rastrean y almacenan información relacionada con problemas de salud pública ambiental. Centrado en programas nacionales y accesible mediante descarga directa, este es un recurso confiable para obtener la información más reciente y precisa de la web.
68. Centros Nacionales de Salud Ambiental
Fundados tras la fusión de tres agencias anteriormente independientes, los Centros Nacionales de Salud Ambiental son el lugar ideal para obtener información de alta calidad sobre el medio ambiente. Ofrecen datos completos que abarcan desde datos oceánicos hasta registros de hielo de millones de años atrás. Si el tema es ambiental, es probable que este sitio web contenga información al respecto. El compromiso de la agencia con la precisión y la excelencia en la gestión de uno de los archivos más grandes de su tipo también la convierte en uno de los pocos sitios en línea que posee, actualiza y mantiene este tipo de datos.
69. Servicio Meteorológico Nacional
El Servicio Meteorológico Nacional de la Administración Nacional Oceánica y Atmosférica (NOAA) les informará a los investigadores sobre todo lo que necesitan saber sobre el clima. Este sitio ofrece búsquedas de datos que incluyen información sobre categorías como advertencias y pronósticos, clima, pronósticos geográficos y más. Además, incluye un mapa intuitivo y fácil de seguir con pestañas que permiten acceder a diferentes resultados. Ya sea para revisar lo sucedido localmente o para encontrar el pronóstico de una ciudad en otro estado, este sitio les permitirá descubrir información rápidamente.
70. Wunderground
Wunderground es un recurso dedicado a garantizar que la información meteorológica esté disponible para todos en todo el mundo, prestando atención también a las zonas con poca cobertura. Wunderground declara explícitamente que ha tomado medidas para garantizar una excelente experiencia de usuario en múltiples plataformas digitales. Esto significa que el sitio es accesible tanto desde dispositivos móviles como desde PC, lo que lo convierte en un recurso ideal para periodistas que están en movimiento.
Weatherbase proporciona información sobre las condiciones actuales, promedios, información climática y condiciones de viaje para más de 40,000 ciudades de todo el mundo con una sencilla barra de búsqueda. Utiliza el sitio web complementario al que se vincula para encontrar información adicional sobre viajes, como conversores de moneda, coordenadas e información sobre condados, entre otros datos curiosos. Weatherbase también permite encontrar destinos vacacionales basándose únicamente en el clima. ¡Que disfrutes de la búsqueda!
72. Atlas de energía
Publicado por la Agencia Internacional de la Energía, el Atlas de la Energía ofrece a los investigadores la posibilidad de comprender el mundo a través de las estadísticas energéticas. Diseñado originalmente como una fuente de datos complementaria desde su creación, el sitio web cuenta con un balance energético animado de flujo de Sankey, así como con varias bases de datos que complementan las publicaciones, las cuales pueden consultarse en la página de estadísticas de la Agencia Internacional de la Energía. Tanto este sitio como sus sitios complementarios resultarán sumamente útiles para los investigadores al investigar cómo los países y las ciudades utilizan la energía.
73. Oficina de Análisis Económico
La Oficina de Análisis Económico (BEA) publica una amplia gama de información útil que permite a los investigadores mantenerse al tanto de la economía nacional. En este sitio, encontrará cifras sobre las cuentas económicas de EE. UU., incluyendo datos sobre el gasto del consumidor, el PIB y los activos fijos, entre otros. Los investigadores pueden buscar por región o sector, así como por nivel, con opciones de búsqueda internacionales, nacionales y regionales. Visite la página de datos interactivos para obtener más información sobre la oficina.
74. Oficina Nacional de Investigación Económica
El sitio web de la Oficina Nacional de Investigación Económica (NBER) es una fuente de datos que aborda la economía desde una perspectiva analítica. Alberga datos sobre una amplia gama de temas económicos, con entradas como el Índice de Gobernanza Africana, el Ciclo Económico Oficial, los Índices Experimentales Coincidentes, Adelantados y de Recesión, y la Base de Datos de Historia Macroeconómica. La NBER cuenta con conjuntos de datos oficiales publicados y compilados bajo su propio nombre, así como índices compilados por otras editoriales.
75. Comisión de Bolsa y Valores de Estados Unidos
La Comisión de Bolsa y Valores de Estados Unidos (SEC) es una agencia que actúa como un organismo de control para promover la transparencia, la equidad y la eficiencia en los mercados. Curiosamente, el sitio cuenta con un conjunto de datos de estados financieros que datan de enero de 2009 a octubre de 2017, con actualizaciones trimestrales. Los investigadores pueden confiar en este sitio para mantenerse al día con las últimas noticias sobre presentaciones y la información que ofrece sobre las empresas y el estado de sus finanzas.
76. FMI
El Fondo Monetario Internacional, también conocido como FMI, es una organización consolidada en el sector económico y financiero internacional. En su sitio web, los investigadores pueden encontrar una gran cantidad de datos sobre estos temas. Los usuarios pueden buscar conjuntos de datos por indicador y país, así como explorar los gráficos y mapas mientras investigan. Entre los conjuntos de datos más populares se incluyen la dirección del comercio, los precios de las materias primas, los indicadores de solidez financiera, las encuestas y las estadísticas de finanzas internacionales, entre otros datos valiosos.
Originalmente concebido por Harvard, el Atlas es una herramienta en línea que permite visualizar e interactuar con la situación comercial de una empresa. Atlas recopila la información y propone diferentes productos que el país podría fabricar para mejorar su economía. Esta herramienta es utilizada por legisladores, empresarios, inversores y ciudadanos comprometidos que desean comprender mejor la situación económica de un país. Las cuestiones relacionadas con el comercio y las economías nacionales nunca han sido tan accesibles.
Doing Business es el resultado de un esfuerzo por realizar evaluaciones objetivas de las regulaciones empresariales. El sitio examina casi 200 economías y numerosas ciudades, midiendo detalles como indicadores económicos y clasificando la facilidad para hacer negocios. Este sitio permite a los usuarios examinar los efectos de diversos tipos de regulaciones empresariales entre países y alberga informes, así como amplios datos cualitativos. Además, el sitio también permite realizar comparaciones a lo largo del tiempo.
79. Comercio
Comtrade, originalmente un proyecto del Departamento de Negocios, Energía y Estrategia Industrial del Reino Unido, en colaboración con el Departamento de Comercio Internacional, es un excelente recurso. Basándose en datos de Comtrade de las Naciones Unidas, el sitio ofrece a los usuarios un gráfico interactivo que permite buscar, comparar y analizar las cifras exactas del comercio y las mercancías entre países. Simplemente seleccione el país informante, elija un país socio y realice la mayor selección posible.
80. Datos financieros globales
Global Financial Data es una fuente que no solo recopila datos financieros estándar, sino que también utiliza información financiera desde el siglo XIII hasta la actualidad. Esta información proviene de diversas fuentes, como libros, material de archivo, revistas académicas y periódicos. Además, el sitio cuenta con conjuntos de datos que utilizan el método estadístico de encadenamiento. El resultado final, desde la perspectiva del usuario, es un recurso único en internet gracias a sus datos exclusivos.
Visualizing Economics no es tanto un recurso en el sentido de descubrimiento de datos, sino más bien un servicio centrado en el diseño de gráficos de información y paneles interactivos. Además, Visualizing Economics también realiza análisis y diseño con el propósito expreso de facilitar la comprensión de los datos económicos. A través de este sitio, los periodistas tienen la oportunidad de trabajar con un profesional con años de experiencia en la traducción de datos económicos a un formato más accesible para el público general.
82. Portal de datos abiertos de la UE
El Portal de Datos Abiertos de la UE es un proyecto creado tras una decisión de la Comisión Europea. En este sitio, las instituciones de la UE ofrecen datos para consulta y uso público, sin restricciones de derechos de autor y disponibles gratuitamente. Los conjuntos de datos incluyen los datos de referencia de CORDIS, el registro de transparencia e incluso una lista completa de las personas, entidades y grupos a los que la UE ha impuesto sanciones financieras. Además, los datos están disponibles en diversos formatos digitales.
83. Red de Datos Abiertos
La Red de Datos Abiertos es un sitio que permite a los usuarios consultar datos por región y ciudad. Con una página de inicio clara e intuitiva, los investigadores pueden buscar por categoría de datos, ciudad e incluso por preguntas de ejemplo. En cada página, tras revisar las categorías de datos o las preguntas de ejemplo, también hay enlaces a otros conjuntos de datos. La organización de los datos por sí sola hace que la Red de Datos Abiertos sea un sitio que vale la pena explorar.
84. Matriz terrestre
Landmatrix es un sitio web que ofrece una base de datos en línea sobre transacciones de terrenos con el objetivo de promover una mayor transparencia en las adquisiciones. En esencia, esta herramienta permite visualizar y comprender las diversas transacciones de terrenos. Los datos se actualizan, cambian y se ajustan constantemente para mejorar la precisión de la información disponible. Hasta la fecha, Landmatrix cuenta con información sobre más de 1000 transacciones. Es una fuente que vale la pena explorar para los investigadores.
85. Programa de las Naciones Unidas para el Desarrollo
El Programa de las Naciones Unidas para el Desarrollo (PNUD) alberga una gran cantidad de datos útiles sobre desarrollo humano en todo el mundo para que el público los explore. Con fechas que generalmente abarcan desde 1990 hasta 2015 en muchos de estos conjuntos de datos, los índices incluyen tablas completas, como las tendencias del índice de desarrollo humano, el índice de desigualdad de género y la brecha de género a lo largo de la vida. Los investigadores pueden buscar los datos directamente a través de la barra de búsqueda y también por país si desean explorar el gráfico.
86. OCDE
La OCDE, conocida como la Organización para la Cooperación y el Desarrollo Económicos, cuenta con un sitio web dedicado a ayudar a los gobiernos en sus iniciativas contra la pobreza y a promover la prosperidad mediante la estabilidad y el crecimiento económicos. En este sitio, los investigadores encontrarán materiales revisados por pares, publicaciones, así como estándares y argumentos a favor del establecimiento de estándares. La OCDE también publica un libro de datos que ofrece una sólida herramienta de referencia económica, que complementa diversas encuestas y predicciones sobre las perspectivas económicas que se pueden encontrar en sus páginas.
87. Departamento de Salud y Servicios Humanos de EE. UU
El Departamento de Salud y Servicios Humanos de EE. UU. opera un sitio web que ofrece información sobre el Consejo Presidencial de Aptitud Física, Deportes y Nutrición. Este sitio web contiene datos recopilados con la ayuda de expertos en campos relacionados, como chefs y atletas. Además, el sitio también ofrece numerosas estadísticas. Los investigadores pueden encontrar información sobre la actividad física infantil, los hábitos de fortalecimiento muscular de los adultos, así como sobre los hábitos alimentarios del público y la obesidad, entre otros datos y estadísticas.
88. Socios en el acceso a la información para el personal de salud pública
Socios en el Acceso a la Información para el Personal de Salud Pública es un proyecto que surgió de la colaboración entre organizaciones de salud pública, agencias gubernamentales de EE. UU. y bibliotecas especializadas en ciencias de la salud. Las páginas temáticas de este sitio incluyen temas como subvenciones y financiación, promoción y educación para la salud, y bibliografía y directrices. La sección de Temas de Salud Pública también incluye información sobre bioterrorismo, genómica en salud pública y salud pública dental, entre otros.
Durante las últimas tres décadas, la United Health Foundation ha proporcionado información sobre clasificaciones de salud para medir la salud pública. El sitio web alberga numerosos informes y publicaciones, incluyendo informes sobre la salud de quienes han prestado servicio, informes de altos cargos, salud de la mujer y el niño, informes anuales e incluso resúmenes sobre temas importantes para el sector. Utilice el mapa interactivo para explorar por región y obtener más información. También hay una barra de búsqueda para navegar mejor si los investigadores buscan información más específica.
En Estados Unidos, Medicare es el principal medio de acceso a seguro médico y tratamiento para muchas personas. Además de los servicios que ofrece en tiempo real, Medicare también ofrece datos sobre los estándares y la calidad del tratamiento en diferentes centros y hospitales mediante su tabla y regla comparativa. Es el conjunto de datos oficial utilizado por el sitio web Hospital Compare y está repleto de datos que pueden descargarse a Excel para facilitar el acceso.
91. Vigilancia, epidemiología y resultados finales (SEER)
Vigilancia, Epidemiología y Resultados Finales, también conocido como SEER, cuenta con un sitio web especialmente útil como fuente de información sobre estadísticas de cáncer. Alberga resúmenes estadísticos que permiten investigar las cifras asociadas al cáncer, las cuales pueden clasificarse por localización, etnia, raza, edad, sexo e incluso por tipo de dato. El sitio también alberga publicaciones, conjuntos de datos y software que los investigadores pueden utilizar para un análisis más profundo.
Amnistía Internacional es una organización que desde hace tiempo defiende los derechos humanos y la justicia en todo el mundo. Además, recopila numerosos datos sobre la situación de los derechos humanos en todo el mundo, así como información sobre atrocidades y crímenes de lesa humanidad específicos en diferentes momentos, como parte de su informe anual. Los investigadores pueden utilizar esta información para realizar comparaciones entre diferentes años y observar cómo han evolucionado o retrocedido los distintos países en materia de derechos humanos.
93. Grupo de Análisis de Datos de Derechos Humanos
Desde su creación hace 25 años, el Grupo de Análisis de Datos de Derechos Humanos ha aplicado principios científicos a las violaciones de derechos humanos en diferentes países del mundo. El sitio alberga publicaciones publicadas en medios de comunicación prestigiosos como el Washington Post y publicaciones formales de editoriales Macmillan, ordenadas por año. Además de sus publicaciones organizadas que se remontan a años atrás, también se llevaron a cabo proyectos en todo el mundo. Para una visión más técnica de las violaciones de derechos humanos, esta es una excelente opción de búsqueda.
94. Datos de relaciones internacionales y derechos humanos
Este sitio alberga bases de datos compiladas por numerosas organizaciones, universidades e incluso agencias gubernamentales de prestigio. Ejemplos de estas son el Proyecto Manifiesto, el Proyecto Minorías (en Riesgo), el Distrito de Estados de Bienestar Comparativo y la Base de Datos de Conflictos Armados. Algunos proyectos, como el Proyecto Polity IV, se remontan al siglo XIX. Por otro lado, proyectos como el Instituto Internacional de Investigación para la Paz de Estocolmo (SIPRI) miden las transferencias de armas, el gasto militar internacional y las tendencias de seguridad. La mejor manera de apreciar los datos es visitar el sitio y explorarlo.
95. Programa de datos sobre conflictos de Uppsala
El Departamento de Investigación de Paz y Conflictos de Uppsala, a menudo conocido como UCDP, alberga una extensa base de datos llamada Enciclopedia de Conflictos de la UCDP. Este sitio permite a los usuarios explorar los datos que el departamento ya ha desagregado. Los investigadores pueden acceder a ellos a través del sitio web y también descargarlos para su posterior manipulación y análisis. Este es un recurso confiable y de referencia para obtener información de calidad, distribuida de forma accesible.
96. Departamento de Trabajo de los Estados Unidos
El Departamento de Trabajo de Estados Unidos alberga una gran cantidad de datos económicos sobre estadísticas de desempleo y empleo. Naturalmente, estas cifras incluyen bases de datos que incluyen estadísticas de despidos masivos, proyecciones de empleo, vacantes y rotación laboral, estadísticas nacionales de empleo e incluso estadísticas comparativas internacionales de empleo. El sitio proporciona información actualizada y precisa, mientras que el Departamento de Trabajo la gestiona. Se trata de un recurso confiable con respaldo gubernamental para fines de investigación.
97. Administración de Pequeñas Empresas
La Administración de Pequeñas Empresas (SBA) ha sido durante mucho tiempo un recurso de confianza para emprendedores y aspirantes a emprendedores. Este sitio web alberga una gran cantidad de estadísticas sobre empleo, así como información que permite a los investigadores realizar estudios de mercado y análisis de la competencia. Aquí pueden encontrar cifras, estadísticas y herramientas que pueden utilizarse para obtener datos adicionales. Para obtener información sobre las estadísticas de las pequeñas empresas desde la perspectiva de un empleador y una empresa, este es un excelente recurso al que los periodistas pueden recurrir en cualquier momento.
98. Crowdpac
Crowdpac es una plataforma que permite a los candidatos políticos recaudar fondos y organizarse. Basándose en la idea de que en cada elección hay varios candidatos al Congreso que prácticamente no tienen oposición, este sitio permite a los ciudadanos comprometidos organizar su apoyo. Con artículos que abordan temas políticos relevantes como la manipulación de los distritos electorales, además de temas como los derechos civiles y la seguridad nacional, este sitio representa una excelente oportunidad para comprender y descubrir qué está sucediendo en la escena política de base.
99. Gallup
Este sitio alberga las famosas encuestas de Gallup. Gallup se especializa en análisis que permiten a los responsables de la toma de decisiones organizacionales resolver problemas mediante un enfoque basado en datos. Además, el método sugerido por Gallup suele ser útil para impulsar soluciones. Esta fuente es reconocida como el estándar de oro en datos y análisis avanzado. Simplemente navegue por el sitio para explorar informes sobre diversos temas, desde el estado del entorno laboral global hasta el análisis de la productividad en EE. UU.
100. Biblioteca de Berkeley
La Biblioteca de Berkeley alberga en su sitio web una recopilación completa de estadísticas y datos para la investigación en Ciencias Políticas. En esta página, los investigadores encontrarán numerosos enlaces que les permiten acceder a diversos conjuntos de datos, así como crear los suyos propios. Entre ellos se encuentran las Estadísticas Históricas de los Estados Unidos (HSUS), la Edición del Milenio, Data Planet, ProQuest Statistical Insight y el Consorcio Interuniversitario para la Investigación Política y Social. Hay varias horas de datos por analizar.
101. Servicios estatales de RAND
Para quienes no la conozcan, la Corporación RAND es una organización especializada en la investigación de los desafíos de las políticas públicas. Con clientes y una cartera que abarca todos los niveles de gobierno, la corporación es una fuente de investigación de calidad para la toma de decisiones. La sucursal estadounidense de la corporación alberga una base de datos de estadísticas en su sitio web. Aquí, los investigadores pueden encontrar información sobre educación primaria y secundaria, salud, negocios y economía, entre otras categorías que abordan temas relevantes para el bien común.
102. Centro Roper para la Investigación de la Opinión Pública
Dirigido y operado por la Universidad de Cornell, el Centro Roper para la Investigación de la Opinión Pública se especializa en la recopilación, distribución y preservación de datos de opinión pública. Como ejemplo del tipo de información que el Centro Roper puede obtener, los investigadores pueden acceder a datos de las elecciones estadounidenses, así como a un enlace a un archivo de más de 23 000 conjuntos de datos. Ya sea que los periodistas busquen la reacción del público a la política o a un reciente problema de salud, este sitio seguramente encontrará información.
Impulsado y operado por la Oficina de Transporte, este sitio contiene datos que abarcan una amplia gama de temas relacionados con el transporte. Los recursos incluyen informes sobre energía, seguridad de los pasajeros, rendimiento del sistema, economía del transporte, infraestructura y transporte de mercancías. Los usuarios pueden incluso ordenar y acceder a los datos por ubicación y geografía. Este sitio permite a los investigadores descubrir todo lo que podrían esperar saber sobre temas relacionados con el transporte.
104. Comercio de viajes
Travel Trade es un sitio web que alberga datos sobre las salidas de ciudadanos estadounidenses desde 1996 hasta 2016, al momento de redactar este documento. El objetivo de este recurso es ayudar al público en general interesado a comprender cómo ha funcionado el turismo global e internacional a lo largo de los años. Disponible tanto para descarga como para consulta en línea, esta información es accesible. Los investigadores pueden usar fácilmente estos datos para identificar tendencias y realizar comparaciones.
105. Skift
Skift es un sitio web que se centra en proporcionar inteligencia y datos a la industria turística. Entre otras fuentes de datos, la empresa ofrece investigaciones, conferencias y boletines informativos para suscriptores e investigadores. Skift examina temas que los profesionales del sector turístico desean conocer, como los destinos de viajes más populares, la identificación de nuevos mercados y mucha información adicional sobre tecnología turística que los investigadores pueden explorar.
106. Geoba.se
Geoba.se es el sitio perfecto para quienes buscan información completa sobre una ciudad o lugar. Con el buscador de la página principal, encontrar coordenadas, información de viaje, el tiempo e incluso vídeos de cámaras web locales está a solo unos clics. El sitio también incluye una página con información sobre clasificaciones mundiales, que puede filtrarse por región y país. En resumen, este es un recurso que proporciona datos y estadísticas precisos.
107. Viajes a EE. UU
US Travel alberga un sitio web operado y mantenido por el Departamento de Estado de EE. UU. Su misión declarada es proteger la vida de los ciudadanos estadounidenses que viajan al extranjero. Por ello, esta fuente contiene estadísticas, información e informes sobre temas como pasaportes y visas estadounidenses, adopciones internacionales, fallecimientos en el extranjero y secuestros internacionales de padres e hijos. La información puede utilizarse para planificar viajes, pero también para identificar tendencias a largo plazo con estadísticas que abarcan desde 1996 hasta 2016.
108. Servicio de datos del Reino Unido
Financiado por el Consejo de Investigación Económica y Social, el Servicio de Datos del Reino Unido publica una amplia gama de datos. Este sitio contiene información que incluye materiales como datos empresariales, encuestas transnacionales, encuestas patrocinadas por el gobierno del Reino Unido e incluso datos del censo británico. El sitio web se diseñó pensando en las necesidades de estudiantes e investigadores. Además, incluye guías, recursos e instructivos que ayudan a los investigadores a comprender y utilizar rápidamente las herramientas de este sitio.
109. Datos.gov.au
Data.gov.au, administrado y publicado por el gobierno australiano, ofrece fácil acceso y búsqueda de datos abiertos. Este sitio señala explícitamente que los datos gubernamentales pueden utilizarse para desarrollar herramientas y aplicaciones que, a su vez, benefician a los australianos. No solo se proporciona acceso a los conjuntos de datos abiertos, sino que también se puede acceder a datos no publicados mediante una tarifa. Para los investigadores que deseen realizar un análisis aún más profundo, el sitio también ofrece un kit de herramientas de datos.
110. Gorjeo
Todo el mundo conoce Twitter por sus conversaciones dinámicas, sus mensajes breves y su estatus como centro de noticias de última hora en la cultura popular. Sin embargo, lo que mucha gente desconoce es que Twitter también cuenta con herramientas para desarrolladores que facilitan el filtrado y el descubrimiento de información. Estas herramientas incluso permiten a los investigadores ver tendencias y filtrar por ubicación geográfica. Ya sea leyendo hashtags de tendencia o explorando las herramientas para desarrolladores, Twitter es un recurso que los periodistas llevan utilizando desde hace tiempo.
111. Instagram
Instagram no es solo para dar "me gusta" a fotos de gatos adorables y fotos de bebés adorables. O al menos, no tiene por qué serlo. La aplicación cuenta con un conjunto sorprendentemente sofisticado de herramientas para desarrolladores que facilitan la comprensión y la investigación de la audiencia. Además, los hashtags y las pistas que revelan las fotos que publican los usuarios, así como las personas etiquetadas en ellas, pueden ser una mina de oro de información. Instagram es una forma útil de descubrir las tendencias en diferentes sectores.
112. Cuatro cuadrados
Para el tipo de investigación donde la ubicación es importante, Four Square es una fuente de datos útil gracias a su enorme base de datos y a toda la información que ha recopilado. En principio, cuenta con una guía de la ciudad que ofrece recomendaciones a los usuarios sobre la solidez de la comunidad. Four Square también cuenta con herramientas para desarrolladores que permiten acceder a información adicional a través de la Base de Datos de Lugares. Los periodistas pueden usarla para obtener más información sobre ubicaciones específicas y sobre los usuarios de la aplicación.
113. El New York Times
Considerado por muchos como un miembro respetado del Cuarto Poder, son muy pocos los periodistas que desconocen el New York Times. Sin embargo, lo que a menudo se pasa por alto es su uso como fuente de datos a través de su API. Los investigadores pueden encontrar artículos que datan desde 1851 por mes, buscar artículos e incluso encontrar reseñas de libros. Esta API permite realizar búsquedas basadas en visualizaciones, compartidos y correos electrónicos, e incluso encontrar y acceder a comentarios.
114. AP
Associated Press ocupa un lugar destacado en la cultura popular como fuente de noticias oportunas y precisas. Gracias a sus herramientas para desarrolladores, también es una fuente de datos útil para periodistas. Al momento de escribir este artículo, los investigadores pueden usar estas herramientas para crear sus propias ediciones mientras descargan imágenes y videos. El nivel de contenido parece depender del tipo de plan que utilicen los investigadores, pero la API de Associated Press permite a los usuarios llevar el proceso de investigación a otro nivel.
115. Cinco treinta y ocho
Es posible que los periodistas ya conozcan a Nate Silver y Five Thirty Eight y su modelo estadístico debido a sus predicciones, a veces inesperadas, pero generalmente acertadas. Five Thirty Eight cuenta con un GitHub que alberga conjuntos de datos y código utilizado a lo largo de la historia del sitio. Los conjuntos de datos presentan temas interesantes, como datos sobre malos conductores, los Vengadores y la encuesta sobre protocolo de vuelo. Asimismo, hay archivos que abordan asuntos más serios, como la seguridad aérea y los delitos de odio.
116. IMDb
Muchos consideran que IMDb es el sitio web más completo sobre la industria cinematográfica y actoral. Si se estrena una película y la gente quiere saber quiénes actúan en ella o ver la reacción general del público, es probable que lleguen a este sitio durante su búsqueda. IMDb también alberga una serie de conjuntos de datos que se actualizan a diario y están disponibles para uso comercial y no comercial.
117. KAPSARC
KAPSARC es un portal de datos que alberga un total de 923 conjuntos de datos con información específica sobre datos energéticos. Estos conjuntos se dividen en temas generales sobre el uso y el suministro de energía, así como otros factores relevantes como políticas, demografía, medio ambiente, comercio, agua e información económica. Para los investigadores interesados en la energía y su uso en diferentes industrias y sectores, KAPSARC es una de las fuentes de datos energéticos más completas de la web.
118. Macro de activos
Asset Marco es un sitio que ofrece datos financieros históricos e indicadores macroeconómicos. Estos datos abarcan más de 75.000 acciones, divisas, materias primas y bonos de todo el mundo. Además, el sitio cuenta con más de 120.000 indicadores macroeconómicos que permiten a los usuarios explorar los datos financieros de diferentes países. Además de todos estos datos sobre el mercado financiero, el sitio también analiza estrategias de inversión. Esta fuente es única debido a la gran cantidad de información que ofrece.
119. Servicios web del gobierno de EE. UU. y fuentes de datos XML
Los servicios web y las fuentes de datos XML del gobierno de EE. UU. se alojan en un sitio web llamado USGovXML.com. Aquí, los usuarios pueden explorar las diferentes fuentes de datos XML y servicios web que ofrece el gobierno de EE. UU. Esta simple acción de conservación mantiene la transparencia y el acceso público a dichas fuentes web. Los investigadores que monitorean regularmente este índice pueden encontrar información relevante en los datos en caso de que se produzca un cambio repentino en los datos XML.
120. Figshare
Figshare es un sitio que alberga más de 5000 piezas de contenido científico disponibles para investigación y citación académica. Además de la información, el sitio está diseñado para ofrecer a los investigadores un único lugar para recopilar, subir, almacenar y gestionar la investigación que encuentren. Matemáticas, ciencias de la salud, ingeniería, química, ciencias biológicas y ciencias sociales se encuentran entre las categorías destacadas. Este sitio es una excelente fuente para periodistas que buscan más recursos académicos.
121. Datos enlazados
LinkedData es un sitio web dedicado a encontrar nuevas formas de conectar datos de Internet que antes no estaban enlazados. Aquí, los usuarios encontrarán tutoriales, guías y conjuntos de datos que les ayudarán a avanzar. Todos los conjuntos de datos se centran en la participación en la comunidad de datos enlazados y, además de la lista de compras de datos enlazados, la mayoría se clasifican como URI desreferenciables, con o sin el formato RDF complementario. Para obtener más información sobre esta comunidad, este sitio es imprescindible.
122. El minero web
Web Miner es el lugar perfecto para investigadores que desean recopilar todos los datos genéricos que puedan encontrar con el programa. Este sitio alberga bases de datos de ejemplo, como restaurantes estadounidenses, códigos SWIFT de bancos de todo el mundo, gasolineras estadounidenses, atracciones turísticas estadounidenses y aplicaciones de Google Play, entre otras listas enormes. Es, como mínimo, un sitio que facilitará y agilizará a los periodistas la selección y el descubrimiento de grandes cantidades de datos en mucho menos tiempo.
123. Centro de datos
Data Hub se enorgullece de ser un lugar donde los usuarios pueden encontrar y publicar datos de la forma más rápida y eficiente posible. El sitio alberga diversos conjuntos de datos. El Índice de Precios de la Vivienda (Case-Shiller), el precio mensual del oro y las Tendencias Actuales del Dióxido de Carbono Atmosférico son los tres más populares. Además de los datos, el sitio también ofrece varios tutoriales que los usuarios pueden consultar para aprender a navegar por los distintos tipos de datos disponibles.
124. Enigma Público
En su sitio web, Enigma Public se autodenomina "la colección de datos públicos más amplia" disponible en la web. Los conjuntos de datos se dividen en cuatro categorías principales: FOIA, Esenciales, De interés periodístico y Bajo el radar. Algunos de los datos de este sitio incluyen los salarios de los empleados de la Casa Blanca y las Licencias Federales de Armas de Fuego Activas. Tras crear una cuenta gratuita, los usuarios pueden acceder a cualquiera de las categorías de datos disponibles.
125. yahoo
La mayoría de los usuarios de internet conocen el nombre Yahoo debido a que cuenta con plataformas como Yahoo! Noticias y Yahoo! Finanzas, entre sus numerosas propiedades en línea. Resulta de interés para investigadores y periodistas que Yahoo también alberga una gran cantidad de conjuntos de datos, incluyendo las Calificaciones de Canciones de Usuarios de Yahoo! Música con Metainformación de Artista, Álbum y Género (v. 1.0) y las Calificaciones de Usuarios de Yahoo! Películas e Información Descriptiva de Contenido (v. 1.0), entre otros. Los periodistas que buscan nuevas estadísticas encontrarán una fuente infalible.
126. 1000 genomas
1000 Genomas alberga un proyecto homónimo que se desarrolló entre 2008 y 2015. El objetivo del proyecto era encontrar todas las variaciones genéticas que pudieran presentarse en al menos el 1% de las poblaciones estudiadas. Además de las publicaciones derivadas de este proyecto, se generaron conjuntos de datos masivos que incluían bases de datos independientes de células variantes, archivos de secuencias sin procesar y disponibilidad de muestras. Estos datos se pueden consultar o descargar.
127. CBOE
CBOE es una bolsa de futuros que se centra principalmente en futuros de volatilidad. En particular, el sitio ofrece abundante material sobre los futuros que figuran en su Índice de Volatilidad, una marca registrada. El sitio alberga datos de mercado de todo tipo, incluyendo datos históricos, estadísticas diarias del mercado y precios de liquidación diarios de futuros VX. Para los periodistas que buscan datos de mercado de calidad, CBOE ofrece dicha información en un formato fácil de seguir y comprender.
128. Reserva Federal de San Luis
El Banco de la Reserva Federal de San Luis es uno de los centros financieros más importantes de su región, si no el más importante. En su sitio web, los investigadores pueden consultar documentos de trabajo, datos económicos, publicaciones y servicios de información directamente. En otras palabras, existe una amplia información sobre las políticas actuales y pasadas de la Reserva Federal de San Luis, así como sobre la capacidad de evaluar su eficacia. Para periodistas de negocios, finanzas y economía, este es un recurso informativo de primer nivel.
129. OANDA
OANDA es una popular plataforma de trading de acciones en línea, dedicada principalmente a la negociación de CFD y divisas. Además de las numerosas funciones añadidas para atraer a los operadores en línea, OANDA también alberga una gran cantidad de datos históricos sobre tasas e información sobre el conversor de divisas. Además de toda esta información, el sitio también ofrece información sobre estrategias de inversión, noticias y análisis de mercado. No se necesita una cuenta para acceder a la mayoría de estos datos.
130. abdominales
La Oficina Australiana de Estadística (ABS), al igual que su homóloga estadounidense, ofrece datos objetivos, información económica e investigaciones sobre una amplia gama de temas relevantes para el país. Directamente en el sitio web, los investigadores pueden consultar datos estadísticos sobre indicadores empresariales, salud, vivienda, finanzas, comercio internacional, salud mental, así como índices de precios e inflación. Los periodistas pueden realizar búsquedas para encontrar encuestas e información anteriores, que también pueden clasificarse por región.
Originalmente concebida y gestionada por la Autoridad del Gran Londres, la Base de Datos de Londres es un esfuerzo de Londres por hacer que los datos de la ciudad sean más accesibles al público. El objetivo final es facilitar el acceso a esta información a la gente, animándola a usarla gratuitamente como desee. En este sitio web, los usuarios pueden buscar datos por temas como Arte y Cultura, Delincuencia y Seguridad Comunitaria, Educación y Salud. Los periodistas interesados en este tipo de datos ahora pueden obtenerlos directamente del gobierno local.
132. Estadísticas de Nueva Zelanda
El gobierno de Nueva Zelanda alberga una gran cantidad de estadísticas y datos que los investigadores pueden analizar en este sitio. Esta información se puede filtrar mediante la barra de búsqueda superior, filtrando por ubicación y región, así como por tema. Algunos de los temas incluyen indicadores económicos, salud, ingresos y trabajo, sectores industriales, medio ambiente y negocios. Entre las fuentes de noticias adicionales y los comunicados que destacan diversos hallazgos y estadísticas, los periodistas descubrirán todo tipo de estadísticas específicas de Nueva Zelanda en este sitio.
133. Oficina de Meteorología del Gobierno de Australia
Administrado y operado en última instancia por el Gobierno de Australia, el sitio web de la Oficina Australiana de Meteorología ofrece información meteorológica de las distintas ciudades y regiones del país. Según el sitio, esta agencia se creó para ayudar a los australianos a afrontar el clima que les rodea mediante una combinación de advertencias y consejos. Aquí, los investigadores podrán encontrar pronósticos estacionales, reservas de agua, pronósticos de lluvia, variabilidad climática y pronósticos de caudales estacionales. En este sitio encontrará información precisa y fiable sobre el clima australiano.
134. GroupLens
Este sitio web es cortesía de GroupLens del Departamento de Ciencias de la Computación e Ingeniería de la Universidad de Minnesota. Ofrece publicaciones y conjuntos de datos para fines de investigación. Hay un total de aproximadamente seis conjuntos de datos. Entre los conjuntos mencionados, se encuentran algunos titulados Book-Crossing, MovieLens y HetRec 2011. En resumen, este es un recurso útil para periodistas que buscan comprender mejor cómo utilizar los datos proporcionados.
135. Nuggets de KD
KD Nuggets es un sitio web que se centra principalmente en brindar ciencia de datos, análisis de negocios, aprendizaje automático y minería de datos. Incluye una página con una lista completa de conjuntos de datos que se utilizan para explorar más a fondo la minería de datos y el big data, con enlaces a conjuntos de datos como Bioassay Data, Asset Marco, DataMarket, Casualty Workbench, Data Ferrett y Datamob. Este es un recurso fantástico para periodistas que prefieren tener toda la información en una sola página.
137. Microsoft
Cualquiera que haya usado una PC o una laptop probablemente haya oído hablar de Microsoft, al menos de pasada. Curiosamente, además de PC, laptops y software, Microsoft también alberga una gran cantidad de investigaciones y publicaciones. Esto incluye avances como su búsqueda por crear máquinas alfabetizadas, así como ciencia de datos basada en la nube. También hay información adicional sobre herramientas que Microsoft está desarrollando, como Visual Studio Code Tools, y los avances en IA que representan.
138. Minería de datos R
Tal como lo indica su nombre, R Datamining es un recurso sobre R y minería de datos. El sitio ofrece numerosos ejemplos y documentos que ofrecen una perspectiva detallada sobre la minería de datos y su uso con R. Además, incluye enlaces a cursos de formación, como el curso corto de la Universidad de Canberra. Esto incluye enlaces a conjuntos de datos y presentaciones gratuitos, así como conjuntos de datos que abarcan temas como datos de aviones, aerolíneas y rutas, así como enlaces a sitios web como GeoDa.
139. Investigación colaborativa en neurociencia computacional: intercambio de datos
Investigación Colaborativa en Neurociencia Computacional, también conocida como CRCN, cuenta con diversos conjuntos de datos accesibles a través de su sitio web. Estos conjuntos de datos están categorizados según las distintas partes del cerebro, como la corteza visual, el hipocampo, la corteza motora, el cerebro aviar, los movimientos oculares y la aplisia, por ejemplo. Estas carpetas también incluyen desafíos, herramientas, simulaciones y métodos. La posibilidad de compartir estos datos los convierte en un recurso aún mejor para la investigación.
140. Archivo del banco de datos de proteínas
Según su sitio web, el archivo del Banco de Datos de Proteínas ha sido un recurso de primer nivel sobre ácidos nucleicos, estructuras tridimensionales de proteínas y ensamblajes complejos desde 1971. Creado con la misión explícita de mantener esta información de dominio público, los investigadores pueden acceder aquí para consultar informes de validación y diccionarios de datos en línea. También hay estadísticas de crecimiento y uso de datos disponibles para su clasificación y análisis en línea, así como para su descarga. Lo mejor de todo es que el sitio añade constantemente nueva información.
141. El Proyecto PubChem
PubChem, como proyecto oficial, se diseñó para informar al público sobre las capacidades biológicas de las moléculas pequeñas. El sitio está vinculado a tres bases de datos: PubChem Compound, PubChem Substance y PubChem BioAssay. Además, permite buscar similitudes entre diferentes proteínas. Para los investigadores que desean llevar su análisis de datos al siguiente nivel, el sitio también ofrece programación y consejos gratuitos.
142. Coremine Medical
Coremine Medical es un recurso invaluable para quienes buscan información sobre biología, salud y medicina. Ahora que la capacidad de minería de textos biomédicos de PubGene ha alcanzado su formato actual, Coremine se convierte en una de las fuentes de información biomédica más flexibles del mercado. Este sitio mostrará vínculos entre conceptos e ideas en un formato visualmente atractivo y de fácil comprensión, que de otro modo podría pasar desapercibido. Es, sin duda, una de las fuentes de datos biomédicos más completas disponibles para periodistas.
143. Tu Tiempo
Tu Tiempo es una increíble fuente de datos meteorológicos y climáticos de todos los países del mundo. Con este recurso, es fácil encontrar promedios anuales, mensuales y diarios de prácticamente todas las ciudades y regiones del mundo. Además, los usuarios pueden buscar en la base de datos de más de 115 millones de registros con datos históricos accesibles para cualquier persona. Dependiendo de la región, es posible encontrar datos que se remontan hasta 1929.
144. Recursos de red complejos
Este sitio web proporciona acceso a gran parte de los datos utilizados inicialmente en sus experimentos informáticos. La lista completa de conjuntos de datos incluye gráficos de noticias, gráficos biológicos, gráficos de citas, gráficos de colaboración, gráficos de ingeniería y gráficos semánticos. La página también incluye enlaces a una lista de fuentes con abundante información, como el conjunto de datos que examinó aproximadamente 3 millones de patentes estadounidenses. La página también cuenta con una impresionante compilación de conjuntos de datos de redes complejas.
145. Scopus
Scopus es una herramienta que permite encontrar investigaciones y citas académicas de forma rápida y sencilla. El sitio ofrece una base de datos increíblemente extensa de investigaciones realizadas en todo el mundo en diversos campos, incluyendo sectores como la medicina, la tecnología, las ciencias sociales, las artes y las humanidades. Utilice Scopus para identificar fuentes académicas que podrían haber pasado desapercibidas. Al fin y al cabo, en muchos ámbitos, la calidad de una fuente académica puede ser casi tan importante como la información que proporciona.
146. Stanford
La reputación de Stanford como institución académica prestigiosa no surgió de la nada. Su excelencia se refleja en sus cursos de programación. El sitio también alberga diversos conjuntos de datos que incluyen información sobre redes sociales. Hay conjuntos de datos centrados en los círculos sociales de Facebook, las solicitudes de administrador de Wikipedia, los círculos sociales de Twitter y Google+. Las redes de comunicación y la Red de Productos de Amazon también cuentan con sus propios conjuntos de datos.
147. Universidad de Milán
El Departamento de Ciencias de la Información de la Universidad de Milán gestiona una página web conocida como el Laboratorio de Algoritmos Web. Este sitio alberga numerosos conjuntos de datos para explorar. Estos incluyen gráficos relacionados con redes sociales, gráficos de Facebook, capturas del proyecto DELIS y una breve lista de datos diversos. La información disponible aquí puede consultarse en línea y descargarse si se desea, lo que lo convierte en uno de los conjuntos de datos más accesibles de su tipo en la web.
148. Repositorio de datos de la red UCI
El Repositorio de Datos de Red de la UCI es un sitio web dedicado a abordar el estudio de redes desde un enfoque científico. En la página de recursos, los investigadores encontrarán enlaces a directorios de conjuntos de datos seleccionados por organizaciones y grupos de investigación, así como por particulares. También incluye una colección de conjuntos de datos que normalmente se utilizan para el análisis de redes sociales. Quienes investiguen los datos se alegrarán de saber que estos conjuntos también están disponibles para su descarga.
149. CAIDA
CAIDA, o el Centro para el Análisis Aplicado de Datos de Internet, recopila una amplia gama de datos de diversas ubicaciones, a menudo con la ayuda de diversas organizaciones e individuos. Este sitio alberga conjuntos de datos como Relaciones de Sistemas Operativos (AS), Ataques DDoS, Telescopio y otros relacionados, entre otros. Las categorías incluyen tráfico, topología, seguridad, resumen de gusanos y estadísticas de resumen de tráfico. Los conjuntos de datos pueden requerir acceso mediante solicitud, pero muchos, si no la mayoría, son públicos.
150. Cangrejo de río
Crawdad, o el Recurso Comunitario para el Archivo de Datos Inalámbricos en Dartmouth, es único por su enfoque en proporcionar datos inalámbricos a investigadores y otras personas interesadas en el tema. El sitio ofrece diversas herramientas, así como acceso a numerosos conjuntos de datos. Entre los conjuntos mencionados se encuentran aquellos relacionados con el uso educativo, la caracterización de errores de bit, el diagnóstico de redes, la conectividad oportunista, la computación con reconocimiento de ubicación y muchos más. Los investigadores apreciarán este recurso cuanto más se adentren en él.
151. Administración de Información Energética de EE. UU
La Administración de Información Energética de EE. UU., conocida como la EIA, se dedica a proporcionar al público datos anuales sobre las empresas de servicios públicos de electricidad. Esta información abarca, entre otras opciones, las reservas de combustibles fósiles, el consumo de combustible, información mensual y anual sobre la generación de electricidad y datos ambientales. Los datos están disponibles para su análisis desde 2001 hasta 2017. Solo hay que acceder al sitio web y descargar la información.
152. Datos oceanográficos británicos
Financiado por el Consejo Nacional de Investigación Ambiental, British Oceanographic Data es una de las fuentes de datos marinos más accesibles en internet. Cuenta con una extensa base de datos que abarca corrientes, perfiles CTD, datos internacionales del nivel del mar, corrientes e incluso datos históricos de registradores de presión de fondo. Además, la Biblioteca de Datos Publicados ofrece acceso adicional al catálogo y ofrece conjuntos de datos. Esta es, posiblemente, una de las fuentes de información marina más completas disponibles en línea.
153. Factual
Factual proporciona datos de ubicación para publicidad y para su uso en plataformas móviles. De especial interés para los investigadores son las herramientas para desarrolladores, que incluyen el SDK Engine Mobile y las aplicaciones profesionales y de investigación completas del Gráfico de Observación, así como la Pila de Validación Local. Con un nombre web que enfatiza la pasión de la empresa por recopilar datos de todo el mundo y encontrar nuevas formas de contextualizarlos, Factual tiene un claro compromiso con los datos y con la búsqueda de nuevas y originales oportunidades para su uso.
154. Áreas administrativas globales
Áreas Administrativas Globales es una geodatabase que muestra la ubicación de las distintas áreas administrativas del mundo. Los datos recopilados de este tipo de base de datos se utilizan habitualmente en sistemas de información geográfica. Estos incluyen países y se dividen en provincias, condados y departamentos, entre otros. La buena noticia para los periodistas es que todos estos datos están disponibles de forma gratuita y también pueden utilizarse para fines académicos y generales no comerciales.
155. Nombres geográficos
Geonames es un sitio que alberga una base de datos geográfica con millones de entradas, características únicas y nombres alternativos. Ofrece opciones de exportación y acceso a través de diversos servicios web; esta base de datos procesa aproximadamente 150 millones de solicitudes diarias. Gracias a sus funciones wiki, los usuarios pueden realizar ajustes y cambios en las entradas con relativa facilidad. Este recurso es excelente, ya solo por su capacidad de alojamiento multilingüe.
156. Datos naturales de la Tierra
Natural Earth Data es un conjunto de datos cartográficos de dominio público, repleto de información diseñada para su uso en software cartográfico para la creación de mapas de vanguardia. El diseño visual del producto final es limpio y bien organizado, y los datos se pueden utilizar de inmediato. Este conjunto de datos incluye datos de inteligencia y diversos temas de datos vectoriales culturales, ráster y físicos. Creado originalmente pensando en las necesidades y preferencias de los cartógrafos, este conjunto de datos es útil para cualquier persona interesada en la geografía.
157. Mapa de Openstreet
Openstreet Map es más una colaboración entre usuarios que un sitio web, ofreciendo servicios de mapas a aplicaciones, sitios web y diversos dispositivos. Este sitio recopila nuevos datos cuando los usuarios introducen información sobre puntos de referencia menos conocidos, como estaciones de tren, carreteras y senderos. El conjunto de datos completo está disponible gratuitamente en el sitio y se puede descargar total o parcialmente. Quienes opten por una descarga parcial, también pueden descargar los datos por región.
158. Ciudad de Chicago
La ciudad de Chicago es la cuna de los Bulls de Michael Jordan, campeones del mundo, y de su singular estilo de pizza. Además, cuenta con un completo portal de datos propio. Las categorías de conjuntos de datos abarcan diversos temas, como Administración y Finanzas, Ética, Salud y Servicios Humanos, Parques y Recreación, Seguridad Pública y Preservación Histórica. En resumen, el portal de datos de la ciudad de Chicago alberga prácticamente cualquier información de interés para investigadores, legisladores y periodistas locales.
159. CKAN
CKAN es, en esencia, el sitio web del proyecto de datos abiertos de la ciudad de Glasgow. Este sitio contiene conjuntos de datos sobre diversos temas útiles para emprendedores, legisladores, investigadores académicos y desarrolladores de aplicaciones. De los 360 conjuntos de datos alojados, algunos están relacionados con la gobernanza urbana, como el conjunto de datos de viviendas por tenencia, mientras que otros, como el conjunto de datos de ciclismo, son de especial interés para los residentes locales. Aquí encontrará todo tipo de información para periodistas que cubren temas más locales.
160. Gobierno de la India
El Gobierno de la India cuenta con un sitio web que abarca recursos de análisis y datos en su versión del Proyecto de Datos Abiertos. Actualmente, cuenta con aproximadamente 137.940 recursos que han recibido millones de visitas. La gran mayoría de estos archivos también están disponibles para su descarga. Ya sea que busque cifras sobre el presupuesto gubernamental o conjuntos de datos sobre salud y bienestar familiar, es probable que este sitio le ofrezca recursos.
161. Estadísticas SA
Este sitio contiene estadísticas, publicaciones y datos actualizados recopilados por el gobierno sudafricano. Aquí, los investigadores encontrarán información sobre diversos temas, desde encuestas de alimentos y bebidas hasta indicadores económicos, estadísticas de empleo, cifras de población e importantes estadísticas de salud. Es posible buscar las cifras por ciudad, tema e indicador, según las necesidades. Este sitio alberga mucha información sobre el censo, además de publicar publicaciones estadísticas, cuestionarios, códigos y clasificaciones, y políticas de precios.
162. Desarrollo de políticas e investigación
Este sitio se publica bajo el patrocinio de la Oficina de Desarrollo de Políticas e Investigación del Departamento de Vivienda y Desarrollo de los Estados Unidos. Publica una gran cantidad de estudios de caso, publicaciones semestrales y publicaciones periódicas cada año. También ofrece una gran cantidad de conjuntos de datos de interés para periodistas, como alquileres de mercado justo, límites de ingresos y factores de inflación para la financiación de la renovación, entre otros.
163. Datos vitales de salud de Net
En Vital Net Health Data, los investigadores encontrarán una gran cantidad de grandes conjuntos de datos relacionados con la salud. Este sitio no alberga todos estos conjuntos, sino que ofrece enlaces a conjuntos que las personas pueden visitar y consultar. Esta lista seleccionada incluye enlaces a recursos como CDC Wonder, Eurocat, Health Data All Star y también al trabajo de organizaciones benéficas como la Asociación Norteamericana de Registros Centrales de Cáncer. Sin duda, este es uno de los recursos de conjuntos de datos de salud más completos que existen.
164. Puente analítico
Analytic Bridge es un recurso dedicado a la inteligencia empresarial. Aquí, los investigadores encontrarán debates sobre aprendizaje automático e IA, enlaces a seminarios web y conferencias, e incluso una sección de búsqueda de empleo. El sitio también alberga Data Science Central, la sección dedicada al big data. Gracias a su comunidad activa y comprometida, y a su compromiso con la difusión de noticias e información, los periodistas interesados en las implicaciones de los datos para las empresas pueden beneficiarse enormemente de esta plataforma.
165. Archivo.org
Conocido principalmente por sus esfuerzos por convertirse en una biblioteca pública en línea, archive.org alberga numerosas obras publicadas, así como una importante colección de datos. El sitio presume de los resultados del Censo de Internet de 2012, así como de archivos del Mercado de la Red Oscura de 2011 a 2015, e incluso un conjunto de datos de comentarios públicos de Reddit. Incluye volcados de datos de Music Brainz y un conjunto de datos con imágenes de portadas de audio. Entre sus publicaciones y datos, archive.org ofrece abundante material para que los periodistas lo revisen.
166. Torrentes académicos
Este sitio web se presenta como un sistema diseñado para facilitar el intercambio y la descarga de grandes conjuntos de datos. Al utilizar la tecnología torrent para simplificar la distribución de datos, Academic Torrents se enorgullece de permitir a los investigadores descargar todo lo que necesitan rápidamente. El sitio también alberga artículos, cursos y colecciones para su consulta. Una búsqueda rápida entre los recursos disponibles revelará que hay una gran cantidad de conjuntos de datos y colecciones disponibles para descargar.
167. Dataverse
La mejor manera de abordar Dataverse es pensar en él como una biblioteca. Aquí, los investigadores pueden buscar, descubrir y citar datos fácilmente, a la vez que utilizan este sitio como repositorio para su propia información. La temática abarca campos como las ciencias sociales, las ciencias agrícolas, la medicina, la salud y las ciencias de la vida, así como las ciencias de la tierra y ambientales. Entre las grandes empresas que publican en este sitio se incluyen Gallup y la División de Geografía de la Oficina del Censo del Departamento de Comercio de EE. UU.
168. DATOS DE LA UC
UC Data, que opera en conjunto con el Laboratorio de Datos de Ciencias Sociales de UC Berkeley, es el archivo más grande y reconocido de la universidad. Este sitio ofrece información en las áreas de estadística y datos de ciencias sociales. En él, los investigadores pueden acceder a los artículos, informes y documentos de trabajo elaborados por los investigadores de UC Data. Los datos sin procesar abarcan numerosas áreas de investigación, como la atención médica, el bienestar y la seguridad social, la demografía, el voto y las tecnologías de la información, entre otros temas.
169. Campamento de bromas
Joe Kamp ofrece una guía completa para encontrar datos y API de fútbol americano para su análisis. Si los investigadores siguen los enlaces de la página, encontrarán datos de código abierto disponibles a través de GitHub, así como acceso a API gratuitas y comerciales para facilitar su acceso. Dado que los datos y el código están disponibles en un sitio reconocido como GitHub, acceder a este tipo de datos nunca ha sido tan fácil.
170. Sean Lahman
Sean Laham no es un nombre que se escuche a diario, pero su sitio web alberga una de las estadísticas de bateo y pitcheo más completas y detalladas de internet. Con cifras que abarcan el período de 1871 a 2016, los datos se remontan literalmente a siglos atrás. Los datos son de libre acceso y uso bajo la licencia Creative Commons Share Alike 3.0 y se pueden descargar directamente en SQL y Microsoft Access, entre otros. Las estadísticas también se pueden descargar a través de GitHub.
171. Hoja retro
Retro Sheet es una de las fuentes más completas de estadísticas y datos de béisbol en internet. El sitio incluye detalles como las listas anuales y la identificación de árbitros, jugadores y entrenadores. Durante los años en que fue relevante, los datos del Juego de las Estrellas se incluyeron en los archivos de eventos, junto con un conjunto de archivos de eventos para la postemporada y un pequeño archivo de discrepancias. Retro Sheet incluso incluye la identificación de los estadios de béisbol para cada temporada. ¡Qué exhaustivo!
172. Desafío de datos de Hubway
Para quienes no estén familiarizados con el programa, Hubway es el nombre del sistema de bicicletas compartidas con sede en el área metropolitana de Boston. Si bien el sistema no registraba ni publicaba información de identificación, Hubway contiene la información básica de todos los viajes realizados entre julio de 2011 y septiembre de 2012. Esto incluye detalles como el inicio y el fin del viaje, así como la estación de recogida, por nombrar solo algunas categorías.
173. Vuelos abiertos
Open Flights es una base de datos con información sobre más de 10.000 terminales de ferry, aeropuertos y estaciones de tren de todo el mundo. Los investigadores pueden encontrar la versión .csv compatible con Excel a través de GitHub y también pueden descargar los datos directamente en el sitio web. Usando el mapa de la página principal, es posible ver qué lugares específicos están en la lista e incluso el sitio ofrece información de rutas. Se puede contactar a los propietarios del sitio para obtener información aún más actualizada.
174. MLVIS
MLVIS es un repositorio de datos que combina el análisis visual con la minería de datos en tiempo real. Esto permite una comprensión más intuitiva de los datos, incluso al trabajar con grandes conjuntos de datos. Entre las numerosas funciones y opciones disponibles en este sitio se incluyen datos de referencia y aprendizaje automático de datos no relacionales, junto con diferentes tipos de datos, como atribuidos y heterogéneos. Para mayor comodidad de los usuarios, esta información también se puede descargar en un único formato coherente.
175. Inicio de los datos abiertos
Open Data Inception es un sitio que ofrece enlaces a más de 2600 portales de datos. Mediante la barra de búsqueda superior, los investigadores pueden buscar portales y conjuntos de datos por categoría y tema. Además, también pueden usar el sitio para encontrar la versión más actualizada del conjunto de datos buscado. Aproveche la posibilidad de ver los portales de datos en formato de lista o en formato visual interactivo y comience a encontrar los datos necesarios.
176. OpenDataSoft
OpenDataSoft, disponible en francés, inglés y alemán, es una fuente que ofrece acceso a 480 millones de registros, 4 millones de celdas API y 9284 conjuntos de datos. Mediante la barra de búsqueda en el centro de la página principal, los investigadores pueden introducir una palabra clave o categoría y encontrar el conjunto de datos más adecuado. Para los periodistas, esta es una forma más rápida de encontrar los conjuntos de datos más relevantes necesarios para completar la investigación en cuestión. Visite el sitio para obtener más información.
177. Maestro de la nación
NationMaster es una fuente de datos completamente compilados de más de 300 países, organizados en más de 5000 categorías. Los datos abarcan cifras como el porcentaje de muertes registradas, estadísticas de la Segunda Guerra Mundial e incluso información sobre guerras y pruebas nucleares. Los investigadores también encontrarán tablas, gráficos y diagramas circulares que permiten una mejor visualización de los datos. En resumen, abarcan tantos temas que siempre hay algo nuevo que descubrir en los datos.
178. Seguidor
Twitter ha sido durante mucho tiempo una red social popular para acceder a noticias de última hora y encontrar historias en tendencia. Followerwonk permite a los usuarios llevar su uso de Twitter al siguiente nivel. Esto incluye encontrar usuarios de Twitter con los que conectar, analizar a sus seguidores actuales y planificar su actividad para obtener los mejores resultados. Actualmente, muchos reporteros y periodistas utilizan Twitter para establecer contactos y difundir sus historias. Followerwonk facilita la productividad de los usuarios de Twitter.
179. Infochimps
Infochimps es un sitio que ofrece servicios en la nube que pueden reducirse para aprovechar al máximo el big data. Resulta útil para implementar e integrar tecnología y aplicaciones de big data. Cuando los investigadores buscan entre grandes cantidades de datos o evalúan tendencias en big data, este es un recurso invaluable. También hay numerosos libros blancos y casos disponibles para que los investigadores los consulten en el sitio.
180. Estadísticas archivadas del gobierno nacional
Fundado en 2006, Archive-It es un servicio proporcionado por Internet Archive. Este servicio ayuda a organizaciones y empresas a crear colecciones digitales y, como resultado, ha tenido la oportunidad de colaborar con organizaciones sin fines de lucro, universidades y gobiernos. Los investigadores pueden consultar algunos de los diferentes archivos del sitio, como los sitios web de la campaña electoral de candidatos al Congreso de 2014, los Archivos del Estado de Alabama y el Archivo Web PLN de Información del Gobierno Canadiense. Este sitio es un tesoro de información para periodistas emprendedores.
Civic Commons cuenta con una página que enumera las diversas iniciativas gubernamentales de datos abiertos. Esta lista de recursos, con función de búsqueda, está organizada por país, ciudad y región, e incluso menciona los recursos que ofrecen las organizaciones intergubernamentales. Para los periodistas, este sitio representa una forma más rápida de averiguar qué gobiernos participan en el Proyecto de Datos Abiertos. También ofrece acceso a datos locales que no necesariamente aparecerían en una simple búsqueda en Google.
182. Gobiernos mundiales guardianes
The Guardian es un nombre reconocido en el mundo del periodismo por su reputación de publicar noticias de última hora. Lo que menos se sabe es que el sitio web cuenta con una sección que ofrece datos sobre gobiernos de todo el mundo. Incluye artículos sobre el impacto de las cifras de personas sin hogar, debates sobre ciberseguridad e incluso un análisis profundo sobre el papel de los datos y las estadísticas en el clima político y social actual. La sección "Gobierno Mundial" de The Guardian es capaz de impulsar el debate y encontrar perspectivas para las historias.
183. Datos abiertos del gobierno (Hub)
Este sitio pertenece a un grupo de la Open Knowledge Foundation cuyo objetivo es fomentar y apoyar el desarrollo continuo de datos gubernamentales abiertos. Aquí, los usuarios encontrarán enlaces a una de las listas más completas de catálogos de datos abiertos disponibles. Entre los objetivos adicionales mencionados en el sitio, el grupo también busca encontrar información sobre políticas, mejores prácticas y directrices. Proporciona a los periodistas un amplio acceso a más y mejor información.
184. Gobierno Abierto – Francia
Este sitio web es el hogar en línea del proyecto de datos abiertos del Gobierno de Francia. Es posible analizar los datos buscando en categorías como empleo, agricultura, educación, viajes y turismo. Estos datos permiten comprender mejor su contenido, a la vez que permiten realizar comparaciones basadas en la información histórica. En resumen, los periodistas tienen motivos de sobra para estar entusiasmados con el análisis de estos datos.
185. Universidad de Notre Dame
Este sitio almacena los datos de investigación disponibles a través del uso de SourceForge.net por parte de la Universidad de Notre Dame. Los datos se ofrecen mediante bases de datos relacionales. Los volcados de datos mensuales también permiten comprender mejor el software de código abierto y sus aplicaciones. Para acceder a esta información, las solicitudes deben realizarse por escrito por correo electrónico. Sin embargo, la cuestión es que solo los investigadores académicos pueden acceder a los datos.
186. Informes de ovnis
El Centro Nacional de Denuncias de OVNIS cuenta con una base de datos en línea que detalla las experiencias de personas con objetos voladores no identificados. Los investigadores pueden optimizar su búsqueda en la base de datos utilizando cualquiera de las cuatro categorías: fecha, forma del OVNI, fecha de publicación e incluso estado. Los OVNIS son únicos porque siempre cautivan la imaginación del público. Si ha habido algún encuentro reciente del tercer tipo en la zona, este es el lugar ideal para enterarse de lo que la gente ha estado diciendo.
187. WikiLeaks
WikiLeaks, conocido e infame en los medios debido a las controversias y a lo que las filtraciones han revelado sobre el funcionamiento interno del gobierno y otras figuras famosas y poderosas de la sociedad, tiene una reputación que lo precede. Aunque las filtraciones de datos rara vez se publican discretamente, nadie cuestiona jamás la veracidad de la información. Para los periodistas que buscan historias que despierten interés al instante, WikiLeaks es una fuente fiable. Como mínimo, será una lectura interesante.
188. El Washington Post
El periódico ya es conocido como una excelente fuente de noticias de última hora y artículos de opinión, pero pocos saben que el Washington Post ofrece acceso a los datos sin procesar que suelen mencionarse en sus artículos. En la página de datos, los investigadores pueden encontrar información en categorías como educación, censo, salud y seguridad, transporte y desarrollo, bases de datos históricas de la Copa Mundial e incluso cifras relacionadas con el gobierno y la política. En resumen, tener acceso a estas cifras ayuda a las personas a comprender mejor los temas de actualidad.
189. Datos climáticos
Datos Climáticos es un conjunto de datos que proporciona información completa sobre la temperatura global. En el formato actual, los usuarios pueden ver toda la información climática importante a través de las cuadrículas, además de ver los promedios. Quienes buscan datos complementarios pueden acceder a la misma información para la tierra y el océano. Esta información se puede descargar, pero para mayor comodidad, también se puede consultar directamente en el sitio web.
190. Estructura de la proteína
Protein Structure es una fuente que busca examinar cómo las redes informáticas pueden utilizarse en conjunción con la biología. La página alberga un repositorio con datos accesibles mediante los enlaces proporcionados. De especial interés para los miembros de la comunidad investigadora es la manera en que el sitio incorpora diversas ideas, como el análisis de modelos y la biología ejecutable, para lograr este objetivo. Para los periodistas, este sitio es una visita obligada para observar el progreso y examinar los datos.
191. Analice datos de encuestas de forma gratuita
Con la ayuda de este sitio, los usuarios pueden tomar un curso de análisis de datos de encuestas sin tener que pagar por el privilegio. "Analice Datos de Encuestas Gratis", con su detallado índice, incluye secciones con títulos como "Mapas y el Arte de la Encuesta: Mantenimiento Ponderado", "Equilibrio entre la Confidencialidad del Encuestado y la Precisión en la Estimación de la Varianza", "Modelos de Ecuaciones Estructurales (SEM)" y "Datos de Encuestas Complejos". El sitio ofrece un excelente repaso para quienes prevén manejar más datos estadísticos en el futuro.
192. Universidad de California en Los Ángeles (UCLA)
En el sitio wiki de la UCLA, los investigadores encontrarán diversos conjuntos de datos disponibles para fines demostrativos. Hay una gran cantidad de datos simulados y observados para elegir. Estos recursos permiten descubrir datos climáticos, demográficos, biomédicos, de neuroimagen, del censo de EE. UU., electorales y económicos, entre muchas otras categorías. En definitiva, estos conjuntos de datos son un recurso del que muchas personas pueden beneficiarse.
En su sitio web, la Universidad de Toronto ofrece a los investigadores acceso a los denominados Conjuntos de Datos Delve. Estas colecciones de datos formaban parte de un producto más amplio diseñado para comparar los métodos de aprendizaje. En definitiva, esta información sirve para el desarrollo y la evaluación de los diferentes enfoques de aprendizaje. En resumen, se trata de una fuente sólida para los investigadores que desean comprender mejor cómo analizar y gestionar conjuntos de datos.
194. Servicio de Conservación de Recursos Naturales
El Servicio de Conservación de Recursos Naturales cuenta con un sitio web dedicado a promover la conservación y ofrece información sobre los diferentes musgos, antocerontes, plantas vasculares, líquenes y hepáticas presentes en Estados Unidos. Este sitio alberga una base de datos completa de plantas e imágenes que se pueden encontrar en el sitio, además de abundante información. Los investigadores pueden descargar la base de datos y encontrar abundante información sobre temas como cultivos alternativos. En resumen, este sitio web tiene todo lo que se necesita saber sobre plantas.
195. Servicio de Investigación Agrícola
Como se desprende del nombre de la agencia, este servicio gestiona las necesidades de investigación del Departamento de Agricultura de Estados Unidos. Cuando se descubre un problema agrícola, es muy probable que este sea el sector del gobierno que haya contribuido a encontrar una solución. El sitio alberga diversos conjuntos de datos a los que se puede acceder y descargar directamente. Los periodistas también pueden usar este sitio para encontrar las últimas noticias sobre los problemas que afectan a la agricultura.
196. Biblioteca de imágenes de células
Este sitio ofrece una biblioteca pública con recursos, información y acceso a imágenes y animaciones que representan células y procesos celulares. La célula está diseñada con el doble propósito de investigación y educación en mente; la información aquí presentada es casi siempre relevante en debates sobre salud pública y enfermedades. Los materiales provienen de una combinación de fuentes, incluyendo publicaciones históricas y modernas. Para una explicación completa que simplifique procesos biológicos complejos, los periodistas no se equivocarán con la Biblioteca de Imágenes Celulares.
197. Genómica completa
Este es el sitio web de una empresa que se considera una empresa consolidada en el sector biotecnológico en el área de la secuenciación del genoma humano. Curiosamente, Complete Genomics ha puesto a disposición del público varias de sus secuencias completas del genoma. En definitiva, esto ofrece información muy útil sobre el ADN y el genoma humano secuenciado. La única condición para este material es que los investigadores que utilicen esta información se aseguren de proporcionar a Complete Genomics las referencias adecuadas.
198. Expreso de matriz
Array Express es un repositorio que almacena información de los resultados de experimentos genómicos que requirieron una gran cantidad de secuenciación o procesamiento. En este sitio, los usuarios encontrarán los resultados de más de 70.000 experimentos, junto con más de 2 millones de ensayos, en múltiples terabytes de almacenamiento de datos. Mejor aún, esta información se puede reutilizar gratuitamente con fines de investigación. Es un excelente recurso para obtener la información más reciente sobre genómica y los avances en este campo.
199. Codificar
La Enciclopedia de Elementos del ADN, o Consorcio ENCODE, es el resultado de la colaboración entre grupos de investigación de todo el mundo. El objetivo final es compilar una lista de todas las partes funcionales del genoma, que incluye un análisis detallado de los niveles de ARN, las proteínas, los elementos que regulan las células y la actividad de los genes. Ofrece datos que permiten realizar búsquedas, así como una enciclopedia que ofrece más información.
200. Genomas en conjunto
Ensemble Genomes es un sitio web fundado en el año 2000 que se dedica a los genomas de vertebrados. Con el paso de los años, este recurso ha añadido información complementaria sobre metazoos invertebrados, plantas, bacterias y hongos. Se puede acceder a los datos sobre todos estos temas haciendo clic en los enlaces disponibles en el sitio. Este sitio ofrece tutoriales, conjuntos de datos sobre todos los temas tratados y una colección de documentos para explorar. Todos estos factores hacen de Ensemble Genomes una fantástica fuente de datos para periodistas.
201. Consorcio de Ontología Genética
Gene Ontology es un sitio web cuyo propósito es representar la comprensión actual del funcionamiento informático de los genes. Ofrece numerosas publicaciones, así como documentación adicional. Las anotaciones se alojan directamente en el sitio. La buena noticia para los investigadores que desean analizar con más detalle las cifras y los datos brutos es que hay archivos disponibles para descargar directamente desde el sitio web.
202. Biblioteca de firmas celulares integradas basadas en redes
El Centro LINCS de la Facultad de Medicina de Harvard existe para ayudar a la comunidad investigadora y al público en general a comprender mejor cómo reaccionan las células humanas al ser alteradas por fármacos. Mediante la base de datos LINCS de la Facultad de Medicina de Harvard y el explorador de proyectos, los investigadores pueden encontrar publicaciones y resúmenes de proyectos, así como recursos generales. Los periodistas también pueden usar este sitio para mantenerse al día con las últimas noticias e información derivadas de esta investigación.
203. Proyecto de Diversidad del Genoma Humano
El Proyecto de Diversidad del Genoma Humano ha avanzado considerablemente gracias a los esfuerzos del Centro del Genoma Humano de Stanford. El sitio web contiene miles de muestras y marcadores. Resulta que estos se pueden descargar, observar y analizar exhaustivamente simplemente siguiendo los enlaces proporcionados en la página. Este es un excelente recurso para periodistas que desean comprender la información que proviene de la comunidad científica.
204. Visor de datos JCB
JCB DataViewer permite a quienes estén interesados en la publicación de la Revista de Biología Celular ver los datos de imágenes asociados a los artículos publicados. El sitio cuenta con una galería completa que permite explorar los materiales. Además, los visitantes pueden realizar análisis más profundos de los datos mientras exploran el sitio. En resumen, este sitio es perfecto para comprender las referencias y figuras presentes en los artículos de la revista.
205. Portal de datos de Genomic Data Commons
El Portal de Datos del GDC es una plataforma diseñada para ayudar a investigadores y profesionales de la bioinformación a realizar investigaciones sobre el cáncer de forma más eficiente. Cuenta con un archivo, una API, documentos disponibles para su consulta, etc. Acceder a este sitio permite acceder a la misma información que utilizan los investigadores del cáncer para realizar sus propias investigaciones. Aquí, los periodistas podrán encontrar todos los datos que buscan y mucho más.
206. Opensp
Opensp es un proyecto comunitario diseñado para compartir genotipos. Las personas que se han tipificado con FamilyTreeDNA, 23andMe o deCODEme pueden subir esa información al sitio. El objetivo de esta solicitud es que el sitio se centre en determinar si se pueden encontrar conexiones entre genotipos y SNP, o polimorfismos de un solo nucleótido. Lo que resulta especialmente interesante para los periodistas es que hay datos disponibles para que la gente los descargue y disfrute consultándolos.
207. Guía de ruta
Pathguide es un sitio web dedicado a proporcionar información sobre las vías metabólicas y de señalización, así como sobre las interacciones entre proteínas a nivel molecular. Esta página contiene una lista de aproximadamente 697 recursos relacionados con el tema principal. Las bases de datos enlazadas en este sitio son generalmente de acceso gratuito. La mayoría de las referencias proporcionadas en esta lista de recursos se centran principalmente en la interacción proteína-proteína. Este sitio es un recurso invaluable para los entusiastas de la biología.
208. PBB del RCSB
Este sitio web se dedica a informar a académicos y al público en general sobre todo lo relacionado con los ácidos nucleicos y las proteínas. El Banco de Datos de Proteínas del RCSB ofrece acceso a diversas herramientas diseñadas para facilitar la comprensión de este aspecto de la biología, incluyendo herramientas de visualización, visualización de estructuras en 3D y un archivo con capacidad de búsqueda completa que permite clasificar por categoría de organismo. Además, este sitio ofrece noticias actualizadas sobre los últimos avances en este campo.
209. Consorcio de Genómica Psiquiátrica
El Consorcio de Genómica Psiquiátrica es el resultado de la colaboración entre investigadores y científicos de todo el mundo que investigan el componente genético de los trastornos psiquiátricos. Este proyecto dio lugar a 17 artículos principales y 31 artículos de desarrollo adicionales que ofrecen análisis y métodos secundarios, con un único artículo clave resultante. El Consorcio ofrece herramientas, descargas y acceso a los hallazgos a través del portal de acceso a datos, previa solicitud.
210. Química pública
PubChem es un nombre respetado en el campo de la investigación médica y biológica desde hace mucho tiempo. Al ofrecer la posibilidad de buscar estructuras, así como en las bases de datos de compuestos, bioensayos y sustancias, los investigadores no se equivocan con este sitio. Además, cada una de estas bases de datos contiene millones de entradas. Esta información se puede consultar mediante herramientas como las de conformadores 3D y bioensayos. Los datos también están disponibles para descargar.
211. CÓSMICO
Como su nombre indica, el Catálogo de Mutaciones Somáticas en Cáncer, o COSMIC, se dedica a registrar y explorar los efectos de las mutaciones somáticas en el cáncer. El sitio permite realizar búsquedas en COSMIC, categorizadas por tipo de cáncer, gen y mutación. COSMIC incluye herramientas como el explorador de genoma y el explorador de cáncer. Además, también se pueden descargar datos sobre curación genética, resistencia a fármacos, análisis genómicos, firmas mutacionales y curación de fusiones genéticas.
212. Genómica de la sensibilidad a los fármacos en el cáncer
La Genómica de la Sensibilidad a los Medicamentos en el Cáncer se dedica a encontrar biomarcadores que ayuden a los médicos a identificar el tipo de medicamento contra el cáncer al que los pacientes tienen mayor probabilidad de responder. Los periodistas pueden usar las pestañas de noticias para mantenerse al día sobre nuevos datos o cambios en el sitio. Además, también hay una recopilación de datos sobre líneas celulares, una base de datos que describe las características del cáncer e incluso una lista de compuestos disponibles para su consulta en el sitio.
213. Instituto Stowers de Investigación Médica
El sitio web del Instituto Stowers de Investigación Médica ofrece a los investigadores del público acceso gratuito a los datos que sus científicos, investigadores y genómicos han utilizado en sus publicaciones. Para el público en general, el instituto se esfuerza en señalar que el Repositorio de Datos Originales de Stowers suele ser de libre acceso. Sin embargo, es posible que algunos de los archivos más grandes de la base de datos no sean accesibles directamente a través de internet y requieran trámites adicionales.
214. Base de datos SSBD
La base de datos de la Ciencia de Sistemas de la Dinámica Biológica, comúnmente conocida como base de datos SSBD, ofrece un conjunto de herramientas y recursos para examinar imágenes microscópicas y evaluar datos biológicos cuantitativos. Las imágenes de este sitio provienen de diversas fuentes e incluyen objetos como células, moléculas individuales y núcleos de expresión génica. Dado que los datos de este sitio se obtienen mediante simulación computacional y experimentos, los periodistas pueden estar seguros de que la información se actualiza y perfecciona constantemente.
215. Compartiendo genomas personales
El Proyecto Genoma Personal es un sitio web centrado en la creación de datos de salud, genoma y rasgos, abiertos y disponibles para el público. Continuando el proyecto con la ayuda de personas voluntarias que han hecho pública su información genómica, este sitio ofrece gratuitamente los datos obtenidos. Más allá de la ciencia, este proyecto ofrece a los periodistas una perspectiva interesante sobre los efectos de crear un registro público de información genómica personal.
216. Navegador de genoma de la UCSC
El Navegador Genómico de USCS permite visualizar conjuntos genómicos. Además de la visualización en línea, el sitio también ofrece enlaces para descargar las secuencias y anotaciones de dichos conjuntos. Estos enlaces se dividen en las categorías de humano, mamíferos, otros vertebrados, deuteróstomos, insectos, nematodos, otros genomas y otras descargas. Las herramientas y directorios de este sitio también son gratuitos para uso personal y no comercial. Los periodistas pueden beneficiarse de la exhaustividad y accesibilidad de esta información.
217. UniProt
El Recurso Universal de Proteínas, conocido como UniProt, es el lugar ideal para obtener información sobre secuenciación y anotación de proteínas. A partir de la información proporcionada por tres bases de datos: los Clústeres de Referencia de UniProt, la Base de Conocimiento de UniProt y el Archivo de UniProt, este sitio ofrece búsquedas de péptidos y clústeres, entre otras funciones. Los periodistas pueden usar este sitio para verificar, descubrir y aprender más sobre nuevos descubrimientos en el área de secuenciación y anotación de proteínas.
218. Datos del índice climático de los actuarios
El Índice Climático de Actuarios, también conocido como ACI, proporciona al público en general y a los responsables de la toma de decisiones información sobre las tendencias climáticas y el efecto del cambio climático en Canadá y Estados Unidos. Los investigadores pueden examinar la información proporcionada por esta herramienta educativa para detectar y descubrir cambios significativos en el mar y el clima. Es posible refinar la búsqueda por regiones y componentes. Este sitio cuenta con décadas de datos y actualiza su información trimestralmente.
219. Centro Meteorológico de Aviación
El Centro Meteorológico de Aviación proporciona información meteorológica precisa, oportuna y actualizada, en la que el sistema aeroespacial puede confiar. En este sitio, los usuarios pueden consultar diversos gráficos, pronósticos y observaciones meteorológicas, presentados de forma accesible para los aviadores. Es posible visualizar la información proporcionada por las fuentes de datos del sitio en tiempo real mediante salidas en formato .csv o XML. Los investigadores pueden manipular y observar las cifras brutas con mayor detalle mediante esta opción de descarga.
220. Unidad de Investigación Climática
El sitio web de la Unidad de Investigación Climática existe con el propósito expreso de investigar los efectos del cambio climático en el pasado, estudiar sus causas y encontrar soluciones a los problemas del cambio climático en el presente. Aquí, se pueden consultar los resultados de la investigación, obtener una visión general del tema a través de las hojas informativas, consultar publicaciones e incluso acceder a los datos brutos. Los periodistas que buscan conjuntos de datos meteorológicos brutos tienen suerte con este recurso.
221. Evaluación y conjunto de datos sobre el clima europeo
En el sitio web de la Evaluación y Conjunto de Datos del Clima Europeo, el público puede encontrar información sobre cambios extremos en el clima o la meteorología. Los investigadores pueden utilizar la herramienta de investigación del proyecto, denominada KNMI Climate Explorer, para verificar datos, examinar pronósticos estacionales e incluso analizar con más detalle los efectos de El Niño, entre otras aplicaciones. Dado que este conjunto de datos se actualiza diariamente, los periodistas que utilicen esta fuente serán los primeros en enterarse de cualquier indicio de cambio climático extremo.
222. Servicios de exploración de imágenes globales
Los Servicios de Navegación de Imágenes Globales (GIBS) son una parte esencial de EOSDIS, ya que ofrecen servicios de imágenes adaptables y basados en estándares comunitarios. En otras palabras, GIBS permite a la gente común interactuar con imágenes satelitales tomadas desde prácticamente cualquier lugar del planeta en alta definición. Dado que EOSDIS GIBS está disponible a través de los datos de ciencias de la Tierra de la NASA, es más fácil que nunca para periodistas e investigadores aprender más sobre el mundo en tiempo real.
223. Clima y ecosistema de Bering
Este sitio web, dependiente de la Administración Nacional Oceánica y Atmosférica (NOAA) del Gobierno de los Estados Unidos, ofrece a periodistas e investigadores toda la información necesaria sobre cómo el clima y el ecosistema del mar de Bering están reaccionando a los cambios ocurridos en el Ártico. Aquí se pueden leer ensayos, revisar proyecciones y utilizar la herramienta de datos en línea para ver el comportamiento de diversos índices climáticos, datos biológicos, atmosféricos y oceánicos, así como la fauna del mar de Bering.
224. Instituto Nacional de la Educación (NCEI)
El NCEI, o Centros Nacionales de Información Ambiental, es el resultado de la fusión de los tres centros de datos de la Administración Nacional Oceánica y Atmosférica (NOAA). Esta página alberga una serie de enlaces divididos en 22 categorías que conectan a los usuarios con diferentes recursos, páginas de interés y conjuntos de datos sobre clima y tiempo. Los periodistas que buscan información sobre el clima, las tormentas, las precipitaciones y otras cuestiones meteorológicas probablemente encontrarán aquí lo que buscan.
225. Laboratorio de Investigación del Sistema Terrestre
La División de Monitoreo Global de la Administración Nacional Oceánica y Atmosférica (NOAA) proporciona información sobre las tendencias a largo plazo de las fuerzas del cambio climático en la Tierra mediante el monitoreo de métricas atmosféricas clave. Entre ellas se encuentran, por ejemplo, el monóxido de carbono, el metano, el óxido nitroso y el dióxido de carbono. Estas métricas se utilizan para medir aspectos como el agotamiento del ozono a largo plazo, las fuentes y los niveles de dióxido de carbono, así como los sumideros. Este es un recurso sobre el cambio climático que los periodistas pueden utilizar.
226. WorldClim – Datos climáticos globales
¿Alguna vez has buscado una mejor manera de visualizar datos climáticos? WorldClim es un proveedor de software de datos gratuitos que se pueden aplicar al modelado espacial y a la creación de mapas. La versión actual de este software gratuito solo se puede aplicar al clima actual, mientras que la versión anterior permite acceder a datos climáticos del pasado y del presente, y también permite a los usuarios ver el estado de las predicciones climáticas futuras. Los periodistas pueden simplemente seguir el enlace y descargar el software.
227. Laboratorio de Descubrimiento del Conocimiento
El Laboratorio de Descubrimiento del Conocimiento es un sitio dedicado al desarrollo de tecnologías innovadoras, los fundamentos del aprendizaje automático y la aplicación de dicho conocimiento en áreas prácticas como la ciencia de redes, la detección de fraudes y el análisis de datos científicos. El sitio alberga un conjunto de datos considerable en el DBLP, con 1,2 millones de objetos y 2,48 millones de enlaces. Para los investigadores interesados en los objetivos del Laboratorio de Descubrimiento del Conocimiento, este conjunto de datos es un excelente recurso.
228. Desafío de implementación de DIMACS
El sitio web del 9.º Desafío de Implementación busca ayudar a los investigadores a aprender a resolver problemas de ruta más corta. Para sus creadores, el sitio se creó con dos objetivos: primero, encontrar las mejores soluciones reproducibles; y segundo, facilitar la colaboración entre los investigadores y el descubrimiento de soluciones más efectivas. Los investigadores interesados en ver el progreso en este campo pueden consultar los artículos y los conjuntos de datos en el sitio.
229. Repositorio de red
El Repositorio de la Red es un sitio donde se almacenan datos científicos con herramientas visuales interactivas a las que los usuarios pueden acceder y analizar. Este sitio tiene la doble distinción de ser el primer repositorio de su tipo y el más grande de la web. Al utilizar datos gráficos e imágenes intuitivas y visualmente atractivas, es mucho más fácil hacer comparaciones y encontrar nuevas maneras de contextualizar los datos. Los periodistas pueden usar esta fuente para encontrar historias dentro de los datos científicos.
230. Conjuntos de datos de Pajek
Pajek Datasets es una página que ofrece un conjunto de datos que aborda las interacciones entre las proteínas presentes en la levadura en ciernes. Tras ofrecer una breve explicación sobre el impacto de encontrar nuevos métodos para detectar interacciones, junto con las razones por las que es esencial discernir la importancia de las diversas interacciones proteína-proteína, el sitio enlaza directamente a un conjunto de datos disponible para su descarga. Para obtener más información, los investigadores pueden hacer clic en el enlace inferior para leer el artículo publicado sobre el tema.
231. Datos de la red Mejn
Este sitio busca compartir enlaces a los conjuntos de datos de red que el propietario web ha utilizado y compilado. Los temas de los conjuntos de datos abarcan desde fútbol americano universitario, blogs políticos y libros sobre política estadounidense, hasta redes sociales, Los Miserables y colaboraciones teóricas de alto impacto. Quienes estén interesados en explorar estos temas encontrarán una amplia gama de conjuntos de datos de interés. Además, los datos son de libre uso siempre que se incluyan referencias.
232. La base de datos gráfica de Stanford
Stanford GraphBase es el nombre que Donald Knuth, de Stanford, ha dado a un conjunto de conjuntos de datos y programas. Al combinarse, estos programas y conjuntos de datos permiten manipular y generar gráficos y redes. En este sitio, los materiales necesarios se pueden descargar a través de los enlaces. En estos archivos, los investigadores encontrarán datos de resultados de fútbol, datos de diccionarios, datos sobre la reconstrucción de la Mona Lisa y muchos más.
233. Colección de matrices SuiteSparse
Anteriormente conocida como la Colección de Matrices Dispersas de la Universidad de Florida, la Colección de Matrices Dispersas SuiteSparse es una colección de matrices con implicaciones prácticas. Según el sitio web, esta colección se utiliza con frecuencia en álgebra lineal numérica para el desarrollo y perfeccionamiento de algoritmos de matrices dispersas. Los usuarios suelen apreciar la colección por su utilidad para ejecutar y probar los resultados de experimentos. Los conjuntos de datos y los benchmarks de matrices se pueden descargar directamente desde el sitio web.
234. Conjuntos de datos gráficos
Este es un conjunto de datos que los creadores de esta página web consideraron relacionales o fácilmente trasladables a representaciones gráficas. Graph Datasets ofrece conjuntos de datos como los del Predictive Toxicology Challenge, datos de IMDb, datos de mutagénesis, datos de MovieLens, filtrado colaborativo y datos de proteínas a investigadores que desean aprender a trabajar con números sin procesar. Los archivos están disponibles en esta página y se pueden descargar principalmente en formato XML.
Big Data News es un sitio web centrado en el big data y los fundamentos de la ciencia de datos. Este sitio alberga las últimas noticias e incluye debates sobre aprendizaje profundo e inteligencia artificial. Además, Big Data News también alberga un conjunto de datos masivo que contiene aproximadamente 3500 millones de páginas web. Todas ellas están separadas por niveles denominados grafos de nivel de página, grafos de nivel de subdominio, grafos de subdominio de primer nivel y grafos de dominio de nivel de pago, respectivamente.
236. Centro de Investigación de Redes y Sistemas Complejos
CNetS, o el Centro de Investigación de Redes y Sistemas Complejos, opera bajo el paraguas del Instituto de Ciencias de Redes de la Universidad de Indiana y la Facultad de Informática y Computación. El sitio web pretende ser un recurso en los campos de la ciencia de datos, las ciencias sociales computacionales y las redes y sistemas complejos, con información sobre minería de datos y patrones de tráfico en línea. Además, CNetS también alberga un conjunto de datos con aproximadamente 53 500 millones de solicitudes de red realizadas por usuarios de la Universidad de Indiana.
237. Explorador OONI
OONI Explorer, parte del Observatorio Abierto de Interferencias de Red, es un proyecto dedicado a proporcionar software libre y de código abierto. Los usuarios pueden usar el software para intentar bloquear sitios web y aplicaciones de mensajería, entre otras. De especial interés para quienes estén interesados en esta tecnología es el acceso gratuito a los datos sin procesar recopilados por OONI. Simplemente introduzca la información en OONI Explorer e interactúe con los datos desde allí.
238. Desafíos en el aprendizaje automático
Challenges in Machine Learning se dedica a la investigación y el desarrollo del aprendizaje automático. En este sitio, los lectores encontrarán enlaces a software, libros, desafíos de aprendizaje automático y notificaciones de próximos talleres. El sitio incluso proporciona enlaces a desafíos que permiten enviar trabajos con fecha posterior. Para los periodistas interesados en comprobar si el aprendizaje automático puede realizar tareas como la predicción financiera o la clasificación de páginas web, este sitio merece una visita.
239. Datos X
DataX, que actualmente opera bajo el paraguas de CrowdANALYTIX, es la parte informática de una iniciativa comunitaria que aprovecha el poder del colectivo para crear aplicaciones personalizadas de inteligencia artificial, aprendizaje automático y programación neurolingüística. La función de DataX en el proceso es el mantenimiento y la implementación, lo que a su vez permite que estas soluciones sean escalables. Para los periodistas que tienen que analizar grandes cantidades de texto, vídeo y datos, los bots disponibles a través de CrowdANALYTIX y DataX pueden reducir el tiempo de investigación a la mitad.
240. Datos impulsados
Driven Data combina el crowdsourcing con la ciencia de datos como casi ningún otro sitio. Enfatizando su rol como apoyo a organizaciones que abordan diversos desafíos sociales, este sitio ofrece ayuda poniendo a su amplia comunidad de científicos de datos a trabajar en la creación de modelos estadísticos que resuelven preguntas predictivas. Driven Data parece trabajar principalmente con organizaciones sin fines de lucro, pero es potencialmente útil para cualquiera que tenga datos sin procesar que necesiten ser refinados. Los periodistas pueden beneficiarse de tener en cuenta esta fuente.
241. Big Data abierto
Dandelion API es una aplicación que gestiona el análisis semántico de texto para big data. Esto significa que, para quienes tienen datos que requieren procesamiento, este programa tomará texto desorganizado y encontrará la manera de contextualizarlo. Los periodistas que analizan una gran cantidad de documentos pueden beneficiarse sin duda de esta capacidad. Dandelion API también ofrece Big Data Abierto en las categorías de Milán, Trento y Europa. Aunque esta API es de pago, hay una cantidad diaria de texto que se puede analizar de forma gratuita.
242. Modelos terrestres
Earth Models se centra en compartir y almacenar software y conjuntos de datos relacionados con la Tierra. Las herramientas de modelado mencionadas en el sitio incluyen software de simulación y procesamiento, así como datos virtuales que se basan en gran medida en áreas de estudio específicas como la tectónica y la sismología. Los periodistas e investigadores que deseen profundizar sus conocimientos sobre el tema pueden consultar las publicaciones y artículos de este sitio antes de profundizar en las herramientas de modelado y visualización.
243. Centro de Datos y Aplicaciones Socioeconómicas (SEDAC)
El Centro de Datos y Aplicaciones Socioeconómicas, o SEDAC, es uno de los centros de datos asociados al sistema EOSDIS de la NASA. En este sitio, los lectores encontrarán conjuntos de datos que ofrecen cifras sobre el cambio climático o información demográfica en cuadrícula. Los conjuntos de datos también pueden buscarse por temas como Gobernanza, Agricultura, Uso del Suelo, Salud, Conservación, Clima, Agua, Teledetección y Pobreza. Hay mapas, galerías, guías que ofrecen más contexto a los datos, así como recursos y herramientas adicionales a los que los investigadores pueden acceder en el sitio.
244. Portal de AODN
El Portal AODN, un sitio web de la Red Australiana de Datos Oceánicos, ofrece acceso a la ciencia climática y los datos marinos australianos. Los investigadores que accedan a esta información también tendrán acceso a los datos y metadatos de IMOS, un marco de investigación respaldado por diversas instituciones, incluido el Gobierno australiano. Los investigadores que opten por el Portal AODN recibirán una excelente presentación de los datos oceánicos en una interfaz intuitiva.
Planet OS ofrece un marco de big data con énfasis en las energías renovables. Esta elección de nicho, sumada a la competencia del sitio, lo ha popularizado entre las empresas energéticas que buscan nuevas formas de visualizar y contextualizar sus datos. Además, el sitio también cuenta con el llamado DataHub, donde alberga una importante colección de más de 2000 conjuntos de datos. Estos conjuntos de datos incluyen datos abiertos de la NASA y Copernicus, y se actualizan periódicamente.
El Smithsonian ha sido durante mucho tiempo un nombre académico respetado y es apreciado en todo el mundo por su compromiso con la investigación y la historia. En cierto sentido, es natural que el Smithsonian tenga un sitio web que ofrece la mejor información en línea sobre investigación volcánica. El sitio publica informes, enlaces de investigación y bases de datos que incluyen búsquedas acotadas sobre volcanes, erupciones, emisiones y deformaciones, además de la lista y hoja de cálculo de volcanes del Holoceno. Los periodistas no necesitarán otra fuente sobre actividad volcánica.
Actualizado y mantenido por el Programa de Riesgos Sísmicos del gobierno de EE. UU., el Catálogo de Terremotos permite a los investigadores ver cuándo y dónde ocurrió el último terremoto. Si bien los resultados de búsqueda están limitados a 20 000, la búsqueda del catálogo permite filtrar los resultados por magnitud, fecha y hora, e incluso por región geográfica. Esta flexibilidad hace que este recurso sea especialmente útil para periodistas que cubren un desastre natural o un terremoto local y buscan información de fondo.
248. Asociación Económica Americana
La Asociación Económica Americana proporciona a los investigadores datos macroeconómicos de Estados Unidos y otros países del mundo. Este sitio no parece producir datos económicos, sino seleccionar una lista de los más fiables. Sin embargo, dada la gran cantidad de sitios que ofrecen información económica en internet, este es un recurso que los periodistas pueden esperar credibilidad. Simplemente visite el sitio y explore las categorías de datos económicos según corresponda.
249. Estadísticas históricas.org
Historicalstatistics.org es un sitio increíblemente útil para encontrar información económica que presenta un contraste interesante con la actualidad. Por ejemplo, su conversor de divisas históricas permite a los investigadores averiguar cuánto podía comprar hoy una persona con 10 USD en 1923. También alberga publicaciones y artículos que plantean preguntas sobre las métricas utilizadas en el campo de la historia económica, junto con índices de precios e información sobre la oferta monetaria que se puede filtrar por país.
250. DB Nomics
¿Qué pasaría si se pudiera acceder y buscar en todos los datos económicos públicos de internet desde una única plataforma navegable? Db.nomics es un agregador de bases de datos económicas que busca precisamente eso. Los datos están disponibles en formatos como HTML, JSON y CSV y se actualizan automáticamente, mientras que las revisiones previas se archivan como corresponde. Entre las fuentes económicas se incluyen la Reserva Federal, la Oficina de Análisis Económico, el Fondo Monetario Internacional y otras. Los investigadores que buscan datos económicos fiables no se equivocarán con Db.nomics.
251. Centro Conjunto de Deuda Externa (JEDH)
Desarrollado mediante el trabajo conjunto del Banco de Pagos Internacionales, la Organización para la Cooperación y el Desarrollo Económicos (OCDE), el Fondo Monetario Internacional y el Banco Mundial, el Centro Conjunto de Deuda Externa pone a disposición del público información sobre datos de deuda, acreedores y deudores internacionales. Los periodistas que investigan las finanzas de diferentes países y buscan comprender mejor el panorama financiero internacional encontrarán aquí prácticamente todo lo que buscan saber.
252. Datos de comercio internacional
Elaborada con la aportación completa de Jon Haveman, un destacado experto en economía, esta página sobre datos de comercio internacional contiene información que puede descargarse y analizarse en profundidad. Los conjuntos de datos incluyen datos arancelarios, tablas de Penn World, servicios públicos, datos de importación, productividad manufacturera, clasificación de bienes, códigos de diferenciación de productos de Rauch, datos del NBER, la encuesta de flujo de mercancías de 1997, comercio e inmigración, y el útil modelo de gravedad. UNIX es el sistema operativo utilizado para compilarlos, pero el sitio web indica que los ordenadores también deberían tener acceso a los datos.
En OpenCorporates, los investigadores tienen la posibilidad de buscar y encontrar información en una de las bases de datos abiertas más grandes de empresas del mundo. Esta información es utilizada por diferentes grupos, como bancos, investigadores, ONG y periodistas, para obtener información y obtener inteligencia. Los periodistas tienen la ventaja adicional de poder acceder a los datos en tiempo real con la ayuda de la API de OpenCorporates, así como a través de los datos básicos masivos u otros conjuntos de datos básicos.
Nuestro Mundo en Datos recopila información de diversas fuentes en diversas áreas y presenta datos cuantificados. Desde cifras sobre la participación de las mujeres en la fuerza laboral hasta información sobre la percepción general de la corrupción en el sector público y la desigualdad de ingresos a nivel mundial, si el tema se puede abordar en términos de datos, este sitio web podría tener una entrada para ello. Los periodistas pueden usar esta fuente para encontrar estadísticas y cifras relacionadas con problemas sociales.
255. Ciencia Po
Sciences Po, o como se le conoce más comúnmente, el Instituto de Estudios Políticos, es una escuela con una influencia innegable en las ciencias sociales. En este caso, la página de Thierry Mayer incluye archivos de datos que presentan datos de regresiones de gravedad y conflictos militares de "Make Trade Not War", así como conjuntos de datos sobre el potencial de mercado, entre otros. Los periodistas que deseen comprender mejor las conclusiones de las revistas académicas encontrarán mucha información al navegar por este sitio.
256. Centro de Datos Internacionales
Desde su fundación en 1999, el Centro de Datos Internacionales se ha dedicado a recopilar, crear, mejorar y distribuir datos económicos internacionales, tanto en línea como fuera de línea. En su sitio web, los lectores pueden acceder a información como datos arancelarios de EE. UU., importaciones y exportaciones mundiales y estadounidenses, e incluso información de la Penn World Table. Esta información, disponible para el público con fines educativos e investigativos, permite a los periodistas acceder y utilizarla gratuitamente.
257. Observatorio de la Complejidad Económica
El Observatorio de Complejidad Económica, comúnmente conocido como OEC, permite a investigadores, estudiantes, economistas y cualquier otra persona visualizar datos de comercio internacional. Con sus atractivos temas e interfaz interactiva, este sitio ofrece a los investigadores una oportunidad única para explorar la información sobre comercio internacional de maneras nunca antes vistas. Para los periodistas que desean ver cómo los datos económicos cobran vida a medida que los buscan, el OEC es un recurso invaluable.
258. Datos del cuadro de mando universitario
La educación superior es un tema candente en muchos círculos, ya que tanto estudiantes como familias desean saber cómo se comparan las escuelas y qué tan bien aprenden los estudiantes. A través de los datos de su College Scorecard, el Departamento de Educación de EE. UU. ofrece a educadores y estudiantes toda esta información y más. Estas cifras abarcan el período de 1996 a 2016 e incluyen datos actuales, datos de la Scorecard, ingresos posteriores a la escuela y nueva información del Sistema Nacional de Datos de Préstamos Estudiantiles. Es una fuente de información actualizada sobre educación postsecundaria que los periodistas deberían consultar.
259. Conjunto de datos de energía de edificios comerciales
Como conjunto de datos que trata principalmente sobre energía, COMBED tiene un derecho indiscutible de singularidad. Si a esto le sumamos que sus datos se renuevan varias veces por minuto, al provenir de un edificio comercial, queda claro que este conjunto de datos es único. Para los periodistas, esta información es sumamente útil al preparar un artículo sobre consumo energético. Acceder a los datos de COMBED es tan fácil como descargar y abrir una hoja de cálculo de Excel.
260. Conjunto de datos DRED
La sección DRED de la base de datos DRED significa Conjunto de Datos de Energía Residencial Neerlandés. Como su nombre indica, estos datos miden y estudian la cantidad de energía que consume un solo hogar neerlandés. El ambiente, la ocupación, la electricidad y la información general del hogar se monitorizaron en este conjunto de datos desde el 5 de julio de 2015 hasta el 5 de diciembre de 2015. Cualquier periodista que investigue el consumo de energía se beneficiará de consultar las cifras brutas que se proporcionan aquí. Las instrucciones para descargar los datos en formato CSV se encuentran directamente en el sitio web.
ECO, siglas de Consumo Eléctrico y Ocupación, es un proyecto operado y gestionado por el Grupo de Sistemas Distribuidos. El proyecto se basó en el monitoreo de consumos y la detección de ocupaciones en seis hogares suizos durante ocho meses. Este sitio web ofrece acceso a dicha información, así como instrucciones y enlaces a publicaciones relacionadas. Gracias a su panel de control visualmente interactivo, los periodistas podrán traducir fácilmente la investigación en un contenido atractivo.
262. Conjunto de datos indios sobre agua y energía ambiental
IAWE, siglas de Conjunto de Datos Indios para Agua y Energía Ambiental, se creó con el objetivo de monitorear el consumo energético de un hogar en Nueva Delhi mediante mediciones de electricidad de electrodomésticos, el contador eléctrico y el panel de control. Debido a cortes de suministro, diferencias en el suministro de agua, pérdidas de paquetes y fluctuaciones de voltaje, iAWE experimentó problemas exclusivos del seguimiento del consumo energético en India. Estos datos son sumamente útiles para los periodistas al analizar los patrones de consumo energético.
263. Electricidad a nivel de electrodomésticos en el Reino Unido
El Sistema de Electricidad a Nivel de Electrodomésticos del Reino Unido (UK-DALE) es el nombre que recibe un conjunto de datos que monitoriza y registra la demanda de energía en un grupo de cinco hogares. Cada seis segundos, UK-DALE mide la demanda tanto de la red eléctrica principal como de los electrodomésticos individuales de la casa. Los periodistas interesados en comprender cómo utilizan la energía los hogares del Reino Unido encontrarán muy útil UK-DALE. Los datos son accesibles y existe un artículo que describe el sistema disponible para consulta.
264. ArcGIS
ArcGIS Hub es una plataforma que organizaciones e individuos pueden usar para lograr objetivos mediante iniciativas que abarcan todo el sitio. Con plantillas de página, guías paso a paso y ejemplos disponibles, este sitio es un excelente recurso para activistas sociales ambiciosos. Además, la información disponible en la pestaña Datos Abiertos alberga cientos de conjuntos de datos solo en la categoría "Desastre". Ya sea que los periodistas investiguen datos o los aporten, ArcGIS Hub es útil en múltiples sentidos.
265. Sistema de información geográfica de Cambridge
Cambridge GIS es el repositorio de datos abiertos de la ciudad de Cambridge, Massachusetts. Con la excepción de los archivos demasiado grandes para descargarse a través de este repositorio de GitHub, la mayoría de los conjuntos de datos de la ciudad se pueden encontrar en esta página. Los conjuntos de datos individuales disponibles aquí incluyen distritos comerciales, servidumbres, distritos de zonificación, resultados del censo, cementerios y otros puntos de referencia y características que pueden cuantificarse mediante datos. Un periodista que busque información local encontrará todo lo que busca y mucho más en este sitio.
266. Geo-Wiki.org
Como recurso, Geo-Wiki es un sitio web dedicado a lo que denomina el "movimiento de ciencia ciudadana". En él, se anima a los ciudadanos a probar suerte en el monitoreo del medio ambiente. Los investigadores pueden encontrar las últimas noticias en la barra lateral, junto con los nombres de las publicaciones y descargas gratuitas de conjuntos de datos y software. Las herramientas que el sitio pone a disposición incluyen mapas, carga de datos personales, validaciones y hackatones que pueden descargarse en formato Excel y archivos zip.
Los extractos de datos de OpenStreetMap provienen del proyecto OpenStreetMap, el esfuerzo continuo en línea por crear un mapa del mundo mediante la edición y el esfuerzo de la comunidad global de usuarios. Para empezar a utilizar esta fuente de datos, los editores de contenido solo tienen que elegir su continente preferido y, a continuación, encontrar su país preferido. La descarga de Geofabrik GmbH es gratuita y, por lo general, los datos se actualizan a diario.
Operado y mantenido por el Departamento de Seguridad Nacional, HIFLD (Datos de Nivel Básico de Infraestructura Nacional) publica datos geoespaciales. Estos datos se distribuyen con el propósito expreso de brindar apoyo e información para la investigación y la preparación de la comunidad. Estos datos pueden descargarse en formato Shapefile y CSV, y también pueden consultarse en la web. Para los editores, los Datos Abiertos de HIFLD hacen que los datos geoespaciales sean más visuales y atractivos que nunca.
269. Direcciones abiertas
OpenAddresses se especializa en infraestructura y recopilación de direcciones. Impulsado en gran medida por el esfuerzo de la comunidad, este sitio utiliza GitHub como plataforma de desarrollo. Aquí, se pueden ubicar direcciones en un mapa después de añadirlas a la base de datos o se pueden tomar los datos y comenzar a geocodificar directamente. Con todos los datos y direcciones abiertos y con la simple atribución, las actualizaciones periódicas de datos y el potencial de avances en geocodificación hacen de OpenAddresses un proyecto muy interesante.
270. Datos abiertos LMU
Datos Abiertos LMU se basa en gran medida en datos de OpenStreetMap para el desarrollo del Geocodificador Inverso Rápido. Esto significa que la aplicación puede tomar rápidamente una ubicación en un mapa y encontrar una dirección completa basándose en ese punto. Esto también podría aplicarse a barrios y condados. Esta página web contiene numerosos enlaces relacionados con la aplicación, incluyendo el código fuente, conjuntos de datos y tablas de búsqueda y resoluciones de OpenStreetMap.
271. Explorador de datos ambientales
Con el Explorador de Datos Ambientales, periodistas, investigadores y estudiantes pueden descargar y explorar los mismos conjuntos de datos que utiliza el Programa de las Naciones Unidas para el Medio Ambiente, junto con sus organizaciones afiliadas y socios. Las búsquedas pueden filtrarse por región y realizarse utilizando uno o todos los 500 filtros. Además, los conjuntos de datos incluyen categorías como salud, PIB, clima, emisiones y agua dulce, que pueden visualizarse directamente en el sitio web en forma de gráfico, tabla o mapa.
272. Grupo del Banco Africano de Desarrollo
El sitio web del Grupo del Banco Africano de Desarrollo es la primera opción para periodistas que buscan información estadística e indicadores relacionados con el continente africano. Al explorar el catálogo de datos, los usuarios pueden filtrar los conjuntos de datos por fuente, tema y región. Para quienes deseen profundizar en el tema, el sitio también ofrece enlaces a una amplia lista de publicaciones, como Perspectivas Económicas Africanas y el Anuario Estadístico Africano.
273. Centro Común de Datos Genómicos (GDC)
El Genomic Data Commons del NCI alberga uno de los repositorios de datos sobre cáncer más completos de la web, centrado en el estudio genómico del cáncer. El portal de datos de este sitio alberga miles de casos y abarca 38 tipos de enfermedades, que se corresponden con 39 proyectos, y es de acceso gratuito. Dado que los datos son aportados principalmente por instituciones e investigadores, la precisión de esta información la convierte en una fuente de datos ideal para los periodistas.
274. Bases de datos de PhysioBank
Las bases de datos de PhysioBank ponen a disposición del público datos fisiológicos. Estas bases de datos se dividen en dos categorías principales: formas de onda y clínicas. Entre las subcategorías de formas de onda se encuentran imágenes, bases de datos de intervalo interlatido, bases de datos sintéticas, de marcha y equilibrio, de ECG y bases de datos multiparamétricas. Una muestra de la información pura que se obtiene de estas bases de datos incluye datos de constantes vitales a pie de cama, saturación de oxígeno e incluso enfermedades cardiovasculares. Los periodistas y quienes investigan el cuerpo humano pueden encontrar información aquí.
275. Base de datos de cobertura de Medicare
La base de datos de Cobertura de Medicare, mantenida por los Centros de Servicios de Medicare y Medicaid a través del Departamento de Salud y Servicios Humanos, ofrece a los investigadores acceso completo a una gran cantidad de información sobre servicios médicos. Incluye información sobre enfermedades crónicas, gasto en medicamentos, plantillas clínicas electrónicas, el sistema de cobro de deudas y subvenciones para investigación y demostración. Con datos extraídos directamente de la fuente, este es el sitio web más completo y completo de su tipo.
Contenido de nuestros socios
Cuando la mayoría de las personas van al médico, no suelen detenerse a pensar si su médico de cabecera se beneficia económicamente tras trabajar con fabricantes de productos sanitarios. Open Payments informa al público sobre comidas, investigaciones, regalos, honorarios por conferencias y gastos de viaje que el médico u hospital ha recibido de las empresas. Los periodistas que buscan una noticia impactante pueden usar el explorador de datos para ver la información o hacer clic en la pestaña para descargar los datos directamente.
277. Logotipos de Flickr
Aunque el nombre lo indica, FlickrLogos se refiere a un conjunto de datos que contiene logotipos de empresas fotografiados en diversas posiciones. Mantenida por el Laboratorio de Computación Multimedia y Visión Artificial de la Universidad de Augsburgo, esta colección se compiló originalmente con la intención de entrenar a las computadoras para que reconocieran logotipos y textos. Para mantenerse al día con los avances de este programa, es recomendable descargar este conjunto de datos y ver de qué se trata.
278. ImagenNet
ImageNet es una base de datos repleta de imágenes organizadas por WordNet. El sitio ofrece retos anuales que pueden consultarse incluso después de cerrar y que se centran en la creación de algoritmos capaces de realizar tareas específicas. ImageNet también alberga numerosas publicaciones, citas y diapositivas. Los editores de contenido tecnológico deberían usar el explorador para comprender la estructura de WordNet y el mapa de nubes.
279. Conjunto de datos de Stanford Dogs
El conjunto de datos Stanford Dogs contiene muchísimas imágenes de diferentes razas de perros. Con 120 razas diferentes de perros y más de 20.000 imágenes individuales, esta base de datos, impulsada por ImageNet, ofrece a los investigadores una gran cantidad de imágenes con las que trabajar mientras enseñan a las máquinas a reconocer cada raza. En el sitio web, se pueden consultar enlaces a diferentes publicaciones que abordan el uso de conjuntos de datos para enseñar a las computadoras el reconocimiento de imágenes, junto con la descarga del conjunto de datos.
280. Base de datos SUN
La base de datos SUN es el sitio de un proyecto creado para que la comunidad investigadora avance en áreas como la visión artificial y los gráficos, la minería de datos, el aprendizaje automático y la neurociencia, entre otras. Con más de 131 000 imágenes y casi 4000 categorías de objetos en sus índices, este sitio es sumamente completo. Para los editores interesados en esta base de datos y en lo que los investigadores han logrado con su uso, esta es una fuente de datos que vale la pena explorar.
281. El conjunto de datos de mascotas de Oxford-IIIT
El conjunto de datos de mascotas Oxford-IIIT es un sitio que complementa un artículo publicado en la Conferencia IEEE de 2012 sobre Visión Artificial y Reconocimiento de Patrones y alberga el conjunto de datos original utilizado para dicho artículo. Estas imágenes se han organizado en aproximadamente 37 categorías de mascotas, junto con otras 200 imágenes asociadas a cada clase. Además, estos datos pueden descargarse directamente a través de los enlaces de la página web.
282. El conjunto de datos del genoma visual
La API Visual Genome es el resultado del arduo trabajo de varios estudiantes y profesores asociados de la Universidad de Stanford. Con varios artículos a su nombre en la búsqueda de una API capaz de evaluar y describir imágenes, el programa ha respondido con éxito a más de un millón de preguntas al evaluar más de 100.000 imágenes. Esta API representa un avance en el campo de la informática y sus campos afines, y el conjunto de datos puede descargarse directamente en el sitio web.
283. Caras de YouTube
La Base de Datos de Rostros de YouTube se centra en el desarrollo de una solución al problema del reconocimiento facial automático en vídeos. En total, el conjunto de datos incluye más de 3000 vídeos de YouTube de casi 1600 personas, con una duración media de aproximadamente 181 fotogramas. El objetivo final es crear un algoritmo capaz de crear etiquetas que identifiquen a la persona que aparece en el vídeo. Los datos, junto con la información sobre errores y los métodos de descripción, están disponibles para su consulta directamente en el sitio web.
284. Repositorio de conjuntos de datos KEEL
El repositorio de conjuntos de datos KEEL contiene el conjunto de datos de software de código abierto basado en Java, diseñado para facilitar el descubrimiento de diversos tipos de datos de conocimiento. KEEL, conocido simplemente como Extracción de Conocimiento Basada en Aprendizaje Evolutivo, puede entrenarse para aprender a agregar valores faltantes, modelos híbridos y métodos estadísticos para evaluar experimentos, entre otras tareas. Las descargas de conjuntos de datos, así como una lista completa de los algoritmos incluidos en KEEL, pueden descargarse directamente desde el sitio web.
285. Club de préstamos
La principal característica de The Lending Club es su condición de prestamista entre particulares, lo que permite a los prestatarios obtener préstamos incluso si no cuentan con la calificación crediticia necesaria para solicitarlos a prestamistas tradicionales. Además de las novedades del funcionamiento del sitio, también ofrece estadísticas que incluyen aspectos destacados de la plataforma, información sobre préstamos rechazados, cifras de rendimiento de los inversores e incluso un diccionario de datos con datos históricos. Estas cifras suelen comenzar a partir de 2007 y se pueden descargar en formato CSV.
286. Museo de Historia Natural
El Museo de Historia Natural es considerado por muchos uno de los museos más reconocidos del mundo, pero la digitalización y la posibilidad de consultar su catálogo a través del portal de datos abiertos probablemente serían una novedad para muchos. Con 91 conjuntos de datos que incluyen colecciones de microfósiles y fósiles, así como registros de lotes de índice, entre otros materiales, los datos están abiertos al público y se pueden descargar gratuitamente en múltiples formatos.
287. Los vocabularios de Getty
Este sitio es perfecto para periodistas y editores que desean ajustarse a ciertas pautas de estilo al describir y categorizar obras de arte, nombres de artistas, arquitectura, materiales y nombres geográficos. Este sitio conecta directamente a los usuarios con las bases de datos de vocabulario controlado que investigadores y catalogadores necesitan conocer para cumplir con los estándares internacionales. Al menos en este caso, los vocabularios de Getty son insuperables. Los conjuntos de datos se pueden explorar mediante texto o SPARQL y se pueden descargar a través del sitio.
288. Corpus de investigación de estilometría (CSI) de CLiPS
El Corpus de Investigación de Estilometría de CLiPS probablemente no sea lo que la mayoría de la gente imagina cuando escucha las palabras CSI, pero aun así es un conjunto de datos compuesto por reseñas y ensayos de estudiantes. Además del texto en sí, el sitio web destaca la presencia de metadatos e información integrada en el documento, lo que permite múltiples usos. Ofrecido y distribuido bajo la licencia Creative Commons, el corpus solo solicita la atribución a cambio de su uso.
289. Dependencias universales v2
Dependencias Universales v2 se refiere a la segunda versión actualizada del proyecto Dependencias Universales, un esfuerzo para desarrollar una anotación de banco de árboles compatible con varios idiomas. En esta versión actualizada, los investigadores encontrarán docenas de bancos de árboles UD para diferentes idiomas, incluyendo afrikáans, griego antiguo, japonés, neerlandés, finlandés y chino, además del inglés. La versión más reciente de Dependencias Universales se puede encontrar y descargar casi al final de esta página web.
290. Webhose
Webhose es una fuente de primera categoría de conjuntos de datos, extraídos directamente de los repositorios del sitio y abiertos al público. Los investigadores pueden ordenar las noticias por idioma; el árabe, el francés y el neerlandés son solo algunos de los idiomas con más de 100.000 artículos. Además, los artículos en inglés se desglosan en categorías como entretenimiento y deportes, para complementar las reseñas y las publicaciones en el foro. Los editores digitales y los investigadores pueden beneficiarse explorando estos conjuntos de datos.
291. Datos wiki
Wikidata es una fuente subestimada de contenido e ideas tanto para editores como para investigadores. Según esta página, existen diversas maneras de acceder al material de los volcados de datos, aunque el uso de JSON es el que el sitio recomienda con mayor énfasis. Disponibles y totalmente gratuitos para uso comercial y no comercial, todos los datos disponibles aquí se pueden acceder y descargar gratuitamente bajo la licencia Creative Commons.
292. Enlaces wiki
Ubicado cómodamente dentro del marco de Google Code, Wiki Links es un proyecto de código abierto que busca brindar acceso a este conjunto de datos único y particular. En esta página web, los investigadores pueden descargar los archivos README, los archivos de datos y la licencia Creative Commons. Los editores y, en general, las personas con conocimientos tecnológicos tienen mucho que ofrecer al explorar este enorme conjunto de datos. Simplemente navegue por el sitio, haga clic y comience a descargar los archivos.
293. Wordnet
WordNet es un léxico del inglés compuesto por componentes del lenguaje: adverbios, sustantivos, adjetivos y verbos, que se clasifican en grupos distintos que se utilizan para expresar ideas específicas. El resultado es una herramienta útil que categoriza las palabras según su uso y significado, en lugar de su pronunciación. Se destacan las aplicaciones de WordNet en la programación lingüística, junto con las numerosas publicaciones y estadísticas disponibles en el sitio.
El Atlas Cerebral Allen, creado por el Instituto Allen de Recursos para la Ciencia del Cerebro, es una herramienta para estudiar y aprender más sobre el cerebro humano y cómo responde tanto en condiciones de salud como en enfermedades. Con este atlas, los investigadores pueden aprender sobre el cerebro humano y su desarrollo, así como sobre el glioblastoma y el efecto del cáncer en el cerebro. Los periodistas que cubren estos temas pueden visitar este sitio para acceder a conjuntos de datos e información.
295. NITRC
El NITRC, o Centro de Intercambio de Herramientas y Recursos Informáticos de Neuroimagen, es el lugar al que periodistas y editores pueden acceder para obtener neuroimágenes. Creado y promovido como una iniciativa para compartir datos de neuroimagen, este sitio alberga datos de varios proyectos, como el Proyecto 1000 Connectome, la Iniciativa de Preprocesamiento del Connectome de la Adicción, así como los proyectos INDI-Prospectivo y Retrospectivo, respectivamente. Los datos se pueden descargar gratuitamente a través del sitio web. Las neuroimágenes tomadas en diversas etapas nunca han sido tan accesibles.
296. Adulto joven profesional de la salud
El Proyecto Conectoma Humano para Jóvenes Adultos es una continuación del esfuerzo continuo por crear un mapa preciso del conectoma humano tal como se observa en la mayoría de los adultos normales. En dos fases, se escaneó a 1200 adultos sanos mediante una combinación de técnicas de resonancia magnética funcional en reposo e imágenes de difusión. Periodistas y editores que buscan información sobre el cerebro no encontrarán otro sitio web con más datos sobre el conectoma humano en adultos jóvenes sanos.
297. Archivo de datos del NIMH
El Archivo de Datos del NIMH, o NDA, no es tanto una fuente de datos independiente como una plataforma para distribuir y almacenar datos. En este sitio web, se encuentran datos recopilados a lo largo de múltiples artículos y proyectos de investigación, así como métodos y herramientas que facilitan un mejor análisis y colaboración. Los resúmenes de datos están disponibles gratuitamente y los proveedores de contenido que informan sobre las últimas novedades científicas pueden utilizar esta información para difundir noticias de última hora.
298. Neurodatos
NeuroData se dedica a investigar la relación única entre la mente y el cerebro. Gracias al compromiso del sitio con la ciencia abierta y la investigación reproducible, los proveedores de contenido tienen acceso a una publicación y a varios conjuntos de datos a los que se puede acceder siguiendo los enlaces de la página web. De especial interés para quienes deseen ver los datos por sí mismos es la disponibilidad de código y herramientas de análisis gratuitas que facilitan aún más la exploración del trabajo de NeuroData.
299. Neuroelectro
El Proyecto NeuroElectro se diseñó con la intención de recopilar las diversas características electrofisiológicas asociadas a diferentes tipos de neuronas y agruparlas en una única base de datos. Este proyecto busca estudiar la relación entre neuronas para analizar las diferencias entre los distintos tipos. El sitio web incluye enlaces a artículos y enumera los tipos de neuronas y las propiedades electrofisiológicas descubiertas hasta la fecha. Los proveedores de contenido pueden consultar este sitio web como fuente de datos sobre las relaciones entre neuronas.
300. Serie de estudios de imágenes de acceso abierto
La Serie de Estudios de Imagenología de Acceso Abierto, también conocida como OASIS, es un proyecto diseñado con el objetivo de poner los conjuntos de datos de resonancias magnéticas cerebrales al alcance de la comunidad científica. Periodistas e investigadores pueden acceder a publicaciones que comparan datos de resonancias magnéticas en adultos, así como a una ficha informativa completa del estudio de OASIS que compara y contrasta los resultados de más de 400 sujetos. La información y las herramientas se pueden descargar del sitio web en varios formatos.
301. OpenfMRI
Para los periodistas que desean acceder a conjuntos de datos de resonancia magnética sin las complicaciones de otros sitios, el enfoque de OpenfMRI.org en hacer accesibles al público los conjuntos de datos de resonancia magnética es un avance positivo. Proveniente directamente de los propios investigadores, este sitio alberga diversos conjuntos de datos, como el conjunto de datos de aprendizaje de clasificación, la tarea de apuestas mixtas y la tarea de toma de riesgos con análogos de globos. La variedad y cantidad de datos permite a los investigadores encontrar nuevas vías de investigación a través de este sitio.
302. Studyforrest
Studyforrest , cuyo nombre se inspira en la famosa película Forrest Gump, busca comprender de qué es capaz el cerebro cuando debe rendir al máximo mientras se enfrenta a una estimulación natural, pero igualmente compleja. Aun así, el sitio reconoce que la cantidad de datos de resonancia magnética funcional recopilados en estos estudios tiene aplicaciones más amplias de lo que parece a primera vista. Los proveedores de contenido pueden explorar las 19 publicaciones que han utilizado de studyforrest e incluso acceder a ellos directamente.
303. Base de datos abierta de cristalografía
Como su nombre indica, la Base de Datos Abierta de Cristalografía es una colección de 385.697 minerales y compuestos metalorgánicos, así como estructuras cristalinas orgánicas e inorgánicas, con la notable excepción de los biopolímeros. Quienes deseen aprender más sobre las estructuras cristalinas pueden buscar por fórmula estructural o realizar una búsqueda coincidente con la opción de navegar. Además, este sitio web incluye software y datos que lo hacen especialmente valioso en el campo de la química.
304. Archivo de exoplanetas de la NASA
Considerada durante mucho tiempo una de las principales fuentes de información sobre el espacio exterior, la NASA mantiene su tradición de ser un recurso invaluable con su archivo de exoplanetas. Este sitio alberga una serie de herramientas y software interactivos, como el Servicio de Tránsitos y Efemérides, el Periodograma, la Herramienta de Trazado de Planetas Confirmados y la posibilidad de subir archivos y buscar tablas de forma interactiva. Los proveedores de contenido que buscan información única pueden usar estos datos la próxima vez que los exoplanetas sean noticia importante.
305. Estudio del cielo digital de Sloan
La creación de mapas tridimensionales del Universo está al alcance de cualquier persona gracias al Sloan Digital Sky Survey (SDSS). Tanto periodistas como proveedores de contenido pueden acceder a algoritmos, datos de imágenes, conjuntos de datos, tutoriales y al desarrollo de materiales visuales para educar al público, tanto formal como informalmente. El sitio también aborda explícitamente la posibilidad de hacer accesibles sus datos al público a través de noticias y redes sociales. Esta es una herramienta visual invaluable para los proveedores de contenido.
306. StatSci.org
Statsci.org ofrece una lista completa de recursos a los que el público puede acceder y utilizar según sus necesidades. Parte de la información incluye el Servicio de Conjuntos de Datos Electrónicos y estudios de caso recopilados por la UCLA. Además de los conjuntos de datos sin procesar, también se incluyen libros de texto enlazados en esta página. Esto incluye títulos como el Manual de Pequeños Conjuntos de Datos y Estudios de Caso en Biometría. Los proveedores de contenido que buscan información estadística no se equivocarán al consultar esta página.
307. ERIC
ERIC, también conocido como el Instituto de Ciencias de la Educación, es un recurso que funciona como motor de búsqueda para quienes buscan información sobre el campo de la educación. La búsqueda preliminar incluso ofrece la opción de filtrar exclusivamente información revisada por pares, así como textos completos basados en ERIC. Dada la frecuencia con la que los presupuestos educativos y los métodos de enseñanza parecen aparecer en las noticias, esta es una fuente de datos que los periodistas deberían tener en cuenta.
308. NTIS
Creado poco después del fin de la Segunda Guerra Mundial, el NTIS (Servicio Nacional de Información Técnica) se creó con el objetivo de utilizar datos para ayudar a las agencias federales a tomar decisiones informadas basadas en ellos. Originalmente, esta agencia era el repositorio de datos del gobierno estadounidense en el ámbito de la investigación científica. Hoy en día, el sitio alberga millones de publicaciones sobre una gran variedad de temas. Su información histórica por sí sola lo convierte en una fuente de datos muy valiosa para periodistas y editores.
309. Certificado de Datos Abiertos
El sitio web del ODI (Instituto de Datos Abiertos) alberga el Certificado de Datos Abiertos, una herramienta gratuita disponible en línea, desarrollada con el propósito expreso de examinar críticamente y reconocer la calidad de los datos abiertos. Desde la perspectiva de un editor o periodista, el sitio también alberga numerosos conjuntos de datos sobre temas que abarcan desde listas de subvenciones hasta alertas de alergias, además de listas descargables en formato CSV.
310. Archivo de GitHub
GitHub es, sin duda, uno de los repositorios y archivos de datos más populares y conocidos de internet gracias a su facilidad de colaboración, sus capacidades de archivo y su accesibilidad para la programación. Ya sea para crear bots que realicen ciertas tareas o para desarrollar aplicaciones, GitHub es un sitio donde editores de contenido y periodistas pueden encontrar fácilmente productos con potencial de interés periodístico. Se puede acceder al archivo siguiendo las instrucciones del tutorial para JSON o Big Query.
311. Sociopatrones
SocioPatterns es un proyecto centrado en la búsqueda de patrones en la actividad humana y la dinámica social a través de datos. Como es de esperar con un objetivo tan amplio, la información del sitio se ha utilizado en publicaciones que abordan diversos temas, desde la propagación de enfermedades hasta estudios de caso sobre las diferencias entre las personalidades online y offline de las personas. Los conjuntos de datos están disponibles para su consulta, al igual que los artículos publicados, que contienen información que los editores probablemente encontrarán relevante en algún momento.
312. Mapa independiente
Indie Map es el resultado de recopilar información de más de 2000 de los sitios web más activos de IndieWeb y convertirla en formatos visuales interactivos, como una API de Social Graph, un conjunto de datos con funciones de consulta SQL y la información sin procesar obtenida de un total de 5,7 millones de páginas web. Los editores digitales interesados en el software de código abierto y en lo que estos datos podrían revelar sobre estas comunidades en línea pueden acceder a la información directamente desde el sitio web.
Simon Fraser continúa consolidando su prestigio como universidad con la disponibilidad de su conjunto de datos sobre "Estadísticas y Red Social de Videos de YouTube". Con información de un rastreador que utiliza la API de YouTube para encontrar videos, los archivos contienen datos sobre millones de videos y conjuntos de datos con información de usuarios. El sitio web especifica que las descargas de conjuntos de datos son solo para fines académicos, pero es posible encontrar fuentes periodísticas y referencias sobre este proyecto a través del sitio.
314. ACLED
ACLED, o Proyecto de Datos de Localización y Eventos de Conflictos Armados, ofrece datos públicos sobre las protestas y la violencia política en los países en desarrollo. La información que se proporciona incluye cifras de víctimas mortales, información sobre las fechas y lugares de los hechos de violencia o protesta, nombres de los grupos relevantes y datos sobre disturbios y enfrentamientos violentos ocurridos. ACLED proporciona acceso a informes periódicos, publicaciones y recursos visuales, así como a datos disponibles para su descarga en el sitio web.
315. Instituto Canadiense de Información Jurídica
El Instituto Canadiense de Información Jurídica, o CanLII como se le conoce popularmente, es un sitio que ofrece acceso gratuito a estatutos y sus reglamentos, jurisprudencia de tribunales de diversas jurisdicciones, como la Corte Suprema de Canadá, los tribunales provinciales y de apelación, y el Tribunal de la Reina, así como sentencias de diversos tribunales administrativos y organismos creados por ley. Con 301 bases de datos de jurisprudencia y más de 140.000 decisiones judiciales disponibles, los periodistas y editores digitales que cubren temas legales se beneficiarán de añadir este sitio a sus favoritos.
316. Centro para la Paz Sistémica
El Centro para la Paz Sistémica (CSP) es una organización dedicada al análisis de sistemas globales para abordar la violencia política. En este sitio, los periodistas que investigan en este ámbito tendrán acceso a análisis sobre conflictos en África, tendencias de conflictos a nivel global, entre otros temas, así como resúmenes de las tres publicaciones principales de la organización: Third World War y el Informe Global y la Biblioteca Virtual del CSP.
317. Proyecto Correlatos de la Guerra
El proyecto Correlatos de la Guerra (COW) se centra en facilitar la recopilación y distribución de datos cuantitativos, como en el ámbito de las relaciones internacionales. Fiel a su compromiso de aplicar principios científicos a los datos de relaciones internacionales, COW pone sus bases de datos a disposición del público. Estas bases de datos contienen información que periodistas e investigadores pueden utilizar, como por ejemplo, sobre conflictos militarizados entre estados, miembros del sistema estatal, capacidades materiales nacionales y alianzas formales.
La Encuesta Social Europea, o ESS, es una encuesta que se realiza en toda Europa con el objetivo de medir los diversos patrones de comportamiento, actitudes y creencias de diferentes poblaciones en diversos países. Dado que los periodistas suelen estar interesados en conocer la opinión pública, la Serie de Noticias Principales de la ESS, que abarca temas que abarcan desde el bienestar personal y social de los europeos, las actitudes hacia el bienestar social e incluso la presencia de discriminación por edad en el Reino Unido, puede enriquecer una noticia de diversas maneras.
319. Fondo para la Paz
El Fondo para la Paz es una organización que se centra en la prevención de conflictos y se centra en la seguridad mediante el desarrollo de herramientas para mitigarlos. A lo largo de su trayectoria, el FFP ha colaborado con periodistas, ONG, organizaciones locales y sus homólogos internacionales, así como con gobiernos. Tanto si buscan tendencias, análisis comparativos y datos globales, periodistas y editores pueden encontrar el material que buscan a través de la herramienta de exploración de datos integrada en el sitio web.
320. La Encuesta Social General
El trabajo de la Encuesta Social General (GSS) se centra en recopilar información sobre diversos aspectos de la sociedad estadounidense moderna para mantenerse al día con las tendencias y patrones de actitud y comportamiento de la población. Con esta práctica de seguimiento de tendencias que se remonta a 1972, los datos históricos por sí solos constituyen una mina de oro para los periodistas que desean explorar las tendencias. Con el Explorador de Datos de la GSS, investigadores y periodistas pueden descargar, examinar e incluso evaluar datos.
321. Gesis
GESIS es un instituto alemán de infraestructura dedicado a las ciencias sociales. Ofrece diversas disciplinas, además de trabajos de investigación y servicios que abarcan desde metodología de encuestas hasta informática aplicada, recopilación de datos, planificación de estudios y análisis de datos, entre otros. Los periodistas interesados en temas como el enfoque metodológico de GESIS, la utilización de inmigrantes sobrecualificados y otros, pueden encontrar amplia información en la sección de publicaciones.
322. Futuros religiosos globales
Desde temas como el aborto hasta la educación sexual, la religión está tan presente que, incluso en países mayoritariamente laicos, la postura de una persona sobre temas sociales complejos puede verse influenciada por sus creencias. En Global Religious Futures, el Pew Research Center examina las tendencias en las actitudes y creencias de las personas en relación con las religiones globales. Los periodistas que deseen analizar detalles como la influencia del evangelicalismo en la política o las actitudes hacia la lapidación pueden usar el Explorador de Datos para encontrar respuestas en las cifras.
323. Índice de Gestión de Riesgos
El Índice de Gestión de Riesgos, también conocido como INFORM, es un recurso al que investigadores y periodistas pueden acceder para realizar evaluaciones de riesgos en situaciones de riesgo de crisis humanitaria o desastre. La organización ofrece enlaces a datos sobre temas como las tasas de mortalidad infantil, el índice de desigualdad de género y la frecuencia de sequías, entre otras cifras. También es posible ver y descargar los datos de INFORM o acceder a ellos a través del mapa interactivo del sitio.
324. INED
El INED, o Instituto Francés de Estudios Demográficos, es una de las fuentes de datos y estadísticas más prolíficas que un periodista puede encontrar en internet. Con más de 70 publicaciones que se investigan y publican cada año para representar la población mundial en formato gráfico, así como estadísticas que miden cuestiones como la diferencia de fertilidad entre los sexos, junto con métodos de noticias y recursos. Los investigadores que buscan hallazgos precisos de una fuente confiable los encontrarán en el INED.
325. Archivo de Redes Internacionales
El Archivo de Redes Internacionales de Princeton ofrece una combinación única de publicaciones, con investigaciones como el Informe sobre Desarrollo Humano 1999 y Redes Globales: Revista de Asuntos Transnacionales, disponibles para su consulta en este sitio. En este sitio, los periodistas podrán examinar minuciosamente la completa información histórica pública y actualizada del archivo. Los temas que se abordan aquí incluyen salud, armas, libros, música, migración, regiones, internet, política y transporte, y son solo una muestra del material que los investigadores pueden consultar.
326. Programa Internacional de Encuestas Sociales
Fundado desde sus inicios como un medio de colaboración entre personas de diferentes naciones, el Programa Internacional de Encuestas Sociales (ISSP) ha realizado encuestas anualmente sobre diversos temas relevantes en el ámbito de las ciencias sociales. A lo largo de los años, los temas han incluido la desigualdad social, la identidad nacional, la ciudadanía, las redes sociales y la orientación laboral, entre otros. Los resultados del ISSP pueden buscarse por año o por tema y descargarse en el sitio web.
327. Asociaciones de Estudios Internacionales
Para periodistas u otros investigadores que buscan un debate informativo e intelectual sobre temas relacionados con asuntos transnacionales, internacionales y globales, la Asociación de Estudios Internacionales (ISA) reúne la experiencia de investigadores, académicos y expertos en políticas, entre otros. La Enciclopedia de Estudios Internacionales de la ISA incluye ensayos revisados por pares que profundizan en la investigación en este campo, así como ensayos que ofrecen información desde una perspectiva más histórica.
328. Datos transnacionales en la Web
La página increíblemente útil del profesor James W. McGuire de la Universidad Wesleyana, apropiadamente titulada Datos Transnacionales en la Web, es una página de recursos repleta de enlaces a datos relevantes sobre desarrollo económico y global. Entre los conjuntos de datos que los periodistas interesados podrán descubrir aquí, se encuentran datos sobre planificación familiar, logros educativos, desnutrición, agua y saneamiento, orientación al libre mercado e información específica sobre América Latina y el Caribe, por nombrar solo algunos. Las fuentes de datos que se listan aquí son impecables.
329. Centro Noruego de Datos de Investigación
El Centro Noruego de Datos de Investigación es una institución que apoya y asiste a investigadores en diversas áreas de la investigación empírica, como la privacidad, la recopilación y el análisis de datos, la evaluación metodológica y la ética en la investigación. Aquí, los investigadores encontrarán software y herramientas desarrollados y recomendados por el centro para complementar una extensa colección de datos regionales, individuales e institucionales, de acceso gratuito. Las conclusiones del centro, recogidas en el Informe Anual de Investigación y Privacidad, también son una lectura siempre interesante.
330. IPUMS
IPUMS no es necesariamente una fuente de datos en el sentido que la mayoría de la gente esperaría al oír el término, pero sí es una fuente útil para periodistas gracias a su función de agregador, archivador y organizador de los datos que le proporcionan otras entidades. Por ejemplo, IPUMS USA funciona como una especie de repositorio de microdatos del censo estadounidense, con datos que se remontan a 1790 y llegan hasta la actualidad.
331. ND-GAIN
El Índice de País ND-GAIN, una iniciativa organizada por la Iniciativa de Adaptación Global de la Universidad de Notre Dame, mide la resiliencia de un país al cambio climático y a otras fuerzas de la globalización. Este índice incluye puntuaciones de vulnerabilidad en áreas como alimentación, salud, infraestructura y ecosistemas, así como puntuaciones de preparación para hasta 500.000 puntos de datos. Esta información, que contiene dos décadas de datos desde 1995 hasta 2014 en formato CSV, está disponible para su descarga.
En este sitio, periodistas y editores pueden acceder a datos abiertos sobre el estado de la policía y la delincuencia en el Reino Unido. Los datos contienen estadísticas útiles sobre equipos de barrio, cuerpos policiales individuales, cifras de detenciones y registros, así como estadísticas sobre delincuencia y resultados. A través de este sitio, los periodistas pueden realizar comparaciones entre cuerpos policiales e identificar tendencias en la justicia penal. Obtener información es tan sencillo como seleccionar el rango de fechas, el cuerpo policial y esperar el archivo.
333. Página de datos internacionales generales de Paul Hensel
La Página General de Datos Internacionales de Paul Hensel es una serie de enlaces agrupados bajo los encabezados Estados y el Sistema Internacional, Datos Geográficos Internacionales, Capacidades Estatales, Colecciones de Datos de Ciencias Sociales, y Alianzas, Tratados y Organizaciones. Cada recurso de esta página web contiene datos de vanguardia que automáticamente darán credibilidad al trabajo periodístico. Estas fuentes pueden incluir desde software hasta conjuntos de datos y archivos, pero todos los enlaces incluidos son útiles.
334. TRAC
En el mundo posterior al 11-S, el terrorismo y sus devastadores efectos en las poblaciones locales han recibido mucha atención mediática. TRAC, en trackingterrorism.org, ofrece a los investigadores análisis e información exhaustivos sobre estos temas. Este sitio contiene información sobre miles de grupos terroristas diferentes. El precio de $500 para un solo usuario puede resultar un poco elevado al principio, pero vale la pena para quienes escriben sobre la violencia y la guerra contra el terrorismo.
335. Departamento de Justicia Penal de Texas
¿Le interesa el funcionamiento interno del sistema de justicia penal de Texas? ¿Le interesa saber quiénes se encuentran actualmente en el corredor de la muerte? El Departamento de Justicia Penal del Estado de Texas cuenta con abundante información, desde las últimas declaraciones de los presos antes de su ejecución, estadísticas de los condenados a muerte por género y raza, hasta estadísticas y hojas informativas sobre ejecuciones. El Departamento de Justicia Penal de Texas es una fuente de información sumamente confiable para los periodistas.
336. Sistema Integrado de Organizaciones de la Sociedad Civil
El Sistema Integrado de Organizaciones de la Sociedad Civil (iCSO) está diseñado para facilitar la comunicación de las organizaciones de la sociedad civil con el Departamento de Asuntos Económicos y Sociales. Además de la eficacia de este sólido marco, la página web incluye conjuntos de datos y categorías para obtener más información. Los datos se pueden ordenar por sector, tipo de organización, región y estatus de la organización en el ECOSOC. Esta es una fuente de datos que los periodistas pueden utilizar sin duda para encontrar fuentes.
337. Universidades en todo el mundo
Universities Worldwide es una base de datos de universidades de todo el mundo donde se puede buscar más información. La búsqueda puede realizarse por lista mundial o filtrarse exclusivamente por universidades de Estados Unidos, y los usuarios también pueden añadir sus propios enlaces. Los editores de datos con un número considerable de estudiantes, o incluso los periodistas que buscan verificar un hecho, pueden beneficiarse del acceso a una base de datos como esta cuando lo necesiten.
338. Programa de datos sobre conflictos de Uppsala
Este es el sitio web del Programa de Datos sobre Conflictos de Uppsala, uno de los proveedores de información más reconocidos sobre la violencia organizada. A lo largo de sus 40 años de existencia, el programa también se ha consolidado por su labor de recopilación de datos sobre la guerra civil. Los periodistas pueden utilizar esta fuente de datos para buscar información sobre conflictos específicos y sus actores, y también pueden acceder a ellos para descargarlos.
339. Pop mundial
El proyecto WorldPop, resultado de la fusión de los proyectos AsiaPop, AfriPop y AmeriPop, se dedica al archivo de conjuntos de datos demográficos espaciales que, a su vez, tienen aplicaciones para apoyar las labores de socorro en casos de desastre. Este proyecto podría ser de interés para editores de contenido y periodistas involucrados en causas de justicia social o que investigan oportunidades eficientes de socorro en casos de desastre. Los investigadores pueden descargar los datos o consultar los estudios de caso en línea.
340. Borrador expreso
DraftExpress es quizás más conocido en internet por sus investigaciones, informes de exploración pre-draft, simulacros de draft y su meticuloso mantenimiento de la altura y medidas de los jugadores, que complementa sus datos históricos. Los prospectos mencionados en este sitio provienen de la NCAA, ligas de secundaria e incluso ligas internacionales. Los periodistas deportivos o proveedores de contenido que deseen ofrecer comentarios sobre baloncesto pueden consultar las estadísticas de DraftExpress para analizar a los jugadores y eventos deportivos en tiempo real.
341. Betfair
Betfair es quizás mejor conocido como el sitio web de referencia para apuestas deportivas. Sin embargo, resulta de interés para los proveedores de contenido y editores digitales, en particular, la disponibilidad de información histórica detallada sobre los datos de precios y el historial del sitio. Los datos se pueden acceder y descargar con o sin la fecha y hora detalladas, y también ofrecen información exhaustiva sobre las carreras de caballos y otras ofertas de mercado del sitio desde junio de 2004 hasta octubre de 2017.
342. HOJA DE CRICS
Cricsheet ofrece un servicio similar al de otros centros de datos deportivos, pero es un sitio especializado exclusivamente en datos de críquet. Ofrece estadísticas y datos bola a bola de diversas ligas, como la Indian Premier League, partidos internacionales de un día y estadísticas de equipos masculinos y femeninos, por nombrar solo algunas de las categorías más importantes. Los editores de contenido que buscan datos históricos de críquet pueden descargarlos en formato CSV o XML.
343. Datos de series temporales transnacionales
Con datos sobre conflictos políticos, económicos, legislativos y nacionales que abarcan más de 200 años de datos en más de 200 países, el Archivo de Datos de Series Temporales Transnacionales es uno de los conjuntos de datos más completos de internet. Los datos se almacenan, para mayor comodidad, en una hoja de Google Drive que se abre automáticamente al hacer clic en la categoría del archivo. A cambio de una cita, esta información puede consultarse parcial o totalmente, según las necesidades del investigador.
344. Ford GoBike
Ford GoBike es el nombre del programa de bicicletas compartidas que se utiliza en el Área de la Bahía. Si bien muchas personas, sin duda, lo utilizan para mantenerse en forma y evitar el consumo de combustibles fósiles, el sistema de bicicletas compartidas ha estado registrando los datos de los viajes. Por supuesto, esta información no incluye información que permita identificar a los usuarios, pero sí incluye detalles como el número de bicicleta, la hora de inicio y fin, el tipo de usuario y las estaciones de llegada y salida. Vale la pena explorarlo.
345. Tráfico marítimo
Marine Traffic es una empresa que rastrea y monitoriza los movimientos de embarcaciones y viajes oceánicos mediante big data. El tipo de información que se analiza a través de los servicios API AIS de Marine Traffic incluye embarcaciones, información sobre las travesías y datos sobre las embarcaciones en cuestión, como llegadas previstas, incluso incidentes, fotos, detalles de la embarcación y pronósticos de viaje. Sin embargo, este sitio ofrece planes de precios, por lo que no está claro cuánta investigación se puede realizar de forma gratuita.
346. Bixi
Los programas de bicicletas compartidas de Bixi son quizás algunos de los más conocidos en algunas de las ciudades más grandes de Norteamérica. Curiosamente, la marca también publica datos abiertos que proporcionan información sobre aspectos como el historial de viajes y el estado de las estaciones, así como comparaciones entre miembros y usuarios ocasionales. Los periodistas locales que investigan cómo las personas utilizan e integran los programas de bicicletas compartidas en sus vidas tienen todas las razones para consultar estos datos.
347. Base de datos de accidentes
Desde Amelia Earhart hasta el vuelo 8501 de AirAsia en Indonesia, los accidentes aéreos son un tema que atrae la atención del público. La Base de Datos de Accidentes archiva y almacena información sobre accidentes de aviación ocurridos entre 1920 y 2017. Los accidentes contabilizados en esta base de datos incluyen accidentes de dirigibles civiles y militares, accidentes con la muerte de celebridades o personas famosas, accidentes de helicópteros con 10 o más fallecidos, y vuelos de pasajeros, tanto regulares como no regulares, con resultado de muerte.
Transport for London es el organismo gubernamental responsable de supervisar el transporte público en el área metropolitana de Londres. En su sitio web encontrará mapas del metro y el tren, junto con una guía para planificar sus viajes. Además de todos estos servicios prácticos, el sitio también alberga una gran cantidad de datos abiertos, como información sobre ciclismo, calidad del aire, la bañera e incluso la ostra. Cualquier persona interesada en ver cómo utilizan el transporte público los residentes del Gran Londres puede beneficiarse del acceso a estos datos.
349. CMAP
El CMAP es responsable de la planificación y organización regional en los condados de DuPage, Lake, McHenry, Kendall, Kane, Cook y Will en Illinois. Como se puede ver en su sitio web, las responsabilidades del CMAP abarcan temas como el desarrollo comunitario, los impuestos y los indicadores económicos, e incluso las carreteras y el transporte público. Por ello, los datos abiertos sobre indicadores regionales y viajes son útiles para los periodistas que buscan comprender el panorama general del futuro de la región.
350. Marco de análisis de carga
Creado gracias a la colaboración entre la Oficina de Estadísticas de Transporte y la Administración Federal de Carreteras, el Marco de Análisis de Carga recopila datos que se utilizan para evaluar el estado general y el rendimiento del sistema de transporte de mercancías. Este software recopila información sobre detalles como el tipo de mercancía y el tonelaje, en comparación con las estaciones de salida y llegada. Estos datos se han puesto a disposición del público para su acceso y descarga, ya sea en su totalidad o en formato resumido.
351. Ciencia de Mozilla
Mozilla Science es un software colaborativo de código abierto y práctica abierta que facilita el desarrollo y la distribución de diferentes fuentes de datos y resultados de investigación. Dejando a un lado los intereses de transparencia, la decisión de abrir programas y realizar un proceso de refinamiento colaborativo facilita la mejora de los programas ya existentes. Con proyectos disponibles en diversos campos, como las ciencias de la vida y la medicina, entre otros, existen soluciones de software que pueden representar un avance notable en este campo.
352. Conjuntos de datos interesantes
El atractivo de Cool Datasets se aprecia fácilmente en el nombre del sitio. En esta página, los conjuntos de datos se dividen en seis categorías generales: gobierno, entretenimiento, ciencia, contribuciones de usuarios, miscelánea y aprendizaje automático. Los periodistas que deseen explorar los datos y extraer información valiosa se beneficiarán al máximo de lo que ofrece este sitio web. Existe la opción de explorar los conjuntos de datos y, si es posible, también de contribuir con ellos.
353. Monitor de datos abiertos
OpenDataMonitor es una plataforma que presenta conjuntos de datos públicos de forma intuitiva y sencilla. Los investigadores pueden acceder a la plataforma para ver un resumen de las capacidades de los recursos de datos abiertos y ver los datos existentes presentados de forma visualmente más atractiva. El sitio explica su metodología y sus puntos de referencia, y los editores no tendrán problemas para encontrar datos que merezcan la pena publicar.
354. CrunchBase
CrunchBase es quizás mejor conocido por su énfasis en la estadística y su compromiso de brindar a sus lectores acceso a la mejor información disponible. Personas con visión empresarial visitan este sitio a diario para conocer las últimas tendencias en inversión e industria. Aquí, periodistas y editores encontrarán noticias y debates actualizados sobre las últimas tendencias empresariales. Además, como parte de su opción de pago, el sitio también alberga amplios conjuntos de datos que pueden analizarse con las herramientas de software de CrunchBase.
355. Índice
Index es una plataforma con una propuesta de venta única, ya que ofrece algo para todos, desde startups hasta inversores, analistas y corporaciones. El sitio también alberga información sobre más de 100.000 empresas del sector tecnológico, a la vez que ofrece a los usuarios la posibilidad de ordenar, crear y exportar hojas de cálculo. Editores y periodistas que buscan titulares en busca de posibles ángulos de información pueden anticiparse a las noticias empresariales a través de este sitio. Index puede ser inusual, pero sin duda es un recurso útil.
356. SEMRUSH
SEMrush se enorgullece de ser una de las herramientas de inteligencia de búsqueda más consolidadas disponibles para los profesionales del marketing online. Entre la academia y los seminarios web, los investigadores tienen la oportunidad de aprender los fundamentos. Sin embargo, las secciones de blog y noticias contienen suficiente información para que editores y periodistas puedan mantenerse al día de las últimas novedades en publicidad online y SEO. Los servicios de SEMrush tienen un coste, pero ofrecen mucha información de calidad gratuita.
357. Ahrefs
Ahrefs se resume quizás mejor como un conjunto de herramientas de marketing potencialmente útiles para cualquiera que publique contenido en línea. El sitio ofrece una combinación de servicios como investigación de contenido, monitorización web, investigación de palabras clave e investigación de backlinks para ayudar a los usuarios a analizar el éxito de la competencia. Probablemente más útil para los editores en línea en general, el blog de Ahrefs por sí solo representa un excelente valor para quienes prefieren un marketing basado en datos.
358. Lista de ángeles
AngelList, con su nombre inteligentemente elegido, es básicamente una combinación de Craigslist y LinkedIn, con su énfasis en reunir a inversores, personas que buscan empleo y startups en un solo lugar. Además de este interesante concepto de sitio, existen numerosas oportunidades para que los periodistas emprendedores descubran las startups más prometedoras y las últimas tendencias de inversión antes de que se generalicen. Con su interfaz sencilla y su marcada orientación empresarial, este sitio es útil para profesionales en múltiples sentidos.
359. Adquirido
En prácticamente todos los sectores, una adquisición empresarial puede cambiar toda una industria prácticamente de la noche a la mañana. Acquired es un sitio web que se encarga de mantener al público informado sobre las adquisiciones en el sector tecnológico. Con una gran cantidad de estadísticas que se pueden consultar en el sitio y la posibilidad de filtrar búsquedas, los periodistas que escriben sobre tecnología se beneficiarán al máximo al incluir Acquired en su navegación web diaria.
360. Mattermark
Mattermark es un servicio de pago que facilita la vida a los responsables de la toma de decisiones empresariales, generando listas de clientes de calidad que tienen en cuenta tanto a las empresas como a sus empleados clave. Al ofrecer perfiles completos de empresa, flexibilidad con su API e incluso funciones de exportación para realizar actualizaciones, Mattermark lo tiene todo. Las empresas que desean optimizar su alcance y, al mismo tiempo, monitorizar los resultados de sus campañas, se beneficiarán enormemente al registrarse.
361. Startups de tecnología financiera
FintechStartupsCo funciona como un agregador que registra la recaudación de diferentes empresas en sus OPI. Con un diseño minimalista que alterna entre las pestañas de "startups" y "noticias", esta es una forma rápida y sencilla para que los periodistas se mantengan al tanto de las últimas noticias sobre recaudación de fondos. Por otro lado, los editores que buscan contenido e historias rápidas también se beneficiarán de revisar la oferta de este sitio.
362. Datafox
Por si el nombre no lo delata, DataFox es una empresa que se esfuerza por brindar a sus clientes empresariales la información que necesitan para optimizar sus CRM y, en general, tomar decisiones basadas en datos. Con servicios que incluyen inteligencia empresarial y de conferencias, API y señales empresariales, esta empresa es, en efecto, una solución integral para las empresas que están renovando sus estrategias de ventas y difusión. Los editores digitales y proveedores de contenido también podrían interesarles.
363. Envío abierto
OpenSpending es una plataforma gratuita, accesible prácticamente desde cualquier lugar del mundo, que permite a los usuarios buscar y examinar datos financieros de dominio público. Para quienes no son hackers, esta es una potente herramienta de visualización y análisis. Los periodistas, en particular, pueden usar OpenSpending para encontrar nuevas perspectivas interesantes y explorar nuevos ángulos de la historia, como sugiere la empresa directamente en su sitio web. Además, los periodistas se encuentran entre las profesiones solicitadas específicamente en el foro.
364. API de deportes de ESPN
No contento con ser el canal deportivo más popular de la televisión por cable, ESPN está expandiendo su influencia en la programación y las API. En el Centro de Desarrolladores, el sitio ofrece a los editores una selección de varias API que incluyen notas de investigación, clasificaciones de poder, selecciones del draft, calendarios y titulares. Incluso hay una API que carga perfiles de atletas, biografías y estadísticas de todos los deportes principales. Los periodistas que se preparan para escribir una historia con contenido deportivo se beneficiarán al explorarlas.
365. Referencia deportiva
Para los amantes de los deportes que buscan estadísticas y recursos avanzados en un solo lugar, Sports Reference es uno de los mejores sitios web. Con datos históricos que incluyen estadísticas de equipos y jugadores, tanto ofensivas como defensivas, los investigadores deportivos pueden explorar este sitio con la amplitud o la precisión que deseen. Además, incluye cifras de prácticamente todos los deportes principales, desde baloncesto hasta béisbol, y datos separados para diferentes deportes universitarios.
366. Conjunto de datos de un millón de canciones
La acertadamente llamada "Colección de un Millón de Canciones" abarca 28 conjuntos de datos con metadatos e información sobre las características de audio de exactamente un millón de canciones. Fruto, en gran medida, del trabajo de LabROSA de la Universidad de Columbia junto con Echo Nest, esta información es accesible y está alojada en el sistema AWS de Amazon. Los usuarios pueden realizar búsquedas a través de Infochimps, lo que la hace aún más accesible tanto para periodistas que buscan información desconocida como para editores de contenido.






