Existem muitos tipos diferentes de sites que fornecem uma grande quantidade de dados gratuitos, freemium e pagos que podem ajudar desenvolvedores de público e jornalistas em seus esforços de reportagem e narrativa. A equipe do State of Digital Publishing gostaria de reconhecer esses sites, com base em pesquisas manuais e no feedback de nosso público.
1. Kaggle O Kaggle é um site que permite aos usuários descobrir o aprendizado de máquina enquanto escrevem e compartilham código baseado em nuvem. Apoiando-se principalmente no entusiasmo de sua grande comunidade, o site promove competições de conjuntos de dados com prêmios em dinheiro e, como resultado, possui uma enorme quantidade de dados compilados. Seja você esteja procurando por dados históricos da Bolsa de Valores de Nova York, uma visão geral das tendências de produção de doces nos EUA ou código de ponta, este site está repleto de informações. 2. Wikipédia É impossível navegar muito tempo na internet sem se deparar com um artigo da Wikipédia. Com artigos que vão desde biografias históricas totalmente referenciadas e com fontes completas até cronogramas do futuro próximo e distante, podemos afirmar com segurança que a Wikipédia consolidou seu status como uma enciclopédia gratuita online. Entre o verbete que serve como uma visão geral do assunto e os inúmeros livros e referências online que o site oferece, a Wikipédia é, em muitos aspectos, a melhor amiga de um escritor. 3. Rastejo comum Como o próprio nome do site sugere, o Common Crawl pesquisa ou "rastreia" a web em busca de dados, que são então armazenados e organizados em um repositório aberto acessível aos usuários. Dois exemplos das possibilidades oferecidas por este site são os marcadores virtuais de patentes e as listas abrangentes de sites que disponibilizam feeds RSS, que demonstram o poder desta aplicação. Se você precisa comparar dados ou sites, esta é uma ferramenta acessível para criar conteúdo original. 4. EDRM EDRM, abreviação de Electronic Discovery Reference Model (Modelo de Referência de Descoberta Eletrônica), é um site para profissionais da área jurídica dedicado a explorar o potencial da descoberta eletrônica e as regras e expectativas que regem a governança da informação. Além disso, os membros do EDRM trabalham em conjunto para desenvolver padrões colaborativos, softwares e ferramentas educacionais que visam promover os objetivos da comunidade. Para obter informações sobre como a tecnologia pode mudar e já vem mudando os aspectos processuais e administrativos da prática jurídica, este é o site que você deve visitar. 5. Mahout O Mahout se concentra em um software de mesmo nome que busca solucionar a logística de construção de um ambiente capaz de criar aplicações de aprendizado de máquina de alto desempenho, escaláveis e de rápida implementação. Para pesquisadores que desejam compilar e manipular seus próprios conjuntos de dados ou experimentar aplicações de aprendizado de máquina, este software é especialmente útil. Este site ajudará os usuários a se tornarem proficientes no uso deste software. 6O Projeto Lêmure O Lemur Project é um banco de dados que se concentra em apoiar pesquisas sobre recuperação de informações e processamento de tecnologias da linguagem humana. Com cerca de 1 bilhão de páginas web e 10 idiomas coletados entre janeiro e fevereiro de 2009, a enorme quantidade de material disponível e o suporte oferecido o tornam um excelente recurso para pesquisadores. Considerando tudo isso e o suporte adicional encontrado no site, qualquer pessoa interessada em tecnologia e linguagens humanas encontrará muito material para trabalhar nesta plataforma. 7Projeto Gutenberg O Projeto Gutenberg é um diretório que apresenta romances, artigos e outras obras em domínio público. A coleção de mais de 54.000 livros digitais do site abrange desde obras consagradas de autores como Shakespeare, Mark Twain e Jane Austen até trabalhos menos conhecidos de nomes mais obscuros como Henri Bergson e Samuel Butler. Seja para ler um clássico por puro prazer literário ou para pesquisar sobre como as pessoas vivenciavam a vida no século XIX, o Projeto Gutenberg é um excelente recurso. 8Conjunto de dados de um milhão de músicas Este site abriga um conjunto de dados completo contendo as características de áudio e metadados de aproximadamente 1 milhão de músicas populares. Além do conjunto de dados principal com um milhão de músicas, também existem diversos outros conjuntos de dados contribuídos pela comunidade em categorias relacionadas, como covers, gêneros musicais e letras, entre outros. Historiadores da música, entusiastas ou pesquisadores que desejam essas informações poderão filtrar os dados com relativa facilidade. Este pode muito bem ser o conjunto de dados mais abrangente sobre o assunto em toda a internet. 9. Amazon Todo mundo conhece a Amazon como uma varejista digital, mas você sabia que a Amazon também hospeda conjuntos de dados públicos gratuitos, acessíveis a qualquer pessoa sem precisar armazenar ou baixar nada em seus próprios dispositivos? Com dados que abrangem desde informações meteorológicas, ambientais e espaciais até imagens focadas no desenvolvimento de algoritmos que auxiliam na visão computacional, não faltam opções para quem busca uma maneira mais prática de analisar grandes volumes de dados. 10. Governo Aberto do Canadá Com o objetivo de promover maior transparência, incentivar a participação cidadã e estimular o diálogo, o Governo do Canadá disponibiliza uma vasta gama de dados como parte da sua iniciativa de Governo Aberto. Neste site, você encontra conjuntos de dados sobre questões governamentais, como a capacidade dos abrigos para pessoas em situação de rua no Canadá, bem como números regionais sobre os níveis de participação de anglófonos e francófonos no setor público. Com acesso a dados dessa natureza, não há necessidade de depender de estatísticas de terceiros para obter informações. 11. Catálogos de dados O Data Catalogs, agora Data Portals, oferece aos usuários um site prático para navegar por portais de dados abertos do mundo todo. Com os portais sendo avaliados e organizados por diversos níveis de governo, várias ONGs e até mesmo o Banco Mundial, os dados disponíveis para análise são de altíssima qualidade. Os usuários podem optar por navegar ou contribuir com dados dos portais. Do ponto de vista da pesquisa, a variedade de assuntos e informações torna este site um ponto de partida especialmente conveniente para a busca de informações. 12. Data.gov.uk O Data.gov.uk é um site que permite aos indivíduos encontrar e acessar dados publicados por diversos órgãos públicos, departamentos governamentais, autoridades locais e agências governamentais. Nele, pesquisadores podem encontrar informações sobre o cenário econômico para pequenas empresas, comércio, importações, indústria e exportações, ou até mesmo pesquisar pagamentos acima de £ 25.000 feitos por departamentos governamentais. Como o site declara explicitamente que os dados podem ser usados para pesquisa, as informações ali contidas podem gerar novas ideias à medida que os pesquisadores as exploram. 13. Data.gov Este site é onde o governo dos EUA disponibiliza dados abertos ao público, na forma de conjuntos de dados. Além dos dados brutos, o site também oferece diversas ferramentas que podem ser usadas para criar visualizações de dados e desenvolver aplicativos para a web e dispositivos móveis. Não se engane: o volume de dados é imenso, com informações que vão desde reclamações de cartões de crédito até dados do programa federal de empréstimos estudantis, em mais de 197.000 conjuntos de dados. Este site oferece inúmeras oportunidades para inovação e análises abrangentes. 14. DataSF O DataSF oferece centenas de conjuntos de dados relacionados à cidade e ao condado de São Francisco. Tem interesse em saber o que os lobistas locais e regionais têm defendido? Precisa de estatísticas sobre criminalidade? Navegue pela aba "Vitrine" para ver o que as pessoas conseguiram realizar com os dados ou use o formulário para contribuir. Criado com dados abertos e oferecendo uma academia, um blog e diversas outras ferramentas, este site é impulsionado em grande parte pela colaboração e pela comunidade. Isso o torna um recurso valioso para pesquisadores. 15. DataFerrett O DataFerrett se diferencia de muitos outros sites por não ser um repositório ou diretório, mas sim uma ferramenta que permite aos usuários personalizar dados de fontes locais, estaduais e federais por meio de análise e extração de dados. Essa ferramenta permite criar planilhas personalizadas e abrangentes e, em seguida, transformar as mesmas informações em um mapa ou gráfico, sem a necessidade de baixar ou habilitar qualquer outro software. Organizar grandes volumes de dados e transformá-los em algo fácil de ler nunca foi tão simples. 16. Fórum Por meio da Universidade de Maryland, o Inforum disponibiliza dados econômicos dos EUA ao público. Muitas agências governamentais americanas contribuíram para este site, que agora contém milhares de "séries temporais econômicas", como são chamadas, contendo números sobre produção industrial, índices de preços, estatísticas trabalhistas e indicadores de negócios. Os dados são gratuitos e podem ser acessados tanto por laptops quanto por computadores de mesa. Pesquisadores que desejam analisar os dados econômicos brutos encontram no Inforum um recurso valioso. 17. Europeia Segundo os próprios dados do site, as coleções da Europeana totalizam mais de 50 milhões de registros. Utilizando os conjuntos de dados selecionados aqui disponíveis, os pesquisadores podem encontrar as informações que procuram em menos tempo. Os conjuntos de dados incluem categorias como modelos 3D, mapas italianos da Primeira Guerra Mundial e até mesmo uma coleção de mais de 20.000 fotos históricas de museus lituanos, entre outros. Seja para pesquisas históricas gerais ou como ponto de partida para explorar os vastos registros da Europeana, este é um excelente recurso. 18. O Guardião Além da cobertura ininterrupta de notícias e eventos de última hora, o Guardian também possui uma seção inteira dedicada a breves análises de dados. Os artigos variam de tópicos sérios, como a eficácia das políticas habitacionais no combate à falta de moradia, a assuntos um pouco mais descontraídos, como quais países têm o maior número de ganhadores do Prêmio Nobel. Jornalistas e pesquisadores encontram neste site uma vasta gama de informações para seus projetos. Com uma busca rápida, é possível encontrar dados sobre praticamente qualquer assunto. 19. Gene Expression Omnibus Hospedado pelo Centro Nacional de Informação sobre Biotecnologia (NCBI), o Gene Expression Omnibus (GEO) é um site que contém "dados públicos de genômica funcional" em conformidade com os padrões MIAME (Informação Mínima sobre um Experimento de Microarray). O site também aceita dados de microarrays ou sequenciamento, fornecendo as ferramentas necessárias para encontrar e baixar as informações. Aqueles interessados em estudar genomas ou obter informações sobre o assunto encontrarão aqui todos os dados de que precisam e muito mais. 20A Universidade de Chicago Reconhecido há muito tempo por suas contribuições para a inovação e o progresso nas ciências sociais, o Centro de Ciência de Dados Espaciais (CSDS) da Universidade de Chicago explora a próxima fronteira com sua incursão na análise e tecnologia espacial. O trabalho do CSDS tem aplicações em praticamente qualquer área que precise lidar com o espaço na abordagem de seus problemas. Consequentemente, campos como economia ambiental, saúde pública e criminologia têm se beneficiado dessas aplicações. A dedicação do CSDS ao software de código aberto e à distribuição de suas informações torna os dados que ele fornece ainda mais acessíveis. 21. Konect Por meio dos dados coletados pelo Instituto de Ciência e Tecnologias da Web da Universidade de Koblenz-Landau, o KONECT (Koblenz Network Collection) oferece pesquisas realizadas na área de ciência de redes e temas relacionados. O projeto utiliza um conjunto de ferramentas próprias de análise de redes para processar dados, gerar gráficos e apresentar algoritmos. O KONECT disponibiliza os resultados de suas análises diretamente em seu site. Com mais de 200 conjuntos de dados disponíveis, este é um recurso que vale a pena explorar. 22. MIdata O MIdata é um site que funciona como um repositório de dados destinados ao aprendizado de máquina. Esses conjuntos de dados podem variar desde uma compilação de expressões faciais humanas até tópicos mais científicos, como a previsão de ligações moleculares. Com entradas divididas em categorias que oferecem acesso a dados brutos, tutoriais na seção de materiais e métodos, além de tarefas e desafios de aprendizado, este site permite que pesquisadores explorem o repositório em busca de conjuntos de dados de seu interesse. 23NASDAQ A NASDAQ é uma bolsa de valores mundialmente famosa, há muito tempo uma excelente fonte de dados para jornalistas e pesquisadores do mundo das finanças e dos negócios. Aqui você encontrará informações sobre IPOs, dados históricos de preços e as últimas notícias financeiras, o que faz deste site um destino online essencial para dados financeiros. O NASDAQ Composite também oferece opções de dados pagos para aqueles que desejam realizar uma análise mais aprofundada. Trata-se de uma fonte de dados muito respeitada e consolidada. 24NASA Desde a chegada do homem à Lua, a NASA é hoje uma agência governamental bastante conhecida, conhecida por suas incursões no espaço sideral. O que interessa aos jornalistas, no entanto, é o fato de a NASA também ser uma valiosa fonte de dados por meio de seu Arquivo Coordenado de Dados de Ciências Espaciais. Nele, pesquisadores podem encontrar dados de missões espaciais em categorias como astrofísica, recursos de imagem e heliofísica, entre outras. Além disso, o site também disponibiliza diversos relatórios técnicos que acompanham os novos dados submetidos. 25Sócrates O Socrata é um site que reúne dados governamentais disponíveis e os formata de maneira que facilita a análise, a navegação e a busca de informações. Projetado especificamente para atender às necessidades de pessoas sem conhecimento técnico, como especialistas em políticas públicas, pesquisadores, empreendedores e cidadãos engajados, o Socrata utiliza a nuvem para compilar dados de diversas fontes. Para jornalistas que buscam compreender a eficácia de diferentes políticas, esta é uma plataforma muito útil. 26. Quandl O Quandle é um site que oferece principalmente dados econômicos e financeiros formatados para atender às necessidades de profissionais de investimento. Com base em mais de 500 fontes de informação de organizações confiáveis como CLS Group, ONU, bancos centrais e Zacks, entre outras, para agregar seus dados, essa plataforma é perfeita para pesquisadores e jornalistas que desejam obter uma visão geral rapidamente. Graças ao suplemento para Excel, o acesso direto aos dados nunca foi tão fácil para os usuários. 27. Universidade Carnegie Mellon A Universidade Carnegie Mellon tem uma reputação bem merecida como uma excelente instituição acadêmica. O que muitos desconhecem é que o StatLab da Carnegie Mellon é um recurso valioso para jornalistas em busca de dados. Este arquivo de dados inclui informações sobre temas como os salários dos jogadores norte-americanos da MLB em 1986, além de dados destinados à avaliação da precisão de softwares estatísticos. Em troca da devida menção à fonte, esses conjuntos de dados estão disponíveis para uso público. 28. UCI O Repositório de Aprendizado de Máquina da UC Irvine, conhecido como UCI, é um site que armazena uma grande quantidade de dados interessantes que jornalistas podem usar. Com 394 conjuntos de dados disponíveis até o momento desta publicação, o site tem a vantagem adicional de possuir uma interface de busca intuitiva. Alguns dos conjuntos de dados mais populares incluem informações sobre "Reconhecimento de Atividade Humana Usando Smartphones", vinhos e marketing bancário, entre outros assuntos. Em troca do uso de todos esses dados, o site solicita apenas a citação da fonte. 29. UCR Se você é um jornalista interessado no desenvolvimento de aprendizado de máquina, a página de Classificação/Agrupamento de Séries Temporais da UCR (Universidade de Cincinnati) é uma excelente leitura. O site oferece um documento informativo bastante útil, com todas as informações básicas necessárias. Além de uma visão geral do conteúdo, o site também permite o download direto dos dados. Lembre-se apenas de usar o formato de citação solicitado pelo site ao utilizar esses conjuntos de dados. 30. Censo dos EUA Precisa de estatísticas sobre a riqueza da população? Quer saber a distribuição exata por gênero em um campo específico? O censo dos EUA é um site que disponibiliza todos esses dados e muito mais para consulta pública. Filtre os dados por ano ou região e você encontrará rapidamente estatísticas que a maioria das pessoas nem sabia que eram consideradas no censo americano. Esses números estavam disponíveis em formato Excel e Microsoft Word, o que torna os dados ainda mais acessíveis para jornalistas. 31. Wolfram Alpha O Wolfram Alpha é, na verdade, um mecanismo computacional que permite aos usuários inserir os dados que desejam analisar e receber um cálculo. O mecanismo processa dados e análises estatísticas, química, datas e horários, e até mesmo palavras e linguística, entre outras coisas. Para usuários que buscam novas maneiras de lidar com dados, isso é especialmente útil devido à capacidade de gerar novos cálculos com o simples pressionar de um botão. Jornalistas, em particular, podem se beneficiar muito ao usar essa ferramenta como um recurso complementar. 32. Yelp Acontece que o Yelp é mais do que apenas restaurantes e avaliações de empresas feitas por usuários. Este site de avaliações colaborativas também mantém um banco de dados que permite aos pesquisadores acessar avaliações, dados de usuários e empresas para "fins pessoais, educacionais e acadêmicos". Segundo a própria empresa, são 4,7 milhões de avaliações e 156 mil empresas em 12 áreas metropolitanas incluídas no banco de dados. Com esses números, os materiais e tendências que os pesquisadores podem descobrir nesses dados podem ser uma grata surpresa. 33. Mundo dos Dados Quer uma lista de páginas do Facebook removidas? Que tal poder classificar dados econômicos dos EUA por condado? O Data World é um site que permite compartilhar, hospedar, colaborar e acompanhar dados. O site inclui até uma seção para jornalistas, explicando os motivos pelos quais o Data World é útil para a profissão, além de destacar os recursos de hospedagem, um simulador de pedidos de acesso à informação (FOIA) otimizado e páginas para auxiliar na organização. Resumindo, é uma excelente combinação de dados e hospedagem de dados. 34. O Livro de Fatos Mundiais Gerido e operado pela CIA, o World Factbook fornece informações sobre as estruturas sociais, história, situação militar e econômica de 267 países, juntamente com mapas, bandeiras e fusos horários, seguindo as informações contidas no mapa-múndi. O site oferece uma análise completa e aprofundada do assunto, indo além do básico. Em resumo, esta é uma fonte de dados que deveria estar no arsenal de todo jornalista. 35. Dados de saúde.gov Gerido pelo Departamento de Saúde e Serviços Humanos dos EUA, o HealthData.gov oferece ao público acesso a "dados de saúde de alto valor" na esperança de atrair a atenção de empreendedores, formuladores de políticas e pesquisadores. Pelo menos nas áreas de desenvolvimento de produtos e serviços, as pessoas têm conseguido examinar esses dados e obter resultados. Jornalistas que desejam estar na vanguarda dos dados de saúde ou que estejam verificando uma declaração divulgada por uma autoridade de saúde podem usar este site para encontrar respostas. 36. UNICEF Este site confere credibilidade instantânea aos jornalistas que utilizam as informações nele contidas. As estatísticas da UNICEF abrangem temas relacionados à saúde e aos direitos humanos, como educação, saúde materna, pobreza infantil, água e saneamento, e deficiência infantil, entre muitas outras categorias. É útil para pesquisadores por ser atualizado e respaldado por uma das organizações mais renomadas do planeta. Jornalistas não têm como errar ao citar esta fonte de dados. 37. Organização Mundial da Saúde A Organização Mundial da Saúde (OMS) é uma organização internacional que coleta estatísticas e informações sobre saúde em todo o mundo. Além das informações disponíveis diretamente na página inicial, o site também oferece dados por meio do Observatório Global de Saúde. Esses dados incluem informações sobre as medidas que os países estão tomando em direção à cobertura universal de saúde, pesquisa e desenvolvimento na área da saúde, entre outras categorias. Jornalistas encontrarão aqui muitas informações sobre surtos, emergências de saúde e cobertura de saúde sob uma perspectiva internacional. 38. Dados públicos do Google Com a disponibilidade dos Dados Públicos do Google, os jornalistas podem, sem dúvida, contar com o Google de diversas maneiras. O gigante das buscas disponibiliza dados públicos para análise, com mais de 100 conjuntos de dados públicos em seu catálogo. Os temas dos dados variam desde assuntos extremamente sérios, como os Indicadores de Desenvolvimento Mundial e os Indicadores de Desenvolvimento Humano, até curiosidades interessantes, como dados sobre as estradas mais perigosas da Europa. Tudo o que um pesquisador precisa fazer é realizar uma busca e verificar o que os Dados Públicos do Google oferecem. 39. Gap Minder O Gap Minder oferece dados sobre diversos indicadores locais e nacionais, juntamente com links e informações sobre todos os fornecedores de dados. Através deste site, pesquisadores podem encontrar informações como a idade em que as mulheres se casam pela primeira vez, estatísticas sobre consumo de álcool e causas de morte infantil. Para jornalistas que escrevem com uma perspectiva internacional ou que trabalham com dados comparativos, este é um excelente recurso. De qualquer forma, é uma fonte de dados útil. 40. Tendências do Google O Google Trends é uma ferramenta que oferece aos pesquisadores informações sobre o que as pessoas estão procurando neste exato momento. Os pesquisadores podem comparar os dados com as tendências passadas e também usar a ferramenta para fazer previsões, por exemplo, para a temporada de festas de fim de ano, a fim de entender como as buscas irão se comportar no futuro. O Google Trends oferece gráficos, tópicos em alta e diversas oportunidades para descobrir notícias antes mesmo de elas se tornarem oficiais. 41. Finanças do Google O Google Finance oferece uma maneira rápida e fácil de realizar uma pesquisa mais aprofundada sobre uma empresa que tem recebido muitos elogios dos investidores. Ele permite filtrar indicadores técnicos e conferir as últimas notícias sobre a empresa em uma única janela simples e intuitiva, que possibilita organizar as informações de forma ainda mais precisa. Além disso, é gratuito. Para jornalistas que desejam pesquisar as finanças de uma empresa de capital aberto, o Google Finance oferece uma interface intuitiva para acessar essas informações. Infelizmente, o Google descontinuou recentemente alguns recursos principais, como o portfólio financeiro. Aqui estão alguns exemplos alternativas ao Google Finance. 42. DBpedia Quem já desejou uma maneira mais fácil de realizar buscas na Wikipédia tem motivos para se animar com o DBpedia. Impulsionado pelo comprometimento da comunidade, este site busca possibilitar buscas mais sofisticadas no conteúdo da Wikipédia. Com a versão em inglês ostentando 4,58 milhões de verbetes com classificações e categorias associadas, o site está bem encaminhado para oferecer uma cobertura abrangente baseada nas informações da Wikipédia. Jornalistas não podem errar ao escolher esta fonte de dados. 43. Pesquisa Pew Para muitos, o Pew Research Center está no topo da lista quando se trata de pesquisas, relatórios e dados científicos. O site abrange tópicos que vão desde opiniões políticas a tendências sociais e desenvolvimentos em diversos setores. O Pew Research Center também possui uma função de busca que facilita o acesso à informação. Jornalistas que buscam estatísticas e resultados atualizados de uma fonte confiável e respeitável não se arrependerão de consultar o Pew Research Center. 44. Instituto Broad Para jornalistas que desejam descobrir as últimas notícias relacionadas ao câncer, os conjuntos de dados do Broad Institute podem ser a fonte ideal de informações. Isso inclui também informações sobre outros assuntos, como bioinformática e biologia computacional, além de câncer cerebral e descoberta de padrões moleculares. Em resumo, este site oferece aos jornalistas uma vantagem na busca por dados aprofundados sobre câncer para que possam produzir reportagens a partir das informações fornecidas pelo Broad Institute. 45. Dados da ONU O UNdata oferece informações sobre diversos países ao redor do mundo. Isso inclui dados como indicadores técnicos, sociais e econômicos para cada país em questão. Para jornalistas que trabalham em reportagens de interesse humano ou matérias que poderiam se beneficiar de estatísticas e dados adicionais para serem corroboradas, o UNdata é a escolha ideal. A precisão dos dados, bem como a reputação da ONU, fazem desta uma fonte de dados confiável para jornalistas em suas pesquisas. 46. Google Acadêmico Imagine se, em vez de navegar por sites, fosse possível fazer uma busca que retornasse apenas artigos revisados por pares e materiais acadêmicos. O Google Acadêmico permite que as pessoas encontrem artigos de periódicos, relatórios técnicos e publicações dos principais acadêmicos do mundo. Como de costume para esta empresa, o Google Acadêmico é extremamente intuitivo, bastando ao usuário inserir uma palavra-chave para começar a busca. Buscar artigos acadêmicos nunca foi tão fácil. 47. Reddit Conhecido popularmente como "a página inicial da internet", o Reddit é um dos sites mais populares da internet. Além de ser um indicador preciso do que está acontecendo online, o site também possui um subreddit, ou subfórum, dedicado a conjuntos de dados. Os usuários podem solicitar conjuntos de dados, publicar recursos e discutir sobre como trabalhar com dados em formatos como JSON. Pesquisadores se beneficiam muito ao consultar essa fonte de dados. 48. Mercado de dados O Qlik DataMarket permite coletar e manipular dados de fontes externas. Esta plataforma possibilita que os usuários utilizem diversos conjuntos de dados, com a opção de compará-los com os dados que já possuem, a fim de refinar sua compreensão do contexto geral. Melhor ainda, embora seja uma plataforma paga, dependendo do assunto, existe também uma opção gratuita no Qlik DataMarket. Jornalistas podem explorar os dados à vontade. 49. Hubspot A HubSpot sempre foi uma referência entre os principais nomes do marketing empresarial. Do ponto de vista da pesquisa, este site oferece aos pesquisadores informações completas sobre o que está acontecendo no setor, bem como os assuntos mais comentados no mercado em tempo real. Jornalistas também podem usar o site para se aprofundar nas tendências. Nesse sentido, a HubSpot é um excelente recurso para pesquisadores. 50. Departamento de Estatísticas da Justiça Talvez não seja surpresa que o Departamento de Justiça mantenha uma enorme quantidade de estatísticas. No site do Departamento, é possível encontrar números sobre prisões, mortes de detentos, execuções com pena de morte, estatísticas policiais e censos das prisões. O sistema de justiça criminal é um tema de constante fascínio tanto para o público quanto para as pessoas envolvidas nele. É por isso que as estatísticas do Departamento de Justiça são ainda mais úteis para jornalistas que pesquisam o sistema de justiça criminal. 51. Relatório Uniforme de Crimes O Relatório Uniforme de Crimes (UCR) é uma coletânea de estatísticas sobre crimes contra o patrimônio e crimes violentos, compilada pelo FBI. Embora as agências de aplicação da lei de todos os Estados Unidos venham relatando esses dados desde 1930, as informações publicadas datam de 1958 e podem ser consultadas no site. Jornalistas que desejam explorar os dados sobre crimes podem acessar e utilizar a ferramenta de dados do UCR para analisar as informações disponíveis neste site. 52. Relatório Uniforme de Crimes O Sistema Uniforme de Relatórios Criminais (UCR, na sigla em inglês) é resultado de um programa idealizado pela Associação Internacional de Chefes de Polícia em 1929. Os dados coletados pelo FBI são publicados quatro vezes ao ano. Além das informações fornecidas pelo programa UCR, o site também inclui relatórios sobre estatísticas de crimes de ódio, policiais mortos e agredidos (LEOKA, na sigla em inglês), bem como os resultados e números fornecidos pelo Sistema Nacional de Relatórios Baseados em Incidentes (NIBRS, na sigla em inglês). 53. NACJD O NACJD, ou Arquivo Nacional de Dados da Justiça Criminal, é um site que extrai informações de conjuntos de dados como os Relatórios Uniformes de Crimes (UCR) e a Pesquisa Nacional de Vitimização Criminal (NCVS), armazenando e distribuindo as estatísticas. Projetado para ser organizado, armazenado e mantido para máxima acessibilidade, os dados são apresentados em diversos formatos, incluindo experimentais, qualitativos e longitudinais. Em última análise, isso oferece a jornalistas e outros pesquisadores mais uma maneira de visualizar e acessar estatísticas da justiça criminal. 54. Primeiro banco de dados O First Databank é um site que lida com dados sobre medicamentos. O site busca promover uma tomada de decisão mais eficiente e baseada em dados na área farmacêutica. Isso permite que médicos e profissionais de saúde comecem a pensar sobre medicamentos de uma maneira diferente, por meio do uso inovador da tecnologia pelo First Databank. Do ponto de vista profissional, este site é especialmente útil devido à forma como seus dados podem ajudar as equipes a se adaptarem à medida que novas informações surgem. No mínimo, trata-se de um recurso valioso para jornalistas que escrevem sobre a área farmacêutica. 55. FDA A FDA, conhecida como Food and Drug Administration (Administração de Alimentos e Medicamentos), é a agência responsável por proteger a saúde pública por meio da supervisão e aprovação de medicamentos, alimentos, suplementos, vacinas e cosméticos, entre outros produtos de consumo. Como recurso, a FDA disponibiliza conjuntos de dados para consulta pública, além de fornecer dados técnicos para pessoas que se sentem à vontade para trabalhar com planilhas e analisar as informações provenientes desses conjuntos de dados. Este é, sem dúvida, um recurso útil para jornalistas. 56. Base de medicamentos Você já se perguntou exatamente quanto o país gasta em decorrência de uma epidemia de drogas? Há rumores de que as pessoas estão consumindo drogas de forma diferente de antes? O Drugbase oferece um banco de dados repleto de estatísticas sobre as tendências e o uso de drogas nos Estados Unidos. Há infográficos, bem como publicações sobre tópicos como a comorbidade entre dependência química e doenças mentais, ou dados sobre direção sob efeito de drogas (e não de álcool). Este recurso fornece informações suficientes para identificar tendências e fazer comparações com dados históricos. 57. UNODC O UNODC, ou Escritório das Nações Unidas sobre Drogas e Crime, possui um site dedicado a promover seu objetivo de ajudar os Estados-membros a adotarem padrões mais rigorosos de pesquisa, coleta de dados e perícia forense. Nesse site, pesquisadores podem encontrar diversas estatísticas e publicações que abrangem temas como coleta de dados, análise de tendências e programas de pesquisa, sempre que possível. Trata-se de um recurso repleto de informações sobre uma variedade de tópicos relacionados à perícia forense, bem como sobre a ciência por trás da área. 58. Fatos sobre a Guerra às Drogas O site Drug War Facts oferece uma análise abrangente da guerra contra as drogas e suas consequências. Inclui estatísticas e dados sobre detalhes como a comparação entre o custo do tratamento e o custo de recorrer à polícia, estimativas de gastos com o controle de drogas e uma infinidade de informações sobre praticamente todos os tópicos relacionados à guerra contra as drogas. Para muitas pessoas, este é o site mais completo da internet sobre o tema. 59. Centro Nacional de Estatísticas da Educação O Centro Nacional de Estatísticas da Educação, frequentemente abreviado como NCES, é a fonte ideal para todas as estatísticas relacionadas à educação. Este site apresenta estatísticas sobre o cenário de empréstimos estudantis, projeções de tendências educacionais, além de conjuntos de dados e ferramentas de comparação que podem ser usados para análises mais aprofundadas. Jornalistas podem usar este recurso para descobrir tendências, verificar declarações públicas, consultar as publicações do Centro Nacional de Estatísticas da Educação e encontrar novas histórias nos dados. 60. Banco Mundial O Banco Mundial disponibiliza inúmeras estatísticas e dados compilados pelo Grupo de Dados para o Desenvolvimento, tanto no setor financeiro quanto na macroeconomia. É possível filtrar os dados utilizando hashtags. Os usuários podem escolher entre uma variedade de indicadores e selecionar por país para analisar as diferentes medidas de progresso do desenvolvimento. Dessa forma, trata-se de um recurso que pode ser útil para qualquer pessoa interessada em analisar a situação financeira e/ou econômica dos países membros. 61. Departamento de Estatísticas do Trabalho O Departamento de Estatísticas do Trabalho (Bureau of Labor Statistics) é a principal fonte de dados e estatísticas para jornalistas, especialmente no que diz respeito às condições de trabalho atuais, à situação do mercado de trabalho e ao impacto das variações de preços na economia americana. Com o trabalho estatístico da agência remontando a 1884, há uma vasta quantidade de dados econômicos disponíveis para pesquisa. O site armazena as informações em uma interface amigável e atualiza constantemente os dados disponíveis para busca. Trata-se de uma fonte de dados que vale a pena explorar. 62. Os Números Os lançamentos de grande sucesso recebem muita atenção da mídia, mas é difícil avaliar o desempenho real de uma empresa sem números. É aí que entra o "The Numbers". Este site oferece pesquisas e dados para a indústria cinematográfica e de entretenimento. Pesquisadores podem explorar estimativas de receita, expectativas para lançamentos futuros e outros dados de investimento por meio do mecanismo de busca baseado em SQL da OpusData. O The Numbers é o primeiro lugar que os pesquisadores devem visitar para obter estatísticas confiáveis sobre filmes. É isso que o torna um excelente recurso. 63. Filme para sempre O Film Forever é um site que pesquisadores podem consultar para obter informações de mercado e dados sobre a indústria cinematográfica no Reino Unido. Nele, os usuários encontram números semanais de bilheteria dos 15 filmes mais lançados no Reino Unido, pesquisas de público, relatórios, estudos de caso e o principal Anuário Estatístico da organização. Além disso, o site também possui um calendário que mantém os visitantes informados sobre a data de publicação das próximas estatísticas. O nicho específico do Film Forever o torna uma fonte de dados particularmente valiosa. 64. IFPI A IFPI é um site que se orgulha de estar sempre a par do que acontece na indústria fonográfica mundial. Os usuários encontrarão relatórios publicados repletos de informações sobre música gravada, dados de vendas nacionais e globais, além de relatórios sobre o lado comercial da indústria musical, que mostram como as empresas estão investindo no setor. Esses relatórios permitem que os usuários acompanhem o que está acontecendo. Este site manterá os pesquisadores atualizados sobre os acontecimentos da indústria musical em tempo real. 65. Estatística O Statista é um mecanismo de busca como o Google, só que em vez de páginas da web, o site retorna dados e estatísticas. Com um simples clique, os usuários podem acessar imediatamente mais de um milhão de estatísticas e fatos. É possível encontrar infográficos, estatísticas sobre a China, a indústria alimentícia, mercados consumidores e, mediante pagamento, dossiês e relatórios setoriais também estão disponíveis para visualização. Seja para buscar informações sobre economia, mídias sociais ou o Big Mac, este é o lugar certo. 66. EPA A EPA, sigla para Agência de Proteção Ambiental dos Estados Unidos, é a agência governamental responsável por proteger as pessoas e o meio ambiente, aplicando as leis estabelecidas e aprovadas pelo Congresso. No site da EPA, os usuários podem consultar diversos conjuntos de dados sobre tópicos que vão da agricultura a assuntos específicos, como emissões anuais de substâncias químicas tóxicas e métodos de gestão de resíduos. Este site é uma excelente opção para jornalistas que desejam ter acesso a dados ambientais brutos. 67. Centros de Controle e Prevenção de Doenças Este site dos Centros de Controle e Prevenção de Doenças (CDC) se apresenta como um "balcão único para dados de saúde pública ambiental". Nele, pesquisadores encontrarão referências e listas de sistemas de dados que recebem financiamento nacional e que rastreiam e armazenam informações relacionadas a questões de saúde pública ambiental. Com foco em programas que operam em nível nacional e acessibilidade por meio de downloads diretos, este é um recurso confiável para obter as informações mais recentes e precisas na internet. 68. Centros Nacionais de Saúde Ambiental Criado após a fusão de três agências anteriormente independentes, o Centro Nacional de Saúde Ambiental (National Centers for Environmental Health) é a principal fonte de informações de alta qualidade sobre o meio ambiente. Oferecendo dados abrangentes que vão desde informações oceânicas até registros de gelo de milhões de anos atrás, se o assunto envolver o meio ambiente, é provável que este site tenha informações sobre ele. O compromisso da agência com a precisão e a excelência na gestão de um dos maiores arquivos do gênero também a torna um dos poucos sites online que possui, atualiza e mantém esse tipo de dado. 69. Serviço Nacional de Meteorologia O Serviço Nacional de Meteorologia da Administração Nacional Oceânica e Atmosférica (NOAA) fornece aos pesquisadores todas as informações necessárias sobre o clima. Este site oferece buscas de dados que incluem informações sobre categorias como alertas e previsões, clima, previsões geográficas e muito mais. Além disso, conta com um mapa intuitivo e fácil de usar, com abas clicáveis para diferentes resultados. Seja para verificar o que aconteceu localmente ou encontrar a previsão para uma cidade em outro estado, este site fornece informações rapidamente. 70. Wunderground O Wunderground é um recurso dedicado a garantir que informações meteorológicas estejam disponíveis para todos ao redor do mundo, com atenção também para áreas que não recebem muita cobertura. O Wunderground afirma explicitamente que tomou medidas para garantir uma excelente experiência do usuário em diversas plataformas digitais. Isso significa que o site é acessível tanto por dispositivos móveis quanto por computadores, tornando-se um recurso ideal para jornalistas que estão sempre em movimento. 71. Base meteorológica O Weatherbase fornece informações sobre as condições atuais, médias, clima e condições de viagem para mais de 40.000 cidades ao redor do mundo, com a ajuda de uma barra de pesquisa simples. Use o site complementar para o qual o site direciona para encontrar informações adicionais de viagem, como conversores de moeda, coordenadas e informações sobre condados, entre outras curiosidades. O Weatherbase também pode ser usado para encontrar destinos de férias com base apenas na previsão do tempo. Boa pesquisa! 72. Atlas de Energia Publicado pela Agência Internacional de Energia, o Atlas de Energia oferece aos pesquisadores a possibilidade de visualizar o mundo através de estatísticas energéticas. Originalmente concebido como uma fonte de dados complementar desde a sua criação, o site apresenta um balanço energético animado em diagrama de Sankey, bem como diversas bases de dados que acompanham as publicações disponíveis na página de estatísticas da Agência Internacional de Energia. Os pesquisadores acharão este site e seus sites complementares extremamente úteis ao investigar os padrões de consumo de energia em países e cidades. 73. Departamento de Análise Econômica O Bureau of Economic Analysis, ou BEA, na sigla em inglês, publica uma ampla gama de informações úteis que permitem aos pesquisadores acompanhar de perto a situação da economia nacional. Neste site, você encontra dados sobre as contas econômicas dos EUA, incluindo números sobre gastos do consumidor, PIB e ativos fixos, entre outras informações relevantes. Os pesquisadores podem pesquisar por região ou setor, bem como por nível, com opções de busca internacional, nacional e regional. Experimente a página de dados interativos para saber mais sobre o Bureau. 74. Escritório Nacional de Pesquisa Econômica O site do National Bureau of Economic Research (NBER) é uma fonte de dados que aborda a economia de um ponto de vista analítico. Ele hospeda dados sobre uma ampla gama de tópicos econômicos, incluindo índices como o Índice de Governança Africana, o Ciclo Econômico Oficial, os Índices Experimentais Coincidentes, de Indicadores Antecedentes e de Recessão, e o Banco de Dados Histórico Macroeconômico. O NBER possui conjuntos de dados oficiais publicados e compilados sob seu próprio nome, bem como índices compilados por outras editoras. 75. Comissão de Valores Mobiliários dos EUA A Comissão de Valores Mobiliários dos Estados Unidos (SEC) é uma agência que atua como uma espécie de órgão fiscalizador, promovendo transparência, equidade e eficiência nos mercados. Curiosamente, o site possui um conjunto de dados de demonstrações financeiras que abrange o período de janeiro de 2009 a outubro de 2017, com atualizações trimestrais. Pesquisadores podem utilizar este site para se manterem informados sobre as últimas notícias relacionadas a registros e as informações que ele fornece sobre empresas e sua situação financeira. 76. FMI O Fundo Monetário Internacional, também conhecido como FMI, é uma organização consolidada no setor econômico e financeiro internacional. Em seu site, pesquisadores podem encontrar uma vasta gama de dados sobre esses temas. Os usuários podem pesquisar conjuntos de dados por indicador e país, além de consultar gráficos e mapas durante suas pesquisas. Entre os conjuntos de dados mais populares estão a direção das negociações comerciais, os preços das principais commodities, os Indicadores de Solidez Financeira, pesquisas e estatísticas de finanças internacionais, além de outras informações valiosas. 77. O Atlas – Harvard Originalmente concebido por Harvard, o Atlas é uma ferramenta online que permite visualizar e interagir com a situação comercial de uma empresa. O Atlas utiliza essas informações para propor diferentes produtos que o país poderia potencialmente fabricar para impulsionar sua economia. Essa ferramenta é utilizada por formuladores de políticas, empresários, investidores e cidadãos engajados que desejam compreender melhor o cenário econômico de um determinado país. Questões de comércio e economias nacionais nunca foram tão acessíveis. 78. Fazendo Negócios O Doing Business é o resultado de um esforço para realizar avaliações objetivas das regulamentações empresariais. O site examina quase 200 economias e inúmeras cidades, medindo detalhes como indicadores econômicos e classificando a facilidade de fazer negócios. Este site permite que os usuários examinem os efeitos de vários tipos de regulamentações empresariais entre países e apresenta relatórios, bem como dados qualitativos abrangentes. Além disso, o site também possibilita comparações ao longo do tempo. 79. Comtrade Originalmente um projeto do Departamento de Negócios, Energia e Estratégia Industrial do Reino Unido, em conjunto com o Departamento de Comércio Internacional, o Comtrade é um excelente recurso. Utilizando dados do Comtrade Data das Nações Unidas, o site oferece aos usuários um gráfico interativo que pode ser usado para pesquisar, comparar e analisar os números exatos do comércio e das mercadorias entre os países. Basta selecionar o país que reporta os dados, escolher um país parceiro e fazer as seleções desejadas. 80. Dados financeiros globais O Global Financial Data não se limita a compilar dados financeiros padrão; ele abrange informações financeiras que datam do século XIII até os dias atuais. Essas informações são derivadas de diversas fontes, incluindo livros, materiais arquivados, periódicos acadêmicos e notícias. Além disso, o site possui conjuntos de dados que utilizam o método estatístico de encadeamento. O resultado final, da perspectiva do usuário, é um recurso incomparável na internet, graças à exclusividade de seus dados. 81. Visualizando a Economia O Visualizing Economics não é exatamente um recurso no sentido de descoberta de dados, mas sim um serviço focado na criação de infográficos e painéis interativos. Além disso, o Visualizing Economics também realiza análises e projetos com o objetivo expresso de tornar os dados econômicos mais fáceis de entender. Por meio deste site, jornalistas têm uma oportunidade legítima de trabalhar com um profissional que possui anos de experiência em traduzir dados econômicos para algo mais acessível ao público em geral. 82. Portal de Dados Abertos da UE O Portal de Dados Abertos da UE é um projeto criado na sequência de uma decisão da Comissão Europeia. Neste site, as instituições da UE disponibilizam dados para consulta e utilização pública, sem restrições de direitos autorais e gratuitamente. Os conjuntos de dados incluem os dados de referência CORDIS, o registo de transparência e até mesmo uma lista completa das pessoas, entidades e grupos contra os quais a UE aplicou sanções financeiras. Além disso, os dados estão disponíveis em diversos formatos digitais. 83. Dados Abertos Rede A Rede de Dados Abertos é um site que permite aos usuários pesquisar dados por região e cidade. Com uma página inicial clara e intuitiva, o site oferece aos pesquisadores a possibilidade de buscar por categoria de dados, cidade e até mesmo por exemplos de perguntas. Em cada página, após navegar pelas categorias de dados ou pelos exemplos de perguntas, há links convenientes para ainda mais conjuntos de dados. A organização dos dados por si só já faz da Rede de Dados Abertos um site que vale a pena explorar. 84. Matriz de terreno O Landmatrix é um site que oferece um banco de dados online de transações imobiliárias com o objetivo de promover maior transparência nas aquisições. Essencialmente, essa ferramenta pode ser usada para visualizar e compreender as diversas transações imobiliárias. Os dados estão em constante aprimoramento, sendo alterados e ajustados para melhorar a precisão das informações disponibilizadas. Até o momento, o Landmatrix possui informações sobre mais de 1.000 transações. É uma fonte que vale a pena explorar para pesquisadores. 85. Programa das Nações Unidas para o Desenvolvimento O Programa das Nações Unidas para o Desenvolvimento (PNUD) disponibiliza ao público uma grande quantidade de dados úteis sobre desenvolvimento humano em todo o mundo. Com datas que geralmente abrangem o período de 1990 a 2015 em muitos desses conjuntos de dados, os índices incluem tabelas completas, como as tendências do Índice de Desenvolvimento Humano (IDH), o Índice de Desigualdade de Gênero e a disparidade de gênero ao longo da vida. Os pesquisadores podem pesquisar os dados diretamente pela barra de pesquisa e também filtrar por país, caso a intenção seja analisar os gráficos. 86. OCED A OCDE, conhecida como Organização para a Cooperação e Desenvolvimento Econômico, possui um site dedicado a auxiliar governos em iniciativas de combate à pobreza e na promoção da prosperidade por meio da estabilidade e do crescimento econômico. Nesse site, pesquisadores encontram materiais revisados por pares, publicações, além de padrões e argumentos a favor do estabelecimento de normas. A OCDE também disponibiliza um anuário informativo que oferece uma sólida ferramenta de referência econômica, complementada por diversas pesquisas e previsões sobre o cenário econômico, também disponíveis em suas páginas. 87. Departamento de Saúde e Serviços Humanos dos EUA O Departamento de Saúde e Serviços Humanos dos EUA mantém um site que fornece informações sobre o Conselho Presidencial de Fitness, Esportes e Nutrição. O site reúne dados e informações compiladas com a colaboração de diversos especialistas em áreas afins, como chefs de cozinha e atletas. Além disso, o site também apresenta uma série de estatísticas. Pesquisadores podem encontrar dados sobre a atividade física de crianças, hábitos de fortalecimento muscular em adultos, bem como informações sobre hábitos alimentares da população, obesidade e muitos outros dados e estatísticas. 88. Parceiros no Acesso à Informação para os Profissionais de Saúde Pública O projeto Parceiros no Acesso à Informação para Profissionais de Saúde Pública surgiu da colaboração entre organizações de saúde pública, agências governamentais dos EUA e bibliotecas especializadas em ciências da saúde. As páginas temáticas deste site abrangem assuntos como bolsas e financiamento, promoção e educação em saúde, além de literatura e diretrizes. Na seção Tópicos de Saúde Pública, também é possível encontrar dados sobre temas como bioterrorismo, genômica em saúde pública e saúde pública odontológica, entre outros. 89. Fundação United Health Nas últimas três décadas, a United Health Foundation tem fornecido informações sobre rankings de saúde para serem usadas como meio de mensurar a saúde pública. O site hospeda diversos relatórios e publicações, incluindo relatórios sobre a saúde de militares, relatórios sobre a saúde de idosos, saúde da mulher e da criança, relatórios anuais e até mesmo resumos sobre tópicos importantes para a área. Use o mapa interativo para explorar por região e obter mais informações. Há também uma barra de pesquisa para facilitar a busca por informações mais específicas. 90. Medicare Nos Estados Unidos, o Medicare é o principal meio pelo qual muitas pessoas dependem para obter seguro saúde e acesso a tratamento médico. Além dos serviços que oferece em tempo real, o Medicare também fornece dados sobre padrões e qualidade de tratamento em diferentes instalações e hospitais por meio de seu gráfico e regra de comparação. Este é o conjunto de dados oficial usado pelo site Hospital Compare e está repleto de informações que podem ser baixadas em formato Excel para facilitar ainda mais o acesso. 91. Vigilância, Epidemiologia e Resultados Finais (SEER) O programa Surveillance, Epidemiology and End Results (SEER) possui um site especialmente útil como fonte de informações estatísticas sobre câncer. Ele hospeda resumos estatísticos que permitem pesquisas sobre os números associados ao câncer, que podem ser classificados por localização do câncer, etnia, raça, idade, sexo e até mesmo por tipo de dado. O site também disponibiliza publicações, conjuntos de dados e softwares que podem ser utilizados por pesquisadores para análises ainda mais aprofundadas. 92. Anistia Internacional A Anistia Internacional é uma organização que há muito tempo defende os direitos humanos e a justiça em todo o mundo. Ela também mantém um vasto acervo de dados sobre a situação dos direitos humanos em todo o mundo, bem como informações sobre atrocidades e crimes contra a humanidade específicos em diferentes períodos, como parte de seu relatório anual. Pesquisadores podem usar essas informações para fazer comparações entre diferentes anos e observar como diferentes países evoluíram ou regrediram na área dos direitos humanos. 93. Grupo de Análise de Dados sobre Direitos Humanos Desde a sua criação, há 25 anos, o Grupo de Análise de Dados de Direitos Humanos aplica princípios científicos a violações de direitos humanos em diversos países ao redor do mundo. O site reúne publicações de veículos de mídia renomados, como o Washington Post, e publicações formais da editora Macmillan, organizadas por ano. Além das publicações organizadas ao longo dos anos, também há projetos em andamento em todo o mundo. Para uma análise mais técnica sobre violações de direitos humanos, esta é uma ótima ferramenta de busca. 94. Dados sobre Relações Internacionais e Direitos Humanos Este site hospeda bancos de dados compilados por diversas organizações renomadas, universidades e até mesmo agências governamentais. Exemplos disso são o Manifesto Project, o Minorities (at Risk) Project, o Comparative Welfare States District e o Armed Conflict Database. Alguns projetos, como o Polity IV Project, remontam ao século XIX. Já projetos como o Stockholm International Peace Research Institute (SIPRI) mensuram transferências de armas, gastos militares internacionais e tendências de segurança. A melhor maneira de apreciar os dados é acessar o site e explorá-lo. 95. Programa de Dados sobre Conflitos de Uppsala O Departamento de Pesquisa sobre Paz e Conflitos de Uppsala, frequentemente referido como UCDP, mantém um extenso banco de dados chamado Enciclopédia de Conflitos do UCDP. Este site permite aos usuários navegar e explorar os dados já desagregados pelo departamento. Os pesquisadores podem acessar os dados por meio do site e também baixá-los para posterior manipulação e análise. Trata-se de um recurso confiável e de referência para informações de qualidade, distribuídas de forma acessível. 96. Departamento do Trabalho dos Estados Unidos O Departamento do Trabalho dos Estados Unidos disponibiliza uma grande quantidade de dados econômicos referentes a estatísticas sobre desemprego e emprego. Naturalmente, esses números incluem bancos de dados com estatísticas sobre demissões em massa, projeções de emprego, vagas de emprego e rotatividade de pessoal, estatísticas nacionais de emprego e até mesmo estatísticas comparativas internacionais do mercado de trabalho. O site fornece informações atualizadas e precisas, e o Departamento do Trabalho mantém um registro completo de todos os dados. Trata-se de uma fonte confiável, com respaldo governamental, para fins de pesquisa. 97. Administração de Pequenas Empresas A Administração de Pequenas Empresas (SBA, na sigla em inglês) tem sido, há muito tempo, uma fonte confiável para empreendedores e outros aspirantes a empreendedores. Este site hospeda uma grande quantidade de estatísticas sobre emprego, bem como informações que permitem aos pesquisadores realizar pesquisas de mercado e análises da concorrência. Aqui, os pesquisadores podem encontrar números, estatísticas e ferramentas que podem ser usadas para descobrir dados adicionais. Para obter informações sobre estatísticas de pequenas empresas sob a perspectiva do empregador e do empresário, este é um excelente recurso ao qual os jornalistas podem recorrer a qualquer momento. 98. Crowdpac Crowdpac é uma plataforma que permite que candidatos políticos arrecadem fundos e se organizem. Baseando-se na ideia de que, a cada eleição, vários candidatos ao Congresso concorrem praticamente sem oposição, este site permite que cidadãos engajados organizem apoio. Com artigos que discutem questões políticas relevantes, como o gerrymandering, além de outros tópicos como direitos civis e segurança nacional, este site representa uma excelente oportunidade para entender e descobrir o que está acontecendo no cenário político de base. 99. Gallup Este site é a sede das famosas pesquisas Gallup. A Gallup se especializa em análises que permitem aos tomadores de decisão organizacionais resolver problemas por meio de uma abordagem baseada em dados. Além disso, as ferramentas sugeridas pela Gallup costumam ser úteis para impulsionar soluções. Esta é uma fonte reconhecida como referência em dados e análises avançadas. Navegue pelo site para explorar relatórios sobre diversos assuntos, desde o estado do mercado de trabalho global até discussões sobre a produtividade nos EUA. 100. Biblioteca de Berkeley A Biblioteca de Berkeley disponibiliza em seu site uma compilação completa de estatísticas e dados para pesquisa em Ciência Política. Nesta página, os pesquisadores encontrarão diversos links que dão acesso a vários conjuntos de dados, além da possibilidade de criar os seus próprios. Entre eles, estão as Estatísticas Históricas dos Estados Unidos (HSUS), a Edição do Milênio, o Data Planet, o ProQuest Statistical Insight e o Consórcio Interuniversitário para Pesquisa Política e Social. São várias horas de dados para explorar. 101. Serviços Estaduais RAND Para quem não sabe, a RAND Corporation é uma organização especializada em pesquisas sobre desafios de políticas públicas. Com clientes e um portfólio que abrange todos os níveis de governo, a corporação é uma fonte de pesquisa de qualidade para fins de tomada de decisão. A filial americana da corporação mantém um conjunto de estatísticas em seu site. Ali, pesquisadores podem encontrar informações sobre educação básica (do jardim de infância ao ensino médio), saúde, negócios e economia, entre outras categorias que abordam questões relevantes para o bem público. 102. Centro Roper para Pesquisa de Opinião Pública Administrado pela Universidade Cornell, o Centro Roper para Pesquisa de Opinião Pública é especializado na coleta, distribuição e preservação de dados de opinião pública. Como exemplo do tipo de informação que o Centro Roper pode revelar, pesquisadores têm acesso a dados das eleições americanas, bem como a um arquivo com mais de 23.000 conjuntos de dados. Seja para jornalistas que buscam a reação do público à política ou a um recente problema de saúde, este site certamente terá informações relevantes. 103. Governo de Transportes Mantido e operado pelo Departamento de Transportes, este site contém dados que abrangem uma ampla gama de assuntos relacionados a transportes. Os recursos deste site incluem relatórios sobre energia, segurança de passageiros, desempenho do sistema, economia de transportes, infraestrutura e transporte de cargas. Os usuários podem até mesmo filtrar e acessar os dados oferecidos neste site por localização e geografia. Este é um site que permite aos pesquisadores encontrar tudo o que possam precisar saber sobre tópicos relacionados a transportes. 104. Comércio de viagens O Travel Trade é um site que hospeda dados sobre viagens de cidadãos americanos de 1996 a 2016, data da publicação deste texto. O objetivo declarado deste recurso é auxiliar o público em geral interessado a compreender como o turismo global e o turismo internacional têm funcionado ao longo dos anos. Disponível para download e visualização online, este recurso oferece informações de fácil acesso. Pesquisadores podem utilizar esses dados para identificar tendências e realizar comparações. 105. Esqui A Skift é um site que se concentra em fornecer informações e dados para a indústria de viagens. Entre outras fontes de dados, a empresa hospeda pesquisas, conferências e boletins informativos para assinantes e pesquisadores. A Skift examina tópicos que profissionais do setor de viagens gostariam de conhecer, como destinos de viagem mais populares, identificação de novos mercados e muitas outras informações sobre tecnologia de viagens que os pesquisadores podem explorar. 106. Geoba.se O Geoba.se é o site perfeito para quem busca informações factuais sobre uma cidade ou localidade. Usando o mecanismo de busca na página inicial, encontrar coordenadas, informações de viagem, previsão do tempo e até mesmo imagens de webcams locais é muito fácil. O site também oferece uma página com rankings mundiais que podem ser filtrados por região e país. Em resumo, este é um recurso que fornece dados e estatísticas precisos. 107. Viagens aos EUA O site US Travel é operado e mantido pelo Departamento de Estado dos EUA. A missão declarada do site é proteger a vida de cidadãos americanos que viajam para o exterior. Assim, essa fonte disponibiliza estatísticas, informações e relatórios sobre tópicos como passaportes americanos, vistos americanos, adoções internacionais, mortes no exterior e sequestros internacionais de crianças por pais. As informações podem ser usadas no planejamento de viagens, mas também para identificar tendências de longo prazo, com estatísticas que abrangem o período de 1996 a 2016. 108. Serviço de Dados do Reino Unido Financiado pelo Conselho de Pesquisa Econômica e Social (ESRC), o Serviço de Dados do Reino Unido publica uma ampla gama de dados. Este site contém informações que incluem desde dados empresariais a pesquisas internacionais, pesquisas patrocinadas pelo governo do Reino Unido e até mesmo dados do censo britânico. Basicamente, o site foi projetado pensando nas necessidades de estudantes e pesquisadores. Além disso, oferece guias, recursos e tutoriais que auxiliam os pesquisadores a compreender e utilizar as ferramentas disponíveis no site de forma rápida e prática. 109. Data.gov.au Gerido e publicado pelo governo australiano, o Data.gov.au oferece acesso e pesquisa facilitados a dados abertos. Este site destaca explicitamente que os dados governamentais podem ser usados para desenvolver ferramentas e aplicativos que, por sua vez, podem beneficiar os australianos. Além do acesso aos conjuntos de dados abertos, também é possível acessar dados não publicados mediante pagamento. Para pesquisadores que desejam realizar análises ainda mais aprofundadas, o site também oferece um Kit de Ferramentas de Dados. 110. Twitter Todo mundo conhece o Twitter por suas conversas rápidas, mensagens curtas e seu status na cultura popular como um centro de notícias de última hora. O que muita gente não sabe, no entanto, é que o Twitter também possui ferramentas para desenvolvedores que facilitam a filtragem e a descoberta de informações. Essas ferramentas permitem até que pesquisadores visualizem tendências e filtrem por localização geográfica. Seja pesquisando hashtags em alta ou explorando as ferramentas para desenvolvedores, o Twitter é um recurso que jornalistas vêm utilizando há bastante tempo. 111. Instagram O Instagram não serve apenas para curtir fotos fofas de gatos e bebês. Ou pelo menos, não precisa ser. O aplicativo possui um conjunto surpreendentemente sofisticado de ferramentas para desenvolvedores, que facilitam a compreensão e a pesquisa do público. Além disso, as hashtags e as pistas reveladas pelas fotos que as pessoas publicam, bem como pelas pessoas marcadas nelas, podem ser um verdadeiro tesouro de informações. O Instagram é uma ferramenta útil para descobrir o que está em alta em diferentes setores. 112. Quatro quadrados Para pesquisas em que a localização é importante, o Foursquare é uma fonte de dados útil devido ao seu enorme banco de dados e a todas as informações que compilou. À primeira vista, oferece um guia da cidade que fornece recomendações aos usuários sobre a qualidade da comunidade. O Foursquare também possui ferramentas para desenvolvedores que permitem o acesso a informações adicionais por meio do Banco de Dados de Locais. Jornalistas podem usar isso para aprender mais sobre locais específicos e sobre as pessoas que usam o aplicativo. 113. New York Times Considerado por muitos um membro estimado do Quarto Poder, são poucos os jornalistas que desconhecem o New York Times. O que muitas vezes passa despercebido, no entanto, é o uso do New York Times como fonte de dados por meio de sua API. Pesquisadores podem encontrar artigos que remontam a 1851 por mês, pesquisar artigos e até mesmo encontrar resenhas de livros. Essa API permite buscas com base em visualizações, compartilhamentos e e-mails, além de possibilitar a localização e o acesso a comentários. 114. AP A Associated Press ocupa um lugar permanente na cultura popular como fonte de notícias oportunas e precisas. Graças às suas ferramentas para desenvolvedores, também é uma fonte útil de dados para jornalistas. Até o momento da redação deste texto, pesquisadores podem usar essas ferramentas para criar suas próprias edições, além de baixar fotos e vídeos. O nível de conteúdo parece depender do tipo de plano que os pesquisadores estão utilizando, mas a API da Associated Press permite que os usuários levem o processo de pesquisa a um novo patamar. 115. Cinco e trinta e oito Jornalistas provavelmente já conhecem Nate Silver e o FiveThirtyEight, bem como seu modelo estatístico, devido às suas previsões, às vezes inesperadas, mas geralmente corretas. O FiveThirtyEight possui um repositório no GitHub que hospeda conjuntos de dados e códigos utilizados ao longo da história do site. Os conjuntos de dados abordam temas divertidos, como informações sobre maus motoristas, os Vingadores e uma pesquisa sobre etiqueta em voos. Ao mesmo tempo, também existem arquivos que tratam de assuntos um pouco mais sérios, como segurança aérea e crimes de ódio. 116. IMDb O IMDb é considerado por muitos o site mais completo da internet no que diz respeito à indústria cinematográfica e de atuação. Se um filme está para estrear e as pessoas querem saber quem está no elenco ou conferir a reação geral do público, é bem provável que elas acessem este site em algum momento da sua busca. O IMDb também hospeda diversos bancos de dados que são atualizados diariamente e estão disponíveis para uso comercial e não comercial. 117. KAPSARC O KAPSARC é um portal de dados que hospeda um total de 923 conjuntos de dados com informações específicas sobre energia. Esses conjuntos são divididos em alguns temas gerais relacionados ao uso de energia, oferta de energia e outros fatores relevantes, como políticas, demografia, meio ambiente, comércio, água e informações econômicas. Para pesquisadores interessados em energia e como ela é utilizada em diferentes indústrias e setores, o KAPSARC é uma das fontes de dados sobre energia mais abrangentes da internet. 118. Macroeconomia de Ativos Asset Marco é um site que fornece dados financeiros históricos e indicadores macroeconômicos. Esses dados abrangem mais de 75.000 ações, moedas, commodities e títulos do mundo todo. Além disso, o site oferece mais de 120.000 indicadores macroeconômicos que os usuários podem utilizar para explorar os dados financeiros de diferentes países. Para além de todos esses dados do mercado financeiro, o site também aborda estratégias de investimento. Essa fonte é única devido ao enorme volume de informações disponíveis. 119. Serviços Web e fontes de dados XML do governo dos EUA Os serviços web e as fontes de dados XML do governo dos EUA estão hospedados no site USGovXML.com. Nele, os usuários podem navegar pelas diferentes fontes de dados XML e serviços web disponibilizados pelo governo americano. Essa simples prática de preservação mantém essas fontes web transparentes e acessíveis ao público. Para pesquisadores que monitoram esse índice regularmente, é possível encontrar informações relevantes nos dados caso haja alguma alteração repentina nos dados XML. 120. Figshare O Figshare é um site que hospeda mais de 5.000 conteúdos científicos disponíveis para pesquisa acadêmica e citação. Além das informações ali presentes, o site foi projetado para oferecer aos pesquisadores um local único para compilar, carregar, armazenar e gerenciar as pesquisas que encontram. Matemática, ciências da saúde, engenharia, química, ciências biológicas e ciências sociais estão listadas como categorias principais. Este site é uma ótima fonte para jornalistas em busca de mais recursos acadêmicos para citar. 121. Dados vinculados LinkedData é um site dedicado à ideia de encontrar novas maneiras de conectar dados da Internet que antes não estavam interligados. Aqui, os usuários encontrarão tutoriais, guias e conjuntos de dados que darão início a essa jornada. Os conjuntos de dados são focados no tema de como se envolver com a comunidade de dados ligados e, além da lista de compras de dados ligados, a maioria é categorizada como URIs referenciáveis, com ou sem o formato RDF complementar. Para aprender mais sobre essa comunidade, este site é essencial. 122. O Web Miner O Web Miner é o lugar perfeito para pesquisadores que desejam coletar todos os dados genéricos que conseguirem encontrar com o programa. Este site hospeda bancos de dados de exemplo, como restaurantes dos EUA, códigos SWIFT de bancos do mundo todo, postos de gasolina dos EUA, atrações turísticas americanas e aplicativos do Google Play, entre outras listas enormes. No mínimo, é um site que facilitará e agilizará o trabalho de jornalistas na busca e descoberta de grandes quantidades de dados em muito menos tempo. 123. Centro de dados O Data Hub se orgulha de ser um local onde os usuários podem encontrar e publicar dados da forma mais rápida e eficiente possível. O próprio site hospeda diversos conjuntos de dados. O Índice de Preços de Imóveis (Case-Shiller), o preço mensal do ouro e as Tendências Atuais do Dióxido de Carbono Atmosférico são os três mais populares. Além dos dados, o site também oferece diversos tutoriais que os usuários podem consultar para aprender mais sobre como navegar pelos diferentes tipos de dados disponíveis. 124. Enigma Público Em seu site, o Enigma Public se autodenomina "a mais abrangente coleção de dados públicos" disponível na internet. Os conjuntos de dados se dividem em quatro categorias principais: FOIA (Lei de Liberdade de Informação), Essenciais, Noticiáveis e Discretos. Alguns dos dados disponíveis no site incluem salários de funcionários da Casa Branca e licenças federais ativas para porte de armas de fogo. Após criar uma conta gratuita, os usuários podem acessar qualquer uma das categorias de dados disponíveis para visualização. 125. Yahoo A maioria dos usuários da internet está familiarizada com o nome Yahoo devido a serviços como o Yahoo! Notícias e o Yahoo! Finanças, entre muitas outras propriedades online da empresa. De interesse para pesquisadores e jornalistas é o fato de o Yahoo! também hospedar um vasto número de conjuntos de dados, incluindo o Yahoo! Music User Ratings of Songs with Artist, Album, and Genre Meta Information, v. 1.0 e o Yahoo! Movies User Ratings and Descriptive Content Information, v. 1.0, para citar dois exemplos. Jornalistas em busca de novas estatísticas não podem errar ao consultar esta fonte. 126. 1000 Genomas O projeto 1000 Genomes, de mesmo nome, foi desenvolvido entre 2008 e 2015. O objetivo do projeto era encontrar todas as variações genéticas que pudessem ocorrer em pelo menos 1% das populações estudadas. Além das publicações resultantes do projeto, foram disponibilizados conjuntos de dados massivos, incluindo bancos de dados separados de células variantes, arquivos de sequências brutas e informações sobre a disponibilidade de amostras. Esses dados podem ser consultados ou baixados. 127. CBOE A CBOE é uma bolsa de futuros que se concentra principalmente em futuros de volatilidade. Em particular, o site apresenta diversos materiais sobre os futuros que compõem o seu Índice de Volatilidade (VIX), marca registrada da empresa. O site hospeda dados de mercado de todos os tipos, incluindo dados históricos, estatísticas diárias de mercado e os Preços Diários de Liquidação dos Futuros de VX. Para jornalistas que buscam dados de mercado de qualidade, a CBOE é um site que pode fornecer essas informações em um formato fácil de seguir e entender. 128. Federação de St. Louis O Banco da Reserva Federal de St. Louis é um dos centros financeiros mais importantes, senão o mais importante, da região. Em seu site, pesquisadores podem consultar documentos de trabalho, dados econômicos, publicações e serviços de informação diretamente. Em outras palavras, há uma vasta gama de informações sobre o pensamento atual e passado do Fed de St. Louis em termos de política monetária, bem como a possibilidade de avaliar a eficácia do Banco da Reserva Federal de St. Louis. Para jornalistas de negócios, finanças e economia, este é um recurso de informação de altíssima qualidade. 129. OANDA A OANDA é uma plataforma popular de negociação de ações online, focada principalmente em CFDs e no mercado Forex. Além dos diversos recursos adicionados para atrair traders online, a OANDA também disponibiliza um vasto banco de dados com taxas de câmbio históricas e informações sobre o conversor de moedas em seu site. Juntamente com esses dados, o site oferece informações sobre estratégias de investimento, notícias e análises de mercado. A maioria dessas informações não exige cadastro. 130. ABS O Escritório Australiano de Estatísticas (ABS, na sigla em inglês), assim como seu equivalente americano, oferece dados objetivos, informações econômicas e pesquisas sobre uma ampla gama de tópicos relevantes para o país. Diretamente no site, pesquisadores podem consultar dados estatísticos sobre indicadores de negócios, saúde, habitação, finanças, comércio internacional, saúde mental, além de índices de preços e inflação. Jornalistas podem realizar buscas para encontrar pesquisas e informações mais antigas, podendo também filtrar os dados por região. 131. Banco de dados de Londres Originalmente idealizado e operado pela Autoridade da Grande Londres, o Banco de Dados de Londres é uma iniciativa da cidade para tornar os dados londrinos mais acessíveis ao público. O objetivo final é dar às pessoas acesso a essas informações, incentivando-as a usá-las gratuitamente da maneira que desejarem. Neste site, os usuários podem pesquisar dados por tópicos como Artes e Cultura, Crime e Segurança Comunitária, Educação e Saúde. Jornalistas interessados nesse tipo de dado agora podem obtê-lo diretamente do governo local. 132. Estatísticas da Nova Zelândia O governo da Nova Zelândia disponibiliza uma grande quantidade de estatísticas e dados para pesquisadores analisarem neste site. Essas informações podem ser filtradas usando a barra de pesquisa no topo da página, por localização e região, bem como por tópico. Alguns dos tópicos incluem indicadores econômicos, saúde, renda e trabalho, setores industriais, meio ambiente e negócios. Entre as fontes de notícias e comunicados adicionais que destacam diversas descobertas e estatísticas, jornalistas encontrarão neste site todos os tipos de dados específicos da Nova Zelândia. 133. Departamento de Meteorologia do Governo Australiano Gerido e operado pelo Governo da Austrália, o site do Serviço Meteorológico Australiano (Australian Bureau of Meteorology) apresenta informações meteorológicas referentes a diversas cidades e regiões do país. Segundo o site, essa agência foi criada para ajudar os australianos a lidar com o clima, fornecendo alertas e recomendações. Nele, os usuários podem encontrar previsões sazonais, dados sobre armazenamento de água, previsões de chuva, variabilidade climática e previsões de vazão sazonal de rios. Neste site, você encontrará informações precisas e confiáveis sobre o clima australiano. 134. GroupLens Este site está disponível na web por cortesia do GroupLens, do Departamento de Ciência da Computação e Engenharia da Universidade de Minnesota. O site oferece publicações, bem como conjuntos de dados para fins de pesquisa. Há um total de cerca de seis conjuntos de dados. Entre os conjuntos nomeados, encontram-se alguns intitulados Book-Crossing, MovieLens e HetRec 2011. Em resumo, este é um recurso útil para jornalistas que buscam entender melhor como usar os dados fornecidos. 135. Nuggets KD O KD Nuggets é um site focado principalmente em fornecer informações sobre ciência de dados, análise de negócios, aprendizado de máquina e mineração de dados. Há uma página no site com uma lista completa de conjuntos de dados usados para explorar mineração de dados e big data, incluindo conjuntos como Bioassay Data, Asset Marco, DataMarket, Casualty Workbench, Data Ferrett e Datamob. Este é um recurso fantástico para jornalistas que preferem ter todas as informações em um só lugar. 137. Microsoft Quem já usou um PC ou um laptop provavelmente já ouviu falar da Microsoft, pelo menos de passagem. Curiosamente, além de PCs, laptops e softwares, a Microsoft também abriga muitas pesquisas e publicações. Isso inclui avanços como a busca da empresa para criar máquinas alfabetizadas, bem como ciência de dados baseada em nuvem. Há também informações adicionais sobre ferramentas que a Microsoft está desenvolvendo, como as Ferramentas de Código do Visual Studio, e os avanços em IA que elas representam. 138. RDataMining Exatamente como o nome indica, o R Datamining é um recurso sobre R e mineração de dados. O site oferece inúmeros exemplos e documentos que proporcionam uma perspectiva aprofundada sobre mineração de dados e mineração de dados com R. Além disso, também inclui links para cursos de treinamento, como o curso de curta duração oferecido pela Universidade de Canberra. Isso inclui links para conjuntos de dados e apresentações gratuitos, bem como conjuntos de dados que abrangem assuntos como dados de aviões, companhias aéreas e rotas, além de links para sites como o GeoDa. 139. Pesquisa colaborativa em neurociência computacional – Compartilhamento de dados A Pesquisa Colaborativa em Neurociência Computacional (CRCN, na sigla em inglês) possui diversos conjuntos de dados acessíveis através de seu site. Os conjuntos de dados são categorizados por diferentes partes do cérebro, como córtex visual, hipocampo, córtex motor, cérebros de aves, movimentos oculares e cérebros de aplísia, para citar alguns exemplos. Essas pastas também incluem desafios, ferramentas, simulações e métodos. A possibilidade de compartilhar esses dados torna-os um recurso ainda mais valioso para pesquisa. 140. Arquivo do Banco de Dados de Proteínas De acordo com seu site, o Protein Data Bank (PDB) é um recurso de referência em ácidos nucleicos, estruturas tridimensionais de proteínas e complexos proteicos desde 1971. Criado com a missão explícita de manter essas informações em domínio público, o banco de dados permite que pesquisadores acessem relatórios de validação e dicionários online. Também estão disponíveis dados sobre crescimento e uso, que podem ser classificados, analisados e baixados via web. E o melhor de tudo: o site está sempre adicionando novas informações. 141. O Projeto PubChem O PubChem, como projeto oficial, foi concebido com o objetivo de informar o público sobre as capacidades biológicas das pequenas moléculas. O site é interligado por três bases de dados: PubChem Compound, PubChem Substance e PubChem BioAssay. Além disso, o site permite a busca por similaridades entre diferentes proteínas. Para pesquisadores que desejam aprofundar suas análises de dados, o site também oferece códigos e dicas gratuitas. 142. Coremine Medical Coremine Medical é um recurso inestimável para qualquer pessoa que busque informações sobre biologia, saúde e medicina. Agora que a funcionalidade de mineração de texto biomédico do PubGene foi incorporada à sua forma atual, o Coremine também se tornou uma das fontes de informação biomédica mais flexíveis disponíveis. Este site exibe conexões entre conceitos e ideias em um formato visualmente atraente e de fácil compreensão, que poderiam passar despercebidas de outra forma. É, sem dúvida, uma das fontes de dados biomédicos mais abrangentes disponíveis para jornalistas. 143. Seu Tempo O Tu Tiempo é uma fonte incrível de dados meteorológicos e climáticos para todos os países do mundo. Com esse recurso, é fácil encontrar médias anuais, mensais e diárias para praticamente todas as cidades e regiões do planeta. Além disso, os usuários também podem pesquisar no banco de dados com mais de 115 milhões de registros repletos de dados históricos, acessíveis a qualquer pessoa. Dependendo da região pesquisada, é possível encontrar dados que remontam a 1929. 144. Recursos de rede complexos Este site fornece acesso a uma grande quantidade de dados que foram usados inicialmente em seus experimentos computacionais. A lista completa de conjuntos de dados inclui os tipos de dados abrangidos, como grafos de notícias, grafos biológicos, grafos de citações, grafos de colaboração, grafos de engenharia e grafos semânticos. A página também contém links para uma lista de fontes com muitas informações, como o conjunto de dados que analisou aproximadamente 3 milhões de patentes americanas. Além disso, a página apresenta uma impressionante compilação de conjuntos de dados de Redes Complexas. 145. Scopus O Scopus é uma ferramenta que permite encontrar pesquisas e citações acadêmicas de forma rápida e fácil. O site oferece um banco de dados incrivelmente extenso de pesquisas realizadas em todo o mundo em diversas áreas, incluindo medicina, tecnologia, ciências sociais, artes e humanidades. Use o Scopus para encontrar fontes acadêmicas que possam ter passado despercebidas. Afinal, em muitos círculos, a qualidade de uma fonte acadêmica pode ser quase tão importante quanto a informação que ela fornece. 146. Stanford A reputação de Stanford como uma instituição acadêmica de prestígio não surgiu por acaso. A excelência transparece em seus cursos relacionados à programação. O site também hospeda diversos conjuntos de dados que incluem detalhes como informações de redes sociais. Há conjuntos de dados focados em círculos sociais no Facebook, solicitações de administração na Wikipédia, círculos sociais no Twitter e Google+. Redes de comunicação e a Rede de Produtos da Amazon também possuem seus próprios conjuntos de dados. 147. Universidade de Milão O Departamento de Ciências da Informação da Universidade de Milão mantém um site conhecido como Laboratório de Algoritmos Web. Este site abriga diversos conjuntos de dados disponíveis para exploração. Entre eles, encontram-se grafos relacionados a redes sociais, grafos do Facebook, capturas de tela do projeto DELIS e uma pequena lista de dados diversos. As informações disponíveis podem ser visualizadas online e baixadas, tornando este um dos conjuntos de dados mais acessíveis do gênero na internet. 148. Repositório de Dados da Rede UCI O Repositório de Dados de Redes da UCI é um site dedicado à abordagem científica do estudo de redes. Na página de recursos, os pesquisadores encontrarão links para diretórios de conjuntos de dados selecionados por organizações e grupos de pesquisa, bem como por indivíduos. O site também possui uma coleção de conjuntos de dados normalmente utilizados para análise de mídias sociais. Aqueles que se aprofundarem nos dados ficarão satisfeitos em saber que esses conjuntos também estão disponíveis para download. 149. CAIDA A CAIDA, ou Centro para Análise Aplicada de Dados da Internet, coleta uma ampla gama de dados de diversas fontes, frequentemente com a ajuda de diferentes organizações e indivíduos. Existem conjuntos de dados hospedados neste site, como Relações de AS, Ataques DDoS, Telescope e outros relacionados, além de outros dados. As categorias incluem tráfego, topologia, segurança, resumo de worms e estatísticas de resumo de tráfego. O acesso a alguns conjuntos de dados pode exigir solicitação, mas muitos, senão a maioria, são públicos. 150. Lagostim O Crawdad, ou Recurso Comunitário para Arquivamento de Dados Sem Fio em Dartmouth, é único por seu foco em fornecer dados sem fio para pesquisadores e outros interessados no assunto. O site oferece diversas ferramentas, além de acesso a inúmeros conjuntos de dados. Entre os conjuntos listados, encontram-se aqueles destinados a Uso Educacional, Caracterização de Erros de Bit, Diagnóstico de Rede, Conectividade Oportunista, Computação Sensível à Localização e muitos outros. Os pesquisadores apreciarão este recurso à medida que o explorarem. 151. Administração de Informação Energética dos EUA A Administração de Informação Energética dos EUA (EIA), frequentemente referida como EIA, tem como objetivo fornecer dados anuais sobre o fornecimento de eletricidade ao público. Esses dados abrangem estoques de combustíveis fósseis, consumo de combustível, informações mensais e anuais sobre a geração de eletricidade e dados ambientais, entre outras opções. Os dados estão disponíveis para análise e datam de 2001 a 2017. Basta que os pesquisadores acessem o site e baixem as informações. 152. Dados Oceanográficos Britânicos Financiado pelo Conselho Nacional de Pesquisa Ambiental (NERC), o British Oceanographic Data é uma das fontes de dados marinhos mais acessíveis na internet. Possui um extenso banco de dados que abrange correntes marítimas, perfis CTD, dados internacionais de nível do mar e até mesmo dados históricos de registradores de pressão de fundo. Além disso, existem conjuntos de dados disponíveis na Biblioteca de Dados Publicados, que oferece acesso adicional ao catálogo. Esta é, possivelmente, uma das fontes de informação marinha mais abrangentes disponíveis online. 153. Factual A Factual fornece dados de localização para publicidade e para uso em plataformas móveis. De particular interesse para pesquisadores são as ferramentas de desenvolvimento, que incluem o SDK Engine Mobile e as aplicações profissionais e de pesquisa completas do Observation Graph, bem como o Local Validation Stack. Com um nome que enfatiza a paixão da empresa por coletar dados ao redor do mundo e encontrar novas maneiras de contextualizá-los, a Factual demonstra um claro compromisso com os dados e com a busca por oportunidades inovadoras e não convencionais para utilizá-los. 154. Áreas Administrativas Globais O Banco de Dados de Áreas Administrativas Globais (Global Administrative Areas - GAA) é um geodatabase que mostra a localização das diversas áreas administrativas do mundo. Os dados coletados desse tipo de banco de dados são normalmente utilizados em sistemas de informação geográfica (SIG). Esses sistemas incluem países e são subdivididos em províncias, condados e departamentos, entre outros. A boa notícia para jornalistas é que todos esses dados estão disponíveis gratuitamente e podem ser utilizados para fins acadêmicos e não comerciais em geral. 155. Geonames O GeoNames é um site que abriga um banco de dados geográfico com milhões de entradas, características únicas e nomes alternativos. Oferecendo opções de exportação e acesso por meio de diversos serviços web, este banco de dados processa aproximadamente 150 milhões de solicitações por dia. Graças aos recursos wiki do banco de dados, os usuários podem fazer ajustes e alterações nas entradas com relativa facilidade. Só por sua capacidade de hospedagem em vários idiomas, já é um excelente recurso. 156. Dados da Terra Natural O Natural Earth Data é um conjunto de dados cartográficos de domínio público, repleto de informações projetadas para uso em softwares de criação de mapas, permitindo a produção de mapas de última geração. Os elementos visuais do produto final são claros e bem organizados, e os dados podem ser utilizados imediatamente. Este conjunto de dados inclui informações de inteligência e diversos temas de dados culturais, raster e vetoriais físicos. Originalmente criado para atender às necessidades e preferências de cartógrafos, este conjunto de dados é útil para qualquer pessoa com interesse em geografia. 157. Mapa OpenStreetMap O OpenStreetMap é menos um site e mais uma colaboração entre usuários que agora fornece serviços de mapeamento para aplicativos, sites e diversos dispositivos. Este site adquire novos dados quando os usuários inserem informações sobre pontos de referência menos conhecidos, como estações ferroviárias, estradas e trilhas. O conjunto de dados completo está disponível gratuitamente no site e pode ser baixado integralmente ou parcialmente. Para aqueles que optarem por baixar os dados parcialmente, também é possível fazer o download por região. 158. Cidade de Chicago A cidade de Chicago é o lar do time de basquete Bulls, campeão sob o comando de Michael Jordan, e de um estilo único de pizza. Além disso, possui um portal de dados completo. As categorias de dados abrangem uma variedade de tópicos, incluindo Administração e Finanças, Ética, Saúde e Serviços Humanos, Parques e Recreação, Segurança Pública e Preservação Histórica. Em resumo, o portal de dados da cidade de Chicago hospeda praticamente tudo que possa interessar a pesquisadores, formuladores de políticas públicas e jornalistas locais. 159. CKAN O CKAN é essencialmente o repositório online do projeto de dados abertos da cidade de Glasgow. Este site contém conjuntos de dados sobre diversos assuntos, úteis para empreendedores, formuladores de políticas públicas, pesquisadores acadêmicos e desenvolvedores de aplicativos. Dos 360 conjuntos de dados hospedados aqui, alguns estão relacionados à governança da cidade, como o conjunto de dados sobre o parque habitacional por tipo de posse, enquanto outros, como o conjunto de dados sobre ciclismo, são de particular interesse para os moradores locais. Há também uma grande variedade de informações para jornalistas que cobrem assuntos mais locais. 160. Governo da Índia O Governo da Índia possui um site que reúne análises e recursos de dados em sua versão do Projeto de Dados Abertos. Atualmente, existem aproximadamente 137.940 recursos que foram visualizados milhões de vezes no site. A grande maioria desses arquivos também está disponível para download. Seja para consultar números sobre o orçamento do governo ou para buscar conjuntos de dados sobre saúde e bem-estar familiar, é provável que este site ofereça os recursos necessários. 161. Estatísticas SA Este site está repleto de estatísticas, publicações e dados atualizados coletados pelo governo sul-africano. Aqui, pesquisadores encontrarão informações sobre tudo, desde pesquisas sobre alimentos e bebidas até indicadores econômicos, estatísticas de emprego, números populacionais e importantes estatísticas de saúde. É possível pesquisar os números por cidade, tema e indicador, dependendo da necessidade. Este site hospeda muitas informações sobre o censo, além de disponibilizar publicações estatísticas, questionários, códigos e classificações, e políticas de preços. 162. Desenvolvimento de Políticas e Pesquisa Este site é publicado sob a égide do Escritório de Desenvolvimento e Pesquisa de Políticas do Departamento de Habitação e Desenvolvimento Urbano dos EUA. Ele publica regularmente um grande número de estudos de caso, publicações semestrais e periódicos. Também oferece diversos conjuntos de dados de interesse para jornalistas, como aluguéis de mercado justo, limites de renda e fatores de inflação para financiamento de renovação, entre outros, aos quais o público tem acesso neste site. 163. Dados vitais de saúde da rede No Vital Net Health Data, pesquisadores encontrarão diversos conjuntos de dados de saúde de grande porte. Este site não hospeda todos esses conjuntos de dados em si, mas oferece links para que as pessoas possam acessá-los e encontrar informações relevantes. Esta lista selecionada inclui links para recursos como CDC Wonder, Eurocat, Health Data All Star, além do trabalho de organizações beneficentes como a Associação Norte-Americana de Registros Centrais de Câncer. Sem dúvida, este é um dos recursos de dados de saúde mais abrangentes disponíveis. 164. Ponte Analítica O Analytic Bridge é um recurso dedicado à inteligência de negócios. Nele, pesquisadores encontrarão discussões sobre aprendizado de máquina e IA, links para webinars e conferências, e até mesmo uma aba de busca de vagas. O site também hospeda o Data Science Central, seção focada em big data. Com sua comunidade ativa e engajada e seu compromisso em fornecer notícias e informações, jornalistas interessados nas implicações dos dados para os negócios têm muito a ganhar com essa plataforma. 165. Arquivo.org Conhecido principalmente por seus esforços para se tornar uma biblioteca pública online, o archive.org abriga inúmeras obras publicadas, bem como uma coleção substancial de conjuntos de dados. O site apresenta resultados do Censo da Internet de 2012, além de arquivos do mercado da Dark Net de 2011 a 2015 e até mesmo um conjunto de dados de comentários públicos do Reddit. Há também dados extraídos do MusicBrainz e um conjunto de dados que contém imagens de capas de álbuns. Entre suas publicações e dados, o archive.org oferece bastante material para jornalistas analisarem. 166. Torrents Acadêmicos Este site se apresenta como um sistema projetado para facilitar o compartilhamento e o download de grandes conjuntos de dados. Utilizando a tecnologia torrent para simplificar a distribuição de dados, o Academic Torrents se orgulha de permitir que pesquisadores baixem tudo o que precisam rapidamente. O site também hospeda artigos, cursos e coleções para visualização. Uma busca rápida pelos recursos disponíveis revelará que há uma infinidade de conjuntos de dados e coleções disponíveis para download. 167. Dataverse A melhor maneira de abordar o Dataverse é pensar nele como um outro tipo de biblioteca. Aqui, os pesquisadores podem buscar, descobrir e citar dados com facilidade, enquanto utilizam o site como um repositório para suas próprias informações. Os assuntos abordados incluem áreas como ciências sociais, ciências agrárias, medicina, saúde e ciências da vida, bem como ciências da Terra e do meio ambiente. Grandes nomes com publicações neste site incluem Gallup e o Departamento de Comércio dos EUA, Divisão de Geografia do Escritório do Censo. 168. DADOS DA UC Operando em conjunto com o Laboratório de Dados de Ciências Sociais da UC Berkeley, o UC Data é o maior e mais conhecido arquivo da universidade. Este site oferece recursos nas áreas de estatística e dados de ciências sociais. Nele, pesquisadores podem acessar artigos, relatórios e documentos de trabalho produzidos pelos pesquisadores do UC Data. Os dados brutos abrangem diversas áreas de pesquisa, incluindo saúde, bem-estar e previdência social, demografia, votação e tecnologia da informação, entre muitos outros tópicos. 169. Acampamento de Piadas Joe Kamp oferece um guia completo para encontrar dados e APIs de futebol para fins de análise. Seguindo os links fornecidos na página, os pesquisadores encontrarão dados de código aberto disponíveis no GitHub, além de acesso a APIs gratuitas e comerciais para facilitar o acesso. Como os dados e o código estão disponíveis em um site reconhecido como o GitHub, obter esse tipo de informação nunca foi tão fácil. 170. Sean Lahman Sean Laham não é necessariamente um nome que se ouve todos os dias, mas seu site abriga uma das coleções de estatísticas de rebatidas e arremessos mais abrangentes e detalhadas da internet. Com dados que abrangem o período de 1871 a 2016, as informações remontam literalmente a séculos atrás. O acesso e o uso dos dados são gratuitos sob a licença Creative Commons Share Alike 3.0 e podem ser baixados diretamente em formatos como SQL e Microsoft Access, entre outros. As estatísticas também podem ser baixadas via GitHub. 171. Folha retrô O Retro Sheet é uma das fontes mais completas da internet para estatísticas e dados de beisebol. O site inclui detalhes como listas anuais de jogadores e identificação de árbitros, jogadores e técnicos. Durante os anos em que esteve ativo, os dados do Jogo das Estrelas foram incluídos nos arquivos do evento, juntamente com um conjunto de arquivos para a pós-temporada e um pequeno arquivo de discrepâncias. O Retro Sheet ainda possui a identificação dos estádios de beisebol para cada temporada. Que tal essa abrangência? 172. Desafio de dados Hubway Para quem não está familiarizado com o programa, Hubway é o nome do sistema de compartilhamento de bicicletas da região metropolitana de Boston. O sistema não registrava nem divulgava informações de identificação, mas, mesmo assim, o Hubway possui informações básicas sobre todas as viagens realizadas entre julho de 2011 e setembro de 2012. Isso inclui detalhes como o local de partida e de chegada, bem como a estação de retirada, entre outras categorias. 173. Voos Abertos O Open Flights é um banco de dados com informações sobre mais de 10.000 terminais de ferry, aeroportos e estações de trem ao redor do mundo. Pesquisadores podem encontrar a versão em formato .csv, compatível com Excel, no GitHub e também podem baixar os dados diretamente do site. Usando o mapa na página inicial, é possível ver quais locais específicos estão na lista, e o site chega a disponibilizar informações sobre rotas. Os proprietários do site podem ser contatados para obter informações ainda mais atualizadas. 174. MLVIS O MLVIS é um repositório de dados que combina análise visual com mineração de dados em tempo real. Isso possibilita explorar compreensões mais intuitivas dos dados, mesmo ao trabalhar com conjuntos de dados enormes. Dados de referência e aprendizado de máquina não relacional, juntamente com diferentes tipos de dados, como dados atribuídos e heterogêneos, estão entre os muitos recursos e opções disponíveis neste site. Para maior conveniência dos usuários, essas informações também podem ser baixadas em um único formato consistente. 175. Início dos Dados Abertos O Open Data Inception é um site que oferece links para mais de 2600 portais de dados. Utilizando a barra de pesquisa no topo, os pesquisadores podem buscar portais e conjuntos de dados por categoria e tema. Além disso, também é possível usar o site para encontrar a versão mais atualizada do conjunto de dados pesquisado. Aproveite a possibilidade de visualizar os portais de dados em formato de lista ou em formato visual interativo e comece a encontrar os dados necessários. 176. OpenDataSoft Disponível em francês, inglês e alemão, o OpenDataSoft é uma fonte que oferece acesso a 480 milhões de registros, 4 milhões de células de API e 9.284 conjuntos de dados. Usando a barra de pesquisa no meio da página inicial, os pesquisadores podem inserir uma palavra-chave ou categoria e encontrar o conjunto de dados mais adequado. Para jornalistas, essa é uma maneira mais rápida de encontrar os conjuntos de dados mais relevantes para concluir a pesquisa em questão. Visite o site para saber mais. 177. Mestre da Nação NationMaster é uma fonte de dados totalmente compilados de mais de 300 países, organizados em mais de 5.000 categorias. Os dados abrangem números como a porcentagem de óbitos registrados, estatísticas da Segunda Guerra Mundial e até mesmo informações sobre guerra nuclear e testes nucleares. Os pesquisadores também encontrarão tabelas, gráficos e diagramas que permitem uma visualização mais aprofundada dos dados. Em resumo, há tantos assuntos abordados que sempre há algo novo a descobrir nos dados. 178. Seguidorwonk O Twitter é há muito tempo uma rede social popular para notícias de última hora e para encontrar assuntos em alta. O Followerwonk permite que os usuários levem seu uso do Twitter para o próximo nível. Isso inclui encontrar outros usuários do Twitter para se conectar, analisar seus seguidores atuais e planejar atividades no Twitter para obter o máximo de resultados. Atualmente, muitos repórteres e jornalistas usam o Twitter para fazer networking e divulgar suas matérias. O Followerwonk torna os usuários do Twitter mais produtivos na plataforma. 179. Infochimps O Infochimps é um site que oferece serviços em nuvem que podem ser dimensionados para otimizar o uso de big data. É útil para a implementação e integração de tecnologias e aplicações de big data. Quando pesquisadores precisam analisar grandes volumes de dados ou avaliar tendências em big data, este é um recurso inestimável. O site também disponibiliza diversos artigos técnicos e estudos de caso para consulta. 180. Estatísticas arquivadas do governo nacional Fundado em 2006, o Archive-It é um serviço oferecido pelo Internet Archive. Este serviço auxilia organizações e empresas na criação de coleções digitais e, como resultado, teve a oportunidade de trabalhar com organizações sem fins lucrativos, faculdades, universidades e governos. Pesquisadores podem pesquisar em diversos arquivos disponíveis no site, como os sites da campanha eleitoral para o Congresso de 2014, o Arquivo Estadual do Alabama e o Arquivo Web PLN de Informações Governamentais do Canadá. Este site é um verdadeiro tesouro de informações para jornalistas empreendedores. 181. Espaços Cívicos O Civic Commons possui uma página que lista as diversas iniciativas governamentais de dados abertos. Essa lista de recursos, que permite buscas, está organizada por país, cidade, região e menciona até mesmo os recursos disponibilizados por organizações intergovernamentais. Para jornalistas, este site representa uma maneira mais rápida de descobrir quais governos participam do Projeto de Dados Abertos. O site também dá acesso a dados locais que não apareceriam necessariamente em uma simples busca no Google. 182. Governos Mundiais Guardiões O Guardian é um nome famoso no mundo do jornalismo por sua reputação em divulgar notícias de última hora. O que poucas pessoas sabem é que o site possui uma seção que oferece dados sobre governos ao redor do mundo. Há artigos sobre o impacto do aumento do número de pessoas sem-teto, discussões sobre segurança cibernética e até mesmo análises ponderadas sobre o papel que os dados e as estatísticas desempenham no atual cenário político e social. A seção Governos Mundiais do Guardian é capaz de impulsionar debates e encontrar ângulos interessantes para reportagens. 183. Dados Abertos do Governo (Centro) Este site pertence a um grupo da Open Knowledge Foundation com o objetivo de incentivar e apoiar o desenvolvimento contínuo de dados governamentais abertos. Aqui, os usuários encontrarão links para uma das listas mais extensas de catálogos de dados abertos disponíveis. Entre os objetivos adicionais mencionados no site, o grupo também busca informações sobre políticas, melhores práticas e diretrizes. Além disso, oferece aos jornalistas amplo acesso a mais e melhores informações. 184. Governo Aberto – França Este site é a plataforma online do projeto de dados abertos oferecido pelo Governo da França. É possível explorar os dados pesquisando por categorias como emprego, agricultura, educação, viagens e turismo. Esses dados permitem construir e desenvolver uma compreensão mais aprofundada do que eles realmente revelam, além de possibilitar comparações com base em informações históricas. Basicamente, jornalistas têm todos os motivos para se entusiasmar com a análise desses dados. 185. Universidade de Notre Dame Este site armazena os dados de pesquisa disponíveis por meio do uso do SourceForge.net pela Universidade de Notre Dame. Os dados são oferecidos em bancos de dados relacionais. Os despejos mensais de dados também possibilitam uma melhor compreensão do software de código aberto e suas aplicações. Para acessar essas informações, as solicitações de acesso devem ser feitas por escrito, via e-mail. A ressalva, porém, é que somente pesquisadores acadêmicos e científicos têm direito ao acesso aos dados. 186. Relatos de OVNIs O Centro Nacional de Relatórios de OVNIs possui um banco de dados online que detalha as experiências das pessoas com objetos voadores não identificados. Os pesquisadores podem otimizar suas buscas no banco de dados utilizando quatro categorias: data, formato do OVNI, data da publicação e até mesmo por estado. Os OVNIs são únicos porque sempre despertam a imaginação do público. Se houve algum encontro recente com o terceiro tipo nas proximidades, este é o lugar para descobrir o que as pessoas têm relatado. 187. WikiLeaks Notório e infame na mídia devido às controvérsias e ao que os vazamentos revelaram sobre o funcionamento interno do governo e de outras figuras famosas e poderosas da sociedade, o WikiLeaks tem uma reputação que o precede. Embora os vazamentos de dados raramente sejam feitos discretamente, ninguém jamais questiona a precisão das informações. Para jornalistas em busca de histórias que atraiam interesse imediato, o WikiLeaks é uma fonte comprovada. No mínimo, será uma leitura interessante. 188. O Washington Post O jornal já é conhecido como uma excelente fonte de notícias de última hora e artigos de opinião, mas poucas pessoas sabem que o Washington Post dá acesso aos dados brutos que são frequentemente mencionados em seus artigos. Na página de dados, pesquisadores podem encontrar informações em categorias como educação, censo, saúde e segurança, transporte e desenvolvimento, bancos de dados históricos da Copa do Mundo e até mesmo números relacionados a governo e política. Em resumo, ter acesso a esses dados ajuda as pessoas a desenvolverem uma compreensão mais concreta dos assuntos noticiados. 189. Dados climáticos O conjunto de dados climáticos fornece informações abrangentes sobre a temperatura global. No formato atual, os usuários podem visualizar todas as informações climáticas importantes por meio de grades, além de conferir as médias. Para quem busca dados complementares, é possível acessar as mesmas informações para terra e oceano. Essas informações podem ser baixadas, mas, para maior comodidade, também podem ser visualizadas diretamente no site. 190. Estrutura da proteína Protein Structure é uma fonte que busca examinar como as redes de computadores podem ser usadas em conjunto com a biologia. A página hospeda um repositório de dados que pode ser acessado pelos links fornecidos. De particular interesse para membros da comunidade científica é a forma como o site incorpora diversas ideias, como análise de modelos e biologia executável, em sua busca por esse objetivo. Para jornalistas, este site vale a pena ser visitado para acompanhar o progresso e examinar os dados. 191. Analise dados de pesquisas gratuitamente Com a ajuda deste site, os usuários podem fazer um curso de análise de dados de pesquisa gratuitamente. O curso "Analyze Survey Data Free" (Analise Dados de Pesquisa Gratuitamente), com seu sumário detalhado, inclui seções com títulos como "Mapas e a Arte da Pesquisa – Manutenção Ponderada", "Equilibrando a Confidencialidade do Respondente com a Precisão da Estimativa de Variância", "Modelos de Equações Estruturais (MEE)" e "Dados Complexos de Pesquisa". O site oferece uma ótima revisão para quem pretende lidar com dados estatísticos mais complexos no futuro. 192. UCLA No site wiki da UCLA, os pesquisadores encontrarão diversos conjuntos de dados disponíveis para fins de demonstração. Há uma grande variedade de dados simulados e observados para escolher. Utilizando esses recursos, é possível descobrir dados climáticos, populacionais, biomédicos, de neuroimagem, do censo dos EUA, eleitorais e econômicos, entre muitas outras categorias. Em suma, esses conjuntos de dados são um recurso que pode beneficiar muitas pessoas. 193. Universidade de Toronto Em sua página na internet, a Universidade de Toronto oferece aos pesquisadores acesso ao que chama de Conjuntos de Dados Delve. Essas coleções de dados faziam parte de um produto maior, desenvolvido com o objetivo de comparar diferentes métodos de aprendizado. Em última análise, essas informações servem para o desenvolvimento e a avaliação de diferentes abordagens de aprendizado. Resumindo, trata-se de uma fonte sólida para pesquisadores que desejam entender melhor como analisar e manipular conjuntos de dados. 194. Serviço de Conservação de Recursos Naturais O Serviço de Conservação de Recursos Naturais (Natural Resources Conservation Service) possui um site focado na promoção da conservação, oferecendo informações sobre os diferentes musgos, antóceros, plantas vasculares, líquens e hepáticas presentes nos Estados Unidos. Este site hospeda um banco de dados completo de plantas e imagens, além de uma vasta gama de informações. Pesquisadores podem baixar o banco de dados e encontrar inúmeras informações sobre tópicos como culturas alternativas. Essencialmente, este site contém tudo o que as pessoas precisam saber sobre plantas. 195. Serviço de Pesquisa Agrícola Como o próprio nome da agência sugere, este serviço atende às necessidades de pesquisa do Departamento de Agricultura dos EUA. Sempre que um problema agrícola é descoberto, esta é a parte do governo que provavelmente ajudou a encontrar uma solução. O site hospeda diversos conjuntos de dados que podem ser acessados e baixados diretamente. Jornalistas também podem usar este site para encontrar as últimas notícias relacionadas a questões que afetam a agricultura. 196. Biblioteca de Imagens Celulares Este site oferece uma biblioteca pública com recursos, informações e acesso a imagens e animações que retratam células e processos celulares. A Biblioteca de Imagens de Células foi concebida com o objetivo duplo de pesquisa e educação, e as informações aqui contidas são quase sempre relevantes em discussões sobre saúde pública e doenças. Os materiais provêm de uma combinação de fontes, incluindo publicações históricas e modernas. Para uma explicação completa que simplifica processos biológicos complexos, jornalistas podem contar com a Biblioteca de Imagens de Células como uma ferramenta essencial. 197. Genômica Completa Este é o site de uma empresa que se considera parte integrante do setor de biotecnologia na área de sequenciamento do genoma humano. Curiosamente, a Complete Genomics disponibilizou ao público diversas sequências de genomas completos. Isso oferece uma ampla gama de informações úteis sobre o DNA e o genoma humano sequenciado. A única condição para o uso desse material é que os pesquisadores que utilizarem essas informações façam as devidas referências à Complete Genomics. 198. Array Express O Array Express é um repositório que armazena informações provenientes de experimentos genômicos que exigiram sequenciamento ou processamento em larga escala. Neste site, os usuários encontrarão os resultados de mais de 70.000 experimentos, além de mais de 2 milhões de ensaios, distribuídos em múltiplos terabytes de dados. Melhor ainda, essas informações são gratuitas e podem ser reutilizadas para fins de pesquisa. Trata-se de um excelente recurso para obter as informações mais recentes sobre genômica e os avanços alcançados na área. 199. Codificar A Enciclopédia de Elementos de DNA, ou Consórcio ENCODE, é o resultado da colaboração entre grupos de pesquisa de todo o mundo. O objetivo final é compilar uma lista de todas as partes funcionais do genoma, incluindo a análise detalhada dos níveis de RNA, proteínas, elementos que regulam as células e a atividade dos genes. Há dados disponíveis para pesquisa, além de uma enciclopédia que oferece informações adicionais. 200. Conjuntos de Genomas O Ensemble Genomes é um site criado em 2000 que trata dos genomas de vertebrados. Ao longo dos anos, este recurso adicionou informações complementares sobre metazoários invertebrados, plantas, bactérias e fungos. Os dados sobre todos esses assuntos podem ser encontrados e acessados clicando nos links disponíveis no site. Este site oferece tutoriais, conjuntos de dados sobre todos os tópicos abordados e uma coleção de documentos para consulta. Todos esses fatores fazem do Ensemble Genomes uma fonte de dados fantástica para jornalistas. 201. Consórcio de Ontologia de Genes A Gene Ontology é um site criado com o propósito expresso de encontrar uma maneira de representar computacionalmente o conhecimento atual sobre o funcionamento dos genes. Possui diversas publicações, além de documentação adicional disponível para consulta. Há anotações hospedadas diretamente no site. A boa notícia para pesquisadores que desejam analisar os números e os dados brutos mais detalhadamente é que os arquivos estão disponíveis para download diretamente no site. 202. Biblioteca de Assinaturas Celulares Integradas Baseadas em Rede O Centro LINCS da Escola de Medicina de Harvard existe com o propósito de ajudar a comunidade científica e o público em geral a aprenderem mais sobre como as células humanas reagem quando são afetadas por medicamentos. Utilizando o banco de dados do LINCS da HMS e a ferramenta de exploração de projetos, pesquisadores podem encontrar publicações e resumos de projetos, bem como recursos gerais. Jornalistas também podem usar este site para obter as últimas notícias e informações resultantes desta pesquisa. 203. Projeto de Diversidade do Genoma Humano O Projeto de Diversidade do Genoma Humano tem obtido grandes avanços graças aos esforços do Centro do Genoma Humano de Stanford. O site disponibiliza milhares de amostras e marcadores, que podem ser baixados, visualizados e analisados detalhadamente através dos links fornecidos na página. Trata-se de um excelente recurso para jornalistas que desejam compreender as informações provenientes da comunidade científica. 204. JCB DataViewer O JCB DataViewer permite que os interessados no conteúdo do Journal of Cell Biology visualizem os dados de imagem associados aos artigos publicados. O site possui uma galeria completa que pode ser navegada para visualizar o material. Além disso, os usuários também têm a opção de realizar análises mais detalhadas dos dados enquanto exploram o site. Em resumo, este site é perfeito para compreender as referências e figuras presentes nos artigos da revista. 205. Portal de Dados Genômicos Comuns O Portal de Dados do GDC é uma plataforma projetada para auxiliar pesquisadores e profissionais da área de bioinformática a realizar pesquisas sobre câncer de forma mais eficiente. Dispõe de um arquivo, uma API, além de documentos disponíveis para leitura e outros recursos. O acesso a este site permite visualizar as mesmas informações que os pesquisadores de câncer utilizam em suas próprias pesquisas. Nele, jornalistas poderão encontrar todos os dados que procuram e muito mais. 206. Opensp O Opensp é um projeto colaborativo criado com o objetivo de compartilhar genótipos. Pessoas que tiveram seus genótipos determinados por meio de testes como FamilyTreeDNA, 23andMe ou deCODEme podem enviar essas informações para o site. O propósito de solicitar esse compartilhamento é permitir que o site se concentre em identificar possíveis conexões entre genótipos e SNPs, ou polimorfismos de nucleotídeo único. O que é particularmente interessante para jornalistas é a disponibilidade de dados para download, permitindo que as pessoas os analisem livremente. 207. Guia de Caminho O Pathguide é um site dedicado a fornecer informações sobre vias metabólicas e de sinalização, bem como sobre as interações entre proteínas em nível molecular. Esta página contém uma lista de aproximadamente 697 recursos relacionados ao tema principal. Os bancos de dados vinculados a este site são, em geral, de acesso gratuito. A maioria das referências fornecidas nesta lista de recursos concentra-se principalmente na interação proteína-proteína. Este site é um recurso inestimável para entusiastas da biologia. 208. RCSB PBB Este site é dedicado a informar acadêmicos e o público em geral sobre tudo relacionado a ácidos nucleicos e proteínas. O RCSB Protein Data Bank oferece acesso a diversas ferramentas projetadas para tornar esse aspecto da biologia mais compreensível, incluindo ferramentas de visualização, visualização de estruturas 3D e um arquivo totalmente pesquisável que pode ser categorizado por tipo de organismo. Além disso, este site oferece notícias atualizadas sobre os últimos avanços nessa área. 209. Consórcio de Genômica Psiquiátrica O Consórcio de Genômica Psiquiátrica é fruto da colaboração entre pesquisadores e cientistas de todo o mundo que trabalham em pesquisas sobre o componente genético dos transtornos psiquiátricos. Ao final, este projeto produziu 17 artigos principais e mais 31 artigos de desenvolvimento, oferecendo análises secundárias e metodologia, culminando em um artigo de referência. O Consórcio oferece ferramentas, downloads e acesso aos resultados por meio do portal de acesso a dados, mediante solicitação. 210. Química de Pub O PubChem é um nome respeitado na área de pesquisa médica e biológica há muito tempo. Oferecendo a possibilidade de busca por estruturas, além de bancos de dados de Compostos, Bioensaios e Substâncias, os pesquisadores não podem errar ao escolher este site. Além disso, cada um desses bancos de dados contém milhões de registros. Essas informações podem ser visualizadas por meio de ferramentas como as de conformação 3D e as de Bioensaios. Os dados também estão disponíveis para download. 211. CÓSMICO Como o próprio nome sugere, o Catálogo de Mutações Somáticas no Câncer (COSMIC) dedica-se ao registro e à exploração dos efeitos das mutações somáticas no câncer. O site permite pesquisar no COSMIC por tipo de câncer, gene e mutação. Existem ferramentas no COSMIC, como o navegador genômico e o navegador de câncer. Além disso, também estão disponíveis para download no site dados sobre curadoria de genes, resistência a medicamentos, triagens genômicas, assinaturas mutacionais e curadoria de fusões gênicas. 212. Genômica da Sensibilidade a Medicamentos no Câncer O projeto Genômica da Sensibilidade a Medicamentos no Câncer dedica-se à busca de biomarcadores que auxiliem os médicos a identificar o tipo de medicamento anticancerígeno ao qual os pacientes têm maior probabilidade de responder. Jornalistas podem utilizar as abas de notícias para se manterem atualizados sobre a disponibilidade de novos dados ou alterações no site. Além disso, há também uma compilação de dados sobre linhagens celulares, um banco de dados que descreve as características do câncer e até mesmo uma lista de compostos, todos disponíveis para consulta no site. 213. Instituto Stowers de Pesquisa Médica O site do Instituto Stowers de Pesquisa Médica oferece acesso gratuito ao público em geral aos dados que seus cientistas, pesquisadores e especialistas em genômica utilizaram em suas publicações. Para o público em geral, o instituto faz questão de ressaltar que o Repositório de Dados Originais do Stowers é normalmente de acesso gratuito. Dito isso, alguns dos arquivos maiores do banco de dados podem não ser acessíveis diretamente pela internet e podem exigir providências adicionais. 214. Banco de dados SSBD O banco de dados de Ciência de Sistemas da Dinâmica Biológica, geralmente abreviado como SSBD, fornece um conjunto de ferramentas e recursos para serem usados com o objetivo de examinar imagens microscópicas e avaliar dados biológicos quantitativos. As imagens encontradas neste site provêm de diversas fontes e incluem objetos como células, moléculas individuais e núcleos de expressão gênica. Como os dados deste site são obtidos por meio de simulação computacional e experimentos, os jornalistas podem ter certeza de que as informações aqui presentes são constantemente refinadas e atualizadas. 215. Compartilhamento de genomas pessoais O Projeto Genoma Pessoal é um site focado na criação de dados de saúde, genoma e características que são abertos e acessíveis ao público. Dando continuidade ao projeto em grande parte com a ajuda de indivíduos que se voluntariaram para tornar públicas suas informações genômicas, este site oferece gratuitamente ao público os dados que encontrou e obteve com sucesso. Além da ciência, este projeto oferece aos jornalistas uma visão interessante dos efeitos da criação de um registro público de informações genômicas pessoais. 216. Navegador Genômico UCSC O USCS Genome Browser permite que indivíduos visualizem montagens de genomas. Além da visualização online, o site também fornece links que podem ser usados para baixar as sequências e anotações dessas mesmas montagens de genomas. Esses links estão divididos nas categorias de humanos, mamíferos, outros vertebrados, deuterostômios, insetos, nematóides, outros genomas e outros downloads. As ferramentas e diretórios deste site também são gratuitos para uso pessoal e não comercial. Jornalistas podem se beneficiar da abrangência e acessibilidade dessas informações. 217. UniProt O Universal Protein Resource, conhecido como UniProt, é o local ideal para obter informações sobre sequenciamento e anotação de proteínas. Com base nas informações fornecidas por três bancos de dados — os UniProt Reference Clusters, o UniProt Knowledgebase e o UniProt Archive — este site oferece buscas por peptídeos e clusters, entre outras funcionalidades. Jornalistas podem usar este site para verificar, descobrir e aprender mais sobre novas descobertas na área de sequenciamento e anotação de proteínas. 218. Dados do Índice Climático dos Atuários O Índice Climático dos Atuários, também conhecido como ACI, fornece ao público em geral e aos tomadores de decisão informações sobre as tendências climáticas e o impacto das mudanças climáticas no Canadá e nos EUA. Pesquisadores podem consultar as informações disponibilizadas por essa ferramenta educacional para identificar e descobrir mudanças significativas no clima e nos oceanos. É possível refinar a busca por regiões e componentes. Este site possui décadas de dados disponíveis e atualiza suas informações trimestralmente. 219. Centro de Meteorologia da Aviação O Centro de Meteorologia Aeronáutica fornece informações meteorológicas precisas, oportunas e atualizadas, nas quais o sistema de espaço aéreo pode confiar. Neste site, os usuários podem visualizar diversos gráficos, previsões e observações meteorológicas apresentados de forma acessível aos aviadores. É possível visualizar as informações fornecidas pelas fontes de dados do site em tempo real, por meio de arquivos .csv ou XML. Pesquisadores podem manipular e observar os dados brutos mais detalhadamente através da opção de download. 220. Unidade de Pesquisa Climática O site da Unidade de Pesquisa Climática existe com o propósito expresso de realizar pesquisas sobre os efeitos das mudanças climáticas no passado, estudar as causas e encontrar soluções para os problemas das mudanças climáticas no presente. Nele, as pessoas podem ler os resultados das pesquisas, obter uma visão geral do assunto por meio de fichas informativas, ler publicações e até mesmo acessar os dados brutos. Jornalistas em busca de conjuntos de dados meteorológicos brutos encontrarão neste recurso uma excelente opção. 221. Avaliação e conjunto de dados climáticos europeus No site do Conjunto de Dados e Avaliação Climática Europeia, o público pode encontrar informações sobre mudanças climáticas extremas ou meteorológicas. Os pesquisadores têm a opção de usar a ferramenta de pesquisa do projeto, chamada KNMI Climate Explorer, para verificar dados, examinar previsões sazonais e até mesmo analisar mais detalhadamente os efeitos do El Niño, entre outras aplicações. Como esse conjunto de dados é atualizado diariamente, os jornalistas que utilizam essa fonte serão os primeiros a saber sobre quaisquer sinais de mudanças climáticas extremas. 222. Serviços de navegação de imagens globais O Global Imagery Browse Services, ou GIBS, é uma parte essencial do EOSDIS, desempenhando um papel fundamental como provedor de serviços de imagens responsivos e baseados em padrões da comunidade. Em outras palavras, o GIBS permite que pessoas comuns interajam com imagens de satélite capturadas de praticamente qualquer lugar da Terra em alta definição. Como o GIBS do EOSDIS é disponibilizado por meio dos dados de ciências da Terra da NASA, tornou-se mais fácil do que nunca para jornalistas e pesquisadores aprenderem mais sobre o mundo em tempo real. 223. Clima e Ecossistema de Bering Operando sob a administração da Administração Nacional Oceânica e Atmosférica (NOAA) do governo dos Estados Unidos, este site fornece a jornalistas e pesquisadores todas as informações que eles possam querer saber sobre como o clima e o ecossistema do Mar de Bering estão reagindo às mudanças ocorridas no Ártico. Aqui, é possível ler ensaios, consultar projeções e usar a ferramenta de dados online para verificar o desempenho de diversos índices climáticos, dados biológicos, atmosféricos, oceânicos e da vida selvagem no Mar de Bering. 224. NCEI O NCEI, ou Centros Nacionais de Informação Ambiental, é o resultado final da fusão dos três centros de dados da Administração Nacional Oceânica e Atmosférica (NOAA). Esta página contém uma série de links divididos em 22 categorias que direcionarão os usuários a diferentes recursos, páginas de interesse e conjuntos de dados climáticos e meteorológicos. Jornalistas em busca de informações sobre clima, tempestades, precipitação e uma série de outros assuntos relacionados ao tempo provavelmente encontrarão o que procuram aqui. 225. Laboratório de Pesquisa do Sistema Terrestre A Divisão de Monitoramento Global da Administração Nacional Oceânica e Atmosférica (NOAA) fornece informações sobre as tendências de longo prazo das forças da mudança climática na Terra por meio do monitoramento de métricas atmosféricas essenciais. Entre elas, podemos citar o monóxido de carbono, o metano, o óxido nitroso e o dióxido de carbono, por exemplo. Essas métricas são então usadas para medir aspectos como a depleção da camada de ozônio a longo prazo, as fontes e os níveis de dióxido de carbono, bem como os sumidouros. Este é um recurso sobre mudanças climáticas que jornalistas podem utilizar. 226. WorldClim – Dados Climáticos Globais Sempre quis uma maneira melhor de visualizar dados climáticos? O WorldClim é um software que fornece dados gratuitos que podem ser usados para modelagem espacial e criação de mapas. A versão atual deste software gratuito só pode ser aplicada ao clima atual, enquanto a versão antiga permite o acesso a dados climáticos do passado e do presente, além de possibilitar a visualização das previsões climáticas futuras. Jornalistas podem simplesmente acessar o link e baixar o software. 227. Laboratório de Descoberta de Conhecimento O Laboratório de Descoberta de Conhecimento (Knowledge Discovery Laboratory) é um site dedicado ao desenvolvimento de tecnologias inovadoras, aos fundamentos da aprendizagem de máquina e à aplicação desse conhecimento em áreas práticas como ciência de redes, detecção de fraudes e análise de dados científicos. O site hospeda um conjunto de dados considerável no DBLP, com 1,2 milhão de objetos e 2,48 milhões de links. Para pesquisadores interessados nos objetivos do Laboratório de Descoberta de Conhecimento, este conjunto de dados é um excelente recurso. 228. Desafio de Implementação do DIMACS O site do 9º Desafio de Implementação tem como objetivo auxiliar pesquisadores a aprenderem como resolver problemas de caminho mais curto. Para os criadores, o site foi desenvolvido com dois objetivos em mente. Primeiro, encontrar as melhores soluções reproduzíveis. E segundo, facilitar a colaboração entre pesquisadores e a descoberta de soluções mais eficazes. Pesquisadores interessados em acompanhar o progresso alcançado podem consultar os artigos e os conjuntos de dados disponíveis no site. 229. Repositório de Rede O Repositório da Rede é um site onde dados científicos são armazenados com a adição de ferramentas visuais interativas que os usuários podem acessar e analisar. Este site detém a dupla distinção de ser o primeiro repositório do seu tipo e também o maior da web. Utilizando dados gráficos e imagens intuitivas e visualmente atraentes, fazer comparações e encontrar novas maneiras de contextualizar os dados torna-se muito mais fácil. Jornalistas podem usar esta fonte para encontrar histórias dentro dos dados científicos. 230. Conjuntos de dados Pajek O Pajek Datasets é uma página que fornece um conjunto de dados sobre as interações entre proteínas encontradas em leveduras em brotamento. Após uma breve explicação sobre o impacto da descoberta de novos métodos para detectar interações, juntamente com os motivos pelos quais é essencial discernir a importância de várias interações proteína-proteína, o site direciona os visitantes diretamente para um conjunto de dados disponível para download. Para saber mais, os pesquisadores podem clicar no link na parte inferior da página para ler o artigo publicado sobre o assunto. 231. Dados da Rede Mejn Este site tem como objetivo compartilhar links para conjuntos de dados de redes que o proprietário do site utilizou e compilou. Os temas dos conjuntos de dados variam desde futebol americano universitário, blogs políticos e livros sobre política americana, até redes sociais, Os Miseráveis e colaborações em teoria de alta energia. Indivíduos com interesse em explorar esses temas encontrarão uma ampla variedade de conjuntos de dados para escolher. Além disso, os dados são de uso gratuito, desde que as devidas referências sejam citadas. 232. O Stanford GraphBase O Stanford GraphBase é o nome dado a um conjunto de dados e programas criado por Donald Knuth, da Universidade Stanford. Quando usados em conjunto, esses programas e conjuntos de dados permitem manipular e gerar grafos e redes. Neste site, os materiais necessários estão disponíveis para download através dos links. Nesses arquivos, pesquisadores encontrarão dados de placares de futebol, dados de dicionários, dados referentes à reconstrução da Mona Lisa e muitos outros. 233. Coleção de matrizes esparsas SuiteSparse Anteriormente conhecida como Coleção de Matrizes Esparsas da Universidade da Flórida, a Coleção de Matrizes Esparsas SuiteSparse é uma coleção de matrizes com aplicações práticas. Segundo o site, essa coleção é frequentemente utilizada em álgebra linear numérica para o desenvolvimento e aprimoramento de algoritmos de matrizes esparsas. Os usuários apreciam a coleção por sua utilidade na execução e teste de resultados de experimentos. Os conjuntos de dados e benchmarks de matrizes estão disponíveis para download diretamente no site. 234. Conjuntos de dados de grafos Este é um conjunto de dados que os criadores desta página web acreditam ser relacionais ou passíveis de serem bem representados em grafos. O Graph Datasets oferece conjuntos de dados como os do Predictive Toxicology Challenge, IMDb, mutagenesis, MovieLens, collaborative filtering e proteins para pesquisadores que desejam aprender a trabalhar com números brutos. Os arquivos estão disponíveis nesta página e podem ser baixados principalmente em formato XML. 235. Notícias sobre Big Data O Big Data News é um site focado em big data e nos fundamentos da ciência de dados. Nele, você encontra as últimas notícias e discussões sobre aprendizado profundo e Inteligência Artificial. Além disso, o Big Data News também abriga um enorme conjunto de dados com aproximadamente 3,5 bilhões de páginas da web. Essas páginas estão organizadas em níveis denominados, respectivamente, grafo de nível de página, grafo de nível de subdomínio, grafo de subdomínio de primeiro nível e grafo de nível de domínio. 236. Centro de Pesquisa em Redes e Sistemas Complexos O CNetS, ou Centro de Pesquisa de Redes e Sistemas Complexos, opera sob a égide do Instituto de Ciência de Redes da Universidade de Indiana e da Escola de Informática e Computação. O site tem como objetivo ser um recurso nas áreas de ciência de dados, ciência social computacional e redes e sistemas complexos, com informações sobre mineração e padrões de tráfego online. Além disso, o CNetS também hospeda um conjunto de dados contendo aproximadamente 53,5 bilhões de solicitações de rede feitas por usuários da Universidade de Indiana. 237. Explorador OONI O OONI Explorer, parte do Observatório Aberto de Interferência de Rede (Open Observatory of Network Interference - OONI), é um projeto dedicado a fornecer software livre e de código aberto. Os usuários podem usar o software para testar o bloqueio de sites e aplicativos de mensagens, entre outros. De particular interesse para quem se interessa por essa tecnologia é a disponibilidade de acesso gratuito aos dados brutos coletados pelo OONI. Basta inserir as informações no OONI Explorer e interagir com os dados a partir daí. 238. Desafios no Aprendizado de Máquina O site Challenges in Machine Learning dedica-se à pesquisa e ao desenvolvimento de aprendizado de máquina. Nele, os leitores encontrarão links para softwares, livros, desafios de aprendizado de máquina, além de notificações sobre workshops futuros. O site oferece inclusive links para desafios que permitem o envio de trabalhos após o prazo. Para jornalistas interessados em verificar se o aprendizado de máquina pode realizar tarefas como previsão financeira ou classificação de páginas da web, este é um site que vale a pena visitar. 239. DataX Atualmente operando sob a égide da CrowdANALYTIX, a DataX é a parte de aprendizado de máquina de uma iniciativa impulsionada pela comunidade que aproveita o poder do coletivo para criar aplicações personalizadas de Inteligência Artificial, aprendizado de máquina e Programação Neurolinguística. O papel da DataX nesse processo é a manutenção e a implantação, que, por sua vez, contribuem para a escalabilidade dessas soluções. Para jornalistas que precisam analisar grandes volumes de texto, vídeo e dados, os bots disponíveis por meio da CrowdANALYTIX e da DataX podem reduzir o tempo de pesquisa pela metade. 240. Dados orientados A Driven Data combina crowdsourcing com ciência de dados de uma forma que quase nenhum outro site faz. Enfatizando seu papel em fornecer assistência a organizações que enfrentam diferentes desafios sociais, este site oferece ajuda colocando sua substancial comunidade de cientistas de dados para trabalhar na criação de modelos estatísticos que resolvem questões preditivas. A Driven Data parece trabalhar principalmente com organizações sem fins lucrativos, mas é potencialmente útil para qualquer pessoa que tenha dados brutos que precisem ser refinados. Jornalistas podem se beneficiar ao manter esta fonte em mente. 241. Dados Abertos em Grande Escala A API Dandelion é um aplicativo que realiza análise semântica de texto para big data. Isso significa que, para quem precisa processar grandes volumes de dados, o programa consegue analisar textos desorganizados e contextualizá-los. Jornalistas que precisam analisar muitos documentos certamente se beneficiarão dessa funcionalidade. A API Dandelion também oferece Big Data Aberto nas categorias Milão, Trento e Europa. Embora a API seja paga, há uma quantidade diária de texto que pode ser analisada gratuitamente. 242. Modelos da Terra O Earth Models concentra-se no compartilhamento e armazenamento de softwares e conjuntos de dados relacionados à Terra. As ferramentas de modelagem mencionadas no site incluem softwares de simulação e processamento, bem como dados virtuais que se baseiam fortemente em áreas específicas de estudo, como tectônica e sismologia. Jornalistas e pesquisadores que desejam aprimorar seus conhecimentos sobre o assunto podem utilizar as publicações e artigos deste site antes de se aprofundarem nas ferramentas de modelagem e visualização. 243. Centro de Dados e Aplicações Socioeconômicas (SEDAC) O Centro de Dados e Aplicações Socioeconômicas (SEDAC) é um dos centros de dados associados ao sistema EOSDIS da NASA. Neste site, os leitores encontrarão conjuntos de dados que oferecem informações sobre mudanças climáticas ou dados demográficos em formato de grade. Os conjuntos de dados também podem ser pesquisados por temas como Governança, Agricultura, Uso da Terra, Saúde, Conservação, Clima, Água, Sensoriamento Remoto e Pobreza. Há também mapas, galerias, guias que fornecem mais contexto aos dados, além de recursos e ferramentas adicionais que os pesquisadores podem acessar no site. 244. Portal AODN O Portal AODN, um site mantido pela Rede Australiana de Dados Oceânicos (Australian Ocean Data Network), oferece acesso a dados climáticos e marinhos australianos. Pesquisadores que acessam essas informações também terão acesso aos dados do IMOS e aos metadados, uma estrutura de pesquisa apoiada por diversas instituições, incluindo o governo australiano. Os pesquisadores que optarem por utilizar o Portal AODN podem esperar um excelente acesso aos dados oceânicos em uma interface intuitiva. 245. Planeta OS O Planet OS oferece uma estrutura de big data com ênfase em energia renovável. Essa escolha de nicho, aliada à eficiência do site, o tornou popular entre empresas de energia em busca de novas maneiras de visualizar e contextualizar seus dados. Além disso, o site também possui o DataHub, que hospeda uma coleção substancial de mais de 2.000 conjuntos de dados. Esses conjuntos de dados incluem dados abertos da NASA e do Copernicus, e são atualizados com frequência. 246. INSTITUIÇÃO SMITHSONIAN O Smithsonian é há muito tempo um nome acadêmico respeitado e é apreciado em todo o mundo por seu compromisso com a pesquisa e a história. De certa forma, é natural que o Smithsonian tenha um site que ofereça algumas das melhores informações online sobre pesquisa vulcânica. O site publica relatórios, links para pesquisas e bancos de dados que incluem buscas específicas por vulcões, erupções, emissões e deformações, além da lista e planilha de vulcões do Holoceno. Jornalistas não precisarão de outra fonte sobre atividade vulcânica. 247. Catálogo de Terremotos Atualizado e mantido pelo Programa de Riscos de Terremotos do governo dos EUA, o Catálogo de Terremotos permite que pesquisadores vejam quando e onde ocorreu o último terremoto. Embora os resultados da busca sejam limitados a 20.000, o catálogo permite filtrar os resultados por magnitude, data e hora, e até mesmo por região geográfica. Esse nível de flexibilidade torna esse recurso particularmente útil para jornalistas que estão cobrindo um desastre natural ou um terremoto local e buscam informações adicionais. 248. Associação Econômica Americana A Associação Econômica Americana fornece aos pesquisadores dados macroeconômicos dos EUA e de outros países ao redor do mundo. Este site não parece produzir dados econômicos em si, mas sim compilar uma lista concisa dos mais confiáveis. No entanto, considerando a quantidade de sites que oferecem informações econômicas na internet, este é um recurso que os jornalistas podem considerar confiável. Basta acessar o site e navegar pelas categorias de dados econômicos de acordo com suas necessidades. 249. Estatísticas históricas.org O Historicalstatistics.org é um site incrivelmente útil para encontrar informações econômicas que apresentem um contraste interessante com o presente. Por exemplo, o conversor de moedas histórico do site permite que pesquisadores descubram o que uma pessoa com US$ 10 em 1923 poderia comprar hoje. Ele também hospeda publicações e artigos que abordam questões sobre as métricas utilizadas no campo da história econômica, juntamente com índices de preços e informações sobre a oferta monetária, que podem ser filtradas por país. 250. DB Nomics E se todos os dados econômicos públicos da internet pudessem ser acessados e pesquisados em uma única plataforma, fácil de navegar? O Db.nomics é um agregador de bancos de dados econômicos que busca fazer exatamente isso. Os dados estão disponíveis em formatos como HTML, JSON e CSV, e são atualizados automaticamente, enquanto as versões anteriores são arquivadas. As fontes econômicas incluem o Federal Reserve, o Bureau of Economic Analysis, o Fundo Monetário Internacional e outras. Pesquisadores em busca de dados econômicos confiáveis não se arrependerão de escolher o Db.nomics. 251. Centro Conjunto de Dívida Externa (JEDH) Desenvolvido pelo Banco de Compensações Internacionais (BIS), pela Organização para a Cooperação e Desenvolvimento Econômico (OCDE), pelo Fundo Monetário Internacional (FMI) e pelo Banco Mundial, o Centro Conjunto de Dívida Externa (Joint External Debt Hub) torna acessíveis ao público informações sobre dados da dívida e credores e devedores internacionais. Jornalistas que investigam as finanças de diferentes nações e buscam uma compreensão mais profunda do cenário financeiro internacional encontrarão praticamente tudo o que desejam saber aqui. 252. Dados do Comércio Internacional Compilada com a valiosa contribuição de Jon Haveman, um dos principais especialistas em economia, esta página sobre Dados de Comércio Internacional disponibiliza dados que podem ser baixados e analisados. Os conjuntos de dados incluem informações sobre tarifas alfandegárias, tabelas Penn World, serviços públicos, dados de importação, produtividade industrial, classificações de mercadorias, Códigos de Diferenciação de Produtos Rauch, dados do NBER (National Bureau of Economic Research), a pesquisa de fluxo de mercadorias de 1997, comércio e imigração, e o modelo gravitacional útil. O sistema operacional utilizado para compilar esses dados é o UNIX, mas o site informa que computadores pessoais também devem ter acesso a eles. 253. Empresas Abertas Na OpenCorporates, os pesquisadores têm a vantagem de pesquisar e encontrar informações em um dos maiores bancos de dados abertos de empresas do mundo. Essas informações são utilizadas por diferentes grupos ao redor do mundo, como bancos, investigadores, ONGs e jornalistas, em seus esforços para obter inteligência e informações. Os jornalistas têm o benefício adicional de poder acessar os dados em tempo real com a ajuda da API da OpenCorporates, bem como por meio dos dados principais em massa ou outros conjuntos de dados principais. 254. Nosso Mundo em Dados O Our World in Data coleta informações de diversas fontes em várias áreas e apresenta dados quantificados sobre elas. De números sobre a participação das mulheres na força de trabalho a informações sobre a percepção geral da corrupção no setor público e a desigualdade de renda global, se o assunto pode ser discutido em termos de dados, este site provavelmente terá uma entrada sobre ele. Jornalistas podem usar esta fonte para encontrar estatísticas e números relacionados a questões sociais. 255. Ciência Po A Sciences Po, ou Instituto de Estudos Políticos, como é mais conhecida, é uma instituição de inegável influência nas ciências sociais. Neste caso, a página de Thierry Mayer inclui arquivos de dados com regressões sobre gravidade e conflitos militares, provenientes do estudo "Make Trade Not War" (Faça Comércio, Não Guerra), além de conjuntos de dados sobre potencial de mercado, entre outros. Jornalistas que buscam compreender melhor as conclusões alcançadas em periódicos acadêmicos encontrarão muitas informações úteis ao navegar por este site. 256. Centro de Dados Internacionais Desde sua estreia em 1999, o Centro de Dados Internacionais tem se dedicado à sua missão de coletar, criar, aprimorar e distribuir dados econômicos internacionais, tanto offline quanto online. No site, os leitores podem acessar informações como dados tarifários dos EUA, importações e exportações mundiais e dos EUA, e até mesmo informações da Penn World Table. Com essas informações disponibilizadas ao público para fins educacionais e de pesquisa, jornalistas podem acessar e usar esses dados gratuitamente. 257. Observatório da Complexidade Econômica O Observatório da Complexidade Econômica, comumente conhecido como OEC, permite que pesquisadores, estudantes, economistas e qualquer pessoa visualizem dados do comércio internacional. Com seus temas atraentes e interface interativa, este site oferece aos pesquisadores uma oportunidade legítima de explorar informações sobre comércio internacional de maneiras nunca antes vistas. Para jornalistas que gostam de ver dados econômicos ganharem vida enquanto os pesquisam, o OEC é um recurso inestimável. 258. Dados do boletim de desempenho universitário O ensino superior é um tema polêmico em muitos círculos, com estudantes e famílias querendo saber o desempenho das instituições e a qualidade do aprendizado dos alunos. Por meio do College Scorecard, o Departamento de Educação dos EUA fornece a educadores e estudantes todas essas informações e muito mais. Esses dados abrangem o período de 1996 a 2016 e incluem informações atuais, dados do scorecard, rendimentos após a conclusão do curso e novos dados do Sistema Nacional de Dados de Empréstimos Estudantis (NSLDS). É uma fonte de informações atualizadas sobre o ensino superior que jornalistas devem utilizar. 259. Conjunto de dados de energia para edifícios comerciais Como um conjunto de dados que trata principalmente de energia, o COMBED possui, automaticamente, um status de exclusividade. Somando-se a isso o fato de seus dados serem atualizados várias vezes por minuto, mesmo sendo provenientes de um edifício comercial, fica evidente que este conjunto de dados é único. Para jornalistas, essa informação é extremamente útil na preparação de uma matéria sobre consumo de energia. Acessar os dados do COMBED é tão simples quanto baixar e abrir uma planilha do Excel. 260. Conjunto de dados DRED A sigla DRED, em DRED Database, significa Dutch Residential Energy Dataset (Conjunto de Dados de Energia Residencial Holandesa). Como o nome sugere, esses dados medem e estudam quanta energia uma residência individual na Holanda consome. Informações sobre ambiente, ocupação, eletricidade e dados gerais da residência foram monitoradas neste conjunto de dados entre 5 de julho de 2015 e 5 de dezembro de 2015. Jornalistas que pesquisam consumo de energia se beneficiarão ao consultar os números brutos fornecidos aqui. As instruções para baixar os dados em formato CSV podem ser encontradas diretamente no site. 261. Conjunto de dados ECO ECO, sigla para Consumo de Eletricidade e Ocupação, é um projeto operado e gerenciado pelo Grupo de Sistemas Distribuídos. A premissa deste projeto consistia em pesquisadores monitorarem as cargas e detectarem a ocupação em seis residências suíças ao longo de 8 meses. Este site oferece acesso a essas informações, bem como instruções e links para publicações relacionadas. Graças ao painel visualmente interativo do site, jornalistas não terão dificuldades em traduzir a pesquisa em algo atraente. 262. Conjunto de dados indiano para água ambiente e energia O IAWE, sigla para Conjunto de Dados Indiano para Água e Energia Ambiente, foi criado com o objetivo de monitorar o consumo de energia de uma residência em Nova Déli, por meio de medições de eletricidade de eletrodomésticos, do medidor de energia e do quadro de distribuição. Devido a interrupções no fornecimento de água, variações na oferta de dados, perda de pacotes e flutuações de tensão, o IAWE enfrentou problemas específicos do monitoramento do consumo de energia na Índia. Esses dados são extremamente úteis para jornalistas que desejam analisar padrões de consumo de energia. 263. Consumo de eletricidade por eletrodoméstico no Reino Unido O UK Domestic Appliance-Level Electricity, ou UK-DALE, é o nome dado a um conjunto de dados que monitora e registra quanta energia é consumida em um grupo de cinco residências. A cada seis segundos, o UK-DALE mede a demanda tanto da rede elétrica principal quanto dos eletrodomésticos individuais em cada casa. Jornalistas interessados em saber como as residências no Reino Unido usam energia certamente podem se beneficiar do UK-DALE. Os dados são acessíveis e há um artigo descrevendo o sistema disponível para leitura. 264. ArcGIS O ArcGIS Hub é uma plataforma que organizações e indivíduos podem usar para atingir objetivos por meio de iniciativas abrangentes. Com modelos de página, guias passo a passo e exemplos disponíveis para visualização, este site é um excelente recurso para agentes de mudança social ambiciosos. Enquanto isso, as informações disponíveis na aba Dados Abertos hospedam centenas de conjuntos de dados somente na categoria "Desastres". Seja para jornalistas que pesquisam dados ou para aqueles que os contribuem, o ArcGIS Hub é útil de diversas maneiras. 265. SIG de Cambridge O Cambridge GIS é o repositório de dados abertos da cidade de Cambridge, Massachusetts. Com exceção dos arquivos muito grandes para serem baixados por meio deste repositório do GitHub, a maioria dos conjuntos de dados da cidade pode ser encontrada nesta página. Os conjuntos de dados individuais disponíveis aqui incluem distritos comerciais, servidões, zonas de zoneamento, resultados do censo, cemitérios e outros marcos e características que podem ser quantificados por meio de dados. Um jornalista em busca de informações locais encontrará tudo o que procura e muito mais neste site. 266. Geo-Wiki.org Como recurso, o Geo-Wiki é um site dedicado ao que denomina "movimento de ciência cidadã". Nele, os cidadãos são incentivados a experimentar o monitoramento ambiental. Pesquisadores podem encontrar as últimas notícias na barra lateral, juntamente com os nomes das publicações e downloads gratuitos de conjuntos de dados e softwares. As ferramentas disponibilizadas pelo site incluem mapas, uploads de dados pessoais, validações e hackathons que podem ser baixados em formato Excel e arquivos zip. 267. OpenStreetMap Os dados extraídos do OpenStreetMap provêm do projeto OpenStreetMap, uma iniciativa online contínua que busca criar um mapa-múndi por meio das edições e esforços da comunidade global de usuários. Para começar a usar essa fonte de dados, basta que os editores de conteúdo escolham o continente desejado e, em seguida, o país. O download deste material da Geofabrik GmbH é gratuito e os dados são atualizados diariamente, em geral. 268. Dados Abertos HIFLD Operado e mantido pelo Departamento de Segurança Interna dos EUA, o HIFLD (Homeland Infrastructure Foundation-Level Data) disponibiliza dados geoespaciais em domínio público. Esses dados são distribuídos com o propósito expresso de fornecer suporte e informações para fins de pesquisa e preparação na comunidade. Os dados podem ser baixados em formato Shapefile e CSV e também podem ser visualizados na web. Para editores, o HIFLD Open Data torna os dados geoespaciais mais visuais e envolventes do que nunca. 269. Endereços abertos O OpenAddresses é especializado em infraestrutura e coleta de endereços. Impulsionado em grande parte pelos esforços da comunidade, este site utiliza o GitHub como plataforma de desenvolvimento. Nele, os usuários podem adicionar endereços a um mapa após incluí-los no banco de dados ou podem utilizar os dados e iniciar a geocodificação imediatamente. Com todos os dados e endereços abertos e exigindo apenas atribuição, as atualizações regulares de dados e o potencial para avanços na geocodificação tornam o OpenAddresses um projeto muito interessante. 270. Dados Abertos LMU O Open Data LMU depende fortemente de dados do OpenStreetMap para auxiliar no desenvolvimento do Geocodificador Reverso Rápido. Isso significa que o aplicativo é capaz de, rapidamente, obter um endereço completo a partir de uma localização no mapa. Isso poderia ser aplicado também a bairros e condados. Esta página da web contém diversos links relacionados ao aplicativo, incluindo código-fonte, conjuntos de dados e tabelas de consulta e resoluções do OpenStreetMap. 271. Explorador de Dados Ambientais Com o Explorador de Dados Ambientais, jornalistas, pesquisadores e estudantes podem baixar e explorar os mesmos conjuntos de dados que o Programa das Nações Unidas para o Meio Ambiente utiliza, juntamente com suas organizações afiliadas e parceiros. As buscas podem ser refinadas por região e feitas utilizando qualquer um ou todos os 500 filtros disponíveis. Além disso, os conjuntos de dados incluem categorias como saúde, PIB, clima, emissões e água doce, que podem ser visualizadas diretamente no site em formato de gráfico, tabela ou mapa. 272. Grupo Banco Africano de Desenvolvimento O site do Grupo Banco Africano de Desenvolvimento é a primeira parada de jornalistas que buscam informações e indicadores estatísticos relacionados ao continente africano. Os usuários que navegam pelo catálogo de dados podem filtrar os conjuntos de dados por fonte, tópico e região. Para quem busca um conhecimento mais aprofundado sobre o assunto em questão, o site também oferece links para uma lista impressionante de publicações, incluindo títulos como o Panorama Econômico Africano e o Anuário Estatístico Africano. 273. Genomic Data Commons (GDC) O Genomic Data Commons do NCI abriga um dos repositórios de dados sobre câncer mais completos da internet, com foco na área de estudos genômicos do câncer. O portal de dados deste site hospeda milhares de casos e abrange 38 tipos de doenças, além de 39 projetos, e o acesso é gratuito. Com dados enviados principalmente por instituições e pesquisadores, a precisão dessas informações torna essa fonte de dados ideal para jornalistas. 274. Bancos de dados PhysioBank Os bancos de dados do PhysioBank disponibilizam dados fisiológicos ao público em geral. Esses bancos de dados são divididos em duas categorias principais: formas de onda e dados clínicos. Entre as subcategorias de formas de onda, encontram-se bancos de dados de imagem, intervalo entre batimentos cardíacos, sintéticos, de marcha e equilíbrio, de ECG e multiparamétricos. Exemplos da quantidade de informações disponíveis incluem dados sobre sinais vitais à beira do leito, saturação de oxigênio e até mesmo doenças cardiovasculares. Jornalistas e pesquisadores da área da saúde podem encontrar informações relevantes nesses bancos de dados. 275. Banco de dados de cobertura do Medicare O banco de dados de cobertura do Medicare, mantido pelos Centros de Serviços do Medicare e Medicaid (CMS) por meio do Departamento de Saúde e Serviços Humanos (HHS), oferece aos pesquisadores acesso completo a uma enorme quantidade de informações sobre serviços médicos. Há informações sobre doenças crônicas, gastos com medicamentos, modelos clínicos eletrônicos, o sistema de cobrança de dívidas e bolsas de pesquisa e demonstração. Para dados obtidos diretamente da fonte, este é o site mais completo e abrangente do gênero disponível online. 276. Dados de pagamentos abertos Quando a maioria das pessoas vai ao médico, geralmente não para para pensar se o seu médico de família está se beneficiando financeiramente ao trabalhar com empresas do setor de saúde. O Open Payments informa o público sobre quaisquer refeições, pesquisas, presentes, honorários por palestras e despesas de viagem que o médico ou hospital tenha recebido de empresas. Jornalistas em busca de uma reportagem impactante podem usar o explorador de dados para visualizar as informações ou clicar na aba para baixar os dados diretamente. 277. Logotipos do Flickr O próprio nome já indica, mas FlickrLogos se refere a um conjunto de dados composto por logotipos de empresas fotografados em diversas posições. Mantida pelo Laboratório de Computação Multimídia e Visão Computacional da Universidade de Augsburg, essa coleção foi originalmente compilada com o objetivo de treinar computadores para reconhecer logotipos e textos. Para acompanhar o progresso desse programa promissor, vale a pena baixar o conjunto de dados e conferir do que se trata. 278. ImageNet O ImageNet é um banco de dados repleto de imagens organizadas pelo WordNet. O site oferece desafios anuais que podem ser visualizados mesmo após o fechamento e que se concentram na criação de algoritmos capazes de executar tarefas específicas. O ImageNet também abriga diversas publicações, citações e slides. Editores de conteúdo voltados para tecnologia têm todos os motivos para usar a opção de exploração para compreender a estrutura do WordNet, bem como o mapa na nuvem. 279. Conjunto de dados de cães de Stanford O conjunto de dados Stanford Dogs contém inúmeras fotos e imagens de diferentes raças de cães. Com 120 raças diferentes incluídas, além de mais de 20.000 imagens individuais, este banco de dados, baseado no ImageNet, oferece aos pesquisadores uma grande quantidade de imagens para trabalhar enquanto ensinam máquinas a reconhecer cada raça. No site, é possível clicar em links para diferentes publicações que discutem o uso de conjuntos de dados para ensinar computadores sobre reconhecimento de imagens, e esses links podem ser acessados juntamente com o download do conjunto de dados. 280. Banco de dados SUN O banco de dados SUN é um projeto desenvolvido para que a comunidade científica avance em áreas como visão computacional e computação gráfica, mineração de dados, aprendizado de máquina e neurociência, entre outras. Com mais de 131.000 imagens e quase 4.000 categorias de objetos em seus índices, este site é extremamente abrangente. Para editoras interessadas neste banco de dados e nas conquistas dos pesquisadores que o utilizam, esta é uma fonte de dados que vale a pena explorar. 281. O conjunto de dados Oxford-IIIT Pet O Oxford-IIIT Pet Dataset é um site que complementa um artigo publicado na Conferência IEEE de Visão Computacional e Reconhecimento de Padrões de 2012 e hospeda o conjunto de dados original utilizado para o artigo. Essas imagens foram organizadas em aproximadamente 37 categorias de animais de estimação, além de outras 200 imagens associadas a cada classe. Os dados podem ser baixados diretamente pelos links disponíveis na página. 282. O conjunto de dados do genoma visual A API Visual Genome é o resultado final do árduo trabalho de diversos alunos e professores associados da Universidade de Stanford. Com vários artigos publicados na busca por criar uma API capaz de avaliar e descrever imagens, o programa respondeu com sucesso a mais de um milhão de perguntas, avaliando mais de 100.000 imagens. Esta API representa um avanço na área da ciência da computação e campos relacionados, e o conjunto de dados pode ser baixado diretamente do site. 283. Rostos do YouTube O Banco de Dados de Rostos do YouTube tem como foco o desenvolvimento de uma solução para o problema do reconhecimento facial automático em vídeos. Ao todo, o conjunto de dados contém mais de 3.000 vídeos extraídos do YouTube, com quase 1.600 indivíduos e duração média de aproximadamente 181 frames. O objetivo final é criar um algoritmo capaz de gerar rótulos que identifiquem a pessoa presente no vídeo. Os dados, juntamente com informações sobre erros e métodos de descrição, estão disponíveis para visualização diretamente no site. 284. Repositório de conjuntos de dados KEEL O repositório de dados KEEL contém um conjunto de softwares de código aberto baseados em Java, projetado para auxiliar na descoberta de diversos tipos de conhecimento. O KEEL, conhecido simplesmente como Extração de Conhecimento Baseada em Aprendizado Evolutivo, pode ser treinado para aprender a lidar com valores ausentes, modelos híbridos e métodos estatísticos para avaliação de experimentos, entre outras tarefas. Os dados e a lista completa dos algoritmos presentes no KEEL podem ser baixados diretamente do site. 285. Clube de Empréstimo O grande diferencial do Lending Club é ser uma plataforma de empréstimos peer-to-peer que permite aos tomadores de empréstimo obterem crédito mesmo sem a pontuação de crédito necessária para empréstimos em instituições financeiras tradicionais. Além da inovação em seu funcionamento, o site também oferece estatísticas que incluem destaques da plataforma, informações sobre empréstimos negados, números de desempenho dos investidores e até mesmo um dicionário de dados com informações históricas. Esses dados geralmente começam em 2007 e podem ser baixados em formato CSV. 286. Museu de História Natural O Museu de História Natural é considerado por muitos um dos museus mais reconhecidos do mundo, mas a digitalização e a possibilidade de examinar seu catálogo por meio do portal de dados abertos provavelmente seriam novidade para muita gente. Com 91 conjuntos de dados que incluem coleções de microfósseis e fósseis, além de registros de lotes indexados, entre outros materiais, os dados são de acesso público e podem ser baixados gratuitamente em diversos formatos. 287. Os vocabulários Getty Este site é perfeito para jornalistas e editores que desejam seguir diretrizes de estilo específicas ao descrever e categorizar obras de arte, nomes de artistas, arquitetura, materiais e nomes geográficos. O site direciona os usuários diretamente para os bancos de dados de vocabulário controlado que pesquisadores e catalogadores precisam conhecer para atender aos padrões internacionais. Nesse quesito, pelo menos, não há nada melhor que os Vocabulários Getty. Os conjuntos de dados podem ser explorados por meio de texto ou SPARQL e podem ser baixados pelo site. 288. Corpus de Investigação de Estilometria CLiPS (CSI) O Corpus de Investigação de Estilometria CLiPS provavelmente não é o que a maioria das pessoas imagina quando ouve as palavras CSI, mas o corpus CSI é, sem dúvida, um conjunto de dados composto por resenhas e redações de estudantes. Além do próprio texto, a presença de metadados e informações incorporadas ao documento são apontadas pelo site como tendo múltiplos usos. Oferecido e distribuído sob a licença Creative Commons, tudo o que o corpus pede em troca do uso do conjunto de dados é a atribuição. 289. Dependências Universais v2 Universal Dependencies v2 refere-se à segunda versão atualizada do projeto Universal Dependencies, um esforço para desenvolver uma anotação de treebank que possa ser usada de forma consistente com vários idiomas diferentes. Nesta versão atualizada, os pesquisadores encontrarão dezenas de treebanks UD para diferentes idiomas, incluindo africâner, grego antigo, japonês, holandês, finlandês e chinês, além do inglês. A versão mais recente do Universal Dependencies pode ser encontrada e baixada na parte inferior desta página. 290. Webhose O Webhose é uma fonte de dados de alta qualidade, extraída diretamente dos repositórios do site e disponibilizada ao público. Pesquisadores podem filtrar artigos de notícias por idioma, sendo o árabe, o francês e o holandês apenas alguns exemplos, com mais de 100.000 artigos disponíveis. Além disso, os artigos de notícias em inglês são subdivididos em categorias como entretenimento e esportes, juntamente com as resenhas e postagens em fóruns. Editores digitais e pesquisadores podem se beneficiar da exploração desses conjuntos de dados. 291. Dados da Wiki O Wikidata é uma fonte subestimada de conteúdo e ideias para editores e pesquisadores. De acordo com esta página, existem várias maneiras de acessar o material nos bancos de dados, embora o uso de JSON seja o mais recomendado pelo site. Disponível e totalmente gratuito para uso não comercial e comercial, todos os dados aqui disponíveis podem ser acessados e baixados gratuitamente sob a licença Creative Commons. 292. Links da Wiki Integrado ao Google Code, o Wiki Links é um projeto de código aberto que busca fornecer acesso a conjuntos de dados específicos e exclusivos. Nesta página, pesquisadores podem baixar os arquivos README, os arquivos de dados e a licença Creative Commons. Editores e pessoas com interesse em tecnologia em geral encontrarão muito o que explorar neste vasto conjunto de dados. Basta navegar pelo site, clicar e começar a baixar os arquivos. 293. Wordnet O WordNet é um léxico da língua inglesa composto pelos componentes da linguagem: advérbios, substantivos, adjetivos e verbos, categorizados em grupos distintos que são usados para expressar ideias específicas. O resultado final é uma ferramenta útil que categoriza as palavras pela forma como são usadas e pelo seu significado, em vez de pela sua pronúncia. As aplicações do WordNet na programação linguística são mencionadas, juntamente com as inúmeras publicações e estatísticas disponíveis no site. 294. Atlas Cerebral de Allen O Atlas Cerebral Allen, criado pelo Instituto Allen de Recursos para a Ciência do Cérebro, é uma ferramenta para estudar e aprender mais sobre o cérebro humano e como ele reage tanto em condições de saúde quanto em situações de doença. Utilizando o atlas, pesquisadores podem aprender sobre o cérebro humano e seu desenvolvimento, bem como sobre o glioblastoma e o efeito do câncer no cérebro. Jornalistas que cobrem esses temas podem visitar este site para obter conjuntos de dados e informações. 295. NITRC O NITRC, ou Centro de Recursos e Ferramentas de Informática em Neuroimagem, é o local onde jornalistas e editores podem encontrar dados de neuroimagem. Criado e promovido como uma iniciativa para o compartilhamento de dados de neuroimagem, este site abriga dados de diversos projetos, como o Projeto 1000 Conectomas, a Iniciativa de Conectomas de Dependência Química (Addiction Connectome Preprocessed Initiative), bem como os projetos INDI-Prospectivo e Retrospectivo, respectivamente. Os dados podem ser baixados gratuitamente pelo site. Neuroimagens obtidas em vários estágios nunca foram tão acessíveis. 296. Profissionais de Saúde Adultos Jovens O projeto Human Connectome Project Young Adult dá continuidade ao esforço em andamento para criar um mapa preciso do conectoma humano, tal como seria observado na maioria dos adultos saudáveis. Ao longo de duas fases, 1200 adultos saudáveis foram submetidos a exames de ressonância magnética funcional em repouso e de difusão. Jornalistas e editores em busca de informações sobre o cérebro não encontrarão outro site com mais dados sobre o conectoma humano em adultos jovens saudáveis. 297. Arquivo de Dados do NIMH O Arquivo de Dados do NIMH, ou NDA, como é conhecido, não é tanto uma fonte de dados independente, mas sim uma plataforma para distribuição e armazenamento de dados. Neste site, encontram-se dados coletados ao longo de diversos artigos e projetos de pesquisa, além de métodos e ferramentas que permitem melhor análise e colaboração. Resumos dos dados estão disponíveis gratuitamente e os provedores de conteúdo que divulgam as últimas novidades da ciência podem usar essas informações para noticiar o fato. 298. Neurodados O NeuroData dedica-se à pesquisa sobre a relação singular entre a mente e o cérebro. Graças ao compromisso do site com a ciência aberta e a pesquisa reproduzível, os colaboradores têm acesso a uma publicação e a diversos conjuntos de dados, acessíveis através dos links na página web. De particular interesse para aqueles que desejam analisar os dados por si próprios é a disponibilidade de código e ferramentas de análise gratuitas, que tornam a exploração do trabalho do NeuroData ainda mais simples. 299. Neuroeletro O Projeto NeuroElectro foi concebido com o intuito de coletar as diversas características eletrofisiológicas associadas a diferentes tipos de neurônios e agregá-las em um único banco de dados. Este projeto busca estudar a relação entre neurônios, com o objetivo de compreender as diferenças entre os vários tipos neuronais. O site contém links para artigos e lista os tipos de neurônios e as propriedades eletrofisiológicas descobertas até o momento. Os provedores de conteúdo podem utilizar este site como fonte de dados sobre as relações entre neurônios. 300. Série de estudos de imagem de acesso aberto A Série de Estudos de Imagem de Acesso Aberto, também conhecida como OASIS, é um projeto concebido com o objetivo de tornar os conjuntos de dados de ressonância magnética cerebral acessíveis à comunidade científica em geral. Jornalistas e pesquisadores podem acessar publicações que comparam dados de ressonância magnética entre adultos, bem como uma ficha informativa abrangente do artigo completo da OASIS que compara e contrasta resultados de mais de 400 indivíduos. As informações e ferramentas podem ser baixadas do site em diversos formatos. 301. OpenfMRI Para jornalistas que desejam acessar conjuntos de dados de ressonância magnética sem as dificuldades associadas a outros sites, o foco do OpenfMRI.org em tornar esses conjuntos de dados acessíveis ao público é um desenvolvimento positivo. Vindo diretamente dos próprios pesquisadores, este site hospeda uma variedade de conjuntos de dados, como o conjunto de dados de aprendizado de classificação, a tarefa de apostas mistas e a tarefa de tomada de risco análoga ao balão. A variedade e a quantidade de dados permitem que os pesquisadores encontrem novas linhas de investigação por meio deste site. 302. Studyforrest Seu nome foi fortemente inspirado no famoso filme Forrest Gump, studyforrest Busca compreender do que o cérebro é capaz quando precisa funcionar em um nível superior, lidando com estímulos naturais, porém igualmente complexos. Mesmo assim, o site reconhece que a quantidade de dados de fMRI coletados nesses estudos tem aplicações mais amplas do que aparenta à primeira vista. Os provedores de conteúdo podem navegar pelas 19 publicações que utilizaram essa tecnologia studyforrest dados e pode até mesmo acessar os dados diretamente. 303. Banco de Dados Aberto de Cristalografia Como seria de esperar pelo título, o Crystallography Open Database é uma coleção de 385.697 minerais e compostos organometálicos, estruturas cristalinas orgânicas e inorgânicas, com a notável exceção dos biopolímeros. Fornecedores de conteúdo que desejam aprender mais sobre estruturas cristalinas podem pesquisar pela fórmula estrutural ou executar uma consulta de pesquisa correspondente, com a opção de navegar pelos resultados. Este site também oferece software e dados que o tornam especialmente valioso na área da química. 304. Arquivo de exoplanetas da NASA Considerada há muito tempo uma das principais fontes de informação sobre o espaço sideral, a NASA mantém sua tradição de ser um recurso inestimável com seu arquivo de exoplanetas. Este site hospeda uma série de ferramentas e softwares interativos, como o Serviço de Trânsitos e Efemérides, o Periodograma, a Ferramenta de Plotagem de Planetas Confirmados e a possibilidade de fazer upload interativo de arquivos e pesquisar tabelas. Os criadores de conteúdo que buscam informações exclusivas podem usar esses dados para obter insights valiosos sempre que exoplanetas forem notícia. 305. Pesquisa Sloan Digital Sky Com a ajuda do Sloan Digital Sky Survey (SDSS), qualquer pessoa pode criar mapas tridimensionais do Universo. Jornalistas e produtores de conteúdo podem acessar algoritmos, dados de imagem, conjuntos de dados, tutoriais e materiais visuais para fins educacionais, tanto formais quanto informais. O site também aborda explicitamente a possibilidade de disponibilizar seus dados ao público por meio de notícias e mídias sociais. Essa é uma ferramenta visual inestimável para produtores de conteúdo. 306. StatSci.org O Statsci.org oferece uma lista abrangente de recursos que o público pode acessar e utilizar de acordo com suas necessidades específicas. Algumas das informações incluem o Electronic Dataset Service (EDS) e estudos de caso compilados pela UCLA. Além dos conjuntos de dados brutos, também há links para livros didáticos nesta página. Isso inclui títulos como o Handbook of Small Data Sets (Manual de Pequenos Conjuntos de Dados) e Case Studies in Biometry (Estudos de Caso em Biometria). Fornecedores de conteúdo em busca de informações estatísticas certamente farão um bom negócio ao consultar este site. 307. ÉRICO O ERIC, também conhecido como Instituto de Ciências da Educação, é um recurso que funciona como um mecanismo de busca para qualquer pessoa que procure informações na área da educação. A busca inicial oferece inclusive a opção de filtrar exclusivamente por informações revisadas por pares, bem como por textos completos disponíveis no ERIC. Considerando a frequência com que orçamentos educacionais e métodos de ensino aparecem nas notícias, essa é uma fonte de dados que jornalistas devem ter em mente. 308. NTIS Criado logo após o fim da Segunda Guerra Mundial, o NTIS (Serviço Nacional de Informação Técnica) foi formado com o objetivo de utilizar dados para auxiliar agências federais a tomar decisões informadas e baseadas em dados. Originalmente, essa agência era o repositório de dados do governo dos EUA na área de pesquisa científica. Hoje, o site hospeda milhões de publicações sobre uma infinidade de assuntos. Só o conteúdo histórico já torna este site uma fonte de dados valiosa para jornalistas e editores. 309. Certificado de Dados Abertos O site do ODI (Open Data Institute) oferece o chamado Certificado de Dados Abertos, uma ferramenta gratuita disponível online, desenvolvida com o propósito específico de examinar criticamente e reconhecer a qualidade dos dados abertos. Do ponto de vista de um editor ou jornalista, o site também hospeda diversos conjuntos de dados sobre assuntos que vão desde listas de subsídios a alertas de alergia, além de listas que podem ser baixadas em formato CSV. 310. Arquivo do GitHub O GitHub é facilmente um dos repositórios e arquivos de dados mais populares e conhecidos da internet, devido à sua facilidade de colaboração, capacidade de arquivamento e acessibilidade no que diz respeito à programação. Seja para criar bots capazes de executar tarefas específicas ou desenvolver aplicativos, o GitHub é um site onde editores de conteúdo e jornalistas podem facilmente encontrar produtos potencialmente relevantes. O arquivo pode ser acessado seguindo as instruções do tutorial para JSON ou BigQuery. 311. Padrões Sociais O SocioPatterns é um projeto focado em encontrar padrões na atividade humana e na dinâmica social por meio de dados. Como esperado para um objetivo tão amplo, as informações do site têm sido utilizadas em publicações que abordam uma variedade de assuntos, desde a disseminação de doenças até estudos de caso sobre as diferenças entre as personas online e offline de indivíduos. Os conjuntos de dados estão disponíveis para visualização, assim como os artigos publicados, que contêm informações que provavelmente serão relevantes para os editores em algum momento. 312. Mapa Indie O Indie Map é o resultado da coleta de informações de mais de 2.000 dos sites mais acessados da IndieWeb, que foram transformadas em formatos visuais interativos, como uma API de Gráfico Social, um conjunto de dados com recursos de consulta SQL e as informações brutas coletadas em um total de 5,7 milhões de páginas da web. Editores digitais interessados em software de código aberto e no que esses dados podem revelar sobre essas comunidades online podem acessar as informações diretamente do site. 313. Universidade Simon Fraser A Universidade Simon Fraser continua a consolidar sua reputação como uma instituição de ensino superior com a disponibilização de seu conjunto de dados sobre as “Estatísticas e a Rede Social de Vídeos do YouTube”. Obtidos a partir de informações coletadas por um rastreador que utilizou a API do YouTube para encontrar vídeos, os arquivos contêm dados sobre milhões de vídeos e conjuntos de dados com informações de usuários. O site especifica que os downloads do conjunto de dados são destinados apenas a fins acadêmicos, mas é possível encontrar fontes jornalísticas e referências sobre este projeto por meio do site. 314. ACLED O ACLED, ou Projeto de Dados sobre Localização e Eventos de Conflitos Armados, oferece dados públicos sobre protestos e violência política em países em desenvolvimento. As informações aqui disponibilizadas incluem números de fatalidades, datas e locais da violência ou protesto, nomes dos grupos envolvidos e dados sobre tumultos e confrontos violentos ocorridos. O ACLED fornece acesso a relatórios, publicações e recursos visuais periódicos, além de dados disponíveis para download no site. 315. Instituto Canadense de Informação Jurídica O Instituto Canadense de Informação Jurídica, ou CanLII, como é conhecido popularmente, é um site que oferece acesso gratuito a leis e seus regulamentos, jurisprudência de tribunais de diversas jurisdições, incluindo a Suprema Corte do Canadá, os tribunais provinciais e de apelação, e o Tribunal da Rainha, além de decisões de vários tribunais administrativos e órgãos criados por lei. Com 301 bases de dados de jurisprudência e mais de 140.000 decisões judiciais disponíveis para consulta, jornalistas e editores digitais que cobrem temas jurídicos podem se beneficiar ao adicionar este site aos seus favoritos. 316. Centro para a Paz Sistêmica O Centro para a Paz Sistêmica (CSP, na sigla em inglês) é uma organização dedicada à análise de sistemas globais com o objetivo de abordar a questão da violência política. Neste site, jornalistas que realizam pesquisas nessa área terão acesso a análises sobre conflitos na África, tendências de conflitos em nível global, entre outros, além de resumos das três principais publicações da organização: Terceira Guerra Mundial, Relatório Global do CSP e Biblioteca Virtual. 317. Projeto Correlatos da Guerra O projeto Correlates of War (COW, na sigla em inglês) tem como foco auxiliar na coleta e distribuição de dados quantitativos na área de relações internacionais. Mantendo seu compromisso com a aplicação de princípios científicos aos dados de relações internacionais, o COW disponibiliza seus conjuntos de dados gratuitamente ao público. Esses bancos de dados contêm informações que jornalistas e pesquisadores podem utilizar, como conflitos militarizados entre Estados, membros do sistema estatal, capacidades materiais nacionais e alianças formais. 318. Pesquisa Social Europeia O Inquérito Social Europeu (ESS, na sigla em inglês) é um inquérito realizado em toda a Europa com o objetivo de medir os diversos padrões de comportamento, atitudes e crenças de diferentes populações em vários países. Como os jornalistas estão frequentemente interessados em obter a opinião pública, a Série de Principais Notícias do ESS, que aborda temas que vão desde o bem-estar pessoal e social dos europeus, as atitudes em relação ao sistema de bem-estar social e até mesmo a presença do preconceito etário no Reino Unido, pode enriquecer uma reportagem de diversas maneiras. 319. Fundo para a Paz O Fundo para a Paz é uma organização que se concentra na prevenção de conflitos e na promoção da segurança por meio do desenvolvimento de ferramentas que podem ser usadas para mitigar conflitos. Ao longo de sua trajetória, o FFP trabalhou em parceria com jornalistas, ONGs, organizações locais e suas contrapartes internacionais, bem como governos. Seja para buscar tendências, análises comparativas ou dados globais, jornalistas e editores podem encontrar os materiais desejados por meio da ferramenta de exploração de dados integrada ao navegador do site. 320. Pesquisa Social Geral O trabalho da Pesquisa Social Geral (GSS, na sigla em inglês) concentra-se na coleta de informações sobre vários aspectos da sociedade americana moderna, como forma de acompanhar as tendências e padrões comportamentais e de atitudes da população. Com essa prática de monitoramento de tendências remontando a 1972, os dados históricos por si só representam uma mina de ouro para jornalistas que desejam explorar tendências. Utilizando o Explorador de Dados da GSS, pesquisadores e jornalistas podem baixar, examinar e até mesmo avaliar os dados. 321. Gesis O GESIS é um instituto de infraestrutura alemão dedicado às ciências sociais. Oferece diversas áreas das ciências sociais, além de pesquisas e serviços que abrangem desde metodologia de pesquisa até ciência da computação aplicada, coleta de dados, planejamento de estudos e análise de dados, entre outras atividades. Jornalistas interessados em temas como a abordagem metodológica do GESIS, a utilização de imigrantes com qualificações superiores às exigidas e outros podem encontrar muitas informações na seção de publicações. 322. Futuros Religiosos Globais De temas como aborto à educação sexual, a religião é tão difundida que, mesmo em países predominantemente seculares, a posição de uma pessoa sobre assuntos sociais complexos pode ser influenciada por crenças religiosas. Em "Futuros Religiosos Globais", o Pew Research Center examina as tendências nas atitudes e crenças das pessoas em relação às religiões globais. Jornalistas que desejam analisar detalhes como a influência do evangelicalismo na política ou as atitudes em relação ao apedrejamento podem usar o Explorador de Dados para encontrar respostas nos números. 323. Índice para Gestão de Riscos O Índice de Gestão de Riscos, também conhecido como INFORM, é uma plataforma que pesquisadores e jornalistas podem utilizar para avaliações de risco em situações de crise humanitária ou desastre. A organização oferece links para dados sobre temas como taxas de mortalidade infantil, índice de desigualdade de gênero e frequência de secas, entre outros. Também é possível visualizar e baixar os dados do INFORM ou acessá-los por meio do mapa interativo do site. 324. IMED O INED, ou Instituto Nacional de Estudos Demográficos da França, é uma das fontes de dados e estatísticas mais prolíficas que um jornalista pode encontrar na internet. Com mais de 70 publicações pesquisadas e divulgadas anualmente, o instituto oferece desde gráficos sobre a população mundial até estatísticas que abordam questões como a diferença de fertilidade entre os sexos, além de notícias e recursos. Pesquisadores em busca de dados precisos de uma fonte confiável os encontrarão no INED. 325. Arquivo de Redes Internacionais O Arquivo de Redes Internacionais de Princeton oferece uma combinação única de publicações, com pesquisas como o Relatório de Desenvolvimento Humano de 1999 e a revista Global Networks: A Journal of Transnational Affairs disponíveis para leitura neste site. Neste site, jornalistas poderão examinar minuciosamente os dados históricos e atualizados do arquivo. Os assuntos abordados incluem saúde, armamentos, livros, música, migração, regiões, internet, política e transporte, sendo apenas alguns exemplos dos materiais que pesquisadores podem consultar. 326. Programa Internacional de Pesquisa Social Fundado desde o início como um meio de colaboração entre pessoas de diferentes nações, o Programa Internacional de Pesquisa Social (ISSP) realiza pesquisas anualmente sobre uma variedade de temas importantes na área das ciências sociais. Ao longo dos anos, os tópicos abordados incluíram desigualdade social, identidade nacional, cidadania, redes sociais e orientação profissional, entre outros. Os resultados do ISSP podem ser pesquisados por ano ou por tema e baixados no site. 327. Associações de Estudos Internacionais Jornalistas e outros pesquisadores que buscam discussões informativas e intelectuais sobre questões transnacionais, internacionais e globais podem se beneficiar da Associação de Estudos Internacionais (ISA), que reúne a expertise de pesquisadores, acadêmicos e especialistas em políticas públicas, entre outros. A Enciclopédia de Estudos Internacionais da ISA apresenta ensaios revisados por pares, repletos de discussões aprofundadas sobre tópicos relevantes para a pesquisa nessa área, bem como ensaios que oferecem informações sob uma perspectiva mais histórica. 328. Dados transnacionais na Web A página incrivelmente útil do Professor James W. McGuire, da Universidade Wesleyan, apropriadamente intitulada "Dados Transnacionais na Web", é uma fonte de recursos repleta de links para dados relevantes sobre economia e desenvolvimento global. Entre os conjuntos de dados que jornalistas interessados poderão encontrar aqui, estão informações sobre planejamento familiar, desempenho educacional, subnutrição, água e saneamento, orientação para o livre mercado e informações específicas da América Latina e do Caribe, para citar apenas alguns exemplos. As fontes de dados listadas são impecáveis. 329. Centro Norueguês de Dados de Pesquisa O Centro Norueguês de Dados de Pesquisa é uma instituição que apoia e auxilia pesquisadores em diversas áreas da pesquisa empírica, como privacidade, coleta e análise de dados, avaliação de metodologias e ética em pesquisa. Nele, os pesquisadores encontrarão softwares e ferramentas desenvolvidos e recomendados pelo centro, que complementam uma extensa coleção de dados regionais, individuais e institucionais, de acesso gratuito. As conclusões do centro, publicadas no Relatório Anual sobre Pesquisa e Privacidade, também são sempre uma leitura interessante. 330. IPUMS O IPUMS não é necessariamente uma fonte de dados no sentido que a maioria das pessoas esperaria ao ouvir o termo, mas é, sem dúvida, uma fonte útil para jornalistas devido ao seu papel como agregador, arquivador e organizador dos dados que outras entidades lhe fornecem. Um exemplo disso é o IPUMS USA, que funciona como uma espécie de repositório de microdados do censo dos EUA, com dados que remontam a 1790 e chegam até os dias atuais. 331. ND-GAIN O Índice de Países ND-GAIN, uma iniciativa organizada pela Iniciativa de Adaptação Global da Universidade de Notre Dame, mede a resiliência de um país às mudanças climáticas e a outras forças da globalização. Este índice inclui pontuações de vulnerabilidade em áreas como alimentação, saúde, infraestrutura e ecossistemas, bem como pontuações de prontidão para até 500.000 pontos de dados. Contendo dados de duas décadas, de 1995 a 2014, em formato de arquivos CSV, essas informações estão disponíveis para download. 332. Polícia do Reino Unido Neste site, jornalistas e editores podem acessar dados abertos sobre o estado do policiamento e da criminalidade no Reino Unido. Os dados contêm estatísticas úteis sobre equipes de policiamento de bairro, forças policiais individuais, número de abordagens e buscas, bem como estatísticas sobre crimes e seus desfechos. Usando este site, os jornalistas podem comparar diferentes forças policiais e identificar tendências no sistema de justiça criminal. Obter informações é tão simples quanto escolher o intervalo de datas, selecionar a força policial e aguardar o arquivo. 333. Página de Dados Internacionais Gerais de Paul Hensel A página de Dados Internacionais Gerais de Paul Hensel é uma série de links agrupados sob os títulos Estados e o Sistema Internacional, Dados Geográficos Internacionais, Capacidades dos Estados, Coleções de Dados de Ciências Sociais e Alianças, Tratados e Organizações. Cada recurso listado nesta página contém dados de última geração que automaticamente conferem credibilidade ao trabalho jornalístico. Essas fontes podem incluir desde softwares a conjuntos de dados e arquivos, mas todos os links aqui presentes são úteis. 334. TRAÇO No mundo pós-11 de setembro, o terrorismo e seus efeitos devastadores sobre as populações locais têm recebido muita atenção da mídia. O TRAC, em trackingterrorism.org, fornece aos pesquisadores análises e informações abrangentes sobre esses assuntos. Este site contém informações sobre milhares de grupos terroristas diferentes. O preço de US$ 500 para um único usuário pode parecer um pouco alto inicialmente, mas vale a pena para aqueles que escrevem sobre violência e a guerra contra o terror. 335. Departamento de Justiça Criminal do Texas Interessado no funcionamento interno do sistema de justiça criminal do Texas? Curioso para saber quem está atualmente no corredor da morte? O Departamento de Justiça Criminal do Estado do Texas possui muitas informações, desde as últimas declarações dos presos antes da execução, estatísticas do corredor da morte por gênero e raça, até estatísticas e fichas informativas sobre execuções. O Departamento de Justiça Criminal do Texas é uma fonte extremamente confiável para jornalistas. 336. Sistema Integrado de Organizações da Sociedade Civil O Sistema Integrado de Organizações da Sociedade Civil (iCSO) foi concebido para facilitar a comunicação entre organizações da sociedade civil e o Departamento de Assuntos Econômicos e Sociais. Além da eficácia da estrutura robusta, a página web inclui conjuntos de dados e categorias para informações adicionais. Os dados podem ser filtrados por setor, tipo de organização, região e status da organização junto ao ECOSOC. Trata-se de uma fonte de dados que jornalistas certamente podem utilizar para encontrar informações. 337. Universidades em todo o mundo O Universities Worldwide é um banco de dados de universidades do mundo todo que pode ser consultado para obter mais informações. A busca pode ser feita por lista mundial ou filtrada exclusivamente para universidades dos Estados Unidos, e os usuários também podem adicionar seus próprios links durante o processo. Editores de dados com um número considerável de alunos, ou mesmo jornalistas que buscam verificar um fato, podem se beneficiar do acesso a um banco de dados como este sob demanda. 338. Programa de Dados sobre Conflitos de Uppsala Este é o site do Programa de Dados sobre Conflitos de Uppsala, um dos mais renomados provedores de informações sobre violência organizada. Ao longo dos seus 40 anos de existência, o programa também se consolidou pelo seu trabalho de coleta de dados sobre a guerra civil. Jornalistas podem utilizar esta fonte de dados para buscar informações sobre conflitos específicos e os atores envolvidos nesses conflitos, além de poderem acessar os dados para fazer o download. 339. População Mundial O projeto WorldPop, resultado da fusão dos projetos AsiaPop, AfriPop e AmeriPop, dedica-se ao arquivamento de conjuntos de dados demográficos espaciais que, por sua vez, podem ser utilizados como meio de apoio a esforços de socorro em desastres. Editores de conteúdo e jornalistas envolvidos com causas de justiça social ou que estejam pesquisando oportunidades eficazes de socorro em desastres podem se interessar por este projeto. Pesquisadores podem baixar os dados ou consultar os estudos de caso online. 340. Draft Express O DraftExpress é talvez mais conhecido na internet por suas pesquisas, relatórios de observação pré-draft, simulações de draft e pela manutenção meticulosa das alturas e medidas dos jogadores, além de seus dados históricos. Os prospectos mencionados neste site vêm da NCAA, do ensino médio e até mesmo de ligas internacionais. Jornalistas esportivos ou criadores de conteúdo que pretendem oferecer comentários relacionados ao basquete podem recorrer às estatísticas do DraftExpress ao discutir jogadores e eventos conforme eles acontecem no esporte. 341. Betfair A Betfair é talvez mais conhecida como o site ideal para apostas esportivas. No entanto, o que interessa especialmente a provedores de conteúdo e editores digitais é a disponibilidade de informações históricas detalhadas sobre os dados de preços e o histórico do site. Os dados podem ser acessados e baixados com ou sem a marcação de tempo detalhada, oferecendo também informações abrangentes sobre corridas de cavalos e outros mercados oferecidos pelo site, de junho de 2004 a outubro de 2017. 342. CRICSHEET O Cricsheet oferece um serviço semelhante a vários outros centros de dados esportivos, mas é um site especializado exclusivamente em dados de críquete. O site oferece estatísticas e dados lance a lance de diversas ligas, incluindo a Indian Premier League, partidas internacionais de um dia, além de números de times masculinos e femininos, para citar apenas algumas das categorias principais. Editores de conteúdo que buscam dados históricos de críquete podem baixar os dados em formato CSV ou XML. 343. Dados de séries temporais transnacionais Com dados políticos, econômicos, legislativos e de conflitos internos que abrangem mais de 200 anos de informações em mais de 200 países ao redor do mundo, o Arquivo de Dados de Séries Temporais Transnacionais é um dos conjuntos de dados mais abrangentes da internet. Os dados são armazenados, de forma bastante prática, em uma planilha do Google Drive que se abre automaticamente ao clicar na categoria do arquivo. Mediante citação, essas informações podem ser visualizadas parcial ou integralmente, dependendo das necessidades do pesquisador. 344. Ford GoBike Ford GoBike é o nome do programa de compartilhamento de bicicletas utilizado na região da Baía de São Francisco. Embora muitas pessoas estejam, sem dúvida, usando esse programa para se manterem em forma e evitar o uso de combustíveis fósseis, o sistema de compartilhamento de bicicletas vem registrando os dados das viagens. É claro que essas informações não incluem nada que possa identificar os usuários, mas detalhes como o número da bicicleta, o horário de início e término, o tipo de usuário e as estações de chegada e partida estão incluídos nos dados. Vale a pena investigar isso. 345. Tráfego Marítimo A Marine Traffic é uma empresa que rastreia e monitora os movimentos de embarcações e viagens marítimas usando big data. O tipo de informação abrangida pelos serviços de API AIS da Marine Traffic inclui embarcações, informações sobre as viagens e dados sobre as embarcações em questão, como chegadas previstas, até mesmo incidentes, fotos, especificações da embarcação e previsões de viagem. Existem planos pagos neste site, portanto, não está claro quanta pesquisa pode ser feita gratuitamente. 346. Bixi Os programas de compartilhamento de bicicletas Bixi estão entre os mais conhecidos nas maiores cidades da América do Norte. Curiosamente, a marca também disponibiliza dados abertos com informações como histórico de viagens e status das estações, além de permitir comparações entre membros e usuários ocasionais. Jornalistas locais que investigam como as pessoas utilizam e integram os programas de compartilhamento de bicicletas em suas vidas têm todos os motivos para analisar esses dados. 347. Banco de dados de acidentes De Amelia Earhart ao voo 8501 da AirAsia, na Indonésia, acidentes aéreos são um tema que atrai a atenção do público. O Banco de Dados de Acidentes arquiva e armazena dados sobre acidentes de aviação ocorridos entre 1920 e 2017. Os acidentes contabilizados neste banco de dados incluem acidentes com dirigíveis civis e militares, acidentes que resultaram na morte de celebridades ou pessoas famosas, acidentes com helicópteros com 10 ou mais mortes e voos comerciais e não comerciais que terminaram em óbito. 348. Transporte para Londres A Transport for London (TfL) é o órgão governamental responsável pela supervisão do transporte público na região da Grande Londres. O site disponibiliza mapas do metrô e das linhas de trem, além de um guia de planejamento de viagens. Além de todos esses serviços práticos, o site também oferece uma grande quantidade de dados abertos, incluindo informações sobre ciclismo, qualidade do ar, metrô e até mesmo o cartão Oyster. Qualquer pessoa interessada em saber como os moradores da Grande Londres utilizam o transporte público pode se beneficiar do acesso a esses dados. 349. CMAP A CMAP é responsável pelo planejamento e organização regional nos condados de DuPage, Lake, McHenry, Kendall, Kane, Cook e Will, em Illinois. Como pode ser visto no site, as responsabilidades da CMAP abrangem questões como desenvolvimento comunitário, impostos e indicadores econômicos, e até mesmo estradas e transporte público. É por isso que os dados abertos referentes a áreas como indicadores regionais e mobilidade são úteis para um jornalista que busca compreender o panorama geral do futuro da região. 350. Estrutura de Análise de Frete Fruto de uma colaboração entre o Bureau of Transportation Statistics e a Federal Highway Administration, o Freight Analysis Framework coleta dados que são utilizados para avaliar a saúde e o desempenho geral do sistema de transporte de cargas. Este software coleta informações detalhadas, como tipo de mercadoria e tonelagem, em comparação com as estações de partida e chegada, e esses dados foram disponibilizados ao público para acesso e download, seja na íntegra ou em formato resumido. 351. Ciência da Mozilla O Mozilla Science é um software colaborativo, de código aberto e com práticas abertas, criado para auxiliar no desenvolvimento e na distribuição de diferentes fontes de dados e resultados de pesquisas. Além das questões de transparência, a decisão de abrir os programas e terceirizar o processo de aprimoramento facilita a melhoria dos programas já existentes. Com projetos disponíveis em diversas áreas, incluindo ciências da vida e medicina, entre outras, há soluções de software que podem representar avanços significativos na área. 352. Conjuntos de dados interessantes O fascínio do Cool Datasets fica evidente já pelo nome do site. Nesta página, os conjuntos de dados estão organizados em seis categorias gerais: governo, entretenimento, ciência, contribuições de usuários, diversos e aprendizado de máquina. Jornalistas que desejam explorar os dados e buscar inspiração para suas matérias certamente se beneficiarão ao conferir o que este site tem a oferecer. Há a opção de explorar os conjuntos de dados e, se possível, também contribuir com os seus próprios. 353. Monitor de Dados Abertos O OpenDataMonitor é uma plataforma que utiliza conjuntos de dados públicos e os apresenta de forma mais intuitiva e fácil de usar. Pesquisadores podem acessar a plataforma para ver um resumo das funcionalidades dos recursos de dados abertos e visualizar os dados existentes de maneira mais atraente. O site explica sua metodologia e critérios de avaliação, e os editores não terão dificuldade em encontrar dados relevantes para publicação. 354. CrunchBase O CrunchBase é talvez mais conhecido por sua ênfase em estatísticas e seu compromisso em fornecer aos seus leitores acesso aos melhores dados disponíveis. Profissionais da área de negócios acessam este site diariamente para se informar sobre as últimas tendências em investimentos e no setor. Aqui, jornalistas e editores encontram notícias e discussões atualizadas sobre as tendências mais recentes do mercado. Além disso, como parte de sua opção paga, o site também hospeda extensos conjuntos de dados que podem ser analisados usando as ferramentas de software do CrunchBase. 355. Índice O Index é uma plataforma com uma proposta de valor única, pois oferece algo para todos os públicos, desde startups e investidores até analistas e grandes empresas. O site também hospeda informações sobre mais de 100.000 empresas do setor de tecnologia, além de permitir que os usuários classifiquem, criem e exportem planilhas. Editores e jornalistas que buscam manchetes em busca de possíveis pautas podem se antecipar às notícias de negócios por meio deste site. O Index pode ser incomum, mas não há dúvida de que é um recurso útil. 356. SEMRUSH A SEMrush se orgulha de ser uma das ferramentas de inteligência de busca mais consolidadas disponíveis para profissionais de marketing digital. Entre a academia e os webinars, os pesquisadores têm todas as oportunidades para aprender os fundamentos. No entanto, o blog e as seções de notícias contêm informações suficientes para que editores e jornalistas possam se manter atualizados sobre as últimas novidades em publicidade online e SEO. Os serviços da SEMrush são pagos, mas eles oferecem muitas informações de qualidade gratuitamente. 357. Ahrefs O Ahrefs pode ser resumido como um conjunto de ferramentas de marketing potencialmente úteis para qualquer pessoa que publique conteúdo online. O site oferece uma combinação de serviços como pesquisa de conteúdo, monitoramento da web, pesquisa de palavras-chave e pesquisa de backlinks para ajudar os usuários a entender o sucesso dos concorrentes. Provavelmente mais útil para editores online em geral, o blog do Ahrefs, por si só, representa um excelente custo-benefício para quem prefere uma abordagem de marketing baseada em dados. 358. Lista de anjos O AngelList, com seu nome inteligentemente escolhido, é basicamente uma mistura de Craigslist e LinkedIn, com foco em conectar investidores, candidatos a vagas e startups em um só lugar. Além desse conceito interessante, o site oferece diversas oportunidades para jornalistas empreendedores descobrirem as startups mais promissoras e as tendências de investimento mais recentes antes que se tornem populares. Com sua interface intuitiva e forte orientação para negócios, este site é útil para profissionais em vários aspectos. 359. Adquirido Em praticamente todos os setores, a aquisição de uma empresa pode mudar toda uma indústria quase da noite para o dia. O Acquired é um site que se dedica a manter o público informado quando ocorre uma aquisição no setor de tecnologia. Repleto de estatísticas que podem ser visualizadas no próprio site, além da possibilidade de filtrar as buscas, o Acquired é uma ferramenta que jornalistas que escrevem sobre tecnologia podem aproveitar ao máximo, incluindo-o em sua rotina diária de navegação na web. 360. Mattermark O Mattermark é um serviço pago que facilita a vida dos tomadores de decisão das empresas, produzindo listas de clientes de alta qualidade que levam em consideração tanto as empresas quanto seus principais funcionários. Oferecendo perfis empresariais completos, flexibilidade com sua API e até mesmo recursos de exportação para atualizações, o Mattermark não poupa esforços. Empresas que desejam direcionar melhor suas campanhas e acompanhar os resultados delas têm muito a ganhar ao se inscreverem neste serviço. 361. Fintechstartups A FintechStartupsCo funciona como um agregador que monitora o quanto diferentes empresas conseguiram arrecadar em seus IPOs. Com um design minimalista que alterna entre as abas "startups" e "notícias", é uma maneira rápida e fácil para jornalistas se manterem atualizados sobre as últimas notícias de captação de recursos. Enquanto isso, editores em busca de conteúdo rápido e notícias concisas também podem se beneficiar ao explorar o que este site tem a oferecer. 362. Datafox Caso o nome não tenha deixado tudo claro, a DataFox é uma empresa que se dedica a fornecer aos seus clientes corporativos as informações necessárias para otimizar seus sistemas de CRM e, de modo geral, tomar decisões baseadas em dados. Oferecendo serviços que incluem inteligência sobre conferências e empresas, APIs e sinais corporativos, esta empresa funciona como um balcão único para negócios que estão reformulando suas estratégias de vendas e relacionamento com o público. Editores digitais e provedores de conteúdo também podem se interessar. 363. Abre o envio O OpenSpending é uma plataforma gratuita, acessível virtualmente em qualquer lugar do mundo, que permite aos usuários pesquisar e examinar dados financeiros de domínio público. Para pessoas sem conhecimentos técnicos, trata-se de uma ferramenta poderosa para visualização e análise. Jornalistas, em particular, podem usar o OpenSpending para encontrar novas informações interessantes e explorar ângulos de reportagem, conforme sugerido pela própria empresa em seu site. Como um bônus adicional, jornalistas estão entre as profissões especificamente solicitadas no fórum. 364. API de esportes da ESPN Não contente em ser apenas o canal de esportes mais popular da TV a cabo, a ESPN está expandindo sua influência para a programação e APIs. No Centro de Desenvolvedores, o site oferece aos editores uma seleção de diversas APIs, incluindo notas de pesquisa, rankings de poder, palpites para o draft, calendários e manchetes. Há até mesmo uma API que carrega perfis de atletas, biografias e estatísticas de todos os principais esportes. Jornalistas que se preparam para escrever uma matéria com conteúdo esportivo só têm a ganhar ao explorar esses recursos. 365. Referência Esportiva Para os amantes do esporte que gostam de analisar números e ter acesso a estatísticas avançadas em um só lugar, o Sports Reference é um dos melhores sites da internet. Com dados históricos que incluem estatísticas de times e jogadores, tanto de ataque quanto de defesa, os pesquisadores esportivos podem explorar o conteúdo de forma ampla ou específica, conforme desejarem. Além disso, o site oferece dados para praticamente todos os principais esportes, do basquete ao beisebol, e também informações separadas para diferentes modalidades universitárias. 366. Conjunto de dados de um milhão de músicas A coleção "Million Songs Collection", cujo nome é bastante apropriado, reúne o equivalente a 28 conjuntos de dados com metadados e informações sobre as características de áudio de exatamente um milhão de músicas. Fruto em grande parte do trabalho do LabROSA da Universidade de Columbia em conjunto com o Echo Nest, essa informação está acessível e hospedada no sistema AWS da Amazon. Os usuários podem realizar buscas por essa informação através do Infochimps, o que a torna ainda mais acessível para jornalistas em busca de curiosidades obscuras, bem como para editores de conteúdo.




