有许多不同类型的网站提供丰富的免费、免费增值和付费数据,可以帮助受众开发者和记者进行报道和讲故事。数字出版状态团队谨此感谢这些网站,它们来源于人工搜索和我们现有受众的认可。.
1. Kaggle Kaggle 是一个让用户在编写和分享云端代码的同时探索机器学习的网站。该网站主要依靠其庞大社区的热情,举办数据集竞赛并提供现金奖励,因此积累了海量数据。无论您是在寻找纽约证券交易所的历史数据、美国糖果生产趋势的概述,还是前沿代码,这个网站都能提供丰富的信息。. 2. 维基百科 在互联网上,你几乎不可能长时间不接触到维基百科条目。从资料翔实、引用丰富的历史人物传记到对近未来和远未来发展的时间线,维基百科的条目涵盖范围之广,足以证明其作为免费网络百科全书的地位。无论是提供主题概述的条目,还是网站提供的众多书籍和在线参考资料,维基百科在很多方面都是写作者的最佳伙伴。. 3. 普通爬行 顾名思义,Common Crawl 网站会搜索或“抓取”网络上的数据,然后将其存储并构建到一个开放的存储库中,供用户访问。该网站的功能强大,例如虚拟专利标记和提供 RSS 源的网站列表,仅举两例。如果您需要进行数据或网站比较,这是一个易于使用的工具,可以帮助您创建原创信息。. 4. EDRM EDRM,即电子发现参考模型(Electronic Discovery Reference Model)的简称,是一个面向法律专业人士的网站,致力于充分发挥电子发现的潜力,并制定信息管理相关的规则和预期。此外,EDRM成员携手合作,开发协作标准、软件和教育工具,旨在推进社群目标的实现。如果您想了解技术如何改变法律实践的程序和行政管理方面,EDRM网站是您的理想之选。. 5. 驯象师 Mahout专注于一款同名软件,该软件旨在解决构建高性能机器学习应用程序环境的逻辑问题,这些应用程序可以快速扩展和创建。对于希望编译和处理自己的数据集或尝试机器学习应用程序的研究人员来说,这款软件尤其有用。本网站将帮助用户快速熟练地使用这款软件。. 6狐猴项目 Lemur 项目是一个专注于支持信息检索和人类语言技术研究的数据库。该项目拥有约 10 亿个网页,涵盖 10 种语言,数据收集时间从 2009 年 1 月到 2 月。如此庞大的资料库和丰富的支持资源使其成为研究人员的绝佳选择。凭借这些资源以及网站提供的其他支持,任何对技术和人类语言感兴趣的人都能在这个网站上找到丰富的研究素材。. 7古腾堡计划 古腾堡计划是一个收录公共领域小说、论文和其他作品的目录网站。该网站拥有超过54,000册电子书,涵盖了从莎士比亚、马克·吐温和简·奥斯汀等知名作家的作品,到亨利·柏格森和塞缪尔·巴特勒等较为冷门作家的作品。无论您是为了增长见识而想阅读经典小说,还是为了研究19世纪人们的生活体验,古腾堡计划都是一个绝佳的资源。. 8百万首歌曲数据集 这是一个包含约一百万首流行歌曲音频特征和元数据的完整数据集的网站。除了这百万首歌曲的主要数据集外,社区还贡献了许多其他相关类别的数据集,例如翻唱歌曲、流派标签和歌词等等。音乐史学家、爱好者或研究人员都可以轻松地对这些数据进行排序。这很可能是整个互联网上关于此主题最全面的数据集。. 9. 亚马逊 亚马逊作为一家数字零售商早已家喻户晓,但您是否知道,亚马逊还托管着大量免费的公共数据集,任何人都可以访问这些数据集,而无需在自己的设备上存储或下载任何内容?这些数据涵盖了天气、太空环境和气象信息,以及用于开发辅助计算机视觉算法的图像数据,对于那些希望以更便捷的方式分析海量数据的人来说,亚马逊提供了丰富的选择。. 10. 加拿大开放政府 为了提高透明度、鼓励更多公民参与和促进对话,加拿大政府在其“开放政府”计划中提供了大量数据。在这个网站上,您可以找到与政府相关问题的数据集,例如加拿大各地无家可归者收容所的容纳能力,以及英语和法语人士在公共部门的参与程度等区域数据。有了这些数据集,您无需依赖他人的统计数据即可获取信息。. 11. 数据目录 数据目录(现更名为数据门户)为用户提供了一个便捷的平台,方便他们浏览来自世界各地的开放数据门户。这些门户经过各级政府、众多非政府组织乃至世界银行的评估和维护,因此可供分析的数据质量极高。用户可以选择浏览或贡献数据门户。从研究角度来看,丰富的主题和信息使该网站成为查找信息的理想起点。. 12Data.gov.uk Data.gov.uk 是一个允许个人查找和访问各类公共机构、政府部门、地方当局和政府机构发布的数据的网站。研究人员可以在这里找到有关小型企业经济环境、贸易、进出口、工业和出口的信息,甚至可以研究政府部门支付的超过 25,000 英镑的款项。该网站明确指出数据可用于研究,因此,研究人员在浏览这些信息的过程中,或许还能从中获得更多灵感。. 13Data.gov 美国政府通过这个网站向公众提供开放数据,数据以数据集的形式呈现。除了原始数据外,该网站还提供多种工具,可用于创建数据可视化图表以及开发网页和移动应用程序。毋庸置疑,数据量极其庞大,涵盖从信用卡投诉到联邦学生贷款项目数据等超过19.7万个数据集。该网站为创新和全面分析提供了丰富的机会。. 14.DataSF DataSF 提供数百个与旧金山市和县相关的数据集。想了解当地和区域游说团体一直在推动什么吗?需要犯罪统计数据吗?浏览“案例展示”选项卡,看看人们如何利用这些数据,或者使用表格做出贡献。该网站基于开放数据构建,并提供学院、博客和许多其他工具,其发展很大程度上依赖于协作和社区。这使其成为研究人员的宝贵资源。. 15. 数据雪貂 DataFerrett 与许多网站不同,它与其说是一个数据存储库或目录,不如说是一个工具,用户可以通过数据分析和提取,自定义来自地方、州和联邦政府的数据。该工具允许用户创建自定义的综合电子表格,然后将相同的信息转换为地图或图表,而无需下载或启用任何其他软件。整理海量数据并将其转换为易于阅读的内容从未如此简单。. 16. 信息论坛 通过马里兰大学,Inforum 向公众提供美国经济数据。许多美国政府机构都为该网站贡献了数据,使其目前拥有数千个所谓的“经济时间序列”,其中包括工业生产、价格指数、劳动力统计数据和商业指标等信息。这些数据免费提供,用户可以使用个人笔记本电脑或台式电脑访问。对于希望深入了解原始经济数据的研究人员来说,Inforum 是一个理想的资源。. 17. 欧洲数字图书馆 根据网站自身的数据,Europeana 的馆藏总量超过 5000 万条记录。研究人员可以利用这里精心整理的数据集,更快地找到所需信息。这些数据集涵盖了诸多类别,例如 3D 模型、意大利一战地图,甚至还包括来自立陶宛博物馆的 2 万多张历史照片等等。无论是进行一般的历史检索,还是作为探索 Europeana 海量馆藏的起点,这都是一个极佳的资源。. 18《卫报》 除了不间断地报道突发新闻和事件外,《卫报》还专门开辟了一个版块刊登数据简讯。这些文章涵盖了从住房政策对解决无家可归问题的有效性等严肃话题,到哪些国家拥有最多的诺贝尔奖获得者等轻松有趣的话题。记者和研究人员可以从该网站获取大量信息用于自己的项目。只需快速搜索,几乎可以找到任何主题的数据。. 19基因表达综合数据库 由美国国家生物技术信息中心 (NCBI) 主办的基因表达综合数据库 (GEO) 是一个包含符合 MIAME(微阵列实验最低信息标准)的“公共功能基因组学数据”的网站。该网站也接受已完成芯片或测序的数据,并提供查找和下载信息所需的工具。对基因组研究或获取相关信息感兴趣的人士可以在这里找到所需的所有数据,甚至更多。. 20芝加哥大学 芝加哥大学空间数据科学中心 (CSDS) 长期以来因其对社会科学领域创新和进步的贡献而备受认可,如今,它正通过进军空间分析和技术领域,探索下一个前沿领域。CSDS 的工作几乎可以应用于任何需要处理空间问题的领域。因此,环境经济学、公共卫生和犯罪学等领域都从中受益。CSDS 致力于开源软件和信息共享,使其提供的数据更易于获取。. 21连接 科布伦茨-兰道大学网络科学与技术研究所收集的数据,促成了KONECT(科布伦茨网络集合)在网络科学及其相关领域的研究成果。该项目运用一系列自主研发的网络分析软件工具进行数据分析,并生成图表和算法。KONECT随后将分析结果直接发布在其网站上。超过200个数据集可供选择,这是一个值得探索的资源。. 22. MIdata MIdata 是一个机器学习数据存储库网站。这些数据集涵盖范围广泛,从人类面部表情汇编到预测分子键合方式等更科学的主题,应有尽有。该网站将数据按类别划分,提供原始数据、材料和方法部分的教程以及学习任务和挑战,方便研究人员浏览存储库,找到感兴趣的数据集。. 23纳斯达克 纳斯达克是世界知名的证券交易所,长期以来一直是记者和研究人员获取金融和商业数据的重要资源。在这里,您可以找到有关首次公开募股 (IPO) 的信息、历史价格数据以及最新的财经新闻,使其成为金融数据领域首屈一指的在线平台。纳斯达克综合指数也为希望进行更深入分析的用户提供付费数据选项。这是一个备受推崇且历史悠久的资源。. 24美国国家航空航天局 自登月以来,美国国家航空航天局(NASA)及其太空探索活动已是家喻户晓。然而,对记者而言,NASA 的另一个重要信息来源是其空间科学数据协调档案库。研究人员可以在这里找到天体物理学、图像资源、太阳物理学等各类空间科学任务数据。此外,网站上还提供大量白皮书,与新提交的数据相对应。. 25索克拉塔 Socrata是一个网站,它将现有的政府数据转换成便于用户分析、浏览和查找所需信息的格式。Socrata的设计充分考虑了非技术用户的需求,例如公共政策专家、研究人员、企业家和关心时事的公民,它利用云技术整合来自各种来源的数据。对于试图了解不同政策有效性的记者来说,这是一个非常有用的平台。. 26昆德尔 Quandle是一个主要提供经济和金融数据的网站,其数据格式充分考虑了投资专业人士的需求。该网站整合了来自CLS集团、联合国、各国央行和Zacks等500多个权威机构的信息源,是研究人员和记者快速了解整体经济形势的理想选择。此外,得益于该网站的Excel插件,用户可以直接访问数据,从未如此便捷。. 27. 卡内基梅隆大学 卡内基梅隆大学作为一所卓越的学术机构,享有盛誉。然而,许多人并不知道,卡内基梅隆大学的统计实验室(StatLab)也是新闻工作者寻找数据的宝贵资源。该数据集库包含的数据涵盖了诸多主题,例如1986年北美职业棒球大联盟(MLB)球员的薪资水平,以及用于评估统计软件准确性的数据。只要注明出处,这些数据集即可公开使用。. 28. 加州大学尔湾分校 加州大学尔湾分校机器学习库(简称UCI)是一个存储了大量有趣数据的网站,供记者使用。截至撰写本文时,该网站拥有394个数据集,其优势在于界面易于搜索。一些比较热门的数据集包括“使用智能手机识别人类活动”、葡萄酒和银行营销等主题的信息。使用所有这些数据,该网站仅要求注明出处。. 29. 加州大学河滨分校 如果您是一位关注机器学习发展的记者,那么加州大学河滨分校(UCR)的时间序列分类/聚类页面将是您绝佳的阅读材料。该网站提供了一份简明扼要的文档,其中包含了您需要了解的所有背景信息。除了概述信息内容外,该网站还提供直接下载数据的功能。如果您使用这些数据集,请务必按照网站要求的引用格式进行引用。. 30. 美国人口普查 需要人口财富统计数据?想知道某个特定领域的具体性别构成?美国人口普查局网站提供所有这些数据以及更多信息,供公众查阅。按年份或地区排序,您就能快速找到大多数人甚至不知道美国人口普查中包含的统计数据。这些数据以 Excel 和 Microsoft Word 格式提供,使记者能够更方便地获取数据。. 31. Wolfram Alpha Wolfram Alpha 实际上是一个计算引擎,用户可以输入想要了解的数据并获得计算结果。该引擎可以处理统计数据和分析、化学、日期和时间,甚至包括词语和语言学等诸多领域。对于那些试图探索新的数据处理方法的用户来说,它尤其有用,因为它只需按一下按钮就能立即输出新的计算结果。记者尤其可以从中受益匪浅,将其作为辅助资源。. 32. 喊叫 事实证明,Yelp 不仅仅提供餐厅和用户点评。这个用户驱动的点评网站还维护着一个数据集,研究人员可以出于“个人、教育和学术目的”访问其中的评论、用户数据和商家信息。据该公司统计,该数据集包含 12 个大都市地区的 470 万条评论和 15.6 万家商家信息。如此庞大的数据量,或许会让研究人员从中发现令人惊喜的素材和趋势。. 33. 数据世界 想查看已删除的 Facebook 页面列表?或者想按县整理美国经济数据?Data World 是一个允许用户分享、托管、协作和跟踪数据的网站。该网站甚至还专门为记者设立了一个版块,阐述了 Data World 对业内人士的实用之处,并重点介绍了其托管功能,包括简化的《信息自由法》申请预测工具以及旨在帮助用户整理数据的页面。总而言之,这是一个集数据和数据托管于一体的强大平台。. 34. 世界概况 由美国中央情报局运营的《世界概况》提供267个国家的社会结构、历史、军事和经济状况等信息,并配有地图、国旗和时区信息,与世界地图的内容相呼应。该网站对相关主题进行了全面深入的探讨,远超基础知识。简而言之,这是每位记者都应该掌握的重要数据来源。. 35. HealthData.gov 由美国卫生与公众服务部管理的HealthData.gov网站向公众提供“高价值健康数据”,旨在吸引企业家、政策制定者和研究人员的关注。至少在产品和服务开发领域,人们已经能够利用这些数据并获得成果。希望掌握健康数据前沿动态或核实卫生官员声明的记者也可以使用该网站寻找答案。. 36. 联合国儿童基金会 这个网站能为使用其信息的记者迅速提升可信度。联合国儿童基金会涵盖的统计数据涉及健康和人权等诸多领域,例如教育、孕产妇健康、儿童贫困、水和卫生设施、儿童残疾等等。对于研究人员来说,它非常有用,因为数据及时更新,并且由全球最知名的组织之一提供支持。记者引用这个数据来源绝对不会出错。. 37. 世界卫生组织 世界卫生组织是一个国际组织,负责收集全球各地的健康统计数据和信息。除了主页上的信息外,该网站还通过全球健康观察站提供数据。这些数据涵盖各国在全民健康覆盖、健康研究与发展等方面所采取的措施。记者可以在这里找到大量关于疫情爆发、突发公共卫生事件以及国际医疗保障方面的信息。. 38. Google 公共数据 有了谷歌公共数据,记者们显然可以从多个方面依赖谷歌。这家搜索引擎巨头拥有超过100个公共数据集,可供分析使用。数据主题涵盖范围极广,从极其严肃的世界发展指标和人类发展指标,到趣味盎然的欧洲最危险道路数据,应有尽有。研究人员只需进行搜索,即可查看谷歌公共数据的内容。. 39. 间隙保持器 Gap Minder 提供一系列本地和国家指标的数据,以及所有数据提供商的链接和信息。研究人员可以通过该网站查看诸如女性初婚年龄、酒精消费统计数据和儿童死亡原因等信息。对于撰写具有国际视野或进行对比数据分析的记者来说,这是一个极佳的资源。无论如何,这都是一个非常有用的数据来源。. 40. 谷歌趋势 Google Trends 是一款工具,可帮助研究人员了解人们此刻正在搜索的内容。研究人员可以将这些数据与过去的趋势进行比较,还可以利用该工具提前预测未来(例如节假日期间)的搜索趋势。Google Trends 提供图表、热门话题以及大量抢先发现新闻的机会。. 41. 谷歌财经 Google Finance 提供了一个便捷的途径,让您可以对投资者热议的公司进行更深入的研究。它提供了一个简洁明了的窗口,方便您筛选技术指标并查看公司最新动态,并进一步优化信息。此外,它是免费的。对于想要研究上市公司财务状况的记者来说,Google Finance 提供了一个直观的界面,方便他们获取所需信息。遗憾的是,Google 最近停止了一些核心功能,例如财务投资组合。以下是一些相关内容。 谷歌财经的替代方案. 42. DBpedia 任何一直渴望更便捷地进行维基百科搜索的人,都有理由对DBpedia感到兴奋。在社区的共同努力下,该网站致力于让用户能够对维基百科内容进行更复杂的搜索。其英文版拥有458万条条目,并包含分类和相关类别,正朝着基于维基百科信息的全面覆盖迈进。对于新闻工作者而言,DBpedia无疑是一个理想的数据源。. 43. 皮尤研究中心 对许多人来说,皮尤研究中心在调查、报告和研究数据方面堪称权威。该网站涵盖的主题广泛,从政治观点到社会趋势,再到各行各业的发展动态,无所不包。皮尤研究中心还提供便捷的搜索功能,让信息获取变得前所未有的轻松。对于希望获取来自权威可靠来源的最新统计数据和研究成果的记者而言,皮尤研究中心无疑是最佳选择。. 44. 博德研究所 对于想要了解癌症领域最新进展的记者来说,博德研究所的数据集可能是获取信息的理想来源。这其中也包括生物信息学、计算生物学、脑癌和分子模式发现等其他领域的信息。简而言之,该网站能够帮助记者更便捷地获取关于癌症的深度数据,并利用博德研究所提供的数据撰写新闻报道。. 45. 联合国数据 联合国数据平台(UNdata)提供世界各国的信息,包括各国的技术指标、社会指标和经济指标等。对于撰写人文故事或需要补充统计数据佐证的报道的记者而言,联合国数据平台是理想之选。数据的准确性以及联合国的权威性,使其成为记者进行研究时值得信赖的数据来源。. 46. 谷歌学术 想象一下,如果不用费力地浏览网页,就能直接搜索到所有经过同行评审的论文和学术资料,那该有多方便。谷歌学术让用户能够轻松找到世界顶尖学者的期刊文章、白皮书和出版物。谷歌学术一如既往地简洁易用,用户只需输入关键词即可开始搜索。查找学术论文从未如此简单。. 47. Reddit Reddit 被誉为“互联网首页”,是互联网上最受欢迎的网站之一。它不仅能准确反映网络热点,还设有专门的数据集子版块(subreddit)。用户可以在这里请求数据集、发布资源,并讨论如何使用 JSON 等格式的数据。研究人员可以从这个数据源中获益良多。. 48. 数据市场 Qlik DataMarket 让您能够收集和处理来自外部来源的数据。该平台允许用户借用多个数据集,并可选择将其与自身已有的数据进行交叉引用,从而更全面地理解数据背景。更棒的是,尽管 Qlik DataMarket 是一个付费平台(具体费用取决于主题),但它也提供免费版本。记者可以尽情探索这些数据。. 49. HubSpot HubSpot一直是商业营销领域思想领袖的代表。从研究角度来看,HubSpot网站能够实时提供行业动态以及业内人士的热门话题,让研究人员全面了解行业动态。记者也可以利用该网站了解更多行业趋势。因此,HubSpot对于研究人员来说是一个极佳的资源。. 50. 司法统计局 不出所料,司法部保存着大量的统计数据。在其网站上,您可以找到逮捕人数、囚犯死亡人数、死刑执行人数、执法统计数据以及监狱人口普查数据。刑事司法系统一直是公众和相关人员关注的焦点。正因如此,司法部的统计数据对于研究刑事司法系统的记者来说更具价值。. 51. 统一犯罪报告 《统一犯罪报告》(UCR)是由联邦调查局(FBI)收集的财产犯罪和暴力犯罪统计数据。虽然美国各地的执法机构自1930年以来一直在报告这些数据,但相关调查结果最早可追溯至1958年,相关人员可以进行搜索。希望探索犯罪数据的记者可以选择访问和使用UCR数据工具,以浏览本网站上的信息。. 52. 统一犯罪报告 统一犯罪报告(UCR)是国际警察首长协会于1929年提出的一个项目的成果。联邦调查局(FBI)收集的UCR数据每年发布四次。除了UCR项目提供的信息外,该网站还包括仇恨犯罪统计报告、执法人员伤亡报告(LEOKA),以及国家事件报告系统(NIBRS)提供的结果和数据。. 53. 全国刑事司法委员会 NACJD,即国家刑事司法数据档案馆,是一个从统一犯罪报告(UCR)和全国犯罪受害者调查(NCVS)等数据集中提取信息,并存储和发布统计数据的网站。为了便于用户访问,该网站的数据经过精心整理、存储和维护,并以多种形式呈现,包括实验性数据、定性数据和纵向数据。最终,这为记者和其他研究人员提供了一种可视化和访问刑事司法统计数据的新途径。. 54. 第一数据银行 First Databank是一个专注于药物数据的网站。该网站致力于在医药领域推动更高效、更数据驱动的决策。通过First Databank创新性的技术应用,医生和临床医生可以以全新的视角看待药物。从专业角度来看,该网站尤其有用,因为它的数据能够帮助团队根据新信息的出现及时调整策略。至少,对于医药领域的记者来说,这是一个宝贵的资源。. 55. FDA 美国食品药品监督管理局(FDA)是负责监管和批准药品、食品、膳食补充剂、疫苗、化妆品以及其他消费品,从而保护公众健康的机构。FDA不仅提供可供公众查阅的数据集,还提供技术数据,方便那些熟悉电子表格操作和分析数据集信息的人员使用。这对于记者来说无疑是一个非常有用的资源。. 56. 药物库 你是否曾好奇过,毒品泛滥究竟给国家带来了多少损失?人们吸毒的方式是否与以往有所不同?Drugbase 提供了一个数据库,其中包含大量关于美国毒品趋势和使用情况的统计数据。此外,还有信息图表和出版物,主题涵盖成瘾与精神疾病的共病性,以及关于吸毒后(而非酒后)驾驶的事实。这个资源提供了充足的信息,帮助你发现趋势并与历史数据进行比较。. 57. 联合国毒品和犯罪问题办公室 联合国毒品和犯罪问题办公室(UNODC)的网站致力于帮助成员国采纳更严格的研究、数据收集和法医鉴定标准。在该网站上,研究人员可以找到大量统计数据和出版物,涵盖数据收集、趋势分析以及研究项目等主题。该网站资源丰富,涵盖了各种法医相关主题以及该领域的科学原理。. 58. 毒品战争事实 “毒品战争事实”网站对毒品战争及其政策后果进行了深入探讨。网站内容包括统计数据和具体数字,例如治疗成本与依赖执法成本的对比、毒品管制支出估算等,以及几乎所有与毒品战争相关的议题。对许多人来说,这是网络上关于毒品战争最全面的网站。. 59. 国家教育统计中心 美国国家教育统计中心(简称NCES)是获取所有教育相关统计数据的权威机构。该网站提供学生贷款状况统计数据、教育趋势预测,以及可用于进行更深入分析的数据集和比较工具。记者可以利用此资源发现趋势、核实公开声明、查阅美国国家教育统计中心的出版物,并从数据中挖掘新的新闻故事。. 60. 世界银行 世界银行拥有由发展数据小组汇编的大量金融和宏观经济领域的统计数据。用户可以通过话题标签对数据进行筛选。用户可以选择各种指标,并按国家/地区进行筛选,从而查看不同的发展进展衡量标准。因此,任何关注成员国金融和/或经济状况的人士都可以从中受益。. 61. 美国劳工统计局 美国劳工统计局是记者获取与当前工作状况、劳动力市场动态以及价格变化及其对美国经济影响相关的数据和统计信息的首选来源。该机构的统计工作可以追溯到1884年,因此研究人员可以从中获取丰富的经济数据。该网站以用户友好的界面存储信息,并不断更新可供搜索的数据。这是一个值得探索的数据资源。. 62. 数字 大片上映总能吸引大量媒体关注,但如果没有数据,很难判断一家公司实际的业绩如何。“The Numbers”网站应运而生。该网站提供电影和娱乐行业的调研和数据。研究人员可以通过OpusData基于SQL的搜索引擎,探索收入预测、即将上映影片的预期以及其他投资数据。“The Numbers”是研究人员获取可靠电影统计数据的首选网站,也正因如此,它成为了一个优秀的资源。. 63. Film Forever Film Forever 是一个研究人员可以访问的网站,提供英国电影行业的市场情报和数据。用户可以在这里找到英国票房前 15 名影片的每周票房数据、观众调查、报告、案例研究以及该机构的旗舰统计年鉴。此外,该网站还提供一个日历,方便用户了解下一次统计数据的发布时间。Film Forever 的专业性使其成为一个特别有价值的数据来源。. 64. 国际唱片业协会 IFPI网站以其对全球唱片业动态的精准把握而自豪。用户可以在这里找到大量已发布的报告,其中包含对录制音乐的深入分析、国内外的销售数据,以及展现音乐产业商业运作的报告,揭示各公司在音乐领域的投资策略。这些报告让用户能够了解行业的最新动态。该网站将为研究人员提供音乐产业实时更新的信息。. 65. Statista Statista 是一个类似谷歌的搜索引擎,但它返回的不是网页,而是数据和统计信息。只需轻轻一点,用户即可立即访问超过一百万条统计数据和事实。用户可以在这里找到信息图表、关于中国、食品行业、消费市场的统计数据,付费用户还可以查看专题报告和行业报告。无论您是想了解经济、社交媒体还是巨无霸汉堡的信息,这里都能满足您的需求。. 66. 美国环保署 美国环境保护署(简称EPA)是负责保护民众和环境的政府机构,其职责是通过执行国会制定并通过的法律。在EPA的网站上,用户可以浏览涵盖农业到有毒化学品年度排放量和废物管理方法等诸多主题的大量数据集。对于希望获取原始环境数据的记者来说,该网站是一个绝佳的选择。. 67.疾病控制与预防中心 美国疾病控制与预防中心(CDC)的这个网站自诩为“环境公共卫生数据的一站式平台”。在这个网站上,研究人员可以找到相关数据系统的参考资料和列表,这些系统接受国家资助,并追踪和存储与环境公共卫生问题相关的信息。该网站重点关注国家级项目,并提供直接下载功能,是获取网络上最新、最准确信息的可靠资源。. 68. 国家环境健康中心 美国国家环境健康中心由三个此前独立的机构合并而成,是获取高质量环境信息的首选之地。该中心提供涵盖海洋数据到数百万年前冰层记录等全面数据,只要涉及环境问题,几乎都能在这个网站上找到相关信息。该机构致力于维护其规模最大的同类档案库之一,并始终秉持着对准确性和卓越性的不懈追求,使其成为少数几个拥有、更新和维护此类数据的网站之一。. 69. 美国国家气象局 美国国家海洋和大气管理局 (NOAA) 的国家气象局 (NWS) 将为研究人员提供他们所需的一切天气信息。该网站提供数据搜索功能,涵盖预警和预报、气候、地理预报等各类信息。此外,它还配备了一张直观易用的地图,地图上的标签页可点击查看不同结果。无论您是想了解本地天气情况,还是查找其他州某个城市的预报,该网站都能快速提供所需信息。. 70. 奇境 Wunderground致力于为世界各地的人们提供天气信息,尤其关注那些报道较少的地区。Wunderground明确表示,已采取措施确保用户在多个数字平台上都能获得卓越的体验。这意味着该网站既可通过手机访问,也可通过电脑访问,使其成为经常出差的记者们的理想资源。. 71. 气象基地 Weatherbase 通过简单的搜索栏,提供全球超过 40,000 个城市的实时天气状况、平均天气、气候信息和旅行信息。您还可以访问其链接的配套网站,查找更多旅行信息,例如货币转换器、坐标、县/郡信息以及其他实用信息。此外,您还可以使用 Weatherbase 根据天气情况查找度假目的地。祝您搜索愉快! 72. 能源图谱 由国际能源署出版的《能源地图集》使研究人员能够通过能源统计数据了解世界。该网站自创建之初就旨在作为补充数据来源,其特色在于动态的桑基流能源平衡图以及多个数据库,这些数据库与国际能源署统计页面上的出版物相辅相成。研究人员在研究各国和各城市的能源使用方式时,会发现该网站及其相关网站都非常有用。. 73. 美国经济分析局 美国经济分析局(简称BEA)发布大量实用信息,使研究人员能够密切关注国家经济动态。本网站提供美国经济账户数据,包括消费者支出、GDP和固定资产等。研究人员可以按地区、行业以及国际、国家和地区等不同层级进行搜索。欢迎访问互动数据页面,了解更多关于该局的信息。. 74. 美国国家经济研究局 美国国家经济研究局(NBER)的网站是一个以分析视角研究经济学的数据库。它收录了涵盖广泛经济主题的数据,例如非洲治理指数、官方商业周期、实验性同步指数、领先指数和衰退指数,以及宏观经济历史数据库。NBER不仅拥有以其名义发布和汇编的官方数据集,还收录了其他出版商汇编的指数。. 75. 美国证券交易委员会 美国证券交易委员会(SEC)是一个监管机构,致力于促进市场的透明度、公平性和效率。值得一提的是,SEC网站拥有一个涵盖2009年1月至2017年10月的财务报表数据集,并且每个季度都会更新。研究人员可以依靠该网站掌握最新的财务报表信息,以及公司财务状况的相关数据。. 76. 国际货币基金组织 国际货币基金组织(简称IMF)是国际经济和金融领域一个历史悠久的知名机构。在其网站上,研究人员可以找到大量相关数据。用户可以按指标和国家/地区搜索数据集,并在研究过程中浏览图表和地图。热门数据集包括贸易走向、初级商品价格、金融稳健性指标、调查以及国际金融统计数据等众多有价值的信息。. 77. 《哈佛大学地图集》 Atlas 最初由哈佛大学构思,是一款在线工具,使用户能够直观地了解并互动分析企业的贸易状况。Atlas 会利用这些信息,提出该国可能生产的不同产品,以促进其经济发展。政策制定者、商界人士、投资者以及希望更好地了解特定国家经济环境的公众都在使用这款工具。贸易和国民经济问题从未如此触手可及。. 78. 开展业务 “营商环境”网站旨在对营商环境法规进行客观评估。该网站考察了近200个经济体和众多城市,衡量了包括经济指标在内的各项细节,并对营商便利度进行了排名。用户可以通过该网站了解不同国家/地区各类营商环境法规的影响,网站提供报告和丰富的定性数据。此外,该网站还支持进行跨时期的比较。. 79. 商品贸易统计网站 Comtrade最初是英国商业、能源和产业战略部与国际贸易部合作的项目,如今已成为一个优秀的资源。该网站借用了联合国商品贸易统计数据库(Comtrade Data)的数据,为用户提供交互式图表,方便用户搜索、比较和分析各国之间的贸易和商品数量。只需选择报告国,选择一个贸易伙伴国,并尽可能多地进行其他选择即可。. 80. 全球金融数据 全球金融数据网站不仅收录标准金融数据,更涵盖了从13世纪至今的金融信息。这些信息来源于书籍、档案资料、学术期刊和新闻期刊等多种渠道。此外,该网站还拥有运用链式链接统计方法构建的数据集。从用户的角度来看,凭借其独一无二的数据,该网站在互联网上堪称绝无仅有。. 81. 经济学可视化 Visualizing Economics与其说是一个数据发现资源,不如说是一个专注于设计信息图表和交互式仪表盘的服务平台。此外,Visualizing Economics还提供分析和设计服务,旨在让经济数据更易于理解。通过该网站,记者们有机会与一位拥有多年经验的专业人士合作,该专业人士擅长将经济数据转化为更易于公众理解的内容。. 82. 欧盟开放数据门户 欧盟开放数据门户网站是欧盟委员会一项决定后设立的项目。在该网站上,欧盟机构提供数据供公众查看和使用,不受版权限制,且完全免费。数据集包括CORDIS参考数据、透明度登记册,甚至还有欧盟已实施金融制裁的个人、实体和团体的完整名单。此外,这些数据还提供多种数字格式。. 83. 开放数据 网络 开放数据网络是一个允许用户按地区和城市查找数据的网站。该网站拥有清晰直观的主页,研究人员可以按数据类别、城市甚至示例问题进行搜索。在每个页面上,浏览完数据类别或示例问题后,还可以找到更多数据集的便捷链接。仅凭其数据组织方式,开放数据网络就值得您深入探索。. 84. 地矩阵 Landmatrix是一个提供土地交易在线数据库的网站,旨在提高土地收购的透明度。本质上,该工具可用于可视化和理解各种土地交易。为了提高信息的准确性,数据一直在不断改进、更新和调整。迄今为止,Landmatrix已收录超过1000笔交易的信息。对于研究人员来说,这是一个值得探索的资源。. 85. 联合国开发计划署 联合国开发计划署拥有大量关于世界各地人类发展的实用数据,供公众查阅。这些数据集的时间跨度通常为1990年至2015年,其中包含各种指标的完整表格,例如人类发展指数、性别不平等指数和生命历程性别差距的趋势表。研究人员可以直接通过搜索栏搜索数据,如果想要查看图表,也可以按国家/地区进行筛选。. 86. 经合组织 经济合作与发展组织(OECD)的网站致力于帮助各国政府通过经济稳定和增长来促进减贫和繁荣。在这个网站上,研究人员可以找到同行评审的资料、出版物,以及制定标准的相关标准和论证。OECD还提供一本概况手册,其中包含大量经济调查和预测,为经济前景提供了可靠的经济参考工具。. 87. 美国卫生与公众服务部 美国卫生与公众服务部运营着一个网站,提供有关总统健身、运动与营养委员会的信息。该网站汇集了相关领域专家(例如厨师和运动员)提供的事实和数据。此外,该网站还包含大量统计数据。研究人员可以从中找到有关儿童体育活动、成人肌肉强化习惯、公众饮食习惯以及肥胖等诸多事实和统计数据。. 88. 公共卫生工作者信息获取合作伙伴 “公共卫生工作者信息获取伙伴计划”是由公共卫生组织、美国政府机构和专注于健康科学的图书馆共同发起的一个项目。该网站的主题页面涵盖了诸如资助和资金、健康促进和健康教育以及文献和指南等主题。通过“公共卫生主题”部分,还可以找到生物恐怖主义、公共卫生基因组学和口腔公共卫生等主题的数据。. 89. 联合健康基金会 过去三十年来,联合健康基金会一直提供健康排名信息,作为衡量公共卫生状况的指标。该网站包含大量报告和出版物,涵盖退伍军人健康报告、老年人健康报告、妇女儿童健康报告、年度报告,以及该领域重要议题的简报。您可以使用交互式地图按地区浏览并了解更多信息。此外,网站还提供搜索栏,方便研究人员查找更具体的内容。. 90. 联邦医疗保险 在美国,联邦医疗保险(Medicare)是许多人获得医疗保险和医疗服务的主要途径。除了提供实时服务外,联邦医疗保险还通过其对比图表和规则提供各医疗机构和医院的治疗标准和质量数据。这是“医院比较”(Hospital Compare)网站使用的官方数据集,其中包含大量数据,可以下载到 Excel 中以便更轻松地访问。. 91. 监测、流行病学和最终结果(SEER) 美国国家癌症研究所的监测、流行病学和最终结果(SEER)网站是获取癌症统计数据的重要信息来源。该网站提供统计摘要,方便研究人员按癌症部位、种族、年龄、性别甚至数据类型对癌症相关数据进行分类。此外,该网站还提供出版物、数据集和软件,供研究人员进行更深入的分析。. 92. 国际特赦组织 国际特赦组织长期以来致力于在全球范围内倡导人权和正义。该组织在其年度报告中也包含大量关于世界各地人权状况的数据,以及不同时期发生的具体暴行和反人类罪行的信息。研究人员可以利用这些信息进行不同年份的比较,了解各国在人权领域的发展或倒退情况。. 93. 人权数据分析小组 自25年前成立以来,人权数据分析小组一直致力于运用科学原理分析世界各地不同国家的人权侵犯问题。该网站收录了发表在《华盛顿邮报》等知名媒体以及麦克米伦出版社正式出版物上的文章,并按年份排序。除了这些历年来整理的出版物外,该网站还收录了世界各地正在开展的项目。若想更深入地了解人权侵犯问题,这是一个绝佳的搜索平台。. 94. 国际关系与人权数据 该网站汇集了众多知名机构、大学乃至政府部门编制的数据库。例如,宣言项目(Manifesto Project)、少数族裔(风险群体)项目(Minorities (at Risk) Project)、福利国家比较区(Comparative Welfare States District)以及武装冲突数据库(Armed Conflict Database)。还有一些项目,例如政体IV项目(Polity IV Project),其数据可以追溯到19世纪。此外,像斯德哥尔摩国际和平研究所(SIPRI)这样的项目则关注武器转让、国际军事开支和安全趋势。想要更好地理解这些数据,最好的方法是访问该网站并进行探索。. 95. 乌普萨拉冲突数据项目 乌普萨拉大学和平与冲突研究系(简称UCDP)拥有一个名为“UCDP冲突百科全书”的庞大数据库。用户可以通过该网站浏览并探索该系已整理的数据。研究人员可以通过网站点击查看数据,也可以下载数据进行进一步的处理和分析。这是一个值得信赖的资源,能够以易于访问的方式提供高质量的信息,并可供参考。. 96. 美国劳工部 美国劳工部拥有大量关于失业和就业统计的经济数据。这些数据自然包括涵盖大规模裁员统计、就业预测、职位空缺和员工流动率、全国就业统计数据,甚至国际劳动力市场对比统计数据的数据库。该网站提供的信息及时更新且准确,所有数据均由劳工部负责追踪。这是一个权威可靠的资源,并得到政府支持,可用于研究用途。. 97. 小企业管理局 美国小企业管理局长期以来一直是企业家和其他有志创业者的重要资源。该网站拥有大量就业统计数据,以及可供研究人员进行市场调研和竞争分析的信息。研究人员可以在这里找到各种数据、统计资料和工具,用于挖掘更多数据。对于希望从雇主和企业角度了解小企业统计数据的记者来说,这是一个极佳的资源,可以随时查阅。. 98. 众包 Crowdpac是一个允许政治候选人筹款和组织活动的平台。该网站的灵感主要来源于每次选举中都有一些国会候选人基本上无人挑战的现状,它让积极参与政治的公民能够组织起来支持他们。网站上的文章探讨了诸如选区划分不公等相关的政治议题,以及公民权利和国家安全等其他话题,为人们了解和掌握基层政治动态提供了一个绝佳的机会。. 99. 盖洛普 本网站是著名的盖洛普民意调查的官方网站。盖洛普专注于数据分析,帮助组织决策者运用数据驱动的方法解决问题。此外,盖洛普推荐的工具通常有助于推动解决方案的制定。该网站被公认为数据和高级分析领域的黄金标准。您可以浏览网站,了解从全球职场现状到美国生产力等各种主题的报告。. 100. 伯克利图书馆 伯克利图书馆网站汇集了政治学研究所需的大量统计数据。在这个页面上,研究人员可以找到许多链接,这些链接不仅提供对众多数据集的访问,还允许他们创建自己的数据集。其中包括美国历史统计数据(HSUS)、千禧年版、Data Planet、ProQuest Statistical Insight 以及大学间政治与社会研究联盟(ICPSR)。这里有数小时的数据可供查阅。. 101. 兰德国家服务公司 对于不了解的人来说,兰德公司是一家专门从事公共政策挑战研究的机构。该公司拥有众多客户,业务范围涵盖各级政府,是决策者获取高质量研究成果的重要来源。兰德公司美国分部在其网站上提供一系列数据库统计数据。研究人员可以在这里找到有关K-12教育、健康、商业和经济等诸多领域的信息,这些领域都与公共利益息息相关。. 102. 罗珀公共舆论研究中心 罗珀公共舆论研究中心由康奈尔大学运营,专门从事公共舆论数据的收集、分发和保存。例如,研究人员可以访问美国大选数据,以及一个包含超过23,000个数据集的档案库,这便是罗珀中心能够揭示的信息类型之一。无论记者是想了解公众对政治事件还是近期健康危机的反应,几乎都能在这个网站上找到相关信息。. 103. 交通运输政府 该网站由交通运输局提供技术支持和运营,涵盖广泛的交通运输相关主题的数据。网站资源包括能源、乘客安全、系统性能、交通经济、基础设施和货运等方面的报告。用户甚至可以按位置和地理区域对网站提供的数据进行排序和访问。该网站能够帮助研究人员找到他们可能想要了解的关于交通运输主题的一切信息。. 104. 旅游贸易 Travel Trade网站收录了截至撰写本文时,1996年至2016年间美国公民出境的数据。该网站旨在帮助感兴趣的公众了解全球旅游业和国际旅游业多年来的发展情况。数据既可下载也可在线查看,方便用户获取。研究人员可以轻松利用这些数据来发现趋势并进行比较。. 105. Skift Skift 是一个专注于为旅游业提供情报和数据的网站。除了其他数据来源外,该公司还为订阅用户和研究人员提供研究报告、会议和信息丰富的简报。Skift 研究的主题涵盖旅游业从业人员关心的方方面面,例如人们的出行目的地日益增多、新市场的识别,以及大量关于旅游技术的其他信息,供研究人员探索。. 106. Geoba.se Geoba.se 是那些只想了解某个城市或地区真实情况的用户的理想网站。只需轻点几下键盘,即可通过首页的搜索引擎查找坐标、旅行信息、天气预报,甚至当地的摄像头画面。该网站还提供全球排名信息页面,用户可以按地区和国家/地区进行筛选。简而言之,这是一个提供纯粹数据和统计信息的资源库。. 107. 美国旅行 美国旅游网站(US Travel)由美国国务院运营和维护。该网站的宗旨是保护出国旅行的美国公民的生命安全。因此,该网站提供有关美国护照、美国签证、跨国收养、海外死亡以及国际父母绑架儿童等主题的统计数据、信息和报告。这些信息可用于规划行程,也可用于分析1996年至2016年期间的长期趋势。. 108. 英国数据服务 由英国经济与社会研究理事会资助的英国数据服务中心(UK Data Service)发布广泛的数据。该网站包含的信息涵盖了从商业数据到跨国调查、英国政府资助的调查,甚至英国人口普查数据等各种资料。该网站的设计主要以学生和研究人员的需求为中心。此外,网站还提供指南、资源和说明,帮助研究人员快速理解和使用网站上的工具。. 109. Data.gov.au 由澳大利亚政府运营和发布的Data.gov.au网站提供便捷的开放数据访问和搜索服务。该网站明确指出,政府数据可用于开发工具和应用程序,进而造福澳大利亚民众。除了开放数据集外,该网站还提供付费访问未公开数据的功能。对于希望进行更深入分析的研究人员,该网站还提供数据工具包。. 110. 叽叽喳喳 众所周知,Twitter 以其快节奏的对话、简短的信息以及作为突发新闻中心在流行文化中的地位而闻名。然而,很多人并不知道,Twitter 还拥有开发者工具,可以更轻松地筛选和发现信息。这些工具甚至允许研究人员查看趋势并按地理位置筛选。无论是阅读热门话题标签还是探索开发者工具,Twitter 都是记者们长期以来一直在使用的资源。. 111. Instagram Instagram 不仅仅是用来点赞可爱猫咪照片和萌娃美照的地方。或者说,它本不该如此。这款应用拥有一套功能强大的开发者工具,让用户能够轻松了解并研究其受众群体。此外,话题标签、照片背后的线索以及被标记的人都蕴藏着丰富的信息。Instagram 是了解不同领域流行趋势的有效途径。. 112. 四方 对于需要关注地理位置的研究而言,Foursquare 凭借其庞大的数据库和丰富的信息,是一个非常有用的数据来源。它提供城市指南,根据社区实力为用户推荐地点。Foursquare 还提供开发者工具,允许通过“地点数据库”访问更多信息。记者可以利用这些工具深入了解特定地点以及使用该应用的用户群体。. 113. 《纽约时报》 《纽约时报》被许多人视为第四权力机构中备受尊敬的一员,几乎所有记者都耳熟能详。然而,人们常常忽略的是,《纽约时报》的API也为数据提供了丰富的资源。研究人员可以按月查找自1851年以来的文章,搜索文章,甚至查找书评。该API还支持基于浏览量、分享量和电子邮件进行搜索,甚至可以查找和访问评论。. 114. 美联社 美联社作为及时准确的新闻来源,在大众文化中占据着不可撼动的地位。凭借其开发者工具,它也是记者们重要的数据来源。截至本文撰写之时,研究人员可以使用这些工具进行编辑,同时下载图片和视频。内容的丰富程度似乎取决于研究人员使用的方案类型,但美联社API无疑能够帮助用户将研究过程提升到一个新的水平。. 115. 五三十八 记者们或许已经熟悉内特·西尔弗 (Nate Silver) 和他的网站 FiveThirtyEight,以及他那套统计模型,因为他的预测虽然有时出人意料,但通常都很准确。FiveThirtyEight 在 GitHub 上托管着网站历史上使用过的数据集和代码。这些数据集涵盖了一些有趣的题材,例如糟糕的驾驶行为、复仇者联盟以及飞行礼仪调查。与此同时,也有一些文件涉及一些更为严肃的话题,例如航空安全和仇恨犯罪。. 116. IMDb IMDb被许多人认为是网络上关于电影和演艺行业最全面的网站。如果有一部电影即将上映,人们想知道有哪些演员参演,或者想了解观众的总体反应,那么他们很可能会在搜索过程中访问这个网站。IMDb还托管着许多每日更新的数据集,这些数据集可供商业和非商业用途。. 117. 卡普萨尔克 KAPSARC是一个数据门户网站,收录了923个包含特定能源数据的数据集。这些数据集按能源使用、能源供应以及其他相关因素(例如政策、人口统计、环境、贸易、水资源和经济信息)等几个主要主题进行分类。对于对能源及其在不同行业和领域的使用感兴趣的研究人员来说,KAPSARC是网络上最全面的能源数据源之一。. 118. 资产宏观 Asset Marco是一个提供历史金融数据和宏观经济指标的网站。这些数据涵盖全球超过75,000种股票、货币、商品和债券。此外,该网站还提供超过120,000个宏观经济指标,用户可以利用这些指标来探索不同国家的金融数据。除了所有这些金融市场数据外,该网站还探讨投资策略。该网站的独特之处在于其信息量之庞大。. 119. 美国政府网络服务和XML数据源 美国政府网络服务和 XML 数据源托管在 USGovXML.com 网站上。用户可以在此浏览美国政府提供的各种 XML 数据源和网络服务。这种简单的保存措施确保了这些网络资源的透明性和可访问性。对于定期监测此索引的研究人员而言,如果 XML 数据发生突然变化,他们或许能够从中发现一些有价值的信息。. 120. Figshare Figshare是一个拥有超过5000篇科学内容的网站,可供学术研究和引用。除了丰富的信息资源外,该网站还旨在为研究人员提供一个集中管理、上传、存储和管理研究成果的平台。数学、健康科学、工程学、化学、生物科学和社会科学均被列为特色类别。对于寻求更多学术资源的记者来说,Figshare是一个绝佳的资源库。. 121. 链接数据 LinkedData 致力于探索连接此前未曾关联的互联网数据的新方法。在这里,用户可以找到教程、指南和数据集,开启数据探索之旅。所有数据集都围绕如何参与关联数据社区展开,除了关联数据购物清单外,大多数数据集都以可解引用 URI 的形式呈现,部分数据集还包含 RDF 格式。想要深入了解这个社区,LinkedData 绝对不容错过。. 122. 网络挖掘机 Web Miner 是研究人员收集各种通用数据的理想平台。该网站提供丰富的示例数据库,例如美国餐厅、全球银行的 SWIFT 代码、美国加油站、美国旅游景点以及 Google Play 应用等海量列表。此外,该网站还能帮助记者更轻松快捷地筛选和挖掘海量数据,显著缩短工作时间。. 123. 数据中心 数据中心致力于为用户提供最快捷、最高效的数据查找和发布平台。该网站托管着众多数据集,其中最受欢迎的三大数据集包括:凯斯-席勒房价指数、黄金月度价格以及大气二氧化碳当前趋势。除了数据之外,该网站还提供一系列教程,帮助用户了解如何使用各种类型的数据。. 124. Enigma Public Enigma Public网站自称是网络上“最全面的公共数据集合”。其数据集分为四大类:信息自由法案(FOIA)相关数据、基本信息、新闻价值数据和鲜为人知的数据。该网站的部分数据包括白宫雇员薪资和有效的联邦枪支许可证信息。用户注册免费账户后,即可访问并查看任何一类数据。. 125. 雅虎 大多数网络用户都熟悉雅虎这个名字,因为它旗下拥有雅虎新闻和雅虎财经等众多在线资产。对于研究人员和记者来说,雅虎还拥有海量的数据集,例如雅虎音乐用户歌曲评分(包含艺术家、专辑和流派元信息,版本 1.0)和雅虎电影用户评分及内容描述信息(版本 1.0)等等。对于正在寻找新统计数据的记者来说,雅虎绝对是理想的数据来源。. 126. 千人基因组计划 “千人基因组计划”包含一个同名项目,该项目从2008年持续到2015年。该项目的目的是寻找所有在研究人群中出现频率至少为1%的遗传变异。除了该项目产生的论文外,还产生了庞大的数据集,其中包括变异细胞数据库、原始序列文件和样本可用性信息。这些数据既可以浏览,也可以下载。. 127. 芝加哥期权交易所 芝加哥期权交易所 (CBOE) 是一家专注于波动率期货的期货交易所。该网站尤其提供大量与其注册商标波动率指数 (VIX) 相关的期货资料。CBOE 提供各类市场数据,包括历史数据、每日市场统计数据以及 VX 期货每日结算价格。对于寻求高质量市场数据的记者而言,CBOE 能够以易于理解的方式提供所需信息。. 128. 圣路易斯联储 圣路易斯联邦储备银行是该地区最重要的金融中心之一,甚至可以说是最重要的。在其网站上,研究人员可以直接查阅工作文件、经济数据、出版物和信息服务。换句话说,关于圣路易斯联邦储备银行当前和以往的政策思路,以及评估其有效性的能力,这里应有尽有。对于商业、金融和经济记者而言,这是一个顶级的信息资源。. 129. OANDA OANDA是一个颇受欢迎的在线股票交易平台,主要交易差价合约(CFD)和外汇。除了为吸引在线交易者而添加的众多功能外,OANDA还提供大量的历史汇率数据以及网站上货币转换器的历史信息。此外,该网站还提供投资策略、新闻和市场分析等信息。访问大部分数据甚至无需注册账户。. 130. ABS 澳大利亚统计局(ABS)与美国统计局类似,提供客观数据、经济信息以及涵盖广泛主题的研究,这些主题都与澳大利亚息息相关。研究人员可以直接在其网站上查找有关商业指标、医疗保健、住房、金融、国际贸易、心理健康以及价格指数和通货膨胀的统计数据。记者可以进行搜索,查找以往的调查和信息,还可以按地区对信息进行排序。. 131. 伦敦数据库 伦敦数据库最初由大伦敦政府构思并运营,旨在让公众更容易获取伦敦的数据。其最终目标是让人们能够获取这些信息,并鼓励他们以任何方式免费使用。在这个网站上,用户可以按主题搜索数据,例如艺术与文化、犯罪与社区安全、教育和健康。对这类数据感兴趣的记者现在可以直接从地方政府获取数据。. 132. 新西兰统计局 新西兰政府网站提供大量统计数据,供研究人员深入挖掘和分析。用户可以通过页面顶部的搜索栏,按地点、地区和主题筛选信息。部分主题包括经济指标、健康、收入和就业、行业、环境和商业。此外,该网站还提供其他新闻来源和新闻稿,重点介绍各种调查结果和统计数据,记者可以通过该网站获取各种新西兰特有的统计数据。. 133. 澳大利亚政府气象局 澳大利亚气象局的网站由澳大利亚政府运营,提供澳大利亚各城市和地区的天气信息。该网站称,气象局的成立旨在通过发布预警和建议,帮助澳大利亚民众应对气候变化。用户可以在这里找到季节性展望、蓄水量、降雨量预报、气候变率和季节性径流预报等信息。该网站提供准确可靠的澳大利亚天气信息。. 134. GroupLens 本网站由明尼苏达大学计算机科学与工程系的 GroupLens 提供。网站提供出版物以及用于研究的数据集,总共有大约六个数据集。其中一些数据集的名称包括 Book-Crossing、MovieLens 和 HetRec 2011。简而言之,对于希望更好地了解如何使用所提供数据的记者来说,这是一个有用的资源。. 135. KD掘金队 KD Nuggets 是一个专注于为用户提供数据科学、商业分析、机器学习和数据挖掘相关内容的网站。网站上有一个页面列出了用户用于深入探索数据挖掘和大数据的所有数据集,例如 Bioassay Data、Asset Marco、DataMarket、Casualty Workbench、Data Ferrett 和 Datamob 等,这些数据集均已链接。对于喜欢在一个页面上获取所有信息的记者来说,这是一个绝佳的资源。. 137. 微软 凡是使用过个人电脑或笔记本电脑的人,大概都至少听说过微软。有趣的是,除了个人电脑、笔记本电脑和软件之外,微软还拥有大量的研究成果和出版物。这其中包括一些突破性进展,例如该公司致力于打造“识字机器”以及基于云的数据科学。此外,还有关于微软正在开发的工具(例如 Visual Studio Code 工具)及其所代表的人工智能发展的信息。. 138. R数据挖掘 正如其名,“R Datamining”是一个关于R语言和数据挖掘的资源网站。该网站提供了大量的示例和文档,深入浅出地讲解了数据挖掘以及使用R语言进行数据挖掘。此外,它还提供了一些培训课程的链接,例如堪培拉大学开设的短期课程。网站内容包括免费数据集和演示文稿的链接,以及涵盖飞机、航空公司和航线数据等主题的数据集,还有GeoDa等网站的链接。. 139. 计算神经科学领域的合作研究——数据共享 计算神经科学合作研究(CRCN)拥有众多数据集,可通过其网站访问。这些数据集按大脑的不同区域进行分类,例如视觉皮层、海马体、运动皮层、鸟类、眼动追踪以及海兔等。这些文件夹还包含挑战、工具、模拟和方法。数据共享功能使其成为更佳的研究资源。. 140. 蛋白质数据库存档 根据其网站介绍,蛋白质数据库(Protein Data Bank)自1971年以来一直是核酸、蛋白质三维结构和复杂组装体研究领域的首要资源。该数据库的建立宗旨是确保这些信息的公共性,研究人员可以访问该网站在线查看验证报告和数据字典。此外,网站还提供数据增长和使用统计数据,支持在线排序和分析以及下载。最重要的是,该网站一直在不断添加新的信息。. 141. PubChem项目 PubChem作为一个官方项目,旨在从生物学的角度向公众普及小分子的功能。该网站链接了三个数据库:PubChem Compound、PubChem Substance和PubChem BioAssay。此外,该网站还支持搜索不同蛋白质之间的相似性。对于希望提升数据分析水平的研究人员,该网站还提供免费的代码和技巧。. 142. Coremine Medical Coremine Medical 对于任何寻求生物学、健康和医学信息的人来说都是一个宝贵的资源。如今,PubGene 的生物医学文本挖掘功能已整合到 Coremine 中,使其成为目前最灵活的生物医学信息来源之一。该网站以引人入胜、易于理解的视觉方式展示概念和想法之间的联系,这些信息在其他情况下可能容易被忽略。它无疑是记者可用的最全面的生物医学数据来源之一。. 143. 图蒂恩波 Tu Tiempo 是一个内容丰富的全球天气和气候数据资源库。利用该资源,您可以轻松查找几乎全球所有城市和地区的年均、月均和日均数据。此外,用户还可以搜索包含超过 1.15 亿条记录的数据库,其中包含大量历史数据,任何人都可以查阅。根据搜索区域的不同,您甚至可以找到追溯到 1929 年的数据。. 144. 复杂网络资源 该网站提供了大量最初用于其计算机实验的数据。完整的数据集列表列出了各种数据类型,包括新闻图谱、生物图谱、引文图谱、合作图谱、工程图谱和语义图谱。该页面还链接到包含大量信息的资源列表,例如分析了约300万项美国专利的数据集。此外,该页面还汇集了大量复杂的网络数据集。. 145. Scopus Scopus 是一款方便用户快速查找研究和学术文献的工具。该网站拥有一个极其庞大的数据库,涵盖世界各地众多领域的研究成果,包括医学、科技、社会科学、艺术和人文科学等。使用 Scopus 可以发现那些可能被忽略的学术资源。毕竟,在许多领域,学术资源的质量几乎与它提供的信息本身同等重要。. 146. 斯坦福大学 斯坦福大学作为一所享有盛誉的学术机构,其声誉并非偶然得来。其卓越的教学质量在其编程相关课程中体现得淋漓尽致。该网站还托管着大量数据集,其中包含社交网络信息等详细内容。例如,有的数据集聚焦于Facebook社交圈、维基百科管理员请求、Twitter社交圈以及Google+。通信网络和亚马逊产品网络也拥有各自的数据集。. 147. 米兰大学 米兰大学信息科学系运营着一个名为“网络算法实验室”的网站。该网站汇集了大量可供探索的数据集,包括社交网络相关的图、Facebook 图、DELIS 项目的快照以及一些其他类型的数据。用户可以在线查看并下载网站上的信息,使其成为网络上最易于访问的同类数据集之一。. 148. UCI网络数据存储库 UCI网络数据存储库致力于以科学方法研究网络。在资源页面,研究人员可以找到由研究机构、团体以及个人选择的数据集目录链接。该存储库还包含一系列通常用于社交媒体分析的数据集。深入研究这些数据的用户会很高兴地发现,这些数据集也可供下载。. 149. CAIDA CAIDA,即应用互联网数据分析中心,从多个不同地点收集各种数据,通常与不同的组织和个人合作。该网站托管着诸如自治系统关系、DDoS攻击、Telescope及其相关数据集以及其他数据。数据类别包括流量、拓扑、安全、蠕虫概览和流量统计概览。部分数据集可能需要申请访问,但大多数(如果不是全部)都是公开的。. 150. 小龙虾 Crawdad,即达特茅斯无线数据存档社区资源,其独特之处在于专注于为研究人员和其他对此领域感兴趣的人士提供无线数据。该网站提供多种工具以及对大量数据集的访问权限。其中列出的数据集包括教育用途、误码率特征分析、网络诊断、机会连接、位置感知计算等,可供选择。研究人员越深入研究,就越会发现这个资源的价值所在。. 151. 美国能源信息署 美国能源信息署(EIA)通常简称为美国能源信息署,其主要业务是向公众提供年度电力公用事业数据。这些数据涵盖化石燃料库存、燃料消耗量、月度和年度发电量信息以及环境数据等。这些数据可追溯至2001年至2017年,并可供分析。研究人员只需访问其网站并下载信息即可。. 152. 英国海洋数据 由英国国家环境研究委员会资助的英国海洋数据(British Oceanographic Data)是互联网上最易于获取的海洋数据资源之一。其庞大的数据库涵盖了洋流、CTD剖面、国际海平面数据、海流信息,甚至包括历史海底压力记录仪数据。此外,用户还可以在已发布的数据库中找到更多数据集,从而进一步访问该目录。这很可能是目前最全面的在线海洋信息资源之一。. 153. 事实 Factual 提供位置数据,用于广告和移动平台。对于研究人员而言,其开发者工具尤为重要,这些工具包括 Engine Mobile SDK、Observation Graph 的完整专业和研究应用以及 Local Validation Stack。Factual 的网站名称强调了公司对收集全球数据并探索全新应用方式的热情,这体现了公司对数据及其应用的坚定承诺,以及对寻找新颖独特应用方式的执着追求。. 154. 全球行政区划 全球行政区划数据库是一个地理数据库,展示了世界各地各个行政区域的位置。这类数据库收集的数据通常用于地理信息系统。这些数据涵盖国家,并进一步细分为省、县、行政区等。对记者而言,好消息是所有这些数据都是免费提供的,并且可用于学术研究和一般非商业用途。. 155. 地理名称 Geonames 是一个拥有数百万条记录、独特特征和别名的地理数据库网站。它提供导出选项,并可通过多种网络服务访问,每天处理约 1.5 亿次请求。得益于数据库的维基功能,用户可以相对轻松地对数据库条目进行调整和修改。仅凭其多语言托管功能,它就足以成为一个优秀的资源。. 156. 自然地球数据 自然地球数据是一个公共领域的地图数据集,包含丰富的信息,专为地图制作软件而设计,可用于创建最先进的地图。最终产品的视觉效果清晰简洁,数据组织有序,可立即使用。该数据集包含情报数据以及各种文化、栅格和物理矢量数据主题。虽然最初是为满足制图师的需求和偏好而创建的,但该数据集对任何对地理感兴趣的人都很有用。. 157. OpenStreetMap OpenStreetMap与其说是一个网站,不如说是一个用户协作平台,它现在为应用程序、网站和各种硬件设备提供地图服务。当用户输入一些鲜为人知的地标信息(例如火车站、道路和小径)时,该网站会获取新的数据。完整的数据集可在该网站上免费获取,用户可以选择下载全部或部分数据。对于选择部分下载数据的用户,还可以按区域进行下载。. 158. 芝加哥市 芝加哥市是迈克尔·乔丹率领的冠军公牛队的主场,也是独具特色的披萨之乡,同时还拥有一个内容丰富的专属数据门户网站。该门户网站的数据集涵盖了行政与财政、伦理、健康与公共服务、公园与娱乐、公共安全以及历史保护等众多主题。简而言之,芝加哥市的数据门户网站几乎囊括了研究人员、政策制定者和当地记者可能感兴趣的一切信息。. 159. CKAN CKAN本质上是格拉斯哥市开放数据项目的线上平台。该网站拥有涵盖众多主题的数据集,可供企业家、政策制定者、学术研究人员和应用程序开发人员使用。这里托管的360个数据集中,有些与城市治理相关,例如按产权划分的房屋存量数据集;而另一些数据集,例如自行车数据集,则与当地居民息息相关。此外,对于报道本地新闻的记者来说,这里也提供了各种信息。. 160. 印度政府 印度政府在其开放数据项目(Open Data Project)中设立了一个网站,涵盖分析和数据资源。目前,该网站拥有约137,940个资源,浏览量已达数百万次。其中绝大多数文件也可供下载。无论您是想查找政府预算数据,还是想搜索有关健康和家庭福利的数据集,该网站都很有可能提供您所需的资源。. 161. 南非统计局 本网站汇集了南非政府收集的最新统计数据、出版物和资料。研究人员可以在这里找到从食品饮料调查到经济指标、就业统计、人口数量和重要健康统计数据等各种信息。您可以根据需要按城市、主题和指标搜索数据。本网站不仅提供大量人口普查信息,还发布统计出版物、调查问卷、代码和分类以及定价政策。. 162. 政策制定与研究 本网站由美国住房和城市发展部政策发展与研究办公室主办。它每年定期发布大量案例研究、半年刊和期刊。此外,它还提供大量记者可能感兴趣的数据集,例如公平市场租金、收入限制、续租资金通胀因素等等,这些数据集公众均可通过本网站访问。. 163. Vital Net 健康数据 在 Vital Net Health Data,研究人员可以找到大量大型健康相关数据集。该网站并非直接托管所有这些数据集,而是提供指向这些数据集的链接,方便用户访问并查找信息。这份精选列表链接到 CDC Wonder、Eurocat、Health Data All Star 等资源,以及北美中央癌症登记协会等慈善组织的工作成果。这无疑是目前最全面的健康数据集资源之一。. 164. 分析桥 Analytic Bridge 是一个专注于商业智能的资源平台。研究人员可以在这里找到关于机器学习和人工智能的讨论、网络研讨会和会议的链接,甚至还有一个求职页面。该网站还设有数据科学中心 (Data Science Central),专门关注大数据。凭借其活跃且参与度高的社区以及对提供新闻和信息的承诺,对数据在商业领域的影响感兴趣的记者将从中获益良多。. 165. Archive.org archive.org 主要以致力于成为在线公共图书馆而闻名,它不仅拥有大量已出版的作品,还收藏了大量的数据集。该网站收录了 2012 年互联网普查的结果、2011 年至 2015 年的暗网市场档案,甚至还有 Reddit 公开评论的数据集。此外,它还包含来自 Music Brainz 的数据以及一个包含音频封面图片的数据集。凭借其丰富的出版物和数据,archive.org 为新闻工作者提供了大量的研究资料。. 166. 学术洪流 该网站自称是一个旨在简化大型数据集共享和下载的系统。Academic Torrents 利用种子下载技术简化数据分发,并以其能够让研究人员快速下载所需资源而自豪。该网站还提供论文、课程和资源合集供用户浏览。只需快速搜索一下可用资源,您就会发现这里有海量的数据集和资源合集可供下载。. 167. 数据宇宙 了解 Dataverse 的最佳方式是将其视为另一种类型的图书馆。研究人员可以在这里轻松搜索、发现和引用数据,同时还能将此网站用作自身信息的存储库。其涵盖的主题包括社会科学、农业科学、医学、健康和生命科学,以及地球和环境科学等领域。在该网站上发表过文章的知名机构包括盖洛普公司和美国商务部人口普查局地理司。. 168. UC数据 UC Data 与加州大学伯克利分校社会科学数据实验室 (Social Science Data Lab) 合作运营,是该大学规模最大、最知名的数据库。该网站提供统计学和社会科学领域的数据资源。研究人员可以在此访问 UC Data 研究人员撰写的论文、报告和工作论文。原始数据涵盖众多研究领域,包括医疗保健、福利和社会保险、人口统计、投票和信息技术等。. 169. 笑话营 Joe Kamp 提供了一份完整的指南,指导用户如何查找足球数据和 API,以进行数据分析。研究人员如果点击页面上的链接,即可通过 GitHub 获取开源数据,并可访问免费和商业 API,从而更轻松地获取数据。由于数据和代码都发布在 GitHub 这样知名的网站上,获取此类数据从未如此简单。. 170. 肖恩·拉曼 肖恩·拉哈姆 (Sean Laham) 这个名字或许并不为人熟知,但他的网站却拥有互联网上最全面、最深入的击球和投球统计数据之一。这些数据涵盖了从 1871 年到 2016 年的时期,可谓跨越了几个世纪。根据知识共享署名-相同方式共享 3.0 协议,这些数据可以免费访问和使用,并可直接下载 SQL 和 Microsoft Access 等格式的文件。此外,还可以通过 GitHub 下载这些统计数据。. 171. 复古版 Retro Sheet 是互联网上最全面的棒球统计数据来源之一。该网站包含年度球员名单、裁判、球员和教练的详细信息。在相关年份,全明星赛的数据被收录在赛事文件中,此外还有一套季后赛赛事文件和一个少量差异文件。Retro Sheet 甚至还列出了每个赛季的球场信息。够全面吧? 172. Hubway 数据挑战 对于不太熟悉该项目的人来说,Hubway是波士顿都会区共享单车系统的名称。当然,该系统不会记录和发布个人身份信息,但Hubway仍然保存着2011年7月至2012年9月期间每次骑行的基本信息,包括行程的起点和终点以及上车点等。. 173. 开放航班 Open Flights 是一个数据库,收录了全球超过 10,000 个渡轮码头、机场和火车站的信息。研究人员可以通过 GitHub 获取与 Excel 兼容的 .csv 版本,也可以直接从网站下载数据。通过首页上的地图,可以查看列表中包含哪些具体地点,该网站甚至还提供路线信息。如需获取更多最新信息,可以联系网站所有者。. 174. MLVIS MLVIS 是一个数据存储库,它将可视化分析与实时数据挖掘相结合。即使处理海量数据集,也能帮助用户更直观地理解数据。该平台提供众多功能和选项,包括基准数据、非关系型机器学习以及属性型和异构型等不同类型的数据。为了方便用户,这些信息还可以下载为统一的格式。. 175. 开放数据启动 Open Data Inception 网站提供超过 2600 个数据门户的链接。研究人员可以使用顶部的搜索栏按类别和主题搜索门户和数据集。此外,该网站还可以帮助用户找到所搜索数据集的最新版本。您可以利用列表或交互式可视化方式查看数据门户,并开始查找所需数据。. 176. OpenDataSoft OpenDataSoft 提供法语、英语和德语版本,拥有 4.8 亿条记录、400 万个 API 单元和 9284 个数据集。研究人员可以使用首页中间的搜索栏输入关键词或类别,找到最合适的数据集。对于记者而言,这是一种更快捷的方式,可以找到完成研究所需的最相关数据集。访问该网站了解更多信息。. 177. 国家大师 NationMaster是一个汇集了300多个国家/地区完整数据的数据库,数据被整理成5000多个类别。数据涵盖了死亡登记百分比、二战统计数据,甚至包括核战争和核试验的相关信息。研究人员还可以找到表格、图表和饼图,以便更直观地了解数据。简而言之,由于涵盖的主题如此之多,总能在数据中发现新的信息。. 178. Followerwonk 长期以来,Twitter 一直是发布突发新闻和发现热点话题的热门社交媒体平台。Followerwonk 能够帮助用户更高效地使用 Twitter。这包括寻找可以建立联系的 Twitter 用户、分析现有粉丝以及规划 Twitter 活动以获得最佳效果。如今,许多记者和新闻工作者都在使用 Twitter 进行人脉拓展和新闻报道。Followerwonk 能够显著提升 Twitter 用户在该平台上的效率。. 179. 信息猩猩 Infochimps是一个提供云端服务的网站,其服务可以根据需要进行缩减,从而最大限度地利用大数据。它在部署和集成大数据技术及应用程序方面非常有用。当研究人员搜索海量数据或评估大数据趋势时,这是一个不可或缺的资源。此外,该网站还提供大量白皮书和案例供研究人员查阅。. 180. 已存档的国家政府统计数据 Archive-It 成立于 2006 年,是互联网档案馆 (Internet Archive) 提供的一项服务。该服务帮助机构和企业创建数字馆藏,并因此有机会与非营利组织、学院、大学和政府机构合作。研究人员可以在该网站上搜索各种不同的档案,例如 2014 年国会候选人竞选网站、阿拉巴马州档案馆和加拿大政府信息 PLN 网络档案馆。对于富有进取心的记者来说,该网站是一个信息宝库。. 181. 公民公共空间 Civic Commons网站有一个页面列出了各种政府开放数据计划。这个可搜索的资源列表按国家、城市、地区分类,甚至还提到了政府间组织提供的资源。对于记者来说,该网站提供了一种更快捷的方式来了解哪些政府参与了开放数据项目。此外,该网站还提供了一些本地化数据,这些数据未必能通过简单的谷歌搜索找到。. 182. 卫报世界政府 《卫报》以其突发新闻报道而闻名于世。但鲜为人知的是,该网站还设有一个专门版块,提供世界各国政府的相关数据。这里有关于无家可归人数影响的文章、关于网络安全的讨论,甚至还有关于数据和统计在当前政治和社会环境下所扮演角色的深入探讨。《卫报》的“世界政府”版块能够引发热烈的讨论,并为新闻报道提供新的切入点。. 183. 开放政府数据(中心) 本网站隶属于开放知识基金会旗下的一个小组,旨在鼓励和支持开放政府数据的持续发展。用户可以在这里找到最全面的开放数据目录链接之一。除了网站提及的其他目标外,该小组还致力于搜集政策、最佳实践和指南方面的信息。它为记者提供更广泛、更优质的信息来源。. 184. 开放政府——法国 本网站是法国政府开放数据项目的线上平台。您可以按就业、农业、教育、旅游等类别进行搜索,深入挖掘数据。这些数据不仅有助于您更细致地理解数据背后的含义,还能让您基于历史信息进行比较。简而言之,记者们完全有理由对这些数据感到兴奋。. 185. 圣母大学 本网站存储了圣母大学通过 SourceForge.net 平台获取的研究数据。这些数据以关系型数据库的形式提供。每月的数据更新也有助于更好地了解开源软件及其应用。要访问这些信息,必须通过电子邮件提交书面申请。但需要注意的是,只有学术研究人员才有资格访问这些数据。. 186. 不明飞行物报告 美国国家不明飞行物报告中心拥有一个在线数据库,详细记录了人们与不明飞行物(UFO)的遭遇。研究人员可以通过日期、UFO形状、发布日期,甚至按州等四个类别进行筛选,从而简化数据库搜索。UFO的独特之处在于它们总能激发公众的无限遐想。如果您附近近期发生过任何第三类接触事件,这里就是了解人们相关经历的最佳场所。. 187. 维基解密 维基解密因其泄露的文件引发的争议以及对政府内部运作和其他社会名流权贵的揭露而臭名昭著,其名声早已在外。尽管数据泄露很少悄无声息地进行,但没有人质疑信息的准确性。对于那些寻求能够迅速吸引眼球的新闻报道的记者来说,维基解密是一个可靠的信息来源。即便没有其他作用,它本身也是引人入胜的读物。. 188. 《华盛顿邮报》 《华盛顿邮报》早已是新闻报道和评论文章的权威来源,但鲜为人知的是,该报还开放其文章中经常提及的原始数据。在数据页面上,研究人员可以找到教育、人口普查、健康与安全、交通与发展、世界杯历史数据库,甚至包括政府和政治相关的数据。简而言之,获取这些数据有助于人们更深入地了解新闻报道中涉及的问题。. 189. 气候数据 气候数据集提供全球气温的全面信息。目前,用户可以通过网格查看所有重要的气候信息,并了解平均值。对于需要陆地和海洋相关数据的用户,也可以获取相同的信息。这些信息可以下载,但为了方便起见,也可以直接在网站上查看。. 190. 蛋白质结构 Protein Structure 致力于探索如何将计算机网络与生物学相结合。该网站提供了一个数据存储库,可通过提供的链接访问。对于研究人员而言,该网站尤其值得关注的是,它将模型分析和可执行生物学等多种理念融入到实现这一目标的过程中。对于新闻工作者来说,该网站也值得关注,可以了解研究进展并分析数据。. 191. 免费分析调查数据 借助本网站,用户可以免费学习调查数据分析课程。“免费分析调查数据”网站拥有详尽的目录,涵盖了诸如“地图与调查艺术——加权维护”、“平衡受访者隐私与方差估计精度”、“结构方程模型 (SEM)”以及“复杂调查数据”等章节。对于那些预计未来需要处理更多统计数据的人来说,该网站提供了极佳的复习机会。. 192. 加州大学洛杉矶分校 在加州大学洛杉矶分校的维基网站上,研究人员可以找到许多可用于演示的数据集。这里有大量的模拟数据和观测数据可供选择。利用这些资源,人们可以挖掘气候数据、人口数据、生物医学数据、神经影像数据、美国人口普查数据、选举数据和经济数据等众多类别的数据。最终,这些数据集将成为许多人都能从中受益的宝贵资源。. 193. 多伦多大学 多伦多大学在其网站上为研究人员提供名为“Delve数据集”的资源。这些数据集是旨在比较不同学习方法的大型产品的一部分。最终,这些信息将用于开发和评估不同的学习方法。简而言之,对于希望更好地了解如何分析和处理数据集的研究人员来说,这是一个可靠的资源。. 194. 自然资源保护局 美国自然资源保护局(NRCS)的网站致力于推广自然保护,并提供美国境内各种苔藓、角苔、维管植物、地衣和苔类植物的信息。该网站拥有一个完整的植物数据库,其中包含大量植物图片和相关信息。研究人员可以下载该数据库,并查找有关替代作物等主题的大量信息。简而言之,该网站涵盖了人们需要了解的关于植物的一切信息。. 195. 农业研究服务 顾名思义,该机构负责满足美国农业部的研究需求。每当发现农业问题,通常都是该机构参与寻找解决方案。该网站托管着大量数据集,用户可以直接访问和下载。记者也可以通过该网站查找与农业相关问题的最新资讯。. 196. 细胞图像库 本网站提供一个公共图书馆,其中包含丰富的资源、信息以及展示细胞和细胞过程的图像和动画。该网站的设计兼顾科研和教育的双重需求,其信息几乎始终与公共卫生和疾病的讨论息息相关。这些资料来源于多种渠道,包括历史文献和现代出版物。对于希望获得简明易懂的复杂生物学过程解释的记者来说,细胞图像库无疑是最佳选择。. 197. 完全基因组学 这是Complete Genomics公司的网站,该公司自诩为人类基因组测序领域生物技术领域的领军企业。值得一提的是,Complete Genomics已将其相当一部分全基因组序列公开。这最终为研究DNA和人类基因组测序提供了各种有用的信息。使用这些资料的唯一条件是,研究人员必须注明Complete Genomics的参考文献。. 198. Array Express Array Express 是一个数据库,存储着基因组学实验的结果信息,这些实验需要大量的测序或处理。在这个网站上,用户可以找到超过 7 万个实验的结果,以及超过 200 万篇论文,数据存储量高达数 TB。更棒的是,这些信息可以免费用于研究用途。对于想要了解基因组学最新信息和该领域最新进展的人来说,Array Express 是一个绝佳的资源。. 199. 编码 DNA元件百科全书(ENCODE联盟)是由世界各地的研究团队合作完成的。其最终目标是编制一份基因组所有功能部分的清单,其中包括对RNA水平、蛋白质、细胞调控元件以及基因活性的深入研究。该百科全书提供可供检索的数据以及更多信息。. 200. Ensembl Genomes Ensembl Genomes 是一个成立于 2000 年的网站,主要关注脊椎动物的基因组。多年来,该网站不断扩充内容,涵盖无脊椎动物、植物、细菌和真菌等相关知识。所有这些主题的数据都可以通过网站上的链接进行查找和访问。该网站提供教程、涵盖所有主题的数据集以及可供浏览的文档集。所有这些因素都使 Ensembl Genomes 成为新闻工作者的绝佳数据来源。. 201. 基因本体论联盟 基因本体(Gene Ontology)网站旨在探索如何利用计算机技术来呈现目前对基因运作方式的理解。该网站拥有大量出版物以及其他可供阅读的文档。网站上直接托管着注释。对于想要深入了解相关数据和原始数据的研究人员来说,好消息是网站上提供了可直接下载的文件。. 202. 集成网络蜂窝特征库 哈佛医学院LINCS中心旨在帮助研究界和公众更好地了解人体细胞在药物扰动下的反应。研究人员可以利用哈佛医学院LINCS数据库和项目探索工具查找相关出版物、项目摘要以及其他资源。记者也可以通过该网站获取该研究领域的最新新闻和信息。. 203. 人类基因组多样性计划 在斯坦福人类基因组中心的努力下,人类基因组多样性计划取得了显著进展。该网站拥有数千个样本和标记。用户只需点击页面上的链接,即可下载、查看并深入分析这些样本。对于希望了解科研界最新信息的记者来说,这是一个宝贵的资源。. 204. JCB 数据查看器 JCB DataViewer 让对《细胞生物学杂志》(Journal of Cell Biology)内容感兴趣的读者能够查看与该杂志发表的文章相关的图像数据。该网站拥有一个完整的图库,用户可以滚动浏览以查看相关资料。此外,用户还可以在浏览网站的同时对数据进行更深入的分析。简而言之,该网站是理解该杂志文章中参考文献和图表的理想工具。. 205. 基因组数据共享平台 GDC 数据门户是一个旨在帮助研究人员和生物信息领域从业人员更高效地开展癌症研究的平台。它提供数据存档、应用程序接口 (API) 以及可供阅读的文档等资源。访问该网站意味着用户能够查看癌症研究人员用于开展研究的相同信息。在这里,记者不仅可以找到他们所需的所有数据,还能获取更多其他信息。. 206. Opensp Opensp 是一个由社区驱动的项目,旨在分享基因型数据。使用 FamilyTreeDNA、23andMe 或 deCODEme 进行过基因分型的用户可以将信息上传到该网站。这样做的目的是为了让网站能够专注于研究基因型与单核苷酸多态性 (SNP) 之间的关联。对新闻工作者而言,该网站的独特之处在于,用户可以下载并浏览这些数据。. 207. 路径指南 Pathguide 是一个致力于提供代谢和信号通路以及蛋白质分子水平相互作用信息的网站。本页面收录了约 697 个与主题相关的资源。本网站链接的数据库通常都可以免费访问。资源列表中的大部分参考文献主要关注蛋白质间的相互作用。对于生物学爱好者来说,本网站是一个宝贵的资源。. 208. RCSB PBB 本网站致力于向学术界和广大公众普及核酸和蛋白质相关的知识。RCSB蛋白质数据库提供多种工具,旨在帮助读者更好地理解生物学的这一领域,包括可视化工具、3D结构查看以及可按生物体类别进行分类的全文检索数据库。此外,本网站还提供该领域最新进展的更新信息。. 209. 精神病基因组学联盟 精神病基因组学联盟是由来自世界各地的研究人员和科学家合作建立的,他们致力于研究精神疾病的遗传成分。该项目最终发表了17篇主要论文和31篇提供二次分析和方法论的拓展论文,其中一篇具有里程碑意义。联盟通过数据访问门户网站提供工具、下载和研究成果的访问权限,用户可提出申请。. 210. 公共化学 PubChem在医学和生物学研究领域享有盛誉,并且由来已久。它不仅提供结构检索功能,还提供化合物、生物测定和物质数据库,是研究人员的理想之选。此外,每个数据库都包含数百万条记录。这些信息可以通过3D构象分析工具和生物测定工具等工具进行查看,并且数据可供下载。. 211. 宇宙 顾名思义,癌症体细胞突变目录(COSMIC)致力于记录和探索癌症中体细胞突变的影响。该网站支持按癌症类型、基因和突变类型搜索COSMIC数据库。COSMIC提供基因组浏览器和癌症浏览器等工具。此外,网站还提供基因注释、耐药性、基因组筛选、突变特征和基因融合注释等数据供用户下载。. 212. 癌症药物敏感性的基因组学 癌症药物敏感性基因组学致力于寻找生物标志物,以帮助医生识别患者更有可能对哪种抗癌药物产生反应。记者可以通过新闻标签页了解最新数据或网站更新。此外,网站还提供细胞系数据汇编、癌症特征数据库,甚至还有化合物列表,所有这些都可以在网站上查看。. 213. 斯托尔斯医学研究所 斯托尔斯医学研究所的网站向公众免费提供其科学家、研究科学家和基因组学家在发表论文时使用的数据。该研究所特别强调,斯托尔斯原始数据存储库通常可以免费访问。不过,数据库中一些最大的文件可能无法直接通过互联网访问,可能需要其他方式获取。. 214. SSBD数据库 系统生物动力学科学数据库(简称SSBD数据库)提供了一系列工具和资源,用于分析显微图像和评估定量生物数据。该网站上的图像来源广泛,涵盖细胞、单分子和基因表达核等对象。由于该网站的数据来源于计算模拟和实验,因此记者可以放心,这里的信息会不断完善和更新。. 215. 共享个人基因组 个人基因组计划是一个致力于创建公开的健康、基因组和性状数据的网站,这些数据将向公众开放。该网站主要依靠自愿公开基因组信息的个人协助,免费向公众提供其已发现并成功获取的数据。除了科学意义之外,该项目也为记者提供了一个有趣的视角,让他们得以了解创建个人基因组信息公共记录的影响。. 216. UCSC基因组浏览器 USCS基因组浏览器允许用户查看基因组组装结果。除了在线查看外,该网站还提供链接,可用于下载这些基因组组装结果的序列和注释。这些链接分为人类、哺乳动物、其他脊椎动物、后口动物、昆虫、线虫、其他基因组和其他下载类别。该网站上的工具和目录均可免费用于个人和非商业用途。记者可以利用这些信息的全面性和易用性。. 217. UniProt 通用蛋白质资源(Universal Protein Resource,简称UniProt)是获取蛋白质测序和注释信息的重要平台。该网站整合了UniProt参考簇、UniProt知识库和UniProt档案库这三个数据库的信息,并配备了肽段和簇搜索等功能。新闻工作者可以利用该网站验证、发现并深入了解蛋白质测序和注释领域的新发现。. 218. 精算师气候指数数据 精算师气候指数(简称ACI)向公众和决策者提供有关加拿大和美国气候趋势及气候变化影响的信息。研究人员可以利用这一教育工具,查找并发现海洋和天气的巨大变化。用户可以按地区和组成部分缩小搜索范围。该网站拥有数十年的数据,并定期按季度更新信息。. 219. 航空气象中心 航空气象中心提供空域系统可信赖的准确、及时、最新的天气信息。用户可通过本网站查看各种天气图表、预报和观测数据,所有内容均以飞行员易于理解的方式呈现。用户还可以通过 .csv 或 XML 输出格式实时查看网站数据源提供的信息。研究人员可通过此下载选项更深入地处理和分析原始数据。. 220. 气候研究单元 气候研究小组的网站旨在研究过去气候变化的影响,探究其成因,并寻找应对当前气候变化问题的解决方案。在这里,人们可以阅读研究成果,通过信息表了解相关主题,阅读出版物,甚至访问原始数据。对于正在寻找原始气象数据集的记者来说,这个资源非常宝贵。. 221. 欧洲气候评估与数据集 在欧洲气候评估与数据集网站上,公众可以获取有关气候或天气极端变化的信息。研究人员可以选择使用该项目的研究工具——荷兰皇家气象研究所(KNMI)气候探索器——来验证数据、查看季节性预测,甚至可以更深入地研究厄尔尼诺现象的影响等等。由于该数据集每日更新,使用该数据源的记者将第一时间获悉任何极端气候变化的迹象。. 222. 全球影像浏览服务 全球影像浏览服务(简称GIBS)是EOSDIS的重要组成部分,它提供响应迅速且符合社区标准的影像服务。换句话说,GIBS使普通用户能够以高清格式浏览几乎来自地球上任何地点的卫星影像。由于EOSDIS GIBS基于NASA的地球科学数据,记者和研究人员比以往任何时候都更容易实时了解世界。. 223. 白令气候和生态系统 该网站隶属于美国国家海洋和大气管理局 (NOAA),为记者和研究人员提供他们想要了解的关于白令海气候和生态系统如何应对北极变化的一切信息。在这里,您可以阅读文章、查看预测报告,并使用在线数据工具来了解白令海的各种气候指数、生物、大气、海洋数据以及野生动物状况。. 224. NCEI 美国国家环境信息中心(NCEI)是由美国国家海洋和大气管理局(NOAA)的三个数据中心合并而成。本页面包含一系列链接,分为22个类别,用户可以通过这些链接访问不同的资源、感兴趣的页面以及气候和天气数据集。记者如果想了解气候、风暴、降水以及其他各种天气相关信息,很可能在这里找到所需内容。. 225. 地球系统研究实验室 美国国家海洋和大气管理局(NOAA)全球监测部门通过监测关键大气指标,提供有关地球气候变化长期趋势的信息。例如,这些指标包括一氧化碳、甲烷、一氧化二氮和二氧化碳。这些指标被用于衡量臭氧层的长期损耗、二氧化碳的来源和水平以及汇等。这是记者可以利用的气候变化资源。. 226. WorldClim – 全球气候数据 想寻找更佳的气候数据可视化方式吗?WorldClim 是一款提供免费数据的软件,这些数据可用于空间建模和地图制作。目前版本的 WorldClim 仅支持当前气候数据,而旧版本则支持访问历史和当前的气候数据,并允许用户查看未来气候预测的现状。记者只需点击链接即可下载该软件。. 227. 知识发现实验室 知识发现实验室致力于开发创新技术、机器学习基础知识,并将这些知识应用于网络科学、欺诈检测和科学数据分析等实际领域。该网站在数据库LP(DBLP)中托管着一个相当大的数据集,其中包含120万个对象和248万个链接。对于对知识发现实验室的目标感兴趣的研究人员来说,该数据集是一个极佳的资源。. 228. DIMACS实施挑战 第九届实施挑战赛的网站旨在帮助研究人员学习如何解决最短路径问题。网站创建者的目标有两个:首先,找到最佳的可复现解决方案;其次,方便研究人员协作并发现更有效的解决方案。有兴趣了解该领域进展的研究人员可以访问网站查看相关论文和数据集。. 229. 网络存储库 网络存储库是一个存储科学数据并配备交互式可视化工具的网站,用户可以访问和分析这些数据。该网站的双重特点是:它是同类存储库中的首创,也是网络上规模最大的存储库。利用图表数据和直观、引人入胜的图像,进行比较和寻找新的数据解读方式变得更加容易。记者可以利用这个资源,从科学数据中挖掘新闻故事。. 230. Pajek 数据集 Pajek Datasets 页面提供了一个数据集,用于研究出芽酵母中蛋白质之间的相互作用。该网站首先简要介绍了寻找新的相互作用检测方法的意义,以及区分各种蛋白质间相互作用的重要性,然后直接提供可供下载的数据集链接。如需了解更多信息,研究人员可以点击页面底部的链接阅读已发表的相关论文。. 231. Mejn 网络数据 本网站旨在分享网站所有者使用和整理的网络数据集链接。这些数据集的主题涵盖广泛,从美国大学橄榄球、政治博客和美国政治书籍,到社交网络、《悲惨世界》以及高能理论合作项目,应有尽有。有兴趣探索这些主题的用户将能找到丰富的数据集选择。此外,只要注明出处,这些数据即可免费使用。. 232. 斯坦福图数据库 斯坦福图数据库(Stanford GraphBase)是斯坦福大学的唐纳德·克努特(Donald Knuth)为一系列数据集和程序命名的。这些程序和数据集结合使用,能够操作和生成图和网络。本网站提供所需资料的下载链接。在这些文件中,研究人员可以找到足球比分数据、字典数据、与蒙娜丽莎画像重建相关的数据等等。. 233. SuiteSparse 矩阵集合 SuiteSparse Matrix Collection(原名佛罗里达大学稀疏矩阵集)是一个具有实际应用价值的矩阵集合。据其网站介绍,该集合常用于数值线性代数领域,以开发和改进稀疏矩阵算法。用户喜欢该集合,因为它便于运行和测试实验结果。数据集和矩阵基准测试可直接从网站下载。. 234. 图数据集 这是一组数据集,本网页的创建者认为这些数据集要么是关系型的,要么能够很好地转换为图表示。图数据集为希望学习如何处理原始数据的研究人员提供了诸如预测毒理学挑战赛数据、IMDb 数据、诱变数据、MovieLens 数据、协同过滤数据和蛋白质数据等数据集。这些文件在本页面上提供下载,主要以 XML 格式提供。. 235. 大数据新闻 大数据新闻网是一个专注于大数据和数据科学基础知识的网站。该网站提供最新资讯,并探讨深度学习和人工智能等话题。此外,大数据新闻网还拥有一个庞大的数据集,其中包含约35亿个网页。这些网页按层级进行划分,分别称为页面级图、子域名级图、一级子域名图和付费域名级图。. 236. 复杂网络与系统研究中心 CNetS,即复杂网络与系统研究中心,隶属于印第安纳大学网络科学研究所和信息与计算学院。该网站旨在成为数据科学、计算社会科学以及复杂网络与系统领域的资源库,提供有关网络数据挖掘和流量模式的信息。此外,CNetS 还托管着一个包含约 535 亿条印第安纳大学用户网络请求的数据集。. 237. OONI Explorer OONI Explorer 是网络干扰开放观测站 (OONI) 的一部分,该项目致力于提供免费开源软件。用户可以使用该软件尝试屏蔽网站、即时通讯应用以及其他应用程序。对于对这项技术感兴趣的用户来说,OONI 收集的原始数据可以免费访问,这一点尤其值得关注。只需将信息输入 OONI Explorer,即可直接与数据进行交互。. 238. 机器学习面临的挑战 “机器学习挑战”网站致力于机器学习的研究与开发。读者可以在该网站找到软件、书籍、机器学习挑战的链接,以及即将举办的研讨会通知。该网站甚至提供允许提交截止日期后题目的挑战链接。对于那些有兴趣了解机器学习能否胜任诸如金融预测或网页分类等任务的记者来说,这个网站非常值得一访。. 239. 数据X DataX 目前隶属于 CrowdANALYTIX,是社区驱动型项目“CrowdANALYTIX”中的机器部分。该项目旨在利用集体的力量创建定制化的人工智能、机器学习和神经语言程序学 (NLP) 应用。DataX 在此过程中负责维护和部署,从而确保这些解决方案的可扩展性。对于需要处理大量文本、视频和数据的记者而言,CrowdANALYTIX 和 DataX 提供的机器人可以将研究时间缩短一半。. 240. 驱动数据 Driven Data 将众包与数据科学相结合,这种结合方式几乎是其他网站所无法比拟的。该网站强调其在帮助应对各种社会挑战的组织方面所发挥的作用,它利用其庞大的数据科学社区创建统计模型来解决预测性问题。Driven Data 似乎主要服务于非营利组织,但对于任何拥有需要提炼的原始数据的人来说,它都可能非常有用。记者们可以考虑使用这个数据资源。. 241. 开放大数据 Dandelion API 是一款用于处理大数据语义文本分析的应用程序。对于需要处理数据的用户来说,这意味着该程序能够将杂乱无章的文本进行上下文关联,从而构建有意义的信息。经常需要处理大量文档的记者无疑会从中受益匪浅。Dandelion API 还提供米兰、特伦托和欧洲等类别的开放大数据服务。虽然该 API 需要付费,但每天都有一定数量的文本可供免费分析。. 242. 地球模型 Earth Models 专注于分享和存储与地球相关的软件和数据集。该网站提及的建模工具包括模拟软件和处理程序,以及大量借鉴于构造学和地震学等特定研究领域的虚拟数据。希望深入了解该主题的记者和研究人员,可以在使用建模和可视化工具之前,先利用该网站上的出版物和文章进行学习。. 243. 社会经济数据与应用中心(SEDAC) 社会经济数据与应用中心(SEDAC)是美国宇航局(NASA)地球观测系统数据信息服务(EOSDIS)的数据中心之一。在该网站上,读者可以找到包含气候变化数据或网格化人口统计信息的数据集。这些数据集还可以按主题进行搜索,例如治理、农业、土地利用、健康、保护以及气候、水资源、遥感和贫困。此外,网站还提供地图、图库、指南等,以提供更多数据背景信息,以及供研究人员访问的其他资源和工具。. 244. AODN门户网站 澳大利亚海洋数据网络(AODN)旗下的AODN门户网站提供澳大利亚气候科学和海洋数据。访问这些信息的科研人员还可以访问IMOS数据及其元数据。IMOS是一个由包括澳大利亚政府在内的多家机构支持的研究框架。选择使用AODN门户网站的科研人员可以期待通过直观的界面获得优质的海洋数据。. 245. Planet OS Planet OS 提供了一个专注于可再生能源的大数据框架。这种细分领域的选择,加上网站的专业性,使其在寻求数据可视化和情境化新方法的能源公司中广受欢迎。此外,该网站还设有名为“数据中心”(DataHub)的平台,其中包含超过 2000 个数据集。这些数据集包括来自 NASA 和哥白尼计划的开放数据,并且数据会定期更新。. 246. 史密森学会 史密森学会长期以来都是备受尊敬的学术机构,其对研究和历史的贡献享誉全球。从某种程度上来说,史密森学会拥有一个提供火山研究领域最佳信息的网站也就不足为奇了。该网站发布报告、研究链接和数据库,其中包括火山、喷发、排放和变形等方面的细分搜索,并配有全新世火山列表和电子表格。记者们无需再寻找其他火山活动信息来源。. 247. 地震目录 由美国政府地震灾害计划更新和维护的地震目录,使研究人员能够查看最近一次地震发生的时间和地点。虽然搜索结果上限为20,000条,但该目录的搜索功能支持按震级、日期、时间甚至地理区域进行筛选。这种灵活性使得该资源对于报道自然灾害或当地地震并寻求背景信息的记者来说尤为有用。. 248. 美国经济协会 美国经济学会为研究人员提供美国及世界其他国家的宏观经济数据。该网站似乎并不直接发布经济数据,而是精选了一系列最可靠的数据。然而,鉴于互联网上提供经济信息的网站众多,该网站的可靠性值得记者信赖。只需访问该网站,点击相应的经济数据类别即可。. 249. Historicalstatistics.org Historicalstatistics.org 是一个非常实用的网站,可以找到与当今经济状况形成鲜明对比的各类经济信息。例如,该网站的历史货币转换器可以让研究人员了解 1923 年拥有 10 美元的人如今能买到多少东西。此外,它还收录了探讨经济史领域所用指标的出版物和论文,以及可以按国家/地区筛选的价格指数和货币供应量信息。. 250. 数据库命名学 如果所有互联网上的公开经济数据都能通过一个统一、易于浏览的平台进行访问和搜索,那会怎样?Db.nomics 正是这样一个经济数据库聚合平台,旨在实现这一目标。数据以 HTML、JSON 和 CSV 等格式提供,并自动更新,同时将之前的版本进行相应存档。经济数据来源包括美联储、美国经济分析局、国际货币基金组织等。对于寻求权威经济数据的研究人员来说,Db.nomics 无疑是理想之选。. 251. 联合外部债务中心(JEDH) 由国际清算银行、经济合作与发展组织(OECD)、国际货币基金组织和世界银行共同开发的联合外部债务中心,向公众提供有关债务数据以及国际债权人和债务人的信息。研究各国财政状况并试图深入了解国际金融格局的记者,几乎可以在这里找到他们想要了解的一切信息。. 252. 国际贸易数据 本国际贸易数据页面由著名经济学家乔恩·哈维曼 (Jon Haveman) 倾力打造,提供可供下载和深入分析的数据。数据集包括关税数据、宾夕法尼亚世界表、公用事业数据、进口数据、制造业生产率、商品分类、劳赫产品差异化代码、NBER 数据、1997 年商品流动调查、贸易和移民数据,以及实用的引力模型。虽然编译这些数据使用的是 UNIX 操作系统,但网站也指出,个人电脑同样可以访问这些数据。. 253. 开放型企业 在 OpenCorporates 平台上,研究人员可以便捷地搜索和查找全球最大的公司开放数据库之一的信息。世界各地的不同群体,例如银行、调查人员、非政府组织和记者,都会利用这些信息进行情报收集和信息获取。记者还可以借助 OpenCorporates API 实时访问数据,并通过批量核心数据或其他核心数据集获取信息,从而获得额外的优势。. 254. 我们的数据世界 “数据世界”(Our World in Data)网站从多个来源收集信息,涵盖各个领域,并呈现量化数据。从女性就业参与率到公共部门腐败普遍认知以及全球收入不平等问题,只要能用数据来探讨的话题,这个网站几乎都能找到相关条目。记者可以利用这个资源查找与社会问题相关的统计数据。. 255. 巴黎政治学院 巴黎政治学院(Sciences Po),或更广为人知的政治研究所,是一所社会科学领域影响力毋庸置疑的学府。蒂埃里·梅耶的网页包含的数据文件包括来自“贸易而非战争”(Make Trade Not War)项目的引力模型和军事冲突回归数据,以及关于市场潜力等其他方面的数据集。希望深入了解学术期刊结论的记者们,浏览该网站将发现大量信息。. 256. 国际数据中心 自1999年成立以来,国际数据中心一直致力于收集、创建、改进和分发线上线下国际经济数据。读者可以通过其网站访问美国关税数据、世界和美国进出口数据,甚至包括宾夕法尼亚世界经济表的信息。这些信息面向公众开放,用于教育和研究,记者也可以免费访问和使用这些数据。. 257. 经济复杂性观察站 经济复杂性观测站(OEC)允许研究人员、学生、经济学家以及任何其他人士将国际贸易数据可视化。凭借其引人注目的主题和交互式界面,该网站为研究人员提供了一个前所未有的机会,让他们能够以前所未有的方式探索国际贸易信息。对于喜欢在搜索过程中看到经济数据生动呈现的记者来说,OEC 是一个宝贵的资源。. 258. 大学记分卡数据 高等教育在许多领域都是一个热门话题,学生和家长都想了解学校的水平以及学生的学习效果。美国教育部通过其“大学记分卡”(College Scorecard)数据,为教育工作者和学生提供了所有这些信息以及更多内容。这些数据涵盖1996年至2016年,包括最新数据、记分卡数据、毕业后收入以及最新的全国学生贷款数据系统(NSLDS)信息。对于新闻工作者来说,这是一个获取最新高等教育信息的重要来源。. 259. 商业建筑能源数据集 COMBED数据集主要关注能源,因此其独特性毋庸置疑。此外,该数据集的数据来自商业建筑,且每分钟多次更新,这些都使其独一无二。对于记者而言,在撰写有关能源消耗的文章时,这些信息极其有用。访问COMBED数据非常简单,只需下载并打开Excel电子表格即可。. 260. DRED 数据集 DRED 数据库中的 DRED 部分代表荷兰住宅能源数据集(Dutch Residential Energy Dataset)。顾名思义,该数据集测量并研究了荷兰单个家庭的能源消耗量。该数据集监测了 2015 年 7 月 5 日至 2015 年 12 月 5 日期间的室内环境、居住情况、用电量以及其他家庭相关信息。任何研究能源消耗的记者都可以参考此处提供的原始数据。您可以在网站上找到下载 CSV 格式数据的说明。. 261. ECO 数据集 ECO(全称为“电力消耗与占用情况”)是由分布式系统集团运营的项目。该项目旨在监测瑞士六个家庭的用电负荷和占用情况,监测周期为八个月。本网站提供相关信息,以及相关出版物的链接和说明。借助网站直观的交互式仪表盘,记者可以轻松地将研究成果转化为引人入胜的内容。. 262. 印度环境水和能源数据集 IAWE(印度环境水和能源数据集)的创建旨在通过测量家用电器、电表和配电盘的用电量来监测新德里一户家庭的能源使用情况。由于停电、供水差异、数据包丢失和电压波动等问题,IAWE在追踪印度能源使用情况时遇到了一些特有的难题。对于记者而言,这些数据在探讨能源使用模式时非常有用。. 263. 英国家用电器级电力 英国家用电器用电量(UK Domestic Appliance-Level Electricity,简称UK-DALE)是一个数据集,用于监测和记录五个家庭的用电量。UK-DALE每六秒钟测量一次主电网和房屋内各个电器的用电量。对英国家庭能源使用情况感兴趣的记者无疑会发现UK-DALE非常有用。该数据公开可用,并且有一篇介绍该系统的论文可供阅读。. 264. ArcGIS ArcGIS Hub 是一个平台,组织和个人可以利用它通过全站项目来实现目标。该网站提供页面模板、分步指南和示例供用户参考,是雄心勃勃的社会行动者的绝佳资源。同时,“开放数据”选项卡下的信息包含数百个数据集,仅在“灾害”类别中就涵盖了这些数据集。无论记者是研究数据还是贡献数据,ArcGIS Hub 都能在多个方面发挥作用。. 265. 剑桥地理信息系统 Cambridge GIS 是马萨诸塞州剑桥市的开放数据存储库。除了部分文件过大无法通过此 GitHub 存储库下载外,该市的大部分数据集都可以在此页面上找到。这里提供的各个数据集包括商业区、地役权、分区、人口普查结果、墓地以及其他可以通过数据量化的地标和特征。记者如果想挖掘本地信息,可以在这个网站上找到他们所需的一切,甚至更多。. 266. Geo-Wiki.org Geo-Wiki作为一个资源平台,致力于推广其所谓的“公民科学运动”。在这里,公民们被鼓励尝试参与环境监测。研究人员可以在侧边栏找到最新资讯,以及出版物名称、免费数据集和软件下载。该网站提供的工具包括地图、个人数据上传、验证和黑客马拉松,这些工具可以以Excel格式和zip文件下载。. 267. 开放街道地图 OpenStreetMap 数据提取自 OpenStreetMap 项目,这是一个持续进行的在线项目,旨在通过全球用户社区的编辑和努力创建世界地图。要开始使用此数据源,所有内容发布者只需选择所需的洲,然后选择所需的国家/地区即可。Geofabrik GmbH 提供此数据下载服务,且数据通常每日更新。. 268. HIFLD开放数据 由美国国土安全部运营和维护的国土基础设施基础级数据(HIFLD)将地理空间数据置于公共领域。这些数据的发布旨在为社区的研究和准备工作提供支持和信息。用户可以下载Shapefile和CSV格式的数据,也可以在网页上查看。对于发布者而言,HIFLD开放数据使地理空间数据比以往任何时候都更加直观和引人入胜。. 269. 开放地址 OpenAddresses 专注于地址基础设施和收集。该网站主要依靠社区的力量,并使用 GitHub 作为其开发平台。用户可以将地址添加到数据库后将其标注在地图上,也可以直接获取数据并立即开始地理编码。所有数据和地址均公开,只需注明出处即可获取,定期的数据更新以及地理编码技术发展的巨大潜力,使得 OpenAddresses 成为一个非常有趣的项目。. 270. 开放数据 LMU 洛约拉马利蒙特大学 (LMU) 的开放数据项目大量依赖 OpenStreetMap 的数据来辅助开发快速反向地理编码器。这意味着该应用程序能够快速获取地图上的位置,并根据该位置找到完整的地址。这项功能未来也可能应用于社区和县级行政区域。本网页包含许多与该应用程序相关的链接,包括源代码、数据集以及 OpenStreetMap 的查找表和分辨率。. 271. 环境数据浏览器 借助环境数据探索器,记者、研究人员和学生可以下载并探索联合国环境规划署及其附属机构和合作伙伴使用的相同数据集。用户可以按地区缩小搜索范围,并使用500个筛选条件中的任意一个或全部进行搜索。此外,这些数据集涵盖健康、GDP、气候、排放和淡水等类别,可以直接在网站上以图表、表格或地图的形式查看。. 272. 非洲开发银行集团 非洲开发银行集团的网站是记者查找与非洲大陆相关的统计信息和指标的首选之地。用户可以浏览数据目录,并按来源、主题和地区筛选数据集。对于希望深入了解相关主题的用户,该网站还提供一系列出版物的链接,其中包括《非洲经济展望》和《非洲统计年鉴》等。. 273. 基因组数据共享平台(GDC) 美国国家癌症研究所(NCI)的基因组数据共享平台拥有网络上最全面的癌症数据存储库之一,专注于癌症基因组研究领域。该网站的数据门户收录了数千个病例,涵盖38种疾病类型和39个项目,并且可以免费访问。由于数据主要由机构和研究人员提交,因此信息的准确性使其成为记者理想的数据来源。. 274. PhysioBank数据库 PhysioBank数据库通过公共领域向个人提供生理数据。这些数据库分为波形和临床两大类。波形数据库又细分为图像、心搏间期数据库、合成数据、步态与平衡数据、心电图数据以及多参数数据库。从中获取的信息包括床旁生命体征数据、血氧饱和度数据,甚至心血管疾病数据。从事人体研究的记者和研究人员或许能从中找到一些有用的信息。. 275. 医疗保险覆盖范围数据库 由美国卫生与公众服务部下属的医疗保险和医疗补助服务中心维护的医疗保险覆盖数据库,为研究人员提供了海量的医疗服务信息。其中包含慢性病、药品支出、电子临床模板、债务催收系统以及研究和示范拨款等信息,供研究人员查阅。对于直接来自源头的数据而言,这是目前网上最全面、最详尽的同类网站。. 276. 公开支付数据 大多数人去看医生时,通常不会仔细考虑他们的家庭医生是否从医疗保健制造商那里获得了经济利益。“公开支付”项目旨在向公众披露医生或医院从企业获得的任何餐费、研究经费、礼品、演讲费和差旅费。记者如果想挖掘劲爆新闻,可以使用数据浏览器查看信息,也可以点击标签直接下载数据。. 277. FlickrLogos 顾名思义,FlickrLogos 指的是一个数据集,其中包含各种不同角度拍摄的公司标志照片。该数据集由奥格斯堡大学多媒体计算与计算机视觉实验室维护,最初的目的是训练计算机识别标志和文本。为了随时了解这项备受关注的项目的最新进展,不妨下载该数据集,一探究竟。. 278. 图像网 ImageNet 是一个包含大量图片的数据库,这些图片由 WordNet 整理而成。该网站每年都会举办挑战赛,即使网站关闭后仍然可以查看,这些挑战赛专注于创建能够执行特定任务的算法。ImageNet 还拥有大量的出版物、引文和幻灯片。技术类内容发布者完全有理由使用探索器选项来理解 WordNet 的结构以及云图。. 279. 斯坦福犬数据集 斯坦福犬类数据集包含大量不同犬种的图片。该数据库基于 ImageNet 构建,涵盖 120 个犬种,包含超过 20,000 张独立图像,为研究人员提供了丰富的图像素材,帮助他们训练机器识别各种犬种。网站上提供了相关链接,指向探讨如何利用数据集训练计算机图像识别的各类出版物,用户可以点击链接进行阅读,并同时下载数据集。. 280. SUN数据库 SUN数据库是一个旨在促进研究界在计算机视觉与图形学、数据挖掘、机器学习和神经科学等领域取得进展的项目。该网站拥有超过13.1万张图像和近4000个对象类别的索引,内容极其全面。对于对该数据库及其研究成果感兴趣的出版商而言,这是一个值得探索的数据源。. 281. 牛津-IIIT宠物数据集 牛津-IIIT宠物数据集网站是对2012年IEEE计算机视觉与模式识别会议论文的补充,并托管了该论文所使用的原始数据集。这些图像被分为大约37个宠物类别,每个类别包含约200张相关图像。此外,用户可以通过网页上的链接直接下载这些数据。. 282. 可视化基因组数据集 Visual Genome API 是斯坦福大学多位学生和副教授辛勤工作的成果。为了开发能够评估和描述图像的 API,他们发表了多篇论文。该程序已成功回答了超过一百万个问题,并评估了超过十万张图像。该 API 代表了计算机科学及其相关领域的进步,数据集可直接从网站下载。. 283. YouTube 脸书 YouTube人脸数据库致力于开发一种解决视频中人脸自动识别问题的方案。该数据集包含超过3000个来自YouTube的视频,涉及近1600人,平均时长约为181帧。最终目标是创建一个算法,能够生成标签来识别视频中的人物。所有数据、错误信息以及描述方法均可在网站上直接查看。. 284. KEEL数据集存储库 KEEL 数据集仓库包含一个基于 Java 的开源软件数据集,该软件旨在辅助各种类型的知识数据发现。KEEL,全称为基于进化学习的知识提取(Knowledge Extraction based on Evolutionary Learning),可以训练学习如何添加缺失值、构建混合模型以及使用统计方法评估实验,此外还能完成许多其他任务。数据集以及 KEEL 中包含的算法的完整列表均可直接从网站下载。. 285. 借贷俱乐部 Lending Club 的成名之处在于其作为 P2P 借贷平台的地位,即使借款人信用评分不足以从传统贷款机构获得贷款,也能通过该平台获得贷款。除了网站运营方式的新颖性之外,它还提供包括平台亮点、贷款被拒信息、投资者业绩数据,甚至包含历史数据的数据字典在内的统计数据。这些数据通常从 2007 年开始,可以 CSV 格式下载。. 286. 自然历史博物馆 自然历史博物馆被许多人认为是世界上最知名的博物馆之一,但其数字化以及通过开放数据门户网站查阅馆藏目录的功能,对很多人来说可能还是个新鲜事。该馆藏包含91个数据集,涵盖微体化石和化石藏品、索引批次记录以及其他资料,所有数据均向公众开放,并提供多种格式免费下载。. 287. 盖蒂词汇表 对于希望在描述和分类特定艺术作品、艺术家姓名、建筑、材料和地名时遵循特定风格指南的记者和出版商而言,本网站堪称完美之选。本网站直接链接至研究人员和编目员为符合国际标准而必须了解的受控词汇数据库。至少在这一点上,Getty词汇库无可匹敌。用户可以通过文本或SPARQL查询浏览这些数据集,并可直接从网站下载。. 288. CLiPS文体计量学调查(CSI)语料库 提到CSI(学生评论和作文研究),CLiPS文体计量学研究语料库可能并非大多数人首先想到的,但它确实是一个包含学生评论和作文的数据集。除了文本本身,该网站还指出,文档中嵌入的元数据和信息也具有多种用途。该语料库以知识共享许可协议发布,用户只需注明出处即可使用。. 289. 通用依赖关系 v2 Universal Dependencies v2 指的是 Universal Dependencies 项目的第二个更新版本,该项目旨在开发一种可用于多种不同语言的通用树库标注。在更新版本中,研究人员除了可以找到英语树库外,还可以找到数十种不同语言的 UD 树库,包括南非荷兰语、古希腊语、日语、荷兰语、芬兰语和汉语。最新版本的 Universal Dependencies 可在本网页底部附近找到并下载。. 290. Webhose Webhose 是一个顶级的数据库,其数据集直接取自网站的存储库并向公众开放。研究人员可以按语言对新闻文章进行排序,阿拉伯语、法语和荷兰语只是其中几种,文章数量超过 10 万篇。此外,英文新闻文章还进一步细分为娱乐和体育等类别,并配有评论和论坛帖子。数字出版商和研究人员可以从探索这些数据集中获益。. 291. 维基数据 Wikidata 是一个被低估的内容和创意资源库,对出版商和研究人员来说都是如此。根据此页面,访问数据转储中的资料有多种方式,但该网站强烈推荐使用 JSON 格式。所有数据均可免费用于非商业和商业用途,并根据知识共享许可协议免费访问和下载。. 292. 维基链接 Wiki Links 是一个开源项目,它基于 Google Code 框架构建,旨在为用户提供访问特定独特数据集的途径。在这个网页上,研究人员可以下载 README 文件、数据文件以及知识共享许可协议。出版商或技术人员在浏览这个庞大的数据集时会发现很多值得期待的内容。只需浏览网站,点击即可开始下载文件。. 293. 词网 WordNet是一个英语词典,它由语言成分组成,包括副词、名词、形容词和动词,这些词被分类到不同的词组,用于表达特定的概念。最终,它成为一个实用的工具,根据词语的用法和含义而非发音对其进行分类。网站上还介绍了WordNet在语言编程中的应用,以及相关的出版物和统计数据。. 294. 艾伦脑图谱 由艾伦脑科学资源研究所创建的艾伦脑图谱,是研究和了解人脑及其在人体健康状态和疾病状态下反应的工具。利用该图谱,研究人员可以了解人脑及其发育,以及胶质母细胞瘤和癌症对大脑的影响。报道这些主题的记者可以访问该网站获取数据集和信息。. 295. 国家氮氧化物研究中心 神经影像信息学工具与资源中心(NITRC)是记者和出版商获取神经影像数据的理想平台。该网站旨在促进神经影像数据的共享,汇集了多个项目的数据,例如“千人连接组计划”(1000 Connectome Project)、“成瘾连接组预处理计划”(Addiction Connectome Preprocessed Initiative)以及INDI前瞻性项目和INDI回顾性项目。用户可以通过该网站免费下载数据。不同阶段的神经影像从未如此易于获取。. 296. 医疗保健专业人员青年 人类连接组计划青年成人项目是持续开展的人类连接组精确图谱绘制工作的延续,旨在展现大多数正常成年人的人类连接组结构。该项目分两个阶段进行,采用静息态功能磁共振成像(fMRI)和扩散成像等多种技术对1200名健康成年人进行了扫描。对于寻求大脑相关信息的记者和出版商而言,没有其他网站能提供比这更全面的健康青年成人人类连接组数据。. 297. NIMH 数据存档 NIMH 数据存档库(简称 NDA)与其说是一个独立的数据源,不如说是一个数据分发和存储平台。该网站收录了多篇论文和研究项目中收集的数据,并提供各种方法和工具,以促进更高效的分析和协作。数据摘要免费提供,报道最新科学进展的内容提供商可以利用这些信息发布新闻。. 298. 神经数据 NeuroData致力于研究心智与大脑之间独特的联系。该网站秉持开放科学和可重复研究的原则,内容提供者可以通过网页上的链接访问其出版物和多个数据集。对于那些希望亲自查看数据的人来说,网站提供的免费代码和分析工具尤其值得关注,它们使得探索NeuroData的研究成果变得更加便捷。. 299. 神经电生理 神经电生理项目旨在收集不同类型神经元相关的各种电生理特征,并将其汇总到一个数据库中。该项目致力于研究神经元之间的关系,以期探究不同类型神经元之间的差异。该网站提供相关文章链接,并列出了迄今为止发现的神经元类型及其电生理特性。内容提供商可以依赖该网站作为神经元间关系的数据来源。. 300. 开放获取系列影像研究 开放获取影像研究系列(Open Access Series of Imaging Studies,简称OASIS)是一个旨在向广大科学界开放脑部磁共振成像(MRI)数据集的项目。记者和研究人员可以访问比较成年人MRI数据的出版物,以及OASIS综合报告中的一份详尽情况说明书,该说明书对比分析了400多名受试者的结果。这些信息和工具可以从网站下载,并提供多种格式。. 301. OpenfMRI 对于希望轻松获取MRI数据集的记者而言,OpenfMRI.org致力于向公众开放MRI数据集,这无疑是一项积极的举措。该网站直接由研究人员创建,提供多种数据集,例如分类学习数据集、混合赌博任务和气球模拟风险承担任务。丰富的数据种类和数量使得研究人员能够通过该网站探索新的研究方向。. 302. Studyforrest 它的名字很大程度上借鉴了著名电影《阿甘正传》 学习森林 该网站旨在了解当大脑需要在应对自然但同样复杂的刺激的同时,以更高的水平运作时,其能力范围究竟如何。即便如此,该网站也承认,从这些研究中收集的fMRI数据具有比乍看之下更为广泛的应用。内容提供商可以浏览已发表的19篇相关文献。 学习森林 可以获取数据,甚至可以直接访问数据。. 303. 晶体学开放数据库 顾名思义,晶体学开放数据库收录了385,697种金属有机矿物和化合物、有机和无机晶体结构,但生物聚合物除外。希望了解更多晶体结构信息的内容提供者可以通过结构式搜索,也可以运行匹配的搜索查询,并可选择浏览。此外,该网站还提供软件和数据,使其在化学领域具有极高的价值。. 304. NASA系外行星档案 长期以来,NASA一直被视为外太空信息的主要来源之一,其系外行星档案库延续了这一传统,成为不可或缺的资源。该网站提供一系列交互式工具和软件,例如凌日和星历服务、周期图、已确认行星绘图工具,以及交互式文件上传和表格搜索功能。内容提供商可以利用这些数据,在下次系外行星成为重大新闻时,获取独特的见解。. 305. 斯隆数字巡天 借助斯隆数字巡天(SDSS),任何人都可以创建宇宙的三维地图。记者和内容提供商都可以访问算法、图像数据、数据集、教程以及进一步开发的视觉素材,用于正式和非正式的公众教育。该网站还明确讨论了如何通过新闻和社交媒体向公众开放其数据。这对内容提供商来说是一个极其宝贵的视觉工具。. 306. StatSci.org Statsci.org 提供了一系列全面的资源,公众可以根据自身需求访问和使用。部分信息包括电子数据集服务和加州大学洛杉矶分校 (UCLA) 汇编的案例研究。除了原始数据集外,该页面还链接了一些教科书,例如《小型数据集手册》和《生物统计学案例研究》。内容提供商如果正在寻找统计资源,不妨浏览一下这个网站。. 307. 埃里克 ERIC,又称教育科学研究所,是一个资源丰富的搜索引擎,可供任何想要查找教育领域信息的人士使用。其初步搜索功能甚至提供了筛选选项,可以专门查找同行评审的信息以及ERIC收录的全文。鉴于教育预算和教学方法在新闻报道中频繁出现,记者们应该牢记这一数据来源。. 308. NTIS 国家技术信息服务中心(NTIS)成立于二战结束后不久,其目标是利用数据帮助联邦机构做出基于数据的明智决策。该机构最初是美国政府在科学研究领域的数据存储库。如今,该网站拥有数百万篇涵盖众多主题的出版物。仅其丰富的历史信息就足以使其成为记者和出版商的重要数据来源。. 309. 开放数据证书 开放数据研究所 (ODI) 的网站提供名为“开放数据证书”的工具,这是一个免费的在线工具,旨在严格审查和认可开放数据的质量。对于出版商或记者而言,该网站还托管了大量数据集,涵盖从资助项目列表到过敏警报等各种主题,并提供 CSV 格式的下载。. 310. GitHub 存档 GitHub 凭借其便捷的协作、强大的数据存档能力以及对代码的友好访问,无疑是互联网上最受欢迎、最知名的数据存储库和存档平台之一。无论是创建能够执行特定任务的机器人,还是开发应用程序,内容发布者和记者都能在 GitHub 上轻松发现潜在的新闻素材。用户可以通过 JSON 或 BigQuery 的教程说明访问其存档。. 311. 社会模式 SocioPatterns是一个专注于通过数据分析发现人类活动和社会动态模式的项目。正如其目标如此广泛所预期的那样,该网站的信息已被用于各种出版物中,涵盖了从疾病传播到个人线上线下形象差异案例研究等诸多主题。数据集和已发表的论文均可查看,其中包含的信息对出版商而言可能在某个时候具有参考价值。. 312. 独立地图 Indie Map 汇集了 IndieWeb 旗下 2000 多个访问量最高的网站的信息,并将这些数据整合为交互式可视化形式,例如社交图谱 API、具备 SQL 查询功能的数据集,以及从总共 570 万个网页上抓取的原始数据。对开源软件以及这些数据可能揭示的在线社区信息感兴趣的数字出版商可以直接从该网站访问这些信息。. 313. 西蒙弗雷泽大学 西蒙弗雷泽大学凭借其关于“YouTube视频的统计与社交网络”的数据集,进一步巩固了其作为一所声誉卓著的大学的地位。该数据集的数据来源于一个使用YouTube API抓取视频的爬虫,包含数百万个视频的数据和用户信息。网站明确指出,数据集下载仅供学术用途,但用户或许可以通过该网站找到有关此项目的新闻报道和参考文献。. 314. ACLED 武装冲突地点与事件数据项目(ACLED)提供有关发展中国家抗议和政治暴力事件的公开数据。此处提供的信息包括死亡人数、暴力或抗议事件的日期和地点、相关团体的名称,以及已发生的骚乱和暴力冲突的数据。ACLED 提供定期报告、出版物和可视化图表,以及可从网站下载的数据。. 315. 加拿大法律信息研究所 加拿大法律信息研究所(Canalii)是一个提供免费访问的网站,涵盖法律法规、各级法院(包括加拿大最高法院、省级法院、上诉法院和女王法院)的判例法,以及各类行政法庭和法定机构的裁决。该网站拥有301个判例法数据库和超过14万份法院判决可供查阅,对于报道法律新闻的记者和数字出版商而言,收藏该网站将大有裨益。. 316. 系统和平中心 系统和平中心(CSP)致力于分析全球体系,以期解决政治暴力问题。在这个网站上,从事相关研究的记者可以获取关于非洲冲突、全球冲突趋势等方面的分析,以及该组织三份主要出版物(如《第三次世界大战》和《CSP全球报告》及虚拟图书馆)的摘要。. 317. 战争相关因素项目 “战争相关性”(Correlates of War,简称COW)项目旨在协助收集和分发国际关系领域的定量数据。秉持着将科学原理应用于国际关系数据的理念,COW将其数据集免费向公众开放。这些数据库包含记者和研究人员可以使用的各种信息,例如国家间的军事冲突、国家体系成员、国家物资能力和正式联盟等。. 318. 欧洲社会调查 欧洲社会调查(ESS)是一项覆盖整个欧洲的调查,旨在衡量不同国家不同人群的各种行为模式、态度和信仰。由于记者通常对公众意见感兴趣,ESS 的“重点系列”涵盖了从欧洲人的个人和社会福祉、对福利的态度,甚至英国是否存在年龄歧视等诸多主题,可以从多方面为新闻报道提供佐证。. 319.和平基金会 和平基金会是一个致力于预防冲突、着重发展安全保障的组织,其工作重点在于开发能够缓解冲突的工具。在和平基金会的历程中,它与记者、非政府组织、地方组织及其国际合作伙伴以及各国政府开展了合作。记者和出版商可以通过该网站的浏览器内数据探索工具,找到所需的资料,无论是寻找趋势分析、对比分析还是全球数据。. 320. 综合社会调查 美国综合社会调查(GSS)的工作重点在于收集现代美国社会各个方面的信息,以此来掌握民众的态度和行为趋势及模式。这项趋势追踪工作始于1972年,其历史数据本身就是一座金矿,对于想要探索趋势的记者来说,这无疑是宝贵的资源。借助GSS数据浏览器,研究人员和记者可以下载、查看甚至评估这些数据。. 321. 盖西斯 GESIS是一家德国基础设施研究所,致力于社会科学研究。它提供多种社会科学研究,以及涵盖调查方法、应用计算机科学、数据收集、研究规划和数据分析等一系列研究和服务。对GESIS的研究方法、高素质移民的利用等议题感兴趣的记者,可以在其出版物部分找到大量信息。. 322. 全球宗教未来 从堕胎到性教育等话题,宗教的影响无处不在,即使在世俗化程度较高的国家,人们对棘手社会问题的立场也会受到宗教信仰的影响。皮尤研究中心在《全球宗教未来》报告中分析了人们对全球宗教的态度和信仰趋势。记者如果想深入了解福音派在政治中的影响或人们对石刑的态度等细节,可以使用数据探索器从数据中寻找答案。. 323. 风险管理指数 风险管理指数(INFORM)是一个供研究人员和记者在人道主义危机或灾难风险情境下进行风险评估的平台。该组织提供的数据链接涵盖儿童死亡率、性别不平等指数、干旱频率等诸多主题。用户还可以查看和下载INFORM的数据,或通过网站的交互式地图访问这些数据。. 324. 独立 法国人口研究所 (INED) 是记者在互联网上能找到的最丰富的统计数据来源之一。该研究所每年研究并发布超过 70 份出版物,内容涵盖世界人口图表以及衡量诸如男女生育率差异等问题的统计数据,并配以新闻报道和资源信息。研究人员若想从权威来源获取准确信息,INED 无疑是最佳选择。. 325. 国际网络档案馆 普林斯顿大学国际网络档案馆提供了一系列独特的出版物,例如《1999年人类发展报告》和《全球网络:跨国事务期刊》等研究成果均可在此网站上阅读。记者们可以在此查阅档案馆全面公开的历史数据和最新资料。这里涵盖的主题包括医疗保健、武器、书籍、音乐、移民、区域、互联网、政治和交通运输等等,这只是研究人员可以浏览的部分资料。. 326. 国际社会调查计划 国际社会调查项目(ISSP)自创立之初便旨在促进不同国家人民之间的合作,每年都会就社会科学领域的重要议题开展调查。多年来,调查主题涵盖社会不平等、民族认同、公民身份、社会网络和工作取向等诸多方面。ISSP的调查结果可按年份或主题进行搜索,并可从其网站下载。. 327. 国际研究协会 对于希望就跨国、国际和全球事务相关议题进行深入探讨的记者或其他研究人员而言,国际研究协会 (ISA) 汇集了研究人员、学者和政策专家等各界人士的专业知识。ISA 的《国际研究百科全书》收录了经同行评审的文章,这些文章不仅深入探讨了该领域的研究主题,还从历史视角提供了相关信息。. 328. 网络上的跨国数据 卫斯理大学詹姆斯·W·麦奎尔教授创建了一个极其有用的网页,名为“网络上的跨国数据”,内容丰富,包含大量相关的经济和全球发展数据链接。记者们可以在这里找到各种各样的数据集,例如计划生育、教育成就、营养不良、水和卫生设施、自由市场导向以及拉丁美洲和加勒比地区的具体信息等等。这里列出的数据来源绝对可靠。. 329. 挪威研究中心 挪威研究数据中心是一个支持和帮助研究人员开展实证研究的机构,研究领域涵盖隐私、数据收集与分析、方法论评估以及研究伦理等。在这里,研究人员可以找到中心开发和推荐的软件和工具,这些软件和工具与中心丰富的区域、个人和机构数据资源库配套使用,所有数据均可免费访问。中心发布的《研究与隐私年度报告》也总是值得一读。. 330. 个人电源模块 IPUMS并非大多数人通常意义上理解的数据源,但它对记者而言仍然是一个有用的信息来源,因为它能够聚合、存档和整理其他机构提供的数据。例如,IPUMS USA充当着美国人口普查微观数据的某种数据存储库,其数据最早可追溯至1790年,一直延续至今。. 331. ND-GAIN 由圣母大学全球适应倡议(ND-GAIN)发起的“国家适应指数”(ND-GAIN Country Index)旨在衡量一个国家应对气候变化和其他全球化因素的能力。该指数涵盖粮食、健康、基础设施和生态系统等领域的脆弱性评分,以及多达50万个数据点的准备度评分。该指数包含1995年至2014年二十年的数据,以CSV文件的形式提供下载。. 332. 英国警方 在这个网站上,记者和出版商可以获取有关英国警务和犯罪状况的公开数据。这些数据包含有关社区警务团队、各个警队、拦截搜查次数以及犯罪和案件结果的实用统计数据。记者可以利用该网站对不同警队进行比较,并发现刑事司法领域的趋势。获取信息非常简单,只需选择日期范围、选择警队,然后等待文件下载即可。. 333. 保罗·亨塞尔的通用国际数据页面 保罗·亨塞尔的“国际通用数据页面”包含一系列链接,这些链接按“国家与国际体系”、“国际地理数据”、“国家能力”、“社会科学数据集合”以及“联盟、条约和组织”等标题进行分组。该网页上列出的每项资源都包含最前沿的数据,能够自动提升记者作品的可信度。这些资源涵盖范围广泛,从软件到数据集和档案,应有尽有,但此处包含的每一个链接都极具价值。. 334. 牵引 911事件后,恐怖主义及其对当地民众造成的毁灭性影响受到了媒体的广泛关注。TRAC(trackingterrorism.org)为研究人员提供了关于这些主题的详尽分析和信息。该网站包含数千个不同恐怖组织的信息。单用户500美元的价格可能略高,但对于那些撰写有关暴力和反恐战争文章的人来说,绝对物有所值。. 335. 德克萨斯州刑事司法部 对德克萨斯州刑事司法系统的运作机制感兴趣吗?想知道目前有哪些人被判处死刑吗?德克萨斯州刑事司法部掌握着大量信息,包括死刑犯临终前的遗言、按性别和种族划分的死刑犯统计数据,以及其他死刑执行统计数据和情况介绍。德克萨斯州刑事司法部是记者们最可靠的信息来源之一。. 336. 综合公民社会组织体系 综合民间社会组织系统(iCSO)旨在方便民间社会组织与经济和社会事务部进行沟通。除了其强大的框架本身的有效性之外,该网页还包含数据集和分类,以便提供更多信息。数据可以按部门、组织类型、所在地区以及组织的经社理事会成员身份进行排序。这无疑是记者寻找信息来源的重要数据资源。. 337. 全球大学 “全球大学数据库”(Universities Worldwide)是一个收录全球大学的数据库,用户可以搜索以获取更多信息。搜索方式包括全球大学列表,以及筛选仅显示美国大学。用户还可以在此过程中添加自己的链接。拥有大量学生数据的数据发布商,甚至是希望核实事实的记者,都能从这种按需访问的数据库中获益。. 338. 乌普萨拉冲突数据项目 这是乌普萨拉冲突数据项目的网站,该项目是组织暴力信息领域最知名的提供者之一。在过去40年中,该项目在收集内战数据方面也取得了显著成就。记者可以利用此数据源搜索特定冲突及其参与者的信息,并可下载这些数据。. 339. 世界流行音乐 WorldPop项目由AsiaPop、AfriPop和AmeriPop项目合并而成,致力于空间人口数据集的存档,这些数据集可用于支持灾害救援工作。关注社会正义事业或研究高效灾害救援方案的内容出版商和记者会对该项目感兴趣。研究人员可以下载数据或在线查阅案例研究。. 340. Draft Express DraftExpress 在互联网上最广为人知的或许是其研究、选秀前球探报告、模拟选秀以及对球员身高和体测数据的细致维护,这些都与其历史数据相辅相成。该网站提及的球员来自 NCAA、高中联赛,甚至国际联赛。体育记者或内容提供者在评论篮球相关赛事时,可以参考 DraftExpress 的统计数据,以便更好地讨论球员和比赛动态。. 341. 必发 Betfair或许最广为人知的是其作为体育博彩网站的定位。然而,对于内容提供商和数字出版商而言,该网站定价数据和历史记录的详细信息尤其值得关注。用户可以选择是否下载带有详细时间戳的数据,同时还能获取从2004年6月到2017年10月期间关于赛马和其他市场产品的丰富数据。. 342. 板球赛程表 Cricsheet提供的服务与其他一些体育数据中心类似,但它专注于提供板球数据。该网站提供包括印度超级联赛、国际一日赛在内的多个联赛的统计数据和逐球数据,以及男子和女子球队的数据等等。内容发布商如果需要历史板球数据,可以下载CSV或XML格式的数据。. 343. 跨国时间序列数据 跨国时间序列数据档案库(Cross-National Time-Series Data Archive)拥有涵盖全球200多个国家、长达200多年的政治、经济、立法和国内冲突数据,是互联网上最全面的数据集之一。这些数据以最便捷的方式存储在Google云端硬盘表格中,点击文件类别即可自动打开。研究人员只需注明出处,即可根据自身需求查看部分或全部信息。. 344. 福特GoBike Ford GoBike是旧金山湾区使用的共享单车项目。虽然很多人无疑都在利用这个项目保持健康并减少化石燃料的使用,但该共享单车系统一直在记录骑行数据。当然,这些信息不包含任何可以识别骑行者身份的内容,但包括单车编号、出发时间、结束时间、骑行者类型以及出发和到达站点等详细信息。这些信息值得我们深入研究。. 345. 海上交通 Marine Traffic 是一家利用大数据追踪船舶和远洋航行动态的公司。其 AIS API 服务涵盖的信息类型包括船舶信息、航程信息以及相关船舶数据,例如预计到达时间、事故记录、照片、船舶详细信息和航程预测。不过,该网站采用付费模式,因此目前尚不清楚免费用户可以进行多少查询。. 346. 比克西 Bixi共享单车项目或许是北美一些大城市中最知名的共享单车项目之一。有趣的是,该品牌还会发布开放数据,提供诸如骑行记录、站点状态等信息,并可对会员和偶尔使用者进行比较。对于那些研究人们如何使用共享单车项目以及如何将其融入日常生活的本地记者来说,这些数据绝对值得深入研究。. 347. 事故数据库 从阿梅莉亚·埃尔哈特到印尼亚航8501航班,航空事故一直是人们关注的焦点。事故数据库收录并存储了1920年至2017年间发生的航空事故数据。该数据库涵盖的事故包括民用和军用飞艇事故、涉及名人或公众人物死亡的事故、造成10人或以上死亡的直升机事故,以及所有导致人员死亡的定期和非定期客运航班事故。. 348. 伦敦交通局 伦敦交通局是负责监管大伦敦地区公共交通的政府机构。其网站上提供地铁和铁路线路图以及出行规划指南。除了这些实用服务外,该网站还包含大量开放数据,涵盖自行车、空气质量、地铁线路,甚至还有牡蛎卡等信息。任何对了解大伦敦居民如何使用公共交通感兴趣的人都可以从这些数据中受益。. 349. 复合肌肉图 CMAP负责伊利诺伊州杜佩奇县、莱克县、麦克亨利县、肯德尔县、凯恩县、库克县和威尔县的区域规划和组织工作。正如其网站所示,CMAP的职责范围涵盖社区发展、税收和经济指标,甚至包括道路和公共交通等问题。因此,对于试图了解该地区未来发展大局的记者而言,有关区域指标和交通等领域的开放数据至关重要。. 350. 货运分析框架 由交通统计局和联邦公路管理局合作开发的货运分析框架,收集的数据用于评估货运系统的整体运行状况和效率。该软件收集货物类型、吨位以及出发站和到达站等详细信息,并将这些数据公开供公众访问和下载,既可查看完整数据,也可查看汇总数据。. 351. Mozilla 科学 Mozilla Science 是一款开源、开放实践的协作软件,旨在帮助开发和分发各种数据源和研究成果。抛开透明度不谈,开放程序并众包改进流程的决定,使得现有程序更容易得到改进。Mozilla Science 的项目涵盖生命科学、医学等多个领域,其中一些软件解决方案可能代表着该领域值得关注的进展。. 352. 酷炫数据集 “酷数据集”(Cool Datasets)这个网站的名称就足以说明它的吸引力。在这个页面上,数据集分为六大类:政府、娱乐、科学、用户提交、其他和机器学习。对于想要探索数据、挖掘新闻故事的记者来说,浏览这个网站无疑是最佳选择。用户可以浏览现有数据集,也可以自行贡献数据集。. 353. 开放数据监测器 OpenDataMonitor是一个平台,它将公共数据集以更直观、更易于理解的方式呈现给用户。研究人员可以访问该平台,查看开放数据资源的功能概述,并以更具视觉吸引力的方式浏览现有数据。该网站解释了其方法论和基准,发布者应该能够轻松找到值得发布的数据。. 354. CrunchBase CrunchBase 最为人熟知的或许是其对统计数据的重视以及致力于为读者提供最佳数据的承诺。每天都有许多具有商业头脑的人士访问该网站,了解投资和行业的最新趋势。记者和出版商也能在这里找到关于最新商业趋势的新闻和新鲜讨论。此外,作为其付费服务的一部分,该网站还提供大量数据集,用户可以使用 CrunchBase 的软件工具进行分析。. 355. 指数 Index平台拥有独特的卖点,因为它能满足从初创公司、投资者、分析师到大型企业等各类用户的需求。该网站不仅收录了超过10万家科技公司的信息,还为用户提供排序、创建和导出电子表格的功能。出版商和记者可以通过该网站快速浏览新闻标题,寻找潜在的新闻角度,抢占先机。Index或许有些另类,但毫无疑问,它是一个非常有用的资源。. 356. SEMRUSH SEMrush 以其作为最成熟的在线营销工具之一而自豪。通过其学院和网络研讨会,研究人员可以充分学习基础知识。此外,其博客和新闻版块也包含大量信息,方便出版商和记者轻松掌握在线广告和 SEO 领域的最新动态。SEMrush 的服务需要付费,但他们也提供了许多免费的高质量信息。. 357. Ahrefs Ahrefs或许可以概括为一套营销工具,对所有在线内容发布者都大有裨益。该网站提供内容研究、网站监控、关键词研究和反向链接研究等服务,帮助用户反向分析竞争对手的成功之道。从整体来看,Ahrefs博客对在线出版商而言可能最为实用,尤其对于那些喜欢以数据驱动方式进行营销的人来说,它本身就极具价值。. 358. AngelList AngelList这个名字起得巧妙,它基本上融合了Craigslist和LinkedIn的功能,致力于将投资者、求职者和初创公司聚集在一个平台上。除了这个有趣的网站理念,它还为有进取心的记者提供了大量机会,让他们能够在热门初创公司和最新投资趋势成为主流之前就发现它们。凭借其简洁明了的界面和强大的商业导向,该网站对专业人士来说用途广泛。. 359. 已收购 在几乎所有行业,企业并购都能在一夜之间彻底改变整个行业格局。Acquired 网站致力于在科技行业发生并购事件时,及时向公众发布相关信息。该网站提供丰富的统计数据,并具备强大的搜索筛选功能,对于撰写科技新闻的记者而言,将 Acquired 作为日常网络浏览的重要参考资料,无疑是最佳选择。. 360. Mattermark Mattermark 是一项付费服务,它通过生成高质量的客户名单,将公司及其关键员工的信息都考虑在内,从而简化了公司决策者的工作。Mattermark 提供全面的公司简介、灵活的 API,甚至还支持导出功能以便于更新,可谓面面俱到。希望更精准地进行客户拓展并追踪营销活动效果的企业,注册使用 Mattermark 将获益匪浅。. 361. 金融科技初创公司 FintechStartupsCo 是一个聚合平台,追踪不同公司在 IPO 中筹集的资金数额。它采用极简设计,在“初创公司”和“新闻”标签之间切换,方便记者快速掌握最新的融资动态。同时,对于那些寻求快速发布内容和简讯的出版商来说,FintechStartupsCo 也值得一看。. 362. Datafox 如果公司名称还不够直白的话,DataFox 是一家致力于为企业客户提供所需信息的公司,旨在帮助他们最大限度地利用客户关系管理系统 (CRM),并做出数据驱动的决策。该公司提供的服务包括会议和公司情报、应用程序接口 (API) 以及公司信号,对于正在改进销售和推广工作的企业而言,它实际上是一个一站式服务平台。数字出版商和内容提供商或许也想了解一下。. 363. 开放发送 OpenSpending 是一个免费平台,几乎可以在世界任何地方访问,用户可以在上面搜索和查看公开的财务数据。对于非技术用户来说,这是一个强大的可视化和分析工具。特别是记者,可以利用 OpenSpending 发现有趣的新见解,并根据该公司在其网站上提供的建议,挖掘新闻报道角度。此外,记者也是该平台论坛特别需要的职业之一。. 364. ESPN体育API ESPN不仅满足于成为有线电视上最受欢迎的体育频道,更将其影响力拓展至代码和API领域。在其开发者中心,ESPN为出版商提供了一系列API,涵盖研究报告、实力排名、选秀预测、赛程安排和新闻标题等内容。甚至还有一个API可以加载所有主要体育项目的运动员资料、传记和统计数据。对于准备撰写体育报道的记者来说,浏览这些API无疑大有裨益。. 365. 体育参考 对于喜欢在一个平台上查找高级统计数据和资源的体育爱好者来说,Sports Reference 是网络上最好的网站之一。该网站提供包括球队和球员进攻及防守统计数据在内的历史数据,体育研究人员可以根据需要进行广泛或深入的研究。此外,它几乎涵盖了所有主流体育项目的数据,从篮球到棒球,甚至还包括不同大学体育项目的单独数据。. 366. 百万首歌曲数据集 这个名为“百万歌曲合集”的项目名副其实,它包含了整整28个数据集,涵盖了一百万首歌曲的音频特征元数据和信息。这些信息主要由哥伦比亚大学的LabROSA实验室与Echo Nest合作完成,并托管在亚马逊的AWS云平台上,用户可以通过Infochimps进行搜索,这使得记者和内容发布者能够更方便地获取这些信息,尤其是那些想要挖掘冷门知识的记者。.




