人工智能在出版业中的作用

人工智能（AI）在出版业的应用已稳步发展十余年，一些主流媒体已开始采用自动化系统制作内容。最初，这些自动化系统主要用于天气预报、体育赛事回顾和财经报道，但如今其应用范围已扩展到更广泛的创意任务。

到了2020年代，研究重点主要转向了能够处理和模拟人类语言的生成式人工智能。这主要归功于先进的机器学习模型能够识别非结构化数据集中的模式。这些模型可以分析数百万张图像、书籍和文章，并根据特定的输入参数生成原创且极其接近人类语言的文字内容。.

ChatGPT于2022年11月发布，极大地提升了公众对人工智能技术的兴趣，也引发了媒体从业人员对被机器人取代的担忧。其用户友好的聊天机器人界面让更多人得以探索自然语言处理（NLP）技术，而其内容的整体质量也促使《自然》出版集团和 PNAS Journals 重新审视其编辑政策。

ChatGPT以空前的速度获得了1亿用户，使其开发商OpenAI的收入飙升至10亿美元以上。这一突破性的成功刺激了对人工智能公司的风险投资， 2023年上半年投资额达到400亿美元，并促使企业探索人工智能在各个行业的应用潜力。

全球媒体和娱乐行业的AI市场预计将从2023年的161亿美元增长到2030年的856亿美元。（数据来源： Research and Markets）

可用于模型训练的计算资源日益增长，高级自然语言处理聊天机器人尚未充分发挥其潜力。然而，人工智能对出版业的影响已堪比互联网的出现。

WAN-IFRA 对新闻出版商的一项调查显示，到 2023 年 5 月，约有一半的出版商正在积极使用 ChatGPT 或类似工具，其中 70% 的出版商预计这些工具将有助于记者。来源： WAN-IFRA

新技术改变了出版业的格局，给作家带来了挑战和机遇，也为内容提供商带来了新的机遇。数据驱动的模式要求企业拥抱这些变革，因此，熟练掌握人工智能工具对于记者和编辑保住饭碗至关重要。.

什么是生成式人工智能？

生成式人工智能（AI）是一种机器学习模型，能够生成包括文本、图像、音乐、动画或代码在内的新内容。这类模型使用自监督学习模式，从而能够模仿人类创作者的行为。

长期以来，人工智能主要围绕数据解读发展，包括训练机器学习算法来理解图像内容。然而，当研究人员将研究方向从图像识别转向图像生成时，这项新技术才真正引起广泛关注。2021年1月， OpenAI发布了DALL-E——一个可以将用户文本描述转换为插图的模型。

《经济学人》杂志的封面是由另一款艺术生成器 Midjourney 制作的，该生成器自 2022 年推出以来便广受欢迎。来源： 《经济学人》

大型语言模型处理输入。LLM 的灵感来源于人脑，它将单词和词组视为多维地图上的节点。LLM 致力于确定这些节点之间的距离，从而预测特定序列中最有可能出现的下一个词。随着数据量的增加，LLM 可以生成更复杂的文案或创建与主题相关的视觉内容。

微软已确认其 Bing 聊天机器人基于 OpenAI 的 GPT-4 LLM 模型运行，ChatGPT 订阅用户也可使用该模型。非订阅用户仍可免费使用 GPT-3.5 模型。这两项服务提供不同的用户体验，而谷歌的 Bard 则采用不同的模型。

这些高级聊天机器人的功能远不止生成文本。它们改变了我们与搜索引擎的互动方式，使查询和搜索结果更具对话性。谷歌声称，其搜索生成体验 (SGE)，该体验可通过美国和英国的谷歌实验室获取。

上图展示了 SGE 如何组织搜索结果页面，以帮助用户从一次搜索中获得更多信息。来源： Google Labs

SGE 提供主题概述，并提供相关资源链接以供深入探索。它能帮助读者了解特定出版物将解答哪些问题。.

这些简明摘要和汇总简化了用户的浏览体验。然而，它们也引发了内容创作者：是否应该允许搜索引擎使用他们的内容进行训练？

最终，搜索引擎和聊天机器人可以利用人类创建的信息来帮助用户，而无需将读者引导至其来源页面。.

人工智能目前应用于哪些领域？

人工智能 (AI) 算法在出版业中得到广泛应用，从塑造新闻传播到定制付费墙用户的体验流程。

例如，路透社早在2016年就使用其新闻追踪工具（News Tracer）自动识别和验证推特上的突发新闻。最初，人工智能旨在自动化流程，帮助出版商专注于内容创作。.

《纽约时报》早在2015年就尝试过人工智能驱动的界面，实现了日常标签和注释工作的自动化。来源： NYTLabs

《纽约时报》也率先运用预测性分析来管理其付费墙。 “动态计量器”通过学习订阅用户与内容的互动方式，来决定非注册用户可以免费阅读多少篇文章。

人工智能的新功能拓展了其应用范围，使其涵盖内容创作和管理。.

根据 JournalismAI 的全球调查，90% 的新闻编辑室在内容制作的不同阶段都会使用人工智能。来源： JournalismAI

趋势和主题检测

诸如Google Trends或 CrowdTangle 之类的监测服务可以帮助发布商识别特定地区或人群的热门话题。此外，人工智能工具可以辅助头脑风暴，其提供的建议可以作为进一步讨论的起点。

2023年6月，科学家们发布了AngleKindling，这是一款基于GPT-3的工具，旨在帮助记者解读新闻稿。来源： Github （PDF下载）

转录和翻译

长期以来，转录采访和讨论一直是记者最不喜欢的环节之一。然而，像Otter 、 Sembly和Airgram可以生成笔记和摘要，让内容创作者能够专注于更有价值的任务。

这些服务支持的语言数量有限，但丹麦数字报纸Zetland Good Tape平台，能够转录 90 多种语言的音频。

不同语言的自动翻译发展也不均衡，但其主要功能是尽可能减少信息错误或冒犯的风险来传达信息。.

2022年，芬兰公共广播公司Yle为乌克兰难民推出了一项服务，提供经母语人士校对的自动翻译报道。疫情期间，Yle已开始提供索马里语、阿拉伯语、库尔德语和波斯语的信息。

写作与编辑

大型语言模型 (LLM) 可以检查语法并提供简洁的内容摘要，创建通知，针对新闻通讯或社交媒体平台进行定制，并将书面文本转换为播客或视频的脚本。.

ChatGPT、Bing、 Claude和其他基于机器学习 (LLM) 的服务可以提供引人入胜的标题列表。虽然这些标题仍需验证，但机器学习算法简化了内容制作流程并提高了速度。

AuthorityHacker 对 3812 位数字营销人员进行的一项调查发现，85.1% 的人工智能用户将其用于撰写文章或博客。来源： AuthorityHacker

2023年7月，澳大利亚新闻集团透露，人工智能技术使四名员工每周能够制作3000篇本地新闻文章。这使得本地新闻媒体的订阅量占所有订阅量的55%。

然而，新闻集团后来澄清说，自动化主要涉及模板化信息，例如燃油价格更新或每日法院名单，所有文章都由人工团队审核。

创建视觉效果

诸如 Midjourney、DALL-E 或 Stable Diffusion 之类的神经网络能够帮助作者和编辑为他们的文章和帖子制作插图。在添加其他品牌叠加层之前，创建、选择和编辑本文的基础封面图片大约花了七分钟。.

创建一张独一无二的图片需要每月支付 8 美元的订阅费，考虑到独一无二的图片更有可能在谷歌图片搜索中获得排名，。

这是使用 Midjourney 专门为本文创作的另一张图片。

内容分发

人工智能帮助出版商细分客户群体，并确定向特定读者群体推送相关内容的最佳渠道、格式和时间。许多网站会根据访客的人口统计特征和过往行为来定制首页。.

内容个性化包括自动文章翻译、动态电子邮件营销活动或针对不同社交媒体平台定制现有内容。.

社交媒体专用工具，例如 WordStream 或 Emplifi，提供智能日程安排、广告活动优化、高级跟踪和受众洞察。.

人工智能在出版业中的益处

人工智能 (AI) 为出版社、媒体机构和记者个人提供了节省时间和金钱的机会，使他们能够加快日常运营速度并做出更明智的决策。它还能帮助出版商加强与读者的联系，吸引新的读者群体，并提升内容质量。.

成本效益

人工智能可以通过简化重复性的人工任务和减轻员工的工作量，显著降低出版商的运营成本。机器学习算法能够提供可操作的洞察，帮助他们优化内容和营销策略，而无需承担高昂的市场调研成本。结合现有的内容创作工具，人工智能还能让规模较小的团队实现更大规模的运营。.

先进的受众定向技术、快速且低成本的图像生成以及Grammarly等写作和编辑辅助工具，为数字出版带来了前所未有的机遇。更高的分发精准度使小众媒体无需大量广告投入即可与读者建立联系。随着出版商效率的提升，他们能够报道更广泛的事件。.

研究协助和事实核查

人工智能可以帮助记者浏览大量文本，识别相关新闻故事以及事实、事件、实体和人物之间隐藏的联系。.

new/s/leak是一款免费工具，旨在筛选维基解密发布的信息。另一个利用人工智能调查新闻报道的项目是伦敦大学的DMINR 。

人工智能通过将新发布的信息与可靠来源的数据集进行比较，或者追踪图像自搜索引擎首次检测到以来的历史，来帮助区分事实和虚假信息。.

一张截图证实，洛杉矶 SoFi 体育场的“机器人”实际上是为电影《造物主》做宣传的演员。.

一张截图证实，洛杉矶SoFi体育场的“机器人”实际上是为电影《造物主》（The Creator）做宣传的演员。来源：路透社、事实核查探索器

内容个性化

尽管存在隐私方面的担忧，但消费者对个性化体验的需求仍在持续增长。一项调查显示，这种需求可能会促使超过半数的消费者成为回头客（PDF下载） ，同比增长7%。

人工智能工具使媒体机构能够定制内容，实现精准分发。2020年，《华盛顿邮报》推出了由人工智能驱动的音频选举动态，根据其政治播客听众的地理位置进行个性化推送。

为媒体公司定制的高级聊天机器人截图。来源： Techcrunch

生成式人工智能为出版商提供了与读者进行个性化互动的机会，现在他们还可以将现有模型集成到客户支持服务中。.

2023年2月， Instagram联合创始人推出了Artifact ，这是一款个性化新闻应用，能够根据用户的偏好推荐可靠且经过事实核查的文章。此外，Artifact还允许用户选择阅读或收听，因为它采用了文本转语音技术，能够呈现自然流畅的语音。

一张截图显示，Artifact 用户可以收听由 Snoop Dogg 或 Gwyneth Paltrow 的声音朗读的报道和故事。来源： Medium

人工智能在出版业的成功案例

人工智能 (AI) 在出版业的应用案例不断增加，为提升效率创造了新的机遇。让我们一起来探讨一些现有的成功案例，以进一步了解这项技术如何重塑出版业。.

5个人工智能驱动的媒体项目

1. BuzzFeed

BuzzFeed 于 2023 年 1 月宣布，它正在试验 ChatGPT 来自动化其测验创建过程。.

就提升用户参与度而言，这项测试取得了成功。在人工智能生成的测验上花费的时间比在人工编辑创建的测验上多出 40%

BuzzFeed 专门开辟了一个页面来展示人工智能生成的测试题。来源： BuzzFeed

2 福布斯

这家财经新闻巨头推出了自主研发的发布平台 Bertie。这款人工智能驱动的内容管理系统 (CMS)根据新闻编辑室记者和撰稿人之前发表的文章，为他们提供热门话题列表。

此外，它还提供引人入胜的标题和相关的图片，尽管它并没有尝试撰写完整的文章。该系统上线后，《福布斯》的月访问量翻了一番

Bertie CMS 提供标题创意建议。来源：福布斯

3. 彭博社

彭博社推出了 BloombergGPT ，这是一个基于 500 亿个参数的特定领域语言模型。

该表显示了 BloombergGPT 在金融任务上如何优于规模相近的现有开源模型。.

该表格展示了彭博GPT在金融任务上如何超越现有规模相近的开源模型。来源： arXiv

4. 英国医学杂志

《英国医学杂志》（BMJ）测试了GPT-3生成引人入胜的圣诞主题研究文章标题的能力。有趣的是，受访者认为人工智能生成的标题至少与人类作者撰写的标题一样吸引人。

《英国医学杂志》（BMJ）刊登的这项测试旨在识别自动生成的标题。来源： 《英国医学杂志》（BMJ）

5.《环球邮报》

加拿大报纸《将其内容策划和分析平台Sophi Inc. 出售给了全球收益管理公司 Mather Economics。这款人工智能工具最初是为《环球邮报》的付费墙而设计的，但在过渡之后扩展到了其他领域。

人工智能解决方案实施面临的挑战

采用人工智能 (AI) 的组织常常面临资金和技术方面的限制。例如，规模较小的媒体可能缺乏资金来聘请合格的工程师。.

出版商还必须考虑人工智能应用不当可能造成的法律和声誉风险

超过40%的媒体管理者在人工智能集成项目中面临技术挑战，包括资金短缺。来源： JournalismAi

技术问题

尽管采用新技术有很多优势，但克服最初的学习曲线的挑战可能会让出版商望而却步。他们不仅需要获得编辑部的支持，还需要将新解决方案集成到现有系统中。此外，他们还担心会依赖于自己并不完全了解的事物。.

内容质量

生成的文案可能达不到预期，从而引发对出版商的严厉批评。此外，大型语言模型（LLM）往往会延续其训练数据集中的错误。

一个值得注意的问题是各种偏见的延续，这是人工智能的一个常见特征，研究也不断强调这一点。

伦理挑战

偏见构成了一个需要解决的伦理问题。另一个挑战是人工智能带来的工作风险，尤其对白领职位而言。人工智能的实施可能会引发员工的担忧，因此需要积极主动的内部沟通。.

法律风险

人工智能也引发了数据安全方面的担忧，因为它需要处理大量用户数据来生成个性化内容。此外，由于用户会输入敏感信息用于自动文本分析，企业也越来越担心数据泄露。.

此外，人工智能生成的内容在版权保护方面仍处于灰色地带，因为相关案件仍在司法系统中处理。.

出版商尚未准备好完全依赖人工智能生成的内容。来源： WAN-IFRA

其他风险包括过度自动化，以及由此导致的独特语调和人性化元素的丧失。但这直接引出了出版团队持续监督的必要性。.

最后想说的话

预计到 2026 年，90%的在线内容可能都是合成生成的。如果这一预测准确，人工智能 (AI) 将对整个出版和内容创作行业产生深远的影响。

报纸编辑、TikTok创作者、设计师、作家——创意领域的每个人都将以某种方式感受到这种规模化带来的影响。它将改变就业市场，凸显数据工程技能和技术知识对新闻工作者的重要性。.

随着人工智能技术的不断融合，出版商必须采取透明且符合伦理的策略，并组建专门的工作组。鉴于事实核查对于防范声誉风险至关重要，出版业的商业目标将与伦理价值观更加紧密地结合起来。.

即便如此，出版商如果想要保持竞争力，仍然需要利用人工智能来维持权威性、探索读者行为并触达更广泛的受众。.

SODP

SODP媒体

人工智能在出版业中的作用

创建者

事实核查

编辑

目录

作者： Vahe Arabian

什么是生成式人工智能？