订阅人工智能洞察
- 热门出版科技资源
- 出版科技和广告科技工具评测
- 有价值的出版科技策略
正在发生什么:
2019年3月, 新苏黎世报 (NZZ)面向公众推出了一项新的文本转语音服务,这是其去年10月发布的测试版音频播放器的改进版本。该公司分享了在此过程中汲取的一些关键经验教训。.
深入挖掘:
Google Wavenet 不足以满足瑞士德语的需求
NZZ 使用 Google WaveNet 生成音频文件。虽然这项技术在语言处理方面表现出色(目前可以自然流畅地播放九种语言),但对于瑞士德语的复杂性而言,它还不够强大。为了解决这个问题,NZZ 为中间件配备了一个词典,用于在将单词转换为音频之前对其进行处理。.
建筑设计必须具有混搭兼容性
在瞬息万变的行业环境中,工具、需求和产品都在不断变化,NZZ 需要构建一种能够轻松适应不断变化的环境的服务。通过构建一种可灵活组合的架构,他们能够在短时间内将服务从 Amazon Polly 迁移到 Google Wavenet,并显著提升了服务性能。.
音频并非人人都能接受
有些人喜欢听音频,有些人则完全不喜欢。NZZ邀请这两类用户分别评估不同的文本转语音引擎以及真人朗读的文本。不出所料,两组用户都对自然人声的评价最高。然而,除了用户喜欢或不喜欢音频之外,这一发现本身意义不大,人声的有无似乎对用户的使用体验并没有显著影响。.
将文字作品转化为优质音频的技巧
音频内容的悦耳度至关重要,因此《新苏黎世报》不得不采用不同的布局,才能将文章转换成高质量的MP3格式。这需要仔细研究用户希望如何收听文章,并以此为基础设计音频模板。.
不同的玩家体验会带来挑战
NZZ希望将其音频功能推广到所有产品和所有平台(台式机、平板电脑和应用程序)。这意味着需要设计和开发多种不同的播放器版本,以适应不同播放器的技术要求。.
结论:
打造一款优秀的文本转语音音频服务需要考虑诸多因素,在构建、测试和 beta 阶段必须充分考虑这些因素,才能成功推出高质量的音频内容产品。.