Ce qui se passe:
En mars 2019, Neue Zürcher Zeitung NZZ a lancé un nouveau service de synthèse vocale, version améliorée de son lecteur audio bêta sorti en octobre dernier. L'entreprise a partagé les principaux enseignements tirés de cette expérience.Creuser plus profond:
Google Wavenet ne suffit pas pour la langue suisse alémanique
NZZ utilisait Google Wavenet pour générer ses fichiers audio. Bien que cette technologie soit performante pour les langues (elle en maîtrise actuellement neuf avec un son naturel), elle s'avérait insuffisante pour gérer la complexité du suisse allemand. Pour pallier ce problème, NZZ a intégré un logiciel intermédiaire doté d'un lexique afin de traiter les mots avant leur conversion en audio.L'architecture doit être facile à combiner
Dans un secteur en constante évolution, marqué par des outils, des besoins et des produits changeants, NZZ devait concevoir un service facilement adaptable. Grâce à une architecture modulaire, l'entreprise a pu migrer rapidement le service d'Amazon Polly vers Google Wavenet, avec des résultats nettement supérieurs.L'audio n'est pas pour tout le monde
Certaines personnes apprécient l'audio, tandis que d'autres le détestent. NZZ a demandé à ces deux types d'utilisateurs d'évaluer différents moteurs de synthèse vocale, ainsi que des textes lus par une voix humaine. Sans surprise, les deux groupes ont attribué la meilleure note à la voix humaine naturelle. Cependant, cette observation n'était pas vraiment pertinente, car les utilisateurs apprécient ou non l'audio ; la présence ou l'absence d'une voix humaine ne semblait pas avoir d'influence significative sur leur utilisation.Techniques pour transformer un texte en un bon son
Il est important que le contenu audio soit agréable à écouter, et NZZ a dû adapter sa mise en page pour convertir ses articles en MP3 de qualité. Cela a nécessité une analyse approfondie des préférences des utilisateurs quant à la lecture d'un article, afin d'orienter la conception des modèles audio.Les différentes expériences des joueurs représentent un défi
NZZ souhaitait proposer son contenu audio sur tous ses produits et toutes les plateformes (ordinateurs, tablettes et applications). Cela impliquait la conception et le développement de nombreuses variantes de lecteurs afin de s'adapter aux spécificités techniques de chaque appareil.L’essentiel :
De nombreuses variables entrent en jeu dans la création d'un bon service audio de synthèse vocale et doivent être pleinement prises en compte lors de la conception, des tests et de la phase bêta afin de réussir le lancement d'un produit de contenu audio de qualité.Contenu de nos partenaires








