SODP logo

    Cinq leçons tirées de la création d'un service de synthèse vocale selon la Neue Zürcher Zeitung

    Actualités : En mars 2019, la Neue Zürcher Zeitung (NZZ) a lancé un nouveau service de synthèse vocale, version améliorée de son lecteur audio bêta sorti en octobre dernier
    Mise à jour : 1er décembre 2025
    Shelley Seale

    Créé par

    Shelley Seale

    Vahe Arabian

    Vérifié par

    Vahe Arabian

    Vahe Arabian

    Édité par

    Vahe Arabian

    Ce qui se passe:

    En mars 2019, Neue Zürcher Zeitung NZZ a lancé un nouveau service de synthèse vocale, version améliorée de son lecteur audio bêta sorti en octobre dernier. L'entreprise a partagé les principaux enseignements tirés de cette expérience.

    Creuser plus profond:

    Google Wavenet ne suffit pas pour la langue suisse alémanique

    NZZ utilisait Google Wavenet pour générer ses fichiers audio. Bien que cette technologie soit performante pour les langues (elle en maîtrise actuellement neuf avec un son naturel), elle s'avérait insuffisante pour gérer la complexité du suisse allemand. Pour pallier ce problème, NZZ a intégré un logiciel intermédiaire doté d'un lexique afin de traiter les mots avant leur conversion en audio.

    L'architecture doit être facile à combiner

    Dans un secteur en constante évolution, marqué par des outils, des besoins et des produits changeants, NZZ devait concevoir un service facilement adaptable. Grâce à une architecture modulaire, l'entreprise a pu migrer rapidement le service d'Amazon Polly vers Google Wavenet, avec des résultats nettement supérieurs.

    L'audio n'est pas pour tout le monde

    Certaines personnes apprécient l'audio, tandis que d'autres le détestent. NZZ a demandé à ces deux types d'utilisateurs d'évaluer différents moteurs de synthèse vocale, ainsi que des textes lus par une voix humaine. Sans surprise, les deux groupes ont attribué la meilleure note à la voix humaine naturelle. Cependant, cette observation n'était pas vraiment pertinente, car les utilisateurs apprécient ou non l'audio ; la présence ou l'absence d'une voix humaine ne semblait pas avoir d'influence significative sur leur utilisation.

    Techniques pour transformer un texte en un bon son

    Il est important que le contenu audio soit agréable à écouter, et NZZ a dû adapter sa mise en page pour convertir ses articles en MP3 de qualité. Cela a nécessité une analyse approfondie des préférences des utilisateurs quant à la lecture d'un article, afin d'orienter la conception des modèles audio.

    Les différentes expériences des joueurs représentent un défi

    NZZ souhaitait proposer son contenu audio sur tous ses produits et toutes les plateformes (ordinateurs, tablettes et applications). Cela impliquait la conception et le développement de nombreuses variantes de lecteurs afin de s'adapter aux spécificités techniques de chaque appareil.

    L’essentiel :

    De nombreuses variables entrent en jeu dans la création d'un bon service audio de synthèse vocale et doivent être pleinement prises en compte lors de la conception, des tests et de la phase bêta afin de réussir le lancement d'un produit de contenu audio de qualité.