SODP logo

    Lima perkara yang dipelajari oleh Neue Zürcher Zeitung semasa membina perkhidmatan teks-ke-pertuturan

    Apa yang Berlaku: Pada Mac 2019, Neue Zürcher Zeitung (NZZ) melancarkan perkhidmatan teks-ke-pertuturan baharu kepada orang ramai, sebagai versi pemain audio beta yang dipertingkatkan yang dikeluarkan Oktober lalu.…
    Dikemas kini Pada: 1 Disember 2025
    Shelley Seale

    Dicipta Oleh

    Shelley Seale

    Vahe Arabian

    Fakta Disemak Oleh

    Vahe Arabian

    Vahe Arabian

    Disunting Oleh

    Vahe Arabian

    Apa yang Berlaku:

    Pada Mac 2019, Neue Zürcher Zeitung (NZZ) melancarkan perkhidmatan teks-ke-ucapan baharu kepada orang ramai, sebagai versi pemain audio beta yang dipertingkatkan yang dikeluarkan Oktober lalu. Syarikat itu berkongsi beberapa pengajaran penting yang dipelajari semasa proses tersebut.

    Menggali Lebih Dalam:

    Google Wavenet tidak mencukupi untuk bahasa Jerman Switzerland

    NZZ menggunakan Google Wavenet untuk menjana fail audionya, dan walaupun teknologi ini berbakat dalam bahasa (kini bertutur sembilan dengan bunyi yang berkualiti semula jadi), ia tidak cukup mantap untuk kerumitan bahasa Jerman Switzerland. Untuk menyelesaikan masalah tersebut, NZZ melengkapkan perisian tengah dengan leksikon untuk mengalirkan perkataan sebelum ditukar menjadi audio.

    Seni bina mestilah mesra campuran dan padan

    Dalam industri yang sentiasa berubah dengan alatan, keperluan dan produk yang sentiasa berubah, NZZ perlu membina perkhidmatan yang mudah disesuaikan dengan keadaan yang berubah-ubah. Dengan membina seni bina campuran dan padanan, mereka dapat memindahkan perkhidmatan daripada Amazon Polly kepada Google Wavenet dalam masa yang singkat, dan bertambah baik secara mendadak.

    Audio bukan untuk semua orang

    Sesetengah orang suka audio, tetapi yang lain pula tidak. NZZ meminta kedua-dua jenis pengguna untuk menilai enjin teks-ke-ucapan yang berbeza bersama-sama dengan teks yang dibaca oleh manusia sebenar. Kedua-dua kumpulan (tidak menghairankan) menilai suara manusia semula jadi sebagai yang tertinggi. Walau bagaimanapun, pandangan itu tidak begitu relevan selain fakta bahawa pengguna sama ada menyukai audio atau tidak, dan suara manusia atau ketiadaannya nampaknya tidak mempunyai pengaruh penting terhadap penggunaan.

    Teknik untuk menghasilkan karya bertulis menjadi audio yang baik

    Adalah penting bahawa kandungan audio menyenangkan untuk didengari, dan NZZ terpaksa menggunakan susun atur yang berbeza untuk mengubah artikelnya kepada format MP3 yang berkualiti. Ini melibatkan penelitian yang teliti tentang bagaimana pengguna ingin artikel dibacakan kepada mereka, yang akan membentuk templat audio mereka.

    Pengalaman pemain yang berbeza memberikan cabaran

    NZZ ingin memperkenalkan audionya merentasi semua produk dan pada semua platform (desktop, tablet dan aplikasi). Ini bermakna mereka bentuk dan membangunkan pelbagai varian pemain untuk menampung pertimbangan teknologi dalam pemain yang berbeza.

    Intinya:

    Banyak pembolehubah diperlukan untuk menghasilkan perkhidmatan audio teks-ke-pertuturan yang baik dan mesti dipertimbangkan sepenuhnya semasa pembinaan, pengujian dan beta untuk melancarkan produk kandungan audio yang berkualiti dengan jayanya.