Apa yang Berlaku:
Pada Mac 2019, Neue Zürcher Zeitung (NZZ) melancarkan perkhidmatan teks-ke-ucapan baharu kepada orang ramai, sebagai versi pemain audio beta yang dipertingkatkan yang dikeluarkan Oktober lalu. Syarikat itu berkongsi beberapa pengajaran penting yang dipelajari semasa proses tersebut.Menggali Lebih Dalam:
Google Wavenet tidak mencukupi untuk bahasa Jerman Switzerland
NZZ menggunakan Google Wavenet untuk menjana fail audionya, dan walaupun teknologi ini berbakat dalam bahasa (kini bertutur sembilan dengan bunyi yang berkualiti semula jadi), ia tidak cukup mantap untuk kerumitan bahasa Jerman Switzerland. Untuk menyelesaikan masalah tersebut, NZZ melengkapkan perisian tengah dengan leksikon untuk mengalirkan perkataan sebelum ditukar menjadi audio.Seni bina mestilah mesra campuran dan padan
Dalam industri yang sentiasa berubah dengan alatan, keperluan dan produk yang sentiasa berubah, NZZ perlu membina perkhidmatan yang mudah disesuaikan dengan keadaan yang berubah-ubah. Dengan membina seni bina campuran dan padanan, mereka dapat memindahkan perkhidmatan daripada Amazon Polly kepada Google Wavenet dalam masa yang singkat, dan bertambah baik secara mendadak.Audio bukan untuk semua orang
Sesetengah orang suka audio, tetapi yang lain pula tidak. NZZ meminta kedua-dua jenis pengguna untuk menilai enjin teks-ke-ucapan yang berbeza bersama-sama dengan teks yang dibaca oleh manusia sebenar. Kedua-dua kumpulan (tidak menghairankan) menilai suara manusia semula jadi sebagai yang tertinggi. Walau bagaimanapun, pandangan itu tidak begitu relevan selain fakta bahawa pengguna sama ada menyukai audio atau tidak, dan suara manusia atau ketiadaannya nampaknya tidak mempunyai pengaruh penting terhadap penggunaan.Teknik untuk menghasilkan karya bertulis menjadi audio yang baik
Adalah penting bahawa kandungan audio menyenangkan untuk didengari, dan NZZ terpaksa menggunakan susun atur yang berbeza untuk mengubah artikelnya kepada format MP3 yang berkualiti. Ini melibatkan penelitian yang teliti tentang bagaimana pengguna ingin artikel dibacakan kepada mereka, yang akan membentuk templat audio mereka.Pengalaman pemain yang berbeza memberikan cabaran
NZZ ingin memperkenalkan audionya merentasi semua produk dan pada semua platform (desktop, tablet dan aplikasi). Ini bermakna mereka bentuk dan membangunkan pelbagai varian pemain untuk menampung pertimbangan teknologi dalam pemain yang berbeza.Intinya:
Banyak pembolehubah diperlukan untuk menghasilkan perkhidmatan audio teks-ke-pertuturan yang baik dan mesti dipertimbangkan sepenuhnya semasa pembinaan, pengujian dan beta untuk melancarkan produk kandungan audio yang berkualiti dengan jayanya.Kandungan daripada rakan kongsi kami








