Ano ang nangyayari:
Noong Marso 2019, Neue Zürcher Zeitung (NZZ) ay naglunsad ng isang bagong serbisyo ng text-to-speech sa publiko, bilang isang pinahusay na bersyon ng beta audio player nito na inilabas noong nakaraang Oktubre. Ibinahagi ng kumpanya ang ilan sa mga pangunahing aral na natutunan nito sa proseso.Paghuhukay ng Mas Malalim:
Hindi sapat ang Google Wavenet para sa wikang Swiss German
Ginamit ng NZZ ang Google Wavenet upang makabuo ng mga audio file nito, at bagama't mahusay ang teknolohiya sa mga wika (kasalukuyang nagsasalita ng siyam na may natural na kalidad ng tunog), hindi ito sapat na matatag para sa mga komplikasyon ng Swiss German. Upang malutas ang problema, nilagyan ng NZZ ang isang middleware ng isang leksikon upang dumaloy ang mga salita bago ito i-convert sa audio.Dapat na madaling pagsamahin ang arkitektura
Sa isang nagbabagong industriya na may nagbabagong mga kagamitan, pangangailangan, at produkto, kinailangan ng NZZ na bumuo ng isang serbisyo na madaling maiangkop sa nagbabagong mga sitwasyon. Sa pamamagitan ng pagbuo ng isang arkitekturang pinaghalong-bagay, nagawa nilang ilipat ang serbisyo mula sa Amazon Polly patungo sa Google Wavenet sa maikling panahon, na lubos na nagpabuti.Hindi para sa lahat ang audio
Mahilig ang ilang tao sa audio, ngunit ang iba naman ay ayaw talaga. Hiniling ng NZZ sa parehong uri ng user na suriin ang iba't ibang text-to-speech engine kasama ang tekstong binasa ng isang totoong tao. Hindi nakakagulat na parehong grupo ang nagbigay ng pinakamataas na rating sa natural na boses ng tao. Gayunpaman, ang pananaw na iyon ay hindi talaga mahalaga maliban sa katotohanang gusto ng mga user ang audio o hindi, at ang boses ng tao o ang kawalan nito ay tila walang mahalagang impluwensya sa paggamit.Mga pamamaraan para sa paggawa ng isang nakasulat na piraso tungo sa magandang audio
Mahalaga na ang nilalamang audio ay kaaya-ayang pakinggan, at kinailangan ng NZZ na gumamit ng ibang layout upang gawing de-kalidad na MP3 format ang mga artikulo nito. Kabilang dito ang masusing pagsusuri kung paano gustong basahin ng mga gumagamit ang isang artikulo para sa kanila, na siyang nakaimpluwensya sa kanilang mga template ng audio.Ang iba't ibang karanasan ng manlalaro ay nagdudulot ng hamon
Nais ng NZZ na ipakilala ang audio nito sa lahat ng produkto at sa lahat ng platform (desktop, tablet, at app). Nangangahulugan ito ng pagdidisenyo at pagbuo ng maraming iba't ibang variant ng player upang matugunan ang mga konsiderasyon sa teknolohiya sa iba't ibang player.Ang Bottom Line:
Maraming salik ang pumapasok sa paglikha ng isang mahusay na serbisyo ng text-to-speech audio at dapat itong lubusang isaalang-alang sa pagbuo, pagsubok, at beta upang matagumpay na mailunsad ang isang de-kalidad na produktong audio content.Nilalaman mula sa aming mga kasosyo








