Cosa sta succedendo:
Nel marzo 2019, Neue Zürcher Zeitung (NZZ) ha lanciato al pubblico un nuovo servizio di sintesi vocale, una versione migliorata del suo lettore audio beta rilasciato lo scorso ottobre. L'azienda ha condiviso alcuni dei principali insegnamenti appresi durante il processo.Scavando più a fondo:
Google Wavenet non è sufficiente per la lingua svizzero-tedesca
NZZ ha utilizzato Google Wavenet per generare i suoi file audio e, sebbene la tecnologia sia adatta alle lingue (attualmente ne parla nove con un suono di qualità naturale), non era sufficientemente robusta per le complessità del tedesco svizzero. Per risolvere il problema, NZZ ha dotato un middleware di un lessico per far scorrere le parole prima di convertirle in audio.L'architettura deve essere adattabile a qualsiasi stile
In un settore in continua evoluzione, con strumenti, esigenze e prodotti in continua evoluzione, NZZ aveva bisogno di creare un servizio che potesse essere facilmente adattato alle circostanze. Grazie a un'architettura "mix-and-match", è riuscita a trasferire il servizio da Amazon Polly a Google Wavenet in tempi rapidi, con un notevole miglioramento.L'audio non è per tutti
Alcune persone amano l'audio, altre semplicemente no. NZZ ha chiesto a entrambi i tipi di utenti di valutare diversi motori di sintesi vocale insieme a un testo letto da una persona. Entrambi i gruppi (come prevedibile) hanno valutato la voce umana naturale come la più alta. Tuttavia, questa intuizione non era realmente rilevante, a parte il fatto che gli utenti apprezzavano o meno l'audio, e la voce umana o la sua assenza non sembrava avere un'influenza significativa sull'utilizzo.Tecniche per trasformare un pezzo scritto in un buon audio
È importante che i contenuti audio siano piacevoli da ascoltare, e NZZ ha dovuto utilizzare un layout diverso per trasformare i suoi articoli in un formato MP3 di qualità. Per farlo, ha analizzato attentamente il modo in cui gli utenti desideravano che un articolo venisse letto, e questo ha influenzato i modelli audio.Le diverse esperienze dei giocatori rappresentano una sfida
NZZ voleva estendere il suo sistema audio a tutti i prodotti e su tutte le piattaforme (desktop, tablet e app). Ciò ha significato progettare e sviluppare diverse varianti di player per soddisfare le esigenze tecnologiche dei diversi dispositivi.La conclusione:
Per creare un buon servizio audio text-to-speech sono necessarie numerose variabili, che devono essere attentamente considerate durante la fase di sviluppo, test e beta, per lanciare con successo un prodotto di contenuti audio di qualità.Contenuti dei nostri partner








