Přejít k obsahu


Using Anomaly Detection for Fine Tuning of Formal Prosodic Structures in Speech Synthesis

Citace:
MATURA, M., JŮZOVÁ, M. Using Anomaly Detection for Fine Tuning of Formal Prosodic Structures in Speech Synthesis. In Text, Speech, and Dialogue, 21st International Conference, TSD 2018, Brno, Czech Republic, September 11-14, 2018, Proceedings. Heidelberg: Springer, 2018. s. 411-418. ISBN: 978-3-030-00793-5 , ISSN: 0302-9743
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Using Anomaly Detection for Fine Tuning of Formal Prosodic Structures in Speech Synthesis
Rok vydání: 2018
Místo konání: Heidelberg
Název zdroje: Springer
Autoři: Ing. Martin Matura , Ing. Markéta Jůzová ,
Abstrakt CZ: Základním požadavkem pro vysokou kvalitu řeči syntetizované pomocí dnešních TTS systémů je konzistentní prozódie. Tato předběžná studie se zabývá využitím detekce anomálií pomocí SVM k odhalení nekonzistencí v prozodickém popisu zvukových nahrávek. Tyto anomálie mohou totiž negativně ovlivnit kvalitu syntetické řeči, především při syntéze pomocí metody unit selection. K vyhodnocení výsledků detekce byly provedeny poslechové testy.
Abstrakt EN: Consistent prosody description of speech corpora is a fundamental requirement for a high quality speech synthesis generated by current TTS systems. In this preliminary study, we are using One-class SVM anomaly detection approach to predict formal prosodic structure outliers (a prosodic mismatch) in recorded utterances, that can negatively influence the overall quality of synthesized speech, especially in unit selection. To evaluate the outcome of our detection system, we performed a listening test with encouraging results.
Klíčová slova

Zpět

Patička