Přejít k obsahu


F0 Post-Stress Rise Trends Consideration in Unit Selection TTS

Citace:
JŮZOVÁ, M., VOLÍN, J. F0 Post-Stress Rise Trends Consideration in Unit Selection TTS. In Text, Speech, and Dialogue 21st International Conference, TSD 2018, Brno, Czech Republic, September 11-14, 2018, Proceedings. Cham: Springer Nature Switzerland AG, 2018. s. 360-368. ISBN: 978-3-030-00793-5 , ISSN: 0302-9743
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: F0 Post-Stress Rise Trends Consideration in Unit Selection TTS
Rok vydání: 2018
Místo konání: Cham
Název zdroje: Springer Nature Switzerland AG
Autoři: Ing. Markéta Jůzová , Jan Volín
Abstrakt CZ: V mluveném českém jazyce jsou první (s přízvukem) a druhé slabiky slov v lidské řeči obvykle charakterizovány zvýšením základní frekvence F0 (vyjma posledních přízvukových taktů ve frázích). V TTS systémech založených na výběru jednotek, kde není generován žádný průběh F0, je však chování F0 obvykle velmi vágní. Článek představuje experiment, kdy je tato metoda TTS upravena tak, aby sledovala trendy zvyšování základní frekvence v syntetizované řeči, aby byla dosažena vyšší přirozenosti a celkové kvalita syntézy řeči.
Abstrakt EN: In spoken Czech language, the stress and post-stress syllables in human speech are usually characterized by an increase in fundamental frequency F0 (except for phrase-final stress groups). In unit selection text-to-speech systems, where no contour of F0 is generated to be followed, however, the F0 behaviour is usually tended very vaguely. The paper presents an experiment of making the unit selection TTS to follow the trends of fundamental frequency rise in synthesized speech to achieve higher naturalness and overall quality of speech synthesis itself.
Klíčová slova

Zpět

Patička