Přejít k obsahu


Last Syllable Unit Penalization in Unit Selection TTS

Citace:
JŮZOVÁ, M., TIHELKA, D., SKARNITZL, R. Last Syllable Unit Penalization in Unit Selection TTS. In Text, Speech and Dialogue, 20th International Conference, TSD 2017, Prague, Czech Republic, August 27-31 August, 2017, Proceedings. Cham: Springer, 2017. s. 317-325. ISBN: 978-3-319-64205-5 , ISSN: 0302-9743
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Last Syllable Unit Penalization in Unit Selection TTS
Rok vydání: 2017
Místo konání: Cham
Název zdroje: Springer
Autoři: Ing. Markéta Jůzová , Ing. Daniel Tihelka Ph.D. , Radek Skarnitzl
Abstrakt CZ: Protože se v metodě syntézy řeči výběrem jednotek snažíme vyhnout úpravám řeči, je důležité umístění jednotek do správné pozice. Obvykle je tato pozice pevně spojena se vzdáleností od začátku/konce nějakých prozodických nebo rytmických jednotek, např. fráze nebo slova. Tento článek však ukazuje, že využijeme-li fonetickou znalost vnímání prozodických vzorů (v našem případě zpravidla trvání), není nutné požadavky na pozici sledovat. Konkrétně se soustředíme na efekty umisťování jednotek z konců slov do vnitřních (nefinálních) pozic ve slovech, což je v syntetické řeči často vnímáno negativně kvůli narušení lokálního časování.
Abstrakt EN: While unit selection speech synthesis tries to avoid speech modifications, it strongly depends on the placement of units into the correct position. Usually, the position is tightly coupled with a distance from the beginning/end of some prosodic or rhythmic units like phrases or words. The present paper shows, however, that it is not necessary to follow position requirements, when the phonetic knowledge of the perception of prosodic patterns (mostly durational in our case) is considered. In particular, we focus on the effects of using word-final units in word-internal positions in synthesized speech, which are often perceived negatively by listeners, due to disruptions in local timing.
Klíčová slova

Zpět

Patička