Přejít k obsahu


Designing High-Coverage Multi-level Text Corpus for Non-professional-voice Conservation

Citace:
JŮZOVÁ, M., TIHELKA, D., MATOUŠEK, J. Designing High-Coverage Multi-level Text Corpus for Non-professional-voice Conservation. In Speech and Computer 18th International Conference, SPECOM 2016, Budapest, Hungary, August 23-27, 2016, Proceedings. Heidelberg: Springer, 2016. s. 207-215. ISBN: 978-3-319-43957-0 , ISSN: 0302-9743
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Designing High-Coverage Multi-level Text Corpus for Non-professional-voice Conservation
Rok vydání: 2016
Místo konání: Heidelberg
Název zdroje: Springer
Autoři: Ing. Markéta Jůzová , Ing. Daniel Tihelka Ph.D. , Doc. Ing. Jindřich Matoušek Ph.D. ,
Abstrakt CZ: Článek je zaměřen na vytvoření textového korpusu vhodného pro konzervaci hlasu lidí, kteří mohou z důvodů vážných zdravotních problémů přijít o hlas. Vzhledem k tomu, že předem nevíme jak velkou část textového korpusu budou takovíto lidé schopni nahrát, navrhujeme pro výběr textů víceúrovňové použité hladového algoritmu, což zajistí požadované pokrytí zvolenými fonetickými a prozodickými jednotkami na jednotlivých úrovních. V článku také porovnáváme pokrytí korpusů různých velikostí s pokrytím obecného korpusu navrženého k nahrávání zdravým profesionálním řečníkem k použití v systému syntézy řeči z textu.
Abstrakt EN: The paper focuses on building a text corpus suitable for the conservation of the voices of non-professional speakers, who are loosing their voices due to serious healthy problems. Since we do not know in advance, how many sentences a speaker will be able to record, we propose a multi-level greedy algorithm which can ensure the coverage of selected texts by various phonetic and prosodic units. The comparison of such coverage is presented for various corpus sizes, and compared to the generic TTS corpus recorded by a healthy professional speaker.
Klíčová slova

Zpět

Patička