Přejít k obsahu


Minimum Text Corpus Selection for Limited Domain Speech Synthesis

Citace:
JŮZOVÁ, M., TIHELKA, D. Minimum Text Corpus Selection for Limited Domain Speech Synthesis. In Text, Speech, and Dialogue, 17th International Conference, TSD 2014, Brno, Czech Republic, September 8-12, 2014. Proceedings. Heidelberg: Springer, 2014. s. 398-407. ISBN: 978-3-319-10815-5 , ISSN: 0302-9743
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Minimum Text Corpus Selection for Limited Domain Speech Synthesis
Rok vydání: 2014
Místo konání: Heidelberg
Název zdroje: Springer
Autoři: Ing. Markéta Jůzová , Ing. Daniel Tihelka Ph.D.
Abstrakt CZ: Článek se zabývá systémem syntézy řeči z limitované oblasti používajícím konkatenační metodu a prezentuje algoritmus schopný extrahovat minimální doménově orientovaný textový korpus z reálných dat dané oblasti a zachovat při tom její maximální pokrytí. Navrhovaný přístup zaručuje, aby bylo vybráno co nejméně textu obsahujícího všechny časté fráze a (pokud je to možné) všechna slova z dané domény. Součastně zajišťuje překrývání frází, čímž umožňuje nalezení vhodného místa řetězení v překryvech a dosažení syntetizované řeči vysoké kvality. Dále jsou prezentována a diskutována doporučení týkající se nahrávaní korpusu. Vytváření korpusu je testováno a vyhodnoceno na několika různých doménách a autoři prezentují výsledky algoritmu a poukazují na výhody použití doménově orientovaného korpusu pro účely syntézy řeči.
Abstrakt EN: This paper concerns limited domain TTS system based on the concatenative method, and presents an algorithm capable to extract the minimal domain-oriented text corpus from the real data of the given domain, while still reaching the maximum coverage of the domain. The proposed approach ensures that the least amount of texts are extracted, containing the most common phrases and (possibly) all the words from the domain. At the same time, it ensures that appropriate phrase overlapping is kept, allowing to find smooth concatenation in the overlapped regions to reach high quality synthesized speech. In addition, several recommendations allowing a speaker to record the corpus more fluently and comfortably are presented and discussed. The corpus building is tested and evaluated on several domains differing in size and nature, and the authors present the results of the algorithm and demonstrate the advantages of using the domain oriented corpus for speech synthesis.
Klíčová slova

Zpět

Patička