Přejít k obsahu


Current State of Text-to-Speech System ARTIC: A Decade of Research on the Field of Speech Technologies

Citace:
TIHELKA, D., HANZLÍČEK, Z., JŮZOVÁ, M., VÍT, J., MATOUŠEK, J., GRŮBER, M. Current State of Text-to-Speech System ARTIC: A Decade of Research on the Field of Speech Technologies. In Text, Speech, and Dialogue 21st International Conference, TSD 2018, Brno, Czech Republic, September 11-14, 2018, Proceedings. Cham: Springer Nature Switzerland AG, 2018. s. 369-378. ISBN: 978-3-030-00793-5 , ISSN: 0302-9743
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Current State of Text-to-Speech System ARTIC: A Decade of Research on the Field of Speech Technologies
Rok vydání: 2018
Místo konání: Cham
Název zdroje: Springer Nature Switzerland AG
Autoři: Ing. Daniel Tihelka Ph.D. , Ing. Zdeněk Hanzlíček Ph.D. , Ing. Markéta Jůzová , Ing. Jakub Vít , Doc. Ing. Jindřich Matoušek Ph.D. , Ing. Martin Grůber Ph.D.
Abstrakt CZ: Článek podává přehled o aktuálním stavu systému ARTIC - moderního českého konkatenačního a na korpusech založeného systému převodu textu na řeč. Během deseti let výzkumu a vývoje na poli řečových technologií a aplikací byl systém obohacen a další jazyky (a s tím souvisejícími na jazyce závislými NLP metodami), a schopnosti generování řeči tohoto systému byly významně vylepšeny návrhem a začleněním modulů s novými a progresivními metodami generování řeči (SPS, DNN, HSS). ARTIC se také musel vypořádat s různými požadavky kladenými na data z nichž se generuje řeč, od jejich velikosti a kvality, po omezení doménou výstupní řeči, přičemž zde byl stále požadavek na dosažení co nejvyšší kvality výstupu jak co do přirozenosti tak srozumitelnosti. Tento článek tedy sumarizuje některé z nejvýznamnějších počinů a nároků jimž musel systém čelit, což ilustruje univerzálnost a flexibilitu tohoto českého systému syntézy řeči.
Abstrakt EN: This paper provides a survey of the current state of ARTIC – the modern Czech concatenative corpus-based text-to-speech system. Through more than a decade of research & development in the field of speech technologies and applications, the system was enriched with new languages (and, as a consequence, language-dependent NLP methods), and its speech generation capabilities were significantly improved when new progressive speech generation modules (SPS, DNN, HSS) were (and are still being to) designed and incorporated into it. Also, ARTIC has to deal with various requirements on data used to generate speech from, ranging in size, quality and domain of the output speech, while there always was the requirement to achieve the highest quality in terms of both naturalness and intelligibility. Thus, the paper summarizes some of the most significant achievements and demanding tasks which had to be tackled by the system, illustrating the universality and flexibility of this Czech TTS system.
Klíčová slova

Zpět

Patička