Přejít k obsahu


Analysis of Facial Motion Capture Data for Visual Speech Synthesis

Citace:
ŽELEZNÝ, M., KRŇOUL, Z., JEDLIČKA, P. Analysis of Facial Motion Capture Data for Visual Speech Synthesis. In Speech and Computer, 17th International Conference, SPECOM 2015, Athens, Greece, September 20-24,2015, Proceedings. Heidelberg: Springer, 2015. s. 81-88. ISBN: 978-3-319-23131-0 , ISSN: 0302-9743
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Analysis of Facial Motion Capture Data for Visual Speech Synthesis
Rok vydání: 2015
Místo konání: Heidelberg
Název zdroje: Springer
Autoři: Doc. Ing. Miloš Železný Ph.D. , Ing. Zdeněk Krňoul Ph.D. , Ing. Pavel Jedlička ,
Abstrakt CZ: Článek se zabývá interpretací dat záznamu pohybu obličeje pro vizuální syntézu řeči. Pro účel analýzy byly zaznamenány promluvy vizuální řeči sestávající ze 170 uměle vytvořených slov, a to jedním řečníkem a pomocí aktuální metody záznamu pohybu. Byla navržena nová nelineární metoda aproximace dat záznamu pohybu používající cíleně definované sady artikulačních parametrů. Výsledky porovnání ukazují, že předložená metoda překonává základní metodu se stejným počtem parametrů. Přesnost aproximace je vyhodnocena pomocí hosnot parametrů extrahovaných z nenepozorovaných dat a také byla ověřena pomocí animovaného 3D modelu lidské hlavy jako výstupu reprodukujícího vizuální řeč umělým způsobem.
Abstrakt EN: The paper deals with interpretation of facial motion capture data for visual speech synthesis. For the purpose of analysis visual speech composed of 170 artificially created words was recorded by one speaker and the state-of-the-art face motion capture method. New nonlinear method is proposed to approximate the motion capture data using inten- tionally defined set of articulatory parameters. The result of the compar- ison shows that the proposed method outperforms baseline method with the same number of parameters. The precision of the approximation is evaluated by the parameter values extracted from unseen dataset and also verified with the 3D animated model of human head as the output reproducing visual speech in an artificial manner.
Klíčová slova

Zpět

Patička