Přejít k obsahu


Databáze vět vhodných pro nahrávání pacientů s poškozením hlasu

Citace:
TIHELKA, D., JŮZOVÁ, M., MATOUŠEK, J., ŘEPOVÁ, B. Databáze vět vhodných pro nahrávání pacientů s poškozením hlasu. 2017.
Druh: SOFTWARE
Jazyk publikace: cze
Anglický název: Sentence database for voice-impaired speakers recording
Rok vydání: 2017
Název zdroje: Západočeská univerzita v Plzni
Autoři: Ing. Daniel Tihelka Ph.D. , Ing. Markéta Jůzová , Doc. Ing. Jindřich Matoušek Ph.D. , Mudr. Barbora Řepová
Abstrakt CZ: Databáze vět má formu XML dokumentu a obsahuje speciálně vybraný seznam vět, které (nebo jejichž část) by měl pacient s indikovanou totální nebo parciální laryngektomií nebo jinou hrozbou ztráty hlasu, či obecně jiný hlasově neškolený uživatel (dále jen uživatel) nahrát v definovaném pořadí. Ke každé větě jsou navíc uvedeny doplňující informace, jako například její fonetická forma nebo předpokládaná prozodická realizace. Nahrávky vět z této databáze tvoří nezbytný základ pro další vytváření hlasových balíčků umožňujících rekonstrukci hlasu nahraného uživatele na vybraných platformách a zařízeních, jsou tedy základním vstupem celé platformy automatické hlasové konzervace. S ohledem na cílovou skupinu uživatelů, u kterých předpokládáme do jisté míry poškozený hlas a tedy i omezenou schopnost mluvit, ale nelze předem určit, kolik vět nakonec budou schopni nebo ochotni nahrát. Na rozdíl od výběru vět pro nahrávání profesionálního (nebo školeného) řečníka byly věty do této databáze omezeny délkou (spíše kratší věty) a složitostí (bez cizích nebo dlouhých slov) a pro finální výběr vět byl použit speciální více-úrovňový algoritmus, který postupně zvyšoval nároky na fonetické a prozodické pokrytí výsledného seznamu vět. Vytvořená databáze vět se využívá v aplikaci pro dozorované nahrávání hlasu a v dalších obdobích řešení projektu bude integrována do platformy automatické hlasové konzervace, kde bude využívána v modulu pro nedozorované nahrávání vět.
Abstrakt EN: The database of sentences has a form of XML document and contains a specially selected list of sentences that all (or their part) are aimed to be recorded in the defined ordering by a patient with indicated total or partial laryngectomy or other threat of voice loss, or by a generally voice untrained speaker (referred to as the user). In addition, information such as phonetic form or the assumed prosodic form are given for each sentence. Recordings of the sentences from this database are the essential basis for the further build of voice modules allowing to reconstruct the voice of the recorded user. Thus, they are the fundamental input of the entire automated voice preservation platform. With regard to the target group of users who are expect to have a somewhat damaged voice and hence a limited ability to speak, it is not possible to determine in advance how many sentences will they eventually be able or willing to record. Unlike the choice of sentences for the recording of a professional (or trained) speaker, the sentences in this database were limited by the length (rather shorter sentences) and the complexity (without foreign or long words). Also, a special multi-level algorithm was used for the final selection of sentences in order to iteratively increase the phonetic and prosodic coverage of the resulting list of sentences. The sentence database is used in the supervised voice recording application, and in the course of project solution, it will be integrated into the automated voice preservation platform, where it will be used by the unsupervised voice recording module.
Klíčová slova

Zpět

Patička