Přejít k obsahu


Technologie pro multimediální archiv a jazykové modelování

Citace:
ŠVEC, J., PRAŽÁK, A., HOIDEKR, J., SKORKOVSKÁ, L., VAVRUŠKA, J., LEHEČKA, J., PRESSL, D., STANISLAV, P., SOUTNER, D., IRCING, P., KANIS, J. Technologie pro multimediální archiv a jazykové modelování. 2011.
Druh: POLOPROVOZ, TECHNOLOGIE, ODRŮDA, PLEMENO
Jazyk publikace: cze
Anglický název: Technology for multimedia archive and language modeling
Rok vydání: 2011
Název zdroje: Katedra kybernetiky, Fakulta aplikovaných věd, Západočeská univerzita v Plzni
Autoři: Ing. Jan Švec , Ing. Aleš Pražák Ph.D. , Ing. Jan Hoidekr , Ing. Lucie Skorkovská , Bc. Jan Vavruška , Bc. Jan Lehečka , Bc. Dan Pressl , Ing. Petr Stanislav , Ing. Daniel Soutner , Ing. Pavel Ircing Ph.D. , Ing. Jakub Kanis Ph.D.
Abstrakt CZ: Technologie v režimu poloprovoz je výstupem projektu FR-TI1/486 a integruje velké množství algoritmů a modulů usnadňujících vybudování multimediálního archivu (text, audio, video) a vytěžování existujících informačních zdrojů za účelem jazykového modelování českého jazyka. Slovníky a jazykové modely mají univerzální použití, prioritně jsou využívány k průběžné a tematické aktualizaci diktovacího systému MegaWord, jehož aktivní slovník pracuje s více než 1 milionem slov; technologie je využívána též pro podporu systému automatického podtitulkování TV pořadů zajišťovaných řešiteli projektu pro Českou televizi. Technologie nabízí univerzální platformou, vykazuje rozšiřitelnost, modularitu, škálovatelnost i přenositelnost. Skládá se z modulů čištění, tokenizace a normalizace textu, modulů pro uchovávání audio a video záznamů spolu s algoritmy pro jejich konverzi. Součástí je i plánovač umožňující volání těchto modulů na vyžádání. Inovativní řešení poloprovozu umožňuje adaptaci jazykového modelu na konkrétní časové období a téma.
Abstrakt EN: The technology integrates a large number of algorithms and modules for a multimedia archive (textual and audio-visual). It also supports data-mining from web to build a large-scale language model of Czech. The language model is used in the task of automatic subtitling of television shows. The technology offers a universal platform, which is extensible, modular and scalable. It contains text processing modules, such as text cleaning, tokenization and normalization, modules for storing audio and video records and algorithms for conversion of such formats. An included scheduler supports on-demand execution of these modules. The innovation of this technology consists of an adaptation of language model to a given time span and topic of subtitles.
Klíčová slova

Zpět

Patička