Přejít k obsahu


WFBAS - Word/Phoneme-Based Audio Search

Citace:
ŠVEC, J., CHÝLEK, A., STANISLAV, P., PRAŽÁK, A., PSUTKA, J., ZELINKA, J., MÜLLER, L., SOUTNER, D. WFBAS - Word/Phoneme-Based Audio Search. 2015.
Druh: SOFTWARE
Jazyk publikace: cze
Anglický název: WFBAS - Word/Phoneme-Based Audio Search
Rok vydání: 2015
Název zdroje: Západočeská univerzita v Plzni
Autoři: Ing. Jan Švec Ph.D. , Ing. Adam Chýlek , Ing. Petr Stanislav , Ing. Aleš Pražák Ph.D. , Ing. Mgr. Josef Psutka Ph.D. , Ing. Jan Zelinka PhD. , Doc. Ing. Luděk Müller Ph.D. , Ing. Daniel Soutner ,
Abstrakt CZ: Software slouží k prohledávání slovního i fonémového indexu videoarchivu a předává uživateli (resp. softwaru MCLASS) informaci o tom, kde a s jakou pravděpodobností se hledané výrazy vyskytují. Vyhledávání ve slovním indexu je v princip velice jednoduché ? pouze do databáze zadáme dotaz na výskyt příslušného slova. Ještě předtím je slovo z uživatelova dotazu lingvisticky předzpracováno následujícím postupem: (1) Ve výslovnostním slovníku je vyhledána fonetická transkripce (tj. posloupnost fonémů) odpovídající danému slovu. (2) Ve stejném slovníku jsou pak nalezena všechna slova, která mají shodnou fonetickou transkripci. (3) Pro všechna takto vyhledaná slova je lemmatizátorem identifikována sada všech možných lemmat a následně je týmž softwarem zpětně vyprodukována množina všech existujících morfologických tvarů. Hledání pak probíhá se všemi takto vyprodukovanými tvary slova a položky nalezené v databázi jsou řazeny sestupně dle hodnoty pravděpodobnosti; uvedené rozšíření dotazu však lze i vypnout. Vyhledávání ve fonetickém indexu je složitější, neboť hledáme izolovaně jednotlivé fonémové trigramy a výsledky pak vhodným způsobem kombinujeme. Přesný postup je tento: (1) Hledané slovo je převedeno na posloupnost fonémů; výsledný řetězec je rozdělen na fonémové trigramy. (2) Trojice fonémů jsou vyhledány v indexu a shluknuty podél časové osy pro každou nahrávku zvlášť a to tak, že je definována minimální vzdálenost mezi jednotlivými shluky. (3) Každý shluk je ohodnocen kombinovaným skóre a vyhledané položky jsou řazeny sestupně dle hodnoty tohoto skóre.
Abstrakt EN: The software used to search the word and phoneme index of video archives and provides the user (resp. MCLASS software) with information about where and how likely search terms appear. Searching the word index is in principle very simple - the query is submitted to the database on the occurrence of specific words. The linguistic preprocessing works as follows: (1) pronunciation dictionary is searched for phonetic transcription (ie. a sequence of phonemes) corresponding to the given word. (2) In the same dictionary, all the words that have the same phonetic transcription are found. (3) all such words are lemmatised and the set of all possible lemmas and word forms is identified. The search is then carried out with all such word forms and items found in the database are ranked according to the probability value; But given query expansion can be switched off. Search in phonetic index is more complicated, because we are looking for an isolated individual phoneme trigraphs results and then combine them in an appropriate manner. The exact procedure is as follows: (1) the search word is converted into a sequence of phonemes; the resulting string is divided into phoneme trigraphs. (2) The three phonemes are searched in the index and ordered along the time axis for each record separately, so that it is defined by the minimum distance between the clusters. (3) Each cluster is evaluated by a combined score and retrieved the items are sorted in descending order according to the value of the score.
Klíčová slova

Zpět

Patička