Přejít k obsahu


Score Normalization Methods for Relevant Documents Selection for Blind Relevance Feedback in Speech Information Retrieval

Citace:
SKORKOVSKÁ, L. Score Normalization Methods for Relevant Documents Selection for Blind Relevance Feedback in Speech Information Retrieval. In Text, Speech, and Dialogue, 18th International Conference, TSD 2015, Pilsen, Czech Republic, 14-17, 2015. Proceedings. Heidelberg: Springer, 2015. s. 316-324. ISBN: 978-3-319-24032-9 , ISSN: 0302-9743
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Score Normalization Methods for Relevant Documents Selection for Blind Relevance Feedback in Speech Information Retrieval
Rok vydání: 2015
Místo konání: Heidelberg
Název zdroje: Springer
Autoři: Ing. Lucie Skorkovská ,
Abstrakt CZ: Cílem tohoto článku je automatický výběr relevantních dokumentů pro využití v automatické zpětné vazbě v oblasti vyhledávání informací v řeči. Obvykle jsou relevantní dokumenty vybrány pouze jednoduše, stanovením, že prvních N dokumentů je relevantních. Naopak, předchozí první experimenty s automatickým výběrem dokumentů pro zpětnou vazbu ukázaly možnosti dynamického výběru relevantních dokumentů pro každý dotaz v závislosti na obsahu vyhledaných dokumentů, místo jen slepě definovaného čísla. V prvních pokusech byla použita metoda World Model normalizace. Na základě slibných výsledků experimenty uvedené v tomto článku se snaží důkladně prozkoumat možnosti použití rozdílných technik pro normalizaci skóre používaných v úloze identifikace řečníka.
Abstrakt EN: This paper aims at the automatic selection of the relevant documents for the blind relevance feedback method in speech information retrieval. Usually the relevant documents are selected only by simply determining the first N documents to be relevant. On the contrary, the previous first experiments with the automatic selection of the relevant documents for the blind relevance feedback method has shown the possibilities of the dynamical selection of the relevant documents for each query depending on the content of the retrieved documents instead of just blindly defining the number of the relevant documents to be used in advance. In the first experiments, the World Model Normalization method was used. Based on the promising results, the experiments presented in this paper try to thoroughly examine the possibilities of the application of different score normalization techniques used in the speaker identification task, which was successfully used in the related task of multi-label classification for finding the “correct” topics of a newspaper article in the output of a generative classifier.
Klíčová slova

Zpět

Patička