Přejít k obsahu


First Experiments with Relevant Documents Selection for Blind Relevance Feedback in Spoken Document Retrieval

Citace:
SKORKOVSKÁ, L. First Experiments with Relevant Documents Selection for Blind Relevance Feedback in Spoken Document Retrieval. In Speech and Computer, 16th International Conference, SPECOM 2014, Novi Sad, Serbia, October 5-9, 2014, Proceedings. Heidelberg: Springer, 2014. s. 235-242. ISBN: 978-3-319-11580-1 , ISSN: 0302-9743
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: First Experiments with Relevant Documents Selection for Blind Relevance Feedback in Spoken Document Retrieval
Rok vydání: 2014
Místo konání: Heidelberg
Název zdroje: Springer
Autoři: Ing. Lucie Skorkovská ,
Abstrakt CZ: Tento článek představuje naše první pokusy zaměřené na automatický výběr relevantních dokumentů pro metodu slepé zpětné vazby v oblasti vyhledávání informací v řeči. Obvykle jsou příslušné dokumenty vybrány pouze jednoduše stanovením prvních N dokumentů jako relevantních. Považujeme tento přístup za nedostatečný a budeme se snažit v tomto článku nastínit možnosti dynamického výběru relevantních dokumentů pro každý dotaz v závislosti na obsahu dokumentů, ne jen slepě definováním počtu příslušných dokumentů předem. Provedli jsme počáteční experimenty s využitím technik normalizace skóre používaných v oblasti identifikace řečníka, které byly úspěšně použity v úloze multi-label klasifikace pro hledání "správného" tématu novinového článku ve výstupu generativního klasifikátoru. Experimenty ukázaly slibné výsledky, proto budou použity pro definování možnosti následného výzkumu v této oblasti.
Abstrakt EN: This paper presents our first experiments aimed at the automatic selection of the relevant documents for the blind relevance feedback method in speech information retrieval. Usually the relevant documents are selected only by simply determining the first N documents to be relevant. We consider this approach to be insufficient and we would try in this paper to outline the possibilities of the dynamical selection of the relevant documents for each query depending on the content of the retrieved documents instead of just blindly defining the number of the relevant documents to be used for the blind relevance feedback in advance. We have performed initial experiments with the application of the score normalization techniques used in the speaker identification task, which was successfully used in the multi-label classification task for finding the “correct” topics of a newspaper article in the output of a generative classifier. The experiments have shown promising results, therefore they will be used to define the possibilities of the subsequent research in this area.
Klíčová slova

Zpět

Patička