Přejít k obsahu


Comparison of retrieval approaches and blind relevance feedback methods within the Czech speech information retrieval

Citace:
SKORKOVSKÁ, L. Comparison of retrieval approaches and blind relevance feedback methods within the Czech speech information retrieval. In Speech and Computer 18th International Conference, SPECOM 2016, Budapest, Hungary, August 23-27, 2016, Proceedings. Heidelberg: Springer, 2016. s. 182-190. ISBN: 978-3-319-43957-0 , ISSN: 0302-9743
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Comparison of retrieval approaches and blind relevance feedback methods within the Czech speech information retrieval
Rok vydání: 2016
Místo konání: Heidelberg
Název zdroje: Springer
Autoři: Ing. Lucie Skorkovská ,
Abstrakt CZ: Tento článek má několik cílů. Prvním je srovnat nejpoužívanější metody pro vyhledávání informací na jedné kolekci pro vyhledávání informací v řeči. Byla použita kolekce, vytvořená v české části CLEF 2007, obsahující automatické přepisy spontánních rozhovorů s pamětníky holocaustu. Kromě prvních experimentů v soutěži CLEF, nebyly na této kolekci publikovány žádné komplexní experimenty k porovnání různých metod vyhledávání informací. Druhým cílem tohoto článku je srovnat výsledky použití metod slepé zpětné vazby v jednotlivých metodách pro vyhledávání informací a představit možnosti využití metody normalizace skóre pro výběr dokumentů pro slepou zpětnou vazbu. Třetím cílem tohoto článku je porovnat různé normalizační metody mezi sebou. Obsáhlé experimenty byly provedeny pro každou metodu a její nastavení. Pro všechny metody vyhledávání informací výsledky experimentů ukázaly, že použití metod normalizace skóre výrazně zlepšuje dosažené výsledky vyhledávání.
Abstrakt EN: This article has several objectives. First, it is to compare the most used information retrieval methods on a single speech retrieval collection. The collection, used in the CLEF 2007 Czech task, contains automatically transcribed spontaneous interviews of holocaust survivors and is to our knowledge the only Czech collection of spontaneous speech intended for speech information retrieval. Apart from the first experiments presented in the CLEF competition, no comprehensive experiments have been published on this collection to compare the different information retrieval methods. The second objective of this paper is to compare the results of using the blind relevance feedback methods with the individual retrieval methods and introduce the possibility of using the score normalization methods for the selection of documents for the blind relevance feedback. The third objective of this article is to compare different normalization methods among themselves. Exhaustive experiments were performed for each method and its settings. For all information retrieval methods used, the experiments results showed that the use of score normalization methods significantly improves the achieved retrieval score.
Klíčová slova

Zpět

Patička