Přejít k obsahu


Comparison of Score Normalization Methods Applied to Multi-label Classification

Citace:
SKORKOVSKÁ, L., ZAJÍC, Z., MÜLLER, L. Comparison of Score Normalization Methods Applied to Multi-label Classification. In Signal Processing and Information Technology (ISSPIT), 2014 IEEE International Symposium on. Noida: Institute of Electrical and Electronics Engineers ( IEEE ), 2014. s. 433-437. ISBN: 978-1-4799-1811-9
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Comparison of Score Normalization Methods Applied to Multi-label Classification
Rok vydání: 2014
Místo konání: Noida
Název zdroje: Institute of Electrical and Electronics Engineers ( IEEE )
Autoři: Ing. Lucie Skorkovská , Ing. Zbyněk Zajíc Ph.D. , Doc. Ing. Luděk Müller Ph.D. ,
Abstrakt CZ: Článek se zabývá multi-label klasifikací novinových článků. Je použit generativní klasifikátor a je nutné zabývat se stanovením hranice mezi správnými a nesprávnými tématy článku. V tomto článku je představeno porovnání metod pro normalizaci skóre aplikovaných na úlohu multi-label klasifikace pro nalezení prahu mezi správnými a nesprávnými tématy. Jsou představeny metody pro normalizaci skóre vycházející z oblasti verifikace a identifikace řečníka.
Abstrakt EN: Our paper deals with the multi-label text classification of the newspaper articles, where the classifier must decide if a document does or does not belong to each topic from the predefined topic set. A generative classifier is used to tackle this task and the problem with finding a threshold for the positive classification is mainly addressed. This threshold can vary for each document depending on the content of the document (words used, length of the document, etc.). An extensive comparison of the score normalization methods, primary proposed in the speaker identification/verification task, for robustly finding the threshold defining the boundary between the "correct'' and the "incorrect'' topics of a document is presented. Score normalization methods (based on World Model and Unconstrained Cohort Normalization) applied to the topic identification task has shown an improvement of results in our former experiments, therefore in this paper an in-depth experiments with more score normalization techniques applied to the multi-label classification were performed. Thorough analysis of the effects of the various parameters setting is presented.
Klíčová slova

Zpět

Patička