[NM05] Evaluation : nouvelle approche avec juges
Conférence Nationale avec comité de lecture :
INFORSID'05 XXIII e congrès, Grenoble,
January 2005,
pp.555-570,
motcle:
Résumé:
la F-mesure est l’indicateur de synthèse communément utilisé depuis 25 ans pour évaluer les algorithmes de classification de données textuelles, à partir de la précision et du rappel. Elle est utilisée indifféremment pour les classifications et les catégorisations. Pour les problématiques de recherche d’information et de classification, certains préfèrent utiliser le Break Even Point. Cependant, ces mesures présentent quelques défauts : elles répondent à une logique binaire et ne permettent pas d’intégrer de niveaux d’exigences en matière de résultats, tant sur la pertinence que sur l'ordre de présentation des résultats.