Rechercher

[YS04a] Une Méthodologie pour la Comparaison de Partitions

Revue Nationale avec comité de lecture : Journal Revue de Statistique Appliquée, vol. 52(1), pp. 97-120, 2004

Mots clés: partition, cluster analysis, classification, Indice de Rand, test de Mac Nemar

Résumé: Nous proposons une méthodologie pour comparer des partitions d’un même ensemble de données. Nous présentons tout d’abord quelques mesures de comparaison de deux classifications d’un même ensemble de données : l’indice de Rand, sous sa forme brute ou corrigée, ainsi que sa version asymétrique, puis deux autres indices : le premier est inspiré du test de Mac Nemar et le second de l’indice de Jaccard. On présente les écritures logiques et relationnelles de ces indices ainsi que leurs distributions d’échantillonnage sous une hypothèse nulle d’absence de liaison. Pour étudier la stabilité des classes on utilise ensuite un modèle particulier de mélanges de distributions, les profils latents qui sert à simuler des données que l’on classe selon deux groupes de variables

Equipe: msdma

BibTeX

@article {
YS04a,
title="{Une Méthodologie pour la Comparaison de Partitions}",
author="G. Youness and G. Saporta",
journal="Revue de Statistique Appliquée",
year=2004,
volume=52,
number=1,
pages="97-120",
}