[KNO16] Two step soft subspace SOM : une méthode de classification multi-bloc avec sélection de variables
Revue Nationale avec comité de lecture :
Journal Revue des Nouvelles Technologies de l'Information AAFD 2016, vol. RNTI-A-8,
pp. 51-66,
2016
Mots clés: Classification, données multi-blocs, soft-subspace clustering, sélection de variables
Résumé:
Nous proposons une stratégie de classification de données multi-blocs
basée sur l’utilisation de la méthode de soft subspace clustering 2S-SOM dans un
processus hiérarchique à deux niveaux combiné à des tests statistiques. Une première
application de la méthode 2S-SOM fournit un système de poids évaluant
les contributions relatives des variables et des blocs aux groupes d’observations.
Nous proposons une procédure de test statistique permettant de sélectionner les
variables significativement pertinentes. 2S-SOM est à nouveau utilisée sur ces
dernières pour déterminer la partition finale des observations. La méthode est
évaluée sur des données simulées et réelles. En particulier, l’application sur des
données météorologiques montre que la sélection des variables au niveau 1 facilite
l’interprétation des classes obtenues.
Collaboration:
LOCEAN
,
UCAD
,
UPMC