| |||||||||||||||||||||||||||||||
[OUA14] Développement et mise en place d'une méthode de classification multi-blocs : application aux données de l'OQAIMémoire de Thèse : Soutenue le: 18 March 2014, pp. 199, pp.: Directeur: M. BADRAN Fouad Professeur, CNAMCo-directrice: Mme. NIANG Ndèye Maître de Conférence, CNAM Rapporteur 1: M. PALUMBO Francesco Professeur, Université Federico II Naples Rapporteur 2: M. QANNARI El Mostafa Professeur, Oniris Nantes Membre du jury: M. NADIF Mohamed Professeur, Université Paris V Membre du jury: M. BISSON Gilles Chargé de recherche, CNRS Grenoble Membre du jury: Mme. DORIZZI Bernadette Professeur à TéléCOM SudParis, INT Invité : M. DEROUBAIX Pierre Ingénieur, ADEME Invité :Mme. Mandin Corinne Ingénieure, CSTB, : Développement et mise en place d'une méthode de classification multi-blocs : application aux données de l'OQAI, Mots clés: classication, multi-blocs, subspace clustering, consensus, SOM
Résumé:
La multiplication des sources d'information et le développement de nouvelles technologies
engendrent des bases de données complexes. Dans les études environnementales sur
la pollution de l'air intérieur par exemple, la collecte des informations sur les bâtiments
se fait au regard de plusieurs thématiques comme les concentrations en polluants, les caract
éristiques techniques, etc., engendrant ainsi des données de grande dimension avec une
structure multi-blocs dénie par les thématiques. L'objectif de ce travail visait à développer
des méthodes de classication adaptées à ces jeux de données de grande dimension et
structurées en blocs de variables.
La première partie de ce travail présente un état de l'art des méthodes de classication
en général et dans le cas de la grande dimension en particulier. Dans la deuxième partie,
trois nouvelles approches de classication d'individus décrits par des variables structurées
en blocs ont été proposées. La méthode 2S-SOM (Soft Subspace Self Organizing Map) est
une approche de type subspace clustering basée sur une modication de la fonction de coût
de l'algorithme des cartes topologiques à travers un double système de poids adaptatifs
déni sur les blocs et sur les variables. Pour surmonter la dépendance des résultats de la
méthode SOM par rapport aux paramètres d'initialisation, nous proposons deux approches
de recherche de consensus de SOM, CSOM (Consensus SOM) et Rv-CSOM,qui prennent
en compte la structuration en bloc des variables. Dans l'approche CSOM, l'objectif est
de favoriser les cartes les meilleures au sens d'un certain critère de validation, alors que
Rv-CSOM va plutôt privilégier les cartes similaires par évaluation de la liaison entre cartes.
Enn, la troisième partie présente une application de ces méthodes sur le jeu de données
de la campagne nationale logements menée par l'Observatoire de la Qualité de l'Air
Intérieur (OQAI) an de dénir une typologie des logements français au regard des thématiques
: qualité de l'air intérieur, caractéristiques constructives du bâtiment, composition
des ménages et habitudes des occupants.
Equipe:
msdma
BibTeX
|
|||||||||||||||||||||||||||||||