[PNSb06] Classification préalable à la recherche de règles d'association
Conférence Nationale avec comité de lecture :
RIAS'06 Rencontres Inter-Associations sur le thème de la classification, Lyon, France,
January 2006,
pp.1,
motcle:
Résumé:
Cette communication d�crit l�utilisation conjointe des m�thodes de recherche de r�gles d�association et de classification de variables dans le cadre d'une application du secteur automobile o� plus de 80000 v�hicules sont d�crits par plus de 3000 attributs binaires rares.
Rechercher des r�gles d�association (Agrawal & Srikant, 1994) sur un grand ensemble d'�v�nements rares conduit � une profusion de r�sultats difficiles � interpr�ter de part leur nombre et leur complexit�. Nous proposons de r�aliser une classification pr�alable des variables (Plasse et al., 2005) afin d'obtenir des groupes homog�nes d'attributs puis de rechercher les r�gles d'association � l'int�rieur de chacun de ces groupes.
Nous avons r�alis� plusieurs classifications de variables (Nakache & Confais, 2005) � l�aide d�un algorithme divisif et d�un algorithme agglom�ratif avec diff�rents indices de similarit� entre variables. Apr�s avoir compar� deux � deux toutes les partitions obtenues gr�ce � l�indice de Rand. Nous avons ensuite proc�d� � la recherche des r�gles d'association � l'int�rieur de chaque classe de variables, dans toutes les partitions. La classification descendante permet directement une r�duction importante du nombre de r�gles, contrairement aux classifications ascendantes, o� la r�duction est moindre. Cependant ces derni�res permettent de mettre en �vidence une forte liaison entre certains attributs dont les associations multiples produisent des r�gles complexes en grand nombre. En isolant ces attributs, la r�duction du nombre de r�gles obtenues est alors sup�rieure � 99% quelque soit la m�thode de classification employ�e. De plus, la complexit� des r�gles n'exc�de pas 5 attributs.
Apr�s avoir montr� l'apport d'une classification de variables pr�alable � la recherche de r�gles d'association, nous travaillons actuellement sur l'apport de la classification crois�e � cette approche.