| ||||||||||||||||||||||||||||||||
[CLB06a] Extraction des connaissances à partir des fichiers logsConférence Internationale avec comité de lecture : 6ème conférence internationale sur l'Extraction et la Gestion des Connaissances EGC'2006, Workshop , January 2006, Lille, France,Mots clés: Web Usage Mining, Clustering, Cartes de Kohonen
Résumé:
L'’approche que nous proposons de caractériser les utilisateurs d’un
site Web en se basant sur leurs motifs de navigation sur le site comporte trois
phases : prétraitement des fichiers Logs, classification des pages et classification
des internautes. Dans la phase de prétraitement, les requêtes sont organisées en visites. Dans la phase de classification des pages, des paramètres introduits
à partir des statistiques sur les accès aux pages sont utilisés pour la
catégorisation des pages Web en pages auxiliaires et pages de contenu. Les
requêtes aux pages de contenu servent à la découverte des motifs de navigation.
Pour construire des groupes d’utilisateurs, deux méthodes hybrides de
classification automatique basées sur l’analyse en composantes principales,
l’analyse des correspondances multiples et les cartes de Kohonen sont appliquées aux visites. Une expérience effectuée sur des données réelles prouve l'’efficacité de cette méthodologie.
Equipe:
msdma
BibTeX
|
||||||||||||||||||||||||||||||||