Rechercher

[CLB06a] Extraction des connaissances à partir des fichiers logs

Conférence Internationale avec comité de lecture : 6ème conférence internationale sur l'Extraction et la Gestion des Connaissances EGC'2006, Workshop , January 2006, Lille, France,

Mots clés: Web Usage Mining, Clustering, Cartes de Kohonen

Résumé: L'’approche que nous proposons de caractériser les utilisateurs d’un site Web en se basant sur leurs motifs de navigation sur le site comporte trois phases : prétraitement des fichiers Logs, classification des pages et classification des internautes. Dans la phase de prétraitement, les requêtes sont organisées en visites. Dans la phase de classification des pages, des paramètres introduits à partir des statistiques sur les accès aux pages sont utilisés pour la catégorisation des pages Web en pages auxiliaires et pages de contenu. Les requêtes aux pages de contenu servent à la découverte des motifs de navigation. Pour construire des groupes d’utilisateurs, deux méthodes hybrides de classification automatique basées sur l’analyse en composantes principales, l’analyse des correspondances multiples et les cartes de Kohonen sont appliquées aux visites. Une expérience effectuée sur des données réelles prouve l'’efficacité de cette méthodologie.

Equipe: msdma

BibTeX

@inproceedings {
CLB06a,
title="{Extraction des connaissances à partir des fichiers logs}",
author=" M. Charrad and Y. Lechevallier and M. Ben Ahmed ",
booktitle="{6ème conférence internationale sur l'Extraction et la Gestion des Connaissances EGC'2006, Workshop }",
year=2006,
month="January",
address="Lille, France",
}