| ||||||||||||||||||||||||||||||||||||
[CLS10a] WCUM pour l'analyse d'un site WebAtelier, Poster ou Démonstration dans une Conférence Internationale : 10ème conférence internationale sur l'Extraction et la Gestion des Connaissances EGC'2010, January 2010, pp.45-52, Hammamet, Tunisia,Mots clés: Machine learning, Data mining, Text mining, Natural Language Processing
Résumé:
La caractérisation des internautes fréquentant un site Web est un problème incontournable pour assister l'internaute et prédire son comportement. Ces considérations ont motivé d'importants efforts dans l'analyse des traces des internautes sur les sites Web. D'autres efforts ont été concentrés sur l'analyse du contenu des pages Web. Sachant que le comportement des utilisateurs sur un site web dépend fortement du contenu des pages du site et inversement le contenu du site devrait répondre aux attentes des usagers du site, nous proposons de faire la liaison entre le contenu et l'usage d'un site web. Notre idée est d'exploiter les différentes informations relatives au contenu d'un site Web et de son usage en vue d'analyser le site. Pour ce faire, nous proposons une approche WCUM (Web Content and Usage based Approach) permettant de relier l'analyse du contenu d'un site Web à l'analyse de l'usage. Les résultats de cette analyse sont exploités d'une part pour confronter la structure sémantique du site à sa perception par ses utilisateurs et d'autre part pour comprendre les comportements de navigation sur le site. L'apport de ce travail réside d'une part dans la proposition d'une approche reliant l'analyse du contenu à l'analyse de l'usage et d'autre part à l'extension de l'application des méthodes de block clustering, appliquées généralement en bioinformatique, au contexte Web mining afin de profiter de leur pouvoir classificatoire dans la découverte de biclasses homogènes à partir d'une partition des instances et une partition des attributs recherchées simultanément.
Equipe:
msdma
BibTeX
|
||||||||||||||||||||||||||||||||||||