[HKC13] Techniques d’indexation de souscriptions pour la syndication web
Revue Nationale avec comité de lecture :
Journal ISI'13, Ingénierie des systèmes d’information,
vol. 18(4),
pp. 33-58,
2013
Mots clés: pub/sub, indexation de souscriptions, syndication web.
Résumé:
L’explosion de la quantité d’information publiée sur le web a conduit à l’émergence
d’un paradigme de syndication du contenu du web, qui transforme le lecteur passif en un collecteur
d’information actif. Les consommateurs d’information s’abonnent aux flux RSS/Atom et
sont notifiés quand une nouvelle information (item) est publiée. La syndication web est maintenant
employée sur les sites web, les blogs et les médias sociaux. Cependant, elle soulève des
problèmes de passage à l’échelle notamment concernant le filtrage en temps réel des flux, afin
de permettre aux utilisateurs de suivre effectivement et personnellement les informations qui
les intéressent. Dans cet article, nous étudions trois techniques d’indexation de souscriptions
des utilisateurs basées sur les listes inverses ou sur une structure arborescente ordonnée. Nous
présentons des modèles analytiques pour l’espace mémoire et le temps de traitement et menons
une étude expérimentale approfondie de l’impact de plusieurs paramètres sur ces structures.
Collaboration:
FORTH-ICS