Rechercher

[VOD07] Intégration, partage et diffusion de données sur le Web

Mémoire de HDR : Soutenue le: 01 January 2007, : Intégration, partage et diffusion de données sur le Web,

Auteurs: D. Vodislav

Mots clés: proximity search on XML graphs

Résumé: Ce rapport présente mon activité de recherche depuis la fin de ma thèse en Janvier 1997. Un point marquant dans ma recherche le représente ma reconversion thématique réalisée en 1999, à partir du domaine des interfaces multimédia vers celui de la gestion de données sur le web. Le rapport présente principalement mes travaux sur la gestion de données sur le web, dans trois directions : (1) intégration de données XML à l’échelle du web, (2) vues applicatives pour données XML hétérogènes et (3) architectures pair à pair (P2P) pour le partage de données sur le web. L’intégration de données à l’échelle du web a été étudiée dans le contexte du système Xyleme, un entrepôt XML distribué, capable de stocker tous les documents XML du web. Nous avons proposé une solution pour l’intégration de données XML à très large échelle, qui a été implémentée en tant que module du logiciel Xyleme, accompagné d’outils pour la génération semi-automatique de vues et pour la création de contenu XML à partir de texte non structuré. Les vues applicatives pour données XML hétérogènes visent à simplifier l’interrogation de telles données par des non spécialistes et à offrir un support pour le développement rapide d’applications. Ce sujet a été traité dans deux contextes différents : entrepôts XML, avec un ensemble limité et contrôlable de changements dans les sources (modèle XyView) et systèmes ouverts, caractérisés par l’autonomie des sources, qui peuvent entrer / sortir du système ou changer leur contenu à tout moment (modèle OpenXView). XyView a été implémenté en tant que module applicatif dans Xyleme, accompagné d’outils pour l’édition graphique des vues et pour la génération d’applications type formulaire web au-dessus des vues. Les architectures P2P pour le partage de données sur le web ont été étudiées dans le contexte de l’environnement de gestion de données distribuées ActiveXML. Le principal résultat est la réalisation du système P2P EDOS pour la distribution de modules logiciels open source à une large communauté d’utilisateurs. EDOS partage d’une façon homogène l’effort entre nœuds du réseau, afin d’offrir des fonctionnalités globales qui passent à l’échelle, telles que la gestion et l’interrogation de métadonnées, la distribution de contenu vers les utilisateurs, la notification des changements. Le rapport présente une vue d’ensemble de mon activité dans l’introduction (Chapitre 1), ensuite les trois axes de recherche (Chapitres 2-4) et se termine avec la présentation des conclusions et des perspectives de recherche (Chapitre 5).

Collaboration: ETIS

BibTeX

@misc {
VOD07,
title="{Intégration, partage et diffusion de données sur le Web}",
author="D. Vodislav",
year=2007,
address="{CEDRIC Laboratory, Paris, France}",
note="{Post-Doctoral Degree (Phd students supervisor) }",
}