[SEB07] Interrogation des documents XML Ã travers des vues
Mémoire de Thèse :
Soutenue le: 01 January 2007,
: Interrogation des documents XML Ã travers des vues,
motcle:
Résumé:
Dans cette thèse, nous étudions le problème d'intégrer et d'interroger des documents XML hétérogènes. Notre première contribution est XyView, un modèle de vues pour le développement d'applications utilisateur (formulaire web) ou orientées machine (service web) sur un entrepôt de documents XML hétérogènes et éventuellement sans schéma. La solution que nous proposons s'inspire du concept de la relation universelle des années 70 : XyView fournit les moyens de visualiser un entrepôt XML comme un tableau de valeurs, pouvant être interrogé à travers une interface similaire aux interfaces QBE ou à travers des requêtes de type sélection/projection. Les inconvénients de perte et de redondance de l'information dus aux jointures dans la définition de la relation universelle, sont évités dans XyView en définissant la vue comme un ensemble de mappings et non pas explicitement par une requête. L'interrogation de XyView est rendue plus simple grâce à un modèle de vues à trois niveaux gérant l'hétérogénéité sémantique des données sans schéma et structurant la vue en séparant les unions des jointures. Notre deuxième contribution est OpenXView : Un modèle pour les systèmes d'intégration de données XML ouverts, caractérisés par l'autonomie des utilisateurs qui publient un nombre très large de données XML sur un thème en commun. L'autonomie implique des changements fréquents et imprévisibles aux données et un grand degré d'hétérogénéité de structures. OpenXview fournit un modèle original pour l'intégration des données, basé sur un schéma global hybride : ontologie-XML. Nous proposons des solutions pour deux problèmes importants dans de tels systèmes : accès facile aux données à travers un langage d'interrogation simple sur le schéma global et une gestion facile du système quand les données changent. À la différence des vues XyView, où la stabilité des structures permet de prédéfinir les jointures et les unions entre sources, OpenXView détermine en temps réel ces opérations, en fonction de la requête et de la structure courante des sources concernées. Nous mettons l'accent sur le problème de réécriture de requêtes dans OpenXView en montrant un algorithme de traduction original répondant à deux critères importants : le nombre très large de sources de données, et les jointures implicites.