Les activités de l'équipe sont structurées autour de trois axes :
- Les systèmes décisionnel
- Le web sémantique
- La qualité des systèmes d'information
Les systèmes décisionnel
L'élaboration d'entrepôts de données requiert des méthodes couvrant à la fois les niveaux conceptuel, logique et physique. Des méthodes complètes, intégrant tous les niveaux de modélisation, et s'appuyant sur un modèle multidimensionnel standard, font défaut dans la littérature. Nous avons proposé une méthode de conception d'entrepôts de données, fondée sur le découpage entre les niveaux conceptuel, logique et physique. Le modèle multidimensionnel unifié, que nous avons défini, est au centre de la démarche (niveau logique). La modélisation conceptuelle s'effectue, quant à elle, à l'aide d'UML et d'OCL. Nous avons défini des règles de transformation assurant le passage automatique entre les différents niveaux d'abstraction (conceptuel à logique, logique à physique). En vue de l'exploitation de données médicales, nous avons développé un outil d'aide à la décision (300 000 lignes de code) incluant une chaîne décisionnelle et un outil de codage automatique de diagnostic. Nous avons réalisé plusieurs prototypes qui mettent en œvre notre démarche, aussi bien pour la conception que pour l'exploitation d'entrepôts de données. Parmi ceux-ci, le prototype d'outil d'aide à la décision, réalisé par le partenaire CNAM dans le cadre du projet Rhéa, est actuellement utilisé dans une trentaine d'hôpitaux en France et a permis un certain nombre de découvertes (19 publications médicales) aux médecins-chercheurs qui l'utilisent.
Le web sémantique
Cet axe s'inscrit dans les efforts de recherche pour construire un Web sémantique, ou Web 3.0. qui contient des méta-données décrivant les ressources du Web, par exemple sous forme de Topic Maps. Aucune méthodologie n'est actuellement satisfaisante pour créer les ressources sémantiques que sont les ontologies, les Topic Maps ou les wiki sémantiques. Nous avons proposé des algorithmes et outils permettant une meilleure prise en compte de la sémantique dans la construction de la hiérarchie d'héritage de l'ontologie, l'enrichissement des ontologies et la construction incrémentale de Topic Maps multiculturelles et multilingues, par utilisation des « scopes » et des facettes, méthode fondée sur un thésaurus. Un prototype de conception d'ontologies (POEM) et un projet Wiktionnaire (wiktionnaire franco-maghrébin dans le domaine des sciences humaines et sociales) intègrent nos différents résultats.
La qualité des systèmes d'information
Le développement de systèmes d'information conformes à un cahier des charges incluant des politiques de sécurité et des exigences de qualité, requiert des méthodes, des techniques et des outils permettant de s'assurer de l'adéquation du système développé aux exigences du cahier des charges. Notre démarche de prise en compte de la qualité comprend la définition d'un cadre pour l'évaluation de la qualité qui œuvre tous les aspects du développement (Usage, Spécification et Implémentation) et le développement d'un environnement dédié à la qualité qui met en œuvre l'approche qualité proposée et permet l'automatisation de la mesure de la qualité. Notre méthode de modélisation de la sécurité s'appuie elle sur les techniques de méta-modélisation, ainsi que sur un atelier de développement qui sépare le processus de développement de son contexte de travail (profil UML). Elle est fondée sur l'approche MDA. Nous avons aussi travaillé pendant plusieurs années sur la problématique de la rétro-conception des bases de données relationnelles. Notre approche combine la méta-modélisation des systèmes d'information et le développement de règles de transformation de modèles. Nous avons ensuite concentré nos efforts sur la rétroconception des sites web semi-structurés. Afin de garantir le passage à l'échelle, nous nous sommes intéressés à la problématique de l'indexation, en environnement centralisé et en environnement distribué, pour différents types d'applications. Ainsi nous avons proposé une technique d'indexation pour des données spatiales dans un environnement distribué. Nous étudions désormais l'indexation de gros volumes de données plain-texte (pour des contextes de données sur le Web en collaboration avec le groupe Vertigo, BD relationnelles, séquences ADN,...).