Rechercher

[HS16] Une approche pour évaluer la complétude de données RDF

Revue Nationale avec comité de lecture : Journal Ingénierie des Systèmes d'Information, vol. 21(3), pp. 31-52, 2016, (doi:10.3166/isi.21.3.31-52)

Mots clés: Web de données, qualité des données RDF, complétude, évaluation de la qualité, Qualité, Web sémantique

Résumé: Nous assistons depuis quelques années à une prolifération de données du web. Ceci a accéléré le développement d’application et de logiciels fondés sur l’exploitation et l’analyse des données. Il devient donc urgent de proposer des techniques et des méthodes pour l’évaluation et l’assurance de la qualité de ces données. La qualité est un concept multidimensionnel qui repose sur une variété de dimensions. Une des dimensions critiques pour la prise de décision est la complétude. Cette dimension est reconnue comme difficile à évaluer puisqu’elle requiert souvent l’existence d’une norme d’excellence ou un schéma de référence validé et agréé qui servira de référence universelle à cette complétude. Cependant un tel référentiel est rarement disponible voire inexistant dans la pratique. Dans le présent article, nous proposons une approche pour l’évaluation de la complétude de sources de données RDF (Resource Description Framework). L’approche est un processus en deux étapes. La première étape, que nous pouvons qualifier de fouille de schéma, consiste à extraire un schéma probable pour la description d’une source de données. Ce schéma est ensuite exploité lors de la deuxième étape du processus pour l’évaluation de la complétude. L’article présente, à la fois des concepts théoriques sur lesquels repose l’approche, mais aussi des expérimentations basées sur des données RDF réelles.

BibTeX

@article {
HS16,
title="{Une approche pour évaluer la complétude de données RDF}",
author="F. Hamdi and S. Si-Said Cherfi",
journal="Ingénierie des Systèmes d'Information",
year=2016,
volume=21,
number=3,
pages="31-52",
doi="10.3166/isi.21.3.31-52",
}