Rechercher

[Fad16b] Une approche basée sur une stratégie d’apprentissage profond pour la détection du sens dans les données non structurées

Chapitres de Livre : Titre du livre: "Ingénierie et management des systèmes d'information", December 2016, Cépaduès, pp. www.cepadues.com,

Auteurs: H. Fadili

Mots clés: apprentissage profond, réseaux de neurones, contextes, relations sémantiques, modèles des données, ressources, LSA, LDA.

Résumé: Les données non structurées dominent l’univers de la production et de la publication des données, et en représentent, d’après plusieurs études, plus de 80%. Ce type de contenus, constitue la partie riche et précieuse en termes de données, d’informations et de connaissances ; donc nécessaire à intégrer et à prendre en considération dans les processus de traitements et d’exploitations des données. Dans ce chapitre, nous présentons une approche basée sur une stratégie d’apprentissage profond permettant d’exploiter des données annotées comme base d’apprentissage pour l’interprétation des données textuelles. Son originalité réside dans le fait que d’une part elle fait un zoom et qu’elle exploite deux notions importantes, à savoir les notions de contexte et des relations sémantiques ; et d’autre part qu’elle exploite ces deux notions pour générer un modèle riche comme base d’apprentissage et d’évaluation. Afin de combler le manque de données sémantiquement annotées, nous avons exploité des réseaux sémantiques existants du Web de données ouvert (Linked Open data, LOD) tels que RDF Wordnet [16] ou Dbpedia[21] pour enrichir et instancier une première partie de du modèle. L’autre partie a été complétée en exploitant les technologies LSA (Latente Semantic Analysis) et LDA (Latent Dirichlet Allocation) pour la génération des thèmes du contexte général et d’autres outils pour gérer le POS, le streaming, le contexte local, etc. Notre étude a été validée à travers des expérimentations appliquant des méthodes d’apprentissage profond, à travers la mise en place et l’optimisation d’un réseau de neurones multicouches . L’implémentation a été effectuée en exploitant principalement les fonctionnalités des plateformes Weka [17] et Automap [18].

BibTeX

@inbook {
Fad16b,
title="{Ingénierie et management des systèmes d'information}",
chapter="{Une approche basée sur une stratégie d’apprentissage profond pour la détection du sens dans les données non structurées}",
author="H. Fadili",
year=2016,
publisher="Cépaduès",
pages="www.cepadues.com",
}