[Fad16c] Le Machine Learning : numérique non supervisé et symbolique peu supervisé, une chance pour l’analyse sémantique automatique des langues peu dotées.
Conférence Internationale avec comité de lecture :
TICAM,
November 2016,
pp.10,
Maroc,
Mots clés: Machine Learning, apprentissages non/peu supervisés, contextes, relations sémantiques, modèles des données, ressources langagières, LSA, LDA, langues peu dotées
Résumé:
Dans cet article nous présentons une approche, bien adaptée aux cas où on ne dispose pas ou que de peu de données traitées. Elle est basée sur des méthodes d’apprentissages numériques non supervisés indépendants de la langue et symboliques peu supervisés, permettant d’exploiter directement des données brutes ou seulement des petites quantités de données traitées, comme base d’apprentissage pour l’interprétation des données. En l’appliquant à un cas concret d’une langue peu dotée, nous avons pu, montrer l’utilité et surtout l’opportunité que ces technologies pourraient constituer pour contourner les problèmes dont souffre ce type de langues, facilitant ainsi leur accès dans le monde de l’analyse sémantique automatique des données non structurées. Cette étude a été validée à travers des expérimentations confirmant de bons résultats pour l’approche.