Les activités de l’équipe MSDMA (Méthodes statistiques de data-mining et apprentissage) se situent dans le domaine de la science des données. Elles concernent le traitement de données par des méthodes mathématiques, statistiques et informatiques dont le concept fédérateur est celui du data-mining.. Cette discipline se propose de découvrir des relations et des structures dans des données à travers des méthodes d’apprentissage supervisé et non supervisé. Elle se situe à la frontière de la statistique, de l’intelligence artificielle et des bases de données. La théorie de l’apprentissage lui donne ses fondements conceptuels.
Les travaux des membres de l’équipe portent sur le développement de méthodes exploratoires et de modélisation paramétrique et non paramétrique ainsi que d’outils informatiques pour leur mise en œuvre.
Ces travaux permettent le traitement de données complexes : données éparses, aberrantes, manquantes, tronquées, censurées, données mixtes mélangeant des variables quantitatives et qualitatives, données structurées en blocs ou multi-tableaux…
Ces données proviennent de divers domaines tels que l’environnement, la télédétection, les procédés industriels, les images, la médecine, la santé et les sciences sociales.
En raison l’augmentation en volume et en variété des bases de données et plus généralement avec l’émergence des nouveaux domaines du data mining et du big data, l’équipe répond aux enjeux scientifiques autour de la science des données également en explorant des thèmes émergents tel que celui de l’explicabilité des méthodes d’IA.