L’équipe est très active, depuis plus de cinq ans, dans le domaine de l’indexation et de la recherche par le contenu visuel des images et vidéos. L’équipe a proposé de nouvelles méthodes de description basées sur des configurations géométriques de points d’intérêt, des index permettant de rendre efficaces la recherche par similarité et l’auto-jointure par similarité, ainsi que des techniques de fouille de données pour l’extraction de classifications complémentaires et pour l’identification interactives de classes. Ces travaux combinent des expertises en analyse d'images et de vidéos, en apprentissage statistique et en bases de données.Nos travaux actuels concernent la détection et la localisation d’actions dans de grandes collections vidéo (thèse de Andrei Stoian et projet ANR blanc international Mex-Culture, http://mexculture.cnam.fr), la détection interactive d’objets dans des images (post-doctorat de Pierre Blanchard et projet ANR POEME), la détection d’objets dans les images satellite en grande résolution (thèse de Hicham Randrianarivo avec l’ONERA), la recherche cross-modale dans des collections web (thèse de Thi Quynh Nhi Tran avec le CEA), l’extraction de vêtements dans des images de mode et la recherche par similarité (thèse de Lixuan Yang en CIFRE avec la start-up Check Lab).
Ces recherches se proposent d’étudier la production de modèles de langages musicaux caractérisant des corpus homogènes de musiques disponibles sous forme symbolique (partitions). Notre perspective est d'enrichir une approche statistique basée sur les données explicites (notes) par un processus d'extraction de connaissances identifiant les éléments du langage musical présents implicitement dans la notation : segmentation en phrases, présence et utilisation de motifs, gestion des dissonances, des cadences, instrumentation et texture. Une autre direction de recherche est le développement de techniques de transcription automatique, conversion d’une performance musicale vers une partition en notation traditionnelle par des modèles de partitions a priori (indépendants de la performance à transcrire), représentant le langage des notations musicales possibles. Ce sont des modèles de langage, composantes essentielles des procédures de traduction automatique ou de reconnaissance des motifs (par analogie avec le traitement de langues).
G
M
T
Y
Text-to-speech function is limited to 200 characters