Wafa Aissa
Je suis en dernière année de doctorat sous la direction de Michel Crucianu et Marin Ferecatu. Ma thèse porte sur le raisonnement visuel compositionel. Lorsqu'on présente une paire image-question à un modèle de réseau de neurones, notre objectif est que le modèle réponde à la question en suivant une chaîne de raisonnement définie par un programme. Nous évaluons la capacité de raisonnement du modèle dans le cadre de la Question Réponse Visuelle (QRV). La QRV compositionnelle décompose les questions complexes en sous-problèmes modulaires plus simples. Ces sous-problèmes incluent des compétences de raisonnement telles que la détection d'objets et d'attributs, la détection de relations, les opérations logiques, le dénombrement et les comparaisons. Chaque sous-problème est attribué à un module différent. Cette approche décourage les raccourcis, exigeant une compréhension explicite du problème. Elle favorise également la transparence et l'explicabilité.
2023
Articles de conférence
- Curriculum Learning for Compositional Visual Reasoning. In Proceedings of the 18th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications - Volume 5: VISAPP, pages 888-897, Scitepress, Lisbon, Portugal, 2023. doi www
- Multimodal Representations for Teacher-Guided Compositional Visual Reasoning. In Advanced Concepts for Intelligent Vision Systems, 21st International Conference (ACIVS 2023), pages 357-369, Springer Nature, Kumamoto, Japan, Lecture Notes in Computer Science 14124, 2023. doi www