J’ai effectué mon stage de fin d’études au LIFO (Laboratoire d’Informatique Fondamentale d’Orléans),
sous la direction d’Anaïs Halftermeyer et Sofiane Elguendouze.
Ce stage portait sur l’explicabilité des systèmes multimodaux, notamment l’explication de modèles de sous-titrage d’images via l’interprétation des corrélations texte-image.
📸 Galerie du stage – LIFO, Orléans
Clôture officielle du stage au LIFO, en présence de mes encadrants. Présentation de l'architecture du système développé et restitution des observations techniques et méthodologiques.
Photo souvenir avec Anaïs Halftermeyer et Sofiane Elguendouze, mes encadrants de stage. Ce stage a été une étape décisive dans ma trajectoire vers la recherche doctorale.
Schéma de la chaîne de traitement du système de sous-titrage d’images utilisé pendant mon stage. L’image montre la phase de préparation des données (objets à insérer, corpus), la génération d’images synthétiques, la phase de sous-titrage automatique par un modèle neuronal, puis l’explication du résultat par l’interprétation des légendes générées.
Affiche académique résumant les travaux réalisés lors de mon stage de recherche au Laboratoire d’Informatique Fondamentale d’Orléans (LIFO). Ce poster présente l’ensemble de la démarche expérimentale visant à étudier l’explicabilité des systèmes de légendage automatique d’images à partir de la saillance et de la position des objets visuels. Il synthétise les étapes méthodologiques, les résultats obtenus et les perspectives futures. Ce travail a été encadré par Anaïs Halftermeyer (Université d’Orléans) et Sofiane Elguendouze (LIFO).
Ce diagramme illustre les différents niveaux d’interprétation entre la perception visuelle et la génération de texte (NLP). Il met en évidence les problèmes d’opacité dans les systèmes IA, notamment les écarts entre la légende idéale et celle réellement produite par les modèles.
Distribution statistique des performances du modèle selon quatre cas de figures (1-1, 1-0, 0-1, 0-0) sur différentes régions géographiques. Ce résultat permet d’analyser la robustesse du système selon les variations contextuelles.
Durant mon master au Vietnam, j’ai appris à mobiliser des approches avancées en intelligence artificielle, notamment :
la conception de modèles à partir de zéro (from scratch),
le fine-tuning de réseaux profonds existants,
l’utilisation d’ontologies combinées au reinforcement learning,
les techniques de vision par ordinateur (reconnaissance faciale, détection d’objets),
l’apprentissage profond avec des CNN, RNN, Transformers,
les grands modèles de langage (LLMs) pour le NLP,
et les réseaux de neurones sur graphes (GNN).
Galerie photo
Présentation de mon projet TPE sur la reconnaissance faciale par deep learning, avec l'utilisation d'un casque VR pour illustrer une interaction immersive en IA appliquée.
Expérimentation d’un casque de réalité virtuelle (VR) pour explorer les interfaces intelligentes dans l’enseignement et les environnements immersifs.
Découverte du patrimoine culturel vietnamien : cette immersion dans le contexte local a enrichi ma perspective interdisciplinaire sur les enjeux de l’IA et de la culture.