Thèses et HDR référencées

Pour annoncer votre soutenance de thèse/HDR rendez-vous ici, pour déposer une thèse/HDR rendez-vous .

Soutenances de thèses/HDR à venir

Réseaux de neurones convolutifs pour la segmentation sémantique et l'apprentissage d'invariants de couleur
  • Auteur : Damien Fourure
  • Contact : damien.fourure@univ-st-etienne.fr
  • Type : Thèse
  • Lieu : Saint-Etienne, 18 Rue Professeur Benoît Lauras, Bâtiment D, Salle D03
  • Date et heure : 12 décembre 2017, 14h30
  • Directeur(s) de thèse: Alain TREMEAU, Professeur, Université Jean Monnet, Saint-Etienne –
    Christian WOLF, Maître de Conférences HDR, INSA Lyon – Rémi EMONET, Maître de Conférences, Université Jean
    Monnet, Saint-Etienne – Elisa FROMONT, Professeur, Université Rennes 1 – Damien MUSELET, Maître de Conférences,
    Université Jean Monnet, Saint-Etienne
  • Rapporteurs : Patrick PEREZ, Distinguished Scientist , PhD, Technicolor, Rennes – Nicolas
    THOME, Professeur CNAM Paris
  • Examinateurs : Thierry CHATEAU, Professeur, Université Blaise Pascal, Clermont-Ferrand -Mikaela KELLER, Maître de Conférences, INRIA Lille Nord Europe – Jakob VERBEEK, Maître de Conférences, HDR, INRIA Rhône-Alpes, Grenoble
  • Résumé : La vision par ordinateur est un domaine interdisciplinaire étudiant la manière dont les ordinateurs peuvent acquérir une compréhension de haut niveau à partir d’images ou de vidéos numériques. Dans cette thèse, nous étudions les réseaux de neurones convolutifs afin de développer des architectures et des fonctions de coûts spécialisées à des tâches aussi bien de bas niveau (la constance chromatique) que de haut niveau (la segmentation sémantique d’image). La constance chromatique est la capacité du système visuel humain à percevoir des couleurs constantes pour une surface malgré les changements dans le spectre de l’illumination (changement d’éclairage). En vision par ordinateur, l’approche principale consiste à estimer la couleur de l’illuminant puis à supprimer son impact sur la couleur perçue des objets. Nous abordons la tâche de constance chromatique avec l’utilisation des réseaux de neurones en développant une nouvelle architecture composée d’un opérateur de sous-échantillonnage inspiré des méthodes traditionnelles existantes. Nous apportons également deux contributions sur une problématique de haut niveau : la segmentation sémantique d’image. Cette tâche, qui consiste à attribuer une classe sémantique à chacun des pixels d’une image, constitue un défis en vision par ordinateur de par sa complexité.
    D’une part, elle requiert de nombreux exemples d’entraînement dont les vérités terrains sont coûteuses à obtenir.
    D’autre part, elle nécessite l’adaptation des réseaux de neurones convolutifs traditionnels afin d’obtenir une prédiction dite dense, c’est-à-dire, une prédiction pour chacun pixel présent dans l’image d’entrée.
    1) Pour résoudre la difficulté liée à l’acquisition de données d’entrainements, nous proposons une approche qui exploite simultanément plusieurs bases de données annotées avec différentes étiquettes.
    2) Nous présentons une nouvelle architecture de réseau de neurones convolutifs appelée GridNet spécialisée pour
    la segmentation sémantique d’image.
    Contrairement aux réseaux traditionnels, implémentés avec un unique chemin allant de l’entrée (l’image) à la
    sortie (la prédiction), notre architecture est implémentée sous forme de grille 2D permettant à plusieurs flux interconnectés de fonctionner à différentes résolutions.
    Nous terminons par une analyse des résultats empiriques obtenus avec notre architecture qui, bien qu’entraînée avec une initialisation aléatoire des poids, révèle de très bonnes performances, dépassant les approches populaires souvent pré-entraînés.
  • Mots-clés : intelligence artificielle ; machine learning ; deep learning ; convolutional neural networks ; semantic segmentation ; color constancy