Offres d’emploi

 N’hésitez pas à déposer vos offres d’emploi en apprentissage automatique (machine learning) en cliquant ici.

Intitulé: Professeur.e des universités en Intelligence Artificielle au Cnam Paris
Type d’offre d’emploi: Offre de poste dans l’académique
Détails de l’offre:

Un poste de professeur.e des universités en intelligence artificielle sera publié lors de la session synchronisée au Conservatoire National des Arts et Métiers (Paris).
Le laboratoire d’accueil est le CEDRIC (EA4629) : https://cedric.cnam.fr/
Le profil détaillé et les différents contacts se trouvent dans ce document : http://cedric.cnam.fr/lab/wp-content/uploads/2023/01/CnamParisPUIA2023.pdf

Date limite de candidature: 2023-03-30
Mail de contact: michel.crucianu@cnam.fr
Intitulé: ML researcher
Type d’offre d’emploi: Offre de poste dans l’industriel
Détails de l’offre:

Pour postuler et voir le descriptif de l’annonce : https://apply.workable.com/giskard/j/E89FE8E310/

Date limite de candidature: 2023-01-31
Mail de contact: jobs@giskard.ai
Intitulé: Digital Twin for CPS cognitive interoperability
Type d’offre d’emploi: Offre de thèse
Détails de l’offre:

Recent works on Cognitive Cyber-Physical Systems (C2PS) and Cognitive Digital Twins (CDT) focus on bringing Artificial Intelligence (AI) features to CPS to mainly give them reasoning and learning capabilities. Making them smart enough to become autonomous or helping humans in decision-making. The Digital Twin (DT) is used as a convenient tool to embed the cognitive functions and allowing for simulations before applying to the real system. A step forward for cognitive interoperability would be to take a human-centric approach, as integrated now into the Trustworthy AI , including knowledge formalisation and explainability for better human understanding. At its heart, there is the combination of symbolic AI based on knowledge/rule reasoning and statistical methods, with machine learning AI based on neural networks, leading to the Neuro-symbolic AI and Neural-Symbolic Computing, new trends that are considered by a part of the research community on the future of AI. Experiments made so far with deep learning have highlighted the two main advantages of neuro-symbolic approaches: less training data is required, and the reasoning process and its conclusions are explainable and understandable for humans. Finally, these approaches allow to build AI systems that are semantically sound, explainable, and trustworthy. Given these capabilities, neuro-symbolic approaches have a high potential for building interoperable C2PS, with adaptive interactions between C2PS and human workers, and automated reconfigurations of C2PS understandable to the human supervisor thanks to explainable AI. This is what we investigate in the AI4C2PS project as a step towards cognitive interoperability, building on the CDT concept.

The PhD candidate will analyse and demonstrate how bridging the reality gap in the emulation of CPS-CPS and CPS-HUMAN interactions to formalize a so-called ‘cognitive interoperability’ in the Cyber-Physical Enterprise (CPE). .. To ensure semantic interoperability across the different components and to build cognitive interoperability on top of it, industry standards will be identified and used where required. The project will be driven by pilots, which will (1) feed the research tasks by providing access to real world requirements and data and will (2) offer the opportunity to deploy and assess the technologies developed from research works in real production environments. To validate the integration capability, the developed technologies will be integrated into Orisun’s existing platform. This integration will create a complete Proof-Of-Concept (POC) for our vision of a CPE platform implementing the high-level architecture. This POC will be deployed and validated in real-world scenarios. Our French pilot will be AIPL S.MART, a Smart industry 4.0 platform and workshop at UL.

This PhD project is part of a bilateral research project between the CRAN, the ITIS department of the Luxembourg Institute of Science and Technology (LIST -http://www.list.lu), in Luxembourg, and the ORISUN company, Strasbourg, France, dealing with applications of artificial intelligence for cognitive interoperability in cyber-physical enterprises: AI4C2PS. The candidate will be registered at the University of Lorraine (doctoral school IAEM Lorraine) as a PhD candidate and will be integrated in the ISET research department of CRAN with strong collaboration with the HUMOD research group of ITIS/LIST. The main workplace will be in CRAN offices in Nancy, while some time will be spent in in Esch/Alzette, Luxembourg, in LIST offices. The Sustainable Systems Engineering (ISET) department, with its 50 researchers and engineers, studies the digital transformation of complex sustainable systems, which are mainly in the application fields of industry 4.0 (also called the Industry of the Future), communication networks, transport, building and energy, and the future of so called digital twins (DT).

Date limite de candidature: 2023-01-02
Mail de contact: herve.panetto@univ-lorraine.fr
Intitulé: Post-doc offer on Computer Vision and semi-supervised representation learning
Type d’offre d’emploi: Offre de post-doc
Détails de l’offre:

Dear all,
we have an open 24-month post-doc position on Computer Vision and semi-supervised representation learning at the LIRIS lab in Lyon.
This is part of a French-German (ANR) research project on resource-efficient tunnel construction involving several academic and industrial partners from both countries in the domains Computer Science (AI) and Geology/Geophysics. The post-doc will be supervised by Stefan Duffner (LIRIS, Imagine team, INSA Lyon) and Catherine Pothier (LIRIS, Imagine team, INSA Lyon).
Requirements :
– Master in computer science, CV, ML, applied mathematics or related
– Good python programming skills
– Autonomy and interdisciplinary curiosity
More details can be found here: https://partage.liris.cnrs.fr/index.php/s/6RjzwjfYJ6tnJ3H
Best regards,
Stefan Duffner

Date limite de candidature: 2023-04-01
Mail de contact: stefan.duffner@liris.cnrs.fr
Intitulé: Master Internship: Neural Network compression by optimising weight quantisation
Type d’offre d’emploi: Offre de stage
Détails de l’offre:

Dear all,
we have an open 5-6 month internship position starting from February/March/April at LIRIS (CNRS) in Lyon.
The internship will be in collaboration with engineers from the SATT Pulsalys in Lyon.
Requirements :
– Master in computer science, ML, applied mathematics or related
– Good python programming skills and some experience with PyTorch
– Good knowledge of neural networks, in particular CNNs
– Basic knowledge on (non-convex) optimisation
– Autonomy
More details can be found here: https://partage.liris.cnrs.fr/index.php/s/4XXx4zFsjrriHgj
Best regards,
Stefan Duffner

Date limite de candidature: 2023-02-01
Mail de contact: stefan.duffner@liris.cnrs.fr
Intitulé: Internship: Explainable machine learning for exploring consciousness recovery of coma patients
Type d’offre d’emploi: Offre de stage
Détails de l’offre:

Dear all,
we have an open 5-6 month internship position starting from February/March/April at LIRIS (CNRS) and CRNL in Lyon.
This is part of a multidisciplinary research project between Computer Science (AI) and Neurosciences supervised by Stefan Duffner (LIRIS) and Fabien Perrin (CRNL).
Requirements :
– Master in computer science, CV, ML, applied mathematics or related
– Good python programming skills
– Autonomy and interdisciplinary curiosity
More details can be found here: https://partage.liris.cnrs.fr/index.php/s/bqN7fcmZ2p2YfiH
Best regards,
Stefan Duffner

Date limite de candidature: 2023-02-01
Mail de contact: stefan.duffner@liris.cnrs.fr
Intitulé: Generating instructions in natural language for robots
Type d’offre d’emploi: Offre de stage
Détails de l’offre:

Autonomous agents require reasoning and planning strategies for performing tasks.

Natural language can serve for building and clarifying the planning strategy, and therefore the actions done by a robot. Several works have addressed instruction identification as abstract representation [2, 4, 5] or natural language expression, but the limited data supervision is often a challenge [3, 5]. To tackle this issue, we propose to develop interactive training processes, which imply asking humans to label situations with sentences, with strong care on limiting interactions to a few relevant situations, to reduce human effort. The underlying assumption is that the compositionality of language is correlated to compositionality in the agent’s world. In this internship, we envision working on the generation of natural language instructions and improve currents model. Our objective is to enhance the semantics behind objects to identify the most relevant actions/sub-actions.

More info: https://mlia.isir.upmc.fr/jobs.html

Date limite de candidature: 2023-04-01
Mail de contact: laure.soulier@isir.upmc.fr ; nicolas.thome@isir.upmc.fr
Intitulé: Cross-language continual learning for conversational systems
Type d’offre d’emploi: Offre de stage
Détails de l’offre:

In this internship, we assume that the deployment of virtual assistants can be done step by step over different countries in the world and, thus, that virtual assistants will face different languages at different timestamp. We propose a continual learning setting in which the task is fixed, but the stream is based on different languages. The model learn the knowledge of language peculiarities. Therefore, to satisfy the initial condition of virtual assistants to address different languages, we therefore need to ensure that our task-based model does not forget previous languages while training on new ones.

Two preliminary works have been done: 1) [Coria et al., 2022], investigating BERT’s cross-lingual transfer capabilities in two continual sequence labeling tasks. 2) [Gerald and Soulier, 2022] designing continual learning streams for information retrieval. In practice, we will focus on the Massively Multilingual NLU 2022 data [FitzGerald et al., 2022], which includes slot-filling and NER tasks for 51 languages in parallel. The objective of the internship will be to 1) build a stream of languages for a given task, 2) run baseline models in the stream, and 3) design a continual learning model for cross-lingual transfer.

More info: https://mlia.isir.upmc.fr/jobs.html

Date limite de candidature: 2023-03-01
Mail de contact: sahar.ghannay@lisn.fr, laure.soulier@isir.upmc.fr, christophe.servan@lisn.fr, sophie.rosset@lisn.fr
Intitulé: Personalized data-to-text neural generation
Type d’offre d’emploi: Offre de stage
Détails de l’offre:

In this internship we are interested in a special case of text generation, which is data-to-text generation. In this setting, the task is to generate sentences in natural language based on structured or semi-structured data. To provide a data to text example, a famous academic dataset is made of statistics of baseball games paired with human written summary of the game, that we ultimately want to the system to learn to generate. Beyond this toy example, data to text is of the utmost practical interests in many scenarios such as finance, . . . This task is a special case in text generation and comes with its own specific challenges. The data to text models are prone to hallucinations, that is generating grammatically correct but irrelevant and out of the blue sentences . Moreover, the inputs being structured or semi-structured data, this calls for alternative solution to encode w.r.t. standard texts inputs made of sequence of tokens arranged as sentences.

The objective of the internship is to develop a neural data to text system able to personalize the text generation. Based on a previous work, we will first focus on a movie dataset in which we dispose of movie tabular description (the data), and reviews. The objective will be to personalize review for a given user. Secondly, while there exists studies on how to evaluate data to text generator, to the best of our knowledge none consider style transfer/text personalization for text generation besides. As such, finding means to perform style transfer evaluation for data to text generators is fully part of the internship, on top of finding neural solution to perform style transfer aware data to text. The evaluation we seek has to be automatic or semi automatic.

More info: https://mlia.isir.upmc.fr/jobs.html

Date limite de candidature: 2023-04-01
Mail de contact: laure.soulier@isir.upmc.fr ; christophe.gravier@univ-st-etienne.fr
Intitulé: Maitre de Conférences Associé – Université Grenoble Alpes
Type d’offre d’emploi: Offre de poste dans l’académique
Détails de l’offre:

Contrat MAST de 3 ans, renouvelable 2 fois. La personne recrutée intervient à hauteur typiquement d’une journée à une journée et demie par semaine à l’université. Elle est chargée :
– d’enseignements (96h eq TD / an) auprès des étudiants: elle interviendra bien sûr prioritairement sur des aspects sur lesquels les enseignants universitaires sont peu / pas / moins compétents (gestion de projets, cours spécialisés sur le domaine de la personne recrutée…)
– de missions annexes, à définir avec elle, qui peuvent être liées à la recherche (participation à une équipe de recherche) et/ou aux relations avec les entreprises (par exemple en s’impliquant dans AMIES et MaiMoSINe).
Le contenu exact de la mission sera à définir en concertation avec la personne recrutée. Celle-ci doit avoir un emploi principal par ailleurs.

Les candidatures sont ouvertes en ligne sur la page emploi de l’Université Grenoble Alpes, jusqu’au 10 novembre.

Date limite de candidature: 2022-11-10
Mail de contact: Eric.Blayo@univ-grenoble-alpes.fr
Intitulé: Machine Learning for chemical reaction prediction
Type d’offre d’emploi: Offre de post-doc
Détails de l’offre:

A post-doctoral position on learning from chemical molecules is available in the Machine Learning team of the LITS lab at INSA Rouen Normandy, France. The pursued goal is to design machine learning algorithms in order to predict/optimize the asymmetric synthesis cyclopropane compounds that are present in the structure of many drugs, based on the chemical reactants, the catalysts, and the experimental conditions.

This position is funded by the Normandy Region project CYCLIA, a joint project that fosters the expertise of the LITIS and the COBRA laboratory at INSA Rouen Normandy.

Research topics of interest include but are not limited to:
– molecules representation learning approaches,
– deep learning approaches,
– transfer learning,
– development of new algorithmic approaches,
– proper evaluation of designed algorithms.

The position is for one year
The expected salary is 2172 euros NET per month (gross salary: 2,700 euros), including health care.

More information with application procedure available at https://gasso.pages.insa-rouen.fr/home/#jobs

Contacts: {gilles.gasso, samia.ainouz, benoit.gauzere}@insa-rouen.fr

Date limite de candidature: 2022-12-15
Mail de contact: gilles.gasso@insa-rouen.fr
Intitulé: Regularity and Invertibility of BregmaNets
Type d’offre d’emploi: Offre de stage
Détails de l’offre: Supervisor: Jordan Frecon-Deloire (https://jordan-frecon.com/)
Mail: jordan.frecon.deloire@univ-st-etienne.fr
Location: Laboratoire Hubert Curien, Saint-Etienne, France
Team: Data Intelligence
Level: Master 2 / 3rd year of engineering school
Gratuity: ≃ 540 euros/month
————————-

Description
Bregman Neural Networks [1] (BregmaNets) are a novel class of neural networks, reminiscent of ResNets, additionally involving the inverse of the activation function. Experimentally, they have shown more robust prediction performance than their standard counterparts. However, their stability has not yet been theoretically grounded. This internship proposal aims to tailor the latest advances in the study of the Lipschitz regularity of neural networks in order to i) elucidate the added robustness of BregmaNets and ii) develop invertible BregmaNets. The first part will be devoted to the design of an upper bound on the Lipschitz constant by hinging on the compositional form of BregmaNets [2]. A refined estimation through a PyTorch toolbox will also be considered. The second part will focus on the conditions permitting to enforce the invertibility of BregmaNets. To this purpose, the previous results on the Lipschitz continuity will be of upmost importance in order to extend the results from ResNets [3] to BregmaNets.

Expected results
• Bibliographical study on the Lipschitz regularity of neural networks
• Derivation of an upper-bound of the Lipschitz constant of BregmaNets
• Design of a PyTorch toolbox to analyze the sensitivity of BregmaNets
• A publication in a leading journal or conference could be considered depending on the results

Candidate profile
A strong background in mathematical analysis is required. Python and PyTorch skills are welcomed

References
[1] Frecon, J., Gasso, G., Pontil, M. & Salzo, S. (2022). Bregman Neural Networks. Proceedings of the 39th International Conference on Machine Learning. 162:6779-6792.
[2] Gupta, K., Kaaka, F., Pesquet-Popescu, B., Pesquet, J.-C. & Malliaros, F.D. (2022) Multivariate Lipschitz Analysis of the Stability of Neural Networks. Front. Sig. Proc.. 2:794469.
[3] Behrmann, J., Grathwohl, W., Chen, R., Duvenaud, D. & Jacobsen, J. (2019). Invertible Residual Networks. Proceedings of the 36th International Conference on Machine Learning. 97:573-582

Date limite de candidature: 2023-01-01
Mail de contact: jordan.frecon.deloire@univ-st-etienne.fr
Intitulé: Variational Contrastive Learning
Type d’offre d’emploi: Offre de stage
Détails de l’offre:

Contexte et problématique
L’apprentissage autosupervisé de représentation est un domaine actuellement actif et qui traite de problématiques telles que:
– L’apprentissage sans supervision humaine, et l’utilisation de données non annotées;
– L’apprentissage des représentations générales applicables à des tâches en aval;
– Le pré-entraînement de réseaux de neurones pour le transfert d’apprentissage.

Ces problématiques sont clef en intelligence artificielle et en traitement d’images, et une avancée dans leur résolution permettrait l’utilisation de l’apprentissage profond dans des domaines d’applications souffrant d’un manque de données. Cela aiderait aussi à réduire les coûts de calcul pour l’entraînement de tâches en aval comparativement à la méthode habituelle bout en bout.

Les approches récentes d’apprentissage autosupervisé de représentation visuelle, reposent sur des réseaux de neurones siamois effectuant une tâche contrastive de discrimination d’instance. Et bien que ces méthodes diffèrent légèrement les unes des autres en termes d’architecture et de tâche apprise, le principe sous-jacent reste le même: l’objectif est d’apprendre un espace latent où deux vues d’une même image (des augmentations de données), ont des représentations similaires, le tout en utilisant différentes astuces pour éviter un effondrement vers des solutions simples. L’intuition est que des entrées synthétiques similaires représentent des concepts similaires, et donc doivent avoir des représentations similaires.

Cependant, bien que ces méthodes évitent un effondrement total des représentations, elles souffrent quand même d’un effondrement partiel de leurs dimensions, c’est-à-dire que même si les représentations sont différentes les unes des autres, une partie de leurs dimensions sont fortement corrélées entre elles. D’un point de vue théorique, cela montre que les représentations n’exploitent pas pleinement les dimensions mises à disposition et que les diverses contraintes imposées par ces modèles pour éviter un effondrement ne fonctionnent que partiellement. D’un point de vue pratique cela tend à produire des représentations dont la qualité est dégradée.

D’autre part, avant l’apparition de ces méthodes dites contrastives, l’état de l’art en apprentissage de représentation reposait sur l’utilisation d’auto-encodeurs variationnels. Ces derniers sont une amélioration des auto-encodeurs où les représentations prennent la forme de distributions statistiques au lieu de points dans un espace latent. L’ajout de cet aspect probabiliste permet de lisser l’espace de représentations, mais aussi de démêler les différentes dimensions des représentations apprises, menant ainsi à des représentations de meilleure qualité comparées à celles apprises par un simple auto-encodeur.

Description du sujet
Bien que l’avancée obtenue avec les auto-encodeurs variationnels ait eu un impact important dans le domaine de l’apprentissage de représentation, les méthodes contrastives de l’état de l’art ne capitalisent pas sur ses principes. Sachant que les auto-encodeurs variationnels permettent d’apprendre des caractéristiques décorrélées et que la décorrélation de caractéristiques a un impact positif sur l’effondrement dans les représentations.

Le sujet du stage consiste à étudier si les représentations apprises par ces méthodes contrastives récentes peuvent bénéficier d’un aspect variationnel avec les tâches suivantes:
– proposer une modification des méthodes actuelles pour que les représentations produites soient des distributions et non des points dans l’espace de représentation
– étudier comment régulariser les distributions produites, comme c’est le cas dans les auto-encodeurs variationnels, afin d’éviter toute forme d’effondrement. Cela nécessitera un travail d’adaptation étant donné que les méthodes d’apprentissage contrastif récentes utilisent un espace latent contraint à une hypersphère, là où les auto-encodeurs variationnels demandent un espace latent sans contrainte

Date limite de candidature: 2023-03-31
Mail de contact: mathieu.lefort@liris.cnrs.fr
Intitulé: [Stage M2] 2 stages en deep learning / apprentissage de représentation
Type d’offre d’emploi: Offre de stage
Détails de l’offre:

Dans le cadre du projet MERLE (Multimodal Effective Representation Learning of Evolution of birds) qui vise à l’apprentissage profond de représentations multimodales pertinentes pour la modélisation de l’évolution en biologie, nous recherchons 2 stagiaires de M2 en deep learning.
Plus d’informations peuvent être trouvées ici: https://perso.liris.cnrs.fr/mathieu.lefort/jobs/stage/Merle/sujet1.pdf et https://perso.liris.cnrs.fr/mathieu.lefort/jobs/stage/Merle/sujet2.pdf

Date limite de candidature: 2022-12-31
Mail de contact: mathieu.lefort@liris.cnrs.fr
Intitulé: CDD de Post Doc en Apprentissage Automatique pour la robotique sociale @ LIRIS, UCBL
Type d’offre d’emploi: Offre de post-doc
Détails de l’offre:

Durée: 15 mois (Potentiellement extensible à 18 mois) – Début prévu en janvier 2023
Projet: PepperMint financé par ASLAN Labex
Partenaires: LIRIS (SyCoSMA, SAARA Teams), ICAR (InSitu Team), Université d’Oulu-Finlande (GenZ),
Encadrement : Pr. Salima Hassas, Dr Mathieu Lefort

Contexte
PepperMint (Interagir avec Pepper: apprentissage mutuel des pratiques de tour de rôle en IHR) est financé par le Labex ASLAN. Il propose une étude exploratoire des pratiques incarnées de prise de tour dans l’Interaction Humain-Robot (IHR) permettant d’améliorer les capacités sociales des robots et rendre l’IHR plus naturelle pour les humains. Le projet initie une coopération entre des chercheurs en Intelligence Artificielle (IA) (LIRIS) et l’Analyse Conversationnelle (AC) (ICAR et GenZ Oulu -Finlande). Il étudie si et comment les résultats de l’AC sur l’interaction naturelle peuvent être utilisés pour développer des modèles d’IA innovants et efficaces pour l’IHR. Le projet est fondé sur une analyse multimodale détaillée de la prise de tour dans l’IHR en condition naturelle, mettant en avant l’émergence de l’allocation de tours en tant que pratiques séquentielles et multimodales complexes.

Le projet s’appuie sur des travaux de l’état de l’art en IA/ AA (Apprentissage Automatique) pour programmer une application d’accueil et d’orientation de personnes dans une bibliothèque universitaire. Dans un premier temps nous avons enregistré des interactions humain-robot basées sur une première version du robot avec des algorithmes / outils de l’état de l’art relatifs aux approches ad-hoc de turn-taking. Ces données sont utilisées dans les études en AC pour identifier les interactions réussies. L’objectif de ce post doc est d’utiliser ces données annotées pour l’apprentissage automatique afin de proposer de nouveaux modèles d’IA pour l’IHR, couplant l’apprentissage développemental et les résultats de l’AC. Les missions du/de la post doctorant.e seront:
– Étudier de l’état de l’art des algorithmes de turn-taking.
– Collaborer avec un Post-doc du domaine de l’Analyse Conversationnelle (AC), pour nettoyer et préparer les données annotées, qui seront produites par les chercheur.e.s en AC, et créer de nouveaux algorithmes pour l’AA basés sur les résultats de l’AC.
– Développer une nouvelle version de l’application IHR avec de nouveaux algorithmes d’apprentissage (developmental) pour améliorer les pratiques de Turn-Taking en IHR.
– Contribuer aux activités de communication (scientifique) du projet PepperMint.

Compétences requises:
Nous recherchons une post doctorant.e pour rejoindre notre équipe projet interdisciplinaire composée de chercheur.e.s, d’ingénieurs et d’utilisateur.rice dans le domaine de l’IA, de la robotique sociale et de l’Analyse Conversationnelle. Le.a candidat.e idéal.e aura les compétences et expériences suivantes:
– Une forte expertise / expérience en IA et Apprentissage Automatique
– De bonnes compétences en développement / programmation en programmation orientée objet (Java, C ++, Python) – Une bonne maîtrise de l’anglais écrit
– Ouverture d’esprit, travail d’équipe, autonomie et capacité à interagir avec d’autres disciplines comme les sciences sociales. – Intérêt dans la recherche interdisciplinaire
– Des compétences/ connaissances en robotique sociale (Interaction Humain Robot), seraient un plus. <\p>

Candidatures:
Les candidatures doivent inclure un curriculum vitae détaillé, une lettre de motivation et les contacts de 2 personnes référentes.
Les candidatures et les lettres doivent être envoyées par courrier électronique à: Salima.Hassas@liris.cnrs.fr, Mathieu.Lefort@liris.cnrs.fr et heike.baldaufquilliatre@ens-lyon.fr.

Date limite pour la réception des candidatures: 20 octobre 2022
(Veuillez noter que 2 à 3 mois seront pris par l’administration pour la pris par l’administration pour la procédure d’embauche)

Environnement de travail:
Le.a. candidat.e recruté.e sera employé.e par le CNRS, UCBL, au Laboratoire LIRIS, Lyon.

Date limite de candidature: 2022-10-20
Mail de contact: Mathieu.Lefort@liris.cnrs.fr
Intitulé: Apprentissage pour la reconnaissance d’intention et la gestion de conversations
Type d’offre d’emploi: Offre de thèse
Détails de l’offre:

Accueil : Équipe SyCoSMA, Laboratoire LIRIS / entreprise Reecall, Lyon, contexte CIFRE

Période : à partir de Novembre 2022 (à discuter), pour une durée de 3 ans

Mots-clefs : deep learning, agents conversationnels, IA, traitement naturel du langage (NLP), reconnaissance d’intentions (NLU), few shot learning, active learning, goal-oriented dialog systems

Rémunération : 33/37 K€ brut annuel suivant profil

Sujet détaillé : https://perso.liris.cnrs.fr/frederic.armetta/sujetTheseNLP-2022.pdf

Date limite de candidature: 2022-12-31
Mail de contact: frederic.armetta@univ-lyon1.fr
Intitulé: Vers une approche moins coûteuse d’apprentissage auto-supervisé de traitement de la parole
Type d’offre d’emploi: Offre de post-doc
Détails de l’offre:

Pour candidater : https://orange.jobs/jobs/v3/offers/116910?lang=fr

Le domaine du traitement de la parole a connu un tournant important ces dernières années avec l’apparition de modèles complètement neuronaux. Ces modèles ont d’abord été entraînés de manière supervisée, c’est-à-dire en disposant pour chaque enregistrement audio d’une annotation manuelle. Les modèles purement neuronaux bénéficient grandement d’un entraînement sur de larges corpus et cela implique donc d’utiliser de plus en plus de données. Or, le coût d’annotation s’est vite révélé prohibitif.

L’apprentissage auto-supervisé constitue une solution naturelle à ce problème.

On retrouve de nombreux travaux en traitement du texte [1,2] et de l’image [3,4] qui ont ouvert la porte à ce type d’approche et permis d’utiliser plus de données, sans supervision humaine. Concernant le traitement de la parole en audio, des méthodes ont également été proposées, souvent inspirées des approches en texte et image, et ont apporté des gains de performances sur différentes tâches de traitement de la parole [5]. Néanmoins, l’adoption de telles approches reste conditionnée par leur coût. En effet, l’entraînement nécessite des ressources très importantes (e.g. 16000 heures GPU [6]).

Le but du post-doc sera de développer des approches permettant de limiter les ressources nécessaires à l’entraînement et à l’utilisation des modèles auto-supervisés de la langue parlée, afin d’en démocratiser l’usage. Par ailleurs, il s’agira de mieux saisir les mécanismes entrant en jeu dans la qualité d’un apprentissage auto-supervisé.

Plusieurs pistes pourront être explorées :
– Analyse du comportement du modèle durant l’entraînement
– Construire une architecture plus efficace
– Explorer les critères d’entraînement
– Travailler sur les données utilisées

Verrou technique : difficulté de mise en œuvre de l’entraînement des modèles SSL
– Dans un contexte de ressources limitées
– Avec des « engineering tricks » qui ont des impacts très importants (e.g. dynamic batching)
– Avec des difficultés rencontrées par la communauté pour reproduire les résultats

Verrous scientifiques
– Evolution rapide de l’état de l’art, obligeant à une veille scientifique continue
– Une compréhension fine des méthodes nécessaire

[1] Mikolov, T. et al. Efficient estimation of word representations in vector space. ICLR Workshop 2013

[2] Devlin, J. et al. Bert: Pre-training of deep bidirectional transformers for language understanding. NAACL-HLT 2018

[3] Grill, J. B. et al. Bootstrap your own latent-a new approach to self-supervised learning. NeurIPS 2020

[4] Chen, T. et al. A simple framework for contrastive learning of visual representations. ICML 2020

[5] Yang, S. W. et al. Superb: Speech processing universal performance benchmark. Interspeech 2021

[6] Baevski, A. et al. wav2vec 2.0: A framework for self-supervised learning of speech representations. NeurIPS 2020

Date limite de candidature: 2022-12-01
Mail de contact: valentin.vielzeuf@orange.com
Intitulé: Intelligence artificielle et Génomique
Type d’offre d’emploi: Offre de thèse
Détails de l’offre:

Intelligence artificielle et Génomique

L’utilisation de génomes complets est un outil particulièrement important pour la compréhension des organismes vivants, notamment pour la médecine (maladies génétiques / cancers) ou l’agronomie (amélioration génétique). Les nouvelles de techniques de séquençages, produisant notamment des lectures longues de bonne qualité, rendent l’assemblage de génomes complets à la portée de tous. Cependant, lors de l’assemblage de génomes, des erreurs se produisent souvent.

Dans ce contexte, l’intelligence artificielle, et notamment le deep learning, sont en plein boom et révolutionnent la science comme en médecine avec AlphaFold pour la prédiction de structures de protéines 3D. Ici, le deep learning permettra d’identifier les erreur d’assemblage afin de corriger l’assemblage de génomes.

Le stage se basera sur des résultats préliminaires très encourageants montrant le grand intérêt du deep learning.

Dans le cadre de ce stage, le candidat aura en charge de :
– Évaluer un prototype de classificateur basé sur un réseau de neurones conçu par les encadrants.
– Proposer et implémenter des modifications dans la génération d’exemples négatifs et positifs.
– Optimiser le réseau de neurones.

Profil
Diplôme requis: Master/Ingénieur (Bac + 5)
Formation: informatique, statistique, ou bio-informatique
Connaissances:
– Bases de programmation (python)
– Bases de deep-learning (Keras, Tensorflow)
– Bases en génomique
– Utilisation de Linux
– Maîtrise de l’Anglais écrit

Accueil
– Lieu d’accueil: INRAE Occitanie, MIAT, Castanet-Tolosan
– Type de contrat: Stage
– Durée du contrat: 6 mois
– Début souhaité: début 2023
– Rémunération: gratification

Modalités pour postuler: envoyer CV et lettre de motivation à raphael.mourad@univ-tlse3.fr et matthias.zytnicki@inrae.fr

Candidature
– Procédure : envoyer CV et lettre de motivation
– Date limite : 14 novembre 2022

Contacts
Raphaël Mourad, Matthias Zytnicki
raphael.mourad@univ-tlse3.fr

Date limite de candidature: 2022-12-30
Mail de contact: raphael.mourad@univ-tlse3.fr
Intitulé: Apprentissage pour la reconnaissance d’intention et la gestion de conversations
Type d’offre d’emploi: Offre de thèse
Détails de l’offre:

Sujet détaillé : https://perso.liris.cnrs.fr/frederic.armetta/sujetTheseNLP-2022.pdf

Mots-clefs : deep learning, agents conversationnels, IA, traitement naturel du langage (NLP), reconnaissance d’intentions (NLU), few shot learning, active learning, goal-oriented dialog systems

Accueil : Equipe SyCoSMA (Laboratoire LIRIS) / entreprise Reecall, Lyon, contexte CIFRE

Période : à partir de Novembre 2022 (à discuter), pour une durée de 3 ans

Candidatures (CV, lettre de motivation, etc.) et renseignements : frederic.armetta(a)univ-lyon1.fr

Rémunération : 33/37 K€ brut annuel suivant profil

Date limite de candidature: 2023-01-01
Mail de contact: frederic.armetta@univ-lyon1.fr