Institut Fayol – Mines St Etienne

Offre post-doctorat en sciences de données : NLP, deep-clustering, classification et deep learning appliqués à l’analyse des défauts en production micro-électronique

Problématique, Objectifs et Mission de recherche

La spécificité d’un laboratoire d’analyse des défaillances est d’opérer un certain nombre de tâches de diagnostic électriques, physiques et chimiques, sur les supports micro-électroniques qui contiennent les composants électroniques susceptibles d’être atteint par un défaut (défaillance). Lors de cette analyse, la succession des tâches de diagnostic dépend des résultats observés jusqu’à l’étape t ; la décision pour le choix de l’étape de diagnostic suivant t+1 dépend des résultats obtenus avant la phase t, et de l’expertise humaine. Ce processus complet de diagnostic, appliqué à un support électronique sur lequel un défaut a été observé, peut être vu comme un parcours sur un graphe de décision où chaque nœud est un choix parmi un ensemble d’alternatives possibles (alternatives : quelle est l’étape de diagnostic suivante à réaliser ?). Les résultats de chaque tâche de diagnostic se présentent sous la forme de données variées (notamment d’importantes bases de données d’imagerie par microscopies diverses, de signaux physiques, de mesures, de données textuelles …) qui sont utilisées par l’analyste pour la construction de son diagnostic final : une hypothèse explicative de la défaillance analysée.

En collaboration avec un doctorant et avec l’équipe de recherche, le post-doctorant sera en situation d’assurer le pilotage opérationnel du déroulement de certaines des tâches scientifiques à réaliser durant le projet. Le post-doctorant prendra lui-même en charge les travaux relevant de l’apprentissage supervisés. Les travaux scientifiques à développer viseront à la fois des avancées scientifiques et théoriques et la réalisation de preuves de concepts démontrées à partir de données réalistes issues du milieu industriel, dans le but de favoriser l’intégration ultérieure des résultats par les industriels.

Le post-doctorant travaillera notamment sur les tâches suivantes, qui s’appuieront sur la mise à disposition de données industrielles historiques résultant de la sauvegarde de processus complets d’analyse de défaillance (depuis la requête de diagnostic, jusqu’au diagnostic final) :

  • Appliquer des techniques NLP (prétraitement, vectorisation, etc.) et de réduction de dimension (e.g. Variational Auto-Encoder (VAE), Multiple Correspondence Analysis (MCA), etc.) dans le but d’optimiser la représentation de l’espace de décision formé essentiellement de données textuelles et catégorielles.
  • Mobiliser les techniques de clustering, de classification et de deep learning dans le but de déterminer des liens de corrélations entre d’une part (i) l’ensemble des données représentant la demande initiale de diagnostic et d’autre part (ii) l’ensemble des données représentant le diagnostic final résultant des analyses. Ces travaux supposent de traiter des données industrielles pour la plupart catégorielles ou textuelles, et d’analyser comparativement les performances de plusieurs techniques possibles pour l’identification de ces corrélations.
  • Articuler puis intégrer les résultats précédents, avec un deuxième volet de travaux en cours de développement par un doctorant de l’équipe de recherche, qui mobilise cette fois ci non plus les données liées au diagnostic final, mais les données liées aux résultats de chaque phase intermédiaire de diagnostic.

Profil du candidat

Le candidat en post-doctorat devra disposer des compétences initiales de niveau ingénieur/M2 dans le domaine des mathématiques appliquées, avec une orientation vers les sciences des données, les modèles probabilistes, le machine learning, le deep learning. Il devra avoir soutenu sa thèse au moment du démarrage de poste (les candidats ‘ingénieur de recherche’, non titulaires de doctorat mais avec une forte expérience dans le domaine peuvent nous contacter directement).

Un parcours de recherche et des expériences dans un ou plusieurs des domaines suivants seront appréciées :

  • Mathématiques appliquées, orientées vers l’analyse et le traitement des données ;
  • Science des données, Machine learning, Deep learning, identification de modèles.
  • Capacités à traiter des données qualitatives et/ou textuelles
  • Maitriser les langages de programmation : Python et R.
  • Apprentissage supervisé, Clustering, Classication
  • Motivation pour l’application des méthodes développées, notamment pour le diagnostic en contexte industriel.

Bien sûr un intérêt ou des expériences complémentaires en lien avec l’industrie de la microélectronique seront également appréciées. Une capacité à publier en revue scientifique, ainsi qu’un bon niveau d’anglais sont attendus.

Les dossiers de candidature sont à déposer sur la plateforme RECRUITEE le 30 novembre  2021 au plus tard

URL de dépôt de candidature : https://institutminestelecom.recruitee.com/o/postdoctorat-en-sciences-de-donnees-institut-henri-fayol

Pour en savoir plus

Pr Xavier BOUCHER , tel(Tel: +33 (0)4 77 42 01 33, boucher@emse.fr

Pr. Mireille BATTON-HUBERT, Tel: +33 (0)4 77 42 00 93, mireille.batton-hubert@emse.fr

Consulter l’offre.

#LIMOS

Commentaires Clos.