L’Institut Fayol et son département Informatique et systèmes intelligents (ISI) et le Laboratoire d’informatique, de modélisation et d’optimisation des systèmes (LIMOS, UMR 6158) recrutent un·e doctorant·e en représentation des connaissances et apprentissage statistique, pour des travaux à l’intersection entre numérique, souveraineté et développement durable.
La thèse vise à trouver des alternatives aux grands modèles de langages (LLM), caractérisés par un grand nombre de paramètres et/ou un grand nombre de symboles dans leur corpus d’apprentissage. L’utilisation des LLM est synonyme d’une dépense énergétique considérable, dans leur phase d’apprentissage comme dans leur phase d’utilisation (inférence), et d’un manque de transparence sur le texte produit. L’objectif de la thèse sera de montrer que les graphes de connaissances tels que DBpedia, BabelNet ou ConceptNet peuvent être une solution à ces deux problèmes. Ils sont déjà largement utilisés pour des tâches de question-réponse, malgré une incomplétude notoire sur la modélisation physique (le raisonnement spatio-temporel, entre autres). L’incomplétude d’un grand graphe de connaissances peut être compensée par l’apprentissage de représentations vectorielles des principaux concepts du graphe (son ontologie fondationnelle), dont les propriétés géométriques restent interprétables sémantiquement.
Profil recherché
Connaissances, savoirs :
- Diplôme de niveau Bac+5 dans les domaines de l’informatique, des sciences des données ou des mathématiques appliquées
- Connaissances en :
- apprentissage statistique et/ou traitement automatique de la langue
- logique formelle et/ou Web sémantique
- (grandes) bases de données et/ou bases de données en graphe
Savoir-faire :
- Maîtriser les techniques d’expression écrite et orale (rédaction de rapports ou de documents de synthèse, restitutions orales…)
- Trouver un équilibre entre considérations théoriques (mathématiques) et mise en œuvre pratique d’expérimentations
Savoir-être :
- Autonomie et sens de l’initiative
- Curiosité intellectuelle et proactivité envers la technique (identification de problèmes, recherche de solutions, documentation personnelle, …)
Modalités de candidature
Les dossiers de candidature (CV, lettre de motivation, lettre de recommandation le cas échéant) sont à déposer sur la plateforme RECRUITEE au plus tard le 5 mai 2024 :