Ce 6 mars, les doctorants du Laboratoire d’Informatique, de Modélisation et d’Optimisation des Systèmes (LIMOS) s’étaient donné rendez-vous pour un nouveau séminaire d’échange et de partage.
Pour cette deuxième session de l’année 2024, Roxane Jouseau en troisième année de thèse CIFRE au sein du LIMOS à l’Université Clermont Auvergne et l’entreprise Agaetis, a présenté ses travaux de recherche qui portent sur l’évaluation de la qualité des données numériques pour les taches de classification.
La thèse de Roxane Jouseau est encadrée par Pr. Sebastien Salva et Chafik Samir, enseignants chercheur, U
Résumé de la présentation :
Data quality is a crucial element for building and optimizing good learning models. Despite many attempts to characterize data quality, rigorous formalization and an efficient quality measure from available observations are still lacking, which is reflected in available data quality tools. Indeed, without a clear understanding of the training and testing processes, it is hard to evaluate the intrinsic performance of a model. This presentation introduces and explains a novel metric to measure data quality. This metric is based on the correlated evolution between the classification performance and the deterioration of data. The proposed method has the significant advantage of being model-independent and does not require metadata or expert knowledge. Furthermore, we provide an interpretation of our metric. We confirm the utility of the proposed metric with intensive numerical experiments and detail some illustrative cases with controlled and interpretable qualities.
Pour le côté convivial, le séminaire s’est terminé par un goûter d’après le séminaire.
Sur le plan pratique, les « Séminaires des Doctorants » sont organisés par et pour les doctorants du LIMOS. Le but est d’apprendre, d’échanger et de débattre autour de courtes présentations sur les différents aspects des sciences informatiques. Le second objectif est de fédérer les doctorants du LIMOS autour d’une rencontre régulière afin de savoir un peu mieux ‘qui fait quoi’ entre les murs du labo.
Les présentations proposées sont destinées à un public académique et doivent avoir un lien fort avec l’informatique. Le séminaire peut également permettre aux doctorants de présenter leurs résultats à d’autres membres du labo, de s’entrainer avant une présentation à une conférence, ou de répéter leur soutenance de thèse.
Il est aussi tout à fait possible de présenter un domaine sous la forme d’un mini-cours ou d’un workshop, sans pour autant présenter de résultats originaux.
Sur le plan de la valorisation, la présence des doctorants à cinq séminaires labo et une présentation au Séminaire des Doctorants validera un module de la formation doctorale ED SIS.