English below
Vous êtes à la recherche d’une offre de stage de Master ? Vous aimeriez le faire dans un laboratoire d’une grande École d’ingénieur ? Vous rêveriez de participer à de vrais programmes de recherche ?
L’Institut Henri Fayol, École des Mines de Saint-Étienne, vous offre l’opportunité de réaliser un stage de Master 2 dans son département Informatique et systèmes intelligents.
Sujet : « Représentation des grandeurs physiques sur le Web sémantique »
Description
Les grandeurs physiques représentent une part importante des données scientifiques, médicales, industrielles, ouvertes et, dans une certaine mesure, des données privées variées.
Qu’il s’agisse de distances, vitesses, charges utiles en transport, concentrations, masses, quantités de matière en chimie, puissances, intensités, tensions dans le secteur de l’énergie, dimensions de meubles, poids, tailles de personnes, durées et bien d’autres dans le domaine de la santé, il est nécessaire de représenter ces grandeurs, de les stocker, de les traiter et de les échanger entre systèmes d’information, potentiellement à l’échelle mondiale, souvent via Internet et le Web.
Ce stage vise à définir précisément un moyen de représenter sans ambiguïté les grandeurs physiques sur le Web des données. Plus précisément, nous étudierons les propositions existantes pour encoder ces grandeurs dans le modèle de données standard du Web sémantique, RDF. Une attention particulière sera portée à l’utilisation d’un type de données dédié à cet encodage, probablement adapté de la proposition de Lefrançois & Zimmermann (2018) basée sur le standard UCUM.
Après avoir établi une définition rigoureuse du type de données (et éventuellement de ses variantes, si pertinent), nous nous concentrerons sur la mise en œuvre d’un module capable de lire/écrire et traiter ces grandeurs et leurs opérations au sein des API de manipulation des données RDF, pour la gestion, l’interrogation et le raisonnement sur des graphes de connaissances contenant des grandeurs physiques.
L’ambition est que la spécification devienne, d’une part, un standard de facto dans quelques années, avant de devenir peut-être un standard de jure ; et d’autre part, que l’implémentation devienne la référence permettant de comparer le niveau de conformité d’autres implémentations futures.
Cette étude devrait aboutir à la publication d’un article scientifique dans une revue à fort impact.
Références
– Maxime Lefrançois et Antoine Zimmermann (2018). The Unified Code for Units of Measure in RDF: cdt:ucum and other UCUM Datatypes. Dans The Semantic Web: ESWC 2018 Satellite Events, volume 11155 des Lecture Notes in Computer Science, pp196–201, Springer.
– Gunther Shadow et Clement J. McDonald. The Unified Code for Units of Measure. Rapport technique, Regenstrief Institute, Inc, 21 novembre 2017.
Profil : Niveau équivalent à un M2 en informatique, avec des connaissances en technologies du Web sémantique. Le candidat doit également avoir de très bonnes compétences en programmation Java ou une aptitude marquée pour la pensée formelle et abstraite.
Informations :
Public cible : Étudiants de Master 2 en informatique
Lieu : Mines Saint-Étienne, Institut Henri Fayol, 29 rue Pierre et Dominique Ponchardier, 42100 Saint-Étienne, France
Durée : 5 à 6 mois
Contacts :
Representation of physical quantities on the Semantic Web
This is the description of an internship proposal for students pursuing a Master degree (or engineering degree) in computer science and who would like to work in a research environment.
Description
Physical quantities form an important part of what is represented in scientific data, medical data, industry data, open data, and to some extent, various private data.
Whether it is distances, speeds, payloads in transportation, concentrations, masses, moles in chemistry, powers, intensities, voltages in the energy sector, dimensions of furniture, weights, heights of people, durations, and many others in health, there is a need to represent physical quantities, to store them, to process them, and to exchange them between information systems, potentially on a global scale, often on the Internet and via the Web.
In this internship, we seek to precisely define a way to unambiguously represent physical quantities for the Web of Data. More precisely, we will study the proposals made to encode physical quantities in the standard data model of the Semantic Web, RDF. We will be particularly interested in the use of a data type dedicated to this encoding, probably adapted from the proposal of Lefrançois & Zimmermann (2018) based on the UCUM standard.
Having established a rigorous definition of the data type (possibly its variants, if relevant), we will focus on implementing a module that can read/write and process physical quantities and their operations within the RDF data manipulation APIs, for the management, querying and reasoning with knowledge graphs containing physical quantities.
The ambition is that, on the one hand, the specification will become in a few years a de facto standard, before perhaps becoming a de jure standard; and that, on the other hand, the implementation will be the reference allowing to compare the compliance levels of other future implementations.
This study should lead to the publication of a scientific paper in a high impact scientific journal.
References
- Maxime Lefrançois and Antoine Zimmermann (2018). The Unified Code for Units of Measure in RDF: cdt:ucum and other UCUM Datatypes. In The Semantic Web: ESWC 2018 Satellite Events – ESWC 2018 Satellite Events, Heraklion, Crete, Greece, June 3-7, 2018, Revised Selected Papers, volume 11155 of the Lecture Notes in Computer Science, pp196–201, Springer.
- Gunther Shadow and Clement J. McDonald. The Unified Code for Units of Measure. Technical report, Regenstrief Institute, Inc, November 21 2017.
Meta
- Audience
- Master 2 students in computer science
- Location
- Mines Saint-Étienne, Institut Henri Fayol, 29 rue Pierre et Dominique Ponchardier, 42100 Saint-Étienne, France
- Duration
- 5 to 6 months
- Contact
- Antoine Zimmermann and Maxime Lefrançois
- (emails:
antoine.zimmermann@emse.fr
andmaxime.lefrancois@emse.fr
) - Pre-requisite
- Equivalent of a M2 level in CS, with knowledge of Semantic Web technologies. Also, the candidate must have either very good programming skills in Java, or very good aptitude in formal and abstract thinking.