En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour vous proposer des services et offres adaptés à vos centres d’intérêts.FERMER  x
Pour en savoir plus et paramétrer les cookies...

Datalift, une plateforme pour se lancer dans le web sémantique

L'outil Datalift permet aux entreprises et administrations de convertir leurs données en RDF pour faciliter leur partage que ce soit publiquement sur le web ou avec des partenaires privés.

laisser un avis
Le web sémantique fait partie des Graal du web dont on entend parler depuis des années et qu’on voit lentement arriver. « Il est présent à énormément d’endroits sans qu’on s’en rende compte. La BBC et le New-York Times font du sémantique », explique Gabriel Kepeklian, directeur R&D d’Atos. Il est aussi le président de l’association Datalift (voir encadré ci-dessous) qui vient de lancer une inititative dans le domaine du web des données.
Baptisée également Datalift, cette plateforme est le résultat d’un travail de R&D conjoint entre l’Inria, la SSII Atos, l’éditeur de logiciel Mondeca, l’IGN (Institut géographique national), l’Insee (Institut national de la statistique et des études économiques), le centre de recherche Eurecom, le Lirmm (Laboratoire d’informatique, de robotique et de microélectronique de Montpellier) et la Fing.

Convertir n'importe quelle donnée en triplet RDF

« Datalift est le tout en un du web des données », résume Gabriel Kepeklian. « Quand une personne veut travailler avec des données dans le domaine du web sémantique, elle est obligée de prendre différentes briques plus ou moins open source et plus ou moins compatibles. Datalift rassemble l’ensemble des technologies pour extraire les données des entreprises ou du web quelques soit leur format afin de les convertir en RDF et faciliter leur interopérabilité ». Le RDF (Resource description framework) est un format de fichier correspondant à un triplet de valeurs qui décrivent la structure et le contexte d’une information.
Concrètement, Datalift aide, par exemple, à ajouter une dimension de géolocalisation à des informations brutes. Dans la vidéo ci-dessous, les adresses des kiosques à journaux parisiens sont récupérées en ligne avant d’être converties en RDF, associées à une ontologie récupérée dans le catalogue d’ontologies LOV, et enfin géolocalisées sur une carte. « Le LOV recense, à ce jour, plus de 400 ontologies pour décrire différents types de données », se félicite Gabriel Kepeklian.

Datalift, une démonstration de la plateforme par Kapriel_1000

Relier les données entre elles pour donner de la valeur à des jeux de données

Des croisements sont possibles entre deux jeux de données avec des alignements d’ontologie. C’est l’une des fonctionnalités proposées par Datalift : réaliser des interconnexions en calculant des distances entre deux jeux de données avec des pourcentages de confiance associés. C’est par exemple ce qu’ont fait l’IGN et l’Insee.
L’IGN peut ainsi nommer un lieu administrativement et pas uniquement géographiquement. Et l’Insee a pu localiser les données de l’État. « Ces deux institutions se sont rapprochées. Ce qui a beaucoup de sens d’un point de vue économique », explique Gabriel Kepeklian. Datalift a aussi servi à enrichir des données de l’Éducation nationale publiées sur le site open Data data.gouv.fr avec la possibilité de cartographier les données.
Localisation des écoles primaires aux alentours du 12 rue Oradour-sur-Glâne 75015 Paris
Localisation des écoles primaires aux alentours du 12 rue Oradour-sur-Glâne 75015 Paris
via http://semantics.eurecom.fr/datalift/PerfectSchool
agrandir la photo
En utilisant Datalift, une entreprise pourra croiser ses données internes avec celles de ses fournisseurs ou de ses partenaires. Au final, les utilisateurs ont accès à une richesse d’information que chaque propriétaire de données n’a pas individuellement. « Datalift propose l’intégration à un monde qui n’en a pas. Une donnée seule n’a pratiquement aucune valeur, mais elle en prend quand on la relie à d’autres données » explique Gabriel Kepeklian.

Une plateforme en open source

Le projet Datalift est comparable au projet européen LOD2 mais ce dernier fournit une boîte à outils quand Datalift met à disposition une plateforme qui permet de réaliser l'ensemble des opérations d'interconnexion des données de bout en bout sans sortir de l'outil.
Datalift est disponible en open source. La plateforme s’installe sur un PC, un Mac ou un ordinateur sous Linux autant que sur une ferme de serveurs. Atos fournit du service autour de Datalift, des développements complémentaires et des prestations d’intégration dans les systèmes d’information. « En terme de conseil, nous avons beaucoup de travail, car les données ne sont pas interoperables au départ, mais au contraire hétérogènes. Il faut une bonne connaissance métier pour comprendre leur structure », explique Gabriel Kepeklian.

L'association Datalift

L'association Datalift vient d'être lancée. Elle a pour objectif de favoriser le développement du web des données (ou web sémantique) tant au niveau des usages que des technologies. Elle cherche aussi à pérenniser les résultats de l'expérience Datalift.

L'association regroupe les membres du consortium : l’Inia, la SSII Atos, l’éditeur de logiciel Mondeca, l’IGN (Institut géographique national), l’Insee (Institut national de la statistique et des études économiques), le centre de recherche Eurecom, le Lirmm (Laboratoire d’informatique, de robotique et de microélectronique de Montpellier) et la Fing. La Dila est membre d'honneur, et des laboratoires d'écoles d'ingénieurs rejoindront bientôt la structure.

 

envoyer
par mail
imprimer
l'article


@01Business_fr sur
à lire aussi
SUR LES MÊMES THÈMES
[Vidéo] Le breton AMA, première entreprise française certifiée Google Glass
L’appli mobile d’easyJet scanne les passeports
Augure, le moteur de recherche qui identifie les influenceurs
SAP n'est pas le premier choix de ses clients dans le cloud
Microsoft fait des promotions sur son CRM en Saas
Top 250 : Les éditeurs Scality et Intersec primés par le jury de Syntec Numérique
Top250 : Le logiciel français maintient une croissance soutenue
Les tests, un quart du budget informatique des entreprises en 2014
Byod, MDM, App store interne… Windows 10 fait de l’œil aux entreprises
Microsoft dévoile Windows 10, disponible en preview dès le 1er octobre
Coconote, une table tactile pensée pour le travail collaboratif
Cegid diffuse Office 365 auprès de ses clients PME
IBM propose une version cloud de Watson aux entreprises
Jamespot accompagne les clients d’Human Connect vers de nouvelles aventures
Alfresco lève 45 millions de dollars
Munich envisage de revenir sur le déploiement de logiciels Open source
La Chine prépare son OS souverain
Salesforce : forte croissance de l’activité au deuxième trimestre
Infor se lance dans le CRM en mode SaaS en reprenant Saleslogix
Windows 9 : une préversion serait prévue pour le mois de septembre