En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour vous proposer des services et offres adaptés à vos centres d’intérêts.FERMER  x
Pour en savoir plus et paramétrer les cookies...

Datalift, une plateforme pour se lancer dans le web sémantique

L'outil Datalift permet aux entreprises et administrations de convertir leurs données en RDF pour faciliter leur partage que ce soit publiquement sur le web ou avec des partenaires privés.

laisser un avis
Le web sémantique fait partie des Graal du web dont on entend parler depuis des années et qu’on voit lentement arriver. « Il est présent à énormément d’endroits sans qu’on s’en rende compte. La BBC et le New-York Times font du sémantique », explique Gabriel Kepeklian, directeur R&D d’Atos. Il est aussi le président de l’association Datalift (voir encadré ci-dessous) qui vient de lancer une inititative dans le domaine du web des données.
Baptisée également Datalift, cette plateforme est le résultat d’un travail de R&D conjoint entre l’Inria, la SSII Atos, l’éditeur de logiciel Mondeca, l’IGN (Institut géographique national), l’Insee (Institut national de la statistique et des études économiques), le centre de recherche Eurecom, le Lirmm (Laboratoire d’informatique, de robotique et de microélectronique de Montpellier) et la Fing.

Convertir n'importe quelle donnée en triplet RDF

« Datalift est le tout en un du web des données », résume Gabriel Kepeklian. « Quand une personne veut travailler avec des données dans le domaine du web sémantique, elle est obligée de prendre différentes briques plus ou moins open source et plus ou moins compatibles. Datalift rassemble l’ensemble des technologies pour extraire les données des entreprises ou du web quelques soit leur format afin de les convertir en RDF et faciliter leur interopérabilité ». Le RDF (Resource description framework) est un format de fichier correspondant à un triplet de valeurs qui décrivent la structure et le contexte d’une information.
Concrètement, Datalift aide, par exemple, à ajouter une dimension de géolocalisation à des informations brutes. Dans la vidéo ci-dessous, les adresses des kiosques à journaux parisiens sont récupérées en ligne avant d’être converties en RDF, associées à une ontologie récupérée dans le catalogue d’ontologies LOV, et enfin géolocalisées sur une carte. « Le LOV recense, à ce jour, plus de 400 ontologies pour décrire différents types de données », se félicite Gabriel Kepeklian.

Datalift, une démonstration de la plateforme par Kapriel_1000

Relier les données entre elles pour donner de la valeur à des jeux de données

Des croisements sont possibles entre deux jeux de données avec des alignements d’ontologie. C’est l’une des fonctionnalités proposées par Datalift : réaliser des interconnexions en calculant des distances entre deux jeux de données avec des pourcentages de confiance associés. C’est par exemple ce qu’ont fait l’IGN et l’Insee.
L’IGN peut ainsi nommer un lieu administrativement et pas uniquement géographiquement. Et l’Insee a pu localiser les données de l’État. « Ces deux institutions se sont rapprochées. Ce qui a beaucoup de sens d’un point de vue économique », explique Gabriel Kepeklian. Datalift a aussi servi à enrichir des données de l’Éducation nationale publiées sur le site open Data data.gouv.fr avec la possibilité de cartographier les données.
Localisation des écoles primaires aux alentours du 12 rue Oradour-sur-Glâne 75015 Paris
Localisation des écoles primaires aux alentours du 12 rue Oradour-sur-Glâne 75015 Paris
via http://semantics.eurecom.fr/datalift/PerfectSchool
agrandir la photo
En utilisant Datalift, une entreprise pourra croiser ses données internes avec celles de ses fournisseurs ou de ses partenaires. Au final, les utilisateurs ont accès à une richesse d’information que chaque propriétaire de données n’a pas individuellement. « Datalift propose l’intégration à un monde qui n’en a pas. Une donnée seule n’a pratiquement aucune valeur, mais elle en prend quand on la relie à d’autres données » explique Gabriel Kepeklian.

Une plateforme en open source

Le projet Datalift est comparable au projet européen LOD2 mais ce dernier fournit une boîte à outils quand Datalift met à disposition une plateforme qui permet de réaliser l'ensemble des opérations d'interconnexion des données de bout en bout sans sortir de l'outil.
Datalift est disponible en open source. La plateforme s’installe sur un PC, un Mac ou un ordinateur sous Linux autant que sur une ferme de serveurs. Atos fournit du service autour de Datalift, des développements complémentaires et des prestations d’intégration dans les systèmes d’information. « En terme de conseil, nous avons beaucoup de travail, car les données ne sont pas interoperables au départ, mais au contraire hétérogènes. Il faut une bonne connaissance métier pour comprendre leur structure », explique Gabriel Kepeklian.

L'association Datalift

L'association Datalift vient d'être lancée. Elle a pour objectif de favoriser le développement du web des données (ou web sémantique) tant au niveau des usages que des technologies. Elle cherche aussi à pérenniser les résultats de l'expérience Datalift.

L'association regroupe les membres du consortium : l’Inia, la SSII Atos, l’éditeur de logiciel Mondeca, l’IGN (Institut géographique national), l’Insee (Institut national de la statistique et des études économiques), le centre de recherche Eurecom, le Lirmm (Laboratoire d’informatique, de robotique et de microélectronique de Montpellier) et la Fing. La Dila est membre d'honneur, et des laboratoires d'écoles d'ingénieurs rejoindront bientôt la structure.

 

envoyer
par mail
imprimer
l'article


@01Business_fr sur
à lire aussi
SUR LES MÊMES THÈMES
IBM propose une version cloud de Watson aux entreprises
Jamespot accompagne les clients d’Human Connect vers de nouvelles aventures
Alfresco lève 45 millions de dollars
Munich envisage de revenir sur le déploiement de logiciels Open source
La Chine prépare son OS souverain
Salesforce : forte croissance de l’activité au deuxième trimestre
Infor se lance dans le CRM en mode SaaS en reprenant Saleslogix
Windows 9 : une préversion serait prévue pour le mois de septembre
Adecco rachète un éditeur de solutions RH dans le cloud
Microsoft annonce la fin du support des anciennes versions d'Internet Explorer
BBM, la messagerie instantanée de Blackberry s’ouvre aux Windows Phone
Office pour iPad : Microsoft propose une mise à jour majeure
Les entreprises ont du mal à mettre en place la BDU (Base de données unique)
Google Hangout lorgne les entreprises
Cegedim affiche des résultats mitigés avant son possible rachat partiel par IMS Health
[MàJ] Microsoft reçoit la visite de l’Administration chinoise dans ses locaux
Les taux de change pénalisent les résultats de Dassault Systèmes du trimestre
Microsoft va unifier toutes les versions de Windows en un OS unique
Sepa : la date butoir se rapproche
Résultats : SAP accélère sa transition vers le cloud