01net Pro Entreprise informatique
Actualités gestion et logiciel informatique professionnel
Offre et recherche Emploi informatique internet
Salon conférences inofrmatique IT ebusiness 01
Le Cloud Computing
Vidéos reportage entreprise acteur informatique
Retrouvez tous les services 01Net dédiés aux professionnels !
Télécharger logiciels Pro et progiciels
Livres blancs e-commerce informatique et nouvelles technologies
Retrouvez l'ensemble des dossiers de la rédaction 01net Entreprise
Les synthèses des bonnes pratiques sur les sujets IT du moment
Agenda
Applications web et logiciels
Développement
FAI-Télécoms
Marché
Matériel
Sécurité
SSII
Système d'exploitation

La libération des données publiques bute sur les standards

Organisé par la Fing à Marseille, l’Open Data Garage a montré combien la question du format et de l’interopérabilité des données était sensible et complexe.

laisser un avis
Les administrations engagées dans un processus d’ouverture des données publiques doivent faire un choix peu évident : d'un côté, publier un maximum d’informations publiques quel que soit leur format. De l'autre, ne libérer que les données interopérables, autrement dit celles disponibles dans les standards du W3C (XML et RDF, notamment). Cette question a été particulièrement débattue à la conférence Open Data Garage, organisée le 6 juillet à Marseille par la Fing et regroupant toute l’avant-garde de l’open data (villes de Rennes, Montpellier, Nantes ;W3C ; universitaires ; éditeurs ; associations citoyennes).  

Sans interopérabilité, seuls les géants exploiteront l’open data

Parmi les défenseurs de la première approche, celle qui fait des standards une priorité, citons deux éditeurs : d’une part Drupal, dont le CMS open source propose un volet e-administration, notamment axé sur la publication de données au format RDF (Ressource Description Framework). D’autre part, Antidot, éditeur du moteur de recherche éponyme qui a traité les différents documents de recherche du CNRS conformément, là encore, au web des données. Son président, Fabrice Lacroix, met en garde contre l’ouverture de données au seul format image PDF : « Sans description sémantique, les données ne seront pas interopérables et ne feront pas l’objet de croisement et d’analyse. Or c’est justement ce croisement qui génère de la valeur. »
Sa principal crainte : que les gros acteurs comme Google ou LexisNexis, qui ont les moyens de pratiquer de l’OCR, du nettoyage et de l’extraction de données, soient les seuls à être en mesure de tirer parti de ces informations. « Globalement, les éditeurs se sont mis au diapason en respectant les standards, mais sur le terrain, les projets sont bricolés dans leur coin : on place une API sur une base de données et l’on croit faire de l’open data », déplore Fabrice Lacroix.

Une standardisation des données qui n’est pas gratuite

Seulement le terrain, lui, ne le voit pas du même œil : « Je n’ai pas les moyens de faire appel à des éditeurs ou à des prestataires pour respecter les standards du W3C. Et les développeurs que je vais engager, à tous les coups, seront dans une logique de bricolage. Alors comme faire ? », questionne Magali Guyon responsable d’une agence de communication marseillaise qui répertorie les œuvres d’art géolocalisées.
Le collectif Regards Citoyens va dans le même sens en insistant sur une mise à disposition des données, quelle que soit leur forme : « Les collectivités locales qui souhaitent se lancer dans le mouvement open data dépensent déjà beaucoup d’énergie à recenser des informations disponibles, à réaliser des exports massifs et à mettre à disposition leur jeux de données. Si en plus nous leur demandons de fournir des données enrichies, aucun projet open data ne se lancera », explique Benjamin Ooghe-Tabanou, cofondateur du collectif.

Monter progressivement en puissance

Dominique Hazael-Massieux du W3C
agrandir la photo
C’est finalement de Dominique Hazael-Massieux du W3C que viendra le consensus : « La première priorité de l’open data est bien d’avoir des données, insiste-t-il. Ce n’est qu’ensuite qu’on les améliorera. Précisément au fur et à mesure que les bénéfices de cette ouverture seront visibles. » Il rappelle que le processus de standardisation de ces données s’opère en cinq étapes (selon le modèle de Tim Berners-Lee, le père du web) : elles sont embarquées au sein d’un PDF ; exposées dans un format compréhensible par une machine ; puis dans un format non propriétaire ; alignées sur les conventions RDF ; et au final rapprochées selon le modèle Linked Data.
envoyer
par mail
imprimer
l'article
PAS D'AVIS SUR CET ARTICLE
Répondre
 

Avis sur «La libération des données publiques bute sur les standards»

   
 
à lire aussi
SUR LES MÊMES THÈMES
Open data : les bénéfices ne sont pas là où on les attend
Premiers exemples d'applications open data issues du concours Etalab
Des données publiques ultrasensibles dans les mains des chercheurs
Les retombées économiques de l'open data viendront de la société civile, assure Gilles Babinet
Les acteurs économiques se mobilisent pour l’open data
Techdays 2012 : valorisation de l’open data, un marché de 50 milliards d’euros
[Best of blogs 2011] Reconnaissance faciale / Les chantiers de l’open data / Cyber-attaques / La fiscalité numérique
[Best of blogs 2011] De Gaulle 2.0 / Les lois du 9-11 dix ans après / Amesys, une affaire d’Etat ? / MyData
Des milliers de données publiques en ligne sur data.gouv.fr
Open data : la France rivalise avec les Etats-Unis et dépasse l'Angleterre
Dix cartes de métro qui ne vont pas fâcher la RATP
Open data : des bénéfices avant tout liés au marketing et à l'innovation
Une licence libre pour les données publiques
L'Etat publie une licence pour la libre réutilisation des données publiques
Inédit : un département libère la totalité de ses données publiques
Open data : un modèle économique encore incertain
CheckMyMetro de retour sur l'App Store
Que retenir de la démission du DSI de la Maison Blanche ?
A la une de 01 : E-santé : une politique industrielle à inventer.