La libération des données publiques bute sur les standards
Organisé par la Fing à Marseille, l’Open Data Garage a montré combien la question du format et de l’interopérabilité des données était sensible et complexe.
Les administrations engagées dans un processus d’ouverture des données publiques doivent faire un choix peu évident : d'un côté, publier un maximum d’informations publiques quel que soit leur format. De l'autre, ne libérer que les données interopérables, autrement dit celles disponibles dans les standards du W3C (XML et RDF, notamment). Cette question a été particulièrement débattue à la conférence Open Data Garage, organisée le 6 juillet à Marseille par la Fing et regroupant toute l’avant-garde de l’open data (villes de Rennes, Montpellier, Nantes ;W3C ; universitaires ; éditeurs ; associations citoyennes).
Sans interopérabilité, seuls les géants exploiteront l’open data
Parmi les défenseurs de la première approche, celle qui fait des standards une priorité, citons deux éditeurs : d’une part Drupal, dont le CMS open source propose un volet e-administration, notamment axé sur la publication de données au format RDF (Ressource Description Framework). D’autre part, Antidot, éditeur du moteur de recherche éponyme qui a traité les différents documents de recherche du CNRS conformément, là encore, au web des données. Son président, Fabrice Lacroix, met en garde contre l’ouverture de données au seul format image PDF : « Sans description sémantique, les données ne seront pas interopérables et ne feront pas l’objet de croisement et d’analyse. Or c’est justement ce croisement qui génère de la valeur. »
Sa principal crainte : que les gros acteurs comme Google ou LexisNexis, qui ont les moyens de pratiquer de l’OCR, du nettoyage et de l’extraction de données, soient les seuls à être en mesure de tirer parti de ces informations. « Globalement, les éditeurs se sont mis au diapason en respectant les standards, mais sur le terrain, les projets sont bricolés dans leur coin : on place une API sur une base de données et l’on croit faire de l’open data », déplore Fabrice Lacroix.
Une standardisation des données qui n’est pas gratuite
Seulement le terrain, lui, ne le voit pas du même œil : « Je n’ai pas les moyens de faire appel à des éditeurs ou à des prestataires pour respecter les standards du W3C. Et les développeurs que je vais engager, à tous les coups, seront dans une logique de bricolage. Alors comme faire ? », questionne Magali Guyon responsable d’une agence de communication marseillaise qui répertorie les œuvres d’art géolocalisées.
Le collectif Regards Citoyens va dans le même sens en insistant sur une mise à disposition des données, quelle que soit leur forme : « Les collectivités locales qui souhaitent se lancer dans le mouvement open data dépensent déjà beaucoup d’énergie à recenser des informations disponibles, à réaliser des exports massifs et à mettre à disposition leur jeux de données. Si en plus nous leur demandons de fournir des données enrichies, aucun projet open data ne se lancera », explique Benjamin Ooghe-Tabanou, cofondateur du collectif.
Monter progressivement en puissance
C’est finalement de Dominique Hazael-Massieux du W3C que viendra le consensus : « La première priorité de l’open data est bien d’avoir des données, insiste-t-il. Ce n’est qu’ensuite qu’on les améliorera. Précisément au fur et à mesure que les bénéfices de cette ouverture seront visibles. » Il rappelle que le processus de standardisation de ces données s’opère en cinq étapes (selon le modèle de Tim Berners-Lee, le père du web) : elles sont embarquées au sein d’un PDF ; exposées dans un format compréhensible par une machine ; puis dans un format non propriétaire ; alignées sur les conventions RDF ; et au final rapprochées selon le modèle Linked Data.

envoyer
par mail
par mail

imprimer
l'article
l'article
à lire aussi
SUR LES MÊMES THÈMES 


nos newsletters
Abonnez-vous à Micro Hebdo : 4,90 €/mois
Abonnez-vous à l'Ordinateur Individuel : 3 €/mois
Abonnez-vous à la version digitale
Abonnez-vous à 01Business et Technologies : 19 €/mois












agrandir la photo


