Open data : la France rivalise avec les Etats-Unis et dépasse l'Angleterre
Après dix mois de chantier, la mission Etalab ouvre son site data.gouv.fr. Avec 350 000 jeux de données référencés, le portail fait aussi bien que son homologue américain, data.gov.
Après les Etats-Unis et l’Angleterre, pour citer les pays plus connus, la France dispose désormais de son portail open data : data.gouv.fr. Le site, conçu et réalisé par la mission Etalab sous l’autorité du Premier ministre, référence ainsi près de 350 000 jeux de données issus de l’Administration centrale. Laquelle a été invitée en mai dernier, par un décret interministériel, à procéder à la libération de toutes ses données produites dans le cadre d’un service public. La masse d’informations libérée équivaut quasiment à celle du portail open data américain (390 000 jeux de données) et dépasse largement la plate-forme britannique (seulement 7 000).
90 producteurs alimentent aujourd'hui data.gouv.fr
- Les ministères : finance, santé, environnement, etc.
- Les établissements publics : SNCF, RFF, IGN, etc. aussi bien pour les données de fonctionnement mais également cartographiques.
- Les collectivités locales : elles ne sont pas concernées par le décret, mais certaines, toutes proches de la majorité présidentielle, ont franchi le pas. Citons Coulommiers, Longjumeau, le conseil général de Loir-et-Cher, etc.
Transparence et développement économique
Pour rappel, l’open data vise d’une part à la transparence politique. Etalab insiste, par exemple, sur la mise à disposition des données budgétaires de l’Etat qui, pour la première fois, seront agrégées dans un même fichier. Jusqu'ici, elles n'étaient accessibles qu'à travers différents rapports des lois de finance.
L’autre vocation de cette démarche concerne le développement économique, via notamment la fourniture de nouveaux services liés à la cartographie, aux transports, au tourisme, etc. C’est au nom de ce développement que la réutilisation des données de data.gouv.fr sera gratuite, sauf exception lorsqu’elles auront fait l’objet d’un investissement particulier. « La créativité des développeurs et des entrepreneurs ne saurait se heurter à des cloisons artificielles, qui ont trop souvent constitué des freins au développement de l’innovation », explique Séverin Naudet, responsable de cette mission interministérielle.
La gratuité pour favoriser la réutilisation à des fins commerciales
Il y a quelques semaines, Etalab publiait d’ailleurs une licence pour encadrer cette gratuité : inspirée du modèle Creative Commons, elle autorise la reproduction, la redistribution et plus généralement l’exploitation des données, même à des fins commerciales. Une condition cependant : que la paternité de l’information soit citée. Globalement, toutes les initiatives déjà menées en France à l’échelle locale (Rennes, Nantes, Bordeaux, Paris ou le conseil général de Saône-et-Loire) sont alignées sur le même principe de gratuité, même si ce dernier est incarné par différents types de licence.
Des formats compréhensibles à défaut d’être totalement ouverts
Autre impératif, le format : « Toutes les données sur data.gouv.fr seront accessibles dans des formats ouverts (CSV ou tableur Excel) comme cela est imposé aux administrations. L'objectif est de permettre la réutilisation libre et facile des données, en permettant à une majorité d'utilisateurs d'y accéder », explique Séverin Naudet.
Enfin, outre la gratuité et le format des données, au sujet desquels le gros des débats est derrière nous, Etalab devra, ces prochains mois et années, recueillir l’adhésion des établissements à caractère public, dont certains restent frileux à l’idée de libérer leurs informations. Plus généralement, il faudra convaincre les collectivités qui n’entrent pas dans le cadre du décret et d’Etalab, à se plonger dans des projets open data dont le modèle économique reste encore à trouver.

Avis sur «Open data : la France rivalise avec les Etats-Unis et dépasse l'Angleterre»
Oui, mais quelles données ?
de
datafree
, posté le 08 décembre 2011 à 17h51
Effectivement je suis pour la libération des données, mais ce concours avec les USA et l'Angleterre sur le nombre de données est un peu enfantin ! Par exemple, il y a énormément de données qui sont livrées au niveau des départements, par exemple, la consommation électrique de l'Ain, de l'Allier... et qui comptent pour autant de jeux de données différents. Ou encore la production de viande pour la semaine 01, 02, 03... découpée en autant de semaines qu'il y a dans l'année !!! On aurait pu regrouper des dizaines de jeu de données dans un seul, mais là, on aurait peut-être été derrière les américains et les anglais, alors...
Il faut utiliser les standards du W3C
de
Pierre Col
, posté le 10 décembre 2011 à 16h20
Désormais, les données commencent à être publiées, et les standards, technologies et outils sont disponibles : et du coup, tout le monde va comprendre que l’Open Data n’est plus un problème de “comment faire“, mais bien de “que faire” et surtout “pourquoi le faire“.
Or le “que faire” et le “pourquoi le faire” peuvent justifier d’interconnecter des jeux de données issus de producteurs très différents, et de mailler des informations de nature très diverses pour les réutiliser d’une façon qui n’avait pas encore été imaginée. Et du coup, on en vient à considérer qu’il faut partager des données les plus brutes possibles, sans le filtre d’APIs qui présupposent des usages et en limitent d’autres. Espérer que des APIs propriétaires associées à chaque jeu de données vont être vraiment utiles est illusoire, pour une raison très simple : si, pour bâtir une application exploitant 13 jeux de données différents, il faut intégrer 13 APIs de fournisseurs différents, alors le résultat du développement sera un monstre totalement impossible à maintenir et à faire évoluer dans le temps, et donc au final inutile.
Il faut donc que les organisations qui se lancent dans l’Open Data publient des données non seulement ouvertes mais pleinement réutilisables : à cet égard, on ne saurait se contenter de proposer de sous forme d’une collection, aussi riche soit-elle, de fichiers XLS, PDF ou même CSV qui vont nécessiter beaucoup de travail pour que les données qu’ils renferment soient vraiment exploitées. Comme l’a dit fort justement Tim Berners-Lee à TED 2009 : “Raw data now!”
Le W3C a défini des standards pour l’accès aux données brutes, via l’approche du “web sémantique” ou “web des données” qui seul permet une réutilisation généralisée des données, par la mise en réseau massive des silos de données ouvertes où qu’ils se trouvent sur le web. Ces standards publiés par le W3C s’appellent RDF, OWL et SPARQL. ils sont désormais matures et de nombreux outils existent pour les mettre en œuvre.
La donnée brute en RDF, publiée dans le “nuage du Linked Open Data” ou “LOD cloud” est la seule vraie façon pérenne de permettre une réexploitation massive des données. Et c'est une tendance lourde, si l’on en juge par la croissance formidable du LOD en l’espace de 4 ans.
Pour mieux appréhender les standards du W3C pour l'Open Data, voir http://blog.antidot.net/2011/12/08/grande-semaine-pour-lopen-data-francais/ qui donne des points d'entrée "pédagogique"
Or le “que faire” et le “pourquoi le faire” peuvent justifier d’interconnecter des jeux de données issus de producteurs très différents, et de mailler des informations de nature très diverses pour les réutiliser d’une façon qui n’avait pas encore été imaginée. Et du coup, on en vient à considérer qu’il faut partager des données les plus brutes possibles, sans le filtre d’APIs qui présupposent des usages et en limitent d’autres. Espérer que des APIs propriétaires associées à chaque jeu de données vont être vraiment utiles est illusoire, pour une raison très simple : si, pour bâtir une application exploitant 13 jeux de données différents, il faut intégrer 13 APIs de fournisseurs différents, alors le résultat du développement sera un monstre totalement impossible à maintenir et à faire évoluer dans le temps, et donc au final inutile.
Il faut donc que les organisations qui se lancent dans l’Open Data publient des données non seulement ouvertes mais pleinement réutilisables : à cet égard, on ne saurait se contenter de proposer de sous forme d’une collection, aussi riche soit-elle, de fichiers XLS, PDF ou même CSV qui vont nécessiter beaucoup de travail pour que les données qu’ils renferment soient vraiment exploitées. Comme l’a dit fort justement Tim Berners-Lee à TED 2009 : “Raw data now!”
Le W3C a défini des standards pour l’accès aux données brutes, via l’approche du “web sémantique” ou “web des données” qui seul permet une réutilisation généralisée des données, par la mise en réseau massive des silos de données ouvertes où qu’ils se trouvent sur le web. Ces standards publiés par le W3C s’appellent RDF, OWL et SPARQL. ils sont désormais matures et de nombreux outils existent pour les mettre en œuvre.
La donnée brute en RDF, publiée dans le “nuage du Linked Open Data” ou “LOD cloud” est la seule vraie façon pérenne de permettre une réexploitation massive des données. Et c'est une tendance lourde, si l’on en juge par la croissance formidable du LOD en l’espace de 4 ans.
Pour mieux appréhender les standards du W3C pour l'Open Data, voir http://blog.antidot.net/2011/12/08/grande-semaine-pour-lopen-data-francais/ qui donne des points d'entrée "pédagogique"
à lire aussi
SUR LES MÊMES THÈMES 


nos newsletters
Abonnez-vous à Micro Hebdo : 4,90 €/mois
Abonnez-vous à l'Ordinateur Individuel : 3 €/mois
Abonnez-vous à la version digitale
Abonnez-vous à 01Business et Technologies : 19 €/mois
















alerter le modérateur