Data Publica: L’annuaire des APIs et des meta données

juillet 14th, 2010 · 1 Comment ·

La diffusion et l’accès aux données brutes. Voila deux problématiques majeures pour le web des données que le projet Data Publica souhaite résoudre. Très différent du projet DataLift, qui améliore le potentiel de données existantes, et aussi très différent du projet de l’APIE, qui aide l’administration à mettre en ligne ses données, le projet Data Publica se positionne comme l’annuaire de toutes les données françaises. François Bancilhon nous parle de ce projet ambitieux:

NC: Salut François, est-ce que tu peux nous présenter Data Publica en quelques mots ainsi que ton rôle dans le projet ?

FB: Data Publica est un projet conduit en collaboration par 3 start ups : Araok, Nexedi et Talend. Il est partiellement financé dans le cadre de l’appel à projet « Web 2 Innovant » lancé par le Secrétariat d’Etat à l’Economie Numérique en 2009. Le projet se déroule sur 12 mois (janvier à décembre 2010) et doit déboucher sur une « place de marché » où se rencontrent ceux qui publient des données (organismes publics et privés) et ceux qui les utilisent (développeurs d’application).

Nous avons un comité de pilotage avec un représentant de Talend (Cedric Carbone, CTO), un représentant de Nexedi (Jean-Paul Smets, CEO), un représentant d’Araok (François Ziserman, CEO), un avocat spécialiste du domaine (Alan Walter) et moi qui tiens le rôle de chef de projet. Des équipes de développement venant des trois partenaires développent la plateforme et nous avons récemment recruté quelqu’un en charge de la collection de données.

NC: Comment l’idée vous est venu et quel est le rôle respectif des 3 sociétés fondatrices ?

FB: Deux sources pour l’idée originelle:

  1. L’intérêt général pour tout ce qui est « ouverture de données » (je ne suis pas très fana du latino-anglicisme « open data »).
  2. Le travail conduit avec l’INRIA sur un consortium, l’Initiative Services Mobiles, pour dynamiser l’écosystème du développement des applications pour smartphones. A la question « que faire pour aider les développeurs ? » une des réponses évidentes est « leur donner des données », d’où l’idée du projet.

Après ça, on a mis en place le consortium pour couvrir les différents aspects à traiter : Araok assure la conduite de projet et le conseil en ergonomie d’interface, Nexedi travaille sur la mise en place de l’annuaire des données publiques, Talend sur les outils pour données structurées.

Nous sommes en outre en discussion avec des équipes de l’INRIA qui voudraient rejoindre le projet et contribuer techniquement à certains des aspects (indexation, moteurs de recherche, etc.).

NC: Quels sont les grandes étapes à venir pour Data Publica, une vocation internationale ?

FB: Nous avons aujourd’hui une première version du système, suffisante pour y collecter des données et nous menons en parallèle le développement de la plateforme et son alimentation en données. En septembre, nous mettrons en ligne une version alpha de la plateforme. Cette version devrait contenir déjà un bon corpus de données. En décembre, nous ferons le lancement officiel de la beta.

Sur le sujet de l’internationalisation, nous commençons par la France, et restons très focalisés. La techno est bien sûr indépendante du corpus de données, mais la recherche des données ne l’est pas.

NC: A ton avis, quel sera votre ratio entre données publiques et données privées ?

FB: Trop tôt pour dire. Nous sommes focalisés aujourd’hui sur le public, donc initialement nous aurons plus de données publiques. Cela devrait évoluer par la suite.

NC: Que dirais-tu aux administrations publiques ou aux entreprises pour les inciter à mettre leurs données en ligne ?

FB: Nous allons leur montrer qu’en publiant ses données on a des retombées positives en terme d’image et d’écosystème, si on est proactif et qu’on met en place les mécanismes pour en bénéficier. Nous voulons aussi créer une certaine émulation entre les différentes organisations. Nous leur montrerons enfin que si elles ne publient pas d’elles mêmes, leurs données se retrouvent quand même utilisées sans qu’elles en profitent.

NC: Comment attirer des dévelopeurs de mashup ? A quelles incitations avez-vous pensé ?

FB: Nous comptons d’abord sur la complétude de notre jeu de données, ensuite sur les outils que nous pourrons fournir.

NC: Comment est-ce que le projet se positionne par rapport aux solutions existantes comme Infochimps ?

FB: La différenciation est sur la technologie (qualité des outils comme les moteurs de recherche) et sur le domaine couvert (nous sommes focalisés sur les données du marché français).

NC: Merci François, bonne continuation, on attend septembre pour le lancement !

J’ai donc revu le pearltree ci-dessus pour différencier les « data publishers » (ceux qui publient) et des « data directories » (ceux qui référencent). Autre pearltree que vous pouvez aussi (re)récouvrir: « cities », avec une très bonne présentation de la ville de Rennes sur l’ouverture des données.

Tags: Uncategorized


1 response so far ↓

  • je ne suis pas très fana du latino-anglicisme « open data »

     
    Heureusement, parce que data publica c’est très loin de l’open data, le mot clé étant open (ouvert, réutilisable sans discrimination: voir http://www.opendefinition.org/okd/francais/ )