Opendata vs "données libres" (et communs numériques)

J’ai très souvent des échanges au sein des administrations au sujet des licences, surtout sur le partage à l’identique de notre licence ODbL.

Je viens encore une fois de rappeler dans un mail quelques principes qui ne semblent pas du tout compris par la sphère publique, ancrée sur la Licence Ouverte.

Je le partage ici pour que ça puisse resservir :

Juste un rappel sémantique bien utile…

« ouverture de données » fait implicitement référence au fait que la donnée était auparavant existante et non ouverte… avant qu’on ne l’ouvre (enfin)

C’est ce qui distingue fondamentalement l’opendata (j’ai quelque chose et je décide de l’ouvrir) des « données libres » qui, dès leur origine, ont été ouvertes et pensées comme telles.

OpenStreetMap ou d’autres communs numériques (Open Food Facts, Wikipedia, etc) sont dans la deuxième logique, pas dans la première. C’est pour cela que je tique quand on parle d’opendata pour OSM.

C’est essentiel pour comprendre la différence entre opendata et communs numériques.

Ensuite le commun, pour rester libre et ne pas tomber dans une « enclosure » le fait en associant une clause à sa ré-utilisation: le partage à l’identique.

C’est ce qui empêche un tiers de tirer parti du commun, sans y participer d’aucune sorte. C’est du « donnant-donnant », oui, assumé et même défendu autant que possible !

Ces contraintes sont une garantie de pérennité pour le commun, car elles organisent son entretien pour reboucler vers lui plutôt que de s’éparpiller et au final dégénérer.

C’est nécessaire car sans cela, une part non négligeable de la communauté (ou des contributions) pourrait se détourner et basculer vers des enclosures.

On a un très beau cas: Yuka et Open Food Facts

Open Food Facts a démarré en 2012, la base de données est sous licence ODbL, donc avec partage à l’identique.

Yuka s’est appuyé quelques années plus tard sur cette base de données pour petit à petit créer sa base (pas sûr que l’ODbL ait été respecté, OFF n’était sûrement pas armée à l’époque pour se défendre), et a capté une part de la communauté qui grandissait et fragilisé Open Food Facts en s’intercalant avec les contributeurs et en ne reversant que partiellement les contributions faites dans Yuka (dont la base n’est pas ouverte, on y accède juste via une service… même logique que Google pas d’accès aux data brutes sauf via des services bien contrôlés).

Je rappelle que:

  • les choix possible de licences par les administration pour les données sont la L.O ET l’ODbL
  • qu’elles n’ont plus à choisir de licence quand un choix a déjà été fait en amont sur les données (ou code source) qu’elles utilisent ou améliorent (oui, vous pouvez utiliser une image CC-BY-SA et vous devrez même publier en CC-BY-SA cette image CC-BY-SA que vous modifierez).
  • quand une administration choisit d’utiliser l’ODbL elle doit pouvoir le justifier, car cela crée une contrainte pour les réutilisateurs, contrainte qui peut parfaitement être valable sur une base de données à entretenir collaborativement (donc pour les comptes publics ou le Journal Officiel c’est bien uniquement de la L.O sauf si on m’autorise à modifier le budget ou la Loi).

Est-ce que produire un petit arbre de décision pour agent public pourrait aider à installer les bonnes pratiques ?

Est-ce que cela a fait l’objet d’un poste de blog ou autre car c’est effectivement un exemple didactique ?

Merci Christian pour cette analyse.

Tu évoques le problème des possibles et réelles enclosure et dispersion en silos suite à une publication en LO.
Je pense que tu peux même aller plus loin en disant que la LO est surtout bénéfique aux gros acteurs qui peuvent investir plus de moyens afin d’enrichir pour leur seul bénéfice ce pot de départ.

Je pense qu’on peux même évoquer 2 visions philosophiques différentes entre la LO et l’ODbL.
La LO incite à des comportements prédateurs et concurrentiels au détriment de la publication de base qui était désintéressée alors que l’ODbL implique de construire ensemble et pour tous.

Le parfait exemple étant la GéoDAE qui, publiée en LO, se voit réutilisée par Sauv’Life, AEDmap et OpenStreetMap (et d’autres ?) en silos contributifs mais non communiquants. Cette mise en concurrence s’est tristement illustrée par le vol des données d’AEDmap par Sauv’Life et leur condamnation en justice.
Cette dispersion n’est idéale pour aucun des 4 acteurs, et surtout pas pour le grand public.

In fine, cela pose les questions suivantes :

  • Qui veut-on privilégier dans l’ouverture des données par le service public ?
  • Quel type de société voulons-nous favoriser ?

Et quand est-ce que l’état met en place des bases de données contributives ?

L’état qui fonctionne historique en « top-down », ne sait pas faire ça. C’est quelque part contre nature pour sa culture.

Encore un exemple:

Bien sûr publié en LO, donc se coupe des 300.000 wheelchair=* qu’on a dans OSM.
Ici c’est typiquement une base en construction (difficile) et pas une base existante qu’on a ouvert.

Un nombre faible de contributeurs, peu de mises à jour du petit stock accumulé en environ 3 ans, et une dispersion de plus des efforts.

Le formulaire pour ajouter un établissement s’appuie par contre sur OpenStreetMap… ce qui pose un petit problème… voir: Acceslibre et utilisation détourné des données OSM

Je pense qu’on peut aussi résumer à « La LO pousse au fork » et le monde du logiciel nous a montré ce que ça donnait.