Lors du SOTM nantais, plusieurs discussions ou présentations ont fait émerger une idée : publier une version « augmentée » des données OSM, pour faciliter les réutilisations.
Une sorte de « Planet+ » où des modifications et ajouts seraient apportées aux données OSM.
J’ouvre ce fil pour juger de l’intérêt (le pourquoi), pas pour rentrer dans l’aspect technique (le comment) qu’il faudra évaluer après avoir validé que ça vaut le coup de se lancer dans cette direction.
Cette « augmentation » permettrait d’avancer sur plusieurs points que je vais détailler.
Les tags obsolètes
Nous avons certains tags qui sont remplacés au fil du temps par d’autres au niveau des usages par les contributeurs.
Parfois, on a même lors d’un vote sur un nouveau tag un consensus pour considérer que l’ancien est obsolète.
Il n’y a pas encore de consensus pour faire un remplacement automatique dans OSM pour faire disparaître des données les tags obsolètes.
Ceci force donc les réutilisateurs à devoir tenir compte de tags actuels et obsolètes en même temps.
Ici, l’augmentation pourrait consister à faire ce remplacement.
Les données intégrables, mais pas intégrées
Le cas typique est celui des adresses… comme celles de BANO en France.
Ici, l’augmentation consisterait à compléter les données OSM avec les adresses manquantes présentes dans BANO (plusieurs façons de faire, je ne détaille pas le côté technique).
On peut envisager aussi de compléter sur d’autres thématiques comme les commerces et POI (par exemple avec la version géocodée de la base SIRENE).
Homogénéiser certains tags
Sur les adresses, plutôt que d’avoir une partie de celles-ci dans des relations addrStreet et d’autres hors relations, on peut tout remettre dans le modèle le plus simple à réutiliser.
Du nettoyage de tags
Corriger les tags erronés les plus courants, les fautes de frappe habituelles, etc.
Appliquer des corrections fiables proposées par osmose
Les analyses osmose fiables (dont le taux de faux négatif est marginal) pourraient aussi servir à appliquer des corrections automatiquement.
Bénéfices
- simplifie les réutilisations,
- enrichit les données OSM pour des réutilisations encore plus nombreuses,
- évite la marche forcée des imports/intégrations qui n’apporte que peut de qualité par rapport à la donnée source.
Risques
- une moindre contribution provoquée par l’absence d’une info constatée sur une réutilisation
Qu’en pensez-vous ?