OpenStreetMap Plus

Hello,
Je relance l’idée de créer une « distribution de données » made in OSM-Fr, nom de code « OpenStreetMap Plus ».

Concept

OSM+ est un jeu de données issues d’OSM et enrichis pour en faciliter la ré-exploitation directe pour créer des cartes web généralistes pour le grand public.

Il est accompagné d’un rendu spécifique directement utilisable.

Périmètre

  • géographiquement, son périmètre est le territoire français dans son intégralité

Il intègre :

  • les noms et données issues de sources externes liées dans OSM (Wikidata et autres)
  • des règles custom, notamment concernant le nommage des POIs
    À titre d’exemple, les mairies seraient toutes nommées explicitement (cf. Utilité des noms descriptifs) avec des name et des short_name, tous deux utiles selon le niveau de zoom et de priorisation d’affichage
  • les suggestions de correction qui ont un taux de confiance très élevé dans OSMOSE

L’usage pourrait

  • être restreint au rendu seul (en créant un fork ou en remplacement du rendu Fr actuel)
  • ou à quelques usages clairement identifiés (je pense en particulier au géocodage ; on peut imaginer une instance d’addok)
3 Likes

Tu peux ajouter aussi la possibilité de compléter les données OSM, je pense aux adresses en les remplaçant par celles de BANO.

L’idée que je m’en fait est un ensemble de traitement combinables et optionnel que l’on peut rejouer chez soi avec une combinaison différente ou en créant ces propres traitements.

Je pense aussi qu’il faut une distribution de ces données avec une combinaison par défaut répondant a un besoin général.

Je vois deux grandes catégories :

  • la redressement : normalisation des données comme les tags dépréciés ou coutumes (aka façon locale de tagger comme pour les adresses), et correction d’erreur évidentes

  • l’ajout de données pour une meilleure complétude : intégration de BANO, de jeux de données OpenData (via Osmose ou d’un meilleur standard de mapping pour faire ça).

1 Like

Ok, tout ça me convient très bien. On commence par où ? J’ai l’impression que c’est un gros morceau.

on fork geodatamine et zou

Pour expliciter mon idée. En entrée c’est de l’OSM, tag et format de fichier. En sortie c’est toujours de l’OSM au même format de fichiers, diff y compris.

Ça permet d’utiliser les outils déjà existant sur ces données, rendu de carte, moteur de recherche, calcul d’itinéraire…

3 Likes

Il faut choisir une chaîne de traitement.

Perso, j’évite les vais ETL, surtout pour de l’OSM.

Je vois deux solutions, peut-être à combiner

  • Postgres/Posgis SQL, le seule schéma/outil non destructeur est le bon vieux Osmosis, capable de charger, décharger et mettre à jour des données.
  • Une lib de traitement de gros volume de données type Numpy+Panda+GeoPanda, ou Apache Arrow.

D’autres propositions ?

1 Like