Présentation et question

Bonjour à tous,

Doctorant en économie, je travaille sur des problématiques liées à l’acquisition d’information sur les prix par les consommateurs. Dans ce cadre, je m’intéresse tout particulièrement à la distribution du carburant. J’imagine que beaucoup doivent connaître le site prix-carburants.gouv.fr (site lancé par le gouvernement en 2006 avec l’objectif d’améliorer l’information des consommateurs sur les prix à la pompe) qui est une source intéressante, mais non sans inconvénients (j’entends, en plus du fait que les données ne soient pas open --). L’un d’eux est que seules les stations qui vendent plus d’un certain volume dans l’année sont tenues de s’y enregistrer… d’où un léger malaise lorsque la DATAR veut enquêter sur le maillage des stations services en France en 2011 (http://www.datar.gouv.fr/sites/default/files/etude_stations-service-_synthese.pdf)… qu’elle constate que le gouvernement n’a aucune base de données qui fasse l’affaire et se trouve donc contrainte d’utiliser les données du site Zagaz , site concurrent de prix-carburants.gouv.fr mais entièrement crowdsourcé.
Bref, j’ai utilisé Zagaz pour vérifier des localisations car l’info fournie par prix-carburants.gouv.fr laisse bcp à désirer, ce qui a été l’occasion de découvrir une communauté de gens relativement passionnés. Mais il est quand même clair que le site connait des difficultés compte tenu de la concurrence faite par le site du gvt. Du coup je trouve qu’une forme de rapprochement Zagaz - OSM pourrait avoir pas mal de sens:

  • les données de Zagaz (pas les prix bien sûr, juste la localisation and co) et sa communauté pourraient donner un bon coup de pousse à OSM concernant les stations services (il me semble, sur la base des qqs extractions que j’ai faites, mais peut être que je me trompe)
  • Zagaz n’est aujourd’hui pas open et utilise Google… mais est ce que le site ne pourrait pas vouloir faire le pari d’OSM pour se relancer un peu, sachant qu’à la base il y a une bonne compatibilité des philosophies

Bon, je lance ça comme ça… je me doute que potentiellement je n’ai pas été le premier à y penser ou que c’est peut être complètement impossible pour plein de bonnes raisons… mais à tout hasard, et parce que pour la recherche (ainsi que la régulation de la concurrence, si toutefois cela a encore du sens ahem, et l’aménagement du territoire) ce serait super sympa, je voulais quand même tenter!

NB: le dernier “gros” rapport gouvernemental en date sur les stations services ( http://www.cgeiet.economie.gouv.fr/Rapports/2012_11_29_rapport-prix-marges-consommation-carburants.pdf ) évoque l’étude de la Datar (p164) sans mentionner la source des données: bizarre, vous avez dit bizarre? :slight_smile:

Zagaz a été mentionné pour la première fois sur la liste de diffusion en janvier 2010:
http://gis.19327.n5.nabble.com/site-osmfuel-td5402647.html

Il est vrai que c’est à partir de décembre de cette même année qu’on a disposé de l’imagerie aérienne de Bing. Il serait donc possible de migrer toutes les stations de Zagaz dans OSM en utilisant cette fois-ci les images de Bing au lieu de Google (une migration automatique étant inenvisagable pour des raisons légales si la géolocalisation s’est faite auparavant avec GMaps et il faudrait aussi fusionner avec les données déjà présentes dans OSM). Ca nécessite un effort non négligeable et c’est surtout à la communauté Zagaz qu’il faut poser la question. On ne devrait pas voir les prix directement dans OSM mais techniquement, ils pourraient utiliser les stations géolocalisées dans OSM (il faudrait encore vérifier au niveau de la license ODbL) pour les utiliser ensuite sur leur site.

A ma connaissance, les modérateurs du site ont toujours été très pointilleux sur la provenance des données, le site du gouvernement (lancé en 2007 d’ailleurs, dsl pr l’inexactitude) ayant créé une opportunité signicative de copier… donc il me paraît raisonnable de penser que Zagaz (i.e. l’entreprise qui est derrière) dispose de plein droit de données de bonnes qualités sur la localisation des stations services (et même un peu plus). Dans cette perspective, une option pourrait être que quelqu’un qui représente OSM initie un contact avec Zagaz (qui aurait ensuite tout le loisir de relayer l’idée auprès de sa communauté). Bien sûr, il n’y a absolument aucune bonne raison que ce soit OSM qui aille vers Zagaz, ça devrait probablement plutôt être l’inverse… mais bon voila, parfois ça vaut la peine d’aller outre les conventions -_- (peut être que là non, je ne prétends pas savoir bien sûr). Après ça, si Zagaz n’est résolument pas ouvert, il reste toujours possible d’évoquer de manière vibrante la possibilité de contribuer à OSM sur les forums Zagaz… ce que je ferais avec plaisir naturellement… mais enfin ça n’aurait sûrement pas le même impact.

Tout contributeur OSM est une sorte de représentant d’OSM !

Si tu connais déjà cette communauté, n’hésite pas à initié le débat au sujet d’OSM.

Les données de Zagaz vont de toute façon devoir passer pas notre crible habituel:

  • légal: d’où proviennent ces données ? comment ont-elles été constituées ? Quelle droit Zagaz possède réellement sur ces données ? Il y a souvent des grosse surprises à ce niveau, surtout quand on les a soit géocodé, soit positionné à l’aide d’un fond de plan/images aériennes en particulier Google.
  • qualité: quelle est la qualité des données ? quelle précision géométrique (à voir) et sémantique (ça devrait aller là je pense).

Question aussi à se poser… manque-t-il tant de stations service que ça dans OSM ?

Ok pour essayer d’initier le débat bien sûr mais n’étant contributeur historique ni de Zagaz ni d’OSM… j’ai conscience de ne pas être le mieux placé pour arriver à faire quelque chose. Je comprends tout à fait les réserves par rapport à la source réelle des données et leur qualité. La charte ( http://www.zagaz.com/charte.php) semble d’ailleurs assez évasive sur certains points e.g. “Les informations indiquées sur Zagaz sont mises à jour par les utilisateurs du site”, peut être un peu moins quand il s’agit de préciser la propriété des données: “Zagaz reste propriétaire de la base de données et de son architecture”.

Un élément plus concret concernant la localisation, le site précise pour chaque station si la localisation a été vérifiée par un utilisateur… après ça je ne sais pas ce que ça vaut. Concernant les stations services dans OSM, je ne peux pas répondre précisément là tout de suite, mais je le ferai avec plaisir dans la semaine.

Au-delà de ça, le marché évolue assez vite: peu d’ouvertures bien sûr mais pas mal de fermetures temporaires ou définitives (et de cessions pour ce qui est de l’info sur l’opérateur de la station) donc avoir un comparateur de prix qui utilise OSM permettrait probablement d’améliorer pas mal la fiabilité de la donnée. Bon bien sûr, le mieux serait sans doute de faire du lobbying pour que prix-carburants.gouv.fr utilise OSM mais enfin, même en admettant que ça n’ait pas déjà été essayé, comme leur prestataire NAVTEQ leur fait l’aumône d’une licence depuis 2013 (p18 http://www.modernisation.gouv.fr/sites/default/files/fichiers-attaches/20131105rapporttrojettecahiern2.pdf) je ne sais pas si c’est raisonnable d’envisager qqch :slight_smile:

Bon, je me suis pas encore trop penché sur les questions d’extraction OSM mais histoire de tester, j’ai téléchargé la haute normandie en .osm sur download.geofabrik.de, je l’ai parsée sous python (dc pour faire la france comme ça je repasserai -_-) et j’ai cherché tout les “node” et “way” qui contiennent un {‘k’: ‘amenity’, ‘v’: ‘fuel’}. Ca me retourne 193 résultats. J’imagine que j’ai peut être des trous dans la raquette?

Zagaz en recense 375 (230 en Seine Maritime, 145 dans l’Eure). Potentiellement ce chiffre est exagéré si des stations ont fermé sans que ce soit signalé par des utilisateurs.

Prix-carburants.gouv.fr en recense 275 (172 Seine Maritime, 103 dans l’Eure), ce qui est très probablement sous estimé par rapport au nombre réél ainsi qu’indiqué précédemment.

EDIT: l’extraction ac osmosis s’est bien passée, plus d’info sur les stations services de France demain -_-

Je suis arrivé de mon côté à 76% sur la région Ile de France, avec 60% pour Paris et 91% pour…le 91 ! :wink:

J’ai utilisé overpass-turbo.eu pour chercher les amenity=fuel par département.

Ok, je ne connaissais pas overpass-turbo.eu. J’ai fait une extraction sur la france avec osmosis et j’ai récupéré 8081 stations donc ça doit faire une couverture de 60 à 70% au niveau national (Zagaz dit en compter 12864). Bon, c’est pas trop mal, mais si on peut faire mieux avec en plus les tags qui vont bien, pourquoi s’en priver -_-

Bonjour,
Il y a aussi des chemins tagués amenity=fuel

http://taginfo.openstreetmap.fr/tags/amenity=fuel#overview

Merci pour cette précision, j’ai compté les chemins mais pas les relations. Reste un écart d’environ 200. Est-ce que taginfo prend seulement la France Métropolitaine?

taginfo.openstreetmap.fr ne compte que sur la France métropolitaine
taginfo.openstreetmap.org sur le monde entier