Discussion: Assistant au challenge "Lieu de cultes non nommés en France"

J’aurai plutôt tendance à saucissonner, mais je ne suis pas seul dans l’histoire.

Le truc le plus difficile qu’il faudrait faire, c’est de sortir les lieux de culte qui ont un nom mais pas celui attendu, genre « Église de Triffoulis-les-Oies » (nom de commune, donc descriptif) au lieu de « Église Saint-Glinglin » ou « Église Notre-Dame ». Je suis sûr qu’il y en a plusieurs dizaines sur tout le territoire parce que j’en ai déjà vu pas mal.

Selon moi, il faudrait les dissocier afin d’apporter davantage de clarté sur ce qu’il faut faire. Problème, il faut penser à tous les cas de figure et puis certains contributeurs pourraient être tentés de tout traiter en même temps.
Il faudrait voir le nombre d’objets concernés sur chacun des problèmes

Je n’ai pas fait toute la France, seulement Occitanie, Auvergne-Rhône-Alpes et Bourgogne-Franche-Comté.

Je n’ai jamais créé de challenge maproulette mais j’ai vu une possibilité de mettre à jour un challenge dans la doc : Rebuilding (Updating) Task Data

Ce que j’ai fait n’est pas lié au nombre d’églises de la commune, je récupère les églises présentent sur wikidata avec des coordonnées comme ça. Il y a plus de chance que toutes les églises de la commune soient présentes dans wikidata s’il y en a qu’une mais normalement elles y sont (presque) toutes.

Si quelqu’un veut faire la même chose que moi, il faut récupérer ensuite les données osm : overpass turbo
Et après utilisé le plugin conflation :
il faut mettre une distance importante car dans wikidata parfois les coordonnées sont au milieu du village et pas à l’emplacement de l’église mais il faut bien vérifier lorsque la distance est importance,
je mets « wikidata » dans « attributs » comme ça si le tag wikidata est présent dans osm, le plugin rapproche avec la bonne église s’il a plusieurs choix,
décocher « remplacer la géométrie »,
et fusionnée les étiquettes seulement « wikidata,name »

Après ce que je fais (ce n’est suremennt pas parfait…), il y a les cas simples :
-le name est le même dans osm et wikidata et la distance est faible, le plugin permet d’ajouter wikidata=*
-Pas de name dans osm et distance faible, j’ajoute sans (trop) de vérification name=* et wikidata=* (mais il y a des cas où il y a plusieurs églises avec des coordonnées proches dans wikidata, je ne sais pas si je les ai tous repéré…)
Ensuite il y a tout les cas plus compliqué, et il y en as beaucoup…
Lorsque la distance augmente, il faut vérifier que c’est bien la bonne église
Lorsque les noms diffère, il y a le problème des tirets,
il y a le cas ou les noms osm sont « église Saint-Machin de Trifouilly-les-Oies » le « de Trifouilly-les-Oies » est de trop (mais je n’ai pas du tous les enlever)
Lorsque la dédicace est proche, j’ai laissé ce qu’il y avait dans osm, je n’y connait rien en dédicaces (Notre-Dame/de l’Assomption/Sainte-Marie…, de l’Invention-de-Saint-Étienne/Saint-Étienne, …).
Si dédicace complètement différente, j’ai parfois chercher laquelle devait être la bonne et parfois laisser ce qu’il y avait dans osm.
Lorsque pas de rapprochement, pour les église, j’ai chercher pour beaucoup à savoir pourquoi il n’y avais pas de rapprochement (donc quelques ajouts d’églises dans osm et des suppressions d’églises en double)
Et il y a plein d’autres cas, c’est pour ça que ca prend des heures…

Ok merci pour les explications détaillées. J’avais dans l’idée de faire aussi des rapprochements en me basant sur la distance wdt/osm pas en utilisant le plugin conflation mais avec un script Python. Je laisse tomber pour le moment. Mieux vaut éviter de se lancer dans ce genre de choses en parallèle sinon on va se marcher sur les pieds et ce sera contre-productif. Juste j’ai pas compris dans ta requête wikidata ce que tu essayes de faire avec le name3.

Bon là en gérant tous ces paramètres c’est clairement trop compliqué pour faire un challenge maproulette compréhensible. Il faudrait quand même que des contributeurs pas totalement geogeeks puissent participer ! C’est l’intérêt de maproulette je trouve. Du coup le mieux c’est de laisser bosser les super geeks pour le moment et on fera le point une fois ce travail accompli. On reviendra éventuellement vers maproulette si il reste des cas compliqués à gérer.

Super boulot qui va éviter beaucoup de travail sans grand interêt, bravo!

Je pense qu’il faut éviter de gérer les cas « compliqués » automatiquement, est-ce possible de reverter cette partie des changements?
Il vaut mieux ne pas avoir de données que des données fausses (ce qui est souvent le cas pour les églises dans google maps par ex).

Pour avoir géré pas mal de cas compliqués à la main, la seule chose qui marche vraiment efficacement c’est de comparer la forme sur osm avec les photos de clochers.org (ou autre source comme mapillary lorsque ca existe). Les approximations risque de faire baisser la qualité du dataset et ca serait dommage!

J’invite qui a un peu de motivation et de temps à essayer sur un département, j’ai donné plus haut comment je fais pour récupérer les données wikidata, osm et quoi mettre dans conflation (le plus important, n’oubliez pas de décocher « remplacer les géométrie », on ne veut pas remplacer un beau bâtiment importé du cadastre par un point :sweat_smile:)

Pour ceux qui n’ont jamais utiliser le plugin conflation de josm, un 1er calque avec les données osm que l’on va modifier et que l’on « envoie » à la fin, dans un 2e calque les données wikidata (qui ne seront pas envoyé à la fin bien entendu) sur la requête wikidata faire télécharger → csv puis donnez le fichier à josm. Dans le plugin : « référence » y mettre tous les points du calques wikidata et dans « sujet » les églises déjà dans osm donc faire un recherche dans le calque osm pour avoir toutes les églises (Le plugin conflation ne sait pas gérer les relations, vous pouvait les lui donner dans « sujet » mais il ne trouvera pas de correspondances avec elles.). Et d’une fois les correspondances générés, le bouton « assembler » permet pour l’élément sélectionné d’ajouter les tags du calques wikidata vers le calques osm.
Dans un 1er temps au moins, allez y doucement sur le bouton « assembler » pour voir ce que ça fait dans les données osm.

Les cas compliqués n’ont pas été fait automatiquement, j’ai fait la même chose, aller voir les photos de wikidata, commons ou clochers.org pour vérifier que l’église correspondait. Le plugin conflation me permet juste, si l’église wikidata correspond à celle osm en un clic d’ajouté wikidata=* sur l’élément osm et de choisir le name=* que mes « investigations » me font croire être le bon (si les noms osm et wikidata différent).

Le name3 que je crée dans ma requête wikidata , j’enlève une partie des tirets présent dans les noms wikidata parce qu’il existe rarement dans osm. exemple : Dans wikidata ont aura « église Saint-Pierre-et-Saint-Paul de Trifouilly-les-Oies », le name que je crée dans la requête c’est « Église Saint-Pierre-et-Saint-Paul » et dans le name3 c’est « Église Saint-Pierre et Saint-Paul » (Le name2 j’ajoute juste une majuscule à la 1e lettre). Je ne sais pas quelle est la graphie à utiliser ?
Ensuite pour le plugin conflation, je teste d’abord si çà match exactement dans osm avec « Église Saint-Pierre-et-Saint-Paul » et si non je passe le name3 en name et retest si ca matches.
(Pour faire cette requête j’ai découvert que l’on pouvait utiliser « ?! » et « ?<! » pour mettre des condition dans les expressions régulières. par exemple si on a wikidata qui donne « église de la Nativité-de-Notre-Dame de Sainte-Marie » je veux sortir « Église de la Nativité-de-Notre-Dame » or il y a 2 fois « de » et ça me posait problème je ne sortais que « Église ». je m’en suis aussi servi pour ne pas virer les tirets après « saint » et « notre »)

Le chalenge maproulette propose d’aller chercher le nom de l’église sur clochers.org c’est aussi un import semi automatique :wink:, je vais le chercher ailleurs mais la licence permet aussi de s’en servir et çà a l’avantage d’avoir une position (plus ou moins) précise. sachant que beaucoup d’église de wikidata sans page wikipédia ont été créé avec directement un lien vers clochers.org et/ou messe.info, il y a de bonne chance que l’info du nom vienne d’un de ces sites.

Je ne sais pas quelle est la meilleurs source, je suis tombé sur plusieurs églises avec source:name=clochers.org avec le nom ajouté il y a plusieurs années et en allant sur le site le nom n’était pas celui ajouté, soit une erreur d’église soit les données du site ont évolué.
Pour un nombres loin d’être négligeable d’églises, Il y a des différences de noms entre clochers.org, messes.info, wikidata, wikipédia, les catégories commons où sont classés les photos de l’édifice, les notices des monuments historiques et osm. Il y a des églises qui ont des noms sur wikidata ou ailleurs comme église Notre-Dame dite Saint-Martin, la dédicace différente du nom utilisé localement.

Je n’ai pas changé de name=* dans osm si je n’avais pas de bonne raison de croire qu’il y avait une erreur. et des erreurs, il y en a quelques unes et ce n’est pas toujours facile de les repérer et donc j’en ai raté : 2 églises inversé dans la commune ou avec un village du même nom à des centaines de kilomètre, les tags et le nom qui va avec un monument historique sur l’église du village alors que le monument historique c’est une église en ruine pas bien loin, dans les villages où il y a église et temple protestant, j’ai eu des cas d’inversion dans osm ou dans wikidata… Si l’erreur est dans osm et wikidata je n’ai pas pu les repérer…

Je ne sais pas comment créer un chalenge maproulette qui présélectionnerai les cas problématique. peut être en comparant les nom osm et wikidata et en ne donnant que ceux différent dans maproulette, le faire avec clochers.org ne me semble pas possible.

bon c’est long à lire et c’était beaucoup trop long à écrire :sweat_smile:, je m’arrête là !

1 Like

Merci pour tout ces détails.
@Olyon , serais-tu disponible un mardi soir prochain pour nous faire une démonstration « live » sur le salon BigBlueButton adopteunecommune?
Ça permettrai de l’enregistrer et d’en faire un tuto vidéo

1 Like

(Ce n’est pas une invitation du mercredi, hein :grin: )

1 Like

Merci encore pour les infos. Oui on peut se faire une visio ce soir sur le sujet. Pour clochers.org pourquoi dis-tu que ça ne semble pas possible ? On pourrait comparer les noms sur les 3 sources pour voir les différences.

J’ai archivé le challenge des lieux de culte sur maproulette. Il n’est plus visible depuis la recherche, mais j’ai l’impression que si on va direct sur la tâche ça marche toujours. Bon j’ai pas envie de le supprimer pour le moment, je le garde sous le coude. On verra quand on aura décidé ce qu’on fait comment je le restructure.

Non désolé, pas possible ce soir, peut être une prochaine fois.

Pour clochers.org ça ne me semble pas possible car je n’ai pas l’impression qu’il y ai un export accessible de leur base de donnée donc s’il faut aller récupérer les noms de dizaines de milliers d’église à la main pour les comparer, c’est compliqué. Peut être qu’il y a un moyen d’« aspirer » toute les pages de leur site ou de leur demander…

Ok pas grave pour hier on a discuté d’autres trucs.

Ah c’était juste ça pour clochers.org. J’ai déjà fait un parser en Python qui scrappe le code HTML du site pour exporter en CSV. Ça fonctionne simplement en donnant le code du département et ça sort la liste de toutes les églises. Pour l’instant je l’ai fait tourner sur une dizaine de départements et ça a plutôt bien fonctionné.

C’est juste que c’est dommage pour l’aspect projet de contribution partagé.
Je suis bien d’accord, mais en l’état, c’est très contraignant et inutilisable pour ma part, le fait d’avoir un lien bouton droit => ouvrir dans un nouvel onglet (comme c’est le cas sur la majorité des sites) réduirait la peine, mais il n’y a même pas cette solution.

D’autre part, sur le projet mairie, auquel j’ai participé, j’ai vu que des mairies étaient déjà là depuis plusieurs mois voir d’avantage, que d’autres avaient été remplies dans l’intervalle de façon bâclée (ne suivant pas la documentation du qui demandait d’insérer les données de lannuaires.service-public.fr), et je me suis superposé avec quelqu’un n’ayant pas vu qu’il fallait s’accaparer la ressource à résoudre.

Concernant maproulette je l’ai utilisé sur différents navigateurs, sous Windows et sous Linux, il y a des moments où ça peut arriver qu’il rame un peu, mais globalement ça fonctionne bien. Peut-être ton ordi est-il vraiment très vieux ?

Oui mon ordinateur à 12 ans (je ne suis pas un adepte de la surconsommation, et je n’ai ça sur quasiment aucun site et la majorité des applications de mon système (Arch, donc toujours à jour des dernières versions) sont largement utilisable également. D’autre part, comme je disais des outils qui font l’équivalent comme l’éditeur en ligne d’OpenStreetMap, OverPass, uMap, et tous les autres outils que j’utilise sont instantanés et utilisent mieux les standard HTML5 pour l’interaction. Il y a des sérieux problèmes de performance sur maproulette, du moins en proportion avec le contenu délivré.