Certains musées avec un nom chinois sur le fond de plan

Bonjour,

En regardant la carte sur Paris en ce moment, sur le Trésor de Notre-Dame ou la bibliothèque de l’Opéra Garnier, le nom affiché est moitié chinois moitié français. Il semble que la contribution ait été faite hier.
Quelle est la manière correcte de corriger cela ? Contacter la personne + revert directement ?

https://www.openstreetmap.org/changeset/41002641
https://www.openstreetmap.org/changeset/41002980

De manière générale, ce n’est pas la première fois que j’observe des contributions hasardeuses/pauvres faites avec l’application maps.me. Constatez-vous la même chose ?

Merci,
Guillaume

Bonjour,
C’est un nouveau contributeur qui utilise une applis smartphone pour éditer.
Tu peux donc lui rappeler le principe du tag name et de l’internationnalisation des données. Demande-lui de corriger.
Proposes également le site http://mlm.jochentopf.com/ ou Maperitive pour afficher/créer une carte dans sa langue.

Le mieux est de lancer la discussion sur les groupes de modification afin de rendre ça clair et ouvert à tous.
Si rien ne bouge, revert.

J’ai la version android de maps.me je regardes ce que donne la carte en chinois :slight_smile:

Bruno

À noter qu’il y a une probabilité non négligeable que la personne ne connaisse pas OpenStreetMap.

Si c’est le cas, le laïus sur l’internalisation des données et maperitive risque de lui passer bien au-dessus…

:smiley:

Sinon Maps.Me, que j’apprécie par ailleurs pour sa fluidité, se fait une “belle” réputation en tant qu’éditeur OSM, et pas que sur les name !

http://wiki.openstreetmap.org/wiki/Maps.Me/Questionable_OSM_Edits

Et oui, abaisser la marche à l’entrée ça a un petit revers à la médaille… et pas mal d’utilisateurs de Maps.me n’ont pas la compréhension de l’impact de leur ajouts…

Il y a du suivi à faire… en attendant que l’appli s’améliore aussi de son côté.

Je viens de corriger un petit paquet de noms sur Paris.
Quelques exemples :
荣军院博物馆Musée de l’Armée
ダリ美術館 Espace Dali
バカラ美術館 galerie-musée Baccarat
Blancpain宝柏

J’aurais aimé écrire une validation pour osmose mais l’analyse ne semble pas être juste “contient un caractère non alphanumérique”. Il y a par exemple des restaurants, des supermarchés et des lieux de culte avec des caractères exotiques.
Exemples :
真佛宗 真願堂 A.C.B. Vérité (place_of_worship)
Supermarché Bonjour - 新温州超市
Chine store - 新今日超市
Jiajia tofu - 家家食品豆腐店
法亚文化友爱会 (une association, sans aucun caractère alphanumérique)

Une idée ?

Toujours l’effet maps.me ?

Une nouvelle analyse osmose serait en effet utile…

Dans de tels cas, pensez à remettre ce nom dans le bon name:xx :wink:

Oui toujours maps.me. J’ai aussi trouvé 4 ou 5 noeuds en arabe. Pas simple du tout !

Tu as pu contacter le gars?

J’ai mis un message sur le changeset sans trop d’espoir. Le problème c’est qu’il n’est pas seul… Je vais tenter de faire une analyse un peu plus profonde.

J’ai fait une petite moulinette pour regarder les noeuds de l’export France.

Voici les résultats : https://gist.github.com/guillaumerose/017f9ef16bf05f2edeacbf44c49297c3 (langue, id, name, dernier contributeur, dernière modification, tags du changeset)

Il y a 76 noeuds louches.
On trouve un peu toutes les langues :
1 KATAKANA
1 LISU
5 HANGUL
8 ARABIC
21 CYRILLIC
36 HAN

34 viennent de Maps.me. Quasiment tous les “problèmes” récents proviennent de Maps.me.

Le plus embêtant de la liste à mon sens : la petite ville de Chambord qui a un joli suffixe.

Cela permet aussi de remonter certains utilisateurs et de voir qu’ils ont aussi touché d’autres pays :
http://www.openstreetmap.org/user/Dahee%20Choe/history
http://www.openstreetmap.org/user/LXG/history

Très intéressante moulinette… tu partage le code ?

C’est une analyse qu’il faudrait ajouter à osmose… il n’y a pas trop de raison qu’en France on ait des caractères provenant d’alphabets non latins en name, name:fr, name:en, etc… et inversement.

Avec beaucoup de retard, voici le petit bout de code.
https://github.com/guillaumerose/detect-non-latin-characters - désolé, c’est du Java

Tout se passe ici : https://github.com/guillaumerose/detect-non-latin-characters/blob/master/src/main/java/fr/guillaumerose/UnicodeDetectorSink.java#L49
Java a la bonne idée d’avoir des fonctions qui retourne le type unicode.

Le résultat sur le dernier france.osm.pbf est dispo ici : https://gist.github.com/guillaumerose/f9b96e511769952bcb6692d456ce9a51
On voit que le Panthéon a eu le droit à un petit suffixe.

Pour convertir ça dans osmose, je ne sais pas trop comment faire. Si tu as un exemple à me montrer, je veux bien tenter de l’écrire.

En l’occurence, c’est du japonais en haut et du chinois en bas.

Info pertinente !

Y-aurait-il un moyen de déterminer approximativement la langue à partir d’une chaine ?

Bruno