Erreur d'orthographe dans FANTOIR

Bonjour,

Aux Contamines-Montjoie il y a une rue avec des erreurs d’orthographe.

  • Le nom vient du sommet juste au dessus l’aiguille de la Bérangère
  • Le panneau sur le terrain est correct mais il est en majuscules non accentuées
  • Le nom correct est : impasse de la Bérangère (avec un é, un a, un è)
  • Le cadastre mentionne (é, e, è)
  • FANTOIR utilise (e, a, è)

Donc :

Pourtant la page FANTOIR des Contamines m’indique toujours que la rue est sans rapprochement.

Est-ce que j’ai loupé une étape ?

Rappel: FANTOIR n’utilise pas d’accents… il n’y a que des majuscules non accentuées dedans (je parle du fichier source de la DGFiP).

Yep. J’ai vu pour les accents. Des restes de l’ASCII :slight_smile: Les panneaux sur cette commune sont aussi en majuscules non accentuées. (PS: vivent les nouveaux claviers bépo ou azerty avancé)

Par contre ça ne m’explique pas pourquoi le rapprochement ne se fait pas. J’ai bien demandé la mise en jour (la flèche avec le rond noir en haut à droite) mais ça ne change rien.

Bonjour,

Je pense qu’il s’agit d’un problème général car depuis le 19/10/21 les mises à jour ne se font pas ce qui est ennuyeux…
Problème qui est déjà survenu il y a quelques mois…

Pour plus de sûreté, j’aurais tendance (peut-être à tort ?) à ajouter un « alt_name=Impasse de la Bérengère » et un « source:alt_name=cadastre » pour optimiser les recherches qui pourraient se tromper d’orthographe, et peut-être faciliter le rapprochement ?

Je ne suis pas trop pour. Les nuances d’orthographe telles que la présence ou absence d’accent sont le b-a-ba de ce que doit savoir appréhender un moteur de recherche. Si on commence à compenser cette lacune en générant de la donnée, on n’a pas fini…

1 Like

C’est lié à ce ticket en cours de résolution. A l’instant sur la page des Contamines l’impasse de la Bérangère est bien rapprochée.

Oui je viens de voir ça :slight_smile: Donc a priori je m’y étais pris correctement.

Il ne reste plus qu’une rue non rapprochée mais c’est un autre sujet : c’est le bazar dans le hameau pour la rue restante. Le cadastre ne correspond absolument pas à l’imagerie aérienne. Il faudra que j’aille voir sur place.

Testé à l’instant : Nominatim trouve bien « impasse de la berangere » sans accents, mais il ne trouve pas « impasse de la berengere » avec un e à la place du a. Qwant Maps n’a pas encore pris en compte ma correction sur les noms mais il trouve avec 2 orthographes.

Ce qui est, avouns-le, un gros point noir d’OSM.
Et c est dommage, c est souvent le premier point d’entrée pour quelqu’un qui découvre

Bien d’accord avec LySioS : c’est un point noir, et c’est pour ça que je proposais mon « alt_name » : il ne s’agit pas ici d’un simple problème d’accentuation, mais d’inversion de lettre (a / e) dans un nom propre, que les moteurs de recherche d’adresse OSM ne corrigent pas.

Ah pardon, je n’avais pas vu que Qwant Maps y parvenait : tant mieux !
Mais ce serait bien qu’osm.org y arrive naturellement.

Quand il y a plusieurs noms possibles, le alt_name existe et il a sa raison d’être. Dans le cas particulier du sujet initial, il y a une erreur du cadastre. Je ne sais pas si le alt_name est la réponse adaptée. Je n’ai pas d’avis sur ce cas.

Par contre il ne faut pas se tromper de sujet. Il y aura toujours un utilisateur pour rechercher un nom avec une faute. Un moteur de recherche digne de ce nom devrait savoir faire de la recherche phonétique (qui diffère selon les langues). Et si on demande aux contributeurs de couvrir tous les cas possibles on résout de la mauvaise façon ce que devrait savoir faire Nominatim. De la même façon qu’on ne taggue pas pour le rendu, je suppose qu’il ne faut pas tagguer pour Nominatim.

Comme le disais @LySioS c’est un point noir. Quand j’ai découvert OSM j’ai commencé par chercher les lieux que je connaissais … et ce n’est pas toujours fameux.

Oui tu as raison, on ne doit pas tagger pour pallier la faible pertinence de nominatim.

Mais ici en l’occurence, on taggue la réalité du terrain + la réalité du cadastre. Cadastre qui n’a qu’une faute donc marge d’erreur faible qui devrait être compensé par les algos de recherche ; mais s’il y en avait plusieurs, comment sait-on si ça sera pris en compte par la recherche ?

Je suis tombé il n’y a pas longtemps sur venta (terrain) / bente (cadastre), ça fait 2 lettres sur 5 qui diffèrent quand même.

J’imagine que dans les régions où la langue locale est très marquée, le cadastre a dû franciser pas mal l’écriture pour respecter la prononciation, quitte à bousculer pas mal de lettres (?)

Cela dit, la procédure ci-dessous de Sylvain me paraît être le bon compromis

J’ai bien noté que vous étiez candidats à fournir un PR pour que le Soundex marche sur Nominatim ;-).

Très compliqué en multilingue… par contre en monolingue, on a ce qu’il faut: https://demo.addok.xyz

Argh voilà ce que le serveur génère

C’est le contrôle parental de ton employeur qui génère ça, pas mon serveur :wink:

« La stratégie établie avec Forcepoint a pour effet de toujours bloquer cette page. »

C’est obscène ? :crazy_face:

Ils ont confondu .xxx et .xyz ?

1 Like