Un des bénéfices de Panoramax est que nous disposons de photos libres pour entraîner des modèles de reconnaissance d’objets et à terme en profiter pour cartographier sur OSM (mais pas que). @cquest avait proposé à quelques bonnes volontés de participer à l’entraînement de reconnaissance de visages, plaques d’immatriculation (pour le floutage) et de panneaux de signalisation (pour de la reconnaissance automatique) via la plateforme Label Studio. Cela a très bien fonctionné puisque le floutage des visages et plaques est natif au dépôt des photos sur Panoramax.
Après cette période de tests/essais sur quelques milliers de photos et des sujets bien déterminés, je vous propose qu’on aille plus loin pour
montrer que Panoramax ne sert pas qu’à faire de jolies photos (nous, nous sommes déjà convaincus)
démarrer des usages sur d’autres objets qui nous seraient utiles pour OSM
Bref, je vous propose de faire de la détection d’objets tels que:
poteaux incendie ou PEI (poteaux + bouches)
armoires de rue
bancs
enseignes (marques/objets symboliques (baguette pour le boulanger ou carotte pour les buralistes))
Le but étant d’entraîner les photos sur plus qu’un seul item à la fois, mais de ne pas vouloir tout détecter non plus (ca risque de faire lourd).
Que pensez-vous de ces item? en voyez-vous d’autres ?
Je les remets dans un second post que vous pourrez modifier.
Les propositions que je fais pour la détection d’objets:
poteaux incendie ou PEI (poteaux + bouches)
armoires de rue (différents usages et modèles)
bancs (différents sortes de bancs des + classiques en bois aux bancs en béton brut)
enseignes (marques/objets symboliques (baguette pour le boulanger ou carotte pour les buralistes))
On peut aussi détecter des lampadaires ou poteaux (n’est-ce pas @InfosReseaux), mais je te laisse nous donner ton avis sur l’opportunité de cette proposition au vu des travaux d’Enedis sur le sujet.
Pour les postes électriques, on a déjà de l’opendata sur le positionnement de très bonne qualité (je trouve). Après, ca pourrait le faire pour détecter les différents modèles de postes (enfin j’imagine).
J’hésite avec les passages piétons, qui seraient peut-être mieux détectés sur les ortho (mais ça reste une belle idée d’avoir la puissance d’une détection auto sur la base des ortho)
Pour les passages piétons et autres choses visibles du ciel, on n’aura qu’à attendre les orthos du PCRS à 5 cm. Le but ici est de se concentrer sur les images de terrain pour faire un POC de ce qui est réalisable facilement.
C’est une des fonctionnalités que j’avais trouvé vraiment bien dans Mapillary, cette reconnaissance d’objets dans les images … Je crois qu’ils avaient commencé par les panneaux de signalisation routière … ?
Effectivement, c’est peut-être ce qui est assez « facile » (facile pour une IA), car les panneaux de signalisation routière sont standards : format, couleur, taille etc.
Il y en a beaucoup au bord de la voirie, et ça sert pas mal dans OSM.
Pour entraîner l’IA, il doit être assez « facile » aussi de trouver des ensembles de photos, par exemple des :
piste cyclable obligatoire
voie réservée aux cyclistes
interdit aux vélos
etc.
Des questions que je me pose :
Combien au minimum faudrait-il de modèles d’une image donnée pour entrainer une IA sur un type de reconnaissance ?
Et comment constituer ces datasets d’entrainements ?
Comme @barnes38 je pensais au panneaux routiers (limitations de vitesse, sens uniques, etc.), aux feux tricolores mais aussi les panneaux de direction (vraiment un plus pour le guidage) qui sont standardisés, blancs, bleus, verts, les petits pour les vélos.
Est-ce qu’on saurait identifier le noms de rues, voire les numéros sur les bâtiments ?
@gendy54 tu as bien entendu pensé aux PEIs
J’ai un stock énorme de photos avec des poteaux incendie et un plus modeste avec des bouches. Elles sont stockées dans la base de données du SDIS34 et je peux faire un extraction. J’en ai aussi dans ma collection perso. Par contre il n’y a pas de photos 360° dans tout ce stock.
Si il y a besoin de travailler manuellement pour détourer et annoter les objets du jeu d’entraînement, je suis volontaire pour travailler sur les PEIs.
Sinon dans les objets intéressants à détecter je dirai les plaques de numéro d’adresses !
Evidemment ! AU départ je ne voulais entraîner le modèle que sur ca, mais Christian m’a dit que c n’était pas forcément une bonne idée.
J’ai peur que ce soit un peu petit. La qualité des photos n’est pas top pour le moment et elles ne sont pas forcément assez rapprochées pour avoir plusieurs angles. Qu’en pense @StephaneP ?
Et je supporte aussi tous ceux qui voudraient modéliser l’éclairage public avec non seulement la position du mat mais aussi sa hauteur et toute information sur la partie éclairante (position, orientation, divergence du faisceau… ). Le but sous-jacent est de modéliser la pollution lumineuse.
J’en ai aussi parlé avec lui à mon retour du geodatadays. C’est sûr que tant qu’à faire il vaut mieux définir plusieurs types d’objets. Ah oui tiens je dirai aussi un autre truc : les potelets positionnés en général aux extrémités des passages piétons (je ne connais pas le nom exact). Ce qui serait surtout bien c’est de les classifier pour éviter qu’ils soient confondus avec des PEIs !
Amha, il n’y a pas assez de données pour entrainer le modèle. Il faut au moins une centaine de photo avec l’objet. On pourrait détecter à la rigueur un panneau mais pas le texte dessus.
Pour les mats/poteaux, ca doit etre possible. Pour le reste, je pense que c’est encore la science-fiction: prendre des photos de nuit et vers le ciel
Euh des rouges il y en a vers chez moi et de loin la forme ça peut prêter à confusion. J’ai déjà vu ce genre de problème dans des algorithmes de reconnaissance sur les images il y a quelques années. Après ça c’est peut-être amélioré depuis au point que les algorithmes actuels ne ferait plus cette confusion ?
J’en avais déposé une petite dizaine dans wikicommons et je suis sûr qu’en faisant appel à la communauté, on arriverait assez rapidement à avoir un joli dataset d’entrainement, je veux bien y contribuer si nécessaire
L’association nationale de protection du ciel et de l’environnement nocturne, qui fait un super boulot, et depuis longtemps, détient bcp de données sur le sujet, mais n’a pas encore pris malheureusement le virage des données ouvertes… ?
Bcp de communes je crois, ont mis en place assez récemment l’extinction nocturne en milieu de nuit de l’éclairage public, pour des raisons financières, (et en vantent l’aspect écolo bien sûr) donc je crois qu’il y a pas mal de données à collecter ?
Accéder à toutes ces données (travail de moyen terme) et les partager permettrait de défendre un peu cette cause, et de toucher le grand public, tout en faisant également parler de Panoramax, et d’OpenStreetMap ?
Plus il y en a, plus c’est fiable.
Après pour entrainer une IA de reconnaissance d’image, il faut valider manuellement ce qu’elle a trouvé lors de l’entrainement, c’est comme ça qu’elle « apprend ». Donc plus il y a d’images, plus c’est fiable, mais plus ça demande de travail.
Sur mes photos on peut en trouver pas mal, que ça soit en photos planes ou 360, et avec des angles variés, ce qui fait qu’il y a de la matière pour entrainer un modèle.
Dans les photos que j’ai placé dans mon « chutier » pour une eventuelle détection, j’ai aussi :
Les repères de couleur :
jaune → gaz :
rouge → fluides
bleu → je ne sais plus
Les barrières :
Les défibrilateurs :
Les supports d’antennes, mais normalement on les a en Opendata :