[SIREN] Récupérer nom entreprises?

Bonjour,

Christian Quest mouline le fichier Siren fournit par l’Insee pour lui ajouter les coordonnées GPS des entreprises, ce qui est très appréciable :

http://data.cquest.org/geo_sirene/v2019/

Par contre, l’Insee ne fournit par le nom des entreprises.

Avant de regarder leur API pour récupérer les noms en envoyant les SIREN, cette liste serait-il déjà disponible sous forme de fichier à télécharger ?

Merci.

Si bien sûr, l’INSEE fournit le nom des entreprises, heureusement !

Ce que je géocode la base SIREN, ce sont les établissements (lieux d’activité d’une entreprise = SIRET) et pas les entreprises (unités légales = SIREN, qui ne comporte pas d’adresse, donc non géocodable). Un établissement est le siège de l’entreprise.
Il suffit de croiser SIRET et SIREN et l’on a le lieu + toutes les infos sur l’établissement et l’entreprise elle même.

Un fichier plus simple à exploiter, qui combine les deux se trouve au niveau au dessus: Index of /geo_sirene/

Il correspond à peu près à l’ancien format avec lequel l’INSEE diffusait la base SIREN jusqu’en 2019.

J’ai aussi mis en place une API:

1 Like

Super ! Je vois en plus que le fichier contient déjà le libellé des codes APE, ce qui évite d’avoir à faire la manip.

http://data.cquest.org/geo_sirene/last/etablissements_actifs.csv.gz

Suggestion : ajouter le SIRET pour identifier directement l’établissement (il y a juste le SIREN).

Truc pour extraire 1) la première ligne (noms colonnes) et 2) juste les lignes qui concernent une ville donnée via son code Insee :
grep -m1 «  » etablissements_actifs.csv > MaVille.SIREN.geo.csv
grep -Ph « ,12345, » etablissements_actifs.csv >> MaVille.SIREN.geo.csv

Merci beaucoup.


Edit : le logiciel de forum transforme les « double-quotes » par leur équivalent français

Il faut indiquer que c’est du code (icône </>) pour que les guillements soient préservés :wink:

grep -m1 "" etablissements_actifs.csv > MaVille.SIREN.geo.csv
grep -Ph ",12345," etablissements_actifs.csv >> MaVille.SIREN.geo.csv

SIRET = SIREN + NIC, les 2 premières colonnes, et ce format c’est l’INSEE qui l’a choisit, pas moi :wink:

En ligne de commande, il suffit de supprimer la première virgule ça donne:

zcat etablissements_actifs.csv.gz | sed 's/,//' | grep ... la suite

Le zcat évite de décompresser le fichier, ça se fait à la volée…

Merci.

Je profite du fil : j’aurais en fait besoin d’isoler les entreprises suffisamment importantes pour avoir un CE.

Sachant qu’on a donc déjà une liste avec le SIREN, l’Insee propose-t-elle un fichier avec cette info ?

Tu as les tranches d’effectifs dans les données, mais pas beaucoup mieux.

Je ne pense pas que l’INSEE ait plus, et même ça c’est pas hyper à jour.

Je vais chercher. Au pire, une moulinette pour pomper un site, vu que je n’ai que quelques millliers de boîtes dans la ville, et encore moins si je retire celles marquées « PME » dans le fichier.

Merci.