1 Introduction


Cette étude s’appuie sur les données du gouvernement du site https://www.data.gouv.fr/fr/datasets/base-sirene-des-entreprises-et-de-leurs-etablissements-siren-siret/. La dernière mise à jour de ces données a été faite le 1er février 2019. Il y a 4 bases de données, une pour les unités légales, une pour les établissements, et l’historique de chacune d’entre elle.

Bien que ces données sont volumineuses, peu de variables sont intéressantes à étudier. Dès lors, l’objectif de projet était de croiser ces bases de données avec d’autres. Au bout d’un certain temps, n’ayant toujours pas trouvé d’autres jeux de données adéquat, nous avons abandonné l’idée d’avoir une problématique et d’y répondre afin de présenter au mieux ce jeu de données sur les entreprises en France.


2 Présentation des données


Pour la suite, il est important de différencier les unités légales des établissements. Une unité légale fait réference à une entité qui dirige sa propre entreprise. Cela peut être un individu ou bien un groupe de personnes qui dirige une entreprise ou une association par exemple. Lorsque nous parlerons d’une entreprise nous fairons réference à une unité légale. Une unité légale peut posséder plusieurs établissements répartis à des endroits différents. Ainsi lorsqu’il s’agira de parler d’établissement, cela sera seulement l’établissement à une adresse d’une entreprise et non pas directement l’entreprise, bien qu’une entreprise peut posséder qu’un seul établissement.


2.1 Unités légales

À l’origine la base de données des unités légales comptait plus de 20 millions de lignes pour 33 variables. En supprimant les entreprises qui ont cessé leurs acitivtés (i.e. entreprises fermées) la table avait plus que 11 millions d’individus. À cela nous avons sélectionné seulement 5 variables, celles qui nous semblaient pertinentes.

Parmi ces entreprises actives, plus de 5 millions sont des Petites et Moyennes Entreprises (PME), 63 000 des Entreprises à Tailles Intermédiaires (ETI), et 32 000 des Grandes Entreprises (EN). Par conséquent il reste plus 5 millions d’unités légales dont on ne connait pas la catégorie ce qui constitue une première limite pour ce jeu de données et cette étude.

Voici un échantillon de la table des unités légales.

siren date_creat tranche_eff categ_ent categ_jurid
5580501 1900-01-01 NN GE 5720
5720602 1957-01-01 NN GE 5710
5720651 1957-01-01 GE 5498
5780390 1957-01-01 12 GE 5599
5780960 1957-01-01 32 GE 5710
5820378 1958-01-01 31 GE 5710

2.2 Établissements

siren date_creat tranche_eff siege code_post etat_admin
5580501 1986-12-25 NN false 44600 A
5580501 1996-05-01 NN true 75008 A
5720602 2007-03-19 true 92110 A
5720651 2014-01-01 true 69002 A
5780390 1989-01-01 NN false 44410 A
5780390 2016-10-25 true 44600 A

2.3 Présentation des variables

  • Siren

Chaque entreprise en France possède un numéro d’identification unique, c’est le Siren.

  • Date création

Date à laquelle l’établissement ou l’unité légale a été créé.

  • Tranche effectif

Effectif des établissements par tranche. À chaque tranche correspond un nombre de salarié.

Num Libelle
01 1 ou 2 salariés
02 3 à 5 salariés
03 6 à 9 salariés
11 10 à 19 salariés
12 20 à 49 salariés
21 50 à 99 salariés
22 100 à 199 salariés
31 200 à 249 salariés
32 250 à 499 salariés
41 500 à 999 salariés
42 1 000 à 1 999 salariés
51 2 000 à 4 999 salariés
52 5 000 à 9 999 salariés
53 10 000 salariés et plus
  • Catégorie entreprise

Il existe quatre catégories d’entreprise :

  • TPE : Trés petite Entreprise
  • PME : Petite Moyenne Entreprise
  • ETI : Entreprise de Taille Intermédiaire
  • GE : Grande Entreprise

Les PME et les TPE ont été regroupées pour ne former que le groupe PME dans les bases de données. D’après différentes sources1 il y aurait environ 2 millions de TPE et 3.8 millions de PME.

  • Catégorie juridique

Chaque numéro correspond un interval d’effectifs des salariés d’une unité légale.

Num Libelle
1 Entrepreneur individuel
2 Groupement de droit privé non doté de la personnalité morale
3 Personne morale de droit étranger
4 Personne morale de droit public soumise au droit commercial
5 Société commerciale
6 Autre personne morale immatriculée au RCS
7 Personne morale et organisme soumis au droit administratif
8 Organisme privé spécialisé
9 Groupement de droit privé



3 Étude univariée


3.1 Évolution du nombre de création d’unité l’égale

En comparant l’évolution du nombre de création d’entreprise nous remarquons que les 3 catégories suivent la même tendance. Quelque soit le type d’entreprise le nombre d’unité légale croît de manière exponentielle. Nous n’avons tenter de croisé cet axe d’analyse avec d’autre jeu de données, ou en cherchant des explications quant à cette croissance très forte des nombre d’entreprise, mais nous n’avons rien trouvé. Ce qui semble étrange est que le nombre d’entreprise croît de manière exponentielle alors que nous savons que le chomage par exemple, n’a pas baissé après les années 2000.



4 Étude bivariée


4.1 Catégories juridiques des entreprises selon leur taille

Parmi les PME 48% et 37% d’entres elles sont respectivement de catégories juridiques 1 (Entrepreneur individuel) et 5 (Société commerciale). Les trois quarts des ETI sont également des sociétés commerciales et 18 % sont d’autres personne morale immatriculée au RCS2. On observe à peu près les mêmes proportions parmi les grandes entreprises.

4.2 Tranches d’effectifs de salariés selon la taille de l’entreprise

Les tranches d’effectif sont ordonnées de la plus petite à la plus grande. Ainsi, nous remarquons que les PME ont de petits effectifs alors que les ETI et les grandes entreprises ont plus d’effectif dans les tranches avec beaucoup de salarié.

4.3 Le nombre d’établissement par région

4.3.1 Grandes Entreprises

FALSE OGR data source with driver: ESRI Shapefile 
FALSE Source: "d:\Users\Home\Desktop\M2 MSS\Projet Open Data\ProjetOpenData\data\map\FRA_adm1.shp", layer: "FRA_adm1"
FALSE with 22 features
FALSE It has 9 fields
FALSE Integer64 fields read as strings:  ID_0 ID_1

4.3.2 Entreprises à Taille Intermédiaire

4.3.3 Petites et Moyennes Entreprises

En comparant la répartition des établissements en France métropolitaine selon leurs catégories d’entreprises, nous remarquons qu’à chaque fois l’Ile-de-France en occupe au moins un cinquième. Nous remarquons également quelques différences entre les catégories mais gloabalement les régions gardent les même proportion à l’image de la Bretagne, du Nord-Pas-de-Calais et du sud-ouest et sud-est de la France.

5 Conclusion

Malgré le manque de problématique de ce projet, il a été intéressant de réaliser du traitement de données avant de réaliser des statistiques. Ce jeu de donnée peut être intéressant à étudier dès lors que l’on a trouvé un autre jeu de donnée adéquat pour croiser plus d’informations.


  1. 1

  2. exemples Caisse d’épargne et de prévoyance, Groupement d’intérêt économique, Société coopérative agricole, Société d’assurance mutuelle, société civile