Chaque année des milliers d’élèves passent des examens obligatoires tels que le Baccalauréat et le Diplôme National du Brevet (DNB). Les taux de réussites à ces examens sont particulièrement suivis et peuvent être des indicateurs de la qualité de l’enseignement français. Cependant, l’opinion publique pense que la réussite des élèves dépendrait de plusieurs facteurs tels que l’origine sociale des parents ou encore le lieu d’enseignement de ces derniers.
Dans un premier temps, nous analyserons les taux de réussite en fonction de l’âge, du sexe et de l’origine sociale, puis nous essayerons d’expliquer ces résultats avec des variables sociaux-économiques tel que le revenu des ménages ou le taux de pauvreté.
Nos jeux de données proviennent majoritairement du site data.education.gouv.fr.
Afin de réaliser nos études nous avons sélectionné 6 jeux de données :
Indicateurs de résultats des lycées d’enseignement général et technologique : Ce jeu de donnée nous donne pour chaque lycée général et technologique le taux de réussite brut et le taux de réussite attendus de 2012 à 2016.
Réussite au baccalauréat selon l’origine sociale : Ce jeu de donnée nous donne le poucentage d’admission au baccalauréat selon l’origine sociale des parents (Cadres,Retraités, Ouvriers, …)
Réussite au baccalauréat selon l’âge : Ce jeu de donnée nous donne le poucentage d’admission au baccalauréat selon plusieurs classes d’âge allant de “16 ans ou moins” à “30 ans ou plus”, pour une période allant de 1997 à 2016.
Diplôme national du brevet par établissement : Ce jeu de donnée nous donne pour chaque établissement, le taux de réussite, le nombre d’admis et le nombre d’admis sans mention.
Résultats détaillés au DNB : Ce jeu de donnée nous donne le taux de réussite en fonction de la série, de l’âge et du sexe.
Nous avons aussi utilisé des bases de données provenant de l’INSEE.
Nous nous sommes tout de suite rendus compte que la granularité de nos jeux de données n’était pas la même :
* Les jeux de données provenant de data.education.gouv présentaient les données en fonction de la commune, du département, de l’académie ou de la région.
* Les bases de données de l’INSEE, présentaient les données en fonction du département et de la région.
De plus, afin de pouvoir répresenter graphiquement nos résultats nous avons téléchargé les shapefiles des départements sur data.gouv.fr. Ce choix nous a obligé à omettre les Départements et les Territoires d’Outre-Mer.
Depuis ces 7 dernières années, on peut observer une forte augmentation du pourcentage de réussite au baccalauréat jusqu’en 2015, puis une stabilisation à 92 %.
Malgré l’augmentation du taux de réussite national ces dernières années, on peut constater en général que les résultats ne dépassent pas franchement les résultats espérés pour les deux tiers des département de france métropolitaine.
On peut constater que plus les candidats sont âgés au moment de l’examen, plus leurs chances de réussite diminuent.
On observe ici, également, une augmentation du taux de réussite national au DNB. On note toutefois que le taux de réussite est largement en dessous des 90 % contrairement au Baccalauréat. ### 3.2.2 Taux de reussite en fonction du sexe
Ces dernières années, les filles ont eu des taux de réussite plus élevés de 4% que les garçons. ### 3.2.3 Taux de reussite en fonction de l’âge
Quelques définitions selon l’INSEE Niveau de vie :
Le niveau de vie est égal au revenu disponible du ménage divisé par le nombre d’unités de consommation (uc). Le niveau de vie est donc le même pour tous les individus d’un même ménage.
Unité de consommation :
Système de pondération attribuant un coefficient à chaque membre du ménage et permettant de comparer les niveaux de vie de ménages de tailles ou de compositions différentes. Avec cette pondération, le nombre de personnes est ramené à un nombre d’unités de consommation (UC).
Pour comparer le niveau de vie des ménages, on ne peut s’en tenir à la consommation par personne. En effet, les besoins d’un ménage ne s’accroissent pas en stricte proportion de sa taille. Lorsque plusieurs personnes vivent ensemble, il n’est pas nécessaire de multiplier tous les biens de consommation (en particulier, les biens de consommation durables) par le nombre de personnes pour garder le même niveau de vie.
Aussi, pour comparer les niveaux de vie de ménages de taille ou de composition différente, on utilise une mesure du revenu corrigé par unité de consommation à l’aide d’une échelle d’équivalence. L’échelle actuellement la plus utilisée (dite de l’OCDE) retient la pondération suivante :
1 UC pour le premier adulte du ménage ; 0,5 UC pour les autres personnes de 14 ans ou plus ; 0,3 UC pour les enfants de moins de 14 ans.
On peut constater qu’il n’y a pas de schéma qui se dessine : On observe que certains départements qui ont un taux de réussite élevé ont des ménages ayant des niveaux de vie median faible.
##
## Call:
## lm(formula = BAC15 ~ Revenus15, data = Departement)
##
## Residuals:
## Min 1Q Median 3Q Max
## -6.9709 -1.3509 0.1061 1.3090 3.8401
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 9.225e+01 2.713e+00 33.999 <2e-16 ***
## Revenus15 2.422e-05 1.336e-04 0.181 0.856
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.042 on 94 degrees of freedom
## Multiple R-squared: 0.0003497, Adjusted R-squared: -0.01028
## F-statistic: 0.03288 on 1 and 94 DF, p-value: 0.8565
Notre variable est loin d’être significative. On va réaliser plusieurs tests de corrélations afin de confirmer l’indépendance de nos deux variables.
N.B : La variable Revenus15 correspond au niveau de vie médian des ménages en 2015.
## p-valeur
## kendall 0.8992305
## pearson 0.8564951
## spearman 0.8947926
On peut constater que les trois tests de corrélations ont des p-valeurs largement supérieures à 0.05. Il est donc vraisemblable de supposer que le taux de réussite au baccalauréat est indépendant du niveau de vie médian des ménages.
##
## Call:
## lm(formula = BAC15 ~ Pauvrete, data = Departement)
##
## Residuals:
## Min 1Q Median 3Q Max
## -6.9883 -1.4529 0.1739 1.3179 3.7471
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 93.58659 1.00444 93.172 <2e-16 ***
## Pauvrete -0.05749 0.06645 -0.865 0.389
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.035 on 94 degrees of freedom
## Multiple R-squared: 0.0079, Adjusted R-squared: -0.002654
## F-statistic: 0.7485 on 1 and 94 DF, p-value: 0.3891
## p-valeur
## kendall 0.1334613
## pearson 0.3891389
## spearman 0.1497981
On ne distingue ici aucune corrélation notable entre le taux de réussite au DNB et le niveau de vie médian. Nous allons, là aussi, réaliser des tests de correlations pour confirmer cette hypothèse.
##
## Call:
## lm(formula = DNB15 ~ Revenus15, data = Departement)
##
## Residuals:
## Min 1Q Median 3Q Max
## -9.3221 -1.5454 0.1314 1.7660 5.0234
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 91.8217447 3.4500519 26.615 <2e-16 ***
## Revenus15 -0.0002841 0.0001699 -1.673 0.0977 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.597 on 94 degrees of freedom
## Multiple R-squared: 0.0289, Adjusted R-squared: 0.01857
## F-statistic: 2.798 on 1 and 94 DF, p-value: 0.09773
## p-valeur
## kendall 0.14364466
## pearson 0.09773498
## spearman 0.15081985
De même que pour le baccalauréat, les p-valeurs sont supérieures à 0.05. Il est donc vraisemblable de dire que les résultats au DNB sont indépendants du niveau de vie médian.
##
## Call:
## lm(formula = DNB15 ~ Pauvrete, data = Departement)
##
## Residuals:
## Min 1Q Median 3Q Max
## -9.1833 -1.4701 0.1955 1.5812 5.1878
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 85.24203 1.29812 65.666 <2e-16 ***
## Pauvrete 0.05587 0.08587 0.651 0.517
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.63 on 94 degrees of freedom
## Multiple R-squared: 0.004482, Adjusted R-squared: -0.006108
## F-statistic: 0.4232 on 1 and 94 DF, p-value: 0.5169
## p-valeur
## kendall 0.8493765
## pearson 0.5169085
## spearman 0.9211172
En conclusion, on peut vraisemblablement dire que le taux de réussite aux examens du secondaires diffèrent selon le sexe, l’âge et l’origine sociale des candidats. Cependant, on n’observe pas de lien direct entre le niveau de vie ou la pauvreté des ménages et le taux de réussite.