LA POLLUTION DE L'AIR

Le monde est confronté à de nombreux problèmes importants et terrifiants qui mettent en danger la vie de l'humanité. La pollution de l'air fait partie malheureusement de ces problèmes majeurs entrainant le décès plusieurs millions de morts dans le monde.

La pollution atmosphérique désigne le rejet dans l'air de polluants qui sont préjudiciables à la santé humaine et à la planète dans son ensemble. Elle peut être décrite comme l'une des menaces les plus dangereuses auxquelles l'humanité ait jamais été confrontée. Elle cause des dommages aux animaux, aux cultures, aux forêts et aux organismes aquatiques. Elle contribue également à l'appauvrissement de la couche d'ozone, qui protège la Terre des rayons ultrat-violets (UV) du soleil. Parmi les autres effets de la pollution atmosphérique sur l'environnement, citons la brume sèche, l'eutrophisation et les changements climatiques mondiaux. Cela nous montre donc à quel point il est primordial pour nous de comprendre et trouver une solution adéquate à ce problème majeur. Pour ce faire, nous allons commencer par analyser judicieusement et comprendre les zones geographiques les plus touchées au fil des années et surtout de comprendre l'évenement majeur pouvant entrainer la cause de cette pollution quand cela est possible.

I- Les pertes humaines causées par la pollution de l'air dans le monde

Données:

Dans cette première partie, nous utiliserons plusieurs données provenant du site $\textbf{Our World in Data}$. Ce site regroupe plusieurs bases de données très variés concernant plusieurs problèmes existant dans le monde tels que la pauvreté, maladie, faim, changement climatique, guerre, risques existentiels et inégalité ,... Les données que nous allons étudier dans cette première partie concerne le nombre de décès causé par plusieurs facteurs dans le monde y compris la pollution de l'air. Les données ont été colléctées annuellement pour chaque pays dans le monde entre la période 1990 à 2015. Pour une étude plus approfondie, nous allons également croiser ces données avec d'autres données concernant l'emission des gaz carbonique(CO2),du méthane, la concentration d'ozone, les particules fines et le protoxyde d'azote.

Les variables utilisées dans cette étude sont pondérées en fonction de la population afin de ne pas biaiser le resultat.

1- Evolution de nombre de décès dans le monde

- Nombre de décès en 2015 dans le monde:

- Nombre de décès en 1990 dans le monde:

On peut constater la pollution de l'air est un vrai problème pour la survie de l'humanité. Soit 20 millions de personnes environ, dans le monde, sont décédées par ce dernier en 1990 et près de 21 millions de personnes en 2015. Ces chiffres nous montrent à quel point la situation peut encore s'aggraver si nous ne prenons pas les précautions nécessaires pour protéger notre environnement.

2-Analyse des facteurs de décès

Analyse en composante principale:


a-Visualisation générale des variables

On constate que depuis l'année 1990 , le nombre de décès annuel dans le monde n'a cessé d'augmenter. Ce nombre est plus particulièrement important pour la Chine et l'Inde car si on comptait environ 618 milles morts pour la Chine et 368 milles morts en Inde en 1990, ces chiffres sont passés à environ un million de morts pour la Chine et 763 milles presonnes décédés pour l'Inde en 2015.

Sur cette figure, on peut voir la concentration du gaz protoxyde d'azote ($N_2 O$) dans le monde. Cette concentration voit une augmentation majeure durant la période 1990 et 2015 dans certains pays. Après la Chine, on voit que l'Inde, les Etats-Unis et le Brésil en possèdent également une forte concentration. On remarque tout de même qu'à part la Chine et l'Inde, les concentrations baissent légèrement surtout en Russie.

Trois pays dominent aujourd'hui le marché mondial des productions animales en termes de volumes produits et de croissance de la production : Chine, Brésil et Inde, dépassant les pays développés. Le Brésil est le premier exportateur mondial de viande bovine, dont il fournit près de 20 % des échanges.

En effet, l'élévage bovin est produit une quantité très importante du méthane dans le monde. Les pets de vache relachés dans l'atmosphère contiennent enormement de méthane qui est l'un gaz à effet de serre le plus nocif.Une vache laitière produit par jour jusqu'à 200 litres de gaz méthane. Il faudra alors changer leur régime alimentaire pour reduire la production du méthane.

Actuellement, les scientifiques savent que 25 % du réchauffement actuel est dù au gaz méthane. Pour rappel, un kilogramme de méthane a autant d'effet sur le réchauffement climatique que 23 kg de CO2.

Les particules fines, également connue sous le nom de pollution particulaire ou PM, est un terme qui décrit les particules solides extrêmement petites et les gouttelettes liquides en suspension dans l'air. Les particules peuvent être composées de divers composants, notamment de nitrates, de sulfates, de produits chimiques organiques, de métaux, de particules de sol ou de poussière et d'allergènes (tels que des fragments de pollen ou des spores de moisissure). La pollution par les particules provient principalement des véhicules à moteur, des chauffages à bois et de l'industrie. Lors de feux de brousse ou de tempêtes de poussière, la pollution particulaire peut atteindre des concentrations extrêmement élevées.

$\textbf{Effets potentiels sur la santé de l'exposition aux particules:}$

Il existe de nombreux effets sur la santé liés à l'exposition aux particules. De nombreuses études ont montré des associations entre l'exposition aux particules et l'augmentation des admissions à l'hôpital ainsi que des décès dus à des maladies cardiaques ou pulmonaires. Malgré des recherches épidémiologiques approfondies, il n'existe actuellement aucune preuve d'un seuil en dessous duquel l'exposition aux particules n'entraîne aucun effet sur la santé. Les effets sur la santé peuvent se produire après une exposition à court et à long terme aux particules.

On pense que l'exposition à court et à long terme a des mécanismes d'action différents. L'exposition à court terme semble exacerber les maladies préexistantes, tandis que l'exposition à long terme provoque très probablement une maladie et en augmente la vitesse de progression.

$\textbf{L'exposition à court terme (de quelques heures à quelques jours) peut entraîner :}$

$\textbf{Une exposition à long terme (plusieurs années) peut entraîner :}$

b- Application de ACP normée

Les variables n'ont pas les mêmes grandeurs, il est alors nécessaire de les normaliser afin de leurs donner une même importance lors de l'ACP.

Le graphe ci-dessus montre le nombre de décès moyen dans chaque pays entre l'année 1990 et 2015. On remarque que la Chine et l'Inde possède le nombre de décès le plus important avec un écart très significatif par rapport aux autres pays dans le monde.

Pour mieux appréhender cet écart, nous allons effectuer une analyse en composante principale et trouver les facteurs majeurs de ces décès parmi les facteurs que nous disposons tels que l'émission de CO2 moyen durant cette même période de chaque pays, la concentration moyenne en méthane, en ozone, en particules fines ayant un diamètre inférieur à 2.5 micronmètres et la concentration en N2O dans l'atmosphère.

Remarque: Les resultats sur l'ACP ont été obtenus via l'implémentation du code en language R de Rstudio en utilisant le package FactoMiner

Description du resultat de l'ACP

a) Distribution de l'inertie

L’inertie des axes factoriels indique d’une part si les variables sont structurées et suggère d’autre part le nombre judicieux de composantes principales à étudier.

Les 2 premiers axes de l’ analyse expriment 82.34% de l’inertie totale du jeu de données ; cela signifie que 82.34% de la variabilité totale du nuage des individus (ou des variables) est représentée dans ce plan. C’est un pourcentage élevé, et le premier plan représente donc bien la variabilité contenue dans une très large part du jeu de données actif. Cette valeur est nettement supérieure à la valeur référence de 41.92%, la variabilité expliquée par ce plan est donc hautement significative .

Du fait de ces observations, il n’est probablement pas nécessaire pour l’analyse d’interpréter les dimensions suivantes.

Décomposition de l’inertie totale Le premier facteur est prépondérant :

Il explique a lui seul 57.9% de la variabilité totale des données. Il convient de noter que dans un tel cas, la variabilité liée aux autres composantes peut être dénuée de sens, en dépit d’un pourcentage élevé.

Une estimation du nombre pertinent d’axes à interpréter suggère de restreindre l’analyse à la description des 2 premiers axes. Cette observation suggère que seuls ces axes sont porteurs d’une véritable information. En conséquence, la description de l’analyse sera restreinte à ces seuls axes.

Le groupe auquel les individus China, India et United States appartiennent (caractérisés par une coordonnée positive sur l’axe) partage de fortes valeurs pour les variables CH4, N2O, Annual.CO2.emissions et death_count (de la plus extrême à la moins extrême).

Le groupe 2 (caractérisés par une coordonnées négative sur l’axe) partage de faibles valeurs pour les variables PM25, O3, CH4, N2O, death_count et Annual.CO2.emissions (de la plus extrême à la moins extrême).

Notons que la variable N2O est extrêmement corrélée à cette dimension (corrélation de 0.95). Cette variable pourrait donc résumer à elle seule la dimension 1.

Le groupe auquel les individus Qatar, United Arab Emirates et Bahrain appartiennent (caractérisés par une coordonnée positive sur l’axe) partage :

de fortes valeurs pour les variables PM25 et O3 (de la plus extrême à la moins extrême). Le groupe 2 (caractérisés par une coordonnées négative sur l’axe) partage :

de faibles valeurs pour les variables PM25, O3, CH4, N2O, death_count et Annual.CO2.emissions (de la plus extrême à la moins extrême).

Test de la nullité de corrélation

Nous allons faire deux tests ici pour vérifier la significativité de la corrélation entre le nombre de morts et les trois variables N2O,CO2 et CH4. Pour ce faire , nous utiliserons deux méthodes différentes : méthode de Pearson et méthode de Spearman. On obtient ainsi les resultats suivants:

Pour un niveau de test de 5%,la p-valeur obtenue est strictement inférieur 5% donc la corrélation est significativement différente de 0 entre la variable N2O et le nombre de mort. Cette corrélation est positive.

Pour un niveau de test de 5%,la p-valeur obtenue est strictement inférieur 5% donc la corrélation est significativement différente de 0 entre la variable CO2 et le nombre de mort. Cette corrélation est positive.

Pour un niveau de test de 5%,la p-valeur obtenue est strictement inférieur 5% donc la corrélation est significativement différente de 0 entre la variable CH4 et le nombre de mort. Cette corrélation est positive.

II-Acidité de la pluie et ses effets sur l'ecosystème

Source des données:

Les données proviennent du plate-forme de l'organisation $\textbf{National Atmospheric Deposition Program}$. Il s'agit des données annuelles sur l'acidité de la précipitation aux Etats-Unis avec quelques informations de ses composants chimiques tels que le 'Ca','Mg', 'K', 'Na', 'NH4', 'NO3', 'Cl', 'SO4'.

Le but est de pouvoir expliquer à partir de ces composants chimiques la variation de l'acidité d'une précipitation.

Le FAO (Food and Agriculture Organisation) a affirmé en juillet 2020 que la superficie forestière mondiale continue de diminuer et la perte forestière enregistrée depuis 1990 à l'échelle mondiale s'élève à 178 millions d'hectares. Toutefois, le taux de perte forestière nette a considérablement baissé sur la période 1990-2020 grâce au recul de la déforestation dans certains pays et à l'augmentation du terrain forestier dans d'autres grâce au reboisement et à l'expansion naturelle des forêts

Cette figure montre que l'acidité de la pluie baisse (ou encore la valeur de pH augmente ) au fil des années de manière générale. Cela est dù en effet à la baisse de l'emission de monoxyde d'azote qui l'un des causes de l'acidification de la précipitation comme montre la figure

Une analyse en composante principale de ces données donne alors la figure suivante:

On peut remarquer que la dimension 2 oppose l'acidité de la précipitation (pH) et les variables SO4 et NO3. Ces variables sont très bien projétées , on peut donc les interpréter convenablement. Il est évident que la variable pH est extrêmement corrélée à cette dimension 2. Tout ceci voudrait dire alors que plus le pH d'une précipitation augmente ( donc une précipitation basique ) moins il y a des NO3 et SO4 dans la précipitation. En revanche, plus les valeurs en NO3 et SO4 sont importantes ,le pH diminue de plus en plus , donc la précipitation est très acide.

On peut donc conclure ici que les variables SO4 et NO3 sont les causes de la variation de l'acidité de la précipitation.

Les pluies acides sont une forme de pollution atmosphérique participant à la dégradation des forêts et des lacs. En effet, comme montre cette figure, les deux causes principales sont les oxydes d'azote ($NO_x$) rejetés par les transports aériens et les transports routiers et les oxydes de souffre ($SO_x$) emis par certaines industries.

Sous l'action de la lumière solaire, ces oxydes de souffre et d'azote réagissent avec l'humidité atmosphérique. Ils forment de l'acide sulfurique($H_2 SO_4$) et de l'acide nitrique ($HNO_3$). Ils sont ensuite transportés sur des longues distances dans l'atmosphère. En tombant sur les forêts, les pluies acides brûlent les feuilles et les racines. Les arbres dépérissent , parfois jusqu'à la mort. Par l'écoulement des eaux, les pluies acides polluent également les lacs. Elles font disparaître le phytoplancton entrainant l'appauvrissement du milieu. Ces phytoplanctons sont des micro-organismes végétaux qui absorbent des milliards de tonnes du $CO_2$ présents dans l'atmosphère et produisent plus de la moitié de l'oxygène terrestre.

Dans l’atmosphère, les oxydes d’azote (NOx) se transforment en acide nitrique (HNO3),qui participe à l’acidification des précipitations et à l’apport de nitrates. Les NOx proviennent majoritairement des transports routiers et dans une moindre mesure des secteurs de l’agriculture/sylviculture et de l’industrie.

On sait également que l’ammoniac (NH3) est à l’origine de la présence d’ammonium dans les précipitations. Il est émis dans l’air majoritairement par le secteur de l’agriculture, principalement l’élevage. Il réagit dans l’atmosphère pour former des sels d’ammonium. Les dépôts d’ammonium ne sont pas acides en tant que tels mais peuvent avoir un effet acidifiant au contact du sol en libérant des ions H+ par transformation en nitrites (NO2-) ou nitrates(NO3-). De ce fait, ils ont également un effet eutrophisant sur les écosystèmes.

Test de la nullité de corrélation

Pour confirmer ce resultat, nous allons faire un test sur la nullité de coefficient de corrélation entre le pH et les variables NO3 et SO4. Nous allons donc exmainer deux méthodes de corrélation qui sont la méthode de Pearson et la méthode de Spearman. On obtient ainsi les resultats suivants:

Selon les deux méthodes de corrélation calculées, la corrélation est bien significativement différente de 0 pour un test au seuil 5% . On voit alors une forte corrélation négative entre pH et NO3. Ce qui valide notre affirmation précédemment.

De même pour SO4,les deux méthodes de corrélation calculées montrent chacune que la corrélation est bien significativement différente de 0 pour un test au seuil 5% . On voit également une forte corrélation négative entre pH et SO4. Ce qui valide notre affirmation précédemment.

III-Prédiction de l'acidité de la précipitation

MODELISATION:

Dans cette partie, l'objectif est de faire une prédiction de l'acidité de la précipitation selon ses compositions chimiques.

Corrélation des données avec la variable à expliquer pH

Ce resultat nous montre certainement que la variable "ppt" n'est pas corrélée avec la variable "pH". En effet la quantité totale de précipitations mesurée par le pluviomètre pendant la période de synthèse n'est pas prise en compte dans le calcul de l'acidité d'une quelconque solution. Il est alors préférable de la supprimer pour que le modèle utilisé puisse apprendre plus facilement sur le reste de nos données qui semblent être pertinentes.

Par validation croisée:

Calibrage des hyperparamètres du modèle Support Vector Machine

$\Longrightarrow$ Le modèle de SVR semble donner le meilleur resultat parmi ces trois modèles testés. On pourrait alors essayer de calibrer ses hyperparamètres pour apprendre un peu plus sur son efficacité sur nos données.

IV- Prévision de la température mondiale

Dans cette partie, nous allons faire une analyse d'une série chronologique concernant la température mondiale. L'objectif est de pouvoir déterminer les valeurs futures de la température moyenne mondiale dependamment des valeurs dont nous disposons depuis l'année 1743. Pour cela, il va falloir comprendre le type de la série que nos données représente.

Pour faire cela, nous devons étudier la stationnarité de la série,les tendances, la saisonalité de la série et ensuite proposer un modèle capable de prédire au mieux les valeurs futures en se basant sur nos données de validation.

Stationnarité de la série

a) Test de KPSS

H0 : la série est stationnaire

H1 : la série est non stationnaire

Ce resultat nous montre que la série chronologique n'est pas stationnaire. Il faut d'abord commencer par stationnariser cette série pour pouvoir mener des études statistiques avec celles-ci.

Pour la rendre stationnaire, nous allons procéder à une différentiation d'ordre 1

$\longrightarrow $Ce resultat de test nous montre que la série est bien stationnaire car la p-valeur est de 0.1 donc on ne rejette pas l'hypothèse nulle pour une valeur critique de 5%

b) Test de Dickey-Fuller Augmenté

H0 : La série possede une série unitaire - NON stationnaire

H1 : La série est stationnaire

La série est cette fois-ci bien stationnaire donc on va pouvoir faire des études statistiques correctement en regardant l'ecart-type, la moyenne .

Proposition d'un modèle

Autocorrélation et autocorrélation partielle

Remarque: L'implémentation du code pour la suite est traité en language R dans l'environnement RStudio

En tenant compte des resultats sur les deux figures d'autocorrélation et autocorrélation partielle, on peut dire que le modèle approprié est un ARIMA(4,1,2). On entrainant ce modèle pour la prévision de la température, on obtient alors la figure suivante :

V- Conclusion:

Nous avons vu durant cette étude que la pollution de l'air est un des problèmes majeurs que nous faisons face actuellement. Malheureusement la principale source de cette pollution vient de nos activités comme la combustion des fossils, les transports aériens et routiers qui produisent énormément de CO2 et d'autres polluants nocifs pour notre santé, l'élévage bovin qui poduit énormément du méthane (CH4) qui est un gaz à effet de serre contribuant de manière importante au rechauffement climatique.

VI- Bibliographie: