## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
## Loading required package: gsubfn
## Loading required package: proto
## Loading required package: RSQLite
## Registered S3 method overwritten by 'xts':
##   method     from
##   as.zoo.xts zoo

Nous allons étudier des données obtenues à partir du site gouvernemental australien. Ces données sont enregistrées dans 739 stations météorologiques australiennes dont nous possédons les coordonnées géographiques.

Les stations enregistrent quotidiennement la quantité de pluie tombée dans la journée en millimètres et la température maximale du jour en degré Celcius. Les enregistrements les plus anciens datent de 1839 et les plus récents 23 janvier 2020. Néanmoins, toutes les stations n’ont pas de données sur de si grandes périodes, cette base contient de nombreux NA.

Notre objectif est de voir si l’on constate une évolution du climat australien depuis le début du XXe siècle. Pour cela, nous allons étudier dans un premier temps les courbes d’évolution des données de température et de précipitation. Puis nous allons étudier des clusters des stations en fonction de leur climat. Enfin, nous allons faire de l’interpolation spatiale de nos données pour avoir une vision plus globale des données par rapport à la vision par station.

Explorer les données

Avant de commencer, il nous faut faire une brève exploration des données à notre disposition. Pour cela nous allons prendre l’exemple de la station 70328 se situant en Nouvelle-Galles du Sud. Cette station se nomme Bombala. Elle se situe à 200km au sud de Canberra, la capitale du pays. Nous représentons les températures maximales mensuelles relevées sur la période 1990-2020 et les précipitations maximales relevées sur la période 1994-2020.

Le boxplot montre qu’il existe une saisonalité. Le mois le plus froid est juillet avec des temperatures maximales quotidiennes qui varient pour la majorité entre 10°C et 15°C. Le mois le plus chaud est janvier avec des temperatures maximales quotidiennes qui fluctuent entre 22°C à 30°C pour la majorité.

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.30   13.07   18.10   18.38   22.94   40.30

La température minimale enregistrée dans cette station a été 2.3°C pendant une journée de juin et la température maximale a été 40.3°C pendant une journée de décembre.

On passe maintenant à l’analyse des précipitations pour cette station et en particulier pendant l’année 2019 (prendre toutes les années d’un coup rend les graphiques illisibles).

Pour la plupart des mois, les précipitations ont été inférieures à la moyenne de 1.167 mm. Les mois d’avril, mai, octobre, novembre et décembre étant particulièrement secs, mais quelques jours très humides ont rendu les mois de janvier, février, mars, juin et septembre ont été plus humides que d’habitude en Nouvelle-Galles du Sud.

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   0.000   0.000   1.167   0.200  32.200

On voit comme on s’y attendait que la plupart des jours, il n’a pas plu. De plus, il a plus le plus en février.

Visualiser un réchauffement ou un assèchement de l’Australie

Maintenant, nous allons étudier les températures pour toutes les stations depuis le début des enregistrements.

Temperature maximales

reg_t <-lm(temp_moy~date, data=temp_moy_tot)
reg_t
## 
## Call:
## lm(formula = temp_moy ~ date, data = temp_moy_tot)
## 
## Coefficients:
## (Intercept)         date  
##   2.383e+01    8.438e-05
summary(reg_t)
## 
## Call:
## lm(formula = temp_moy ~ date, data = temp_moy_tot)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -8.0156 -3.4368  0.2798  3.5207  8.2344 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 2.383e+01  1.057e-01  225.43   <2e-16 ***
## date        8.438e-05  5.204e-06   16.21   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.886 on 1931 degrees of freedom
## Multiple R-squared:  0.1198, Adjusted R-squared:  0.1194 
## F-statistic: 262.9 on 1 and 1931 DF,  p-value: < 2.2e-16

On rejette l’hypothèse nulle au seuil de 5%, le test significatif. On a bien un réchauffement climatique.

Précipitations

Les coefficients sont de 2 pour l’intercept et 0,00000367 pour la variable date. La p-value vaut 0,00004199. On rejette l’hypothèse nulle au seuil de 5%, le test est significatif.

Déterminer des climats

Afin d’étudier les différents climats d’Australie, nous avons décidé de réaliser une ACP pour regrouper les stations. Nous avons donc créé une matrice prenant :

  • En lignes les stations
  • Pour les douze premières colonnes, les moyennes des températures quotidiennes pour toutes années confondues pour chaque mois
  • Pour les douze colonnes suivantes, la même chose avec les précipitations

Nous réalisons ensuite un clustering avec la méthode des k-means en n’utilisant que les deux premières composantes de l’ACP. Nous avons choisi d’effectuer le clustering en cinq classes. Nous avons choisi ce nombre de climats car en prendre plus conduisait à des découpages non logiques des climats.

Nous représentons ce clustering sur le premier plan principal de l’ACP.

On décide que chacun des groupes de stations obtenu constitue un climat.

Nous représentons ensuite pour chaque climat les moyennes pour toutes les stations de ce climat des températures et précipitations moyennes mensuelles. Cela permet de caractériser chaque climat et de correspond ce qui les différencie les uns des autres.

Le premier climat correspond à des températures élevées toute l’année avec de très faibles variations entre l’hiver et l’été et de fortes pluies en été.

Le deuxième climat correpond à des températures en moyennes autour de 20°C avec d’importantes variations saisonnières et peu de pluie toute l’année (un peu plus en hiver).

Le troisième climat est très similaire au climat 2 avec une moyenne des températures supérieure (autour de 25°C).

Le quatrième climat est encore une fois similaire mais les températures sont en moyenne autour de 15°C et il pleut globalement plus toute l’année.

Enfin, le cinquième climat correspond à des températures en moyenne autour de 30°C avec de fortes variations de températures et un peu de pluie en été contre aucune pluie en hiver.

Il ne nous reste plus qu’à représenter les stations sur une carte afin de voir si ces répartitions de climats ont un sens géographique.

Ces découpages semblent cohérents avec la géographie de l’Australie.

Maintenant, nous allons réaliser le même travail mais au lieu d’étudier les moyennes mensuelles pour toutes les années, nous allons regarder pour la période 200-2004 puis la période 2015-2019 pour voir s’il y a eu une évolution visible des répartitions des climats.

Comparaison des climats entre 2000-2004 et 2015-2019

2000-2004

2015-2019

Comparaison

On pourrait penser dans une premier temps que l’on a une évolution du climat entre ces deux périodes. En effet, on voit qu’il y a plus de stations dans le climat rouge au nord, plus de stations dans le climat jaune à l’ouest et plus de stations dans le climat marron à l’est pour la période récente.

Il y a également des changements sur les profils des climats avec par exemple moins de pluie pour les climats marron et rouge.

Pourtant, il paraît difficile pour nous de pouvoir réellement déterminer s’il y a eu une évolution des climats et des zones qui les concernent entre les deux périodes. En effet, chaque année a plus d’importance lorsque l’on étudie cinq années que lorsque l’on étudie plus d’une centaines d’années. Il se peut que parmi les années sélectionnées dans cette petite comparaison, certaines ait eu par exemple un été exceptionnellement aride ou froid. Ces années influencent la détermination des climats sans pourtant représenter une évolution.

De plus, le nombre de stations météorologiques a augmenté entre 2000 et 2019 et cela a une influence sur le résultat du clustering. C’est pour cette raison que nous n’avons également pas essayé de comparer les climats pour des années encore plus anciennes : les cartes n’ont alors plus du tout la même allure et on ne peut donc pas les comparer.

Interpoler les données dans l’espace

Ensuite, nous avons réalisé un krigeage.

Un krigeage est une technique d’interpolation permettant d’estimer des valeurs inconnues à des endroits précis sachant des valeurs disponibles à d’autres endroits. En résumé, grâce aux valeurs connues de nos 739 stations, on va être en mesure de connaître les valeurs pour tout le territoire australien.

Nous avons effectué un krigeage spatial en fixant une date. Dans les exemples qui vont suivre, nous avons pris la date du 31 octobre 2019 pour les températures et du 17 janvier 2020 pour les précipitations.

Températures

## Warning in fit.variogram(vario, model = mod): No convergence after 200
## iterations: try different initial values?
## [using ordinary kriging]

Nous avons commencé par effectuer un krigeage sur les températures. Comme on peut le voir sur la carte ci-dessous où on ne représente que les données enregistrées, la région la “plus froide” ce jour-là était le sud-ouest de l’australie occidentale avec un peu moins de 20°C. En revanche, dans le reste du pays, il faisait relativement chaud.

Maintenant, on peut réaliser le krigeage. On voit que cette nouvelle carte interpolée est cohérente par rapport à la carte d’origine.

Elle permet déjà de constater que les températures étaient anormalement élevées pour la saison dans certaines villes. Par exemple, à Adelaïde en Australie méridionale, il faisait plus de 37°C, soit plus de 16°C au-dessus de la normale maximale pour octobre. On observe des résultats similaires à Canberra avec une température de 11°C supérieure à la normale ainsi que dans d’autres villes australiennes.

Précipitations

Ensuite, on a effectué la même chose pour les données de précipitations.

## Warning in fit.variogram(varioR, model = mod): singular model in variogram fit
#Krigeage
rain.kriged <- krige(Rainfall.amount..millimetres. ~ 1, rain_date, aus_grille, model=varioFitR)
## [using ordinary kriging]

Il a plu principalement dans le Queensland et dans le Territoire du Nord. Cette zone de pluie est bien représentée par le krigeage. En revanche, les valeurs les plus extrêmes ne sont pas très visibles.

Nous avons également essayé de faire du krigeage au cours du temps afin de voir une éventuelle évolution. Pour cela, nous avons réalisé une vidéo de l’évolution des températures moyennes annuelles en Australie de 1939 à 2019. Nous nous sommes arrêtées à 1939 car le nombre de stations dont nous possédions les données avant cette date était assez restreint. Cela aurait faussé le krigeage. Cette vidéo sera sur Dropbox car nous n’avons pas réussi à l’insérer dans le Markdown.

Cependant, en regardant la vidéo, il est difficile de constater une évolution des températures aussi importante que par les autres méthodes, surtout dans certaines régions comme la Nouvelle-Galles du Sud où l’on a l’impression qu’il n’a pas fait aussi chaud que ça en 2019 alors que cette région a été durement touchée.

Nous avons tenté de faire la même chose pour le cumul de précipitations annuelles. Néanmoins, il était impossible de savoir à l’avance le cumul maximal enregistré afin d’avoir la même légende pour toutes les cartes. Nous avons également rencontré des difficultés à faire le variogramme et à choisir un bon modèle car il fallait le changer pour chaque année. De plus, les valeurs prédites par le krigeage n’étaient pas forcément du même ordre de grandeur que les valeurs réelles enregistrées dans les stations. Par exemple, en 2019, le plus grand cumul de pluie était d’environ 1500mm tandis que pour le krigeage, on avait une valeur de 4600mm.

Conclusion

Finalement, toutes ces données nous permettent bien de voir une évolution dans le climat australien. Néanmoins, cette évolution est principalement visible à l’aide la régression linéaire sur les températures. En effet, l’étude des climats ne permet pas de montrer une évolution réelle et le krigeage, même s’il montre une évolution ne permet pas vraiment de dégager une tendance à l’oeil nu.

De plus, nous avions choisi à l’origine ces données dans l’optique de les croiser avec des données sur les récents feux de forêts en Australie afin de voir si nous pouvions ou non voir un lien entre les feux et les variations de climat. Malheureusement, nous n’avons pas trouvé de données exploitables dans le cadre de notre projet. Peut-être que ces données seront mises à disposition dans le futur.