Projets informatiques M2 Parcours MSS

Introduction :

Contexte et analyse de l'existant

Airbnb est une plateforme américaine dite communautaire qui vise à proposer un service de logement de location qui en théorie se fait de particulier à particulier. Comme pour beaucoup de plateformes de ce type le phénomène Airbnb prend une ampleur considérable et ne cesse de s'étendre à travers le monde. En effet, selon une étude de l'agence immobilière STR, Airbnb compte, au début de l'année 2016, 2.3 millions de chambre à louer dans le monde, ce qui veut dire que l'entreprise détient plus de chambres que les chaînes d'hôtel américaine Marriot, Starwood et Hilton Worldwide réunis (environ 1.9 millions). Il faut toutefois mesurer ce chiffre par le fait que les logements proposés par Airbnb ne sont pas disponibles tout au long de l'année. On peut voir sur le graphique suivant le nombre d'hôtels recensés ainsi que le nombre de location Airbnb disponible pour les 10 villes les plus influantes sur la plateforme :

#Packages
require(animation)
require(sp)
require(RColorBrewer) 
require(classInt)     
require(rgdal)
library(stringr)
library(stringi)
library(FactoMineR)

#Transformer les chaines de caractères qui définissent les pris à l'aide d'une fonction : "$85.30" --> 85.30
transformPrices <- function(vec){
  splits <- stri_split_fixed(as.character(vec),"$")
  splits2 <- rep(NA,length(splits))
  for (s in 1:length(splits)) {
    var <- splits[[s]][2]
    if (!(is.na(var))){
      if (str_detect(var,',')){
        strspl <- str_split(var,',')
        var <- paste0(strspl[[1]][1],strspl[[1]][2])
      }
      splits2[s] <- var
    }
  }
  return(as.numeric(splits2))
}

data1 <- read.csv("Michel-Dumerc-Choisy/Other/data_cities.csv",header=T,sep=",")
data2 <- read.csv("Michel-Dumerc-Choisy/Other/dat_country.csv",header=T,sep=",")
px_vente <- read.csv("Michel-Dumerc-Choisy/Other/prixvente.csv",header=T,sep=",")
coords <- read.csv("Michel-Dumerc-Choisy/Other/coord.csv",sep=",",header=T)
topoData <- readOGR("Michel-Dumerc-Choisy/world.geo.json-master/countries.geo.json",verbose=F)

nloc <- data1[,4]
nhot <- data2[,4]
ord <- order(nloc)
nloc <- nloc[ord][31:40]
nhot <- nhot[ord][31:40]

par(mar=c(6,3,3,3)+0.3)
plot(1:10, nloc, pch=16, axes=FALSE, ylim=c(min(nloc)-5,max(nloc)+5), xlab="", ylab="", 
   type="b",col="black", main="Hotels et locations Airbnb des villes les plus influantes")
axis(2, ylim=c(min(nloc)-5,max(nloc)+5),col="black",las=1)  ## las=1 makes horizontal labels
mtext("",side=2,line=2.5)
box()

## Allow a second plot on the same graph
par(new=TRUE)

## Plot the second plot and put axis scale on right
plot(1:10, nhot, pch=15,  xlab="", ylab="", ylim=c(min(nhot)-5,max(nhot)+5), 
    axes=FALSE, type="b", col="red")
## a little farther out (line=4) to make room for labels
mtext("",side=4,col="red",line=4) 
axis(4, ylim=c(min(nhot)-5,max(nhot)+5), col="red",col.axis="red",las=1)

## Draw the time axis
axis(1,at=1:10,labels=as.character(data1[ord[31:40],2]),las=2)
mtext("",side=1,col="black",line=2.5)  

## Add Legend
legend("topleft",legend=c("Locations Airbnb","Hôtels"),
  text.col=c("black","red"),pch=c(16,15),col=c("black","red"))
mtext("Figure 1 : Nombre d'hôtels vs. nombre de locations Airbnb",side=1)


On voit clairement que Airbnb trouve particulièrement son succès dans les villes à caractère très touristiques. C'est ainsi que l'on retrouve Paris et Londres comme villes les plus actives alors même que la plateforme a été créée à San Francisco.

Comme beaucoup de géants du web service, Airbnb tient à ce que ses données restent privées et elle ne permet pas aux internautes d'accéder à leurs données en Opendata. Toutefois, Murray Cox, un photojournaliste australien, est parvenu à rendre certaines données de la plateforme en libre accès. Ainsi, par le biais de son site insideAirbnb, ce dernier permet l'accès à de larges tables de données concernant une quarantaine de villes dans le monde. Une telle alternative est appréciée par la communauté des data scientists et permet alors de mieux comprendre comment se comporte le phénomène Airbnb au sein même d'une ville mais également sur le plan international.

On dispose en grande partie de données sur des villes européennes, états-uniennes, canadiennenes et australiennes. On dispose pour chaque ville d'un recencement des différents logements proposés sur le site : prix, nombre de pièces, quartier, disponibilité, et bien d'autres données.

Notre étude a pour but de comprendre comment le phénomène se comporte sur chacune des villes en matière de répartition des locations, de prix et de type de location. Nous chercherons également à trouver des rapprochements statistiques entre les villes afin de déterminer si l'on peut expliquer le comportement des villes une à une par leur localisation géographique ou encore leurs données socio-économiques.

I. Première approche : Analyse du parc locatif Airbnb parisien

Dans cette introduction nous nous pencherons à titre d'exemple sur les locations au sein de la ville de Paris. Notons tout d'abord que Paris est la ville parmi les 40 retenues qui est la plus représentée en matière de logement Airbnb, ce qui rejoint le fait que Paris est une ville extrèmement touristique.

Sur le plan des logement disponibles, on remarque directement qu'il y'a un effet de la géolocalisation sur le prix comme on peut le voir sur la carte suivante.

#Lecture de la carte
topoData <- readOGR("Michel-Dumerc-Choisy/Paris/neighbourhoods.geojson",verbose=F)
neighboors <- topoData$neighbourhood
#Lecture des données
listings <- read.csv('Michel-Dumerc-Choisy/Paris/list_simplified.csv',header=T,sep=';')

ar_neigh <- c(17,7,19,9,10,13,15,12,1,6,8,3,20,5,16,14,11,2,18,4)
superficies <- c(5.67,4.09,6.79,2.18,2.89,7.15,8.48,6.37,1.83,2.15,3.88,1.17,5.98,2.54,7.91,5.64,3.67,0.99,6.01,1.6)
ar_roman <- c("XVIIe","VIIe","XIXe","IXe","Xe","XIIIe","XVe","XIIe","Ier","VIe","VIIIe","IIIe","XXe","Ve","XVIe","XIVe","XIe","IIe","XVIIIe","IVe")
#Calcul des et discrétisations des différents prix
par(mar=c(1,1,1,1)*2)
myPalette <- brewer.pal(8,"YlOrRd")
prices <- transformPrices(listings$price)
cuts <- as.factor(as.numeric(cut(prices,c(0,25,50,100,150,200,300,500,10000000))))
levels(cuts) <- c("[0,25]","]25,50]","]50,100]","]100,150]","]150,200]","]200,300]","]300,500]","+500")
plot(topoData)
points(listings$longitude,listings$latitude,cex=.9,col=myPalette[cuts],pch=19)
title('Prix  en $ de la nuit et géolocalisation \ndes logements dans la ville de Paris')
legend(x=2.43,y=48.9,legend=levels(cuts),col=myPalette,horiz=F,cex=.7,pch=19,pt.cex=1)
mtext("Figure 2 : Prix par logement Airbnb - Paris",side=1)


On trouve les quantités de logements Airbnb suivantes pour chacun des arrondissements.

ar_counts <- matrix(NA,3,length(neighboors))
types <- unique(listings$room_type)
for (i in 1:length(types)){
  for (j in 1:length(neighboors)){
    ar_counts[i,j] <- nrow(listings[intersect(which(listings$room_type==types[i]),which(listings$neighbourhood_cleansed==neighboors[j])),])
  }
}
ord_ar_roman <- ar_roman[order(apply(ar_counts,2,"sum"))]
ar_counts <- ar_counts[,order(apply(ar_counts,2,"sum"))]
bar <- barplot(ar_counts,names.arg=ord_ar_roman,cex.names=.5,main="Location Airbnb par arrondissements",col=c("red","blue","yellow"))
mtext("Figure 3 : Type de location par arrondissement",side=1)

Il semble que les locations Airbnb se concentrent pour la plupart dans les arrondissements les plus écartés du centre. De plus on remarque que la majeur partie des locations sont des appartements.

On voit que les logements en location de la ville de Paris semblent relativement bien répartis bien que la carte ne permette pas d'observer exactement la répartition de ces derniers sur le plan spatial. En revanche, on voit que les logements situés au centre de la ville sont significativement plus chère que ceux se situant sur la péréphérie. Connaîssant la ville, on peut supposer que ceci est directement en lien avec le prix de l'immobilier dans chacun des arrondissement. On peut vérifier cette idée sur les cartes suivantes :


Le lien entre le prix de l'immobilier et le prix Airbnb existe bel et bien. On remarque que les logements des arrondissements les plus aux centre sont significativement plus chère : du 1er au 8ème arrondissement. On peut toutefois remarquer que le 16ème arrondissement tout à l'ouest est particulièrement chère en location Airbnb par rapport à son prix immobilier. On peut expliquer ce phénomène par le fait que cet arrondissement est particulièrement sympathique pour des touristes vacanciers : Quai branly et tour eiffel au niveau de la frontière avec le 7ème arrondissement, bois de boulogne et bois de saint-cloud à proximité. Ainsi puisque les offres Airbnb s'adressent en général à des personnes en vacance on comprend en quoi ce quartier est particulièrement chère par rapport à son prix en temps normal.

Dans les données que nous nous sommes procurées, il est possible de voir combien de jour par an un logement est disponible. Il peut alors être intéressant de croiser cette information avec les prix de ces logements. La carte suivante permet d'observer les logements de la ville en fonction de leur disponibilité sur l'année. Il faut savoir qu'un logement est considéré comme disponible à une certaine date lorsque l'hôte de ce dernier spécifie sur le site qu'il est prêt à accueillir quelqu'un à cette date.


Le phénomèné que l'on remarque ici est très intéressant. On voit qu'un grand nombre de logements sont en faites disponibles plus de la moitié de l'année. On en conclut directement qu'à Paris, les logements mis en location par les hôtes ne sont que très peu souvent leur lieu de résidence primaire. On peut alors en conclure que ce type d'hôtes Airbnb se répartissent selon différents profils : pour beaucoup ce sont des personnes aisées possédant au moins deux lieux de résidences, d'autres sont des personnes ayant les moyens d'être logées ailleurs (amis, conjoint(e), famille...), mais on peut aussi très fortement supposer que des agences immobilières commencent à s'installer sur ce marché. Il faut noter que pour les personnes physiques locataires pratiquant ce type de sous location sont dans l'illégalité la plus totale si leur propriétaire n'en est pas tenu informé. Pour les personnes morales (agences), la location par Airbnb n'est alors qu'un prétexte pour augmenter le prix des loyers, à l'heure même où le marché de l'immobilier en France est chutte libre. Sur la ville de Paris, il semble donc que ce nouveau marché profite surtout à des personnes physiques ou morales déjà fortement aisées cherchant à contourner le problème de la chutte des prix de l'immobilier. On s'écarte alors de l'idée communautaire et collaborative que revendique la plateforme puisque celle-ci semble permettre en grande partie à enrichir les personnes en ayant le moins besoin.

Sur le site certains logements sont indiqués comme étant disponibles 0 jours dans l'année. On supposera qu'il s'agit des logements ayant été loué de manière très occasionnelle auparavant, pour lequel la personne y habitant ne compte pas remettre à disposition dans l'année à suivre.


Les résultats sont ici très marquants et on voit très bien que, des logements susceptibles d'être loués dans l'année à suivre, près de 60% d'entre eux sont disponibles plus de la moitié de l'annèe.

Au final, on trouve que 5% soit 2243 personnes détiennent 9027 logements Airbnb, soit 17.1% du parc locatif Airbnb parisien.

On peut parfaitement illustrer les chiffres précédents à l'aide du graphe ci-dessous :

Figure 1: Nombre de logements par jours de disponibilité

Figure 1: Nombre de logements par jours de disponibilité

Pour ce qui est des logements moins disponibles au cours de l'année on peut supposer que les hôtes sont les personnes résidant dans le lieux de location en question. On retrouve alors plus l'idée de plateforme communautaire dédiée à des personnes cherchant à amortir le coût du logement lors d'un départ sur une certaine période.

On peut voir sur la carte ci-dessous que la disponibilité semble se corréler avec le prix des logements sur les arrondissements.


Si l'on se réfère à la carte des prix par arrondissement (Figure 4) on voit que les arrondissements les plus chers, sont également les plus disponibles.

Un fait intéressant supplémentaire est que la proportion de logements libres pendant une longue période est tellement forte dans chacun des arrondissements que le temps de disponibilité moyen le plus petit pour un arrondissement s'élève à environ 160 jours par ans. Il y'a donc bel et bien un effet d'appropriation de ce marché par les personnes prioritaires de plusieurs logements et les agences de locations. Ceci amène alors deux problèmes majeurs : Les agences profitent de l'occasion pour augmenter le prix de location et les propriétaires ne payent bien sûr qu'une taxe d'habitation tandis que leurs locataires Airbnb au cours de l'année ne la payent pas, ce qui est un vrai problème pour l'état. Notons que l'alternative Airbnb permet également de ne pas payer le taxe de séjour, chose qui s'est avérée être un problème par exemple lors de l'organisation de l'Euro 2016 en France. A ce type de reproche, Airbnb a pour habitude de répondre que ce type de mesure est "trop compliquée à mettre en place". Venant de la part de personnes compétentes capables de mettre en place une telle plateforme de service dans le monde entier, on peut fortement supposer que le problème provient surtout du fait que ceci affecterait significativement leurs larges bénéfices.

On peut également se pencher sur comment se comportent les quartiers en matières de densité de logements disponible.


Les locations de Paris sont fortement concentrée dans les arrondissements les plus aux centres, c'est-à-dire dans les arrondissements les plus chers et les plus disponibles. On sait donc que ces logements sont de loin ceux qui génèrent le plus d'argent sur la plateforme mais ce sont également ceux qui sont les plus concentrés en matière de logements Airbnb proposés.

On a bel et bien un monopole des quartiers les plus au centre de la ville. Comme on a pu le remarquer, il semblerait que les quartiers les plus riches sont ceux qui proposent des offres les plus régulières et les plus chers, le tout sur un espace géographique moindre.

On peut ajouter l'information apportée des données socio-économique sur les arrondissements. Sur le graphe en bulle suivant on peut observer les différents arrondissements selonle prix airbnb en fonction du prix de location de l'immobilier, de la population (taille des bulles), et du revenu médian (couleur des bulles).

#Lecture ou implémentation directe des données
prix_immo <- read.csv("Michel-Dumerc-Choisy/Paris/prix_immo.csv",header=T,sep=";")
ar_rom_nntri <- prix_immo[,1]
prix_immo <- prix_immo[match(ar_roman,prix_immo$Arrond),]

population <- data.frame(Arrond=ar_rom_nntri,pop=c(17100,22390,35991,27769,60179,43224,57092,38749,59474,94474,155006,144925,182386,141102,238190,167613,170156,201374,186116,197311))
population <- population[match(ar_roman,population$Arrond),]


rev_med <- data.frame(Arrond=ar_rom_nntri,rev=c(3236,2845,2835,3130,3232,3873,4173,4331,3167,2651,2635,2927,2630,2863,3153,4062,3086,2300,2367,2415))
rev_med <- rev_med[match(ar_roman,rev_med$Arrond),]
myPalette <- brewer.pal(8,"Purples")
cuts <- as.factor(as.numeric(cut(unlist(rev_med['rev']),c(2000,2300,2600,2900,3200,3500,3800,4100,10000))))
levels(cuts) <- c("[2000,2300]","]2300,2600]","]2600,2900]","]2900,3200]","]3200,3500]","]3500,3800]","]3800,4100]",">=4100")

#Construction du data frame
data_bubble <- data.frame(cbind(prix_immo[,1],prix_immo[,2],population[,2],rev_med[,2],moyAv,(population[,2]/sum(population[,2]))*535))
names(data_bubble) <- c("Arrond","prix_immo","pop","rev_med","prix_airbnb","prop_pop")

#Graphe en bulles
#Immo + prix airbnb + population + revenu
par(mar=c(5,5,5,5),mfrow=c(1,1))
symbols(data_bubble$prix_airbnb,
        data_bubble$prix_immo/1.08,
        circles=data_bubble$pop,
        inches=.4,
        bg=myPalette[cuts],
        xlim=c(150,230),
        xlab="Prix moyen d'une location Airbnb (une nuit)",
        ylab="Prix de l'immobilier en dollar/m2",
        main="Prix de l'immobilier selon le prix Airbnb, revenu et population")

text(data_bubble$prix_airbnb,
     data_bubble$prix_immo/1.08,
     ar_roman)
legend("topleft",legend=levels(cuts),col=myPalette,horiz=F,cex=.5,pch=19,pt.cex=1)
mtext("Figure 11 : Graphique en bulles - Paris",side=1)


Ce graphique illustre parfaitement les conclusions que nous avions tirées précédemment. Tous les arrondissements du centre de Paris, c'est-à-dire du premier au huitième, sont peu peuplés, très riches et leurs prix Airbnb s'alignent sur leurs prix immobilier. Dans l'ensemble on pourrait presque discerner une tendance linéaire entre le prix immobilier et le prix Airbnb, excepté pour le 16ème arrondissement, qui, comme nous l'expliquions plus haut est un quartier attirant beaucoup plus les touristes, d'où son prix Airbnb plus élevé.

La conclusions que l'on peut faire sur Paris est très claire. Après quelques années pour bien s'implenter dans la ville. Airbnb est tombé en majorité dans les mains de personnes aisées possédant plusieurs logements ou d'agences immobilières qui possèdent des logements partout dans la ville. Evidemment les arrondissements les plus au bords de la ville sont eux plus abordables et sont ceux les moins disponibles dans l'année. Ainsis on peut supposer que c'est dans ces quartiers que l'on trouvera le plus souvent des "honnêtes", particulier à particulier.

Airbnb pose donc certains problèmes pour les usagers et risque à terme de modifier et dominer complètement le marché de la location immobilière. De plus Airbnb permet de générer de la richesse sur la location de biens fonciers considérés comme innocupés sans faire payer la taxe d'habitation associée. De la même manière l'état peut se trouver dérangé par ce phénomène lors d'évènements internationaux. Par exemple en France, plusieurs maires se sont pleind du non paiement de la taxe de séjour des utilisateurs de la plateforme lors de l'Euro 2016, et considèrent que Airbnb devrait revoir ces propositions de prix pour l'y inclure. Ces derniers n'ont pour autant pas obtenu gain de cause. A terme il est probable que l'état Français se retrouve confronté à un conflit économique ou sociale selon ses prises de positions vis-à-vis de Airbnb.

Suite à cet introduction, nous chercherons maintenant à comparer nos 40 villes disponibles sur le site insideAirbnb afin de voir s'il est possible de voir si l'on peut distinguer différents profils. Ceci nous permettra de déterminer si la plateforme a eu le même effet que sur la capitale Française dans divers endroits du monde.

II. Comparaisons et associations entre les différentes villes

Au total, on dispose de 17 villes étas-uniennes, 16 européennes, 4 canadiennes, 2 australiennes et Hong-kong. On peut supposer que ces larges écarts géographiques peuvent impacter les comportements des utilisateurs de la plateforme. Toutefois il faut garder en tête que les villes dont nous disposons sont des villes relativement développées et aisées.

On peut observer sur la carte suivante la répartition de ces villes accompagnées du nombre de location proposées sur le site et des prix de ces dernières.


On voit que les pays nord américains semblent globalement plus chère que les pays européens mais proposent en moyenne moins de location. Hong-Kong, Melbourne et Sydney proposent un nombre raisonnable de locations.

On voit que deux villes sont extrèmement chères par rapport aux autres : Copenhague et Hong-Kong. Nous verrons ces villes en détails afin de déterminer la provenance de ce phénomène. Aux États-unis, les villes se situant dans la sunbelt et plus particulièrement en Californie sont très chère, plus qu'à Paris, Berlin ou encore New-York.

On peut observer sur le graphe suivant la représentation en bulle par ville du prix Airbnb en fonction du prix d'achat de l'immobilier au m², du revenu (couleur des bulles), et de la population (taille des bulles).


Sans Copenhague et Hong Kong, qui semblent trop extrèmes par rapport au reste des villes, on obtient le graphique suivante.


Sur les villes restantes, on peut observer un lien linéaire entre le prix de la location Airbnb et le prix d'achat de l'immobilier. Toutefois les villes de Genève, Paris, New-York, Londres et Venise semblent suivre légèrement moins cette tendance et on voit que la location Airbnb dans ces villes est une bonne affaire en comparaison du prix de l'immobilier. On peut expliquer ceci par le fait qu'à part Genève, ces villes sont mondialement connues pour leur succès touristique.

Pour se donner une meilleure idée, nous allons récupérer différentes variables numériques sur ces villes et nous réaliserons une projection de ces villes sur les deux premières composantes principales obtenues par ACP. Pour avoir un maximum d'information, nous avons croisé les différentes données numériques Airbnb avec des données socio-économiques concernant les différentes villes.

Au final, nos variables d'intérêt sont les suivantes :

Vous pourrez trouver les sources de ses données à la fin du document.

Réalisons maintenant l'ACP sur ces variables numériques. Remarquons que par soucis de clarté, nous n'avons conservé pour la représentation que la première et la troisième composante principale de l'ACP. La seconde ne nous ayant pas convaincu sur les conclusions qu'elle nous permet de tirer. Puisque les poids portés par la seconde et la troisième composantes principales obtenus par la diagonalisation de la matrice de covariance de nos données sont quasi identiques (11% et 10.8%), il n'y a donc pas d'inquiétudes à avoir quand à la perte de qualité de représentation graphique dûe à notre choix.

La représentation des variables sur les deux premières composantes principales de l'ACP sont les suivantes :

df_fin <- read.csv("Michel-Dumerc-Choisy/Other/df_final.csv",header=T,sep=",")
for (j in 2:ncol(df_fin)) df_fin[,j] <- as.numeric(df_fin[,j]) 
prc <- prcomp(data.matrix(df_fin[,2:ncol(df_fin)]),scale=T)

plot(prc$rotation[,1],prc$rotation[,3],type="n")
lines(c(-100,100),c(0,0),lty=3)
lines(c(0,0),c(-100,100),lty=3)
text(prc$rotation[,1],prc$rotation[,3],label=colnames(df_fin)[2:ncol(df_fin)],col="red")
mtext("Figure 15 : ACP des villes : représentation des variables",side=1)


Et la représentation des individus est la suivante :

plot(prc$x[,1],prc$x[,3],type="n")
lines(c(-100,100),c(0,0),lty=3)
lines(c(0,0),c(-100,100),lty=3)
text(prc$x[,1],prc$x[,3],label=df_fin[,1],col="blue")
mtext("Figure 16 : ACP des villes : représentation des individus",side=1)


Le premier axe de l'ACP oppose la taille des logements proposés en matière de nombre de pièces avec la population de la ville et son prix immobilier.

En effet la ville tout à gauche de cet axe, Majorque, est une île connue pour être peu peuplée, mais fortement convoité par les touristes. Ainsi, on y trouve de très grandes maisons de vacances. A l'opposé, on trouve à la droite de cet axe des villes très urbanisées extrèmement peuplées pour lesquelles le type de logement les plus fréquents sont de petits logements avec un petit nombre de pièces de vie : New-York, Paris, Londres...

Pour le seconde axe de la représentation (qui est en réalité la troisième composante principale de l'ACP) on trouvera les villes pour lesquelles les locations Airbnb sont très chères en haut, et les moins chères en bas. Ainsi, on trouve également en bas des villes dont le taux de chômage est fortement élevé, ce qui semble s'opposer avec le prix de location Airbnb.

On voit bien que l'on peut distinguer différents profils de villes. Pour un maximum de finesse dans notre comparaison, nous avons arbitrairement décidé que nous classerons les villes dans ce plan de représentation selon cinq classes. Nous utiliserons ici la méthodes des plus proches voisins au sens du carré de la distance de Ward sur les première et troisième composantes principales de l'ACP.

On remarque que la disponibilité moyenne par ville semble peu se démarquer sur cette représentation graphique.

La classification obtenue est par cette méthode est la suivante :

K <- 5
ncp <- 2
cp <- 3
cah <- hclust(dist(prc$x[,c(1,cp)]),"ward.D2")
memb <- cutree(cah,k=K)
plot(prc$x[,c(1,cp)],type="n")
text(prc$x[,c(1,cp)],col=memb,labels=df_fin[,1])
mtext("Figure 17 : Classification des villes sur le plan",side=1)


On distingue alors les cinq classes suivantes :

III. Comparaison de l'activité Airbnb des différentes classes

III.1) Comparaisons directes entre les classes

La classification réalisée nous a permis de regrouper les villes selon 5 classes distinctes. La 1ère classe ne prend en compte que l'île de Majorque. On la sépare des autres villes notamment en raison de la superficie des logements (maisons) mis en location sur Airbnb, qui est, en moyenne, beaucoup plus élevée que dans les villes des autres classes. Cette différence se remarque aussi au niveau du nombre de places disponibles par logement, ce qui semble plutôt logique au vu de la superficie, ainsi que sur la disponibilité par logement.


Les deux derniers graphiques montrent, par la même occasion, que la classe 4 est celle qui se rapproche le plus de la 1ère. L'île de Majorque est en fait influencée par les mêmes variables que les villes de la classe 4 : Austin, Nashville, New Orleans, San Diego et Santa Cruz County, mais avec des valeurs beaucoup plus extrèmes sur les variables qui déterminent la première composante principale.

La 2nde classe regroupe les villes de Copenhague et Hong Kong. Ces deux villes sont caractérisées par leur prix Airbnb moyen très élevé. En effet, dans cette classe, le prix Airbnb moyen est plus de 3 fois supérieur à celui des autres classes. Même si il n'est pas le plus élevé, le prix de l'immobilier est aussi, en moyenne, très elevé dans cette classe.


On pourrait penser qu'il existe un lien positif entre le prix Airbnb et le prix de l'immobilier. Cependant, quand on regarde ces mêmes graphiques pour la 3ème classe, la relation entre le prix Airbnb et le prix de l'immobilier est totalement inversée. Cette 3ème classe regroupe les villes de Berlin, Londres, New York et Paris. La particularité de ces villes, en plus d'avoir un prix de l'immobilier élevé, réside dans le fait que le nombre de location Airbnb et le nombre d'hôtels sont très élevés comme on avait pu l'évoquer à la figure 12. Ceci peut aussi expliquer le faible prix des locations Airbnb. En effet, les hôtes, pour attirer un maximum de personne à louer leur logement, sont obligés de faire face à la concurrence. On peut considérer cette classe comme regroupant les villes les plus touristiques et les plus peuplées, et donc les villes ayant le plus de demandes que ce soit pour des locations Airbnb ou pour des chambres d'hôtel.
Pour finir, l'ensemble des graphiques précédents montrent que la 5ème classe se situe à chaque fois autour de la moyenne. On peut donc se satisfaire dans l'idée qu'elle regroupe les villes n'ayant aucune caractéristique particulière qui la ferait se démarquer des autres.

III.2) Aperçu de certaines villes

III.2) - a. Classe 1 : Majorque

Cette classe se distingue des autres du fait qu'elle est constituée d'une seule localité : Majorque. Majorque est la plus grande île des Baléares, située dans la mer Méditerranée, proche de la côte espagnole. C'est un lieu extrêmement touristique (la ville est réputée pour son eau azur et ses criques de rêve). 70% de son PIB provient du tourisme, ce qui explique le succès que Airbnb peut y avoir. Il faudra garder cela à l'esprit lorsque l'on regardera cette île plus en détails. Notons qu'en dehors de l'aspect touristique paradisiaque de Majorque, l'île qui n'a pas échappé à la crise en Espagne affiche parmis ces 800 000 habitants un taux de pauvreté de près de 18.5% et un taux de chômage de 10%.

Regardons le prix des logements Airbnb sur la carte.


On ne remarque pas forcément d'effet de géolocalisation sur le prix : à part les reliefs montagneux, on trouve de tous les prix un peu partout dans l'île.

En revanche, si on décide de ne regarder que les locations les plus chères (au-delà de 200$ la nuit par exemple), on obtient le graphique suivant :


Où l'on peut remarquer les lieux les plus desservis en logements "chers" sont les plus touristiques : la capitale Palma, tout le littoral partant du sud vers l'est où l'on trouve de nombreuses criques, et enfin le nord-est où l'on trouve là-encore de nombreuses plages et criques. En revanche, on aura remarqué que beaucoup de locations ne sont plus sur la carte : c'est-à-dire que Majorque n'est pas une ville où le logement est "cher".

Comme nous avions pû le voir sur l'ACP, Majorque se distingue des autres villes par la taille et le nombre de pièces de ces logements, ainsi, il est probable que les logements proposés soient destiné à des familles ou des groupes de personnes général.

On peut vérifier cette idée en regardant le prix par personnes des logements de l'île :


En réalité, Majorque semble idéal pour quelqu'un qui semble vouloir se loger sur Airbnb, rapporté au prix par personne calaculé à l'aide du nombre de places disponibles par logement l'île offre des prix plus que convenables, contrairement à comme on avait pû le voir à Paris précédemment. En effet on peut rappeller que l'effet Airbnb avait tendance à se concentrer sur le centre de la ville de Paris en matière de prix, de disponibilité et de densité de location. Pour Majorque nous sommes dans un cas de figure totalement différent de par le fait que c'est un île : la répartition du prix par personne est plus homogène bien que légèrement plus concentré sur les côtes.

Interessons-nous maintenant à la disponibilité des logements proposés par Airbnb sur l'île.


Cela saute immédiatement aux yeux : on n'aura pas de mal à trouver un endroit où se loger à Majorque, puisque la majorité des locations semble presque tout le temps disponible ! On peut en déduire que la majorité de ces logements ne sont pas vraiment habités par des gens autres que des touristes... Ce qui n'est guère surprenant. On peut imaginer que, étant donnée la nature presque paradisiaque de l'endroit, de nombreuses personnes aisées y ont investi dans une maison de vacances inhabitée la majorité du temps, et qui auront eu l'idée de rentabiliser leur effort financier. On peut aussi imaginer que des agences immobilières possèdent un bon nombre de locations sur le marché ; Majorque étant un lieu très visité et prisé par des jeunes pour des durées plutôt courtes, ceux-ci préfèrent passer par Airbnb que par des agences espagnoles sur des sites moyennement attractifs...

Pour l'instant, le prix des locations Airbnb semble comme on avait pû le voir s'ajuster au prix de l'immobilier en question. En revanche, le profil général des hôtes de la ville semble se dessiner encore plus que dans la capitale Française : Airbnb permet en grande partie à des personnes aisées de dégager de plus amples bénéfices et non de venir en aide aux personnes qui veulent se rembourser lors d'un départ de courte durée.

III.2) - b. Classe 2 : Copenhague et Hong Kong

Une autre classe est consituée de deux villes très particulières : Hong-Kong et Copenhague. Malgré les différences géographiques, climatiques, sociales et culturelles entre les deux villes, nous chercherons à montrer quelle tendance sur Airbnb s'extirpe le plus de cette classes.


Ce que l'on remarque en observant la carte des prix de Copenhague selon le lieu, c'est que certaines zones ne possèdent pas de logement, ce que l'on peut peut-être expliquer par les terrains accidentés du nord et du sud de la ville. Ensuite, ce qui choque peut-être davantage, c'est ce rouge foncé dominant signifiant que le prix de la nuit semble cher voire très cher à Copenhague ! Voyons ce que l'on obtient si l'on ne garde que des logements "chers", comme pour Majorque.


La plupart des logements sont toujours sur la carte (alors que le seuil minimum est de 200 dollars la nuit), et de nombreuses locations ne sont pas disponibles à moins de 500 dollars par nuit... Alors on se satisfait dans l'idée que l'on avait au sujet la différence entre la classe de Copenhague et les autres : ses prix exhorbitants.

Même si l'on visualise le prix des logements par personne, le constat sur le prix reste le même :


Comme on aurait pu le penser, Copenhague est une ville urbanisée, possédant un assez grand nombre de logements de petites tailles. Ainsi le prix par personne au sein de la ville reste extrèmement chère. Il est de plus remarquable que le prix des logements semble grandir à mesure que l'on se rapproche du centre, tout comme dans la ville de Paris. Copenhague se différencient donc d'une ville comme Paris de par son prix de logement Airbnb, tandis qu'elle se différencie de Majorque sur le plan du type de logement proposé et ainsi du prix de location par personnes

Interessons-nous maintenant à la disponibilité des logements proposés par Airbnb à Copenhague.


On voit ici que la disponibilité des logements est assez variable, on a de tout, des logements disponibles moins de 30 jours dans l'année comme des logements tout le temps disponible. On remarque toutefois que la proportion de logement disponible très fréquemment est élevée comme pour les villes étudiées précédemment. Toutefois l'effet ne semble pas aussi fort que sur l'île de Majorque

Voyons si l'on peut définir ces caractéristiques pour l'autre ville de la même classe, Hong Kong :


On voit d'abord que quasiment tout est concentré au centre, ce qui est assez logique car la carte est assez trompeuse, beaucoup des territoires ici sont dans l'eau (rappelons que Hong-Kong est un presque-île). Là aussi les locations semblent plutôt chères, vérifions-le en filtrant les logements selon leur prix élevé.


On reconnaît une carte plutôt identique à la carte précédente. La plupart des habitations peuvent donc être considérées comme "chères", comme pour Copenhague. Cela est assurément la caractéristique principale de cette classe.

Interessons-nous maintenant à la disponibilité des logements proposés par Airbnb à Hong Kong.


On a plutôt l'impression que la plupart des logements sont souvent disponible dans l'année... A mesure que nous avançons dans notre parcours de classe, il semble déjà clair que le point commun entre les classes est que beaucoup de logements sont très souvents disponibles, et donc que la plateforme est surtout profitable au plus riches, et ce à divers endroits dans le monde.

III.2) - c. Classe 3 : San Diego

Une classe est constituée uniquement de villes états-uniennes, on peut d'ores et déjà en conclure qu'il existe certaines caractéristiques typiques des Etats-Unis. On peut supposer est dû au fait que, bien que le pays soit hôte de la plateforme, il est un des plus régulateur vis-à-vis des débordements de certains utilisateurs de l'application.

A titre d'exemple sur la classe nous étudierons la ville de San Diego.


On remarque une grosse importance de la géographie sur le prix de la nuit à San Diego : en effet le prix moyen d'un logement sur la côte est beaucoup plus cher qu'ailleurs dans San Diego. Cela n'est pas étonnant, la ville possède de nombreuses plages et on peut assurément considérer que cela influe sur le prix de la location.

Considérons seulement les logements "chers" afin d'affiner cette vision.


Cela confirme ce que l'on pensait, la majorité des logements "très chers" sont situés sur la côte. Cependant on peut noter un autre agglutinement d'habitations, correspondant à la vieille ville et aux quartiers alentours, réputés très touristiques.

On peut donc raisonnablement penser que le prix des locations à San Diego est ajusté selon le lieu où elles se trouvent. De plus ces prix semblent relativement chers en moyenne.

Pour ce qui est de la disponibilité :


Cette classe ne semble pas non plus épargnée par l'appropriation de la plateforme par des personnes n'étant pas dans le besoin. Encore une fois on trouve des logements disponibles très longtemps dans tous les quartiers de la ville.

III.2) - d. Classe 4 : New-York

Une classe est constituée uniquement de quatre grandes villes : Paris, New-York, Berlin et Londres.

Voyons si New-York présente des caractéristiques semblables à celles de Paris que nous avions vu en introduction. Tout d'abord on sait déjà que cette classe contient surtout les villes les plus développées et touristiques, avec une population élevée, possédant de nombreux logements de petite taille. On peut également rappeler que ces villes sont les plus importantes sur le marché de la location Airbnb.

On note immédiatement un effet de géolocalisation sur le prix, qui semble correspondre au "standing" des quartiers : l'arrondissement le plus cher est bien sûr Manhattan, qui est l'arrondissement le plus riche et le plus touristique de New-York. En revanche les prix pratiqués dans les autres quartiers semblent davantage accessibles, et l'on ne s'étonnera pas que des arrondissements comme le Bronx, anciennement célèbre pour sa dangerosité, ou comme le Queens, comptant certains des quartiers les plus pauvres de New-York, comportent ainsi une majorité de logements aux prix "raisonnables".

Pas sûr qu'il soit bien nécessaire de refaire cette carte avec seulement les logements les plus "chers", la tendance ayant déjà été nette :

On voit également que de nombreux logements du nord de Brooklyn sont assez chers eux aussi. Cela n'est pas étonnant en soi, le quartier de Downtown Brooklyn étant un important quartier d'affaires, et le phénomène de gentrification ayant touché les quartiers nord de l'arrondissement ont entraîné une hausse des prix, valable également sur l'immobilier.

Interessons-nous maintenant à la disponibilité des logements proposés par Airbnb à New-York.


Comme pour toutes les villes étudiées, on voit encore une fois qu'il ne s'agit que très rarement d'hôtes ponctuels.

III.2) - e. Classe 5 : Amsterdam

La dernière classe est aussi la moins bien représentée sur les axes de l'ACP que nous avons projetés. Rappelons que nos axes de projections discrétisent surtout les villes selon leur prix de locations et le nombre de pièces composant les logements. Ainsi, les individus de cette classe sont ceux qui se situent le plus dans la moyenne sur ces indicateurs. On s'intéressera ici à la ville d'Amsterdam.


Il semble que la plupart des logements sont situés au centre de la ville, et qu'on dispose de peu de données ailleurs. Plus on est dans le centre, plus ces locations ont l'air chères. Confirmons-le en ne sélectionnant que les logements dont le prix est supérieur à 200$ la nuit.


Les logements les plus chers sont effectivement ceux qui sont situés le plus au centre de la ville. On peut aussi se demander si cela n'est pas juste dû à nos données, et que cette part de logements chers est proportionnelle au nombre de données afférentes aux quartiers d'Amsterdam.

Pour la disponibilité des logements :


Encore une fois il n'y pas de lien entre la géolocalisation au sein de la ville d'un logement et sa disponibilité. Il y'a encore une fois une forte proportion de logements Airbnb disponibles toute l'année.

IV.Conclusions

De cette étude, il ressort plusieurs conclusions intéressantes.

Tout d'abord le prix d'un logement Airbnb est entièrement déterminé par le type de la ville qui l'inclue : mégalopole, île, ville cotière... Mais également par certaines caractéristiques socio-économiques : revenus, prix de l'immobilier, taux de pauvreté. Le prix des logements Airbnb est en effet très variable et on retiendra que les pays américains sont en moyenne plus chers que les pays européens mais proposent cependant un nombre plus faible de locations.

Une autre information nous permet de différencier les villes de notre étude : le type en général des logements, ou plus exactement la capacité d'accueil des logements susdits. Encore une fois cette information est directement en lien avec le type de la ville et son profil socio-économique. On a en effet pu observer qu'une ville comme Majorque propose plutôt des logements à grande capacité tandis que Paris propose en grande partie des appartements ne pouvant accueillir que peu de personnes. On peut par ailleurs souligner qu'au sein d'une ville cette variable s'oppose au nombre de locations Airbnb proposées bien que ce soient deux variables a priori corrélées positivement avec l'activité touristique. On explique simplement ce phénomène par le fait que les villes proposant plutôt des appartements de petite taille sont des mégalopoles très peuplées et donc au large parc immobilier.

Enfin, l'élément le plus remarquable dégagé par notre étude est le comportement unanime des hôtes sur l'application à travers le monde. Quelque soit la ville considérée on voit que les appartements proposés sont disponibles pendant une très grande partie de l'année, en moyenne plus de la moitié. Il es alors évident qu'il ne s'agit dans ces cas là pas d'hôtes louantleur lieu de résidence primaire.

Comme on peut le voir ci-dessous, bien que l'on ait distingué différents types de villes au travers de cinq classes, on voit que le nombre d'appartement par jour de disponibilité dans ces classes est identique quelque soit la classe. On peut donc dire que ce phénomène affecte toute les villes recencées sur la plateforme.


La conclusion est claire : Une proportion inconsidérable d'appartements sont disponibles toute l'année quelque soit la ville dans laquelle la location Airbnb a lieu. On peut également remarquer quelques piques autre que celui des 365 jours au mêmes endroits sur les graphiques : 3 mois, 6 mois, 9 mois et 11 mois. On peut tout de même noter que la classe 1 uniquement composée de Majorque est la seule à ne pas posséder ces petits pic et quasiment personnes n'y loue un logement sur la plateforme pour de courtes durées.

Au final, après seulement quelques années d'activité, la plateforme s'est vu appropriée par des fortunes y voyant un intérêt de dégager des bénéfices encore plus importants. Il s'agit soit de propriétaires qui louent un ou plusieurs logement tout au long de l'années soit d'agences immobilières qui profite de la location à courte durée pour dégager un bénéfice plus large dans le temps. En dehors de l'idée "gagnant-gagnant" entre les hôtes et les détenteurs de la plateforme, il y'a un tout un problème d'inflation du marché de la location et de contournement des impôt à payer aux états. Pour le moments les états ne semblent que trop peu réagir à ce phénomène, ou à défaut de le faire, se retrouvent impuissants face à la notoriété de Airbnb accumulée en peu de temps.

Avec une méthode attirant les personnes et les entreprises aux patrimoines plus élevés, ceci risque a terme de faire peser la balance en faveur de Airbnb qui pourrait bientôt devenir le leader mondial de la location de logements.

Si les législations vis-à-vis des taxes ne changent pas, ceci risque finalement d'amener des "perdants" dans la partie : ceux qui ne profitent déjà pas ou peu de la plateforme et tout le contribuable en général.

V. Application Shiny

Au vu du grand nombre de villes et de caractéristiques exploitables, nous proposons en supplément de ce document une application permettant d'observer diverses informations que nous avons pu récupérer au cours de la rédaction de ce projet.

Cet application offre 3 possiblités :

Vous pourrez accéder à cette application depuis le lien suivant : https://optimaentendre.shinyapps.io/appli/

VI. Sources

VI. 1) Données

Toutes les données conçernant Airbnb ont été récupérée sur le site http://insideairbnb.com/.

Pour le reste des données le tableau suivant récapitulent les sources et les dates auxquelles les données ont été mesurées.

Variable Source URL.Source Annee.source Mesure
Population Wikipedia 2014 Cardinal
Rervenu median Salary explorer 2015 $ par an
Nombre d'hotels (approximatif) Trip Advisor 2017 Cardinal
Coordonnees Date and time 2017 Lontitude et latitude
Taux de pauvrete Divers - Sites dans la langue de la ville pour la plupart 2014,2015,2016 Taux
Pris d'achat de l'immobilier Numbeo 2015 $ par metre carre
Superficie Wikipedia 2017 Kilometres carres
Age Divers - Sites dans la langue de la ville pour la plupart 2014,2015,2016 Annees
Taux de chomage Divers - Sites dans la langue de la ville pour la plupart 2014,2015,2016 Taux

VI. 2) Articles informatifs

https://www.theguardian.com/cities/2016/oct/06/the-airbnb-effect-amsterdam-fairbnb-property-prices-communities https://yieldandtravel.com/2016/10/17/donnees-impact-airbnb-hotel/ http://www.lesechos.fr/30/06/2016/lesechos.fr/0211082718653_airbnb---20-000-logements-seraient-dans-l-illegalite-a-paris.htm http://www.lesechos.fr/27/04/2016/lesechos.fr/021881666512_les-10-villes-hotes-de-l-euro-2016-exigent-d-airbnb-le-paiement-des-taxes-de-sejour.htm http://ashvegas.com/asheville-tourists-and-their-economic-impact-by-the-numbers