22 Fév 2021

Mythe #5 : Corrélation = causalité

Dans toutes sortes de situations, il nous arrive d’identifier des liens entre différents éléments qui semblent associés entre eux. Conséquemment, nous avons souvent tendance à penser que l’un doit nécessairement causer l’autre. Ce phénomène est bien connu mais néanmoins, il est facile de tomber dans ce piège. La confusion entre la corrélation et la causalité est connue sous le nom de l’effet cigogne, en référence au fait qu’il y a une corrélation entre le nombre de nids de cigognes et les naissances. En fait, ces 2 éléments partagent une même cause, soit la plus grande proportion en milieu rural.

 

La corrélation

La corrélation est une méthode statistique permettant de définir à quel point 2 éléments varient de la même façon, et ce :

  • dans le même sens (corrélation positive)
  • dans le sens opposé (corrélation négative)

 

La causalité

Lorsqu’on a trouvé une association statistique, plusieurs interprétations sont possibles :

  • X entraîne Y
  • Y entraîne X
  • X entraîne Y, qui à son tour agit sur X
  • X et Y sont déterminés par Z, mais n’ont pas de relation directe entre eux
  • etc.

 

Bien que 2 variables puissent être parfaitement corrélées entre elles dans une situation donnée, cela ne confirme en rien si un lien de cause à effet est présent. Il est donc très important de faire attention aux conclusions tirées de ce type de relation et en particulier aux décisions ou aux prédictions faites à partir de celles-ci. Une analyse plus approfondie du contexte ainsi que l’utilisation de méthodes statistiques peuvent permettre de tirer des conclusions plus réalistes.

 

 

Poursuivez votre lecture…

Mythe #6 : Les données fournissent une représentation fidèle de la réalité

 

Charles Michaud

Consultant en intelligence d’affaires