Le chocolat rend-il intelligent ? Ou l’importance de la distinction entre “corrélation” et “causalité”

Posté par

En 2012, un article du médecin Franz H. Messerli paraissait dans le New England Journal of Medecine et s’intéressait aux effets du chocolat sur les fonctions cognitives. Pour cela il calcula la corrélation entre la consommation de chocolat et le nombre de lauréats du prix Nobel dans 23 pays. L’auteur considérait cette dernière mesure comme ce qui pouvait le plus se rapprocher d’une estimation du niveau globale de l’intelligence d’un pays. 

Les résultats montrèrent une haute corrélation entre ces deux variables (comme le montre le graphique d’origine où la Suisse compte le plus haut niveau de consommation et le plus grand nombre de prix Nobel, à l’inverse de la Chine). Autrement dit, au plus la consommation de chocolat est importante dans un pays, au plus il y a de prix Nobel dans ce même pays.

L’auteur conclut son article en disant que les flavanols, molécules présentes dans les fèves de cacao et connues pour ses effets antioxydants auraient un rôle préventif contre les maladies neurodégénératives. Il encourage donc la consommation de chocolat afin d’améliorer les capacités cognitives.

Difficile de pleinement savoir si Messerli était sérieux ou si son but était avant tout de s’amuser avec cette corrélation… Bien qu’il disait être conscient que ses analyses ne sont que des corrélations, sa conclusion finale n’en tient toutefois pas compte. Cette étude fut reprise par des médias généralistes à grands renforts de titres accrocheurs, mais aussi par des articles scientifiques qui ont considéré sa conclusion comme scientifiquement sérieuse et valide.

Mon but ici n’est pas de débattre sur la question des effets éventuels du chocolat (même si j’ai opté pour un titre en partie racoleur) mais plutôt de parler d’une erreur d’interprétation statistique très fréquente et qui peut aboutir à des conclusions erronées : confondre “corrélation” et “causalité”.

Corrélation et causalité, quelle différence ?

Une corrélation est une analyse statistique qui permet d’exprimer l’existence d’une relation entre deux variables. Si l’une augmente, l’autre peut également augmenter (on parlera de corrélation positive) ou diminuer (on parlera alors de corrélation négative). En aucun cas une corrélation n’indique qu’une variable influence directement l’autre (!), mais bien qu’elles semblent toutes les deux varier en même temps. Pour l’exemple, il n’est pas difficile d’imaginer qu’en été les coups de soleil et le nombre de glaces consommées augmentent. Mais nous savons que ce n’est pas l’un qui impacte l’autre, ni inversement.

À l’inverse, il existe des analyses statistiques qui permettent de conclure à la causalité d’une variable sur un autre. Autrement dit, avec ce genre d’analyse, on est en droit de conclure qu’il y a bien une influence directe. En reprenant notre exemple, il est plus probable que le soleil et la chaleur qu’il produit sont responsables des coups de soleil et de la hausse de consommation de glaces.

IKEA > Chocolat > Vin > Thé

Pierre Maurage, Alexandre Heeren et Mauro Pesenti, tous les trois chercheurs à l’Université catholique de Louvain, publièrent en 2013 un article en réaction à celui de Messerli pour souligner différents points problématiques.

Premièrement, Messerli a comparé les prix Nobel des cents dernières années à la consommation de chocolat sur les deux dernières années (au moment de l’étude, aux débuts des années 2010 donc). Le chocolat a longtemps été un produit de luxe avant de se répandre de façon plus importante dans les pays occidentalisés au cours des cinquante dernières années. La comparaison est donc, au niveau temporel, inadéquate.

Deuxièmement, Maurage et al. ont réalisé d’autres analyses de corrélation avec des produits contenant des flavanols comme le thé (A) ou le vin (B). Aucun résultat n’est apparu significatif. Il est donc peu probable que l’hypothèse de l’effet des flavanols sur l’intelligence soit la bonne à retenir.

Ils ont cependant trouvé une corrélation statistiquement plus forte que celle de Messerli entre le nombre de Prix Nobel et… de magasins IKEA par pays (C).

Enfin, ils ont cherché ce qui pourrait expliquer de façon plus plausible cette relation entre chocolat et Prix Nobel. Ils se sont donc intéressés au Produit Intérieur Brut (PIB) de chaque pays comme indicateur de la qualité de vie (ce qui comprend la consommation de produits luxueux, comme le chocolat, et le niveau que la recherche scientifique atteint dans ce pays). Comme attendu, les résultats montrèrent que :
– la corrélation entre PIB et Prix Nobel est très forte (D) ;
– la corrélation entre PIB et chocolat est également très forte (E) ;
– la corrélation entre Prix Nobel et Chocolat ne l’est plus du tout si les analyses prennent en compte le PIB.

Autrement dit, considérer la qualité de vie comme troisième variable pouvant expliquer pourquoi une haute consommation de chocolat était reliée à un nombre élevé de prix Nobel dans un pays a permis de se rapprocher un peu plus près de la réalité (le PIB faisant ici office de soleil comme dans l’exemple présenté plus haut).

Que retenir ?

Si vous lisez ou entendez parler de corrélation dans une étude, gardez à l’esprit qu’il ne s’agit que d’un degré de relation entre deux variables, rien de plus. Elle peut servir de base pour émettre des hypothèses qui permettront d’aller plus loin dans les études et analyses. Il faut donc rester prudent lors de l’interprétation des résultats.

Il est possible qu’une troisième variable non-considérée (comme le soleil ou le PIB) permette de mieux expliquer un fait observé. Prenons un autre exemple : au plus un enfant ou un ado sera exposé aux écrans, au plus il sera isolé et présentera des troubles du comportement. Peut-être s’agit-il de familles en difficultés, où les interactions sociales sont pauvres ou conflictuelles, sans grande stimulation, où l’écran sera vu comme refuge et unique occupation, mais sera très rarement à l’origine des troubles.

Pire encore, et totalement probable, il se peut qu’une corrélation statistiquement significative soit le fruit d’un total hasard. Si vous voulez des exemples, je vous invite à visiter le site de Tyler Vigen où plusieurs corrélations sont rapportées sur base de données réelles, mais où il est clair qu’aucun lien direct n’existe entre ces variables :
– au plus des personnes décèdent dans une piscine, au plus Nicolas Cage apparait dans un film ;
– au plus on consomme de mozzarella, au plus des ingénieurs reçoivent leur diplôme de doctorat ;
– au plus on se marie dans l’état du Kentucky, au plus des personnes meurent en tombant de bateaux de pêche.

Preuves que sans bonne interprétation, et comme le dit le vieil adage : “les chiffres, on leur ferait dire n’importe quoi”.

Articles cités

Messerli, F. H. (2012). Chocolate Consumption, Cognitive Function, and Nobel Laureates. New England Journal of Medicine, 367(16), 1562‑1564. https://doi.org/10.1056/NEJMon1211064
 
Maurage, P., Heeren, A., & Pesenti, M. (2013). Does Chocolate Consumption Really Boost Nobel Award Chances? The Peril of Over-Interpreting Correlations in Health Studies. The Journal of Nutrition, 143(6), 931‑933. https://doi.org/10.3945/jn.113.174813

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.