Chronique n° 149 parue initialement dans France Catholique-Ecclésia − N° 1391 − 10 août 1973

SHERLOCK HOLMES EN ÉCHEC

Corrélation n’est pas causalité

lundi 29 octobre 2012

Quand on dit que ceci est cause de cela, on croit parler clairement [1]. Cependant, dès que l’on essaie de préciser ce qui est une cause et ce qui ne l’est pas, les difficultés commencent. Voici un exemple donné par le psychologue anglais S. G. M. Lee : les statistiques montrent que les bébés sevrés tôt se révèlent, devenus grands, très « acquisitive », « âpres au gain ». Faut-il en conclure que le sevrage précoce est la cause, ou au moins une cause possible, de la cupidité ?

Supposons que l’on trouve une corrélation étroite et indiscutable entre la cupidité de l’adulte et la précocité de son sevrage, autrement dit que plus le sevrage fut précoce et plus le bébé devenu adulte se montre réellement cupide : on ne pourra manquer d’être troublé. Il faudra bien de la rigueur pour s’abstenir de conclure qu’en effet le sevrage précoce produit bel et bien ce résultat lointain et inattendu.

Et pourtant, nous n’avons ici qu’une corrélation : nous sommes en présence de deux phénomènes qui varient ensemble, dont les variations sont concomitantes. Cela veut-il dire que celui qui se produit le premier est la cause de l’autre ?

Un coup de soleil

Si l’on répond oui, on va se trouver en face de « causalités » bien étranges. Par exemple, il existe une corrélation entre les désordres sociaux (ou même simplement les chahuts dans les lycées), les pannes de téléphone, le nombre des admissions dans les hôpitaux psychiatriques et le nombre des crises cardiaques. Ce sont les pannes de téléphone qui se produisent les premières, le reste suit avec la plus belle régularité. Comment les pannes de téléphone peuvent-elles provoquer des chahuts dans les lycées ?

Cette question est un piège, car si l’on se met à chercher de possibles relations de cause à effet, on ne manque jamais d’en trouver ou plutôt d’en imaginer. En ce qui concerne l’effet possible des pannes de téléphone sur les chahuts et les cas de folie déclarée par exemple, nul doute que Sherlock Holmes (ou quelque lecteur ingénieux) serait capable d’en proposer quatre ou cinq parfaitement vraisemblables, dès l’instant qu’on y a pensé.

La plupart des savants, cependant, admettent plus simplement que tous ces phénomènes hétéroclites et concomitants sont eux-mêmes les effets d’une autre cause, à savoir l’activité solaire : quand celle-ci augmente, l’ionisation de la haute atmosphère fait de même, ce qui entraîne en cascade une série de conséquences aboutissant au système nerveux des êtres vivants, y compris celui des lycéens et des cardiaques (on sait que le système nerveux est un réseau où circulent des ions, c’est-à-dire l’électricité).

Parfois la corrélation semble complètement incompréhensible. Dans son traité de statistique (a), G. W. Snedecor en cite une où Sherlock Holmes lui-même, je crois, perdrait son latin : c’est la corrélation exactement inverse qui existe entre la natalité en Grande-Bretagne et la production d’acier brut aux États-Unis de 1875 à 1920 (elle est égale à ‒0,98). Quelle peut être la cause commune de l’accroissement de la seconde et de la diminution de la première ?

La réponse est pourtant simple : ces deux quantités varient avec le temps, la natalité baissant et la production croissant. Snedecor aurait même pu proposer des corrélations encore plus bizarres et tout aussi rigoureuses, par exemple entre la consommation des chocolats glacés et le nombre des demandes en divorce (qui varient avec les saisons) [2].

Le bon sens (qui en science se trompe presque toujours) croit volontiers que l’on peut facilement, au prix d’un peu de réflexion, décider si un fait est ou non la cause d’un autre. Mais en réalité les savants ont de plus en plus rarement l’occasion d’employer le mot « cause » [3].

Quand un résultat est publié, il se borne le plus souvent à mettre des corrélations en évidence. Si l’on va au-delà du contenu, on se rend compte, à la lecture des publications scientifiques, qu’elles se ressemblent de plus en plus, je veux dire qu’une publication de physique expérimentale, par exemple, diffère de moins en moins d’une publication de biologie ou de n’importe quelle autre science expérimentale.

L’utilisation du langage commun de l’ordinateur tend encore à laminer les différences. Dans la philosophie des sciences telle qu’on l’enseignait il y a trente ans, la physique était la science par excellence, le modèle que les autres sciences se devaient d’imiter pour mériter leur respectabilité. L’idéal du savant reste toujours de définir les causes de ce qu’il étudie. Mais c’est un idéal [4] que l’on n’a plus guère l’occasion d’atteindre.

Cela ne traduit pas un échec de la science : cela montre au contraire qu’elle ne cesse de tendre vers la complexité des choses. En y tendant, elle réussit à rapprocher des problèmes qui naguère paraissaient sans rapports entre eux, à établir leurs corrélations. En voici un exemple récent, pris précisément dans les sciences physiques.

Il y a seulement dix ans ; la prévision des tremblements de terre était considérée comme un problème de géologie. On pensait qu’il fallait, pour envisager une prévision incertaine et difficile, étudier dans le détail les zones dangereuses, surveiller attentivement tous les signes des sismographes, etc. Encore ne voyait-on pas comment, de là, passer à la prévision : le problème était trop complexe, il comprenait trop d’inconnues [5].

Cependant on put établir un premier ensemble de corrélations entre les tremblements de terre et les variations du magnétisme terrestre, grâce, en particulier, à l’astronautique ; on découvrit aussi d’autres corrélations entre le magnétisme terrestre et l’activité solaire, de là on passa naturellement à l’hypothèse que les séismes sont en relation avec l’activité solaire.

Sinon expliquer du moins prévoir

Voilà le problème déjà bien transformé, si du moins cette relation peut être démontrée, puisqu’on peut envisager la prévision des tremblements de terre par une observation constante du magnétisme terrestre et du soleil, tâche qui peut être assumée automatiquement par des satellites. Ce qui est bien encourageant, mais qui, on l’avouera, ressemble fort à la corrélation entre le divorce et le chocolat glacé.

Sans doute peut-on imaginer des liaisons causales, et cela a été fait.

Mais gare à la tentation de Sherlock Holmes ! Il y a quelques années, le physicien américain J. Weber, de l’Université du Maryland, publiait les premiers enregistrements d’ondes gravitationnelles (peu importe d’ailleurs ici ce que sont ces ondes) [6]. En peu de temps, voici que l’on a découvert des corrélations entre ces enregistrements, les variations du champ magnétique terrestre, les taches solaires, les tremblements de terre. Et pour ajouter à la confusion, les ondes enregistrées par Weber viendraient du cœur de notre galaxie.

Si Weber a raison, où poursuivre la « cause » de tel tremblement de terre ? Elle se sera complètement diluée en une foule d’innombrables corrélations. En revanche, ce que l’on ne saura plus « expliquer », on pourra le prévoir. Qu’est-ce qui vaut mieux ?

Aimé MICHEL

(a) G. W. Snedecor : Statistical Methods (Iowa State College Press, 1956).

(*) Chronique n° 149 parue dans France Catholique-Ecclésia − N° 1391 − 10 août 1973


Notes de Jean-Pierre ROSPARS du 29 octobre 2012


[1Si la notion de cause nous paraît si claire c’est sans doute en raison de notre capacité d’action. Je pousse une porte, elle s’ouvre ; je ramasse une pierre sur le chemin puis la lâche, elle tombe au sol. J’ai le sentiment d’être la cause de ce qui arrive et que ce qui arrive est prévisible. Ces idées sont renforcées par l’enseignement des sciences ; celui-ci insiste beaucoup sur le « déterminisme », pour des raisons à la fois pédagogiques, historiques et pratiques. La mécanique s’est imposée au XIXe siècle comme le modèle des sciences expérimentales, au point que pour beaucoup « science » et « déterminisme » sont indissociables. Ce n’est plus du tout vrai aujourd’hui (voir ci-dessous).

[2Les « fausses corrélations » sont légions. Il n’est pas inutile d’en donner quelques exemples parce qu’on a beau être averti de ce piège il est très facile d’y tomber, du moins quand ils sont moins piquants et caricaturaux. Ainsi, les statistiques de la FAO montrent que plus on consomme de viande, de tabac et d’alcool, plus on vit vieux (en fait l’espérance de vie est plus élevée dans les pays riches, là où on consomme davantage de viande, d’alcool et de tabac). On vit plus vieux au Japon qu’en France et en France qu’en Russie ; or il y a plus de médecins par millier d’habitants en Russie qu’en France et en France qu’au Japon, donc moins il y a de médecins plus on vit vieux (en fait il faut chercher l’explication du côté du régime alimentaire au Japon, et de la moindre qualité des soins en Russie). Il y a une corrélation positive entre l’évolution de l’espérance de vie et le nombre de chômeurs (en fait les deux séries évoluent parallèlement dans le temps). Ou encore le fait que les décapitations de Charles 1er et de Louis XVI ont suivi de près l’introduction de la pomme de terre en Angleterre et en France prouve que la consommation de ce légume provoque troubles et révolutions ; et cette loi est confirmée par les troubles politiques en Irlande, pays grand consommateur de pomme de terre. J’extrais ces exemples du petit livre fort instructif de Joseph Klatzmann, ancien administrateur de l’INSEE et longtemps professeur d’économie à l’Agro de Paris-Grignon, Attention statistiques ! Comment en déjouer les pièges (La Découverte, Paris, 1996). Bien des gens concluent de tels exemples « qu’on peut faire dire n’importe quoi aux statistiques », ce qui n’est pas faux, à condition d’ajouter qu’il s’agit d’un usage incompétent des statistiques !

Sur les corrélations voir aussi la chronique n° 69, Pascal en cartes perforées, La psychophysiologie guérira-t-elle Pascal d’écrire ses Pensées ? (15.02.2011).

[3Bertrand Saint-Sernin dans l’article « Causalité » de l’Encyclopedia Universalis explique fort bien les raisons de cette désaffection dans la science actuelle. « [L]a notion de cause, écrit-il, a fait l’objet de quatre remises en question : de la part des positivistes, qui contestent la possibilité de pénétrer la nature ou les connexions intimes du réel ; de la part des physiciens et des biologistes, qui constatent la nécessité du recours aux probabilités dans leurs descriptions et leurs hypothèses ; de la part des fondateurs de la théorie du chaos, qui observent une dissociation entre causalité et prédiction ; enfin de la part de tous ceux qui, considérant avec suspicion l’idée de finalité, redoutent de la voir se réinstaller dans la science à la suite de la notion de cause. »

De ces quatre remises en question, celle fondée sur la théorie du chaos est peut-être la plus impressionnante. En effet, cette théorie démontre que le comportement de certains systèmes mécaniques très simples, décrits par trois variables indépendantes seulement, est imprévisible. Un tel système obéit à une loi connue (exprimée par des équations différentielles, c’est la raison pour laquelle on le dit « déterministe ») et pourtant il échappe à toute prédiction. On croyait jusque là que des règles simples imposaient un comportement simple et qu’un comportement qui ne l’était pas provenait nécessairement de règles qui ne l’étaient pas non plus. On sait aujourd’hui que c’est faux : un système obéissant à des règles simples peut avoir un comportement complexe, et inversement, un système au comportement apparemment compliqué peut obéir à des règles simples (voir par exemple Hervé Zwirn, Les systèmes complexes. Mathématiques et biologie, Odile Jacob, Paris, 2006).

[4Cette présentation du déterminisme non comme une réalité mais comme un idéal a été défendue avec beaucoup de lucidité par Jean Fourastié. D’une part, écrit-il, « la recherche scientifique doit rester d’abord et toujours orientée, comme elle l’a été jusqu’à maintenant depuis Galilée, vers la recherche du déterminisme ; en effet, le déterminisme est la forme de connaissance la plus utile à l’homme, parce qu’elle est le mieux en accord avec la pensée rationnelle, avec l’esprit humain ; et surtout le déterminisme est la forme de connaissance la plus utile pour l’action. Il faut rechercher dans la nature autant que possible des phénomènes déterminés. Or il en existe, peut-être à court terme seulement, peut-être grossièrement seulement. Mais peut-être aussi à long terme. Nous devons les rechercher systématiquement. ». Mais, d’autre part, « l’homme de science doit être à l’école de l’expérience, de l’expérience seule. Il doit savoir que le déterminisme n’est pas la règle mais l’exception ; il ne reculera pas “épouvanté” devant l’indéterminisme ; (…) il y a une science du probable ; il y a une science de l’aléatoire ; il y a une science du “conditionné”. » (J. Fourastié, Les conditions de l’esprit scientifique, coll. Idées, Gallimard, Paris, 1966).

La « science de l’aléatoire » inclut notamment la statistique, dont l’étude des corrélations n’est qu’un des multiples chapitres. Le mathématicien américain George Snedecor (1881-1974), dont Aimé Michel cite l’ouvrage classique, est l’un des fondateurs des statistiques modernes. Il apporta des contributions majeures notamment en ce qui concerne l’analyse de la variance (qui permet de comparer des résultats d’observations ou d’expériences) et les plans expérimentaux (qui optimisent la conception des expériences). Ses travaux, comme ceux de son célèbre collègue anglais Ronald Fisher (1890-1962), ont été motivés par des problèmes en recherche agronomique.

[5La prévision des tremblements de terre est un sujet toujours d’actualité que vient illustrer la récente condamnation des scientifiques qui n’ont pas su prévoir le tremblement de terre d’Aquila en avril 2009. En réalité, les géophysiciens s’accordent sur leur médiocre capacité à prévoir les séismes avec certitude. Beaucoup de pistes ont été explorées sans grand succès au point que Richter, le père de l’échelle servant à mesurer la magnitude des séismes qui porte son nom, a déclaré un jour « Seuls les fous, les charlatans et les menteurs peuvent prédire les tremblements de terre » !

Le physicien danois Per Bak (1948-2002), un des promoteurs d’une science de la complexité, récemment disparu, a critiqué le simple examen détaillé de ce qui s’est passé. « Bien sûr, écrit-il, après un tremblement de terre, on peut (…) identifier la faille responsable et localiser l’épicentre, ce qui peut suffire à convaincre les scientifiques travaillant sur les tremblements de terre qu’on devrait être capable de prédire les plus gros : on pourrait y arriver, si l’on avait “un peu plus d’argent”. Malheureusement, notre expérience (…) nous enseigne que les choses ne fonctionnent pas en général de cette manière. Ce n’est pas parce que l’on peut décrire avec une extrême précision ce qui est arrivé que l’on est nécessairement capable de prédire ce qui va se passer. » (Quand la nature s’organise. Avalanches, tremblements de terre et autres cataclysmes, trad. par Marcel Filoche, Flammarion, 1999, p. 123-124).

Per Bak rappelle que ce même Richter a découvert, en collaboration avec Gutenberg, une loi statistique fort intéressante donnant le nombre de tremblements de terre d’une magnitude donnée. Selon cette loi, pour, disons, 1000 séismes de magnitude 4, il y en a 100 de magnitude 5, 10 de magnitude 6 et ainsi de suite (de nombreux phénomènes complexes suivent une loi puissance de ce genre). « Cette loi est époustouflante ! » s’exclame Per Bak. « Comment se peut-il que la dynamique de tous les éléments d’un système aussi compliqué que la croûte terrestre, avec ses montagnes, ses vallées, ses lacs et ses structures géologiques d’une diversité énorme, complote pour produire in fine comme par magie une loi d’une si grande simplicité ? ». Telles sont les surprises qu’occasionnent les systèmes complexes. En tout cas, c’est très encourageant car cela montre que les tremblements de terre les plus meurtriers ne différent pas fondamentalement des petits tremblements de terre, beaucoup plus fréquents et donc bien plus faciles à étudier.

Commentant ces observations, Bak attribue la lenteur des progrès dans ce domaine au conservatisme de la communauté des géophysiciens. A la question « Pourquoi adoptez-vous une attitude aussi conservatrice, alors même que tant de phénomènes demeurent si mal compris ? », on lui fit cette réponse : « Si nous ne nous raccrochions pas à une vision commune de l’univers, bien qu’elle ne soit pas vérifiée dans les faits, rien ne nous lierait en tant que communauté scientifique. Comme le risque de voir notre vision actuelle contredite durant notre existence est faible, cette théorie en vaut une autre. » Bak conclue : « L’explication était donc sociale et non scientifique » (op. cit., pp. 30 et 122).

Cette discussion aurait certainement ravi Aimé Michel qui était fermement convaincu de notre ignorance dans tous les domaines, de l’inépuisable source d’interrogations offertes par un monde dont les surprenantes propriétés n’attendent que la sagacité d’un esprit neuf pour être découvertes. Voir par exemple la chronique de la semaine dernière, n° 137, Copernic cinq siècles après (Il existe une éternelle contradiction entre la découverte de la vérité et les mécanismes par lesquels elle se transmet), ou encore la chronique n° 53, À dix minutes de l’an 4000, (Dix minutes pour comprendre une idée qui ne sera conçue que par un génie de l’an 4000), parue ici le 24.01.2011.

[6Nous avons eu récemment l’occasion de parler des ondes gravitationnelles à propos des pulsars, voir la chronique n° 111, Les pulsars au rendez-vous du calcul (L’univers est-il conforme aux structures de la raison humaine ?) , mise en ligne au début du mois.

Un message, un commentaire ?


Les forums restent ouverts durant 15 jours après la date de publication

modération a priori

Ce forum est modéré a priori : votre contribution n’apparaîtra qu’après avoir été validée par un administrateur du site.

Qui êtes-vous ?
Votre message

Ce formulaire accepte les raccourcis SPIP [->url] {{gras}} {italique} <quote> <code> et le code HTML <q> <del> <ins>. Pour créer des paragraphes, laissez simplement des lignes vides.