Les illusions, le biais de la négligence de la taille de l'échantillon

par Jean Marie Champeau 22 Janvier 2022, 12:38 biais de raisonnement

La négligence de la taille de l'échantillon


Un sujet a fait couler beaucoup d’encre en 2020 et 2021 :

«75% des nouveaux cas de Covid-19 sont chez des vaccinés».

Vous avez sûrement croisé cette information sous une forme ou sous une autre:

 

C'est effectivement ce qui a été observé, par exemple, début juillet 2021 à Provincetown, dans le Massachusetts, et pendant quatre semaines en été 2021 à Singapour.

 

Constater d'emblée que la plupart des personnes infectées dans un groupe étaient vaccinées interpelle au niveau du vécu comme diraient les Bobos de mame Hidalgo.

 

Cette affirmation, qui n’est pas fausse, est cependant incomplète. Elle conduit au biais de raisonnement de ce qu’on appelle La négligence de la taille de l'échantillon.

La négligence de la taille de l'échantillon est aussi appelé L'oubli de la fréquence de base. C’est la tendance à ne pas prendre en considération la fréquence de la survenue d'un événement, sa probabilité propre, lorsqu'on cherche à en évaluer une probabilité combinée. Cela conduit, le plus souvent, à surestimer cette probabilité combinée.

 

Dans les années 1970, Amos Tversky, psychologue israélien, et Daniel Kahneman, psychologue et économiste américano-israélien, ont conduit une série d'expériences qui mettent en évidence les erreurs provoquées par cet oubli, y compris dans des populations très diplômées. 

Exercice sanitaire
Proportions de malades 

Supposons une population de 20.000.000 de personnes et où 99% de ces gens sont entièrement vaccinés, soit 19.800.000. 

 

On pourrait penser qu'avec un taux de vaccination aussi élevé, les personnes vaccinées sont tout à fait hors de danger, pourtant la statistique évoquée laisse entendre le contraire.

 

La vaccination n’empêchant pas toujours d’attraper la maladie, il est effectivement possible de rencontrer des cas de malades vaccinés.

 

Poursuivons donc notre raisonnement, supposons qu'on observe dans cette population 200.000 nouveaux cas de Covid-19, soit 1% de la population totale, et que sur ces 200.000 nouveaux cas, on observe que 150.000 se trouvent dans la population vaccinée, et 50.000 seulement chez les non vaccinés. 

 

En effet, 75% des 200.000 cas sont survenus chez des vaccinés. 

Et c'est ainsi que tous ont un gros 75% en tête. 

 

Aie !


La question à se poser est la suivante: quels sont les risques que vous fassiez partie de ce groupe de malades si vous êtes vacciné et quelles sont les risques que vous tombiez malade si vous n'êtes pas vacciné?

 

Le nombre total de personnes non vaccinées dans notre population hypothétique est de 200.000 (1% de 20 millions). Les risques de tomber malade si vous n'avez pas été vacciné sont donc de 50.000 divisé par 200.000, c’est à dire 0,25, soit 25%, une chance sur 4.

 

En revanche, si vous êtes vacciné, les chances sont de 150.000 divisé par 19.800.000, c’est à dire 0,0075, soit 0,75%, c’est à dire 33 fois moins. 

 

En d'autres termes, si vous n'êtes pas vacciné dans cette hypothèse, les risques sont 33 fois plus élevés, même si la plupart des cas surviennent dans le groupe des vaccinés.

 

L'explication, c'est qu'il y a beaucoup plus de gens vaccinés que de non vaccinés. 
A la limite, si la totalité de la population est vaccinée, 100% des malades seront des vaccinés.

 

Moralité, Le genre d'affirmation :,«X des cas se retrouvent parmi les vaccinés», n’a de sens que par rapport au taux de vaccination. Et ensuite, faites un peu d'arithmétique.

Tests
Tests faux positifs faux négatifs 0,04 %
Tests faux positifs faux négatifs 0,04 %

Supposons que la maladie est présente dans une population dans la proportion de 4 personnes malades sur 10.000, soit 0,04%.

 

Le test est plutôt fiable à 99% de vrai positifs (donc 1% de faux négatifs) et 99,8% de vrai négatif (donc 0,2% de faux positifs).

 

«Si vous avez cette maladie, le test sera positif dans 99% des cas.»
«Si vous ne l’avez pas, il sera négatif dans 99,8% des cas».

 

Si l’on teste 1.000.000 de personnes, il y a 400 malades et 999.600 non malades puisque 0,04% de la population est malade.

 

D’après la fiabilité du test, on a alors:
- parmi les 400 malades, 396 auront un test positif et 4 négatif.
- parmi les 999.600 non malades, environ 1.999 auront un test positif (faux positif) et 997601 négatif.

 

Il y a donc 2.395 tests positifs en tout(1999+396), parmi lesquels 396 correspondent à des personnes malades, soit : 396/2.395 ≈0,16

 

Pour un test positif, la probabilité que le patient ait la maladie est d’environ 16%.
Autrement dit, il y a 84% de faux positifs.

 

Parmi les 400 malades il y aura 4 tests négatifs (faux négatifs)
Parmi les 997.605 tests négatifs (997601+4) 4 personnes ont un faux négatif.

 

Pour un test négatif, la probabilité que le patient soit malade est : 4/997.605≈0,000004
Autrement dit, il y a 0,0004% de faux négatifs.

 

Pratiquement tous les malades présentent un test positif, mais l’inverse n’est pas vrai, car plus de 80% de tous les tests positifs désignent des personnes saines !

 

Evidemment, plus il y a de vrais malades moins il y a de faux positifs.

Tests faux positifs faux négatifs 0,10 %
Tests faux positifs faux négatifs 0,10 %

S’il y avait, non pas 4 mais 10 personnes sur 10.000 de touchées (0,1%), on aurait non pas 400 malades mais 1000.

 

On aurait 2988 positifs dont 990 malades (33%) et donc seulement 67% de faux positifs et 10 faux négatifs sur 997.012.

Explication

L’explication dominante de ce biais est que nos jugements et décisions reposeraient sur deux types de processus cérébraux, certains rapides et intuitifs, d’autres lents et délibérés. 

 

Quand ce biais se manifeste c’est que nous jugeons une situation donnée non pas seulement en fonction de toute l’information à notre disposition, mais rapidement selon le processus intuitif ou en fonction de ce qu’on croit être représentatif de ladite situation, comme un stéréotype.

Il faut faire un effort d’analyse pour rétablir la situation.

 

Commettre le sophisme d’oubli de la fréquence de base peut donc s’avérer lourd de conséquences et peut jouer un rôle important dans divers contextes de prise de décision, notamment dans le monde médical, dans les tribunaux ou encore dans le monde des sciences et technologies. 

 

Pour comparer la probabilité de deux événements il est impératif de tenir compte des cas dans lequel cette probabilité se manifeste.
 

 

Photos

iceberg

Created by Uwe Kils (iceberg) and User:Wiska Bodo (sky).

https://upload.wikimedia.org/wikipedia/commons/thumb/a/ac/Iceberg.jpg/618px-Iceberg.jpg

 

Proportions de malades

Création personnelle

 

Tests faux positifs faux négatifs 0,04 %

Création personnelle

 

Tests faux positifs faux négatifs 0,10 %

Création personnelle

 

Vaccination répartition des risques

Création personnelle

 

Pour être informé des derniers articles, inscrivez vous :
commentaires

Haut de page