Après les tests de psycho-économie, voici un simple test de probabilités.
Une maladie touche une personne sur mille dans la population. Il existe un test pour cette maladie, qui est valide à 99%; c’est à dire que lorsque vous êtes malade, le test est positif dans 99% des cas, et si vous n’êtes pas malade, le test est négatif dans 99% des cas. Il y a 1% de “faux positifs” et 1% de “faux négatifs”.
Une personne fait ce test, et le test est positif. Quelle est la probabilité que cette personne soit malade?
Vous pouvez poster vos réponses en commentaires.
Edit (11h38) : les réponses seront publiées avec un petit délai, afin d’éviter d’orienter les réponses suivantes. Si votre réponse ne s’affiche pas tout de suite, ne vous en inquiétez pas : cela viendra plus tard.
Edit2 (12h54) : Merci à tous les participants. Soit les lecteurs de ce blog sont un échantillon très biaisé de connaisseurs en matière Bayesienne; soit ceux qui ont répondu faux ont, pour un bon nombre d’entre eux, soit mal rempli le captcha, soit n’ont pas osé répondre : en tous les cas, à cette heure, il y a 9 réponses justes sur 16. Bravo donc à LB, Gu Si Fang, Frigobus, Thomas Xavier-Martin, Jck, El, Hektor, Tim, Prl, qui ont donné la bonne réponse : probabilité voisine de 9%. La réponse de Yannick est un peu approchée, mais peut être considérée comme juste. Et bravo aux autres d’avoir joué le jeu. Qu’ils se disent qu’en se trompant, ils sont en bonne compagnie : même des gens très doués se trompent sur ce genre de questions.
Le débriefing des résultats et du test sera posté d’ici quelques instants.
- William Nordhaus, Paul Romer, Nobel d’économie 2018 - 19 octobre 2018
- Arsène Wenger - 21 avril 2018
- Sur classe éco - 11 février 2018
- inégalités salariales - 14 janvier 2018
- Salaire minimum - 18 décembre 2017
- Star wars et la stagnation séculaire - 11 décembre 2017
- Bitcoin! 10 000! 11 000! oh je sais plus quoi! - 4 décembre 2017
- Haro - 26 novembre 2017
- Sur classe éco - 20 novembre 2017
- Les études coûtent-elles assez cher? - 30 octobre 2017
50%.
Un peu moins de 1% de le population n’est pas malade et répond positif (0,99%) et un peu moins de 1% de la population est malade et répond positif (0,99%). Comme il répond positif, il a autant de chances d’être malade que de ne pas l’être.
Gdaudin : le raisonnement est intéressant, mais le résultat est faux.
Je me suis toujours fait avoir, dans ce type de test.
Mais je dirais 99 %
Un peu de stimulation intellectuelle le samedi matin au réveil ne peut pas faire de mal.
Le test est positif dans deux hypothèses. Premièrement, si la personne est malade et que le test donne un résultat conforme à la réalité. Deuxièmement, si la personne n’est pas malade et le test donne un résultat contraire à la réalité.
La probabilité que la personne soit malade est égale à la probabilité qu’on se trouve dans la première hypothèse sachant qu’on se trouve forcément dans l’une ou l’autre des deux hypothèses.
Plus concrètement, la probabilité que la personne soit malade est égale à la probabilité qu’on se trouve dans l’hypothèse une divisée par la probabilité qu’on se trouve dans l’hypothèse une ou dans l’hypothèse deux.
En chiffre:
Probabilité que la personne soit malade est égale à (0.001 x 0.99)/(0.001 x 0.99 + 0.999 x 0.01), soit environ 0.09 (9%).
Correct ?
Je dis aussi 99%. Puisque si c’est positif, il a tout de même 1% de chance que l’on se soit trompé.
Le test étant positif, la personne fait partie d’un des deux groupes suivants :
– vrais positifs (0,001 x 99%)
– faux positifs (0,999 x 1%)
Si l’on regarde les ordres de grandeur, on voit qu’il y a beaucoup plus de faux positifs que de vrais positifs. Sur l’ensemble des tests positifs, la part de gens vraiment malade est de :
(0,001 x 99%) / (0,001 x 99% + 0,999 x 1%)
soit environ 9%.
Quand on apprend qu’on a un test "positif", on a donc encore 91% de chances d’être en bonne santé. Cheese…
10 % ?
P(A sachant B) = P(A inter B) / P(B)
avec A = être malade
avec B = être positif
P (A inter B) = 0,001 * 0,99 = 0,00099
P (B) = 0,00099 + 0,999*0,01 = 0,00099+0,00999 = 0,01098
P(A sachant B) = 9 %
Bon, j’aborde le problème d’un point de vue scientifique, parce que si les formules existent, c’est pour ne pas se faire pièger par des raisonnements piégeux 🙂
Soit une population de 100.000 personnes, dont 100 malades et 99.900 sains.
Testons tout le monde…
Les 99.900 sains se répartissent en 999 faux positifs et 98.901 vrais négatifs.
Les 100 malades se répartissent entre 99 vrais positifs et 1 faux négatif.
Il y a donc au total 99+999=1098 positifs dont seulement 99 sont malades.
La probabilité d’être réellement malade avec un test positif est de 99/1098, soit environ 9%.
Je ne suis qu’un amateur en économie, mais les taux de fraude et les taux d’insulte sont un grand classique de la théorie de la comparaison en sécurité (et en qualité), ce qui est mon domaine.
Accessoirement, ce genre de chose explique pourquoi il est illusoire d’essayer de reconnaître les terroristes dans les aéroports ; c’est aussi l’une des raisons qui font que la biométrie est une vaste escroquerie…
Je dirai, au pifométre, sans avoir revu mes vieux cours de proba, quelquechose comme: (0,99)^2=0,9801.
Ce que j’ai fait, c’est au jugé, pour le faire correctement, il faudrait utiliser les formules de Bayes.
Et j’ai vraiment pas le courage de m’y replonger. 😉
Eh bien 99%. Cela rappelle furieusement le jeu habituel "Quelqu’un lance 1000 fois une pièce en l’air et obtient 1000 fois ‘face’; quelle est la probabilité d’avoir un ‘pile’ au lancer suivant?"
Si la personne est positive, elle peut être soit faux positif, soit effectivement malade. La probabilité pour qu’elle soit malade et faux positif est 0.01*0.001=0.00001 donc la probabilité qu’elle soit malade est de 1-0.00001=99.999%. Le fait de faire le test a donc permis d’améliorer la confiance d’un facteur 100 i.e. la sensibilité du test. mais je me déchire peut être lamentablement…
Il y a 1% de faux positifs. Si je teste 1000 personnes il y a 10 faux positifs. Puisqu’il y a 1 personne malade sur mille. Il y a 10 faux pour un vrai. 10% de chance d’être malade
je did 9,999%
correction
99/(99+999)=9%
Sauf erreur de calcul on trouve 99/1098, soit un peu moins d’un dixième.
Moralité : un résultat positif ne donne guère d’information ; par contre un résultat négatif est une assurance quasi-certaine d’être bien portant..
PS : Gros boulet que je suis, je me suis planté à la question "combien font cinq moins deux" du système de filtrage de commentaire.. J’ai répondu 7.. Quelqu’un a une corde?
prenons une population de 10000 personnes. 99900 saines, 100 malades. On trouve donc 999 faux positifs et 99 vrais positifs. Soit, dans la population des positifs, une proba p=99/(99+999)=0,09016… d’être vraiment malade. Ce qui est effectivement contre-intuitif (il y a beaucoup plus de faux positifs que de vrais). Question subsidiaire : Quelle est la probabilité que les inventeurs de ce test se fassent virer de leur labo?
Polydamas : effectivement, l’utilisation des formules de Bayes permet de voir que la personne n’a que 9,02 % de chances d’avoir la maladie. Le test n’est pas assez précis compte tenu de la faible distribution de la maladie dans la population totale.
Il y a beaucoup plus de personnes saines que de personnes malades dans la population : le test produit donc, en proportion, beaucoup plus de faux positifs que de faux négatifs.
Pour 1000 individus (1 malade, 999 sains), en moyenne, les résultats du test seront :
– 0,99 (99% de 1) vrai malade détecté comme tel
– 0,01 (1% de 1) vrai malade détecté comme sain
– 989,01 (99% de 999) non malade détecté comme tel
– 9,99 (1% de 999) non malade détecté comme malade
Pour chaque vrai malade correctement détecté, il y a un peu plus de dix faux positifs.
Un sujet testé positif a donc seulement environ 9,016% de "chances" d’être réellement malade.
A l’inverse, un sujet testé négatif a seulement un peu plus de 0.001% de "chances" d’être en fait malade.
Ça tombe plutôt bien, puisque qu’un faux positif n’est pas très grave (on peut faire des examens supplémentaires) mais qu’un faux négatif est un malade qui ne sera pas soigné.
ben oui je me suis lamentablement déchiré… être malade et faux positif n’est pas possible. damn it !
Je copierai 100 fois : bien lire l’énoncé et ne pas confondre un sur mille et un sur cent.
bien lire l’énoncé et ne pas confondre un sur mille et un sur cent.
bien lire l’énoncé et ne pas confondre un sur mille et un sur cent.
…
En ce qui concerne la détection de terroriste, je ne partage pas l’avis de M. Martin: un faux positif est beaucoup moins grave qu’un faux négatif: quelques heures de garde à vue contre 250 morts. Alors tant pis pour les 1098 faux positifs …
Très bonne idée cette petite remise en jambe probabiliste. On comprend mieux pourquoi la mode est à l’incertitude non probabilisable… les calculs étant impossibles, les erreurs passent plus inapercues 😉
Mais plus sérieusement peut-être, ce qui est étonnant c’est qu’en améliorant la qualité du test de 1% (donc 99,99%), la probabilité d’être malade sachant qu’on est positif devient 90,917% si je ne me trompe. Cet effort de fiabilité est peut-être couteux mais permet aussi pas mal d’économies sur les faux malades traités… La question de l’arbitrage entre un investissement sur la recherche (améliorer le test) ou sur la production d’analyses (ou de médicaments) me semble relativement bien mise en évidence par cet exemple. De là à reboucher le trou de la sécu je ne sais pas, mais on peut se demander si le marché aboutit au bon équilibre naturellement.
Pour mille personnes, on a statistiquement 999 non malades et 1 malade. On aura statistiquement donc 9,99 faux positif et 0,99 vrai positif. Le nombre total de positifs est 9,99+0,99=10,98.
La proba d’être malade est donc 0,99/10.98=0,0901, soit 9,01%. Il y a donc 98,99 faux positifs en moyenne.
C’est un biais bien connu du test hemoccult qui recherche du sang dans les selles comme marqueur d’un cancer du colon. Il y a beaucoup de faux positifs, mais ce test reste quand même utile.