Test antidopage : le cas Contador.

Dans cet article, un spécialiste de la lutte contre le dopage affirme sa certitude que le test positif au Clenbutérol de Contador, lors du tour de France 2010, ne lui vaudra aucune sanction, et que sa version est la bonne. Rappelons que Contador a été testé positif un jour de repos, après un test négatif la veille, et a justifié ce test positif par le fait d’avoir consommé un steak qui devait contenir du Clenbutérol (celui-ci est initialement un produit vétérinaire). Or comme le produit ne peut servir qu’en cure longue, ou de façon ponctuelle un jour d’effort, il est absurde d’en avoir pris un jour de repos.

Je n’ai pas de compétence médicale ou pharmacologique; je suis néanmoins frappé de constater que l’hypothèse sous-jacente de ce spécialiste, c’est que le test positif et les tests négatifs précédents sont tous justes. Mais est-ce vraiment le cas? C’est l’occasion d’illustrer le problème statistique posé par ce genre de tests.

Lorsqu’on cherche à tester quoi que ce soit (maladie, dopage, etc…) il y a deux types d’erreurs possibles : le faux positif et le faux négatif. Un faux positif est positif au test de dopage alors qu’il ne s’est pas dopé; un faux négatif est un individu qui s’est dopé mais que le test ne détecte pas.

Bien souvent, dans les exercices de probabilités, on considère ces deux erreurs comme équivalentes; mais dans la pratique, elles ne le sont que très rarement. Le problème central, c’est que réduire l’une de ces deux erreurs conduit à accroître l’autre. Pour le comprendre, on peut considérer deux cas extrêmes. Comment faire un test qui détectera tous les dopés? Très simple, il suffit d’un test qui dit systématiquement « la personne est dopée ». De façon évidente, ce test détectera tous les dopés (aucun faux négatif, puisqu’il n’y a aucun négatif…) mais au prix d’un nombre énorme de faux positifs (puisque tous les non-dopés sont déclarés dopés).

A l’inverse, pour créer un un test qui n’aura aucun faux positif, il faut qu’il indique systématiquement « la personne n’est pas dopée ». Il n’y aura aucun faux positif (un sportif accusé à tort de dopage) mais au prix de ne détecter aucun dopé.

Concevoir un test, c’est placer un curseur entre ces deux extrêmes. On avait pu voir le problème à l’époque des premiers tests de prise d’EPO dans le cyclisme. L’EPO n’étant pas encore détectable, les instances du sport avaient décidé qu’un sportif présentant un hématocrite (la proportion de globules rouges dans le sang, augmentée par la prise d’EPO) de plus de 50% serait déclaré inapte à courir, et qu’en dessous de 50%, il était possible de concourir.

l’hématocrite moyen est de l’ordre de 45%. Mais certaines personnes, au naturel, sont au dessus de ce taux, d’autres sont en dessous. Par ailleurs, s’exercer en haute altitude (ce qui n’est pas du dopage) permet naturellement d’élever ce taux de quelques points. Si les instances sportives avaient choisi un taux limite inférieur, elles auraient dénoncé beaucoup plus de cas de dopage, mais au prix d’une augmentation de faux positifs – les gens qui, naturellement, ont un hématocrite élevé. Inversement, fixer le taux limite à un niveau plus élevé aurait réduit le nombre de faux positifs, mais en détectant beaucoup moins de dopés réels. Ce choix d’une limite à 50% était donc un arbitrage obligé entre faux positifs et faux négatifs.

Dans le domaine médical, on cherche avant tout à éviter les faux négatifs, quitte à avoir des taux élevés de faux positifs. Il est bien plus grave de dire à une personne « vous n’êtes pas malade » alors qu’elle l’est (ce qui conduit à ne pas la soigner) que de lui dire « vous êtes malade » alors qu’elle ne l’est pas (auquel cas, on fait d’autres tests pour confirmer). C’est certes inquiétant pour les gens qui se retrouvent positifs à un test alors qu’ils ne sont pas malades (et cette inquiétude est amplifiée par le fait que les médecins connaissent très mal le taux de faux positifs) mais c’est un moindre mal.

Et dans le domaine du test antidopage sportif? Les incitations sont exactement inverses. Annoncer qu’un sportif est dopé est extrêmement lourd : il sera aussitôt suspendu par sa fédération le temps de pouvoir confirmer le test, et ne pourra plus concourir; il va subir de lourdes conséquences financières et de réputation, dont il ne se relèvera que difficilement. Un laboratoire qui annonce « untel est dopé » alors qu’il ne l’était pas court donc de grands risques. Alors que l’inverse n’a que peu de conséquences : si on déclare négatif un sportif douteux, il continuera sa carrière sans problèmes. Les autorités antidopage sont donc incitées à éviter les faux positifs, quitte à avoir un taux élevé de faux négatifs.

L’expérience nous montre que c’est le cas, que le nombre de faux négatifs (des sportifs dopés non détectés) sont extrêmement nombreux dans le sport. On le sait parce que de nombreux sportifs ont été dopés sans être détectés, et ont avoué ensuite un dopage systématique. Bjarne Riis et Richard Virenque, qui ont tous deux reconnu s’être dopé, n’ont jamais fait l’objet du moindre contrôle positif à l’époque où ils ont déclaré le faire. Marion Jones n’a jamais été contrôlée positive, et a avoué ensuite une prise permanente de stéroides depuis 1999.

Et cela a une conséquence assez logique : le nombre de faux positifs (sportifs accusés à tort de dopage) doit être extrêmement faible. Si l’on se pose la question : « quelle est la probabilité, sachant qu’il a été déclaré positif à un test, que tel sportif soit dopé », sans connaître la réponse avec précision, statistiquement, on peut se dire qu’elle est très élevée. Et que le crédit à accorder aux tests négatifs antérieurs est assez faible.

Comme le dit Kaiser Fung, (dont le livre inspire ce post), quelle est la probabilité des explications alternatives (la consommation d’un steak issu d’un bovin traité au clenbutérol)? A une époque où l’on identifie très rapidement l’origine des aliments (en particulier la viande de boeuf) pourquoi n’a-t-on pas cherché à vérifier s’il a vraiment mangé un steak, de quelle exploitation il provenait, si l’on y utilisait du clenbutérol? Après tout, l’usage de cette substance est interdit dans l’élevage, il y a là un problème sanitaire sur lequel enquêter.

Faute d’une telle enquête qui manifestement n’intéresse personne, en se cantonnant à une lecture statistique, l’hypothèse du dopage semble bien plus probable que les alternatives.

D’ailleurs, le fameux exercice de probabilité du bac S portait précisément sur une question du même type.

Mais voilà, je trouve qu’il y a un trou dans votre raisonnement, ou peut-être un raccourci un peu facile : quel est votre définition d’un test ? Comment détecterait-on le risque de faux positifs ou de faux négatifs s’il n’existaient pas d’autres tests de fiabilités différentes. Et par conséquent, en les combinants, le résultat ne serait-il pas un test plus fiable ?

Bon, mon propre post est intellectuellement malhonnête jusqu’à présent, parce que j’ai délibérément laissé de côté la question des effets secondaires d’un protocole de test, les questions d’échelle de temps et de délai souhaitable, les questions de preuve judiciaire, et peut-être bien d’autres encore (mais celles qui ne me sont pas venus à l’esprit ne comptent pas comme malhonnêtetés intellectuelles – paresse ou ignorance, plutôt).

YMB
12 juillet 2011 á 14:39

Excellent Martin Vidberg : vidberg.blog.lemonde.fr/2…
Pierre
12 juillet 2011 á 16:19

Au passage, il y a un autre dimension qui caractérise un test que l’arbitrage faux positifs-faux négatifs: la qualité du test. Dire que "Concevoir un test, c’est placer un curseur entre ces deux extrêmes." est donc un peu caricatural.

Merci pour tout le reste.

Réponse de Alexandre Delaigue
Vous avez raison. On peut noter que la proportion de vrais positifs dans la population influe aussi. Je voulais faire un post rapide, et surtout insister sur cet arbitrage faux positifs/faux négatifs.
Schmorgluck
12 juillet 2011 á 16:48

D’ailleurs, le fameux exercice de probabilité du bac S portait précisément sur une question du même type.

Mais voilà, je trouve qu’il y a un trou dans votre raisonnement, ou peut-être un raccourci un peu facile : quel est votre définition d’un test ? Comment détecterait-on le risque de faux positifs ou de faux négatifs s’il n’existaient pas d’autres tests de fiabilités différentes. Et par conséquent, en les combinants, le résultat ne serait-il pas un test plus fiable ?

Bon, mon propre post est intellectuellement malhonnête jusqu’à présent, parce que j’ai délibérément laissé de côté la question des effets secondaires d’un protocole de test, les questions d’échelle de temps et de délai souhaitable, les questions de preuve judiciaire, et peut-être bien d’autres encore (mais celles qui ne me sont pas venus à l’esprit ne comptent pas comme malhonnêtetés intellectuelles – paresse ou ignorance, plutôt).
Rouget
12 juillet 2011 á 17:59

Le DA de New-York devrait lire cet article. Mais malheureusement il est peut-être trop tard.

En tout cas il y a trois cas, un ou deux faux positifs et un ou deux vrais négatifs…

A méditer.
bayesien
12 juillet 2011 á 18:46

Ce serait amusant de voir l’UCI avoir recours à un raisonnement bayesien et estimer la probabilité marginale qu’un sportif soit dopé.
Malheureusement on n’enseigne pas la loi de bayes en médecine.

Schmorgluck: en supposant les tests indépendants sachant si un coureur est dopé (ce qui semble raisonnable), un raisonnement bayesien naïf répond aussi à cette question. : )
Schmorgluck
12 juillet 2011 á 19:32

Au temps pour moi, je n’avais pas pensé à l’idée de doper délibérément des sujets pour se donner un échantillonnage suffisant pour avoir une base de travail pour réaliser des inférences bayésiennes, en effet.
bayesien
13 juillet 2011 á 11:49

Non: il suffit de connaitre le taux de faux positif et faux négatif pour chaque test indépendamment.
Riendf
16 juillet 2011 á 15:15

‘Il est bien plus grave de dire à une personne "vous n’êtes pas malade" alors qu’elle l’est (ce qui conduit à ne pas la soigner) que de lui dire "vous êtes malade" alors qu’elle ne l’est pas (auquel cas, on fait d’autres tests pour confirmer).’
Le problèmes et que les autres tests ne sont pas forcément anodins non plus. Il me semble que la volonté de dépister le cancer de la prostate de manière trop préventive fait qu’un final il y a plus de problème déclenchés chez des personnes saines que de personnes soignés. Le curseur entre faux positif et faux négatif n’étant pas forcément toujours bien placé.

éconoclaste

L'économie pour les nuls et les autres. Depuis 1999.

Test antidopage : le cas Contador.

8 Commentaires