{"id":7128,"date":"2008-06-29T19:36:12","date_gmt":"2008-06-29T19:36:12","guid":{"rendered":"http:\/\/127.0.0.1\/import\/?p=1128"},"modified":"2008-06-29T19:36:12","modified_gmt":"2008-06-29T19:36:12","slug":"la-fin-de-la-theorie","status":"publish","type":"post","link":"https:\/\/econoclaste.eu\/econoclaste\/la-fin-de-la-theorie\/","title":{"rendered":"La fin de la th\u00e9orie?"},"content":{"rendered":"<p>Un lecteur, via la chatbox, nous indique un r\u00e9cent article de Chris Anderson, auteur de l&rsquo;excellent \u00ab\u00a0<a href=\"http:\/\/www.amazon.fr\/Longue-Tra%C3%AEne-nouvelle-%C3%A9conomie-est\/dp\/2744062693\" hreflang=\"fr\">the long tail<\/a>\u00ab\u00a0, annon\u00e7ant la <a href=\"http:\/\/www.wired.com\/science\/discoveries\/magazine\/16-07\/pb_theory\" hreflang=\"fr\">fin prochaine de la m\u00e9thode scientifique telle que nous la connaissons<\/a>&nbsp;: l&rsquo;augmentation du nombre de donn\u00e9es et de capacit\u00e9s de traitement, permises par les nouvelles technologies, permet de se passer des th\u00e9ories fausses pour se contenter du simple constat, issu des donn\u00e9es, de l&rsquo;existence de corr\u00e9lations mesurables. Corr\u00e9lation n&rsquo;est pas causalit\u00e9, mais cela n&rsquo;a plus d&rsquo;importance d\u00e8s lors que l&rsquo;on dispose de tant de donn\u00e9es&nbsp;: on peut comprendre le monde de fa\u00e7on bien meilleure gr\u00e2ce \u00e0 leur analyse plut\u00f4t qu&rsquo;en se r\u00e9f\u00e9rant \u00e0 des th\u00e9ories forc\u00e9ment incompl\u00e8tes.<\/p>\n<p>L&rsquo;article est amusant et met le doigt sur un ph\u00e9nom\u00e8ne peu connu&nbsp;: la mont\u00e9e en puissance de l&rsquo;analyse des donn\u00e9es. En \u00e9conomie, c&rsquo;est I. Ayres, dans <a href=\"http:\/\/www.amazon.fr\/Super-Crunchers-Thinking-Numbers-Smart\/dp\/0553805401\/ref=sr_1_1?ie=UTF8&amp;s=english-books&amp;qid=1214757417&amp;sr=8-1\" hreflang=\"fr\">Super Crunchers<\/a>, qui \u00e0 l&rsquo;aide de quelques exemples (les travaux de Levitt, la pr\u00e9vision de la consommation chez Wal Mart, ou <a href=\"http:\/\/papers.ssrn.com\/sol3\/papers.cfm?abstract_id=1139199\" hreflang=\"fr\">l&rsquo;\u00e9quation d&rsquo;Ashenfelter<\/a> &#8211; voir ce <a href=\"http:\/\/www.econtalk.org\/archives\/2007\/10\/ayres_on_super.html\" hreflang=\"fr\">podcast<\/a> consacr\u00e9 au livre) montrait l&rsquo;importance et la pertinence de l&rsquo;analyse massive des donn\u00e9es dans la science moderne.<\/p>\n<p>C. Anderson pousse la logique encore plus loin&nbsp;: les mod\u00e8les et les th\u00e9ories scientifiques sont faux, et l&rsquo;analyse des donn\u00e9es est susceptible de remplacer l&rsquo;analyse scientifique, dont le recours aux th\u00e9ories conduit \u00e0 des impasses &#8211; Anderson cite l&rsquo;exemple de la physique th\u00e9orique et de la biologie \u00e0 ce titre, \u00e9voquant pour cette derni\u00e8re la d\u00e9couverte par Craig Venter de nouvelles esp\u00e8ces sans les avoir jamais vues, gr\u00e2ce \u00e0 l&rsquo;analyse syst\u00e9matique de l&rsquo;ADN. Le raisonnement est le suivant&nbsp;: la m\u00e9thode scientifique traditionnelle consiste \u00e0 \u00e9laborer des th\u00e9ories, et les tester ensuite sur les donn\u00e9es&nbsp;: des donn\u00e9es sans th\u00e9orie pour les relier ne sont que du bruit. Mais d\u00e8s lors que l&rsquo;on dispose d&rsquo;\u00e9norm\u00e9ment de donn\u00e9es, cette m\u00e9thode est obsol\u00e8te, parce qu&rsquo;il est possible gr\u00e2ce \u00e0 la puissance de calcul de retirer r\u00e9ellement des th\u00e9ories valables \u00e0 partir des donn\u00e9es. Plus besoin, d\u00e8s lors, de mod\u00e8les forc\u00e9ment faux. De la m\u00eame fa\u00e7on que Google ne sait strictement rien de ce qui constitue une information pertinente, mais se contente d&rsquo;analyser les donn\u00e9es pour les fournir plus efficacement que les autres, la science pourrait se passer de th\u00e9ories et se fonder sur des donn\u00e9es.<\/p>\n<p>L&rsquo;argument choquera les puristes, et \u00e0 juste titre, parce qu&rsquo;il est faux; l&rsquo;article a quand m\u00eame l&rsquo;int\u00e9r\u00eat de rappeler que l&rsquo;analyse des donn\u00e9es est tr\u00e8s \u00e0 la mode, et devient une composante majeure de l&rsquo;analyse scientifique. De l\u00e0 \u00e0 supplanter la th\u00e9orie? Pas s\u00fbr. Cet article m&rsquo;a rappel\u00e9 l&rsquo;un de nos <a href=\"http:\/\/econoclaste.eu\/dotclear\/index.php\/?2004\/10\/24\/13-13\" hreflang=\"fr\">vieux posts<\/a> (novembre 2004&#8230; comme le temps passe) qui indiquait d\u00e9j\u00e0 qu&rsquo;il y a deux fa\u00e7ons de faire de la science&nbsp;: faire des th\u00e9ories d&rsquo;abord et les confronter aux faits ensuite, ou \u00e9tudier les faits et en d\u00e9duire des th\u00e9ories. En sciences, en g\u00e9n\u00e9ral, on pr\u00e9f\u00e8re la premi\u00e8re fa\u00e7on, et il y a de bonnes raisons pour cela, qui ne se limitent pas au \u00ab\u00a0c&rsquo;est plus pratique\u00a0\u00bb sous-entendu par Anderson. Les raisons sont logiques et \u00e9pist\u00e9mologiques, pas de commodit\u00e9.<\/p>\n<p>Pourquoi consid\u00e9rons-nous l&rsquo;Egypte antique comme une tr\u00e8s grande civilisation? L&rsquo;historien Arnold Toynbee s&rsquo;\u00e9tait pos\u00e9 la question, et avait apport\u00e9 une r\u00e9ponse troublante&nbsp;: parce que c&rsquo;est l&rsquo;une des rares pour lesquelles nous disposons d&rsquo;\u00e9l\u00e9ments \u00e0 analyser. Les conditions climatiques particuli\u00e8res de la r\u00e9gion (le climat d\u00e9sertique qui permet la conservation des b\u00e2timents et des reliques arch\u00e9ologiques) et des hasards de l&rsquo;histoire (la proximit\u00e9 de l&rsquo;Europe, permettant aux arch\u00e9ologues de se d\u00e9placer, le r\u00f4le de l&#8217;empire britannique) ont fait que nous disposons, depuis tr\u00e8s longtemps, de beaucoup d&rsquo;informations sur l&rsquo;Egypte antique. Du coup, nous lui accordons une grande importance historique, bien plus grande que celle que nous accordons \u00e0 ces civilisations qui, parce que leurs reliques sont moins accessibles ou ont \u00e9t\u00e9 d\u00e9truites par le temps, ne nous ont pas laiss\u00e9 grand-chose \u00e0 \u00e9tudier. En somme, pour Toynbee, l&rsquo;historien est un peu comme cet ivrogne qui a perdu les cl\u00e9s de chez lui, et les cherche sous le lampadaire, non pas parce qu&rsquo;elles ont plus de chances d&rsquo;\u00eatre l\u00e0 plut\u00f4t qu&rsquo;ailleurs, mais parce que c&rsquo;est le seul endroit \u00e9clair\u00e9.<\/p>\n<p>Et c&rsquo;est le probl\u00e8me principal du \u00ab\u00a0number crunching\u00a0\u00bb pour comprendre la r\u00e9alit\u00e9&nbsp;: il d\u00e9pend de donn\u00e9es qui sont elles-m\u00eames sujettes \u00e0 des biais de disponibilit\u00e9. On pourrait imaginer que disposer de la totalit\u00e9 des donn\u00e9es disponibles permettrait de r\u00e9soudre ce probl\u00e8me&nbsp;: c&rsquo;est oublier que les donn\u00e9es, elles-m\u00eames, sont une construction, et ne sont pas la r\u00e9alit\u00e9. Anderson r\u00e9p\u00e8te plusieurs fois que la th\u00e9orie est par nature fausse, ce qui est exact; mais les donn\u00e9es, elles-m\u00eames, sont fausses. Elles subissent le biais du quantifiable&nbsp;: toutes les informations ne peuvent pas \u00eatre stock\u00e9es et analys\u00e9es de la m\u00eame fa\u00e7on. Ce qui est mesurable est alors privil\u00e9gi\u00e9 par rapport \u00e0 ce qui ne l&rsquo;est pas, ou ne peut l&rsquo;\u00eatre que de fa\u00e7on floue et qualitative.<\/p>\n<p>Il y a l\u00e0 surtout, en filigrane, le c\u00e9l\u00e8bre <a href=\"http:\/\/en.wikipedia.org\/wiki\/Problem_of_induction\" hreflang=\"fr\">probl\u00e8me \u00e9pist\u00e9mologique de l&rsquo;induction<\/a>&nbsp;: Nous pouvons disposer de toutes les donn\u00e9es que nous voulons, elles ne permettent pas en soi de construire une th\u00e9orie valide, mais seulement des croyances&nbsp;: parce que cela a toujours \u00e9t\u00e9 ainsi dans nos donn\u00e9es, cela va continuer. Il n&rsquo;y a aucune raison de penser que c&rsquo;est le cas. Nous ne pouvons que disposer de th\u00e9ories, tout en sachant que nous ne pourrons jamais d\u00e9montrer qu&rsquo;elles sont vraies, mais simplement, que jusqu&rsquo;\u00e0 pr\u00e9sent, rien n&rsquo;a permis d&rsquo;affirmer qu&rsquo;elles \u00e9taient fausses (c&rsquo;est la r\u00e9ponse apport\u00e9e par Karl Popper au probl\u00e8me de l&rsquo;induction).<\/p>\n<p>Sur un intervalle de temps suffisamment long, toute corr\u00e9lation d\u00e9couverte dans des donn\u00e9es peut s&rsquo;av\u00e9rer une simple coincidence; et parfois, la simple d\u00e9couverte d&rsquo;une corr\u00e9lation suffit \u00e0 la faire dispara\u00eetre. Les \u00e9conomistes ont l&rsquo;habitude, pour leur plus grand d\u00e9sespoir, de ce probl\u00e8me. Supposez par exemple que gr\u00e2ce \u00e0 l&rsquo;analyse exhaustive des donn\u00e9es financi\u00e8res depuis qu&rsquo;elles existent, je d\u00e9couvre qu&rsquo;il existe un type d&rsquo;entreprises qui a syst\u00e9matiquement \u00e9t\u00e9 sous-\u00e9valu\u00e9e, et rapporte beaucoup plus que le rendement normal des march\u00e9s&nbsp;: que va-t-il se passer? D\u00e8s que la nouvelle sera connue, tout le monde ach\u00e8tera ce type d&rsquo;entreprise, et la rentabilit\u00e9 exceptionnelle dispara\u00eetra rapidement. Ce n&rsquo;est pas une vue de l&rsquo;esprit&nbsp;: c&rsquo;est tr\u00e8s exactement ce qui s&rsquo;est pass\u00e9 pour les entreprises \u00e0 faible capitalisation boursi\u00e8re. Des analystes ont constat\u00e9 que celles-ci avaient rapport\u00e9 beaucoup plus que les autres pendant longtemps, et ont con\u00e7u des strat\u00e9gies de placement se fondant sur cette rentabilit\u00e9 sup\u00e9rieure&nbsp;: celle-ci a rapidement disparu au fur et \u00e0 mesure que sa connaissance se diffusait.<\/p>\n<p>Cela, un \u00e9conomiste aurait pu le pr\u00e9dire, uniquement sur la base de th\u00e9ories&nbsp;: si les gens sont rationnels, il n&rsquo;y a aucune chance pour qu&rsquo;un placement excessivement rentable le reste, si l&rsquo;information sur cette rentabilit\u00e9 se diffuse. Rien dans les donn\u00e9es n&rsquo;aurait permis de le pr\u00e9voir, puisque ce type de titre avait toujours \u00e9t\u00e9 plus rentable que le reste.<\/p>\n<p>On pourra dire que ce probl\u00e8me est sp\u00e9cifique aux sciences humaines, dont le mat\u00e9riau \u00ab\u00a0r\u00e9agit\u00a0\u00bb \u00e0 l&rsquo;analyse; mais toutes les sciences ont <a href=\"http:\/\/arstechnica.com\/news.ars\/post\/20080625-why-the-cloud-cannot-obscure-the-scientific-method.html\" hreflang=\"fr\">besoin de th\u00e9ories<\/a> pour comprendre ce que veulent dire les donn\u00e9es, et surtout, ce que les donn\u00e9es ne disent pas. Darwin n&rsquo;est pas c\u00e9l\u00e8bre pour avoir identifi\u00e9 de nombreuses esp\u00e8ces, mais pour avoir compris un m\u00e9canisme qui les fait appara\u00eetre, dispara\u00eetre et \u00e9voluer, lui permettant ainsi de d\u00e9crire des m\u00e9canismes que jamais <a href=\"http:\/\/judson.blogs.nytimes.com\/2008\/06\/17\/darwinmania\/\" hreflang=\"fr\">personne n&rsquo;a pu observer<\/a>.<\/p>\n<p>L&rsquo;analyse des donn\u00e9es est extr\u00eamement utile, mais sa disponibilit\u00e9 croissante risque d&rsquo;avoir l&rsquo;effet exactement inverse de celui pr\u00e9dit par Anderson&nbsp;: une floraison de th\u00e9ories. Parce qu&rsquo;il n&rsquo;y a pas d&rsquo;autres fa\u00e7ons d&rsquo;imaginer ce que l&rsquo;on ne peut pas voir &#8211; ce qui constitue le probl\u00e8me principal de la science.<\/p>\n","protected":false},"excerpt":{"rendered":"<div class=\"mh-excerpt\"><p>Un lecteur, via la chatbox, nous indique un r\u00e9cent article de Chris Anderson, auteur de l&rsquo;excellent \u00ab\u00a0the long tail\u00ab\u00a0, annon\u00e7ant la fin prochaine de la m\u00e9thode scientifique telle que nous la connaissons&nbsp;: l&rsquo;augmentation du nombre de donn\u00e9es et de capacit\u00e9s de traitement, permises par les nouvelles technologies, permet de se <a class=\"mh-excerpt-more\" href=\"https:\/\/econoclaste.eu\/econoclaste\/la-fin-de-la-theorie\/\" title=\"La fin de la th\u00e9orie?\">(Lire la suite&#8230;)<\/a><\/p>\n<\/div>","protected":false},"author":3,"featured_media":59424,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[5],"tags":[],"class_list":["post-7128","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ecoblabla"],"_links":{"self":[{"href":"https:\/\/econoclaste.eu\/econoclaste\/wp-json\/wp\/v2\/posts\/7128","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/econoclaste.eu\/econoclaste\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/econoclaste.eu\/econoclaste\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/econoclaste.eu\/econoclaste\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/econoclaste.eu\/econoclaste\/wp-json\/wp\/v2\/comments?post=7128"}],"version-history":[{"count":0,"href":"https:\/\/econoclaste.eu\/econoclaste\/wp-json\/wp\/v2\/posts\/7128\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/econoclaste.eu\/econoclaste\/wp-json\/wp\/v2\/media\/59424"}],"wp:attachment":[{"href":"https:\/\/econoclaste.eu\/econoclaste\/wp-json\/wp\/v2\/media?parent=7128"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/econoclaste.eu\/econoclaste\/wp-json\/wp\/v2\/categories?post=7128"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/econoclaste.eu\/econoclaste\/wp-json\/wp\/v2\/tags?post=7128"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}