26 octubre 2006

Estadística y causalidad

Que no, que no está demostrado que la reducción de la piratería tenga que ver con el calentamiento global

Primer caso: supongan que el señor X pide que le hagamos unas pruebas sobre la clarividencia mediante cartas Zener. La prueba se desarrolla barajando las cartas, pidiendo a X que diga de qué palo o tipo es cada carta, mirando cuál es realmente, etc.
El porcentaje esperado de aciertos es del 20% pero resulta que el sujeto acierta un 75%. Aquí el señor X se levanta y dice: “Señores ¿qué más prueba quieren? Acabo de demostrar mis poderes de clarividencia.”
La respuesta es no, no aún.
Un ejemplo menos conflictivo: todos los 26 de octubre, día de mi cumple, me tomo una copa de coñac Mascaró. Y resulta que ningún invierno pillo la gripe. Como en el caso anterior afirmo que mi adicción al coñac de esa marca supone una protección eficaz ante los virus griposos.
En ambos casos existe una trampa en el planteamiento, una trampa que a veces ni siquiera es deliberada. En el primer caso, lo que muestra la prueba es que el sujeto X tiene un porcentaje de aciertos muy superior a lo esperable por azar. Es atractivo suponer clarividencia, y de hecho muchas personas tenderán a aceptarlo porque el planteamiento de la prueba fue precisamente ese: “vamos a ver si tengo clarividencia”.
Lo que ocurre es que el experimento no demuestra que la causa del acierto sea el poder de clarividencia de X. De hecho, no demuestra nada sobre la causalidad del fenómeno.
Lo mismo ocurre con el licor de mis amores: existe una coincidencia perfecta entre el hecho verificable de tomar coñac y el igualmente comprobable de no pasar la gripe. Pero esa coincidencia no significa causalidad. De modo similar, en el caso del señor X, lo que se ha visto es que hay resultados que, comparados con los esperables por puro azar, son muy improbables pero el porqué de esos resultados, la causa subyacente, está tan indeterminada ahora como antes de la prueba.

Es frecuente la tendencia a interpretar la existencia de correlaciones significativas como equivalentes a relaciones causales. Pero no debe ser así, el encontrar correlaciones es frecuentemente una pista pero debe ser seguida de una etapa experimental especificamente diseñada para descubrir y confirmar los mecanismos de la relación causal. Sin esta etapa, frecuentemente de difícil diseño y compleja ejecución, nuestra comprensión del fenómeno sigue tan reducida como antes.

En el caso del clarividente señor X sólo cabe la opción de determinar con exactitud cuales son los mecanismos que actuan en esa presunta clarividencia. Si descubrimos que X emite o recibe ondas psiripitifláuticas que le permiten la adivinación, estas ondas deberán ser comprendidas, medidas, localizado el órgano emisor y receptor, la forma de transmisión, etc. Tal vez sea el señor X el único especimen que es capaz de emitirlas o recibirlas pero hay que descubrir cómo.
Lo mismo en el caso del coñac: hay de descubrir cuales son las rutas metabólicas o las relaciones entre la ingesta de tan preciado producto y la inmunidad al virus.
En resumen: ni lo improbable ni la correlación hacen causalidad, sólo son una primera etapa en un estudio completo de los hechos.

Hay un pequeño detalle más que quiero comentar, mínimamente técnico. Y es que cuando diseñamos una prueba estadística tendemos a caer en una trampa similar a la anterior, aunque algo más sutil. Por ejemplo, en el caso del señor X podemos calcular un valor para la probabilidad de obtener el resultado de 75% de aciertos sólo por azar.
Es obvio que podría obtener este porcentaje o incluso mayor dando valores al azar pero está igualmente claro que la probabilidad de que eso pase será muy pequeña. Para representar esa probabilidad se usa la letra P. Una expresión típica sería por ejemplo P=0.00015. La interpretación es que es posible obtener ese resultado de aciertos por puro azar con una probabilidad de 15 por cien mil. O dicho de otra forma, si repiera la prueba un millón de veces esperaría obtener el 80% de aciertos o más en unas 150 ocasiones.
Normalmente, cuando en una prueba encontramos que P es pequeño nos ponemos muy contentos porque tendemos a creer que ratifica la hipótesis inicial. Pero eso es falso, P sólo nos dice lo improbable que es obtener el resultado pero no dice nada de la verdad de la hipótesis que sirve de base al experimento. P sólo responde de los datos que se han usado, no sabe nada de verdades o falsedades en las hipótesis iniciales ni, por supuesto, en los datos que hemos utilizado.

Una broma (¿) para terminar: como todo el mundo sabe, el descenso del número de piratas es la causa del calentamiento global, tal como se demuestra en el gráfico siguiente.


Este es uno de los contraargumentos usados por Bobby Henderson profeta de la Primera Iglesia Unida del Monstruo Volador de Espagueti que aglutina al más conocido pastafarismo para parodiar la confusión entre correlación y causalidad.

8 comentarios:

Anónimo dijo...

Feliz cumpleaños¡
¿Demuestra esta gran entreda que los días que celebramos nuestro cumpleaños somos más analíticos? Hasta ahora se ha observado en el 100% de los casos, así que...

Anónimo dijo...

> Que no, que no está demostrado que la reducción de la piratería tenga que ver con el calentamiento global

¡HOGUERA!

Anónimo dijo...

Un profesor mío decía siempre que el hecho de que exista una correlacion estadística constatable entre el descenso del nivel de los embalses y el incremento en el consumo de helados no nos debía hacer creer que, en caso de crisis en el sector heladero, la solucion fuera vaciar los embalses :)

Saludos... y muchas gracias por tu blog.

Ángel M. Felicísimo dijo...

Anonimo: ejem, cabe la posibilidad de que estemos algo sensibles a las cifras, sí.
Lanarch: ¡un momento! que sólo he dicho que es algo por comprobar ¿pedimos un proyecto de investigación?.
Aunque pensándolo bien... es un dogma apoyado por la santa correlación...: aceptado, retiro mis dudas.

Ana dijo...

Que pases muy buen día y celebres con tus amigos. Me tomaré un cognac a tu salud.

Ángel M. Felicísimo dijo...

Ana, que sea verdad lo del coñac, yo voy a empezar en unos minutos en un butacón y delante de una pelicula. Que pena que todavía no haga frío para encender la chimenea. Saludos.

Hurón dijo...

Me recuerda aquella vieja historia del "científico" que iba cortando patas a una araña y cada vez la llamaba, y la araña acudía. Hasta que cortó la última pata y la araña no acudió a su llamada.
La conclusión que sacó: "Las arañas sin patas se vuelven sordas".

¡Feliz cumpleaños!

Anónimo dijo...

Buena entrada, visita nuestro blog de actualizaci'on estad'istica

http://predictive.wordpress.com/

Grab this Widget ~ Blogger Accessories
 
º