02 febrero 2006

¿Aceptamos pulpo como animal de compañía?

En la entrada anterior mencioné un trabajo disponible en internet llamado proyecto SILA. Está firmado por Francisco Máñez y tiene la virtud, no muy frecuente en este tipo de trabajos, de molestarse en poner las tablas de resultados de experimentos "psi". Ya quedó claro que no estoy de acuerdo con el enfoque del asunto que se trasluce tras el texto que acompaña al artículo pero me dije: vamos a valorar los resultados, a ver qué sale. Y es que el tratamiento estadístico que hace don Francisco es más bien escasito.
Lo que sale es lo siguiente, expuesto más o menos ordenadamente:
  • la frecuencia esperada de coincidencias de cartas en las pruebas A, B, C y D es p= 0.2
  • dado un número de ensayos determinado, se observarán discrepancias entre las concidencias observadas (f_obs) y esperadas (f_esp); llamemos a ese número k: k = f_obs - f_esp
  • la hipótesis nula es H0: k = 0; esto no significa que k sea exactamente 0, es decir que las coincidencias observadas sean exactamente las mismas que las esperadas, sino que la magnitud de k es tal que no podemos descartar que sea debida al azar. Esto parece vago pero no lo es porque es fácil estimar la probabilidad P de que un valor k determinado se deba al azar.
  • la hipótesis alternativa es H1: k>0; o sea que las coincidencias observadas son significativamente mayores que las esperadas. En este caso, el valor de P será pequeño; por ejemplo, con P menor que 0.001, k podría atribuirse al azar con una probabilidad menor que uno entre mil.
  • tenemos 4 grupos de ensayos con cartas y 1 con dados. En el primer caso hay 21 series y en el segundo 5. Para cada serie se dispone del número de coincidencias (remito al texto original) y he calculado el valor de P de acuerdo con una distribución normal (estrictamente sería una binomial pero con este número de casos son indistinguibles).
  • los resultados son, en síntesis, los siguientes:
    • de las 21 series de cartas, 17 tienen valores de P mayor que 0.05, 5 tienen P menor que 0.05, y ninguna llega a P menor que 0.01.
    • de las 5 series de dados, 4 tienen valores de P mayor que 0.05 y la otra tiene P=0.02
    • de las 21 series de cartas, 2 tienen valores de P<0.05>para no coincidencias.
  • los valores de P concretos son, por orden de series, los siguientes:
    0.029, 0.021, 0.085, 0.548, 0.201, 0.236, 0.990, 0.059, 0.017, 0.614, 0.965, 0.063, 0.844, 0.586, 0.638, 0.044, 0.087, 0.641, 0.051, 0.012, 0.816, 0.268, 0.021, 0.262, 0.450, 0.785
    (los últimos 5 corresponden a los dados)
¿Qué significa lo anterior? Pues lo siguiente: si realizáramos ensayos al azar, mediante cartas perfectamente barajadas, o buenos generadores aleatorios de números, podríamos encontrar resultados con las mismas o más coincidencias que las obtenidas en cada serie con una probabilidad igual al valor de P en cada caso. Por ejemplo, P=0.085 (tercera serie de cartas) significa que por puro azar encontraríamos las mismas o más coincidencias que las observadas en un 8.5% de los ensayos. Lógicamente, para suponer una desviación significativa del azar es necesario encontrar valores de P suficientemente pequeños. En este sentido, los resultados de los experimentos de don Francisco son pobres porque ningún caso tiene una P menor que 0.01. Hay 5 casos con P menor que 0.05 (una probabilidad de que se deban al azar menor que el 5%) pero también hay dos casos con P menor que 0.05 para no coincidencias.
Aparte de la ausencia de resultados (5 valores de P entre 0.01 y 0.05 no son para tirar cohetes y mucho menos para demostrar nada) me he lanzado al análisis dando por buenas algunas hipótesis de partida que están sin comprobar. Incluso si eliminamos el fraude del experimento quedan incógnitas importantes pendientes. Por poner un ejemplo: sería imprescindible disponer de las secuencias de cartas en cada serie, ya que es la única forma de comprobar que se barajaron bien (analizando estadísticamente la existencia de correlación entre las secuencias de series consecutivas).
Una circunstancia que me llama poderosamente la atención es que en 4 de los 6 resultados más significativos (P menor que 0.05) interviene el autor, como él mismo reconoce. Esto parecería significar que tiene influencia sobre los resultados (psi o no psi, que eso es otra cosa). Pero resulta que el propio autor hizo pruebas masivas él solito sin obtener nada significativo (cosa que usa como prueba de no sé bien qué):
  • "completamente aparte, yo mismo efectué 3100 pruebas clásicas de PES general usando siempre el mismo mazo, permitiéndome toda clase de manipulación física de las cartas, sin que, pese a mi deseo, pudiera alcanzar unos resultados no atribuibles al azar."
  • "realicé 37800 tiradas comparativas empleando los mismos dados, entrando los resultados en la esperado por el azar."
¿Por qué no considera don Francisco que estos resultados negativos refutan su influencia en las series "oficiales" o, al menos, son tan válidos como ellas? Pues no, a pesar de lo expuesto, sus conclusiones son como las de los partidos políticos después de las elecciones, todos ganan:
  • "como fundamento para continuar las investigaciones, los tres puntos principales que se pretendían explorar en la experiencia piloto dieron frutos positivos."
Finalmente, para no aburrir más: incluso si hubieran salido valores de P abrumadores, habría que buscar la causa. Asignar esos resultados a poderes "psi", sin más, es una arbitrariedad insultante. Algunas causas alternativas podrían ser factibles, como dados defectuosos o mezcla deficiente en el caso de las cartas. Aunque yo prefiero atribuirlos a la influencia del ángel de la guarda (una hipótesis tan chula como la otra). Pero sólo cuando salgan, no ahora.

Nota: he tenido problemas con los signos "mayor que" y "menor que" debido a los códigos html, por eso los he sustituído por texto

1 comentarios:

Asigan dijo...

Buen análisis. Seguramente, hoy en día Paco Máñez estaría de acuerdo contigo.

Grab this Widget ~ Blogger Accessories
 
º