23 julio 2010

¿Efecto contagio en la violencia machista?

Publican en LaProvincia.es un artículo titulado Publicar noticias sobre violencia provoca un efecto mimético con un subtítulo "El 88 % de los casos de violencia machista se producen en los cuatro días que siguen a un suceso similar" con la cabecera siguiente:
El psicólogo Pedro Alonso Cabrera recomienda en el estudio Aprendizaje vicario, efecto mimético y violencia de género que los medios de comunicación no publiquen noticias sobre asesinatos machistas para evitar que otros agresores imiten estos comportamientos. El especialista ha concluido que el 88,89 % de los casos se producen en un periodo que se extiende no más allá de cuatro días de que se haya producido un suceso de similares características. Sólo un 11,11 % se dan de manera aislada.
La noticia sobre este informe ha merecido comentarios de todo tipo en el propio periódico y en algunos blogs. Algunos la reproducen sin más pero Víctor R. Ruiz cuestiona la significación estadística del resultado en su Cuaderno de Bitácora:
No soy experto en estadística, pero si las muertes se distribuyeran durante el año de forma aleatoria, la media de días entre muertes se obtendría diviendo 365 entre el anterior total. De hecho, 365/79 = 4,6 días por muerte. Habrá ocasiones en los que sucedan en cortos espacios de tiempo, y otras veces, más largo. Por tanto, la afirmación «el 88,89 % de los casos se producen en un periodo que se extiende no más allá de cuatro días» entra dentro de lo razonable. Si esto es así, a partir de eventos distribuidos aleatorialmente no podemos concluir de ninguna forma que las noticias produzcan un efecto mimético
¿Quién tiene razón? Me puse a revisar un poco los datos y les expongo a continuación los resultados, a ver si están de acuerdo conmigo. Aunque el estudio original es ilocalizable en estos momentos, en LaProvincia.es nos pone un gráfico de donde pueden extraerse todos los datos necesarios. Lo copio a continuación por si desaparece con el tiempo (pulsar encima para ampliar):

Cronograma de muertes de mujeres por violencia machista en el año 2008
En el gráfico están marcados con un punto los días en los que se han producido las muertes y se encierran en un rectángulo las "series" de muertes, entendiendo como tales aquellos grupos donde se han producido muertes en los cuatro días siguientes a otra cualquiera. Por ejemplo, el día 3 de enero hay una muerte que es seguida por otra el día 5 y otra más el día 7. Dado que entre el 3 y el 7 han pasado cuatro días, las tres muertes suponen una "serie".
Según este procedimiento, seguido aparentemente por el autor del trabajo, el 89% (72 de 81 casos) de las muertes forman parte de series lo cual demuestra el efecto contagio. 
Lo malo (o lo bueno, según se mire) es que eso no es cierto.
En mi opinión, en el recuento se comete un error grave: la primera muerte de cada serie se incluye en el recuento se "muertes por contagio" cuando es evidente que no debe hacerse si la muerte anterior se produjo hace más de 4 días.  En el caso comentado, la muerte del 3 de enero no puede añadirse al recuento, tampoco la del 17 o la del 31 de enero. En cambio, sí puede incluirse la del 22 de enero porque la anterior se produjo el 18. Por extensión, cuando se producen dos muertes el mismo primer día, como en el caso del día 22 de junio, es dudoso que la segunda deba añadirse al recuento porque la noticia no se conoce inmediatamente y es probable que el efecto contagio no haya podido producirse. En estos casos, sería necesario saber la diferencia en horas entre las muertes y cuando se publicó, algo que no sabemos ni tengo tiempo de buscar por lo que haré los cálculos con ambas opciones.

Con esta consideración, el porcentaje de "muertes dentro de los cuatro días siguientes" baja del 89% al 58% o al 64% (47 o 52 casos) y, como es lógico, el 11% que se produce de forma aislada según el autor, sube al 42% o al 36% según se consideren las segundas muertes el primer día de cada serie.
La siguiente pregunta es ¿cuál sería el porcentaje esperado si los eventos fueran aleatorios?
Como mi capacidad estadística es muy limitada, acudí a Excel para hacer algunas simulaciones de series y estimar dichos porcentajes empíricamente.  Para ello basta con hacer lo siguiente:
  • se generan números aleatorios entre 1 y 365 en 81 celdas; cada número supone una muerte. Lógicamente pueden producirse una o más muertes en cualquier día del año.
  • se ordena la serie de menor a mayor (cronológicamente)
  • se cuentan los casos que distan 1, 2, 3 o 4 días del caso anterior.
  • se divide el recuento entre el total (81) y ya tenemos una estimación de la cantidad de casos que cabe esperar en ese intervalo de 4 días de forma aleatoria.
Los resultados son que en una serie aleatoria cabe esperar que un 56% de los casos esté dentro de una ventana temporal de 4 días de un caso anterior. Este porcentaje no difiere gran cosa del 58% y 64% que arrojan los datos reales pero ¿son significativas las diferencias?
Aquí acudimos a una página donde podemos hacer el test online y la respuesta es que no hay diferencias significativas entre los porcentajes (ni al 95% ni al 90% de nivel de confianza). La conclusión es que los datos aportados no apoyan la hipótesis de que el contagio exista en las circunstancias que el autor parece manejar (cuatro días de margen temporal). Tal vez haya entendido algo mal ya que no tengo acceso al informe original pero, mientras aparece, la recomendación de no publicar las noticias de las muertes no tiene fundamento en los datos aportados. Sería bueno poder analizar una serie más larga (la mencionada es del año 2008) pero desconozco donde localizar los datos.

11 comentarios:

Nicolás dijo...

No conozco la forma en la que se realizó el estudio, pero sería bueno saber si se siguieron de la misma manera los crímenes de otra índole, ya sean asesinatos con otro movil, o incluso robos. Si los casos de violencia machista no se diferencian apreciablemente del resto en lo que respecta a la regularidad, entonces veo dificil establecer una relación causal entre las noticias y los nuevos crímenes.

Anónimo dijo...

Para empezar el analisis que realizas es sobre los casos de asesinato, no sobre los que tuvieron repercusión mediática. Ni cuando la tuvieron, puesto que la noticia no tiene por qué seguir al hecho.
De cualquier modo, desde mi punto de vista, en el estudio haces demasiadas presunciones. Por ejemplo, que todos los casos tuvieran el mismo tratamiento informativo o que la información se ofreciera en los mismos plazos desde el momento del suceso.
Como muy bien saben los políticos, si hay algo desagradable que tiene que salir a la luz, mejor que coincida con un mundial de futbol o cualquier otra noticia que acapare la atención de la mayoría.

Angel dijo...

Anónimo, yo no hago ninguna presunción, me limito a analizar la noticia en función de los datos que se dan y a demostrar que el contagio no se deduce de ellos porque hay un error de base en el recuento. Es posible que el contagio exista pero estos datos no sirven para demostrarlo.
Yo no asumo que todos los casos tuvieran la misma difusión, en cualquier caso lo hace el autor del estudio al incluirlos en las series.

Angel dijo...

Nicolás, supomgo que este tipo de casos se presta más al análisis de rachas porque tienen amplia repercusión en los medios y porque por el momento se les presta bastante atención. Saludos.

Anónimo dijo...

Sí, yo también hice el cálculo cuando leí que criticaban el estudio en otro blog de Hispaciencia.

El proceso se puede modelar con lo que se llama "proceso de Poisson". Supone este que los casos no tienen correlación entre si. Me dio los mismos datos que a ti. Estaba pendiente del análisis de contraste de hipótesis y resulta que lo tenéis vosotros. Sinceramente, pendiente de un cálculo mejor a mi me pareció "a ojo" significativo, pero muchísimo menos que al médico ese y los porcentajes que manejaba. Ahora resulta que la hipótesis de la correlación es rechazable nada menos que al 95%

Anónimo dijo...

No es complicado y hay bastante en Internet. Ya digo que lo estudiado (bajo la hipótesis de sucesos independientes) se llama proceso de Poisson. La distribución de tiempos entre sucesos sigue una distribución exponencial P(t)= lambda*EXP(-lambda*t), con lambda el cociente entre sucesos en determinado periodo y el periodo mismo.

Anónimo dijo...

Parece que olvidamos que la estádistica solo es cierta con grandes números, utilizarla par 85 casos en un año solo tiene valor ilustrativo. Ir mas alla es pura elucubración. Por otro lado desde mi experiencia de 25 años como profesor les puedo segurar que la publicidad de las faltas diciplinarias aumenta su incidencia por efecto mimético y la publicidad de las medidas correctivas aplicadas la disminuye.

Angel dijo...

>Parece que olvidamos que la estádistica solo es cierta con grandes números...
Por un lado creo haber escrito "Sería bueno poder analizar una serie más larga..."
Por otro, la estadística no deja de ser cierta con muestras pequeñas ya que entre sus bondades está la de manejar el concepto de incertidumbre. Una media aritmética, por ejemplo, puede valer lo mismo para una muestra de 10 que para otra de 10000 pero en el primer caso su error estándar es mucho mayor y su fiabilidad mucho menor: por eso es necesario usar pruebas de significación (que tienen en cuenta el tamaño muestral) y no basarse solamente en las cifras brutas. Este es el motivo por el cual los dos porcentajes de este caso no son significativamente diferentes. Los mismos porcentajes (56 y 64) sí lo serían con muestras más grandes.

>la publicidad de las faltas diciplinarias...
Entiendo que ese es un tema diferente. Aquí no debato sobre si el efecto contagio existe o no en la violencia doméstica, sólo sobre si los datos del estudio apoyan la existencia ese efecto.
Saludos

Alfredo Oliva dijo...

Angel, muy interesante, y bien trabajado. Ya había leído algo en otro lugar en el mismo srntido. No obstante, no tengo claro que pueda sacarse la conclusión de que no hay efecto contagio, ya que la influencia de esas noticias sobre el comportamiento del agresor no tiene porque ser inmediata y ocurrir en los días que siguen a la publicación de la noticia. Vamos, que la cosa me parece algo más complicada.
Un saludo

Angel dijo...

Hola Alfredo, esperaba tu opinión.

>no tengo claro que pueda sacarse la conclusión de que no hay efecto contagio,

No puede sacarse esa conclusión, en efecto. La única que puede sacarse es, como pongo al final del post, "que los datos aportados no apoyan la hipótesis de que el contagio exista". Que no lo apoyen no significa que no exista, simplemente que de esos datos, tratados así, no se deriva prueba alguna.
Ya puestos a suponer, cada agresor será distinto. Algunos serán influenciables, otros menos, algunos tendrán claro que la agresión la harán a la primera oportunidad, otras esperarán circunstancias diferentes, o tendrán que estar borrachos...
El problema es que este estudio ha tenido una amplia acogida en los medios y, aparentemente, sus conclusiones no son correctas.
Saludos.

rvr dijo...

Hola Ángel. ¡Interesantísima tu argumentación, muy detallada! Creo que quedan ya pocas dudas que con los datos aportados, no se puede concluir lo que afirma el artículo.

Grab this Widget ~ Blogger Accessories
 
º