Aclarando la confusión entre correlación y causalidad 

Aquí hay un tidbit histórico del que quizás no estés al tanto. Entre los años 1860 y 1940, a medida que aumentó el número de ministros metodistas que vivían en Nueva Inglaterra, también aumentó la cantidad de ron cubano importado en Boston, y ambos aumentaron de manera muy similar. ¡Por lo tanto, los ministros metodistas deben haber comprado un montón de ron en ese período de tiempo!

En realidad no, esa es una conclusión tonta para dibujar. Lo que realmente está sucediendo es que ambas cantidades (ministros metodistas y ron cubano) fueron impulsadas hacia arriba por otros factores, como el crecimiento de la población.

Al llegar a esa conclusión incorrecta, hemos cometido el muy común error de confuso correlación con la causalidad.

¿Cual es la diferencia?

Se dice que dos cantidades son correlacionado  si ambos aumentan y disminuyen juntos ("positivamente correlacionados"), o si uno aumenta cuando el otro disminuye y viceversa ("correlacionado negativamente").

La correlación se detecta fácilmente a través de las mediciones estadísticas de la Coeficiente de correlación de Pearson, que indica cuán estrechamente juntas están las dos cantidades, que van desde -1 (perfectamente correlacionado negativamente) a través de 0 (no correlacionado en absoluto) y hasta 1 (perfectamente correlacionado positivamente).


gráfico de suscripción interior


 causalidad1tylervigen.com

Pero el hecho de que dos cantidades estén correlacionadas no necesariamente significa que uno esté directamente relacionado causando el otro para cambiar La correlación no implica causa, al igual que el clima nublado no implica lluvia, a pesar de que lo contrario es cierto.

Si se correlacionan dos cantidades, entonces bien podría existir una relación de causa y efecto genuina (como los niveles de lluvia y las ventas globales), pero quizás otras variables impulsen ambas (como números de piratas y calentamiento global), o tal vez es solo una coincidencia (como Consumo de queso en los Estados Unidos y estrangulaciones por sábana).

Incluso cuando está presente la causalidad, hay que tener cuidado de no confundir la causa con el efecto, o de lo contrario podríamos concluir, por ejemplo, que un mayor uso de calentadores provoca un clima más frío.

Con el fin de establecer la causa y efecto, tenemos que ir más allá de las estadísticas y buscar pruebas independiente (de carácter científico o histórico) y el razonamiento lógico. Correlación nos puede incitar a ir en busca de tal evidencia, en primer lugar, pero no es de ninguna manera una prueba en su propio derecho.

Problemas sutiles

Aunque los ejemplos anteriores fueron obviamente tonto, la correlación es muy a menudo confundido con la causalidad en formas que no son inmediatamente evidentes en el mundo real. Al leer e interpretar las estadísticas, hay que tener mucho cuidado para entender exactamente lo que los datos y las estadísticas están implicando - y lo más importante, lo que son no reticente.

 causalidad2

Un ejemplo reciente de la necesidad de precaución en la interpretación de los datos es la emoción a principios de este año que rodea el innovador aparente detección de ondas gravitacionales - un anuncio que parece haberse realizado prematuramente, antes de que se contabilizaran todas las variables que afectaban a los datos.

Por desgracia, el análisis de estadísticas, probabilidades y riesgos no es un conjunto de habilidades por cable en nuestra la intuición humana, y por eso es demasiado fácil desviarse. Libros enteros se han escrito sobre las formas sutiles en que las estadísticas pueden malinterpretarse (o utilizarse para inducir a error). Para ayudar a mantener la guardia alta, estos son algunos problemas estadísticos resbaladizos comunes que debe tener en cuenta:

1) El Efecto Trabajador Saludable, donde a veces dos grupos no se pueden comparar directamente en un campo de juego nivelado.

Considere un estudio hipotético que compare la salud de un grupo de oficinistas con la salud de un grupo de astronautas. Si el estudio no muestra una diferencia significativa entre los dos, no hay correlación entre la salubridad y el ambiente de trabajo, ¿debemos concluir que vivir y trabajar en el espacio no conlleva riesgos de salud a largo plazo para los astronautas?

¡No! Los grupos no están en la misma situación: los candidatos de la pantalla del cuerpo de astronautas encuentran candidatos sanos, que luego mantienen un régimen de aptitud integral para combatir de forma proactiva los efectos de vivir en "microgravedad".

Por lo tanto, esperamos que sean significativamente más saludables que los trabajadores de oficina, en promedio, y deberían preocuparse si no lo fueran.

2) Categorización y el efecto de migración de etapa: mezclar personas entre grupos puede tener efectos dramáticos en los resultados estadísticos.

Esto también se conoce como Will Rogers efecto, después del comediante estadounidense que, según los informes, bromeó:

Cuando los habitantes de Oklahoma dejó Oklahoma y se trasladó a California, elevaron el nivel medio de inteligencia en ambos estados.

Para ilustrar, imagine dividir un gran grupo de amigos en un grupo "corto" y un grupo "alto" (tal vez para organizar una foto). Una vez hecho esto, es sorprendentemente fácil aumentar la altura promedio de ambos grupos a la vez.

Simplemente solicite a la persona más baja del grupo "alto" que cambie al grupo "corto". El grupo "alto" pierde su miembro más corto, lo que aumenta su altura promedio, pero el grupo "corto" gana su miembro más alto y, por lo tanto, también gana en altura promedio.

Esto tiene importantes implicaciones en los estudios médicos, donde los pacientes a menudo se clasifican en grupos "saludables" o "insalubres" en el curso de probar un nuevo tratamiento. Si los métodos de diagnóstico mejoran, algunos pacientes levemente insalubres pueden ser recategorizados, lo que lleva a que los resultados de salud de ambos grupos mejoren, independientemente de qué tan efectivo (o no) sea el tratamiento.

 causalidad3Escoger y elegir entre los datos puede llevar a conclusiones erróneas. Los escépticos ven el período de enfriamiento (azul) cuando los datos realmente muestran un calentamiento a largo plazo (verde). skepticalscience.com 

la minería 3) de datos - cuando está presente una gran cantidad de datos, partes y piezas pueden ser palmitas para apoyar cualquier conclusión deseada.

Esta es una mala práctica estadística, pero si se hace deliberadamente puede ser difícil de detectar sin conocimiento del conjunto de datos original y completo.

Considere el gráfico de arriba que muestra dos interpretaciones de datos de calentamiento global, por ejemplo. O fluoruro: en pequeñas cantidades, es uno de los medicamentos preventivos más eficaces de la historia, pero el efecto positivo desaparece por completo si solo se consideran las cantidades tóxicas de flúor.

Por razones similares, es importante que los procedimientos para un experimento estadístico determinado se fijen en su lugar antes de que comience el experimento y luego se mantienen sin cambios hasta que finaliza el experimento.

4) Agrupación: lo que se espera incluso en datos completamente aleatorios.

Considere un estudio médico que examine cómo una enfermedad en particular, como el cáncer o la esclerosis múltiple, es geográficamente distribuido. Si la enfermedad ataca al azar (y el medio ambiente no tiene ningún efecto), esperaríamos ver numerosos grupos de pacientes por rutina. Si los pacientes se distribuyen perfectamente de manera uniforme, ¡la distribución sería muy poco aleatoria!

Entonces, la presencia de un solo grupo, o un número de pequeños grupos de casos, es completamente normal. Se necesitan métodos estadísticos sofisticados para determinar cuánto clúster se requiere para deducir que algo en esa área podría estar causando la enfermedad.

Desafortunadamente, cualquier clúster en absoluto, incluso uno no significativo, tiene un titular de noticias fácil (y a primera vista convincente).

 causalidad4

El análisis estadístico, como cualquier otra herramienta poderosa, debe usarse con mucho cuidado y, en particular, uno siempre debe tener cuidado al sacar conclusiones basadas en el hecho de que dos cantidades están correlacionadas.

En cambio, siempre debemos insistir en pruebas separadas para defender la causa y el efecto, y esa evidencia no vendrá en la forma de un solo número estadístico.

Correlaciones aparentemente convincentes, por ejemplo, entre genes dados y esquizofrenia o entre una dieta alta en grasas y la enfermedad cardíaca, puede llegar a estar basada en una metodología muy dudosa.

Tal vez estamos como una especie cognitivamente mal preparada para enfrentar estos problemas. Como educador canadiense Kieran Egan ponerlo en su libro Obténgalo mal desde el principio:

La mala noticia es que nuestra evolución nos equipó para vivir en sociedades pequeñas, estables, de cazadores-recolectores. Somos personas del Pleistoceno, pero nuestros cerebros en lenguaje han creado sociedades masivas, multiculturales, tecnológicamente sofisticadas y rápidamente cambiantes en las que podemos vivir.

En consecuencia, debemos resistir constantemente la tentación de ver el significado en el azar y de confundir la correlación y la causalidad.La conversación

Este artículo se publicó originalmente el La conversación
Lea la articulo original.


Acerca de los autores

Jonathan BorweinJonathan Borwein (Jon) es Profesor Laureado de Matemáticas en la Universidad de Newcastle. Es Profesor Laureado de Matemáticas en la Universidad de Newcastle y Director del Centro de Matemáticas de Investigación Asistida por Computadora y sus Aplicaciones (CARMA). Ha trabajado en Carnegie-Melon, Dalhousie, Simon Fraser y Waterloo Universities y ha ocupado dos cátedras de investigación de Canadá en informática.

Rose MichaelMichael Rose es Candidato a PhD, Facultad de Ciencias Matemáticas y Físicas de la Universidad de Newcastle. Estudiante de Matemáticas y Doctorado bajo la supervisión del Profesor Laureate Prof. Jon Borwein de la Universidad de Newcastle, Australia. Actualmente ayuda con la investigación en la aplicación de las matemáticas fractales para modelar distribuciones de sinapsis cerebrales.

Declaración de divulgación: Los autores no trabajan, consultan, poseen acciones ni reciben fondos de ninguna compañía u organización que se beneficie de este artículo. Tampoco tienen afiliaciones relevantes.


Libro recomendado:

Dinero, Sexo, Guerra, Karma: Notas para una revolución budista
por David R. Loy.

Dinero, Sexo, Guerra, Karma: Notas para una revolución budista por David R. Loy.David Loy se ha convertido en uno de los defensores más poderosos de la cosmovisión budista, explicando como nadie su capacidad de transformar el paisaje sociopolítico del mundo moderno. En Dinero, sexo, guerra, karma, ofrece presentaciones nítidas e incluso sorprendentemente claras de los básicos básicos budistas, el funcionamiento del karma, la naturaleza del yo, las causas de problemas tanto a nivel individual como social, y las verdaderas razones detrás de nuestro sentido colectivo de "nunca lo suficiente". , "ya sea tiempo, dinero, sexo, seguridad ... incluso guerra". La "Revolución Budista" de David es nada menos que un cambio radical en la forma en que podemos acercarnos a nuestras vidas, a nuestro planeta, a los delirios colectivos que impregnan nuestro lenguaje, nuestra cultura e incluso nuestra espiritualidad.

Haga clic aquí para más información y / o para solicitar este libro en Amazon.