sábado, 1 de octubre de 2016

Correlación y causalidad

Una de las cosas más difíciles de lograr entre la abundancia de información periodística que existe sobre investigaciones de todo tipo (de las serias, y de las otras), es lograr diferenciar (discriminar, en el buen sentido de la palabra) la simple correlación de datos, y la causalidad entre los mismos.

En demasiadas oportunidades leemos sobre supuestas "pruebas científicas" de que tal causa provoca determinado efecto (cualquiera sea el campo de investigación), cuando en realidad solo se podría tratar de simple coincidencia en el comportamiento de los datos.

Pero en lugar de dar una explicación "sesuda" de las diferencias, lo haremos con algunos ejemplos de correlaciones que podrían (si alguien estuviera realmente loco) presentarse como causalidades.

1) Número de personas ahogadas en piscinas vs. cantidad de films de Nicolas Cage




2)  Número de lanzamientos espaciales no comerciales vs. doctorados en sociología (USA)




3) Consumo de pollo per-cápita vs. importaciones de petróleo en USA



Creo que con esto queda claro que una buena correlación no significa en absoluto causalidad.
Por lo tanto, debemos ser suficientemente escépticos a la hora de "justificar" hechos a partir de supuestas causas, por más que los datos sean estadísticamente confiables.

Obviamente, es el periodismo no especializado quien debería al menos tener presente esto antes de difundir una noticia, pero como me quedan pocas esperanzas de que sea así, al menos intentaré que mis lectores lo tengan claro para no caer en falsas expectativas...

Así que, ya lo sabes: correlación de datos no implica causalidad entre ellos.

Mas "Correlaciones Espúreas" para divertirse, acá:
http://www.tylervigen.com/spurious-correlations

No hay comentarios.:

Publicar un comentario