martes, 7 de octubre de 2025

Sobre las correlaciones

En el campo de la matemática, la estadística, la informática y ahora la inteligencia artificial, el manejo de las correlaciones es fundamental. En términos sencillos, una correlación es una medida estadística que describe la relación o asociación entre dos o más variables. Nos indica en qué medida los cambios en una variable están asociados a los cambios en otra.

Para comprender mejor su uso y funcionamiento, se pueden mostrar tres ejemplos sencillos. Veámoslo con una analogía clásica:

Correlación positiva: "Cuanto más tiempo pasa una persona bajo el sol (variable 1), más probable es que se queme la piel (variable 2)". Ambas variables se mueven en la misma dirección.

Correlación negativa: "Cuanto más veces te cepillas los dientes al día (variable 1), menos caries tendrás (variable 2)". Las variables se mueven en direcciones opuestas.

Sin correlación: "Cuanto más mide una persona (variable 1), más inteligente es (variable 2)". No hay una relación discernible.

Desarrollando un poco más la idea, podemos reparar en algunos elementos más profundos, a saber: 

1.-El Grado y la Dirección: la correlación no solo nos dice si hay una relación, sino también qué tan fuerte es y en qué dirección se da.

Dirección: Positiva (cuando una sube, la otra también) o Negativa (cuando una sube, la otra baja).

Fuerza: Se mide generalmente con un coeficiente (como el de Pearson) que va de -1 a +1.

        +1: Correlación positiva perfecta.

        -1: Correlación negativa perfecta.

        0: No existe correlación lineal alguna.

2.-Esto no implica Causalidad: este es el punto más importante y comúnmente malinterpretado. Que dos variables estén correlacionadas no significa que una cause la otra. Un ejemplo clásico: hay una fuerte correlación positiva entre la venta de helados y los ataques de tiburón. ¿Significa que los helados atraen tiburones? No. La variable oculta o "tercera variable" es el verano. Hace más calor (más gente compra helados y más gente nada en el mar, aumentando los encuentros con tiburones).

3.-Tipos de Correlación:

Lineal: La relación entre las variables se puede representar razonablemente bien con una línea recta (es la más común).

No lineal: La relación sigue un patrón curveado (por ejemplo, en forma de U). Los coeficientes de correlación lineal standard no detectarían esta relación.

¿Para qué se usan las correlaciones?

Las correlaciones son extremadamente útiles en casi todos los campos:

Finanzas: Para diversificar una cartera de inversiones (se buscan activos con baja o negativa correlación).

Medicina: Para estudiar la relación entre un hábito (como fumar) y una enfermedad (cáncer de pulmón).

Marketing: Para entender si el gasto en publicidad está relacionado con un aumento en las ventas.

Ciencia e Investigación: Para identificar patrones y conexiones que merezcan un estudio más profundo.

Hoy en día el avance de la inteligencia artificial está muy ligado a la aplicación algorítimica de correlaciones matemáticas de grandes datos y funciones de causa y efecto. Pensar en correlaciones es responder a la pregunta: "¿Están estas dos cosas conectadas de alguna manera?"

Sí, y se mueven juntas -> Correlación Positiva.

Sí, pero cuando una sube la otra baja -> Correlación Negativa.

No parece haber un patrón -> Sin Correlación.

Y siempre, siempre, hay que recordar la advertencia de oro: Correlación ≠ Causalidad. Es el primer paso para encontrar una relación, no la prueba final de que una variable cause la otra.


No hay comentarios:

Publicar un comentario