sábado, 23 de mayo de 2009

CORRELACION

Correlación


la correlación indica la fuerza y la dirección de una relación lineal entre dos variables aleatorias. Se considera que dos variables cuantitativas están correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables (A y B) existe correlación si al aumentar los valores de A lo hacen también los de B y viceversa. La correlación entre dos variables no implica, por sí misma, ninguna relación de causalidad.


Fuerza, sentido y forma de la correlación

La relación entre dos super variables cuantitativas queda representada mediante la línea de mejor ajuste, trazada a partir de la nube de puntos. Los principales componentes elementales de una línea de ajuste y, por lo tanto, de una correlación, son la fuerza, el sentido y la forma:

  • La fuerza extrema segun el caso, mide el grado en que la a representa a la nube de puntos: si la nube es estrecha y alargada, se representa por una línea recta, lo que indica que la relación es fuerte; si la nube de puntos tiene una tendencia elíptica o circular, la relación es débil.
  • El sentido mide la variación de los valores de B con respecto a A: si al crecer los valores de A lo hacen los de B, la relación es positiva; si al crecer los valores de A disminuyen los de B, la re lación es negativa.

Coeficientes de correlación

Existen diversos coeficientes que miden el grado de correlación, adaptados a la naturaleza de los datos. El más conocido es el coeficiente de correlación de Pearson (introducido en realidad por Francis Galton), que se obtiene dividie

ndo la covarianza de dos variables por el producto de sus desviaciones estándar. Otros coeficientes son:

Interpretación geométrica

Ambas series de valores X (x_1, \ldots, x_n) e Y (y_1, \ldots, y_n) pueden estar consideradas como vectores en un espacio a n dimensiones. Reemplacemoslos por vectores centrados:

X (x_1 - \bar x, \ldots, x_n - \bar x) e Y (y_1 - \bar y, \ldots, y_n - \bar y).


El coseno del ángulo alfa entre estos vectores es dada por la fórmula siguiente :

 cos(\alpha) = \dfrac{\displaystyle \sum_{i=1}^N (x_i - \bar x)\cdot(y_i - \bar y)}{\sqrt{\displaystyle \sum_{i=1}^N (x_i - \bar x)^2}\cdot\sqrt{\displaystyle \sum_{i=1}^N (y_i - \bar y)^2}}

Pues cos(α) es el coeficiente de correlación de

Pearson.

¡ El coeficiente de correlación es el coseno entre ambos vectores centrados!

Si r = 1, el ángulo α = 0°, ambos vectores son colineales (paralelos).
Si r = 0, el ángulo α = 90°, ambos vectores son ortogonales.
Si r =-1, el ángulo α = 180°, ambos vector es son colineales de dirección opuesto.
Más generalmente : α = arcCos(r).

Por supuesto, del punto vista geométrica, no hablamos de correlación lineal: el coeficiente de correlación tiene siempre un sentido, cualquiera que sea su valor entre -1 y 1. Nos informa de modo preciso, no tanto sobre el grado de dependencia entre las variables, que sobre su distancia angular en la hyperesfera a n dimensiones.

No hay comentarios:

Publicar un comentario