Page 120 - cepe2012.pdf
P. 120
i i
“cepeMathBookFC” — 2012/12/11 — 19:57 — page 110 — #114
i i
110 2. ESTAD ´ ISTICA
DEFINICI ´ ON 2.18. El coeficiente de correlaci´ on entre las variables aleatorias X y
Y se define como el n´ umero
Cov.X; Y /
:
.X; Y / D p
Var.X/ Var.Y /
Al n´ umero .X; Y / se le denota tambi´ en por X;Y , en donde es la letra griega
ro. El lector puede observar inmediatamente que la diferencia entre la covarianza
y el coeficiente de correlaci´ on radica ´ unicamente en que este ´ ultimo se obtiene al
dividir la covarianza por el producto de las desviaciones est´ andar de las variables
aleatorias. Puede demostrarse que este cambio de escala tiene como consecuencia que
el coeficiente de correlaci´ on tome como valor m´ aximo 1, y como valor m´ ınimo 1, es
decir,
1 .X; Y / 1:
Explicaremos ahora la interpretaci´ on del coeficiente de correlaci´ on. Cuando X y Y
son tales que .X; Y / D 1, entonces existen constantes a y b, con a positiva tales que
Y D aX C b, es decir, se puede establecer una dependencia lineal directa entre las
dos variables aleatorias. En el otro caso extremo, cuando .X; Y / D 1, entonces
nuevamente existen constantes a y b, pero ahora con a negativa, tales que Y D aX Cb.
De nuevo, se trata de una relaci´ on lineal entre las dos variables aleatorias pero ahora tal
relaci´ on es inversa en el sentido de que cuando una de las variables aleatorias crece
la otra decrece. De esta forma el coeficiente de correlaci´ on es una medida del grado
de dependencia lineal entre dos variables aleatorias. Existen varias formas en que dos
variables aleatorias pueden depender una de otra, el coeficiente de correlaci´ on no mide
todas estas dependencias, ´ unicamente mide la dependencia de tipo lineal. As´ ı, hemos
mencionado que cuando el coeficiente de correlaci´ on es C1, ´ o 1, la dependencia
lineal es exacta. Como en el caso de la covarianza, puede demostrarse que si dos
variables aleatorias son independientes, entonces el coeficiente de correlaci´ on es cero, y
nuevamente, el rec´ ıproco es en general falso, es decir, la condici´ on de que el coeficiente
de correlaci´ on sea cero no es suficiente para garantizar que las variables aleatorias sean
independientes, excepto en el caso cuando las variables tienen distribuci´ on conjunta
normal.
Si en lugar de la distribuci´ on del vector aleatorio .X; Y / se cuenta con una serie
de observaciones .x 1 ; y 1 /; : : : ; .x n ; y n / de este vector, entonces puede calcularse el
as´ ı llamado coeficiente de correlaci´ on muestral como sigue:
Cov.fxg; fyg/
:
.fxg; fyg/ D p
Var.fxg/ Var.fyg/
Esta cantidad representa una estimaci´ on del coeficiente de correlaci´ on entre las variables
aleatorias.
i i
i i