Page 120 - cepe2012.pdf

P. 120

i i

“cepeMathBookFC” — 2012/12/11 — 19:57 — page 110 — #114
i i

110 2. ESTAD ´ ISTICA

DEFINICI ´ ON 2.18. El coeﬁciente de correlaci´ on entre las variables aleatorias X y
Y se deﬁne como el n´ umero

Cov.X; Y /
:
.X; Y / D p
Var.X/ Var.Y /
Al n´ umero .X; Y / se le denota tambi´ en por X;Y , en donde es la letra griega
ro. El lector puede observar inmediatamente que la diferencia entre la covarianza
y el coeﬁciente de correlaci´ on radica ´ unicamente en que este ´ ultimo se obtiene al
dividir la covarianza por el producto de las desviaciones est´ andar de las variables
aleatorias. Puede demostrarse que este cambio de escala tiene como consecuencia que
el coeﬁciente de correlaci´ on tome como valor m´ aximo 1, y como valor m´ ınimo 1, es
decir,

1 .X; Y / 1:

Explicaremos ahora la interpretaci´ on del coeﬁciente de correlaci´ on. Cuando X y Y
son tales que .X; Y / D 1, entonces existen constantes a y b, con a positiva tales que
Y D aX C b, es decir, se puede establecer una dependencia lineal directa entre las
dos variables aleatorias. En el otro caso extremo, cuando .X; Y / D 1, entonces
nuevamente existen constantes a y b, pero ahora con a negativa, tales que Y D aX Cb.
De nuevo, se trata de una relaci´ on lineal entre las dos variables aleatorias pero ahora tal
relaci´ on es inversa en el sentido de que cuando una de las variables aleatorias crece
la otra decrece. De esta forma el coeﬁciente de correlaci´ on es una medida del grado
de dependencia lineal entre dos variables aleatorias. Existen varias formas en que dos
variables aleatorias pueden depender una de otra, el coeﬁciente de correlaci´ on no mide
todas estas dependencias, ´ unicamente mide la dependencia de tipo lineal. As´ ı, hemos
mencionado que cuando el coeﬁciente de correlaci´ on es C1, ´ o 1, la dependencia
lineal es exacta. Como en el caso de la covarianza, puede demostrarse que si dos
variables aleatorias son independientes, entonces el coeﬁciente de correlaci´ on es cero, y
nuevamente, el rec´ ıproco es en general falso, es decir, la condici´ on de que el coeﬁciente
de correlaci´ on sea cero no es suﬁciente para garantizar que las variables aleatorias sean
independientes, excepto en el caso cuando las variables tienen distribuci´ on conjunta
normal.
Si en lugar de la distribuci´ on del vector aleatorio .X; Y / se cuenta con una serie
de observaciones .x 1 ; y 1 /; : : : ; .x n ; y n / de este vector, entonces puede calcularse el
as´ ı llamado coeﬁciente de correlaci´ on muestral como sigue:

Cov.fxg; fyg/
:
.fxg; fyg/ D p
Var.fxg/ Var.fyg/
Esta cantidad representa una estimaci´ on del coeﬁciente de correlaci´ on entre las variables
aleatorias.

i i

115 116 117 118 119 120 121 122 123 124 125