Page 62 - EI2019.pdf
P. 62
54 1. An´ alisis exploratorio de datos
70. Se dice que el conjunto de datos num´ericos x ,...,x es sim´etrico
1
n
alrededor de su media ¯x si por cada dato x alaizquierda de ¯x hay
i
otro dato a la derecha y a la misma distancia de este punto central.
Demuestre que en esta situaci´on el coeficiente de asimetr´ıa es cero.
Curtosis
La curtosis es un n´umero que denotaremos por la letra k, y se define de la
siguiente manera.
Definici´on 1.32 La curtosis de un conjunto de n´umeros x ,...,x es
n
1
la cantidad
˜ ¸
n
1 1 ÿ
k “ px ´ ¯xq 4 .
i
s 4 n
i“1
2
Recordemos nuevamente que s denota la varianza, en consecuencia, el
4
t´ermino s denota la varianza al cuadrado y se calcula de la siguiente forma
˜ n ¸ 2
1 ÿ
4 2 2 2
s “ps q “ px ´ ¯xq .
i
n
i“1
La curtosis es un n´umero positivo que no tiene una unidad de medici´on.
Cuando una observaci´on x dista mucho de la media ¯x, al elevar esta dis-
i
tancia a la cuarta potencia hace que se magnifiquen las distancias grandes.
Por lo tanto, una curtosis grande puede indicar un mayor n´umero de datos
alejados de la media, hacia uno u otro lado, y por ello a la curtosis se le
interpreta como una medida de la forma de las colas de la distribuci´on o del
conjunto de datos. Por la expresi´on “forma de las colas” nos referimos aqu´ı
asi ´estas son amplias o bien ligeras (o inexistentes). Si son de una forma
o de otra, esto afecta la forma de un posible pico que presente la frecuen-
cia de los datos y de all´ısurgen interpretaciones de la curtosis como una
medida del tipo de pico de los datos. Estas interpretaciones est´an sujetas a
debate y por ahora no existe una interpretaci´on aceptada de manera general.