Page 62 - EI2019.pdf
P. 62

54                                      1.   An´ alisis exploratorio de datos



                    70. Se dice que el conjunto de datos num´ericos x ,...,x es sim´etrico
                                                                                 1
                                                                                          n
                        alrededor de su media ¯x si por cada dato x alaizquierda de ¯x hay
                                                                             i
                        otro dato a la derecha y a la misma distancia de este punto central.
                        Demuestre que en esta situaci´on el coeficiente de asimetr´ıa es cero.



                  Curtosis


                  La curtosis es un n´umero que denotaremos por la letra k, y se define de la
                  siguiente manera.




                   Definici´on 1.32 La curtosis de un conjunto de n´umeros x ,...,x es
                                                                                                    n
                                                                                           1
                   la cantidad
                                                       ˜                  ¸
                                                             n
                                                    1     1  ÿ
                                              k “               px ´ ¯xq 4   .
                                                                  i
                                                    s 4   n
                                                            i“1

                                                        2
                  Recordemos nuevamente que s denota la varianza, en consecuencia, el
                             4
                  t´ermino s denota la varianza al cuadrado y se calcula de la siguiente forma

                                                          ˜     n             ¸ 2
                                                            1  ÿ
                                            4      2 2                      2
                                          s “ps q “                px ´ ¯xq      .
                                                                      i
                                                            n
                                                               i“1
                  La curtosis es un n´umero positivo que no tiene una unidad de medici´on.
                  Cuando una observaci´on x dista mucho de la media ¯x, al elevar esta dis-
                                                  i
                  tancia a la cuarta potencia hace que se magnifiquen las distancias grandes.
                  Por lo tanto, una curtosis grande puede indicar un mayor n´umero de datos
                  alejados de la media, hacia uno u otro lado, y por ello a la curtosis se le
                  interpreta como una medida de la forma de las colas de la distribuci´on o del
                  conjunto de datos. Por la expresi´on “forma de las colas” nos referimos aqu´ı
                  asi ´estas son amplias o bien ligeras (o inexistentes). Si son de una forma

                  o de otra, esto afecta la forma de un posible pico que presente la frecuen-
                  cia de los datos y de all´ısurgen interpretaciones de la curtosis como una
                  medida del tipo de pico de los datos. Estas interpretaciones est´an sujetas a
                  debate y por ahora no existe una interpretaci´on aceptada de manera general.
   57   58   59   60   61   62   63   64   65   66   67