Page 82 - EI2019.pdf
P. 82

74                                      1.   An´ alisis exploratorio de datos



                           c)
                                25.3 28.2 31.4 27.1 30.4 25.0

                                23.9 24.5 23.1 29.4 28.2 28.1
                                27.4 26.8 25.2 30.5 29.7 28.4
                                31.7 29.3 28.5 29.8 30.2 27.6









                  Diagramas de caja y brazos



                  Esta es una forma gr´afica de representar algunas caracter´ısticas de un con-
                  junto de datos num´ericos. Esta representaci´on est´a compuesta por una caja
                  ypor un pardemarcas en dos extremos opuestosque asemejan brazos como

                  se muestra en la Figura 1.22 . A este tipo de gr´aficas se les conoce tambi´en
                  como diagramas de caja y bigotes, y por los t´erminos en ingl´es boxplots o
                  whiskers.Paradibujar estosdiagramas se necesitadeterminar cuatroele-
                  mentos: el centro de la caja, su altura y los tama˜nos de los brazos superior
                  einferior. Explicaremos dos manerasenlasquese puedendeterminarestos
                  par´ametros.



                  Para el ejemplo mostrado en la Figura 1.22, el centro de la caja es la media
                  ¯ x.Se extiendela cajauna desviaci´on est´andar s hacia arriba y otra desvia-
                  ci´on est´andar s hacia abajo. La caja tiene, por lo tanto, una altura de 2s
                  unidades. La marca del brazo superior es igual al m´aximo valor observado,
                  esto es, x    .Lamarca delbrazo inferioreselm´ınimo valor observado, es
                             pnq
                  decir, x p1q .En esta construcci´on, las longitudes de los brazos pueden ser
                  distintas.


                  De esta manera, un diagrama de caja y brazos, construido de la forma indi-
                  cada, es una forma de representar 4 descripciones num´ericas de un conjunto

                  de datos en un solo diagrama: el dato menor x             ,lamedia ¯x,la desviaci´on
                                                                         p1q
                  est´andar s, y el dato mayor x          .Sepueden colocar dos o m´as de estos
                                                       pnq
                  diagramas, uno junto al otro, a fin de comparar visualmente estas carac-
                  ter´ısticas en distintos conjunto de datos.
   77   78   79   80   81   82   83   84   85   86   87