Boxplot
Diagrama Boxplot ofera informatii privind tendinta centrala si forma distributiei studiate.O diagrama de tip Boxplot reflecta grafic rezumarea prin cele 5 valori ale unei distributii: valoarea minima, prima quartila, mediana , a treia quartila si valoarea maxima.Graficul va prezenta deasemeni si valorile aberante sau valori situate mult in afara distributiei. - Xmin Valoarea minima denumita si percentila 0 este cea mai mica valoare observata din sirul de valori,exceptind valorile aberante. (Percentila este valoarea unei variabile sub care se incadreaza(„cade’) un anumit procent din obsevatii. De exemplu,percentila 20 este valaorea sub care pot fi gasite 20% din observatii.[ "Engineering Statistics Handbook : Percentile” NIST] ) - Q1 Quartila inferioara delimiteaza cele mai mici 25% din valorile observate. (Quartila este oricare din cele 3 valori care divid datele sortate in patru parti egale,deci fiecare parte reprezentind o patrime din populatie [Freund, J. and Perles, B. "A New Look at Quartiles of Ungrouped Data." American Stat. 41, 200-203, 1987..] ) - Me Mediana delimiteaza 50% din valori(intervalul cuprins intre cea mai mica valoare observata si mediana contine 50% din valorile observate,iar intervalul cuprins intre valoarea mediana si cea mai mare valoare observata contine celelate 50% din valorile observate) .
-Q3 Quartila superioara delimiteaza cele mai mari 25% din valorile observate.
-Xmax Valoarea maxima denumita si a 100-a percentila este cea mai mare valoare observata,exceptind valorile aberante. -Intervalul dintre quartile IQR este intervalul cuprins intre Q3 si Q1.
IQR=Q3-Q1
-Valoarile aberante (outliers) sunt considerate valorile mai mari decat Q3+1,5IQR sau valori mai mici decat Q1-1,5IQR Intervalul IQR este reprezentat grafic printr-un dreptunghi(„cutie”). In interiorul sau se afala mediana reprezentata grafic prin o linie orizontala.Intervalele ( Xmin , Q1) si ( Q3 , Xmax) sunt reprezentate de cate o linie(„mustata”) trasata in continuarea dreptunghiului. Valorile aberante sunt reprezentate prin „* ”
Reprezentarea grafica poate fi orizontala sau vericala,semnificatiile termenilor ramanind aceleasi.O reprezentare grafica este in figura 1.24
Fig 1.24 Diagrama Box Plot