Boxplots получават името си от това, което приличат. Те понякога се наричат парцели за кутии и мустаци. Тези типове графики се използват за показване на диапазона, Медиана, и квартили. Когато те са попълнени, кутия съдържа първи и трети квартил. Уискирите се простират от полето до минималните и максималните стойности на данните.
Следващите страници ще покажат как да направите полета за набор от данни с минимум 20, първи квантил 25, средна 32, трета четвъртина 35 и максимум 43.
Начертайте пет вертикални линии над числовата линия, по една за всяка от стойностите на минимума, първи квартал, средна, трета четворка и максимум. Обикновено линиите за минимум и максимум са по-къси от линиите за кватилилите и медианата.
За нашите данни минимумът е 20, първият кватил е 25, медианата е 32, третата четирия е 35, а максималната е 43. Линиите, съответстващи на тези стойности, са изчертани по-горе.
След това ние нарисуваме кутия и използваме някои от линиите, за да ни ръководят. Първият квартал е лявата страна на нашата кутия. Третият квартал е дясната страна на нашата кутия. Медианата попада навсякъде в кутията.
По дефиницията на първия и третия четвърт, половината от всички стойности на данните се съдържат в полето.
Сега виждаме как графа с кутия и мустаци получава втората част от името си. Уискирите са привлечени, за да демонстрират обхвата на данните. Начертайте хоризонтална линия от линията за минимум към лявата страна на кутията в първия четвърт. Това е едно от нашите мустаци. Начертайте втора хоризонтална линия от страната на правата на полето в третия квартал до линията, представляваща максимума на данните. Това е вторият ни мустак.
Нашата графа за кутии и мустаци, или boxplot, вече е пълна. С един поглед можем да определим обхвата на стойностите на данните и степента до това колко е събрано всичко. Следващата стъпка показва как можем да сравним и сравним две карета.
Графиките на кутиите и мустаците показват обобщението на пет числа на набор от данни. По този начин могат да се сравнят два различни набора от данни, като се разгледат заедно техните каси. Над вторият боксер е изтеглен над този, който сме конструирали.
Има няколко функции, които заслужават да бъдат споменати. Първият е, че медианите и на двата набора от данни са идентични. Вертикалната линия вътре в двете кутии е на едно и също място в числовата линия. Второто нещо, което трябва да се отбележи за графиките с две кутии и мустаци, е, че горната графика не е толкова разперена в долната. Горната кутия е по-малка, а мустаците не се простират толкова далеч.
Начертаването на две полета над една и съща цифрова линия предполага, че данните зад всеки заслужават да бъдат сравнени. Не би имало смисъл да сравняваме кутия с височина на третокласници с тежести на кучета в местен приют. Въпреки че и двете съдържат данни в съотношението ниво на измерване, няма причина да се сравняват данните.
От друга страна, би имало смисъл да се сравняват боксплотите от височините на третокласници, ако един сюжет представляваше данните от момчетата в училище, а другият сюжет представляваше данните от момичетата в училището.