Първият и третият квантил са описателна статистика, която е измерване на позицията в набор от данни. Подобно на това как медианата обозначава средната точка на набор от данни, първата четвъртина отбелязва четвърт или 25% точка. Приблизително 25% от стойностите на данните са по-малки или равни на първата четвърт. Третият квартал е подобен, но за горните 25% от стойностите на данните. Ще разгледаме тези идеи по-подробно в следващото.
Медианата
Има няколко начина за измерване на център на набор от данни. Средната, средната стойност, режимът и средният диапазон имат своите предимства и ограничения в изразяването на средата на данните. От всички тези начини да намерите средното, Медиана е най-устойчивият на външни хора. Той отбелязва средата на данните в смисъл, че половината от данните е по-малка от средната.
Първият Квартил
Няма причина да спираме да намираме само средата. Ами ако решим да продължим този процес? Бихме могли да изчислим средната стойност на долната половина на нашите данни. Едната половина от 50% е 25%. Така половината от половината или една четвърт от данните ще бъдат под това. Тъй като имаме работа с една четвърт от първоначалния набор, тази медиана на долната половина на данните се нарича първи кватил и се обозначава с
Q1.Третият Квартил
Няма причина да разгледаме долната половина на данните. Вместо това можехме да разгледаме горната половина и да извършим същите стъпки като горе. Медианата на тази половина, която ще обозначим с Q3 също разделя набора от данни на четвъртинки. Това число обаче означава горната една четвърт от данните. Така три четвърти от данните са под нашия брой Q3. Ето защо призоваваме Q3 третия квартал.
Пример
За да поясним всичко това, нека разгледаме пример. Може да е полезно първо да прегледате как да изчислите медианата на някои данни. Започнете със следния набор от данни:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20
В комплекта има общо двадесет точки от данни. Започваме с намирането на медианата. Тъй като има четен брой стойности на данните, средната е средната стойност на десетата и единадесетата стойности. С други думи, медианата е:
(7 + 8)/2 = 7.5.
Сега погледнете долната половина на данните. Медианата на тази половина се намира между петата и шестата стойност на:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7
По този начин се оказва, че първата четвъртина е равна Q1 = (4 + 6)/2 = 5
За да намерите третия квартал, погледнете горната половина на оригиналния набор от данни. Трябва да намерим средната стойност на:
8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Тук медианата е (15 + 15) / 2 = 15. По този начин третият квартал Q3 = 15.
Интерквартирен обхват и пет броя обобщение
Квартилите помагат да ни дадат по-пълна картина на нашия набор от данни като цяло. Първият и третият квантил ни дават информация за вътрешната структура на нашите данни. Средната половина на данните попада между първия и третия кватил и е съсредоточена върху медианата. Разликата между първия и третия квантил, наречен the интерквартирна гама, показва как са подредени данните за медианата. Малък интерквартирен диапазон показва данни, които са сбити около медианата. По-голям интерквартирен диапазон показва, че данните са по-разпространени.
По-подробна картина на данните може да се получи, като се знае най-високата стойност, наречена максимална стойност, и най-ниската стойност, наречена минимална стойност. Минималният, първият квантил, средната, третата четвъртина и максималният са набор от пет стойности, наречени " резюме на пет числа. Ефективен начин за показване на тези пет числа се нарича a boxplot или графа с кутия и мустаци.