Обхватът от статистически набори от данни

В статистиката и математиката диапазонът е разликата между максималните и минималните стойности на набор от данни и служи като една от двете важни характеристики на набор от данни. Формулата за диапазон е максималната стойност минус минималната стойност в набора от данни, което осигурява на статистиците по-добро разбиране на това колко разнообразен е наборът от данни.

Две важни характеристики на набор от данни включват центъра на данните и разпространението на данните и центърът може да бъдеизмервани по много начини: най-популярните от тях са средните, Медиана, режим и среден диапазон, но по подобен начин има различни начини да се изчисли колко е разпространен наборът от данни и най-лесната и груба мярка за разпространение се нарича диапазон.

Изчисляването на обхвата е много ясно. Всичко, което трябва да направим, е да намерим разликата между най-голямата стойност на данните в нашия набор и най-малката стойност на данните. Създадени кратко, имаме следната формула: Диапазон = Максимална стойност - Минимална стойност. Например, наборът от данни 4,6,10, 15, 18 има максимум 18, минимум 4 и диапазон от

instagram viewer
18-4 = 14.

Диапазонът е много грубо измерване на разпространението на данни, тъй като е изключително чувствителен към външните хора и в резултат на това има определени ограничения на полезността на истински диапазон от набор от данни за статистици, тъй като една единствена стойност може да повлияе значително на стойността на диапазон.

Например, помислете за набора от данни 1, 2, 3, 4, 6, 7, 7, 8. Максималната стойност е 8, минималната 1, а диапазонът - 7. След това помислете за един и същ набор от данни, само с включена стойност 100. Сега диапазонът става 100-1 = 99 при което добавянето на една допълнителна точка от данни значително повлия на стойността на диапазона. Стандартното отклонение е друга мярка за разпространение, която е по-малко податлива на външни хора, но недостатъкът е, че изчисляване на стандартното отклонение е много по-сложно.

Диапазонът също не ни казва нищо за вътрешните характеристики на нашия набор от данни. Например, ние считаме набора от данни 1, 1, 2, 3, 4, 5, 5, 6, 7, 8, 8, 10, където обхватът за този набор от данни е 10-1 = 9. Ако след това сравним това с набора от данни 1, 1, 1, 2, 9, 9, 9, 10. Тук обхватът отново е девет, но за този втори набор и за разлика от първия набор, данните са групирани около минималния и максималния. Други статистически данни, като първо и трето тримесечие, трябва да бъдат използвани за откриване на част от тази вътрешна структура.

Диапазонът е добър начин да получите много основно разбиране за това как наистина са разпределени числата в набора от данни, защото е лесно изчислете, тъй като изисква само основна аритметична операция, но има и няколко други приложения от обхвата на набор от данни в статистика.

Диапазонът може да се използва и за оценка на друга мярка за разпространение, стандартното отклонение. Вместо да преминем през доста сложна формула, за да намерим стандартното отклонение, вместо това можем да използваме това, което се нарича правило за обхват. Диапазонът е основен при това изчисление.

Диапазонът се среща и в a boxplotили заговор за кутия и мустаци. Максималните и минималните стойности са обозначени в края на мустаците на графиката, а общата дължина на мустаците и полето е равна на диапазона.

instagram story viewer