Стандартното отклонение и обхватът са и двете мерки на разпространение на набор от данни. Всяко число ни казва по свой начин колко раздалечени са данните, тъй като и двете са мярка за промяна. Въпреки че няма изрична връзка между обхват и стандартно отклонение, има правило за палеца Това може да бъде полезно за свързване на тези две статистически данни. Тази връзка понякога се нарича правило за обхват за стандартно отклонение.
Правилото за обхват ни казва, че стандартното отклонение на пробата е приблизително равно на една четвърт от обхвата на данните. С други думис = (Максимален - Минимален) / 4. Това е много проста формула за използване и трябва да се използва само като много груба оценка на стандартното отклонение.
Пример
За да видите пример за това как работи правилото за диапазон, ще разгледаме следния пример. Да предположим, че започваме със стойностите на данните от 12, 12, 14, 15, 16, 18, 18, 20, 20, 25. Тези стойности имат a означава от 17 и стандартно отклонение от около 4.1. Ако вместо това първо изчислим обхвата на нашите данни като 25 - 12 = 13 и след това разделим това число на четири, ние оценяваме стандартното отклонение като 13/4 = 3.25. Това число е относително близко до истинското стандартно отклонение и е добро за груба оценка.
Защо работи?
Може да изглежда, че правилото за обхват е малко странно. Защо работи? Не изглежда ли напълно произволно да разделите обхвата на четири? Защо не бихме разделили на различно число? Всъщност има някаква математическа обосновка, която се случва зад кулисите.
Спомнете си свойствата на крива на звънеца и вероятностите от a стандартно нормално разпределение. Една характеристика е свързана с количеството данни, което попада в определен брой стандартни отклонения:
- Приблизително 68% от данните са в рамките на едно стандартно отклонение (по-високо или по-ниско) от средната стойност.
- Приблизително 95% от данните са в две стандартни отклонения (по-високи или по-ниски) от средната стойност.
- Приблизително 99% е в рамките на три стандартни отклонения (по-високи или по-ниски) от средната стойност.
Броят, който ще използваме, е свързан с 95%. Можем да кажем, че 95% от две стандартни отклонения под средната стойност до две стандартни отклонения над средната стойност, имаме 95% от нашите данни. По този начин почти цялото ни нормално разпределение ще се простира върху линеен сегмент, който е дълъг общо четири стандартни отклонения.
Обикновено не всички данни са разпределени и имат оформена крива на звънеца. Но повечето данни са достатъчно добре поведени, че преминаването на две стандартни отклонения от средната стойност улавя почти всички данни. Ние оценяваме и казваме, че четири стандартни отклонения са приблизително размера на диапазона и затова диапазонът, разделен на четири, е грубо сближаване на стандартното отклонение.
Използва се за правилото на обхвата
Правилото за обхват е полезно в редица настройки. Първо, това е много бърза оценка на стандартното отклонение. Стандартното отклонение изисква първо да намерим средната стойност, след което да я извадим от всяка точка на данни, квадрат разликите, добавете тези, разделете с една по-малка от броя точки на данни, след което (най-накрая) вземете квадрата корен. От друга страна, правилото за обхват изисква само едно изваждане и едно деление.
Други места, където правилото за обхват е полезно, е когато имаме непълна информация. Формули като тази за определяне на размера на извадката изискват три информации: желаната граница на грешка, the ниво на увереност и стандартното отклонение на населението, което изследваме. Много пъти е невъзможно да се знае какво е населението стандартно отклонение е. С правилото за обхват можем да оценим тази статистика и тогава да знаем колко голяма трябва да направим нашата извадка.