Най- стандартно отклонение на извадката е описателна статистика, която измерва разпространението на количествен набор от данни. Това число може да бъде всяко неотрицателно реално число. Тъй като нулата е неотрицателна реално число, струва си да попитаме: „Кога стандартното отклонение на извадката ще бъде равно на нула?“ Това се случва в много специалния и крайно необичаен случай, когато всички наши стойности на данните са абсолютно еднакви. Ще проучим причините защо.
Описание на стандартното отклонение
Два важни въпроса, на които обикновено искаме да отговорим относно набор от данни, включват:
- Какъв е центърът на набора от данни?
- Колко разпространен е набор от данни?
Има различни измервания, наречени описателна статистика, които отговарят на тези въпроси. Например центърът на данните, известен още като средно аритметично, може да се опише по отношение на средната, средната или режима. Могат да се използват и други статистически данни, които са по-малко известни, като например midhinge или тримесеца.
За разпространението на нашите данни бихме могли да използваме диапазона, интерквартирна гама или стандартното отклонение. Стандартното отклонение е сдвоено със средната стойност за количествено определяне на разпространението на нашите данни. След това можем да използваме този номер за сравняване на множество набори от данни. Колкото по-голямо е нашето стандартно отклонение, толкова по-голямо е разпространението.
интуиция
Затова нека разгледаме от това описание какво би означавало да има стандартно отклонение от нула. Това би означавало, че в нашия набор от данни изобщо няма разпространение. Всички стойности на отделните данни ще бъдат обединени в една и съща стойност. Тъй като би имало само една стойност, която нашите данни биха могли да имат, тази стойност ще представлява средната стойност на нашата извадка.
В тази ситуация, когато всички наши стойности на данните са еднакви, няма да има никаква промяна. Интуитивно има смисъл стандартното отклонение на такъв набор от данни да е нула.
Математическо доказателство
Стандартното отклонение на извадката се определя с формула. Така че всяко твърдение като това по-горе трябва да се докаже с помощта на тази формула. Започваме с набор от данни, който отговаря на описанието по-горе: всички стойности са идентични и има н стойности, равни на х.
Изчисляваме средната стойност на този набор от данни и виждаме, че е
х = (х + х +... + х)/н = NX/н = х.
Сега, когато изчисляваме отделните отклонения от средната стойност, виждаме, че всички тези отклонения са нула. Следователно, дисперсията, а също и стандартното отклонение и двете също са равни на нула.
Необходими и достатъчни
Виждаме, че ако наборът от данни не показва промяна, то стандартното му отклонение е нула. Може да попитаме дали антоним от това твърдение също е вярно. За да видим дали е, ще използваме отново формулата за стандартно отклонение. Този път обаче ще зададем стандартното отклонение, равно на нула. Няма да правим предположения за нашия набор от данни, но ще видим каква настройка с = 0 предполага
Да предположим, че стандартното отклонение на набор от данни е равно на нула. Това означава, че пробата на пробата с2 също е равно на нула. Резултатът е уравнението:
0 = (1/(н - 1)) ∑ (хаз - х )2
Умножаваме и двете страни на уравнението по н - 1 и вижте, че сумата от отклоненията в квадрат е равна на нула. Тъй като ние работим с реални числа, единственият начин това да се случи е всяко едно отклонения в квадрат да е равно на нула. Това означава, че за всеки аз, терминът (хаз - х )2 = 0.
Сега вземаме квадратния корен от горното уравнение и виждаме, че всяко отклонение от средната стойност трябва да е равно на нула. Тъй като за всички аз,
хаз - х = 0
Това означава, че всяка стойност на данните е равна на средната. Този резултат заедно с този по-горе ни позволява да кажем, че стандартното отклонение на извадката от набор от данни е нула, ако и само ако всичките му стойности са идентични.