Пример за интервал на доверие за отклонение

Отклонението в популацията показва индикация как се разпространява набор от данни. За съжаление, обикновено е невъзможно да се знае точно какъв е този параметър на популацията. За да компенсираме липсата на познания, използваме тема от инфекциозната статистика, наречена доверителни интервали. Ще видим пример как да изчислим интервал на доверие за отклонение от популацията.

Формула за увереност на интервал

Формулата за (1 - α) интервал на доверие относно отклонението на популацията. Дава се от следния низ от неравенства:

[ (н - 1)с2] / B < σ2 < [ (н - 1)с2] / А.

Тук н е размерът на извадката, с2 е дисперсията на извадката. Броя А е точката на хи-квадратното разпределение с н -1 градуса на свобода, при който точно α / 2 от областта под кривата е вляво от А. По подобен начин числото B е точката на същото хи-квадратно разпределение с точно α / 2 на площта под кривата вдясно от B.

Предварителен

Започваме с набор от данни с 10 стойности. Този набор от стойности на данни е получен от обикновена произволна извадка:

instagram viewer

97, 75, 124, 106, 120, 131, 94, 97,96, 102

Ще бъде необходим някои проучвателни анализи на данни, за да се покаже, че няма остатъчни хора. Чрез изграждането на a стъбло и лист парцел виждаме, че тези данни вероятно са от разпространение, което е приблизително нормално разпределено. Това означава, че можем да продължим с намирането на 95% интервал на доверие за отклонението в популацията.

Вариант на пробата

Трябва да оценим отклонението на популацията с дисперсията на извадката, обозначена с с2. Така че започваме с изчисляването на тази статистика. По същество ние усредняваме сума от квадратните отклонения от средното. Но вместо да разделяме тази сума с н разделяме го по н - 1.

Откриваме, че средната проба е 104,2. Използвайки това, имаме сумата от квадратни отклонения от средната стойност, дадена от:

(97 – 104.2)2 + (75 – 104.3)2 +... + (96 – 104.2)2 + (102 – 104.2)2 = 2495.6

Разделяме тази сума на 10 - 1 = 9, за да получим пробна дисперсия от 277.

Chi-Square разпределение

Сега се обръщаме към нашето чи-квадратно разпределение. Тъй като имаме 10 стойности на данни, имаме 9 степени на свобода. Тъй като искаме средната 95% от нашата дистрибуция, имаме нужда от 2,5% във всяко от двете опашки. Консултираме се с чи-квадратна таблица или софтуер и виждаме, че стойностите на таблицата от 2.7004 и 19.023 обхващат 95% от площта на разпространението. Тези числа са А и Bсъответно.

Сега имаме всичко, от което се нуждаем, и сме готови да сглобим нашия интервал на доверие. Формулата за лявата крайна точка е [(н - 1)с2] / B. Това означава, че лявата ни крайна точка е:

(9 х 277) /19.023 = 133

Правилната крайна точка се намира чрез замяна B с А:

(9 х 277) /2.7004 = 923

И така ние сме 95% уверени, че различието в населението е между 133 и 923.

Стандартно отклонение на населението

Разбира се, тъй като стандартното отклонение е квадратният корен на дисперсията, този метод може да се използва за изграждане на доверителен интервал за стандартното отклонение на популацията. Всичко, което би трябвало да направим, е да вземем квадратни корени на крайните точки. Резултатът ще бъде 95% доверителен интервал за стандартно отклонение.