Интервал на доверие за пропорция на населението

Интервали на увереност може да се използва за оценка на няколко популации параметри. Един тип параметър, който може да бъде оценен с помощта инфекциозна статистика е част от населението. Например, може да искаме да знаем процентът на населението на САЩ, който подкрепя определен законодателен акт. За този тип въпроси трябва да намерим интервал на доверие.

В тази статия ще видим как да изградим интервал на доверие за част от населението и ще разгледаме част от теорията зад това.

Обща рамка

Започваме, като разглеждаме голямата картина, преди да навлезем в спецификата. Видът на доверителен интервал, който ще разгледаме, е от следната форма:

Изчислете +/- граница на грешка

Това означава, че има две числа, които ще трябва да определим. Тези стойности са оценка за желания параметър, заедно с граница на грешка.

условия

Преди провеждането на статистически тест или процедура е важно да се уверите, че всички условия са изпълнени. За интервал на доверие за част от населението, трябва да сме сигурни, че следното се отнася за:

instagram viewer

Ние имаме проста случайна извадка на размер н от голямо население
Нашите индивиди са избрани независимо един от друг.
В нашата извадка има поне 15 успеха и 15 провала.

Ако последният елемент не е удовлетворен, тогава е възможно да коригираме леко нашата извадка и да използваме a плюс четири интервала на доверие. По-нататък ще приемем, че всички горепосочени условия са изпълнени.

Проба и пропорция на населението

Започваме с приблизителната оценка на нашата част от населението. Точно както ние използваме примерна средна стойност, за да оценим средната популация, така и ние използваме примерна пропорция, за да оценим пропорцията на населението. Пропорцията на населението е неизвестен параметър. Пробната пропорция е статистическа. Тази статистика се открива чрез отчитане на броя на успехите в нашата извадка и след това разделяне на общия брой индивиди в извадката.

Пропорцията на населението се обозначава с р и се обяснява само. Обозначението за извадката е малко по-ангажирано. Означаваме примерна пропорция като p̂ и четем този символ като „p-hat“, защото прилича на буквата р с шапка отгоре.

Това става първата част от нашия доверителен интервал. Оценката на p е p̂.

Вземане на разпределение на пробна пропорция

За да определим формулата за границата на грешката, трябва да помислим за разпределение на извадката от p̂. Ще трябва да знаем средната стойност, стандартното отклонение и конкретното разпределение, с което работим.

Разборното разпределение на p̂ е биномиално разпределение с вероятност за успех р и н изпитвания. Този тип случайна променлива има средно р и стандартно отклонение на (р(1 - р)/н)^0.5. Има два проблема с това.

Първият проблем е, че биномичното разпределение може да бъде много сложно да се работи. Наличието на фабрики може да доведе до някои много големи числа. Тук условията ни помагат. Докато нашите условия са изпълнени, можем да преценим биномичното разпределение със стандартното нормално разпределение.

Вторият проблем е, че стандартното отклонение на p̂ използва р в нейното определение. Неизвестният параметър на популацията трябва да бъде оценен чрез използване на същия този параметър като граница на грешка. Това кръгово разсъждение е проблем, който трябва да бъде отстранен.

Изходът от тази главоблъсканица е да се замени стандартното отклонение със стандартната му грешка. Стандартните грешки се основават на статистически данни, а не на параметри. Стандартна грешка се използва за оценка на стандартно отклонение. Това, което прави тази стратегия полезна е, че вече не е необходимо да знаем стойността на параметъра стр.

формула

За да използваме стандартната грешка, заместваме неизвестния параметър р със статистическата p̂. Резултатът е следната формула за интервал на доверие за част от населението:

p̂ +/- Z * (p̂ (1 - p̂) /н)^0.5.

Тук стойността на Z * се определя от нашето ниво на увереност ° С. За стандартното нормално разпределение ° С процент от стандартното нормално разпределение е между -Z * и Z *. Общи стойности за Z * включват 1.645 за 90% увереност и 1.96 за 95% доверие.

пример

Нека да видим как работи този метод с пример. Да предположим, че искаме да знаем с 95% увереност процента на електората в графство, който се самоопределя като демократичен. Провеждаме обикновена случайна извадка от 100 души в този окръг и установяваме, че 64 от тях се идентифицират като демократ.

Виждаме, че всички условия са изпълнени. Оценката на нашето съотношение на населението е 64/100 = 0,64. Това е стойността на извадката пропорция p̂ и тя е центъра на нашия доверителен интервал.

Границата на грешка се състои от две части. Първият е Z*. Както казахме, за 95% увереност стойността на Z* = 1.96.

Другата част на допустимата грешка е дадена с формулата (p̂ (1 - p̂) /н)^0.5. Задаваме p̂ = 0.64 и изчисляваме = стандартната грешка да бъде (0.64 (0.36) / 100)^0.5 = 0.048.

Умножаваме тези две числа заедно и получаваме граница на грешка 0.09408. Крайният резултат е:

0.64 +/- 0.09408,

или можем да пренапишем това като 54.592% до 73.408%. По този начин ние сме 95% уверени, че истинската част от населението на демократите е някъде в диапазона на тези проценти. Това означава, че в дългосрочен план нашата техника и формула ще обхванат пропорцията на населението от 95% от времето.

Свързани идеи

Има редица идеи и теми, които са свързани с този тип интервал на доверие. Например, бихме могли да проведем тест на хипотеза, отнасящ се до стойността на пропорцията на населението. Бихме могли да сравним и две пропорции от две различни популации.