В тази статия ще преминем през стъпките, необходими за изпълнение на a тест за хипотезаили тест за значимост за разликата от две пропорции на популацията. Това ни позволява да сравним две неизвестни пропорции и да заключим, ако те не са равни помежду си или ако едно е по-голямо от друго.
Преглед и предистория на теста на хипотезата
Преди да се впуснем в спецификата на нашия тест за хипотеза, ще разгледаме рамката на тестовете за хипотези. В тест за значимост се опитваме да покажем, че изявление относно стойността на едно население параметър (или понякога естеството на самото население) вероятно е вярно.
Събираме доказателства за това твърдение, като провеждаме a статистическа извадка. Изчисляваме статистика от тази извадка. Ценността на тази статистика е това, което използваме, за да определим истинността на първоначалното изявление. Този процес съдържа несигурност, но ние сме в състояние да оценим тази несигурност
Общият процес на тест за хипотеза е даден от списъка по-долу:
- Уверете се, че условията, необходими за нашия тест, са изпълнени.
- Ясно посочете нулеви и алтернативни хипотези. Алтернативната хипотеза може да включва едностранно или двустранно изпитване. Трябва също така да определим нивото на значимост, което ще бъде обозначено с гръцката буква алфа.
- Изчислете статистиката на теста. Типът статистика, който използваме, зависи от конкретния тест, който провеждаме. Изчислението се основава на нашата статистическа извадка.
- Изчислете р-стойност. Тестовата статистика може да бъде преведена в p-стойност. P-стойност е вероятността случайността сама да произведе стойността на нашата тестова статистика при предположението, че нулевата хипотеза е вярна. Общото правило е, че колкото по-малка е р-стойността, толкова по-големи са доказателствата срещу нулевата хипотеза.
- Направи заключение. Накрая използваме стойността на алфа, която вече беше избрана като прагова стойност. Правилото за решение е, че ако р-стойността е по-малка или равна на алфа, тогава отхвърляме нулевата хипотеза. Иначе ние не успее да отхвърли нулевата хипотеза.
Сега, когато видяхме рамката за тест за хипотеза, ще видим спецификата на теста за хипотеза за разликата от две пропорции на популацията.
Условията
Тестът за хипотеза за разликата на две пропорции на популацията изисква да бъдат изпълнени следните условия:
- Имаме две прости случайни проби от големи популации. Тук "голям" означава, че популацията е поне 20 пъти по-голяма от размера на извадката. Размерите на пробите ще бъдат обозначени с н1 и н2.
- Индивидите в нашите проби са избрани независимо една от друга. Самите популации също трябва да бъдат независими.
- Има и най-малко 10 успеха и 10 провала и в двете ни проби.
Докато тези условия са изпълнени, можем да продължим с нашия тест за хипотеза.
Нулевите и алтернативните хипотези
Сега трябва да разгледаме хипотезите за нашия тест за значимост. Нулевата хипотеза е нашето твърдение за никакъв ефект. В този конкретен тип тест за хипотези нашата нулева хипотеза е, че няма разлика между двете пропорции на популацията. Можем да напишем това като H0: р1 = р2.
Алтернативната хипотеза е една от трите възможности, в зависимост от спецификата на това, което тестваме:
- На: р1 е по-голяма от р2. Това е едностранно или едностранно изпитване.
- На: р1 е по-малко от р2. Това също е едностранно изпитване.
- На: р1 не е равно на р2. Това е двукратно или двустранен тест.
Както винаги, за да бъдем предпазливи, трябва да използваме двустранната алтернативна хипотеза, ако нямаме посока, преди да получим нашата извадка. Причината за това е, че е по-трудно да се отхвърли нулевата хипотеза с двустранен тест.
Трите хипотези могат да бъдат пренаписани, като се посочи как р1 - р2 е свързана със стойността нула. За да бъдем по-конкретни, нулевата хипотеза би станала H0:р1 - р2 = 0. Потенциалните алтернативни хипотези ще бъдат написани като:
- На: р1 - р2 > 0 е еквивалентно на израза "р1 е по-голяма от р2."
- На: р1 - р2 <0 е еквивалентно на израза "р1 е по-малко от р2."
- На: р1 - р2 ≠ 0 е еквивалентно на израза „р1 не е равно на р2."
Тази еквивалентна формулировка всъщност ни показва малко повече от това, което се случва зад кулисите. Това, което правим в този тест за хипотеза, е превръщането на двата параметъра р1 и р2 в единния параметър р1 - р2. След това тестваме този нов параметър спрямо стойността нула.
Тестовата статистика
Формулата за тестовата статистика е дадена на изображението по-горе. Следва обяснение на всеки от термините:
- Пробата от първата популация има размер н1. Броят на успехите от тази извадка (което не се вижда пряко във формулата по-горе) е к1.
- Пробата от втората популация има размер н2. Броят успехи от тази извадка е к2.
- Пропорциите на пробата са p1-hat = k1 / н1 и п2-то = к2 / н2 .
- След това комбинираме или обединяваме успехите от двете тези проби и получаваме: p-шапка = (k1 + к2) / ( н1 + n2).
Както винаги, бъдете внимателни с реда на операциите, когато изчислявате. Всичко под радикала трябва да се изчисли, преди да се вземе квадратният корен.
P-стойност
Следващата стъпка е да се изчисли р-стойността, която съответства на нашата тестова статистика. Ние използваме стандартна нормална дистрибуция за нашата статистика и се консултираме с таблица от стойности или използваме статистически софтуер.
Детайлите на нашето изчисление на p-стойност зависят от алтернативната хипотеза, която използваме:
- За На: р1 - р2 > 0, изчисляваме пропорцията на нормалното разпределение, която е по-голяма от Z.
- За На: р1 - р2 <0, изчисляваме пропорцията на нормалното разпределение, която е по-малка от Z.
- За На: р1 - р2 ≠ 0, изчисляваме пропорцията на нормалното разпределение, която е по-голяма от |Z|, абсолютната стойност на Z. След това, за да отчитаме факта, че имаме тест с две опашки, удвояваме пропорцията.
Правило за решение
Сега ние вземаме решение дали да отхвърлим нулевата хипотеза (и по този начин да приемем алтернативата) или да не отхвърлим нулевата хипотеза. Ние вземаме това решение, като сравняваме нашата p-стойност с нивото на значимост алфа.
- Ако р-стойността е по-малка или равна на алфа, тогава отхвърляме нулевата хипотеза. Това означава, че имаме статистически значим резултат и че ще приемем алтернативната хипотеза.
- Ако р-стойността е по-голяма от алфа, тогава ние не успяваме да отхвърлим нулевата хипотеза. Това не доказва, че нулевата хипотеза е вярна. Вместо това означава, че не сме получили достатъчно убедителни доказателства, за да отхвърлим нулевата хипотеза.
Специална бележка
Най- интервал на доверие за разликата от две пропорции на населението не обединява успехите, докато тестът за хипотезата прави. Причината за това е, че нашата нулева хипотеза предполага това р1 - р2 = 0. Интервалът на доверие не предполага това. Някои статистици не обединяват успехите на този тест за хипотеза и вместо това използват леко модифицирана версия на горната статистика на теста.