Тип I срещу Грешки тип II при тестване на хипотези

Статистическата практика на тестване на хипотези е широко разпространен не само в статистиката, но и в природните и социалните науки. Когато ние провеждане на хипотеза тествайте там няколко неща, които могат да се объркат. Има два вида грешки, които по дизайн не могат да бъдат избегнати и трябва да сме наясно, че тези грешки съществуват. На грешките се дават доста пешеходни имена от грешки тип I и тип II. Какво представляват грешките от тип I и тип II и как ги различаваме? Накратко:

  • Грешки от тип I се случват, когато отхвърлим вярно нулева хипотеза
  • Грешки от тип II се случват, когато не успеем да отхвърлим невярна нулева хипотеза

Ще проучим повече предистория зад тези видове грешки с цел да разберем тези твърдения.

Тестване на хипотези

Процесът на тестване на хипотези може да изглежда доста разнообразен с множество тестови статистики. Но общият процес е същият. Тестване на хипотези включва изказването на нулева хипотеза и избора на a ниво на значимост. Нулевата хипотеза е или вярна или невярна и представлява претенцията по подразбиране за лечение или процедура. Например, когато се изследва ефективността на дадено лекарство, нулевата хипотеза би била, че лекарството няма ефект върху заболяване.

instagram viewer

След формулирането на нулевата хипотеза и избора на ниво на значимост, ние получаваме данни чрез наблюдение. Статистически изчисления кажете ни дали трябва да отхвърлим нулевата хипотеза.

В идеален свят винаги бихме отхвърлили нулевата хипотеза, когато е невярна, и не бихме отхвърлили нулевата хипотеза, когато тя наистина е вярна. Но са възможни два други сценария, всеки от които ще доведе до грешка.

Грешка тип I

Първият вид грешка, който е възможен, включва отхвърляне на нулева хипотеза, която всъщност е вярна. Този вид грешка се нарича грешка тип I и понякога се нарича грешка от първи вид.

Грешките от тип I са еквивалентни на невярно положителни. Да се ​​върнем към примера на лекарство, което се използва за лечение на болест. Ако отхвърлим нулевата хипотеза в тази ситуация, тогава твърдението ни е, че лекарството всъщност има някакъв ефект върху заболяване. Но ако нулевата хипотеза е вярна, тогава в действителност лекарството изобщо не се бори с болестта. За лекарството се твърди, че има положителен ефект върху заболяване.

Грешки от тип I могат да бъдат контролирани. Стойността на алфа, която е свързана с ниво на значимост че избраните от нас имат пряко отношение към грешки от тип I. Алфа е максималната вероятност да имаме грешка тип I. За 95% ниво на доверие, стойност на алфа е 0,05. Това означава, че има 5% вероятност да отхвърлим истинска нулева хипотеза. В дългосрочен план един от всеки двадесет теста на хипотези, които извършваме на това ниво, ще доведе до грешка от тип I.

Грешка тип II

Другият вид грешка, която е възможна, се появява, когато не отхвърляме нулева хипотеза, която е невярна. Този вид грешка се нарича грешка тип II и също се нарича грешка от втори вид.

Грешките от тип II са еквивалентни на фалшиви негативи. Ако се върнем отново към сценария, в който тестваме лекарство, как би изглеждала грешка от тип II? Възникна грешка от тип II, ако приемем, че лекарството няма ефект върху заболяване, но в действителност го направи.

Вероятността за грешка тип II се дава от гръцката буква бета. Това число е свързано със силата или чувствителността на теста на хипотезата, обозначено с 1 - бета.

Как да избегнем грешки

Грешки тип I и тип II са част от процеса на тестване на хипотези. Въпреки че грешките не могат да бъдат елиминирани напълно, можем да сведем до минимум един вид грешки.

Обикновено когато се опитаме да намалим вероятността един тип грешка, вероятността за другия тип се увеличава. Бихме могли да намалим стойността на алфа от 0,05 до 0,01, което съответства на 99% ниво на увереност. Ако обаче всичко останало е същото, вероятността за грешка от тип II почти винаги ще се увеличи.

Много пъти приложението на нашия тест за хипотеза в реалния свят ще определи дали повече приемаме грешки от тип I или тип II. Това ще бъде използвано, когато проектираме нашия статистически експеримент.

instagram story viewer