Как да намерите критични стойности с таблица Chi-Square

click fraud protection

Използването на статистически таблици е често срещана тема в много курсове по статистика. Въпреки че софтуерът прави изчисления, умението за четене на таблици все още е важно. Ще видим как да използваме таблица от стойности за хи-квадратно разпределение, за да определим критична стойност. Таблицата, която ще използваме е намиращи се тук, обаче, други квадратни таблици са съставени по начини, които са много подобни на тази.

Критична стойност

Използването на чи-квадратна таблица, която ще разгледаме, е да определим критична стойност. Критичните стойности са важни и при двете тестове за хипотеза и доверителни интервали. За тестовете на хипотези критичната стойност ни показва границата на това колко екстремна тестова статистика трябва да отхвърлим нулевата хипотеза. За интервалите на доверие критичната стойност е една от съставките, която влиза в изчисляването на граница на грешка.

За да определим критична стойност, трябва да знаем три неща:

  1. Броят на степените на свобода
  2. Броят и вида на опашките
  3. Нивото на значимост.
instagram viewer

Степени на свобода

Първият важен елемент е броят на степени на свобода. Този номер ни казва кой от счетливо безкрайно много много чи-квадратни разпределения, които трябва да използваме в нашия проблем. Начинът, по който определяме това число, зависи от точния проблем, който използваме хи-квадратно разпределение с. Следват три често срещани примера.

  • Ако правим a тест за годност, тогава броят на степените на свобода е един по-малък от броя на резултатите за нашия модел.
  • Ако изграждаме a интервал на доверие за вариация на популацията, тогава броят на степените на свобода е един по-малък от броя на стойностите в нашата извадка.
  • За хи-квадрат тест за независимост от две категорични променливи, имаме двупосочна таблица за непредвидени ситуации R редове и ° С колони. Броят на степените на свобода е (R - 1)(° С - 1).

В тази таблица броят на степените на свобода съответства на реда, който ще използваме.

Ако таблицата, с която работим, не показва точния брой степени на свобода, за които се нуждае проблемът ни, тогава съществува правило, което използваме. Закръгляме броя на степените на свободата до най-високата таблична стойност. Да предположим, че имаме 59 градуса свобода. Ако нашата таблица има само линии за 50 и 60 градуса свобода, тогава използваме линията с 50 градуса свобода.

тура

Следващото нещо, което трябва да вземем предвид, е броя и вида на опашките, които се използват. Чи-квадратното разпределение е изкривено вдясно и затова обикновено се използват едностранни тестове, включващи дясната опашка. Ако обаче изчисляваме двустранен доверителен интервал, тогава ще трябва да разгледаме a тест с две опашки с дясна и лява опашка в нашето хи-квадратно разпределение.

Ниво на увереност

Последната информация, която трябва да знаем, е нивото на увереност или значимост. Това е вероятност, която обикновено се обозначава с алфа. След това трябва да преведем тази вероятност (заедно с информацията относно нашите опашки) в правилната колона, която да използваме с нашата таблица. Много пъти тази стъпка зависи от това как е изградена нашата таблица.

пример

Например, ще разгледаме тест за годност за дванадесетстранна матрица. Нашата нулева хипотеза е, че всички страни са еднакво вероятни да бъдат навити и затова всяка страна има вероятност 1/12 да бъде навити. Тъй като има 12 резултата, има 12 -1 = 11 градуса на свобода. Това означава, че ще използваме реда, отбелязан с 11, за нашите изчисления.

Тестът за годност е тест с една опашка. Опашката, която използваме за това, е правилната опашка. Да предположим, че нивото на значимост е 0,05 = 5%. Това е вероятността в дясната опашка на разпределението. Нашата таблица е настроена за вероятност в лявата опашка. Така че вляво от нашата критична стойност трябва да бъде 1 - 0,05 = 0,95. Това означава, че използваме колоната, съответстваща на 0,95, и ред 11, за да дадем критична стойност от 19,675.

Ако статистиката на чи-квадрат, която изчисляваме от нашите данни, е по-голяма или равна на 19.675, тогава отхвърляме нулевата хипотеза с 5% значимост. Ако нашата статистика на чи-квадрат е по-малка от 19.675, тогава ние не успее да отхвърли нулевата хипотеза.

instagram story viewer