Степени на свобода за независимост в двупосочна таблица

Броят на степени на свобода независимостта на две категорични променливи се дава чрез проста формула: (R - 1)(° С - 1). Тук R е броят на редовете и ° С е броят на колоните в двупосочна маса от стойностите на категоричната променлива. Прочетете, за да научите повече по тази тема и да разберете защо тази формула дава правилното число.

Заден план

Една стъпка в процеса на много тестове за хипотеза е определянето на броя степени на свобода. Това число е важно, защото за вероятностни разпределения които включват семейство от разпределения, като хи-квадратното разпределение, броя на степените свободата определя точното разпределение от семейството, което трябва да използваме в нашата хипотеза тест.

Степените на свобода представляват броя на свободните избори, които можем да направим в дадена ситуация. Един от тестовете за хипотеза, който изисква да определим степените на свобода, е хи-квадрат тест за независимост за две категорични променливи.

Тестове за независимост и двупосочни таблици

Чи-квадратният тест за независимост изисква от нас да изградим двупосочна таблица, известна също като таблица за непредвидени ситуации. Този тип таблица има

instagram viewer
R редове и ° С колони, представляващи R нива на една категорична променлива и ° С нива на другата категорична променлива. По този начин, ако не броим реда и колоната, в които записваме суми, има общо RC клетки в двупосочната таблица.

Хи-квадратният тест за независимост ни позволява да тестваме хипотезата, че категоричен променливите са независими една от друга. Както споменахме по-горе R редове и ° С колоните в таблицата ни дават (R - 1)(° С - 1) степени на свобода. Но може да не е веднага ясно защо това е правилният брой степени на свобода.

Броят на степените на свободата

За да видите защо (R - 1)(° С - 1) е правилното число, ще разгледаме тази ситуация по-подробно. Да предположим, че знаем пределните суми за всяко от нивата на нашите категорични променливи. С други думи, ние знаем общото за всеки ред и общото за всяка колона. За първия ред има ° С колони в нашата таблица, така че има ° С клетки. След като знаем стойностите на всички, освен на една от тези клетки, тогава, тъй като знаем общия брой на всички клетки, е просто проблем с алгебрата да се определи стойността на останалата клетка. Ако попълвахме тези клетки от нашата таблица, бихме могли да влезем ° С - 1 от тях свободно, но след това останалата клетка се определя от общия брой на реда. Така има ° С - 1 градус свобода за първия ред.

Продължаваме по този начин за следващия ред и пак има ° С - 1 степен на свобода. Този процес продължава, докато стигнем до предпоследния ред. Всеки от редовете с изключение на последния допринася ° С - 1 градус свобода към общото. По времето, когато имаме всички, освен последния ред, тогава, тъй като знаем сумата на колоните, можем да определим всички записи на крайния ред. Това ни дава R - 1 ред с ° С - 1 градус свобода във всяка от тях, за общо (R - 1)(° С - 1) степени на свобода.

пример

Виждаме това със следния пример. Да предположим, че имаме двупосочна таблица с две категорични променливи. Едната променлива има три нива, а другата има две. Освен това, да предположим, че знаем общата стойност на реда и колоните за тази таблица:

Ниво А Ниво Б Обща сума
Ниво 1 100
Ниво 2 200
Ниво 3 300
Обща сума 200 400 600

Формулата предвижда, че има (3-1) (2-1) = 2 степени на свобода. Ние виждаме това по следния начин. Да предположим, че попълваме горната лява клетка с числото 80. Това автоматично ще определи целия първи ред записи:

Ниво А Ниво Б Обща сума
Ниво 1 80 20 100
Ниво 2 200
Ниво 3 300
Обща сума 200 400 600

Сега ако знаем, че първият запис във втория ред е 50, тогава се попълва останалата част от таблицата, защото знаем общата стойност на всеки ред и колона:

Ниво А Ниво Б Обща сума
Ниво 1 80 20 100
Ниво 2 50 150 200
Ниво 3 70 230 300
Обща сума 200 400 600

Таблицата е изцяло попълнена, но имахме само два безплатни избора. След като бяха известни тези стойности, останалата част от таблицата беше напълно определена.

Въпреки че обикновено не е необходимо да знаем защо има толкова много степени на свобода, добре е да знаем, че всъщност просто прилагаме концепцията за степените на свобода в нова ситуация.

instagram story viewer