Броят на степени на свобода независимостта на две категорични променливи се дава чрез проста формула: (R - 1)(° С - 1). Тук R е броят на редовете и ° С е броят на колоните в двупосочна маса от стойностите на категоричната променлива. Прочетете, за да научите повече по тази тема и да разберете защо тази формула дава правилното число.
Заден план
Една стъпка в процеса на много тестове за хипотеза е определянето на броя степени на свобода. Това число е важно, защото за вероятностни разпределения които включват семейство от разпределения, като хи-квадратното разпределение, броя на степените свободата определя точното разпределение от семейството, което трябва да използваме в нашата хипотеза тест.
Степените на свобода представляват броя на свободните избори, които можем да направим в дадена ситуация. Един от тестовете за хипотеза, който изисква да определим степените на свобода, е хи-квадрат тест за независимост за две категорични променливи.
Тестове за независимост и двупосочни таблици
Чи-квадратният тест за независимост изисква от нас да изградим двупосочна таблица, известна също като таблица за непредвидени ситуации. Този тип таблица има
R редове и ° С колони, представляващи R нива на една категорична променлива и ° С нива на другата категорична променлива. По този начин, ако не броим реда и колоната, в които записваме суми, има общо RC клетки в двупосочната таблица.Хи-квадратният тест за независимост ни позволява да тестваме хипотезата, че категоричен променливите са независими една от друга. Както споменахме по-горе R редове и ° С колоните в таблицата ни дават (R - 1)(° С - 1) степени на свобода. Но може да не е веднага ясно защо това е правилният брой степени на свобода.
Броят на степените на свободата
За да видите защо (R - 1)(° С - 1) е правилното число, ще разгледаме тази ситуация по-подробно. Да предположим, че знаем пределните суми за всяко от нивата на нашите категорични променливи. С други думи, ние знаем общото за всеки ред и общото за всяка колона. За първия ред има ° С колони в нашата таблица, така че има ° С клетки. След като знаем стойностите на всички, освен на една от тези клетки, тогава, тъй като знаем общия брой на всички клетки, е просто проблем с алгебрата да се определи стойността на останалата клетка. Ако попълвахме тези клетки от нашата таблица, бихме могли да влезем ° С - 1 от тях свободно, но след това останалата клетка се определя от общия брой на реда. Така има ° С - 1 градус свобода за първия ред.
Продължаваме по този начин за следващия ред и пак има ° С - 1 степен на свобода. Този процес продължава, докато стигнем до предпоследния ред. Всеки от редовете с изключение на последния допринася ° С - 1 градус свобода към общото. По времето, когато имаме всички, освен последния ред, тогава, тъй като знаем сумата на колоните, можем да определим всички записи на крайния ред. Това ни дава R - 1 ред с ° С - 1 градус свобода във всяка от тях, за общо (R - 1)(° С - 1) степени на свобода.
пример
Виждаме това със следния пример. Да предположим, че имаме двупосочна таблица с две категорични променливи. Едната променлива има три нива, а другата има две. Освен това, да предположим, че знаем общата стойност на реда и колоните за тази таблица:
Ниво А | Ниво Б | Обща сума | |
Ниво 1 | 100 | ||
Ниво 2 | 200 | ||
Ниво 3 | 300 | ||
Обща сума | 200 | 400 | 600 |
Формулата предвижда, че има (3-1) (2-1) = 2 степени на свобода. Ние виждаме това по следния начин. Да предположим, че попълваме горната лява клетка с числото 80. Това автоматично ще определи целия първи ред записи:
Ниво А | Ниво Б | Обща сума | |
Ниво 1 | 80 | 20 | 100 |
Ниво 2 | 200 | ||
Ниво 3 | 300 | ||
Обща сума | 200 | 400 | 600 |
Сега ако знаем, че първият запис във втория ред е 50, тогава се попълва останалата част от таблицата, защото знаем общата стойност на всеки ред и колона:
Ниво А | Ниво Б | Обща сума | |
Ниво 1 | 80 | 20 | 100 |
Ниво 2 | 50 | 150 | 200 |
Ниво 3 | 70 | 230 | 300 |
Обща сума | 200 | 400 | 600 |
Таблицата е изцяло попълнена, но имахме само два безплатни избора. След като бяха известни тези стойности, останалата част от таблицата беше напълно определена.
Въпреки че обикновено не е необходимо да знаем защо има толкова много степени на свобода, добре е да знаем, че всъщност просто прилагаме концепцията за степените на свобода в нова ситуация.