Една от целите на статистиката е подреждането на данни по смислен начин. Двупосочните таблици са важен начин за организиране на определен тип сдвоени данни. Както при изграждането на всякакви графики или таблици в статистиката, много е важно да знаем видовете променливи, с които работим. Ако имаме количествени данни, тогава графика като a хистограма или стъбло и лист парцел трябва да се използва. Ако имаме категорични данни, тогава лентова графика или кръгова диаграма е подходящо.
Когато работим с сдвоени данни, трябва да сме внимателни. Съществува разпръсквач за сдвоени количествени данни, но какъв вид графика има за сдвоени категоричен данни? Всеки път, когато имаме две категорични променливи, тогава трябва да използваме двупосочна таблица.
Описание на двупосочна таблица
Първо, припомняме, че категоричните данни се отнасят до черти или до категории. Тя не е количествена и няма числови стойности.
Двупосочна таблица включва изброяване на всички стойности или нива за две категорични променливи. Всички стойности за една от променливите са посочени във вертикална колона. Стойностите за другата променлива са посочени по хоризонтален ред. Ако първата променлива има
m стойности и втората променлива има н стойности, тогава ще има общо млн записи в таблицата. Всеки от тези записи съответства на определена стойност за всяка от двете променливи.Покрай всеки ред и по дължината на всяка колона записите се сумират. Тези суми са важни при определяне на пределни и условни разпределения. Тези суми също са важни, когато провеждаме хи-квадрат тест за независимост.
Пример за двупосочна таблица
Например, ще разгледаме ситуация, в която разглеждаме няколко раздела на курс по статистика в университет. Искаме да изградим двупосочна таблица, за да определим какви разлики, ако има такива, има между мъжете и жените в курса. За да постигнем това, броим броя на всяка степен от букви, спечелена от членове от всеки пол.
Отбелязваме, че първата категорична променлива е тази на пола и има две възможни стойности при изследването на мъжки и женски пол. Втората категорична променлива е тази на буквата и има пет стойности, които се дават от A, B, C, D и F. Това означава, че ще разполагаме с двупосочна таблица с 2 x 5 = 10 записа, плюс допълнителен ред и допълнителна колона, които ще са необходими за таблициране на общия ред и колони.
Нашето разследване показва, че:
- 50 мъже спечелиха А, докато 60 жени спечелиха А.
- 60 мъже спечелиха B, а 80 жени спечелиха B.
- 100 мъже спечелиха С, а 50 жени спечелиха С.
- 40 мъже спечелиха D, а 50 жени спечелиха D.
- 30 мъже спечелиха F, а 20 жени спечелиха F.
Тази информация е въведена в двупосочната таблица по-долу. Общата стойност на всеки ред ни показва колко от оценките за всеки вид са спечелени. Общата стойност на колоната ни показва броя на мъжете и броя на женските.
Значение на двупосочните таблици
Двупосочните таблици помагат да се организират нашите данни, когато имаме две категорични променливи. Тази таблица може да се използва, за да ни помогне да сравним между две различни групи в нашите данни. Например, бихме могли да разгледаме относителната ефективност на мъжете в курса по статистика спрямо ефективността на жените в курса.
Следващи стъпки
След формирането на двупосочна таблица следващата стъпка може да бъде анализ на данните статистически. Може да попитаме дали променливите, които са в изследването, са независими една от друга или не. За да отговорим на този въпрос, можем да използваме тест chi-квадрат на двупосочната таблица.
Двупосочна таблица за степени и полове
Мъжки пол | Женски пол | Обща сума | |
А | 50 | 60 | 110 |
B | 60 | 80 | 140 |
° С | 100 | 50 | 150 |
д | 40 | 50 | 90 |
F | 30 | 20 | 50 |
Обща сума | 280 | 260 | 540 |