Пример за тест за пермутация

Един въпрос, който винаги е важно да си зададем статистика е: „Наблюдаваният резултат дължи ли се само на случайността, или е такъв статистически значим? " Един клас на тестове за хипотеза, наречени пермутационни тестове, ни позволяват да тестваме този въпрос. Прегледът и стъпките на такъв тест са:

  • Разделихме нашите субекти в контролна и експериментална група. Нулевата хипотеза е, че няма разлика между тези две групи.
  • Приложете лечение на експерименталната група.
  • Измерете отговора на лечението
  • Обмислете всяка възможна конфигурация на експерименталната група и наблюдавания отговор.
  • Изчислете p-стойност въз основа на наблюдавания ни отговор спрямо всички потенциални експериментални групи.

Това е контур на пермутация. За да разберем това очертание, ще отделим време за разглеждане на подробно разработен пример за такъв тест за пермутация.

пример

Да предположим, че изучаваме мишки. По-специално ни интересува колко бързо мишките завършват лабиринт, който никога досега не са срещали. Искаме да предоставим доказателства в полза на експериментално лечение. Целта е да се покаже, че мишките в групата за лечение ще решат лабиринта по-бързо от нелекуваните мишки.

instagram viewer

Започваме с нашите предмети: шест мишки. За удобство мишките ще бъдат посочени с буквите A, B, C, D, E, F. Три от тези мишки трябва да бъдат избрани на случаен принцип за експерименталното лечение, а останалите три са поставени в контролна група, в която пациентите получават плацебо.

След това ще изберем произволно реда, в който мишките са избрани да изпълняват лабиринта. Времето, прекарано в завършване на лабиринта за всички мишки, ще бъде отбелязано и ще бъде изчислена средна стойност за всяка група.

Да предположим, че нашата случайна селекция има мишки A, C и E в експерименталната група, а останалите мишки в плацебо контролна група. След като лечението е осъществено, ние избираме произволно реда за мишките да протичат през лабиринта.

Времето за изпълнение на всяка от мишките е:

  • Мишка А провежда състезанието за 10 секунди
  • Мишка B провежда състезанието за 12 секунди
  • Мишка С провежда състезанието за 9 секунди
  • Мишка D провежда състезанието за 11 секунди
  • Мишка Е провежда състезанието за 11 секунди
  • Мишка F провежда състезанието за 13 секунди.

Средното време за завършване на лабиринта за мишките в експерименталната група е 10 секунди. Средното време за завършване на лабиринта за тези от контролната група е 12 секунди.

Бихме могли да зададем няколко въпроса. Наистина ли лечението е причината за по-бързото средно време? Или просто сме имали късмет при подбора на контролна и експериментална група? Лечението може да не е имало ефект и ние на случаен принцип избрахме по-бавните мишки, които да получат плацебо и по-бързите мишки, за да получат лечението. Тест за пермутация ще ви помогне да отговорите на тези въпроси.

хипотези

Хипотезите за нашия тест за пермутация са:

  • Най- нулева хипотеза е изявлението без ефект. За този специфичен тест имаме H0: Няма разлика между групите за лечение. Средното време за провеждане на лабиринта за всички мишки без лечение е същото като средното време за всички мишки с лечението.
  • Алтернативната хипотеза е това, за което се опитваме да установим доказателства в полза. В този случай щяхме да имаме На: Средното време за всички мишки с лечението ще бъде по-бързо от средното време за всички мишки без третирането.

Пермутации

Има шест мишки и има три места в експерименталната група. Това означава, че броят на възможните експериментални групи е даден от броя на комбинациите C (6,3) = 6! / (3! 3!) = 20. Останалите индивиди ще бъдат част от контролната група. Така че има 20 различни начина за избор на случаен принцип в нашите две групи.

Присвояването на A, C и E на експерименталната група се извършва на случаен принцип. Тъй като има 20 такива конфигурации, специфичната с A, C и E в експерименталната група има вероятност 1/20 = 5% от възникване.

Трябва да определим всички 20 конфигурации на експерименталната група от индивидите в нашето изследване.

  1. Експериментална група: A B C и контролна група: D E F
  2. Експериментална група: A B D и контролна група: C E F
  3. Експериментална група: A B E и контролна група: C D F
  4. Експериментална група: A B F и контролна група: C D E
  5. Експериментална група: A C D и контролна група: B E F
  6. Експериментална група: A C E и контролна група: B D F
  7. Експериментална група: A C F и контролна група: B D E
  8. Експериментална група: A D E и контролна група: B C F
  9. Експериментална група: A D F и контролна група: B C E
  10. Експериментална група: A E F и Контролна група: B C D
  11. Експериментална група: B C D и контролна група: A E F
  12. Експериментална група: B C E и контролна група: A D F
  13. Експериментална група: B C F и Контролна група: A D E
  14. Експериментална група: B D E и Контролна група: A C F
  15. Експериментална група: B D F и Контролна група: A C E
  16. Експериментална група: B E F и Контролна група: A C D
  17. Експериментална група: C D E и контролна група: A B F
  18. Експериментална група: C D F и контролна група: A B E
  19. Експериментална група: C E F и Контролна група: A B D
  20. Експериментална група: D E F и Контролна група: A B C

След това разглеждаме всяка конфигурация на експериментални и контролни групи. Изчисляваме средната стойност за всяка от 20-те пермутации в списъка по-горе. Например, за първите A, B и C имат времена съответно 10, 12 и 9. Средната стойност на тези три числа е 10,3333. Също така в тази първа пермутация D, E и F имат времена съответно 11, 11 и 13. Това е средно 11.6666.

След изчисляване на средно за всяка група, изчисляваме разликата между тези средства. Всяко от следващите съответства на разликата между експерименталните и контролните групи, изброени по-горе.

  1. Плацебо - лечение = 1.333333333 секунди
  2. Плацебо - лечение = 0 секунди
  3. Плацебо - лечение = 0 секунди
  4. Плацебо - лечение = -1,333333333 секунди
  5. Плацебо - лечение = 2 секунди
  6. Плацебо - лечение = 2 секунди
  7. Плацебо - лечение = 0,666666667 секунди
  8. Плацебо - лечение = 0,666666667 секунди
  9. Плацебо - лечение = -0.666666667 секунди
  10. Плацебо - лечение = -0.666666667 секунди
  11. Плацебо - лечение = 0,666666667 секунди
  12. Плацебо - лечение = 0,666666667 секунди
  13. Плацебо - лечение = -0.666666667 секунди
  14. Плацебо - лечение = -0.666666667 секунди
  15. Плацебо - лечение = -2 секунди
  16. Плацебо - лечение = -2 секунди
  17. Плацебо - лечение = 1.333333333 секунди
  18. Плацебо - лечение = 0 секунди
  19. Плацебо - лечение = 0 секунди
  20. Плацебо - лечение = -1,333333333 секунди

P-Value

Сега класираме разликите между средствата от всяка група, които отбелязахме по-горе. Таблизираме и процента на нашите 20 различни конфигурации, които са представени от всяка разлика в средствата. Например четири от 20-те нямаха разлика между средствата на контролните и лечебните групи. Това представлява 20% от посочените по-горе 20 конфигурации.

  • -2 за 10%
  • -1,33 за 10%
  • -0,667 за 20%
  • 0 за 20%
  • 0,667 за 20%
  • 1,33 за 10%
  • 2 за 10%.

Тук сравняваме този списък с наблюдавания ни резултат. Нашият случаен подбор на мишки за лекуващите и контролните групи доведе до средна разлика от 2 секунди. Виждаме също, че тази разлика съответства на 10% от всички възможни проби. Резултатът е, че за това проучване имаме a р-стойност от 10%.