Една от основните части на инфекциозната статистика е разработването на начини за изчисляване доверителни интервали. Интервалите на доверие ни предоставят начин да оценим популацията параметър. Вместо да казваме, че параметърът е равен на точна стойност, казваме, че параметърът попада в диапазон от стойности. Този диапазон от стойности обикновено е оценка, заедно с граница на грешка, която добавяме и изваждаме от прогнозата.
Прикрепена към всеки интервал е ниво на увереност. Нивото на доверие дава измерване на това колко често в дългосрочен план методът, използван за получаване на нашия доверителен интервал, улавя истинския параметър на популацията.
Полезно е, когато се запознаете със статистически данни, за да видите някои разработени примери. По-долу ще разгледаме няколко примера на интервалите на доверие за средно население. Ще видим, че методът, който използваме за изграждане на интервал на доверие за средно ниво, зависи от допълнителната информация за нашето население. По-конкретно, подходът, който използваме, зависи от това дали знаем или не стандартното отклонение на населението или не.
Изложение на проблемите
Започваме с обикновена случайна извадка от 25 конкретни видове тритони и измерваме опашките им. Средната дължина на опашката на нашата проба е 5 cm.
- Ако знаем, че 0,2 см е стандартното отклонение на дължината на опашката на всички тритони в популацията, тогава какъв е 90% доверителен интервал за средната дължина на опашката на всички тритони в популацията?
- Ако знаем, че 0,2 см е стандартното отклонение на дължината на опашката на всички тритони в популацията, тогава какъв е 95% интервал на доверие за средната дължина на опашката на всички тритони в популацията?
- Ако открием, че това е 0,2 cm от стандартното отклонение на дължината на опашката на тритоните в нашата проба, популация, тогава какъв е 90% доверителен интервал за средната дължина на опашката на всички тритони в население?
- Ако открием, че това е 0,2 cm от стандартното отклонение на дължината на опашката на тритоните в нашата проба, популация, тогава какъв е 95% интервал на доверие за средната дължина на опашката на всички тритове в население?
Обсъждане на проблемите
Започваме с анализ на всеки от тези проблеми. В първите два проблема ние знаят стойността на стандартното отклонение на населението. Разликата между тези два проблема е, че нивото на увереност е по-голямо в # 2, отколкото това, което е за №1.
Във вторите два проблема стандартното отклонение на населението не е известно. За тези два проблема ще оценим този параметър с извадката стандартно отклонение. Както видяхме в първите два проблема, тук също имаме различни нива на увереност.
Solutions
Ще изчислим решения за всеки от горните проблеми.
- Тъй като знаем стандартното отклонение на популацията, ще използваме таблица с z-резултати. Стойността на Z което съответства на 90% доверителен интервал е 1.645. Чрез използване на формула за границата на грешката имаме интервал на доверие от 5 - 1.645 (0.2 / 5) до 5 + 1.645 (0.2 / 5). (5-те в знаменателя тук са, защото сме взели квадратния корен от 25). След извършване на аритметиката имаме 4,934 см до 5,066 см като доверителен интервал за популацията.
- Тъй като знаем стандартното отклонение на популацията, ще използваме таблица с z-резултати. Стойността на Z което съответства на 95% доверителен интервал е 1,96. Използвайки формулата за границата на грешката, имаме интервал на доверие от 5 - 1,96 (0,2 / 5) до 5 + 1,96 (0,2 / 5). След извършване на аритметиката имаме от 4.922 см до 5.078 см като доверителен интервал за популацията.
- Тук не познаваме стандартното отклонение на популацията, само стандартното отклонение в извадката. По този начин ще използваме таблица с t-резултати. Когато използваме таблица на T Резултатите трябва да знаем колко степени на свобода имаме. В този случай има 24 степени на свобода, което е една по-малка от размера на извадката 25. Стойността на T което съответства на 90% доверителен интервал е 1,71. Използвайки формулата за границата на грешката, имаме интервал на доверие от 5 - 1,71 (0,2 / 5) до 5 + 1,71 (0,2 / 5). След извършване на аритметиката имаме 4.932 см до 5.068 см като доверителен интервал за популацията.
- Тук не познаваме стандартното отклонение на популацията, само стандартното отклонение в извадката. По този начин отново ще използваме таблица с t-резултати. Има 24 степени на свобода, което е една по-малка от размера на извадката от 25. Стойността на T което съответства на 95% доверителен интервал е 2,06. Използвайки формулата за границата на грешката, имаме интервал на доверие от 5 - 2,06 (0,2 / 5) до 5 + 2,06 (0,2 / 5). След извършване на аритметиката имаме от 4.912 см до 5.082 см като доверителен интервал за популацията.
Обсъждане на решенията
Трябва да отбележим няколко неща при сравняването на тези решения. Първият е, че във всеки случай с нивото на доверието ни се увеличава, толкова по-голяма е стойността на Z или T с което приключихме. Причината за това е, че за да сме по-уверени в това, че наистина сме уловили популацията означава в нашия доверителен интервал, се нуждаем от по-широк интервал.
Другата характеристика, която трябва да се отбележи, е, че за определен интервал на доверие, тези, които използват T са по-широки от тези с Z. Причината за това е, че a T разпределението има по-голяма променливост в опашките си от стандартното нормално разпределение.
Ключът към правилното решение на тези видове проблеми е, че ако знаем стандартното отклонение на населението, използваме таблица Z-scores. Ако не знаем стандартното отклонение на населението, тогава използваме таблица от T резултати.