Интервалите на поверителност са ключова част от инфекциозните статистики. Можем да използваме известна вероятност и информация от a разпределение на вероятността за оценка на параметър на популацията с помощта на извадка. Изявлението на a доверителен интервал се прави по такъв начин, че да бъде лесно разбран. Ще разгледаме правилната интерпретация на интервалите на доверие и ще проучим четири грешки, които са направени във връзка с тази област на статистиката.
Какво е интервал на увереност?
Интервалът на доверие може да се изрази или в диапазон от стойности или в следната форма:
Изчислете ± Погрешка
Интервалът на доверие обикновено се посочва с ниво на доверие.Общи нива на доверие са 90%, 95% и 99%.
Ще разгледаме един пример, в който искаме да използваме примерна средна стойност, за да заключим средната стойност на популация. Да предположим, че това води до доверителен интервал от 25 до 30. Ако кажем, че сме 95% уверени, че неизвестното население означава се съдържа в този интервал, тогава ние наистина казваме, че ние открихме интервала, използвайки метод, който е успешен да даде правилни резултати в 95% от времето. В дългосрочен план нашият метод ще бъде неуспешен 5% от времето. С други думи, ние няма да успеем да заловим истинската популация означава само един на всеки 20 пъти.
Грешка №1
Сега ще разгледаме поредица от различни грешки, които могат да бъдат допуснати при справяне с интервалите на доверие. Едно неправилно твърдение, което често се прави за интервал на доверие при 95% ниво на доверие, е, че има 95% вероятност доверителният интервал да съдържа истинската средна стойност за населението.
Причината, че това е грешка, всъщност е доста фина. Основната идея, отнасяща се до интервал на доверие, е, че използваната вероятност влиза в картината използваният метод при определяне на доверителен интервал е, че той се отнася до метода, който е използва.
Грешка №2
Втора грешка е интерпретирането на 95% интервал на доверие като казва, че 95% от всички стойности на данните в популацията попадат в интервала. Отново 95% говори с метода на теста.
За да разберем защо горното твърдение е неправилно, бихме могли да разгледаме нормална популация с a стандартно отклонение от 1 и средно 5. Проба, която има две точки от данни, всяка със стойности 6, има примерна средна стойност от 6. 95% интервал на доверие за населението ще бъде от 4,6 до 7,4. Това очевидно не се припокрива с 95% от нормална дистрибуция, така че няма да съдържа 95% от населението.
Грешка №3
Трета грешка е да се каже, че 95% доверителен интервал предполага, че 95% от всички възможни средства за извадка попадат в обхвата на интервала. Преразгледайте примера от последния раздел. Всяка проба с размер два, която се състоеше само от стойности, по-малки от 4.6, би имала средна стойност, по-малка от 4.6. По този начин тези примерни средства ще попаднат извън този интервал на доверие. Пробите, които съответстват на това описание, представляват повече от 5% от общата сума. Така че е грешка да се каже, че този доверителен интервал улавя 95% от всички средства за извадка.
Грешка №4
Четвърта грешка при работата с интервалите на доверие е да се мисли, че те са единственият източник на грешка. Въпреки че има допустима грешка, свързана с интервал на доверие, има и други места, при които грешките могат да проникнат в статистически анализ. Няколко примера за тези видове грешки могат да бъдат от неправилен дизайн на експеримента, отклонения в извадката или невъзможност за получаване на данни от определена подгрупа от популацията.