в статистика, терминът стабилност или устойчивост се отнася до силата на статистически модел, тестове и процедури според специфичните условия на статистическия анализ, които едно проучване се надява да постигне. Като се има предвид, че тези условия на изследване са изпълнени, моделите могат да бъдат потвърдени като верни чрез използването на математически доказателства.
Много модели се основават на идеални ситуации, които не съществуват при работа с данни от реалния свят и в резултат на това моделът може да осигури правилни резултати, дори ако условията не са точно изпълнени.
Следователно надеждната статистика е всяка статистика, която дава добри резултати, когато данните се черпят от широк спектър от вероятностни разпределения, които до голяма степен не се влияят от отшелници или малки отклонения от предположенията на модела в даден момент набор от данни. С други думи, стабилната статистика е устойчива на грешки в резултатите.
Един от начините за спазване на често провеждана стабилна статистическа процедура, трябва да се търси не повече от t-процедурите, които използват тестове на хипотези, за да определят най-точните статистически прогнози.
Спазване на Т-процедури
За пример на здравина ще разгледаме T-процедури, които включват доверителен интервал за средна популация с неизвестно стандартно отклонение на популацията, както и тестове за хипотеза за средната популация.
Използването на T-процедурите предполага следното:
- Наборът от данни, с който работим е a проста случайна извадка от населението.
- Популацията, от която сме взели проби, обикновено се разпределя.
На практика с примери от реалния живот статистиците рядко имат население, което обикновено се разпределя, така че въпросът вместо това става: „Колко здрави са нашите T-процедури? "
Като цяло условието, че имаме обикновена случайна извадка, е по-важно от условието, че сме взели извадка от нормално разпределена популация; причината за това е, че теоремата за централната граница осигурява разпределение на извадката, което е приблизително нормално - колкото по-голям е размерът на извадката ни, толкова по-близо е до значението на разпределението на пробата на извадката нормалното.
Как функционират Т-процедурите като стабилна статистика
Толкова стабилност за T-процедури зависят от размера на пробата и разпределението на нашата извадка. Съображенията за това включват:
- Ако размерът на пробите е голям, което означава, че имаме 40 или повече наблюдения, тогава T-процедурите могат да се използват дори при дистрибуции, които са изкривени.
- Ако размерът на извадката е между 15 и 40, тогава можем да използваме T-процедури за всяко оформено разпределение, освен ако няма външни или висока степен на коса.
- Ако размерът на пробата е по-малък от 15, тогава можем да използваме T- процедури за данни, които нямат остатъци, нито един пик и са почти симетрични.
В повечето случаи устойчивостта е установена чрез техническа работа в математическата статистика и, за щастие, не е задължително да правим тези усъвършенствани математически изчисления, за да правилно използвайте ги; трябва само да разберем какви са общите насоки за стабилността на нашия специфичен статистически метод.
T-процедурите функционират като стабилна статистика, тъй като те обикновено дават добри резултати при тези модели, като отчитат размера на извадката в основата за прилагане на процедурата.