Пример за зареждане в статистиката

click fraud protection

Bootstrapping е мощна статистическа техника. Това е особено полезно, когато проба размер, с който работим е малък. При обичайни обстоятелства, размерите на извадките, по-малки от 40, не могат да бъдат разгледани като се приеме a нормална дистрибуция или а t разпределение. Техниките на Bootstrap работят доста добре с мостри, които имат по-малко от 40 елемента. Причината за това е, че зареждането при зареждане включва повторно оформяне. Този вид техники не предполагат нищо за разпределение от нашите данни.

Bootstrapping стана по-популярен, тъй като изчислителните ресурси станаха по-лесно достъпни. Това е така, защото за да може практическото зареждане да бъде практично, трябва да се използва компютър. Ще видим как става това в следващия пример за зареждане на стартиращи устройства.

Започваме с статистическа извадка от население, за което не знаем нищо. Нашата цел ще бъде 90% доверителен интервал за средната стойност на извадката. Макар и други статистически техники, използвани за определяне

instagram viewer
доверителни интервали да приемем, че знаем средното или стандартното отклонение на нашето население, зареждането със стартираща програма не изисква нищо друго освен извадката.

За целите на нашия пример ще приемем, че пробата е 1, 2, 4, 4, 10.

Сега препровеждаме с подмяна от нашата проба, за да образуваме онези, известни като проби за зареждане. Всяка проба за зареждане ще има размер пет, точно като нашата оригинална проба. Тъй като ние избираме произволно и след това заместваме всяка стойност, пробите за зареждане могат да се различават от оригиналната проба и една от друга.

За примери, в които бихме се сблъскали в реалния свят, бихме направили това пренареждане стотици, ако не хиляди пъти. В следващото по-долу ще видим пример с 20 проби за зареждане:

Тъй като ние използваме bootstrapping за изчисляване на доверителен интервал за популационната средна стойност, сега изчисляваме средствата на всяка от нашите проби за зареждане. Тези средства, подредени във възходящ ред, са: 2, 2.4, 2.6, 2.6, 2.8, 3, 3, 3.2, 3.4, 3.6, 3.8, 4, 4, 4.2, 4.6, 5.2, 6, 6, 6.6, 7.6.

Сега получаваме от нашия списък на пробата за зареждане означава интервал на доверие. Тъй като искаме 90% доверителен интервал, използваме 95-ти и 5-ти процентил като крайни точки на интервалите. Причината за това е, че разделихме 100% - 90% = 10% наполовина, така че да имаме средните 90% от всички средства за първоначална извадка.

instagram story viewer