Bootstrapping е статистическа техника, която попада в по-широкия заглавие на повторно оформяне. Тази техника включва сравнително проста процедура, но се повтаря толкова много пъти, че е силно зависима от компютърните изчисления. Bootstrapping предоставя метод, различен от доверителен интервал за оценка на параметър на популацията. Изглежда, че Bootstrapping много работи като магия. Прочетете, за да видите как получава интересното си име.
Обяснение на Bootstrapping
Една цел на инфекциозна статистика е да се определи стойността на параметър на популация. Обикновено това е твърде скъпо или дори невъзможно да се измери това директно. Така че ние използваме статистическа извадка. Ние правим извадка от съвкупност, измерваме статистически данни на тази извадка и използваме тази статистика, за да кажем нещо за съответстващ параметър от населението.
Например, в една шоколадова фабрика може да искаме да гарантираме, че бонбоните с бонбони имат определено означава тегло. Не е възможно да се претегля всеки произведен бонбон, така че използваме техники за вземане на проби, за да избираме произволно 100 бонбона. Изчисляваме средната стойност на тези 100 ленти за бонбони и казваме, че средната стойност на населението попада в граница на грешка от средната стойност на нашата извадка.
Да предположим, че няколко месеца по-късно искаме да знаем с по-голяма точност - или по-малко от a граница на грешка - какво е средното тегло на бонбоните в деня, в който взехме проба на производствената линия. Не можем да използваме и днешните бонбони много променливи са влезли в снимката (различни партиди мляко, захар и какаови зърна, различни атмосферни условия, различни служители на линията и т.н.). Всичко, което имаме от деня, за който сме любопитни, са 100-тежестите. Без машина на времето до този ден, изглежда, че първоначалната грешка е най-доброто, на което можем да се надяваме.
За щастие, можем да използваме техника на зареждане с багаж. В тази ситуация ние случайно проба със замяна от 100-те известни тежести. Тогава ние наричаме това проба за зареждане. Тъй като допускаме замяна, тази проба за зареждане най-вероятно не е идентична с нашата първоначална проба. Някои точки от данни могат да бъдат дублирани, а други точки от първоначалните 100 могат да бъдат пропуснати в проба за зареждане. С помощта на компютър могат да бъдат изградени хиляди проби за зареждане за сравнително кратко време.
Пример
Както споменахме, за да използваме истински техники за зареждане, трябва да използваме компютър. Следващият числов пример ще ви помогне да демонстрирате как работи процесът. Ако започнем с извадката 2, 4, 5, 6, 6, тогава всички изброени по-долу са възможни проби за зареждане:
- 2 ,5, 5, 6, 6
- 4, 5, 6, 6, 6
- 2, 2, 4, 5, 5
- 2, 2, 2, 4, 6
- 2, 2, 2, 2, 2
- 4,6, 6, 6, 6
История на техниката
Техниките за зареждане са сравнително нови в областта на статистиката. Първата употреба е публикувана в документ от 1979 г. от Брадли Ефрон. Тъй като изчислителната мощност се увеличава и става по-евтина, техники за зареждане стават все по-широко разпространени.
Защо името Bootstrapping?
Името „bootstrapping“ идва от израза „Да се повдигнеш от своите обувки за зареждане“. Това се отнася за нещо нелепо и невъзможно. Опитайте колкото се може по-силно, не можете да се повдигнете във въздуха, като опънете парчета кожа на ботушите си.
Има някаква математическа теория, която обосновава техники за зареждане. Въпреки това, използването на зареждане със стартиране се чувства така, сякаш правите невъзможното. Въпреки че не изглежда, че бихте могли да се подобрите при оценката на статистиката за популацията, като използвате повторно една и съща извадка, в действителност това може да направи това.