Какво е медианата в статистиката?

click fraud protection

Това е полунощното показване на най-новия хитов филм. Хората са облицовани извън театъра и чакат да влязат. Да предположим, че от вас се иска да намерите центъра на линията. Как бихте направили това?

Има няколко различни начина, по които да вървим решаване на този проблем. В крайна сметка ще трябва да разберете колко души са на реда, и след това да вземете половината от този брой. Ако общият брой е четен, то центърът на линията ще бъде между двама души. Ако общият брой е нечетен, то в центъра ще бъде един човек.

Може да попитате: „Какво общо има намирането на центъра на линията статистика? "Тази идея за намиране на центъра е точно това, което се използва при изчисляване на медианата на набор от данни.

Какво е медианата?

Медианата е един от трите основни начина за намиране на средната стойност на статистически данни. По-трудно е да се изчисли от режима, но не толкова трудоемко, колкото изчисляването на средната стойност. Това е центърът по почти същия начин като намирането на център на ред хора. След изброяване на стойностите на данните във възходящ ред, медианата е стойността на данните със същия брой стойности на данни над нея и под нея.

instagram viewer

Първи случай: нечетен брой стойности

Единадесет батерии са тествани, за да се види колко дълго издържат. Техният живот, в часове, е даден с 10, 99, 100, 103, 103, 105, 110, 111, 115, 130, 131. Какъв е средният живот? Тъй като има нечетен брой стойности на данните, това съответства на ред с нечетен брой хора. В центъра ще бъде средната стойност.

Има единадесет стойности на данните, така че шестата е в центъра. Следователно, средният живот на батерията е шестата стойност в този списък, или 105 часа. Обърнете внимание, че средната е една от стойностите на данните.

Случай втори: четен брой стойности

Тежат двадесет котки. Теглата им в килограми се дават с 4, 5, 5, 5, 6, 6, 6, 7, 7, 7, 8, 8, 9, 10, 10, 10, 11, 12, 12, 13. Какво е средното котешко тегло? Тъй като има четен брой стойности на данните, това съответства на линията с четен брой хора. Центърът е между двете средни стойности.

В този случай центърът е между десетата и единадесетата стойност на данните. За да намерим средната, изчисляваме средната стойност на тези две стойности и получаваме (7 + 8) / 2 = 7,5. Тук медианата не е една от стойностите на данните.

Други случаи?

Единствените две възможности са да имате четен или нечетен брой стойности на данните. Така че горните два примера са единствените възможни начини за изчисляване на медианата. Или медианата ще бъде средната стойност, или медианата ще бъде средно от двете средни стойности. Обикновено наборите от данни са много по-големи от тези, които разгледахме по-горе, но процесът на намиране на медианата е същият като тези два примера.

Ефектът на избухналите

Средната стойност и режимът са силно чувствителни към външните хора. Това означава, че наличието на външен човек ще се отрази драматично и на двете мерки на центъра. Едно предимство на медианата е, че не се влияе толкова много от външен човек.

За да видите това, помислете за набора от данни 3, 4, 5, 5, 6. Средната стойност е (3 + 4 + 5 + 5 + 6) / 5 = 4,6, а средната е 5. Сега запазете същия набор от данни, но добавете стойността 100: 3, 4, 5, 5, 6, 100. Ясно е, че 100 е по-външно, тъй като е много по-голямо от всички останали стойности. Средната стойност на новия набор е сега (3 + 4 + 5 + 5 + 6 + 100) / 6 = 20,5. както и да е медиана на новия набор е 5. въпреки че

Приложение на медианата

Поради това, което видяхме по-горе, медианата е предпочитаната мярка за средна стойност, когато данните съдържат остатъци. Когато се отчитат доходите, типичният подход е да се отчита средният доход. Това се прави, защото средният доход е изкривен от малък брой хора с много високи доходи (помислете Бил Гейтс и Опра).

instagram story viewer