Най- Медиана на набор от данни е средната точка, в която точно половината от стойностите на данните са по-малки или равни на средната. По подобен начин можем да мислим за медианата на a непрекъснатразпределение на вероятността, но вместо да намерим средната стойност в набор от данни, ние намираме средата на разпределението по различен начин.
Общата площ при функция на плътност на вероятностите е 1, представляваща 100%, и в резултат половината от нея може да бъде представена с половина или 50 процента. Една от големите идеи на математическата статистика е, че вероятността е представена от областта под кривата на функция на плътност, която се изчислява чрез интеграл и по този начин медианата на непрекъснато разпределение е точката на на реално число линия, където точно половината от областта лежи вляво.
Това може да бъде по-кратко заявено от следния неправилен интеграл. Медианата на непрекъснатата случайна променлива х с функция на плътност е( х) е стойността M такава, че:
0.5=∫m−∞е(х)дх
Медиана за експоненциално разпределение
Сега изчисляваме медианата за експоненциалното разпределение Exp (A). Случайна променлива с това разпределение има функция на плътност е(х) = д-х/ A/ A за х всяко неотрицателно реално число. Функцията съдържа и математическа константа д, приблизително равна на 2,71828.
Тъй като функцията на плътността на вероятността е нула за всяка отрицателна стойност на х, всичко, което трябва да направим, е да интегрираме следното и да решим за M:
0,5 = ∫0M f (x) dx
Тъй като интегралът ∫ д-х/ A/ A dх = -д-х/ A, резултатът е такъв
0,5 = -е-М / А + 1
Това означава, че 0,5 = д-M / A и след като вземем естествения логаритъм от двете страни на уравнението, имаме:
ln (1/2) = -M / A
Тъй като 1/2 = 2-1, по свойства на логаритми пишем:
- ln2 = -M / A
Умножаването на двете страни с A ни дава резултата, че средната M = A ln2.
Средно-средно неравенство в статистиката
Следва да се спомене едно следствие от този резултат: средната стойност на експоненциалното разпределение Exp (A) е A и тъй като ln2 е по-малка от 1, следва, че произведението Aln2 е по-малко от A. Това означава, че средната стойност на експоненциалното разпределение е по-малка от средната.
Това има смисъл, ако помислим върху графиката на функцията на плътността на вероятностите. Поради дългата опашка, това разпределение е изкривено вдясно. Много пъти, когато разпределението е наклонено вдясно, средната стойност е отдясно на медианата.
Това означава по отношение на статистическия анализ е, че често можем да прогнозираме, че средната и средната стойност не са директно корелира, като се има предвид вероятността данните да са наклонени вдясно, което може да се изрази като средно-средно доказателство за неравенство познат като Неравенството на Чебишев.
Като пример, помислете за набор от данни, според който човек получава общо 30 посетители за 10 часа, където средното време за изчакване за посетител е 20 минути, докато набор от данни може да показва, че средното време на изчакване ще бъде някъде между 20 и 30 минути, ако над първата половина от тези посетители дойдат през първите пет часа.