Мерките от централна тенденция са числа, които описват какво е средно или типично в разпределението на данни. Има три основни мерки от централна тенденция: средно, Медианаи режим. Въпреки че всички те са с централна тенденция, всяка се изчислява по различен начин и измерва нещо различно от останалите.
Средната
Средната стойност е най-често срещаната мярка за централна тенденция, използвана от изследователи и хора във всички видове професии. Мярката за централна тенденция се нарича също средно аритметично. Изследовател може да използва средното, за да опише разпределението на данните на променливи, измерени като интервали или съотношения. Това са променливи, които включват числово съответстващи категории или диапазони (като раса, клас, полили ниво на образование), както и променливи, измерени числено от скала, която започва с нула (като доход на домакинството или броя на децата в семейството).
Средната стойност е много лесна за изчисляване. Човек просто трябва да добави всички стойности на данните или "резултати" и след това да раздели тази сума на общия брой резултати при разпределението на данните. Например, ако пет семейства имат съответно 0, 2, 2, 3 и 5 деца, средният брой деца е (0 + 2 + 2 + 3 + 5) / 5 = 12/5 = 2.4. Това означава, че петте домакинства имат средно 2,4 деца.
Медианата
Медианата е стойността в средата на разпределение на данни, когато тези данни са организирани от най-ниската до най-високата стойност. Тази мярка за централна тенденция може да бъде изчислена за променливи, които се измерват с порядъчна, интервална или съотношение на скалата.
Изчисляването на медианата също е доста просто. Да предположим, че имаме следния списък с числа: 5, 7, 10, 43, 2, 69, 31, 6, 22. Първо трябва да подредим числата в ред от най-ниско до най-високо. Резултатът е следният: 2, 5, 6, 7, 10, 22, 31, 43, 69. Медианата е 10, защото е точното средно число. Има четири числа под 10 и четири числа над 10.
Ако вашето разпределение на данни има четен брой случаи, което означава, че няма точна средна стойност, просто коригирате леко диапазона от данни, за да изчислите медианата. Например, ако добавим числото 87 в края на нашия списък с числа по-горе, имаме 10 общи числа в нашата дистрибуция, така че няма нито едно средно число. В този случай човек взема средната оценка за двете средни числа. В нашия нов списък двете средни числа са 10 и 22. И така, вземаме средната стойност на тези две числа: (10 + 22) / 2 = 16. Нашата медиана вече е на 16.
Режимът
Режимът е мярката на централната тенденция, която идентифицира категорията или резултата, който се среща най-често в рамките на разпространението на данни. С други думи, това е най-често срещаният резултат или резултатът, който се появява най-много пъти в разпределението. Режимът може да бъде изчислен за всеки тип данни, включително тези, измерени като номинални променливи, или по име.
Например, да речем, че гледаме домашни любимци, собственост на 100 семейства, и разпространението изглежда така:
животноБрой семейства, които го притежават
- Куче: 60
- Котка: 35
- Риба: 17
- Хамстер: 13
- Змия: 3
Режимът тук е „куче“, тъй като повече семейства притежават куче, отколкото всяко друго животно. Обърнете внимание, че режимът винаги се изразява като категория или резултат, а не като честота на този резултат. Например, в горния пример, режимът е "куче", а не 60, което е броя на появата на кучето.
Някои дистрибуции изобщо нямат режим. Това се случва, когато всяка категория има една и съща честота. Други дистрибуции може да имат повече от един режим. Например, когато дистрибуцията има два резултата или категории с една и съща най-висока честота, тя често се нарича „бимодален."