Какво е хистограма и как се използва?

Хистограмата е вид графика, която има широко приложение в статистиката. Хистограмите осигуряват визуална интерпретация на числови данни чрез посочване на броя точки от данни, които се намират в диапазон от стойности. Тези диапазони от стойности се наричат ​​класове или бункери. Честотата на данните, които попадат във всеки клас, се изобразява чрез използването на лента. Колкото по-висока е лентата, толкова по-голяма е честотата на стойностите на данните в този кош.

Хистограми vs. Графики

На пръв поглед хистограмите изглеждат много подобни графики. И двете графики използват вертикални ленти за представяне на данни. Височината на щанга съответства на относителна честота от количеството данни в класа. Колкото по-висока е лентата, толкова по-висока е честотата на данните. Колкото по-ниска е лентата, толкова по-ниска е честотата на данните. Но външният вид може да бъде измамен. Именно тук приликите завършват между двата вида графики.

Причината, че тези видове графики са различни, е свързана с

instagram viewer
ниво на измерване на данните. От една страна, лентовите графики се използват за данни на номиналното ниво на измерване. Графики измервайте честотата на категоричните данни, а класовете за лентова графика са тези категории. От друга страна, хистограмите се използват за данни, които са поне на порядъчно ниво на измерване. Класовете за хистограма са диапазони от стойности.

Друга ключова разлика между графиките и хистограмите е свързана с подреждането на баровете. В лентова графика е обичайна практика да пренареждате баровете в ред на намаляваща височина. Въпреки това, баровете в хистограма не могат да бъдат пренаредени. Те трябва да бъдат показани в реда, в който се появяват класовете.

Пример за хистограма

Диаграмата по-горе ни показва хистограма. Да предположим, че четири монети са обърнати и резултатите са записани. Използването на подходящите биномиална таблица на разпределение или направо изчисления с биномиална формула показва вероятността, че не се показват глави, е 1/16, вероятността, че една глава се показва, е 4/16. Вероятността за две глави е 6/16. Вероятността за три глави е 4/16. Вероятността от четири глави е 1/16.

Конструираме общо пет класа, всеки от ширината един. Тези класове съответстват на възможния брой глави: нула, една, две, три или четири. Над всеки клас рисуваме вертикална лента или правоъгълник. Височините на тези ленти съответстват на вероятностите, споменати за нашия експериментален вероятност за прелитане на четири монети и преброяване на главите.

Хистограми и вероятности

Горният пример не само демонстрира изграждането на хистограма, но и показва това дискретни разпределения на вероятностите може да бъде представена с хистограма. Всъщност и дискретното разпределение на вероятността може да бъде представено с хистограма.

За да изградим хистограма, която представлява разпределение на вероятността, започваме с избора на класовете. Това трябва да са резултатите от вероятностния експеримент. Ширината на всеки от тези класове трябва да бъде една единица. Височините на стълбовете на хистограмата са вероятностите за всеки от резултатите. С хистограма, изградена по такъв начин, областите на баровете също са вероятности.

Тъй като този вид хистограма ни дава вероятности, той подлежи на няколко условия. Едно условие е, че за скалата, която ни дава височината на дадена лента от хистограмата, могат да се използват само неотрицателни числа. Второ условие е, че тъй като вероятността е равна на площта, всички площи на баровете трябва да се съберат до общо една, равна на 100%.

Хистограми и други приложения

Баровете в хистограма не трябва да са вероятности. Хистограмите са полезни в области, различни от вероятността. Всеки път, когато искаме да сравним честотата на появата на количествени данни, може да се използва хистограма за изобразяване на нашия набор от данни.