Крива на звънеца и определение за нормално разпределение

Терминът крива на звънеца се използва за описание на математическото понятие, наречено нормално разпределение, понякога наричано разпределение на Гаус. "Крива на звънеца" се отнася до формата на звънеца, която се създава, когато се начертава линия, използвайки точките от данни за елемент, който отговаря на критериите за нормално разпределение.

В крива на звънеца, центърът съдържа най-голям брой стойност и следователно това е най-високата точка на дъгата на линията. Тази точка е отнесена към означава, но най-просто казано, това е най-големият брой събития на даден елемент (в статистически план - режимът).

Нормална дистрибуция

Важното, което трябва да се отбележи за a нормална дистрибуция е, че кривата е концентрирана в центъра и намалява от двете страни. Това е важно, тъй като данните имат по-малка склонност да произвеждат необичайно екстремни стойности, наречени извънземни, в сравнение с други разпространения. Също така, кривата на звънеца означава, че данните са симетрични. Това означава, че можете да създадете разумни очаквания относно възможността резултатът да бъде в рамките на диапазон вляво или вдясно от центъра, след като сте измерили количеството на отклонението, съдържащо се в данните. Това се измерва като

instagram viewer
стандартни отклонения.

Графикът на кривата на звънеца зависи от два фактора: средното и стандартното отклонение. Средната стойност идентифицира положението на центъра, а стандартното отклонение определя височината и ширината на звънеца. Например, голямо стандартно отклонение създава камбана, която е къса и широка, докато малко стандартно отклонение създава висока и тясна извивка.

Вероятност на кривата на звънеца и стандартно отклонение

За да разберете коефициентите на вероятност за нормално разпределение, трябва да разберете следните правила:

  1. Общата площ под кривата е равна на 1 (100%)
  2. Около 68% от площта под кривата попада в рамките на едно стандартно отклонение.
  3. Около 95% от площта под кривата попада в две стандартни отклонения.
  4. Около 99,7% от площта под кривата попада в три стандартни отклонения.

Точки 2, 3 и 4 по-горе понякога се наричат ​​емпирично правило или правило 68–95–99.7. След като определите, че данните се разпространяват нормално (камбана извита) и да се изчисли средната стойност и стандартно отклонение, можете да определите вероятност че една точка от данни ще попадне в даден диапазон от възможности.

Пример за крива на звънеца

Добър пример за крива на звънеца или нормално разпределение е руло от две зарчета. Разпределението е центрирано около числото седем и вероятността намалява, когато се отдалечите от центъра.

Ето процента вероятност от различните резултати, когато хвърлите две зарчета.

  • Второ: (1/36) 2.78%
  • Три: (2/36) 5.56%
  • Четири: (3/36) 8.33%
  • Пет: (4/36) 11.11%
  • Шест: (5/36) 13.89%
  • Седем: (6/36) 16,67% = най-вероятният резултат
  • Осем: (5/36) 13.89%
  • Девет: (4/36) 11.11%
  • Десет: (3/36) 8.33%
  • Eleven: (2/36) 5.56%
  • Дванадесет: (1/36) 2.78%

Нормалните разпределения имат много удобни свойства, така че в много случаи, особено в физика и астрономия, случайни вариации с неизвестни разпределения често се приемат за нормални, за да позволят изчисления на вероятността. Въпреки че това може да бъде опасно предположение, често е добро приближение поради изненадващ резултат, известен като централна гранична теорема.

Тази теорема заявява, че средната стойност на всеки набор от варианти с всяко разпределение с ограничена средна стойност и дисперсия има тенденция да се появява при нормално разпределение. Много общи признаци като тестови резултати или височина следват приблизително нормални разпределения, с малко членове в горния и долния край и много в средата.

Когато не трябва да използвате кривата на камбаната

Има някои видове данни, които не следват нормален модел на разпространение. Тези набори от данни не трябва да се принуждават да се опитват да се поберат на кривата на звънеца. Класически пример са студентските оценки, които често имат два режима. Други видове данни, които не следват кривата, включват доходи, прираст на населението и механични повреди.