Сума от квадрати Формула на пряк път

click fraud protection

Изчисляването на a проба вариация или стандартно отклонение обикновено се посочва като фракция. Числителят на тази част включва сума от отклонения в квадрат от средната стойност. В статистиката, формулата за тази обща сума от квадрати е

Σ (xаз - х)2

Тук символът x̄ се отнася до средната проба, а символът Σ ни казва да добавим разликите в квадрат (xаз - x̄) за всички аз.

Въпреки че тази формула работи за изчисления, съществува еквивалентна формула за пряк път, която не изисква първо да изчислим проба средно. Тази формула за пряк път е за сумата от квадратчета

Σ (хаз2) - (Σ xаз)2/н

Тук променливата н се отнася до броя точки от данни в нашата извадка.

Пример за стандартна формула

За да видим как работи тази формула за пряк път, ще разгледаме пример, който се изчислява с помощта на двете формули. Да предположим, че нашата извадка е 2, 4, 6, 8. Средната проба е (2 + 4 + 6 + 8) / 4 = 20/4 = 5. Сега изчисляваме разликата на всяка точка от данни със средната стойност 5.

  • 2 – 5 = -3
  • 4 – 5 = -1
  • 6 – 5 = 1
  • 8 – 5 = 3
instagram viewer

Сега правим квадрат на всяко от тези числа и ги добавяме заедно. (-3)2 + (-1)2 + 12 + 32 = 9 + 1 + 1 + 9 = 20.

Пример за формула на пряк път

Сега ще използваме същия набор от данни: 2, 4, 6, 8, с формулата за пряк път, за да определим сумата от квадрати. Първо квадратме всяка точка от данни и ги добавяме заедно: 22 + 42 + 62 + 82 = 4 + 16 + 36 + 64 = 120.

Следващата стъпка е да се съберат всички данни и да се квадратят тази сума: (2 + 4 + 6 + 8)2 = 400. Разделяме това на броя точки от данни, за да се получи 400/4 = 100.

Сега изваждаме това число от 120. Това ни дава, че сумата от отклоненията в квадрат е 20. Това беше точно числото, което вече открихме от другата формула.

Как работи това?

Много хора просто ще приемат формулата по номинална стойност и нямат представа защо тази формула работи. Използвайки малко алгебра, можем да разберем защо тази формула за пряк път е еквивалентна на стандартния, традиционен начин за изчисляване на сумата от квадратни отклонения.

Въпреки че в реалния свят може да има стотици, ако не и хиляди стойности, ще приемем, че има само три стойности на данните: x1, х2, х3. Това, което виждаме тук, може да се разшири до набор от данни, който има хиляди точки.

Започваме с отбелязването, че (x1 + х2 + х3) = 3 x̄. Изразът Σ (xаз - х)2 = (х1 - х)2 + (х2 - х)2 + (х3 - х)2.

Сега използваме факта от основната алгебра, че (a + b)2 = a2 + 2ab + b2. Това означава, че (x1 - х)2 = х12 -2x1 x̄ + x̄2. Правим това за другите два термина от нашето обобщение и имаме:

х12 -2x1 x̄ + x̄2 + х22 -2x2 x̄ + x̄2 + х32 -2x3 x̄ + x̄2.

Пренареждаме това и имаме:

х12+ х22 + х32+ 3x̄2 - 2x̄ (x1 + х2 + х3) .

Чрез пренаписване (x1 + х2 + х3) = 3x̄ горното става:

х12+ х22 + х32 - 3x̄2.

Сега от 3x̄2 = (х1+ х2 + х3)2/ 3, нашата формула става:

х12+ х22 + х32 - (х1+ х2 + х3)2/3

И това е специален случай на общата формула, спомената по-горе:

Σ (хаз2) - (Σ xаз)2/н

Наистина ли е пряк път?

Може да не изглежда, че тази формула е наистина пряк път. В крайна сметка в примера по-горе изглежда, че има също толкова изчисления. Част от това е свързано с факта, че разгледахме само размера на извадката, който беше малък.

Докато увеличаваме размера на нашата извадка, виждаме, че формулата за пряк път намалява броя на изчисленията с около половината. Не е необходимо да изваждаме средната стойност от всяка точка от данни и след това да квадратваме резултата. Това намалява значително върху общия брой операции.

instagram story viewer