Как да изчислим коефициента на корелация

Има много въпроси, които трябва да зададете, когато гледате скетер. Едно от най-често срещаните е да се чудим колко правилна апроксимация прави права. За да се отговори на това, има описателна статистика, наречена коефициент на корелация. Ще видим как да изчислим тази статистика.

Коефициентът на корелация

Най- коефициент на корелация, обозначени с R, ни казва колко близо данните в разсеяно падат по права линия. Колкото по-близо е това абсолютната стойност на R е към едно, толкова по-добре, че данните са описани с линейно уравнение. ако R = 1 или r = -1 тогава наборът данни е перфектно подравнен. Набори от данни със стойности на R близо до нула показват малко до никакви праволинейни отношения.

Поради продължителните изчисления е най-добре да се изчисли R с използването на калкулатор или статистически софтуер. Винаги обаче си заслужава да се опитате да знаете какво прави вашият калкулатор, когато изчислява. Следва процес за изчисляване на коефициента на корелация главно на ръка, с калкулатор, използван за рутинните аритметични стъпки.

instagram viewer

Стъпки за изчисляване R

Ще започнем с изброяване на стъпките за изчисляване на коефициента на корелация. Данните, с които работим, са сдвоени данни, чиято двойка ще бъде обозначена с (хаз, уаз).

  1. Започваме с няколко предварителни изчисления. Количествата от тези изчисления ще бъдат използвани в следващите стъпки от нашето изчисляване на R:
    1. Изчислете x̄, означава от всички първи координати на данните хаз.
    2. Изчислете ȳ, средната стойност на всички втори координати на данните
    3. шаз.
    4. Изчисли с х Образецът стандартно отклонение от всички първи координати на данните хаз.
    5. Изчисли с ш стандартното отклонение на извадката на всички втори координати на данните шаз.
  2. Използвайте формулата (Zх)аз = (хаз - х) / с х и се изчислява стандартизирана стойност за всеки хаз.
  3. Използвайте формулата (Zш)аз = (шаз – ȳ) / с ш и се изчислява стандартизирана стойност за всеки шаз.
  4. Умножете съответните стандартизирани стойности: (Zх)аз(Zш)аз
  5. Добавете продуктите от последната стъпка заедно.
  6. Разделете сумата от предишната стъпка по н - 1, където н е общият брой точки в нашия набор от сдвоени данни. Резултатът от всичко това е коефициентът на корелация R.

Този процес не е труден и всяка стъпка е доста рутинна, но събирането на всички тези стъпки е доста ангажирано. Изчисляването на стандартното отклонение е достатъчно досадно само по себе си. Но изчисляването на коефициента на корелация включва не само две стандартни отклонения, но и множество други операции.

Пример

За да видите точно как стойността на R се получава, ние разглеждаме един пример. Отново е важно да се отбележи, че за практически приложения бихме искали да използваме нашия калкулатор или статистически софтуер за изчисляване R за нас.

Започваме с списък на сдвоени данни: (1, 1), (2, 3), (4, 5), (5,7). Средната стойност на х стойности, средната стойност на 1, 2, 4 и 5 е x̄ = 3. Ние също имаме това ȳ = 4. Стандартното отклонение на

х стойности е сх = 1,83 и сш = 2.58. Таблицата по-долу обобщава останалите изчисления, необходими за R. Сумата на продуктите в най-дясната колона е 2.969848. Тъй като има общо четири точки и 4 - 1 = 3, разделяме сумата от продуктите на 3. Това ни дава коефициент на корелация от R = 2.969848/3 = 0.989949.

Таблица за пример за изчисляване на коефициента на корелация

х ш Zх Zш ZхZш
1 1 -1.09544503 -1.161894958 1.272792057
2 3 -0.547722515 -0.387298319 0.212132009
4 5 0.547722515 0.387298319 0.212132009
5 7 1.09544503 1.161894958 1.272792057
instagram story viewer