Какво представляват сдвоените данни в статистиката?

Сдвоените данни в статистиката, често наричани подредени двойки, се отнасят до две променливи при индивидите от популация, които са свързани заедно, за да се определи връзката между тях. За да може даден набор от данни да се счита за сдвоени данни, и двете стойности на данни трябва да бъдат прикрепени или свързани помежду си и да не се разглеждат отделно.

Идеята за сдвоени данни е в контраст с обичайното свързване на едно число към всяка точка от данни, както в други количествени данни определя, че всяка отделна точка от данни е свързана с две числа, като предоставя графика, която позволява на статистиците да наблюдават връзката между тези променливи в популация.

Този метод на сдвоени данни се използва, когато едно проучване се надява да се сравнят две променливи при индивидите от популацията, за да се направи някакъв извод за наблюдаваната корелация. Когато наблюдавате тези точки от данни, редът на сдвояване е важен, тъй като първото число е мярка за едно нещо, докато второто е мярка за нещо съвсем различно.

instagram viewer

Пример за сдвоени данни

За да видите пример на сдвоени данни, да предположим, че учителят брои броя на задачите за домашни задачи на всеки ученик включени за определена единица и след това сдвояват това число с процента на всеки ученик в единицата тест. Двойките са както следва:

  • Лице, което изпълни 10 задачи, спечели 95% от своя тест. (10, 95%)
  • Лице, което изпълни 5 задачи, спечели 80% от своя тест. (5, 80%)
  • Лице, което изпълни 9 задачи, спечели 85% от своя тест. (9, 85%)
  • Индивид, който изпълни 2 задачи, спечели 50% от своя тест. (2, 50%)
  • Лице, което изпълни 5 задачи, спечели 60% от своя тест. (5, 60%)
  • Лице, което изпълни 3 задачи, спечели 70% от своя тест. (3, 70%)

Във всеки от тези набори сдвоени данни можем да видим, че броят на заданията винаги е на първо място в поръчана двойка, докато процентът спечелен на теста е втори, както се вижда в първата инстанция на (10, 95%).

Докато статистически анализ на тези данни може да се използва и за изчисляване на средния брой на Завършените домашни задачи или средният тестов резултат, може да се зададат други въпроси информацията. В този случай учителят иска да знае дали има някаква връзка между броя на задачите в домашни условия включени и изпълнение на теста и учителят ще трябва да запази данните в двойка, за да отговори на това въпрос.

Анализ на сдвоени данни

Най- статистически техники на корелация и регресия се използват за анализ на сдвоени данни, където коефициент на корелация количествено определя колко точно са разположени данните по права линия и измерва силата на линейната връзка.

Регресията, от друга страна, се използва за няколко приложения, включително определяне коя линия е най-подходяща за нашия набор от данни. След това този ред може да бъде използван за оценка или прогнозиране ш стойности за стойности на х които не бяха част от нашия първоначален набор от данни.

Има специален тип графика, който е особено подходящ за сдвоени данни, наречен разпръсквач. В това тип графика, едната координатна ос представлява едно количество от сдвоените данни, докато другата координатна ос представлява другото количество от сдвоените данни.

Една разсеяност на горепосочените данни ще има x-ос, обозначаваща броя на включените задачи, докато y-оста би означавала оценките при единичния тест.

instagram story viewer