Определение и примери за анализ на вторични данни

Вторичният анализ на данни е анализът на данните, събрани от някой друг. По-долу ще разгледаме дефиницията на вторичните данни, как могат да бъдат използвани от изследователите, както и плюсовете и минусите на този тип изследвания.

Ключови заведения: Вторичен анализ на данни

  • Първичните данни се отнасят до данни, които изследователите са събрали сами, докато вторичните данни се отнасят до данни, които са били събрани от някой друг.
  • Вторичните данни са достъпни от различни източници, като правителства и изследователски институции.
  • Въпреки че използването на вторични данни може да бъде по-икономично, съществуващите масиви от данни може да не отговарят на всички въпроси на изследователя.

Сравнение на първични и вторични данни

В социално-научните изследвания термините първични данни и вторични данни са общоприето слово. Първичните данни се събират от изследовател или екип от изследователи за конкретната цел или анализ, който се разглежда. Тук изследователски екип замисля и разработва изследователски проект, решава за

instagram viewer
техника за вземане на проби, събира данни, предназначени за справяне с конкретни въпроси, и извършва свои собствени анализи на данните, които са събрали. В този случай хората, участващи в анализа на данните, са запознати с дизайна на изследването и процеса на събиране на данни.

Вторичен анализ на данниот друга страна е използването на данни, които беше събрана от някой друг за някаква друга цел. В този случай изследователят поставя въпроси, които са разгледани чрез анализа на набор от данни, които не са участвали в събирането. Данните не бяха събрани, за да отговорят на специфичните изследователски въпроси на изследователя, а вместо това бяха събрани с друга цел. Това означава, че един и същ набор от данни всъщност може да бъде първичен набор от данни за един изследовател, а вторичен набор от данни към друг.

Използване на вторични данни

Има някои важни неща, които трябва да се направят, преди да се използват вторични данни за анализ. Тъй като изследователят не е събрал данните, за тях е важно да се запознаят с набора от данни: как са събрани данните, какви са категориите отговори за всяка въпрос дали е необходимо да се прилагат теглата по време на анализа, дали трябва да се отчитат струпвания или стратификация, чия популация е изследвана, и Повече ▼.

Голяма част от вторичните ресурси и набори от данни са на разположение за социологически изследвания, много от които са публични и лесно достъпни. Най- Преброяване на САЩ, the Общо социално проучване, и на Проучване на американската общност са някои от най-често използваните налични вторични набори от данни.

Предимства на вторичния анализ на данните

Най-голямото предимство на използването на вторични данни е, че може да бъде по-икономично. Някой друг вече е събрал данните, така че изследователят не трябва да отделя пари, време, енергия и ресурси за тази фаза на изследване. Понякога вторичният набор от данни трябва да бъде закупен, но цената почти винаги е по-ниска от разходите за събиране на подобно набор от данни от нулата, което обикновено включва заплати, пътуване и транспорт, офис пространство, оборудване и други режийни разходи разходи. Освен това, тъй като данните вече са събрани и обикновено се почистват и съхраняват в електронен формат, изследователят може да прекара голяма част от времето си анализ на данните вместо да подготвим данните за анализ.

Второ основно предимство на използването на вторични данни е широчината на наличните данни. Федералното правителство провежда многобройни проучвания в мащабен, национален мащаб, за които отделните изследователи биха били трудни за събиране. Много от тези набори от данни също са надлъжен, което означава, че същите данни са събрани от едно и също население през няколко различни времеви периоди. Това позволява на изследователите да разгледат тенденциите и промените на явленията във времето.

Трето важно предимство на използването на вторични данни е, че процесът на събиране на данни често поддържа ниво на експертиза и професионализъм, които може да не присъстват при отделни изследователи или малки изследователски проекти. Например събирането на данни за много федерални набори от данни често се извършва от служители, които са специализирани в определени задачи и имат дългогодишен опит в тази конкретна област и с това конкретно проучване. Много по-малки изследователски проекти нямат това ниво на опит, тъй като много данни се събират от студенти, работещи на непълно работно време.

Недостатъци на вторичния анализ на данните

Основен недостатък при използването на вторични данни е, че той може да не отговори на специфичните изследователски въпроси на изследователя или да съдържа конкретна информация, която изследователят би искал да има. Той може също да не е събран в географския регион или през желаните години или със специфичната популация, която изследователят се интересува от изучаване. Например, изследовател, който се интересува от изучаване на подрастващи, може да открие, че вторичният набор от данни включва само млади възрастни.

Освен това, тъй като изследователят не е събирал данните, те нямат контрол върху това, което се съдържа в набора от данни. Често пъти това може да ограничи анализа или да промени първоначалните въпроси, на които изследователят се опита да отговори. Например, изследовател, който изучава щастието и оптимизма, може да открие, че вторичният набор от данни включва само едно от тях променливи, но не и двете.

Свързан проблем е, че променливите може да са били дефинирани или категоризирани по различен начин отколкото би избрал изследователят. Например възрастта може да е събрана в категории, а не като непрекъсната променлива или расата може да бъде определена като „бяла“ и „друга“, вместо да съдържа категории за всяко основно състезание.

Друг съществен недостатък на използването на вторични данни е, че изследователят не знае точно как е извършен процесът на събиране на данни или колко добре е осъществен. Обикновено изследователят не е запознат с информация за това колко сериозно са засегнати данните от проблеми като ниска степен на отговор или неразбиране на респондентите от конкретни въпроси от проучването. Понякога тази информация е лесно достъпна, както е в много федерални набори от данни. Въпреки това, много други вторични набори от данни не са придружени от този тип информация и аналитикът трябва да се научи да чете между редовете, за да разкрие всякакви потенциални ограничения на данните.

instagram story viewer