корелация е важен статистически инструмент. Този метод в статистиката може да ни помогне да определим и опишем връзката между две променливи. Трябва да внимаваме да използваме и интерпретираме корелацията правилно. Едно такова предупреждение е винаги да помните това корелацията не предполага причинно-следствена връзка. Има и други аспекти на корелацията, с които трябва да бъдем внимателни. Когато работим с корелацията, ние също трябва да сме предпазливи от екологичната корелация.
Екологичната корелация е корелация, основана на средни стойности. Въпреки че това може да бъде полезно, а понякога дори е необходимо да се вземе предвид, трябва да внимаваме да не приемем, че този тип корелация се отнася и за индивидите.
Пример първи
Ще илюстрираме концепцията за екологична корелация и ще подчертаем, че не е злоупотребено, като разгледаме няколко примера. Пример за екологична зависимост между две променливи е броят на годините на образование и средният доход. Можем да видим, че тези две променливи са положително корелиращи: колкото по-голям е броят на годините на образование, толкова по-голямо е средното ниво на доходите. Би било грешка тогава да мислим, че тази корелация е валидна за отделните доходи.
Когато разглеждаме лица с еднакви образователни нива, нивата на доходите са разпределени. Ако конструираме разсейване на тези данни, щяхме да видим това разпространение на точки. Резултатът ще бъде, че връзката между образованието и доходите на отделните лица ще бъде много по-слаба, отколкото връзката между годините на образование и средните доходи.
Пример втори
Друг пример за екологична зависимост, който ще разгледаме, се отнася до моделите на гласуване и нивото на доходите. На държавно ниво по-заможните държави са склонни да гласуват в по-голяма част за кандидатите за демокрация. По-бедните държави гласуват в по-големи пропорции за републиканските кандидати. За хората тази корелация се променя. По-голяма част от по-бедните хора гласуват демократично, а по-голяма част от богатите хора гласуват за републиканци.
Пример три
Трети случай на екологична зависимост е, когато разглеждаме броя часове на седмично упражнение и средния индекс на телесната маса. Тук броят часове на упражнения е обяснителната променлива, а средният индекс на телесната маса е отговорът. С нарастването на упражненията очакваме индексът на телесната маса да се понижи. По този начин ще наблюдаваме силна отрицателна зависимост между тези променливи. Въпреки това, когато гледаме на индивидуално ниво, корелацията не би била толкова силна.
Екологична грешка
Екологичната корелация е свързана с екологичната грешка и е един от случаите на този вид заблуда. Този тип логическа заблуда заключава, че статистическо изявление, отнасящо се до дадена група, се прилага и за индивидите в тази група. Това е форма на заблудата на разделението, която греши изявления, включващи групи за отделни лица.
Друг начин, по който екологичните грешки се появяват в статистиката, е Парадокс на Симпсън. Парадоксът на Симпсън се отнася до сравнението между двама души или популации. Ще разграничим тези две от A и B. Поредица от измервания може да покаже, че променлива винаги има по-висока стойност за A, а не за B. Но когато средните стойности на тази променлива виждаме, че B е по-голямо от A.
екологичен
Терминът екологичен е свързан с екологията. Една от употребите на термина екология е да се отнася до определено клон на биологията. Тази част от биологията изучава взаимодействията между организмите и тяхната среда. Това разглеждане на индивида като част от нещо много по-голямо е смисълът, в който е кръстен този тип корелация.