Разбиране на мащабирани резултати при стандартизирани тестове

Мащабните резултати са вид оценка на изпита. Те обикновено се използват от тестващи компании, които администрират изпити с високи залози, като приеми, сертифициране и лицензионни изпити. Мащабирани резултати се използват и за тестване на K-12 Common Core и други изпити, които оценяват уменията на учениците и оценяват напредъка на обучението.

Сурови резултати срещу Мащабирани резултати

Първата стъпка към разбирането на мащабираните резултати е да научите как се различават от суровите резултати. Суровият резултат представлява броя на изпитните въпроси, на които отговаряте правилно. Например, ако на изпита има 100 въпроса, а вие получавате 80 от тях правилни, вашата сурова оценка е 80. Вашият процент-правилен резултат, който е вид суров резултат, е 80%, и вашият клас е В-.

Мащабиран резултат е суров резултат, който е коригиран и преобразуван в стандартизирана скала. Ако вашият суров резултат е 80 (защото имате 80 от 100 правилни въпроса), този резултат се коригира и превръща в мащабиран резултат. Суровите резултати могат да бъдат конвертирани линейно или нелинейно.

instagram viewer

Пример за мащабиран резултат

Най- ACT е пример за изпит, който използва линейна трансформация за преобразуване на сурови резултати в мащабирани резултати. Следващата диаграма за разговори показва как суровите резултати от всеки раздел на ACT се трансформират в мащабирани резултати.

Суров резултат английски	Материал за сурови резултати	Четене на сурови резултати	Наука за сурови резултати	Мащабиран резултат
75	60	40	40	36
72-74	58-59	39	39	35
71	57	38	38	34
70	55-56	37	37	33
68-69	54	35-36	-	32
67	52-53	34	36	31
66	50-51	33	35	30
65	48-49	32	34	29
63-64	45-47	31	33	28
62	43-44	30	32	27
60-61	40-42	29	30-31	26
58-59	38-39	28	28-29	25
56-57	36-37	27	26-27	24
53-55	34-35	25-26	24-25	23
51-52	32-33	24	22-23	22
48-50	30-31	22-23	21	21
45-47	29	21	19-20	20
43-44	27-28	19-20	17-18	19
41-42	24-26	18	16	18
39-40	21-23	17	14-15	17
36-38	17-20	15-16	13	16
32-35	13-16	14	12	15
29-31	11-12	12-13	11	14
27-28	8-10	11	10	13
25-26	7	9-10	9	12
23-24	5-6	8	8	11
20-22	4	6-7	7	10
18-19	-	-	5-6	9
15-17	3	5	-	8
12-14	-	4	4	7
10-11	2	3	3	6
8-9	-	-	2	5
6-7	1	2	-	4
4-5	-	-	1	3
2-3	-	1	-	2
0-1	0	0	0	1

Източник: ACT.org.

Процесът на приравняване

Процесът на мащабиране създава базова скала, която служи като еталон за друг процес, известен като уравняване. Процесът на изравняване е необходим за отчитане на разликите между множество версии на един и същ тест.

Въпреки че производителите на тестове се опитват да запазят нивото на трудност на един тест от една версия до друга, разликите са неизбежни. Изравняването позволява на производителя на теста да коригира статистически оценките, така че средните показатели на версията един от теста е равен на средната ефективност на версия 2 от теста, версия трета на теста и така На.

След преминаване както на мащабиране, така и на приравняване, мащабираните резултати трябва да бъдат взаимозаменяеми и лесно сравними, независимо коя версия на теста е взета.

Приравняващ пример

Нека да разгледаме пример, за да видим как процесът на изравняване може да повлияе на мащабирани резултати при стандартизирани тестове. Представете си, че кажете, че вие и приятел приемате SAT. И двамата ще полагате изпита в един и същ тестов център, но ще го правите през януари, а ваш приятел ще го прави през февруари. Имате различни дати на тестване и няма гаранция, че и двамата ще вземете една и съща версия на SAT. Може да видите една форма на теста, докато вашият приятел вижда друга. Въпреки че и двата теста имат сходно съдържание, въпросите не са абсолютно еднакви.

След като вземете SAT, вие и вашият приятел се събирате и сравнявате резултатите си. И двамата получихте суров резултат 50 по математическия раздел, но вашият мащабиран резултат е 710, а оценката на вашия приятел е 700. Вашият приятел се чуди какво се е случило, след като и двамата имате правилен брой въпроси. Но обяснението е доста просто; всеки от вас взе различна версия на теста и вашата версия беше по-трудна от неговата. За да получи същия мащабиран резултат на SAT, той ще трябва да отговори правилно на повече въпроси от вас.

Производителите на тестове, които използват процес на приравняване, използват различна формула, за да създадат уникална скала за всяка версия на изпита. Това означава, че няма нито една диаграма за преобразуване в суров мащаб, която да може да се използва за всяка версия на изпита. Ето защо в предишния ни пример суров резултат от 50 беше преобразуван в 710 за един ден и 700 за друг. Имайте това предвид, когато вземате практически тестове и използвате диаграми за преобразуване, за да трансформирате суровия си резултат в мащабиран резултат.

Цел на мащабирани резултати

Суровите резултати определено са по-лесни за изчисляване, отколкото мащабните резултати. Но тестващите компании искат да се уверят, че резултатите от тестовете могат да бъдат сравнени сравнително и точно, дори ако участниците в тестовете приемат различни версии или форми на теста на различни дати. Мащабираните резултати позволяват точни сравнения и гарантират, че хората, които са взели по-труден тест, не бъдат санкционирани и хората, които взеха по-малко труден тест, не получават несправедливо предимство.