Page 80 - ALL_Рени-Дамянова-Тяло-Финал-1-280_Content_links
P. 80
k .r
r 11 (9)
kk
1 k . 1 r 11
където:
r (kk′) – корелацията на два теста с дължина k; r11 – корелацията на два теста с дължина 1.
При сравняване на коефициентите на корелация между два еквивалентни варианта на
един тест r(Х, Х′) (израз 8) и между наблюдавания и действителния бал r(х,τ) (израз 6) следва, че:
r X 2 r XX (10)
С други думи, коефициентът на корелация между действителния и наблюдавания бал не
позволява директно определяне на надеждността, тъй като действителният бал (τ) не може да
се измери пряко, но това може да се осъществи с помощта на корелацията между двата
наблюдавани резултата от еквивалентните варианти на един тест. По този начин надеждността
на един тест се изразява от степента, в която баловете се повтарят при приложените варианти
на теста. Високата надеждност на баловете с коефициенти на корелация, клонящи към +1,
показва, че получените балове от различните еквивалентни (паралелни) варианти ще бъдат
почти еднакви. Смисълът на тази основна характеристика на измерителните качества на един
тест се състои в отговор на въпроса доколко индивидуалните балове се дължат на грешката от
измерването или на други фактори, различни от учебните постижения, за които е предназна-
чено измерването. При планирането и оптимизирането на тестовете основният стремеж е да се
минимализира ефектът от влиянието на нежеланите фактори. На практика при този метод на
установяване на надеждността на дидактическите тестове се предполага априори, че измене-
нията в резултатите се дължат на главния измерван признак – учебните постижения, а не на
грешката в измерването.
Третият метод за установяване на надеждността на дидактическите тестове се основава
на идеята, че всички въпроси и задачи, които съставят структурата на един тест или са обеди-
нени в различни негови части, наречени „скали на теста“, са вътрешно съгласувани и из-
мерват едни и същи учебни постижения в една или няколко области. В случая се има предвид
това, че един тест може да бъде предназначен за измерване на учебните постижения в конк-
ретна област или в част от нея, както и за измерване на учебните постижения в няколко съвсем
различни области като история, география, математика, физическо възпитание и др., чиито
въпроси са обединени в отделни скали, съставляващи този тест (тест от типа „Survey
Test“). В тези случаи общият бал на теста се получава от баловете на съставящите го въпроси
(и респ. баловете на включените в него скали) по израза:
X1 = Y 1 + Y2 + ............ Yn,
където:
n – брой на задачите в теста;
Х1 – общ бал на теста;
Yi – бал в i-тата задача.
Ако компонентът на грешката в измерването на всяка една задача е чисто случайна вели-
чина, то може да се предвиди, че при сумирането на отделните балове от задачите тези грешки
взаимно ще се неутрализират и очакваната средна стойност на грешката в целия тест ще бъде
нула. В същото време, когато сумираме баловете от всички задачи, вторият компонент (дейст-
вителният бал) остава непроменен, а това на практика означа, че добавянето на повече
задачи в един тест ще се отразява в по-голяма степен върху действителния бал. Обикновено
78