Page 111 - ALL_Рени-Дамянова-Тяло-Финал-1-280_Content_links
P. 111
4. 2. НАДЕЖДНОСТ
Един от подходите за установяване на степента на надеждност на критериално-ориенти-
раните дидактически тестове е описаният вече метод „тест–ретест“. За разлика от класичес-
ката теория на нормативните тестове, където степента на надеждност се оценява чрез коре-
лацията на постигнатите от двете тестирания резултати от целите изследвани представи-
телни извадки, при установяване на надеждността и стабилността на критериалните тестове
се търси зависимостта единствено между резултатите на лицата, постигнали поставените
учебни цели. За надеждността на критериалните тестове обикновено се съди от тяхната ста-
билност, от еквивалентността на тестовите резултати и от отклонението на резултатите от
критерия за „успешност“.
За установяване на стабилността на резултатите много подходящо е да се използват поз-
натите статистически методи χ-квадрат или коефициентът за алтернативно номинално скали-
рани величини Ф и респ. таблицата на 4-те полета [22, 23]. Много съществен момент тук е
прецизното експертно дефиниране на границата, която ще раздели тестираните лица на ус-
пели–неуспели (над и под средното равнище или над и под допустимия минимум) в зависимост
от обема от знания в съответствие с поставените образователни цели. Този проблем излиза от
територията на конструирането на самите тестове (критериални или нормативни), но е пряко
свързан с възможните загуби от вземането на неправилни решения като следствие от анализа
на крайните резултати от тестирането.
За определяне на еквивалентността на тестовите резултати като показател за надежд-
ността на тестовете може да се използват описаните методи: „сплитхалф“ и паралелни вари-
анти на един тест, χ-квадрат или някои от специално разработените за критериалните тестове
коефициенти.
Доколкото „сплитхалф“ методът и паралелните тестове вече бяха подробно анализирани,
а χ-квадрат е добре известен на специалистите педагози, ще се спрем по-детайлно на следните
коефициенти: Ű-коефициент на R. Frike, Ű-коефициент на К. Linden и κ-коефициент на J.
Cohen (Cohen’s kappa– „Капа“ на Коен).
Ű-коефициентът на R. Frike [188, 189] се изчислява, като:
SS
U 1 , (31)
MaxSS
където:
SS – квадрат на сумата от тестовите резултати;
MaxSS – максимално възможен квадрат на сума от тестови резултати.
От израз (31) се вижда, че липсва вариация, когато резултатите на всички тестирани са
еднакви, следователно квадратът на сумата ще бъде равен на 0, а Ű-коефициентът ще заеме
стойност 1. Коефициентът не може да заема отрицателни стойности, т.е. той варира от 0 до +1.
Стойността му е 0, когато квадратът на сумите се изравни с максимално възможния квадрат на
сумите, с други думи, когато вариацията между оценяваните обекти е максимална. При стой-
ност на Ű- коефициента, равна на +1, говорим за идеална оценителна възможност, а при Ű
равен на 0 – за „минимални” възможности.
Коефициентът Ű на R. Frike може да се използва само при алтернативно скалирани
величини, каквато в случая е оценката на тестираните от типа „да–не“. За такива дихотомни
величини може да се прилага и коефициентът на конкордация, наречен още Ű на К. Lidner [223,
224]:
109