Page 200 - ALL_Рени-Дамянова-Тяло-Финал-1-280_Content_links
P. 200
като много съществен за подготовката на кадрите. В конкретния случай това не е така. Въпро-
сът не спада към последната категория и при една ревизия на теста той трябва да бъде заменен
от друг, по-съществен въпрос с по-добри качества. Това ще повиши надеждността и иконо-
мичността на теста.
Обобщеният сравнителен анализ на 4-те теста, генерирани чрез случаен избор на въпро-
сите с избираем отговор от общата банка, ни позволи да установим:
измерителните характеристики на цялата банка от въпроси с избираем отговор;
средните измерителни качества на 4-те паралелни варианта тестове за семестриален
изпит;
наличието или липсата на еквивалентност на качествата на 4-те теста, т.е. доказателст-
вото на хипотезите за достоверността на разликите в трудността на тези тестове.
От обобщения сравнителен анализ на измерителните качества на паралелните тестове се
вижда, че:
всички варианти имат много добра разграничителна способност
[средноаритметичната на индексите на дискриминация – (d = 0.954)];
оптимална трудност [среден индекс на трудност (Т = 51%)];
достатъчно висока надеждност [α на Cronbach е в диапазона от
0.954 до 0.984)].
За да установим дали е вярна нулевата (Н0 : μ - μ = 0) или алтернативната (Н : μ - μ ≠
2
1
2
1
1
0) хипотеза относно разликите в средните балове, постигнати в четирите теста ( X = 27.21 т.;
1
2
X = 25.58 т.; X = 25.52 т. и X = 26.07 т.), използвахме χ – критерия на Van der Varden.
3
4
2
Изборът му се основава на факта, че при семестриалния изпит са изпълнени и трите усло-
вия за коректното приложение на този критерий: 1. разпределението на баловете е различно от
нормалното; 2. извадките са независими; 3. променливата величина не е качествена и спада към
преходната към метричните скали – рангова скала. Подобно на резултатите от първите два ек-
сперимента, проведени с различен брой тестове с открити отговори, и в този случай се оказа,
че с гаранционна вероятност над 95% трябва да се приеме за вярна нулевата хипотеза. Това
означава, че разликите между средните балове, постигнати в отделните варианти, не са статис-
тически значими и следователно използваният случаен подбор на въпросите в тестовете пос-
тавя при еднакви условия всички изпитани студенти, тъй като те са еквивалентни по отно-
шение на основното си измерително качество – трудност.
По-важното в конкретния случай е, че приложените анализи могат да послужат като при-
мерен модел за процедиране на всички колеги спортни педагози, които трябва да установят
еквивалентността на измерителните качества на използваните от тях паралелни тестови вари-
анти, използвани за семестриален изпит в дадена учебна дисциплина или отделна нейна сфера.
Разпределенията на баловете в три от тестовете леко се отклоняват от нормалното разпре-
деление, а в един от тях е доказано асиметрично и с понижен ексцес при α < 0.05. В този случай
коректното оценяване на крайните резултати на тестираните лица трябва да се извършва със
скали и методи, които не предполагат наличието на нормално разпределение на баловете.
Коректното процедиране при използването на един или няколко паралелни тестови вари-
анта за оценка на учебните постижения изисква не само да се установят измерителните им
качества по обективните данни от постигнатите балове в предварително проведените тестира-
ния, но и да се сравнят тези данни със субективните възприятия на тестираните лица за из-
ползваните тестове и за техните предпочитания към една или друга форма на провеждане на
изпитите (устна, тестова, решаване на задачи и възможните им комбинации).
198