Page 210 - ALL_Рени-Дамянова-Тяло-Финал-1-280_Content_links
P. 210
7.6.3. Апробация на методика III
Апробацията на методиката целеше да се установи ефектът от създадената методика за
генериране на евристично моделирани тестове от банки с установени измерителни характерис-
тики и ефекта от оптимизацията на създадените емпирични модели на тестове.
Поставянето на тази цел стана възможно благодарение на опита и данните, натрупани в
продължение на близо 17 години изследователски труд, свързан с изучаване на теорията и прак-
тиката на дидактическите тестове, и извършените апробации на двете банки от въпроси по
„Статистически методи в спорта“.
Оптимизационната задача, която си поставихме, изисква от банката от въпроси да се под-
берат тези, които имат оптимална трудност, висока дискриминация и корелация с общия бал,
добре функциониращи дистрактори. При това съотношението на въпросите в тестовете за се-
местриален изпит трябва да отговаря на съотношението и на обема от изучаваните раздели по
тази дисциплина и на тяхното разпределение в акредитираните учебни планове на НСА „Васил
Левски“.
Ограничителните условия на тази оптимизационна задача са свързани с дължината на тес-
товете, която, от една страна, влияе положително върху надеждността му, а от друга, снижава
неговата икономичност, като удължава времето за администрирането му. Към всичко това
трябва да прибавим и факта, че максимализирането на надеждността на един тест изисква да
се подбират тестови задачи с колкото е възможно по-висока интеркорелация (т.е. задачите в
една скала на теста или в теста да са хомогенни и да измерват една-единствена променлива
величина). В същото време трябва да се отчете и фактът, че именно високата хомогенност на
задачите понижава валидността на тестовете. От теорията на тестовете е известно, че валид-
ността на теста е толкова по-висока, колкото задачите в него са с по-ниска корелация помежду
им и с висока корелация по отношение на някакъв външен критерий. По този начин удовлет-
воряването на условията за повишаване на надеждността е в противоречие с удовлетворяването
на условията, свързани с повишаването на неговата валидност.
От сравнителния анализ на теорията и практиката на дидактическите тестове, в част 1,
стана ясно, че един от възможните подходи за решаване на тази оптимизационна задача е въ-
веждането на различни тегла на всеки въпрос в теста. Този подход има както своите апологети,
така и своите противници – W. Pophan и др. [14, 254–256]. Последните предлагат, вместо да
се приписват различни тегла на значимите и трудни въпроси, да се увеличи относителният им
дял при конструирането на теста.
Резултатите от нашите изследвания в рамките на първия и втория експеримент също до-
казаха, с висока гаранционна вероятност, наличието на положителна корелационна зависимост
между „трудността“ и „значимостта“ на тестовите въпроси. Наличието на такава доказана за-
висимост между двата признака оправдава въвеждането на различни тегла за въпросите, оце-
нени на експертен принцип по някаква подходяща скала (3-степенна, 5-степенна и т.н.). По
тази причина при решаването на първата задача в този експеримент възприехме за напълно
правомерно въвеждането на тегла в използвания линеен модел на тестовете за семестриална
оценка. За целта използвахме тристепенна скала. Теглата на всеки въпрос бяха поставени въз
основа на експертната им оценка, като много трудните и важни въпроси получиха тегло 3 т., а
важните, но лесни въпроси – тегло 1 т.
208