Page 160 - ALL_Рени-Дамянова-Тяло-Финал-1-280_Content_links
P. 160
7.3. АПРОБАЦИЯ НА МЕТОДИКА I
7.3.1. Еквивалентност на тестовите варианти
Тогава, когато се налага да се оценяват знанията на големи групи или потоци от студенти,
е много целесъобразно и ефективно да се използват различни еквивалентни по трудност
варианти от дидактически тестове, разработени и представени на хартиен носител.
Чрез приложението на описаната в предходния раздел методика за генериране на множес-
тво от тестови варианти за контрол и оценка на знанията става възможно да се минимизира
ефектът от всички опити на тестираните лица да се възползват от неразрешени средства и
методи за преписване.
При генерирането на множество тестови варианти за контрол и оценка на знанията в да-
дена предметна област обаче съществува реалната възможност, независимо от лотарийното
изтегляне на въпросите от всеки тест, да се натрупат в един тест (случайно) голям брой лесни
или обратното – трудни въпроси. Това означава, че е напълно възможно отделните тестови
варианти да са еквивалентни по отношение на тяхната вътрешна структура и съдържание,
но да не са еквивалентни по своите измерителни характеристики (различна степен на труд-
ност и др.) и изпитваните лица да бъдат поставени и оценявани при различни условия.
Това налага, преди да бъде внедрена в редовна експлоатация всяка една система от тестови
варианти, да бъде апробирана и да бъдат установени измерителните характеристики на всеки
един от използваните варианти тестове. И тъй като технологията на подобна апробация не е
достатъчно популярна, а може успешно да се приложи във всички учебни дисциплини, ще я
илюстрираме с няколко примера от областта на тестовете за контрол на знанията по „Статис-
тически методи в спорта“.
7.3.2. Установяване на еквивалентността на паралелни тестове. Експеримент I
За да се установят основните измерители характеристики (трудност, значимост и др.) на
няколко паралелни тестови варианта, разработихме собствена методика и технология и подб-
рахме необходимия за целта математико-статистически апарат, който ще илюстрираме чрез
представянето на логиката и резултатите от няколко измервания с паралелни форми тестове.
Тези измервания (тестирания) на знанията на тестираните лица са фактически серия от експе-
рименти по отношение на предлаганите методики за създаване на бази данни и използвания
инструментариум за генерирането и оптимизирането на тестовите модели.
Целта на първия експеримент е да се установят измерителните характеристики на 22 екви-
валентни по структура и съдържание варианта на тестове и впоследствие те да се калибрират.
В тези 22 варианта бяха обхванати 728 въпроса. Разликата между броя на въпросите в общата
банка и въпросите в 22-ата варианта се дължи на факта, че прекомерното увеличаване на вари-
антите на еквивалентните тестове би довело до малък брой тестирани с тях лица и съответно би
повлияло негативно върху надеждността на необходимата ни информация.
Първият експеримент бе проведен през юли 1988 г. с редовните студенти от І курс в рамките
на изпитната сесия. Общият брой на тестираните лица бе n = 549. Всеки студент получи предвари-
телна инструкция за целта на експеримента и за неговия регламент. Времето за попълване на един
тест бе един академичен час.
След обработката на първичните резултати от тестовете, вкл. изброяване на честотите на вер-
ните отговори във всеки тест и на броя на тестираните студенти с дадения вариант на теста, се
изготвят два вида формуляри.
В първия формуляр се попълват получените абсолютни честоти за всеки въпрос от целия уче-
бен материал (Таблица 13).
158