Page 87 - ALL_Рени-Дамянова-Тяло-Финал-1-280_Content_links
P. 87

Практическите последствия от този основен постулат от класическата теория на тес-
            товете означават, че по принцип трябва да се очаква, при равни други условия, по-ниска
            степен  на  надеждност  на  тестовете,  приложени  при  хомогенни  групи  от  лица  (учебна
            група, клас и др.) в сравнение с разнородни групи (различни випуски, различни класове
            и др.).
                 Третият фактор, който оказва влияние върху надеждността на тестовете, е тяхната труд-
            ност. Той логически е свързан и произтича от втория фактор, описан като вариация на резул-
            татите и възможностите на тестираните лица. Това е така, защото при един много лесен или

            при много труден тест лицата отговарят еднозначно  (еднакво)  и  на  практика  става  невъз-
            можно да се измерят индивидуалните им възможности.
                 Трудността на теста може да се дефинира като отношение между стойностите на сред-
            ния бал (μ) в едно разпределение и броя на въпросите в теста (n). Колкото повече стойностите
            на μ клонят към броя на въпросите n, толкова по-лесен става тестът. При един максимално
            кратък тест, когато μ става равно на n (и ако предположим, че всеки въпрос носи по една точка
            към общия бал), всички лица биха отговорили вярно на всички въпроси. В този случай няма да
            има разлика в получените балове, вариацията ще е ниска, а това ще понижи и степента на на-
            деждност на теста. Подобен ефект ще има и ако тестът е много труден и тестираните не могат
            да отговорят на поставените въпроси. При това много трудните тестове провокират тактиката
            на чисто случайното налучкване на отговорите и разсейването на резултатите в този случай ще
            бъде случайна величина, свързана с измерваната променлива величина или по-точно с латен-
            тния признак – действителните учебни постижения.
                 По тази причина създаването на един добър тест по отношение на трудност (калибрирането
            на тестовете) по същество представлява решаване на една оптимизационна задача, а добрата
            трудност на тестовете се дефинира като „оптимална трудност“ (за подробности вж. също част

            2, гл. VII).
                 Четвъртият фактор, който оказва влияние върху степента на надеждност на един дидакти-
            чески тест, е броят на въпросите, включени в него. С намаляването на броя на въпросите на
            практика се понижава  възможността  за изменение на  положението  на едно тестирано лице
            спрямо останалите в групата (т.е. вариацията в подреждането  и  ранговите  номера  намалява).
            Например  вариацията  в  един  тест, съставен от един въпрос, е силно ограничена в интервала
            от 0 до +1. По принцип увеличаването на броя на въпросите води до по-стабилни и точни из-
            мервания на действителните  учебни  постижения,  за  които  съдим  от  наблюдаваните  балове,
            и представлява най-ефективният метод за повишаване на надеждността на един дидактически
            тест. Трябва да се има предвид обаче фактът, че един дълъг тест (с голям брой въпроси) все още
            не означава автоматично и висока надеждност.
                 Едно от основните предположения в този случай се гради върху допускането, че увеличе-

            ният брой въпроси ще се постигне с прибавянето на такива нови въпроси, чиито измерителни
            характеристики са близки или подобни на въпросите от първоначалния тест (за подробности
            вж. част II, VII).
                 За установяване на оптималния брой въпроси, които гарантират при равни други условия
            необходимата (желаната) степен на надеждност, може да се използва формулата на Spearman–
            Brown (израз  9).  Тази  формула  показва,  че  надеждността на един тест ще се повишава дото-
            гава, докогато прибавените към него въпроси са с подобни измерителни характеристики на
            въпросите от оригиналния тест  и  съответно  имат  принос  към  измерването  на  един  и  същ


                                                           85
   82   83   84   85   86   87   88   89   90   91   92