Page 104 - 6285
P. 104
Похибка вимірювання зменшується при збільшенні кілько-
сті завдань у тесті. Теорія припускає, що при спрямуванні кіль-
кості завдань до нескінченності можна знайти справжнє значен-
ня величини рівня знань студента. Зрозуміло, що такою ідеалі-
зацією підкреслюється необхідність проведення великої кілько-
сті випробувань студентів і завдань у тесті. Отже, експеримен-
тальні дані отримують із статистичних досліджень, а для харак-
теристики рівня знань студента можна застосовувати такі стати-
стичні параметри, як середнє значення X і дисперсію [37].
Дисперсія спостережуваних тестових балів х складається із
дисперсії істинних значень t і дисперсії помилок е:
2 2 2
x t e . (4.2)
Цими самими параметрами визначається коефіцієнт надійності
тесту К:
2
t
K . (4.3)
2
x
Якщо це відношення близьке до 0, то інтерпретація результатів
є ненадійною; якщо коефіцієнт К близький до 1, то він є макси-
мально надійним. Висока надійність свідчить про прийнятну
повторюваність результатів тестування в однакових умовах. Та-
ким чином, надійність тісно пов'язана із похибкою тестових ви-
мірювань. Похибку можна розрахувати, спостерігаючи за розки-
дом балів, що виявляють у низці повторних тестувань (чим
менший розкид, тим менше похибка). Надійність тесту характе-
ризує його точність як вимірювального інструменту. Результати,
отримані при застосуванні тесту з невідомою надійністю, не
можуть бути коректно інтерпретовані.
Надійність характеризує як стійкість, так і узгодженість ре-
зультатів вимірювань. Під узгодженістю розуміють збереження
співвідношень між результатами виконання конкретних тесто-
вих завдань і тестів загалом за послідовного проведення низки
тестувань. Наприклад, це може бути узгодженість результатів,
що показали одні й ті самі студенти при повторному тестуванні
з використанням одного й того ж самого тесту або його парале-
льної форми. Паралельними формами тестів називаються такі
тести, що мають однотипний зміст та однакову кількість за-
104