测验的难度
- 含义
- 测验项目的难易程度,用P表示
- 一个测验项目,如果大部分被试都能答对,该项目的难度就小;如果大部分被试都不能答对,难度就大
计算
二分法项目的难度
通过率
项目难度
全体被试人数
答对通过该项目的人数。
极端分组法
- 当被试人数较多时,先依照测验总分排序
- 总分最高的27%的被试被称为高分组,总分最低27%的被试被称为低分组
- 分别计算高分组和低分组的通过率
然后求出项目的难度
分别代表高分组和低分组的通过率
分别代表高分组和低分组通过该项目的人数。
分别代表高分组和低分组的人数
注意 高分组、低分组的人数比例可以变化。
- 样本量大、适当减小比率
- 样本量小,适当增大比率
非二分法计分项目的难度
被试在某个项目上的平均分;
该项目的满分
测验难度水平的确定
- 对于效标参照测验和掌握测验,一般不考虑难度。(需要掌握特定的知识,不管难度高低)
- 对于选拔测验,难度最好接近录取率。
- 对于选择题来说,难度一般应大于猜测率
- 速度测验的难度不宜太高,并且每个项目的难度值都应该基本相等;难度测验要求难度值在0.50左右。
- 应该防止被试得满分
难度的等距变化
- 原因
- 难度P是顺序数据
- 难度量表是反序的
- 变化方法
- 将试题的难度P作为正态曲线下的面积,转换成具有相等单位的等距量数,即Z分数
- 因为Z分数有小数点和负值,通常需要再转换。常用的是美国国家教育测验服务中心所采用的难度指标:
- 以25为上限、1为下限,平均数为13,标准差为4(所以是等距数据,而非等比)
- 越大,难度越高,反之,难度越低。
对测验的影响
- 测验的难度会影响测验分数的分布形态
- 难度大,分布呈正偏态
- 难度小,分布呈负偏态
- 测验难度影响测验分数的离散程度
- 过难或过易的测验,会使全距缩小
- 分数全距缩小,信度就会较低
- 一般来说,难度P=0.50时,测验信度最佳