信度的估计方法
重测信度
- 定义:用同一个量表对同一组被试施测两次所得结果的一致性程度。
- 计算:皮尔逊积差相关
- 误差来源
- 所测得特质的稳定性
- 两次测量的时间间隔
- 成熟、知识的积累、联系和记忆效果等存在个体差异
- 测验过程中的偶发因素
- 使用的前提条件
- 所测量的心理特质必须是稳定的
- 遗忘和练习的效果基本上相互抵消;
- 两次测验的间隔期内,被试在所要测查的心理特质方面没有获得更多的学习或训练
- 注意事项
- 一个测验可以有不止一个重测信度;
- 测验速度、人格测验这类题量较大的测验适合重测信度
- 在报告重测信度时,应报告间隔时间的长度。
副本信度
- 定义 指两个平行测验测量同一批被试所得结果的一致性程度。
- 如果两个副本测验是同时连续施测,称为等值性系数。
- 如果两个副本测验是相距一段时间分两次施测的,则成为稳定性与等值性系数。
- 计算 皮尔逊积差相关
- 误差来源
- 两个平行测验本身是否等值;
- 被试的情绪波动、动机变化
- 测验情境的变化
- 偶发因素的干扰等
- 使用前提条件
- 首先要构造出两份或两份以上真正平行的测验
- 被试要有条件接受这两个测验。
- 评价
- 优点 副本信度的应用相对再测信度广泛
- 局限
- 如果研究的行为收到练习和记忆的影响很大,则使用副本只能减少但不能消除这种影响
- 测验的性质会由于重复而有所改变
- 编制真正的副本测验很困难
分半信度
- 定义 将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。
- 计算步骤
- 皮尔逊积差相关
- 校正公式
- 两半测验分数的变异相等: 斯皮尔曼-布朗公式:
- 两半测验分数的变异不等
- 弗朗那根公式
- 卢仑公式
- 误差来源
- 题目本身,两半测验的内容取样不同
- 有牵连的题目放在同一半
- 使用前提
- 分半信度通常是只能施测一次或没有副本的情况下使用
- 当一个测验无法分成对等两半时,分半信度不宜使用
- 注意事项
- 有牵连的题目(几个题目都是基于同一个材料)要放在同一半,否则会高估信度
- 不适用于速度测验
- 由于将一个测验分半的方法很多(按题号奇偶,按题目难易,按题目内容等),因此同一个测验通常有多个分半信度
同质性信度
- 定义 也叫内部一致性系数,指测验内部所有题目的一致性程度
- 题目的一致性含有两层意思
- 所有题目的测的都是同一种心理特质;
- 所有题目得分间有较高的正相关
- 测量单一特质是同质性高的必要条件,而非充分条件。
- 题目的一致性含有两层意思
- 计算
- 公式
- 仅适用于0,1计分的测验
题目数
答对第题的人数比例
答错第题的人数比例
测验总分的变异
- 仅适用于0,1计分的测验
- 公式
- 要求所有题目难易程度接近时使用
- 和一样仅适用于0,1计分的测验
题目数
题目的平均通过率
题目的平均失败率
测验总分的变异
- 克隆巴赫系数
- 相当于将所有可能的分半系数求出,得出平均数(是信度的最小值)
- 不要求测验是0,1计分,可以初一任何测验的内部一致性系数的计算问题
题目数
所有被试在第i题上的分数变异
测验总分的变异
- 荷伊特信度
- 利用方差分析的原理
- 公式
- 误差来源
- 内容取样
- 行为的异质性
- 注意事项
- 不是所有测验都要求较高的同质性信度
- 测验只施测一次,可以排除记忆和联系的效果
- 内部一致性的评估只可在测量单一特质的测验上使用
- 当内部一致性估计应用在速度测验上时,会有信度估计膨胀的现象。
评分者信度
- 定义 多个评分者对同一批人答卷进行评分的一致性程度。
- 计算
- 评分者人数=2:
- 积差相关
- 等级相关
- 评分者人数 > 2:肯德尔和谐系数
- 评分者(K)为3~20人,被评对象(考卷N)为3~7个时,信度是否符合要求可以直接查阅W表检验
- 评分对象>7时,可计算值,进行检验
- 评分者人数=2: