实验设计
实验设计的定义
- 实验设计指进行科学实验前的具体计划,包括控制实验条件及安排实验程序
- 设计的注意事项
- 选取能引起反应差异最大的自变量间距及检查点
- 控制好各种影响实验结果的无关变量
- 控制随机误差,使实验中的误差变异最小。
实验设计的评价标准
- 有没有解决要解决的问题
- 有没有很好地控制额外变量
- 效度高不高
- 被试样本和情境是否有代表性
实验设计的类型
单因素设计和多因素设计
- 多因素设计的优点
- 可以计算多个自变量的交互作用,这是单因素的设计无法做到的。
- 多因素设计更易于控制额外变量,实验情境也更接近真实情境,利于推广
被试间设计、被试内设计和混合设计
- 主要区别 被试接受实验处理的种类数;实验是否控制个体的差异
- 被试间设计对无关变异的控制不够理想,因为被试间不可避免的差异会影响实验设计的结果。被试间设计需要用到大量被试,在实际操作中和从经济角度来看没有优势。
- 被试内设计比较常用。但如果存在练习效应,或在实验处理后,被试的状态不能恢复到实验处理前的水平,就不要用被试内设计
真实验、非实验和准实验设计
- 主要区别是对变量的控制情况和控制水平的高低
- 真实验以数理统计为基础,能对各种无关变量进行周密的控制。
- 非实验设计不能满足真实验设计所需的随机选择和分配被试的原则,也不能操纵自变量和控制额外变量,因此很难根据实验有效推断出自变量和因变量之间的因果关系。非实验设计一般在真实验和准实验之前用作对假设的初步验证
- 准实验设计介于两者之间。它无法用随机化原则来分配被试,但是可以严格操纵自变量和控制额外变量,适用更广泛的研究
- 从非实验到实验是一条连续的线,是从无法控制逐渐向严格控制过度。
| 随机选择和分配被试 | 严格操纵自变量和控制额外变量 | |
|---|---|---|
| 真实验设计 | √ | √ |
| 准实验设计 | × | √ |
| 非实验设计 | × | × |
非实验与准实验设计
单组后测设计
- 评价
- 没有对照组,研究者只能描述所观察到的结果
- 没有前测,失去了与前测进行比较的依据
- 容易出现自变量混淆
- 很难排除历史、选择和成熟等作用的影响
- 例子
- 吃了东西,拉肚子
- 教学,考试得高分
- 评价
事后追溯设计
- 在所研究的现象发生后对其发生原因进行追溯,适用于自然条件下对简单因果关系的研究,可以避免人为作用所带来的干扰
- 相关研究设计 在一个被试组收集两个集合的数据,一个是观察到的结果,另一个是被追溯的变量,确定两种变量之间的相关关系
- 准则组设计 研究者通过对所研究对象的被试比较,确定某些被试,即准则组,具有一种状态的特征;而另一些被试,即非准则组,不具备这种状态的特征,然后追溯可能的原因。
- 例子
- 肺癌与吸烟的关系
- 新冠感染与基础疾病的关系
- 在所研究的现象发生后对其发生原因进行追溯,适用于自然条件下对简单因果关系的研究,可以避免人为作用所带来的干扰
单组前后测设计
- 评价
- 前测可以提供被试的基线数据以及某些有关的信息
- 设计中只有一个实验组,自身兼做控制组
- 很难排除历史、选择和成熟等作用的影响
- 例子
- 考试——训练——考试
- 评价
单组时间序列设计
- 评价
- 较好地控制“成熟”的影响
- 可控制测量因素的影响,多次测量降低了一次测验造成实验结果偏离的概率
- 可以较好地控制统计回归的影响
- 无控制组,很难对其他额外变量加以控制
- 多次前测可能降低或增加被试对测试的敏感性
- 例子
- 做题-做题-做题-做题-看书-做题-做题-做题-做题
- 评价
单组相等时间样本设计
- 评价
- 较好地控制历史因素、测量因素、统计回归
- 多次测量降低或增加了被试对实验变量的敏感词
- 重复实验处理产生干扰,实验安排产生反作用
- 评价
不等组后测设计
- 评价
- 由于使用了控制组,所以能对历史和成熟因素进行控制
- 没有前测,所以能控制测验效应和仪器因素干扰
- 对选择及选择与成熟的交互作用缺少控制
- 例子
- 评价
不等组前测-后测设计
- 评价
- 基本控制了历史、成熟、测验等因素的干扰
- 了解实验前的状态,初步控制了选择因素
- 实验组与控制组不相等
- 选择与成熟、选择与处理之间可能存在交互作用
- 例子
- 评价
不等组前测-后测时间序列设计
- 评价
- 基本控制了选择、历史、成熟、测验等因素的干扰
- 测验存在反作用
- 选择与处理之间存在交互作用
- 例子
- 评价
交叉滞后组相关设计
- 首先获得随时间变化的若干相关系数,然后依据这些相关系数的大小和方向,确定是什么因素导致了什么结果。

- 评价
- 适合研究单向的因果关系
- 研究一些无法控制的因素关系时较为适用
- 首先获得随时间变化的若干相关系数,然后依据这些相关系数的大小和方向,确定是什么因素导致了什么结果。
真实验设计
随机实验组控制组后测设计
- 评价
- 控制了历史、成熟、回归的影响
- 控制了测验与实验处理的交互作用
- 统计方法
- 可以使用独立样本t检验对和的差异进行检验
- 评价
随机实验组控制组前后测设计
- 评价
- 控制了历史、成熟、测验、仪器、回归的影响
- 前测会影响外部效度
- 前测可能会引发一些反作用
- 统计方法
- 对被试前后测的差异进行独立样本t检验
- 或进行两因素混合设计方差分析(前后测×实验/控制)
- 评价
实验组控制组匹配
- 步骤
- 将被试按某一个或几个特征上水平的相同和相似加以匹配(一般需要进行前测),然后再把每一对中的每个被试随机分配到各个组别。前测的内容必须和实验作业高度相关。
- 对动物匹配的技术:拆窝技术
- 评价
- 不可能对每个特征都进行匹配,匹配是不完全的;
- 耗时耗力
- 匹配多个特征时,若特征间存在交互作用,可能混淆结果
- 需要防止向平均数回归的问题
- 步骤
单因素随机区组设计
- 评价
- 不仅能反映实验处理的效果是否显著,还能看到自变量对因变量影响的量化过程;
- 被试分配、实验处理分组、组织实施更困难
- 统计方法困难
- 评价
单因素组内设计
- 评价
- 以自己为对照条件,优点
- 一种实验条件下的操作会影响另一种实验条件下的操作
- 会产生疲劳效应或练习效应
- 改进
- 对于每一个被试随机安排实验条件的顺序
- 采用抵消平衡法(ABBA、拉丁方) 抵消顺序产生的效应
- 统计方法
- 相关样本t检验或单因素重复测量方差分析
- 评价
所罗门四组设计/重叠实验设计
- 评价
- 兼具实验组控制组后测设计、实验组控制组前后测设计的优点
- 对实验处理效果进行了两次检验,可以确认实验处理效果
- 可以检验测验与处理的交互作用
- 同质被试难选,程序复杂
- 统计方法 方差分析
- 因素设计(关于两个或多个自变量的实验设计)
- 组间设计
- 被试间设计
优点
- 在一个水平上能获得大量数据
- 被试在短时间内完成实验,避免产生厌烦情绪或对实验失去兴趣
- 排除练习效应和疲劳效应
- 避免平衡顺序效应的复杂操作
- 通过对不同处理组的被试匹配,保证各实验处理组为等组被试
- 被试的随机化分配可以减少被试的反应偏向
缺点
- 尽管进行了匹配,被试间仍有差异的可能
- 需要更多的被试
- 花费更多的人力和时间
- 匹配过程有前提条件,不能存在练习和迁移效应,否则结果会不可靠
- 匹配过程花费时间和精力
- 被试间设计
- 组内设计
- 被试内设计
优点
- 节省了被试的人数
- 个体差异得到很好的控制
- 更好地考察不同组数据之间的差异
缺点
- 在不同水平的处理之间如果存在时间间隔,需要警惕偶然事件的影响。
- 和时间顺序有关的误差可能混淆进来,如疲劳效应、练习效应
- 被试内设计
- 混合设计
- 随机分配到A1处理和A2处理
- 然后均进行B1、B2和B3处理
- 组间设计
小样本设计
- 心理学的典型实验室测量大样本的行为,因为大样本能够消除被试个体差异对因变量产生的影响
- 小样本设计也是被试内设计的一种变式
ABA设计
- 步骤
- 先确定研究变量的基线水平,即在没有任何实验处理条件下被试的心里指标所处的一个相对恒定不变的水平;
- 之后根据被试的基线水平设计自变量的不同水平,并对被试进行相应的实验处理,进而发现被试对实验处理的反应,研究不同水平实验处理的效应是否显著
- 前提 B阶段的处理效果不持久
例

- 步骤
多基线设计
- 步骤
- 找到一个或若干个与所要研究的行为(或被试)接近的行为(或被试),在不同时间内对它们引入同一自变量的处理
- 例

- 步骤
被试样本的大小问题
- 考虑因素
- 某个研究领域传统上使用多少被试
- 感知觉实验 几个、十几个
- 动物实验 一组2~4只
- 社会心理学 几十名~几千名
- 计划采用何种统计分析
- 预期样本变异较大,则需要更多的被试
- 考试时,一组>30
- 某个研究领域传统上使用多少被试