第4章 各种研究设计的方差分析
1何谓实验设计?
答:实验设计是心理学实验研究的重要环节,是研究者根据研究目的而制定的实验计划、方法策略及相关的统计分析程序。它是探讨变量间因果关系的逻辑基础。
(1)实验设计的内容
①根据研究目的提出假设;②确定验证假设的方法、程序;③选择恰当的处理、分析实验观测数据的统计方法。主要作用是实现对各类变量的有效控制。
(2)实验设计基本类型
①根据是否设置对照组,可分为单组设计和对比设计;②根据分组特点和处理方式,可分为完全随机化设计和随机区组设计;③根据实验中自变量的多少,可分为单因素设计和多因素设计;④根据被试接受实验处理的特点,可分为被试间设计、被试内设计和混合设计;⑤根据实验中涉及的变量的控制程度,可分为准实验设计和真实验设计。
(3)对实验设计的评价标准
①实验设计与研究问题的匹配,即实验设计是否能恰当地、有针对性地解决研究者要解决的问题;②内部效度,即实验设计是否有效地控制了无关变量,使反应变量的变化完全由自变量决定,也即要求实验的因果关系明确;③外部效度即生态效度,要求实验结果在具备科学性的基础上,还具有普遍性,能推论到其他被试或其他情境中。
2效应模型的类型及其特点是什么?
答:效应模型是研究设计中由于自变量的取样方式不同而造成的不同研究效应类型,包括随机模型、固定模型、混合模型这三种类型,其各自的特点如下:
(1)随机模型的特点
①研究中的自变量水平是随机取样,所选各水平仅是无限多水平中的一部分有代表性的样本。
②统计推论可推广到无限总体中。
③F值的计算有区别,即在不同效应检验时,如主因素A的效应,B的效应,交互作用效应检验时,计算F值的分母项不同。
(2)固定模型的特点
①研究中的自变量总体是有限的几个固定值。所选的实验处理水平,即为处理水平的总体,例如讲演式、启发式、自学式三种教学方式的实验研究。
②推论只能涉及有限的总体。
③F值的计算一般用误差项的均方为分母,求各主效应的F值,检验其是否差异显著。
(3)混合模型的特点
①研究中所选变量中的一部分因素为有限总体,即所选自变量水平只能代表有限总体,属于固定效应模型,而另一部分因素中的各实验处理则是无限多水平中的一部分样本,属于随机效应模型。
②统计假设时,一部分因素可推广到无限总体,另一部分变量只能推论到有限总体,视具体情况而定。
③F值的计算有区别,在检验主效应及交互效应显著性上,视不同的情况及因素数目的多少有不同的计算方法。
3完全随机实验设计的特点及统计分析方法是什么?
答:完全随机实验设计的特点及统计分析方法是:
(1)完全随机实验设计的特点
①实验的因素是一个或多个,每个因素又有多个不同的实验水平,随机选取被试,又随机分组,将各组被试随机地安排到一种实验处理组之中。
②各实验处理水平,可以是随机的,也可固定,若存在两个以上因素,可有一个因素随机,一个因素固定。
③完全随机实验设计分为单因素完全随机化实验设计与多因素完全随机化设计。a.单因素完全随机设计自变量只有一个因素,因素有多种水平,被试完全随机取样,随机分组,实验效应模型只有随机模型和固定模型两种。b.多因素完全随机实验设计主要指析因设计,是指研究中的自变量有两个或两个以上的因素,每个因素各有多种水平,随机取样,随机分组的实验设计。这种设计效应模型有随机模型、固定效应模型和混合模型三种可能,统计分析时要予以特别注意。
④完全随机实验设计应具备:数据正态性、方差可加、方差齐性这三个条件。
(2)完全随机实验设计的统计分析方法
完全随机实验设计的统计分析方法是进行方差分析。
①平方和的分解与计算
a.单因素方差分析
b.多因素方差分析
②自由度的确定
a.单因素
dft=nk-1
dfb=k-1
dfw=k(n-1)
b.多因素
dft=npq-1
dfA=p-1
dfB=q-1
dfAB=(p-1)(q-1)
dfn=pq(n-1)
③均方的计算
a.单因素
MSb=SSb/dfb
MSw=SSw/dfw
b.多因素
MSA=SSA/dfA
MSB=SSB/dfB
MSAB=SSAB/dfAB
MSe=SSe/dfe
④效应模型与F检验
a.单因素
随机效应模型:F=MSb/MSw
固定效应模型:F=MSb/MSw
b.多因素(二因素为例)
随机效应模型:
FA=MSA/MSAB
FB=MSB/MSAB
FAB=MSAB/MSe
固定效应模型:
FA=MSA/MSe
FB=MSB/MSe
FAB=MSAB/MSe
混合效应模型(A随机B固定):
FA=MSA/MSe
FB=MSB/MSAB
FAB=MSAB/MSe
⑤解释
根据效应模型与F值的显著性与否进行解释。
4析因实验设计的特点及统计分析方法是什么?
答:析因实验设计的特点及统计分析方法是:
(1)析因实验设计的特点
①有多个自变量(又称因素),每个自变量有多个水平,是完全随机化设计的一种。
②相对于单因素实验设计而言,它具有实验次数少、实验精度高的优点;实验只要进行n>1次重复,就可以估计出因素间的交互作用效应。
③统计方法复杂,被试人数多。
④类型包括交叉匹配型、2k析因、3k析因。
(2)析因实验设计的统计分析方法
①数据模型(以二因素为例)
数据模型为:xijk=μ+αi+βj+(αβ)ij+∑εijk
均方期望:即均方差的组成,随不同效应模型,其均方期望值不同,随均方期望值的构成不同,F检验时,计算F值分母项的均方不同,这一点必须给予注意。
②平方和的分解与计算(以二因素析因为例)
总平方和:
A因素平方和:
B因素平方和:
交互作用平方和:
误差平方和:
③自由度的确立
dft=npq-1
dfA=p-1
dfB=q-1
dfAB=(p-1)(q-1)
dfe=(n-1)pq
④均方的计算
MSA=SSA/dfA
MSB=SSB/dfB
MSAB=SSAB/dfAB
MSe=SSe/dfe
⑤求F值
a.随机效应模型。求A、B因素的主效应时,F值的分母项为交互作用项均方,而求交互作用项效应时,F值的分母项为误差的均方。
b.固定效应模型。求各因素及交互作用项效应时,F值的分母项都为误差均方。
c.混合效应模型(以A随机B固定为例)。不同效应模型,所求F值的分母不同。求固定因素主效应,F值的分母项是交互作用项均方;求随机因素主效应,F值的分母项为误差项均方;求交互作用项效应,F值分母项为误差均方。
⑥解释
a.无次序型交互作用,即A因素的不同水平与B的不同水平下存在不同的差异,不能做出概括化的结论。两因素结果曲线在图形上相交;次序型交互作用,不同因素的不同水平呈规则性变化,可做出概括化结论,两因素结果曲线在图形上不相交,也不平行;无交互作用,即不同因素不同水平的结果是相互平行的。
b.差异显著意味着至少有一对处理组合之间的效果有差异;究竟哪一组组合有差异,须作单纯主效果检验,然后做事后检验确定。
5区组实验设计的特点及统计分析方法是什么?
答:(1)区组实验设计的特点
①区组设计使用区组方法减少误差变异,即用区组方法分离出由无关变量引起的变异,使它不出现在处理效应和误差变异中。区组设计的前提条件是自变量和无关变量之间没有交互作用。
②区组设计中,区组的表现形式为:同一被试作为一个区组,即让每个被试接受所有的实验处理;性质相同的不同团体(文化、民族、性别、年级、年龄等)都可称为区组,区组可大可小,根据研究需要确定。用配对方法的对偶组和以团体为单位的对手组,都是区组的表现形式。
③区组设计比随机实验设计更加有效,减少了实验误差,可获得对处理效应的更加精确的估价。区组设计可以用于任何处理水平数的实验中,并且区组的数量不受限制,因而具有很好的灵活性。
④区组设计的缺点是,如果实验中含有许多处理水平,可能给形成同质区组带来困难。
区组设计也有一些限定,例如,使用区组设计的前提条件是,实验中的自变量和无关变量之间没有交互作用,如果存在交互作用,使用区组设计就不合适,这在一定程度上限制了区组设计的应用。
(2)区组实验设计的统计分析方法
以单因素随机化区组设计为例,其统计分析方法如下:
①数据模型:
xij=μ+αi+βj+εij
式中;i=1,2……p,j=1,2……q(p为处理数,q为区组数)。
②假设检验:对实验因素各处理效应以及各区组效应分别进行假设检验。
H0:αi=0,βj=0
Hi:αi≠0,βj≠0
③方差分解与计算
总平方和:
处理平方和:
区组平方和:
误差平方和:
F值的计算:
FA=MSA/MSe
FB=MSB/MSe
6嵌套实验设计的特点及统计分析方法是什么?
答:(1)嵌套实验设计的特点
①嵌套设计又称阶层设计,是指下一层不同因素水平,只在其上一层因素某一水平下出现,而在另一水平下不出现的设计。
②根据因素分层的多少有不同的嵌套类型。如一级嵌套、二级嵌套、三级嵌套等。一般情况下,可有完全随机取样和重复测量等不同形式。
(2)嵌套实验设计的统计分析方法
应考虑不同的效应模型的特点对F检验的影响,步骤如下:
①计算平方和
自由度=p-1;
自由度=p(q-1);
自由度=pq(r-1);
自由度=pqr(n-1);
自由度=pqr(n-1)。
②计算均方:平方和除以自由度。
③F值的计算:用误差项均方为分母,求F值。
④查F表,解释分析结果。
7裂区实验设计的特点及统计分析方法是什么?
答:(1)裂区实验设计的特点
①研究者只关心多因素中某一因素的主效应,以及该因素与其他因素的交互作用,而对另外的一些因素主效应不感兴趣。裂区实验设计存在一个主区,一个或多个次区等不同的形式。被试为随机取样,随机安排接受主区与小区的不同实验处理组合,数据形式仍为测量数据,其特点同一般方差分析。也可以采用每一位被试接受所有小区不同实验处理的重复测量设计。
②裂区设计是一种系统分组设计,研究中将不感兴趣的因素放在系统的最上层,称为主区,另一不感兴趣的因素放在第二层称为次区。依次类推,将最感兴趣的因素放在最下层,称为小区。统计分析时,只分析小区的主效应以及小区因素与其他因素的交互作用。一般情况下,设计中的主区或次区大都为被试因素的有机体变量。该设计能更好地控制被试变量不受取样的因素的影响。
(2)裂区实验设计的特点及统计分析方法
根据裂区设计的统计分析方法是方差分析,计算步骤如下:
①平方和的计算:
②自由度的计算:
③均方的计算。
④F检验时应考虑存在不同的效应模型,审慎选择分母项应用时应予以充分注意。
8拉丁方实验设计的特点及统计分析方法是什么?
答:(1)拉丁方实验设计的特点
①拉丁方设计是指按拉丁方格安排不同因素水平的一种多因素实验设计。它要求实验中的因素水平数相等,一般情况下,其中一个因素为研究因素,另外一个因素为控制因素。
②实验设计时根据实验处理数目选用不同阶数的拉丁方格,挑选的标准最好是能平衡不同搭配所带来的顺序误差。
③被试区组要与实验处理数目相匹配。
④每个处理水平在每个区间组内和实验顺序上出现的次数相同。
⑤每个区组安排的处理和实验顺序数相同。
⑥每个顺序上安排的处理水平和组区数目相同。
(2)拉丁方实验设计的统计分析方法
①平方和的计算
自由度=r-1;
自由度=r-1;
自由度=r-1;
自由度=r2-1;
自由度=(r-1)(r-2)。
②均方的计算:各项的平方和除以自由度。
③求F值的分母项为残差(误差)均方。
9比较各种方法的异同及适用研究的问题。
答:(1)各种方法的相同点
①各种方法都设法恒定或排除某些无关变量,以便着重观察与分析一些关键特征及其影响因素,找出事物发展的因果关系,即,使系统变异的效应最大,控制无关变异,使误差变异最小。
②各种方法都包括如下步骤:建立与研究假说有关的统计假说;确定实验中的自变量和必须控制的无关变量;确定实验中需要被试的数量及被试抽样的总体;确定将实验条件分配给被试的方法;确定实验中的因变量和使用的统计分析。
③各种设计都是建立在统计学原理的基础上,研究的质量取决于实验设计及统计学知识。各种设计的效应模型都是随机模型、固定模型、混合模型中的一种或若干种;各种设计都在一个或多个因素的不同水平上对被试进行实验处理;各种设计都是通过方差分析,比较差异是否显著来判断因素作用;都遵循方差分析的基本假定,即总体正态分布、变异相互独立、方差齐性。
(2)各种方法的不同点
①各种方法的考察目标有所不同。比如,完全随机实验设计、析因实验设计考察自变量的主效应和变量间的交互作用;区组效应考察自变量的主效应,不考察区组变量和自变量的交互作用;裂区设计只注重考察多变量中某一变量的主效应,以及该变量与其他变量的交互作用,而对另外的一些变量主效应不感兴趣;拉丁方设计目的主要是平衡顺序误差。
②各种方法中,将实验条件分配给被试的方法有所不同。比如,完全随机实验设计随机选取被试,又随机分组,将各组被试随机地安排到一种实验处理组之中;区组设计中,先按某种标准把被试分成区组,区组内被试同质,所有的实验处理随机分配给每个区组的每个被试;裂区实验设计中,被试为随机取样,随机安排接受主区与小区的不同实验处理组合;拉丁方设计中,每个处理水平仅在每行、每列中出现一次,每个方格单元中分配一个或多个被试接受处理,被试区组要与实验处理数目相匹配。
③各种方法中控制无关变量的方法有所不同。比如,完全随机实验设计主要采取随机选择和分配被试的方法控制无关变量;区组设计采用区组的方法,尽量保证区组内被试同质以减少误差变异;拉丁方实验设计主要根据实验处理数目选用不同阶数的拉丁方格,平衡不同搭配所带来的顺序误差。
(3)各种方法适用的研究问题
①完全随机实验设计适用于实验的因素是一个或多个,每个因素又有多个不同的实验水平,随机选取被试随机分组的研究问题。
②析因实验设计适用于实验有多个自变量,每个自变量有多个水平,比较各因素的主效应和交互效应的研究问题。
③区组实验设计适用于实验的因素是一个或多个,存在影响研究因素方面同质的被试的研究问题,把同质因素归为同一区组。
④嵌套实验设计适用于不同因素水平,只在其上一层因素某一水平下出现,而在另一水平下不出现的研究问题。
⑤裂区实验设计适用于只关心多因素中某些因素的主效应,以及这些因素与其他因素的交互作用,而对另外的一些因素效应不感兴趣的研究问题。
⑥拉丁方实验设计适用于需要平衡顺序效应的研究问题。