第3章 假设检验
1t检验的条件有哪些?
答:t检验可以分成三类,第一类是针对单组设计定量资料的;第二类是针对配对设计定量资料的;第三类则是针对成组设计定量资料的。无论哪种类型的t检验,都必须满足一定的前提条件。
(1)若是单组设计,必须给出一个标准值或总体均值,同时提供一组定量的观测结果,应用t检验的前提条件就是该组资料必须服从正态分布。
(2)若是配对设计,每对数据的差值必须服从正态分布。
(3)若是成组设计,个体之间相互独立,两组资料要均取自正态分布的总体,并满足方差齐性。
2单侧检验与双侧检验的区别是什么?
答:单侧检验与双侧检验的区别是:
(1)定义不同
单侧检验是在查统计表时,按分布的一侧计算显著性水平概率的检验;双侧检验是在查统计表时,按分布两端计算显著性水平概率检验。
(2)应用不同
单侧检验应用于检验大于、小于、高于、低于、优于、劣于等有确定性大小关系的假设检验问题,这类问题的确定是有一定的理论依据的,假设检验写作H1:μ1<μ2或μ1>μ2;双侧检验应用于理论上不能确定两个总体一个一定比另一个大或小的假设检验,一般假设检验写作H1:μ1≠μ2。
3平均数的显著性检验与平均数差异的显著性检验的异同有哪些?
答:平均数的显著性检验与平均数差异的显著性检验是两种重要的假设检验。
(1)二者的相同点
平均数的显著性检验与平均数差异的显著性检验都要比较差异是否显著,都要考虑总体分布情况和总体方差。
(2)二者的不同点
①检验对象不同。平均数的显著性检验是对样本平均数与总体平均数之间差异进行的显著性检验;平均数差异的显著性检验是对两个样本平均数之间差异的检验。
②检验目的不同。平均数的显著性检验目的在于样本是否来自于某总体;平均数差异的显著性检验目的在于由样本平均数之间的差异来检验各自代表的两个总体之间的差异。
③公式选取不同。平均数的显著性检验根据总体分布和总体方差情况选择不同公式;平均数差异的显著性检验还需要注意两个总体方差是否一致、两个样本是否相关以及两个样本容量是否相同等一系列条件来选择公式。
4方差的显著性检验与方差差异的显著性检验的区别是什么?
答:方差的显著性检验与方差差异的显著性检验的区别是:
(1)检验目的不同。方差的显著性检验的目的是检验样本方差与总体方差的差异显著性;方差差异的显著性检验的目的是检验两样本方差之比是否服从F分布。
(2)计算公式不同。方差的显著性检验的公式为:
如果所计算出来的临界值大于,结论为方差显著;否则,则不显著;方差差异的显著性检验的公式为:独立样本时用F检验,即
查F值表,确定并选择显著性水平,若F值大于Fα/2,则结论为方差差异显著,作此结论犯错误的概率小于α/2。否则,则不显著。相关样本时用t检验,即
查t值表,确定并选择显著性水平,若t值大于tα/2,则结论为方差差异显著,作此结论犯错误的概率小于α/2。否则,则不显著。
5相关系数的显著性检验与其差异显著性检验的区别是什么?
答:相关系数的显著性检验及其差异显著性检验的区别是:
(1)检验对象不同。相关系数的显著性检验是对样本相关系数与总体相关系数的差异检验;相关系数差异的显著性检验比较的是两个样本相关系数r的差异。
(2)检验目的不同。相关系数的显著性检验是确定样本是否来自某一总体;相关系数差异的显著性检验推论各自的总体ρ1和ρ2是否有差异。
(3)公式不同。相关系数的显著性检验和相关系数差异的显著性检验根据不同情况选择不同的公式。
6假设检验的两类错误的概念与意义是什么?
答:(1)两类错误的概念
假设检验的两类错误指α错误和β错误。
α错误又称为Ⅰ型错误,是指在否定虚无假设接受对立假设时所犯的错误,即将属于没有差异的总体推论为有差异的总体时所犯的错误。
β错误又称为Ⅱ型错误,是指在接受虚无假设为真时而拒绝备择假设时所犯的错误。即将属于有差异的总体推论为无差异的总体时所犯的错。
(2)两类错误的意义
①两类错误之间的关系
α和β是在两个前提下的概率,即α是在拒绝原假设H0时犯错误的概率,β是接受原假设H0时犯错误的概率。两类错误之间存在着此消彼长的关系。如果犯α错误的代价很大,想降低其概率就要将显著性水平α设得很低,但减少犯α错误的概率必然会增加犯β错误的概率。一个好的检验要在样本容量n一定的情况下,尽量减小犯这两类错误的概率。
②两类错误是统计推断的决策依据
假设检验是一个关于假设的可置信性的决策过程,那么必然需要有某种可依据的标准。在检验过程中,人们总是对虚无假设的结果作出评价,这是因为评价所依据的是随机抽样所得样本均值的概率分布,即研究结果多大程度上是由随机误差所致是可以评估的,而多大程度由实验处理所致则无法通过计算得到。因此,假设检验的结论通常只是接受或拒绝虚无假设H0。
在行为科学的研究中,无法了解总体中除样本以外的个体情况,因此尝试拒绝虚无假设的方法应该优于证明备择假设,这样α错误就为统计推断提供了依据,明确规定了决策标准,即显著性水平,又称为α水平,其实质是一个特定的概率。在检验过程中,假设H0是真实的,同时计算出所观测到的差异完全是由于随机误差所致的概率,称为观测概率,简写为p。将p和事先界定好的显著性水平α进行比较。从而对虚无假设H0得出结论:如果p≤α,则拒绝H0;如果p>α,则不能拒绝H0,即接受H0。
β错误常常是由于实验设计不够灵敏,样本数据的变异性过大,或是处理效应本身比较小。虽然处理对样本产生了作用,但是样本均值并没有落在临界区域内,样本不能够有效地与原先的总体加以区分,也就不能拒绝虚无假设。与α错误不同的是,β类错误无法由一个准确的概率值来衡量,它的概率依赖于许多因素,需要用函数表示。但假设检验的统计效力可以表示为power=1-β,指该检验能够正确地拒绝一个错误的虚无假设的概率,因此。统计效力也反映了假设检验能够正确侦察到真实的处理效应的能力。
7计数数据的检验方法有哪几种?
答:计数数据的检验方法有:
(1)百分数的检验
①百分数显著性
a.条件:百分数又称作比率,比率的分布服从二项分布。当np≥5时,近似正态分布。
b.标准误:
c.临界值:
d.解释:按正态分布,确定显著性水平并予以解释。
②百分数差异显著性
a.条件:当n1p1≥5,n2p2≥5时,两样本比例的差异接近正态分布。
b.标准误:
c.临界值:
d.解释:按正态分布确定显著性,并进行解释。
(2)c2检验
①配合度检验
a.概念:配合度检验是对实际次数与理论次数之间差异是否显著的检验方法。
b.自由度的确定:一般为df=R-1,R为分类数目。
c.理论次数的计算。无差假设:理论次数为理论上的概率;理论与经验概率:根据经验或已知某一概率分布的理论确定计算理论次数的概率;连续变量拟合检验:根据拟检验的理论分布计算概率,根据理论概率求理论次数,根据计算理论次数所用的统计量数目及分组数目求自由度。
d.计算公式:一般情况下
次数较小时的修正
②独立性检验(R×C表)
a.自由度的确定:df=(R-1)(C-1)
b.理论次数计算:
c.公式:
d.解释:用c2分布的概率解释,两变量不同分类间是否存在显著差异或相关。
③列联表的合并
列联表的合并方法有:简单两格表和四格表数据合并、c2相加法、相加法。
④品质相关
a.四分相关:四分相关适用于计算两个变量都是连续变量,且每一个变量的变化都被人为地分为两种类型这样的测量数据之间的相关。公式为:
b.Φ相关:适用于四格表数据。公式为:
Φ接近1为高相关,接近0为低相关。c2显著,则相关显著。
c.列联相关:适用于列联表资料,公式为:
C接近1为高相关,接近0为低相关。c2显著,则相关显著。
8品质相关的种类与计算方法有哪几种?
答:品质相关处理的数据类型一般都是计数数据,而非测量性数据。品质相关依二因素的性质及分类项目的不同,而有不同的名称和计算方法。主要有四分相关、Φ相关、列联表相关等。
(1)四分相关
适用条件:四格表的二因素都是连续的正态变量,如学习能力,身体状态等,只是人为将其按一定标准划分为两个不同的类别,如“好”与“不好”,“对”与“错”等,即一因素划分为“A”与“非A”两项,另一因素划分为“B”与“非B”两项。这样便可将资料整理成四格表的形式。在四格表中,属于A项、B项交叉格内的实际计数为a,非A项、非B项交叉格内的实计数为d,非A项与B项交叉格内的实计数为b,非8项与A项交叉格内的实计数为c,边缘次数分别为a+b、c+d、a+c、b+d,N=a+b+c+d。
计算四格相关最常用的方法是皮尔逊余弦π法(近似计算法)。公式为:
这个公式还可写成下面的形式:
式中:a、b、c、d符号的意义同前。π为圆周率。
(2)Φ相关
适用资料是除四分相关之外的四格表(计数)资料,是表示两因素两项分类资料相关程度最常用的一种相关系数。其计算公式为:
(3)列联相关
适用于数据属于R×C表的计数资料,欲分析所研究的二因素之间的相关程度,就要应用列联相关。当双变量的测量型数据被整理成次数分布表后,也可用列联相关系数表示两变量的相关程度。关于列联表的计算,最常用的是皮尔逊定义的列联系数:
当两个因素完全独立时C为0,反之它不会超过1,但达不到1。为了弥补这个缺点,Tschuprow提出了另一个表示公式:
这个公式在R≠C时,T也不能达到1。