
练习题解答
一、最佳选择题解答
1.D 2.C 3.E 4.E 5.A 6.E 7.D 8.C 9.D 10.A
解答的理由举例:
2.评析:P值是指从H0规定的总体随机抽得等于及大于或/ 和等于及小于现有样本获得的检验统计量值(如t或u)的概率。 两样本t检验,若得到P≤α,则拒绝H0,接受H1,差别有统计学意义,可认为两总体均数不等,因选项A 和D 涉及的是样本,故错误。 从P和α比较所得有统计学意义的假设检验结果并不能说明专业上差异的大小,只能反映两总体均数是否不同。 差异的大小只能根据专业知识予以确定,同样的差异,样本含量越大,则P值越小。 当P≤α时,P越小,只能越有理由说明两总体均数不同,而不是两总体均数相差越大。 故选项B 错误。
3.评析:由于甲乙是从随机数字表中随机抽取30 个数字,从理论上讲,两个样本应当来自同一总体,即两样本所对应的两总体均数和总体方差应相等。 此时由于抽样随机性得到的两样本均数和样本方差往往并不相等,因此选项A 和B 错误。 任何假设检验都可能犯两型错误,无论真实情况是两总体相同还是不同。 当两总体相同,如进行假设检验时,可能会犯Ⅰ型错误,检验水准α就是我们预先规定的所犯Ⅰ型错误概率的最大值。 故选项C 和D 得到的“必然” 结论也是错误的。
7.评析:在假设检验中其检验假设均是针对总体,而不是样本。 也就是说,是对总体的假设,无效假设H0通常是:……总体……相等或某资料总体服从某一特定分布;备择假设H1为无效假设的对立假设,通常是:……总体……不等或某资料总体不服从某一特定分布。 因选项A、B 和E 针对样本,故错误。 实际上两样本均数是否相等,作两样本均数假设检验前样本资料的信息就已经表明了。 选项C 由于是对立假设H1,也错误。 故正确答案为D。
二、简答题解答
1.答:例如某医生从某地2010 年的正常成年男性中,随机抽取25 人,算得其血红蛋白的均数为138.5g / L,标准差S为5.20g / L,标准误
为1.04g / L。 其标准差是描述25 名正常成年男性血红蛋白变异程度的指标,它反映了这25 个数据对其算术均数的离散情况。 因此标准差是描述个体值变异程度的指标,为方差的算术平方根,该变异不能通过统计方法来控制。 而标准误则是指样本统计量的标准差,均数的标准误实质是样本均数的标准差,它反映了样本均数的离散程度,反映了样本均数与总体均数的差异,说明了均数的抽样误差。 本例均数的标准误
,此式将标准差和标准误从数学上有机地联系起来了,同时还可以看出:当标准差不变时,通过增加样本含量可以减少标准误。
2.答:假设检验是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。 即在假设H1成立的条件下,计算检验统计量(test statistic),然后根据获得的P值(P-value)来判断H1是否成立。
假设检验三大基本步骤为:
(1)建立检验假设,确定检验水准。 假设有两种:
1) μ=μ0,即检验假设(hypothesis under test/ to be tested),常称无效假设或零/ 原假设(null hypothesis),用H0表示。
2) μ≠μ0,即H0的对立假设,常称备择假设(alternative hypothesis),用H1或HA表示。
(2)计算检验统计量。 应根据统计推断的目的、设计方案、变量或资料类型、方法的适用条件等选择检验统计量。 如成组设计两样本均数的比较可根据资料特点选用检验统计量t、t'、u等;而成组设计两样本方差的比较一般选用检验统计量F。
(3)确定P值,作出推断结论。 从假设检验的整个逻辑推理过程可看出,P的含义是指从H0规定的总体中随机抽样,获得等于及大于或/ 和等于及小于现有样本获得的检验统计量(如t、u等)值的概率。 根据获得的事后概率P,与事先规定的概率——检验水准α进行比较,判断其是否为小概率事件而得出结论。
3.答:(1)α值是在科研设计(调查设计或实验设计)中根据研究目的预先确定的,不应在算出P值之后再来选择。
(2)若假设检验的重点是减少Ⅰ型错误(如一般的假设检验),一般取α= 0.05;若重点是减少Ⅱ型错误(如方差齐性检验、正态性检验等),一般取α= 0.10 或α= 0.20,甚至更高。
4.答:α和P均为概率,其中α是指拒绝了实际上成立的H0所犯错误的最大概率,是进行统计推断时预先设定的一个小概率事件标准。 P值是由实际样本获得的,在H0成立的前提条件下,出现等于及大于或/ 和等于及小于现有样本获得检验统计量值的概率。 在假设检验中通常是将P与α对比来得到结论,若P≤α,则拒绝H0,接受H1,有统计学意义,可以认为……不同或不等;否则,若P>α,则不拒绝H0,无统计学意义,还不能认为……不同或不等。
5.答:单双侧检验首先应根据专业知识来确定,同时也应考虑所要解决问题的目的。 若从专业知识判断一种方法的结果可能低于或高于另一种方法的结果,则用单侧检验。 在尚不能用专业知识判断两种结果谁高谁低时,用双侧检验。 若研究者对低于或高于两种结果都关心,则用双侧检验;若仅关心其中一种可能,则取单侧检验。 在相同α时,一般认为双侧检验较保守和稳妥,单侧检验由于充分利用了另一侧的不可能性,故更易得出有差别的结论,但应慎用。
6.答:犯Ⅱ型错误的概率为 β,在样本量不变的前提下,α越小,β越大,反之,α越大,β越小。 在方差齐性检验中,重点是要尽量减少Ⅱ型错误的概率,因此常取较高的检验水准α= 0.10,甚至0.20。
7.答:(1)区间估计用于说明量的大小即推断总体参数所在的范围,假设检验用于推断质的不同即判断总体参数是否不等。
(2)区间估计亦可回答假设检验的问题,但区间估计不能提供确切的P值范围,只能给出在α水准上有无统计学意义。
(3)区间估计还可提示差别有无实际意义。
8.答:(1)如果是由随机抽样资料计算得到的指标,在比较时应作统计推断。 因为此时存在抽样误差,直接由两样本统计量的大小比较结果对总体情况下结论是不合适的。 如果是由总体数据计算得到的指标进行比较,可以不必进行假设检验。
(2)统计推断方法包括参数估计和假设检验,对两指标进行比较可以选择其中任一方法进行。 参数的置信区间不仅能够进行指标大小的比较,还可以提示两指标的差别有无实际的专业意义,但只能在其预先规定概率,即可信度(1-α)的前提下进行计算,而假设检验可以获得一个较为确切的概率P值。
9.答:检验效能用1-β表示,过去称把握度,指的是当两总体确有差异时,按规定检验水准α所能发现该差异的能力。 决定检验效能的影响因素有检验水准α、样本含量n、Ⅱ型错误β、容许误差δ。
10.答:变量变换是将原始数据作某种函数转换,如转换为对数值等,从而使各组方差齐同,亦可使偏态资料正态化,以满足t检验或其他统计分析方法对资料的要求。 常用变量变换的方法有对数变换、平方根变换、平方根反正弦变换、倒数变换等,应根据资料性质选择适当的变量变换方法。
三、计算分析题解答
1.解:(1)女性两项指标的CV:
CVRBC= 0.29 / 4.18×100% = 6.94%
CVHb= 10.2 / 117.6×100% = 8.67%
即该地区女性血红蛋白的变异程度比红细胞数的变异程度大。
(2)男性两项指标的抽样误差:
红细胞数:
血红蛋白:
(3)已知健康成年女性的红细胞数服从正态分布,且n= 255 较大,故采用正态近似法计算其总体均数的95% 置信区间。

(4)因健康成人血红蛋白含量服从正态分布,故采用两样本t检验。
H0:μ1=μ2
H0:μ1≠μ2
α= 0.05

ν= 360+255-2 = 613
查t界值表,得P<0.000 5,按α= 0.05 水准,拒绝H0,接受H1,有统计学意义,可以认为健康成年男、女血红蛋白含量的均数不同。 从男性血红蛋白含量的样本均数高于女性,可推断出血红蛋白含量的总体均数男性高于女性。
(5)将标准值看成是总体均数,故采用单样本t检验。
H0:μ=μ0= 4.84(或140.2)
H1:μ<μ0= 4.84(或140.2)
α= 0.05
男性红细胞数:
男性血红蛋白:
查t界值表得男性两指标均P<0.000 5,按 α= 0.05 水准,拒绝H0,接受H1,有统计学意义,可以认为该地男性红细胞数、血红蛋白含量均低于标准值。
2.解:先计算标准误:。
计算总体均数的双侧95% CI:查t界值表,t0.05/2,9= 2.262,得103.0 ± 2.262 × 0.702 即(101.41,104.59)(mg),故该批药剂有效成分的平均含量是(101.41,104.59)mg。
3.解:本题为样本均数所代表的未知总体均数与已知总体均数的比较,因n= 25,故采用单样本t检验。
H0:μ=μ0= 72
H1:μ>μ0= 72
α= 0.05

查t界值表,得单尾概率0.05<P<0.10,按α= 0.05 水准,不拒绝H0,无统计学意义,还不能认为该地成年男子脉搏比一般人群要高。
4.解:本题为配对样本均数的比较,故采用配对t检验。 将双源CT(DSCT)的检查结果与超声心动图的检查结果相减作为差值d。
H0:μd= 0
H1:μd≠0
α= 0.05
今算得,Sd= 6.727 3。 因此

查t界值表,得P<0.001,按α= 0.05 水准,拒绝H0,接受H1,有统计学意义,可认为两种检测方法测得心脏病患者左室舒张末容积(EDV)的大小不同。 根据样本资料可知DSCT 冠状动脉造影所测EDV比超声心动图检查要高。
5.解:该资料为完全随机设计的两样本均数比较,故选用两样本t检验。 先对两差值作Levene 方差齐性检验。

以Levene 检验:,ν1= 30-1 = 29,ν2= 28-1 = 27,查F界值表,F0.10/2,(24,27)= 1.93,F0.10/2,(30,27)= 1.88,F0.10/2,(29,27)>1.88,本题F= 1.361<F0.10/2,(29,27),则P>0.1,按 α= 0.10 水准,均不拒绝H0,无统计学意义,还不能认为两总体方差不等。 可进行总体方差齐性情形下的t检验。
H0:μd1=μd2
H1:μd1≠μd2
α= 0.05

查t界值表,得P<0.001,按α= 0.05 水准,拒绝H0,接受H1,有统计学意义,可以认为野木瓜与哌替啶的术后平均镇痛时间是不同的。
6.解:该资料为完全随机设计的两样本均数比较,故选用两样本t检验。 先对两样本资料作方差齐性检验,由于无原始数据,故选用方差齐性的F检验(规定)。

F= 4.72/2.82= 2.818,ν1= 47-1 = 46,ν2= 38-1 = 37,得P<0.10。
按α= 0.10 水准,拒绝H0,接受H1,有统计学意义,认为两总体方差不等。 应选用总体方差不等情形下的近似t检验,现以Cochran & Cox 的近似t检验为例。
H0:μ1=μ2
H1:μ1≠μ2
α= 0.05

查t界值表得到t0.05/2,46≈t0.05/2,50= 2.009,t0.05/2,37= 2.026
算得t'界值,
因此得P<0.05,按α= 0.05 水准,拒绝H0,接受H1,有统计学意义,可认为试验组和对照组儿童平均仰卧起坐成绩的提高值不同。 根据试验组样本平均仰卧起坐成绩提高值更高,说明补充复合微量营养素6 个月后改善了儿童体质状况。
7.解:血清抗体滴度或稀释倍数资料常服从对数正态分布,故可将原始数据取自然对数后再作两样本t检验。 将取自然对数后标准株和水生株的样本含量、均数和标准差分别以和
表示。
先作Levene 方差齐性检验。

按算术均数方法算得:Levene 检验F= 5.063,P= 0.037(计算机分析结果)。
按中位数方法算得:Levene 检验F= 2.522,P= 0.130(计算机分析结果)。
若以算术均数方法算得Levene 检验,则按α= 0.10 水准,拒绝H0,接受H1,差异有统计学意义,可认为两总体方差不等。 而以中位数方法算得Levene 检验则还不能认为两总体方差不等。
下面分别给出总体方差不等和相等情形下的t检验计算机结果,两者的H0、H1和α均相同。
H0:两总体几何均数相等
H1:两总体几何均数不等
α= 0.05
(1)近似t检验(Satterthwaite 法)——总体方差不等时

查t界值表得:0.002<P<0.005。
(2)t检验——总体方差相等时

查t界值表得:0.005<P<0.01。
按α= 0.05 水准,两种不同方法情形下均拒绝H0,接受H1,有统计学意义,可认为两组平均效价不同。
8.解:(1)将旧药和新药的例数、平均退热天数及标准差分别以和
表示,查t界值表得t0.05/2,70= 1.994。 两药平均退热天数之差的95% CI为1、S1和n2、X

(2)因两组例数均小于60,故先作两样本方差齐性检验。 该资料无原始数据,用F检验(规定)。

F= 0.92/0.82= 1.266,ν1= 37-1 = 36,ν2= 35-1 = 34,得P>0.10。
按α= 0.10 水准,不拒绝H0,无统计学意义,还不能认为两总体方差不等。 因此采用总体方差相等情形下的t检验。
H0:μ1=μ2
H1:μ1≠μ2
α= 0.05

查t界值表,得P<0.001,按α= 0.05 水准,拒绝H0,接受H1,有统计学意义,可以认为新药和旧药的退热天数不同。
(3)上述两种方法的联系在于:均可得到新药和旧药的退热天数不同的结论,也就是说置信区间同样也可回答假设检验的问题,因上述95% 置信区间(1.00,1.80)没有包含0(即H0:μ1-μ2= 0)。
9.解:因两组患儿PaO2的标准差相差较大,两组例数较小且无原始数据,故先对两组数据作方差齐性F检验。 将对照组和治疗组的例数、均数和标准差分别以和
表示(规定
)。

按α= 0.10 水准,拒绝H0,接受H1,有统计学意义,可认为两总体方差不齐。 因此采用总体方差不等情形下的近似t检验(Satterthwaite 法)。
H0:μ1=μ2
H1:μ1≠μ2
α= 0.05

查t界值表,得P<0.001,按α= 0.05 水准,拒绝H0,接受H1,有统计学意义,可以认为治疗后48 小时,两组的PaO2不同。
(潘晓平 李长平)