![SPSS统计分析从入门到精通(第五版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/116/47216116/b_47216116.jpg)
3.3.3 实验操作
下面以数据文件“3-3”为例,说明探索分析的具体操作过程。
1.实验数据描述
数据文件“3-3”记录了两个班级学生的数学成绩、语文成绩,以此数据文件为例,利用探索分析该数据文件中的数学和语文成绩的最大值、最小值、众数、平均数等,并检验样本数据的正态性。原始Excel数据文件如图3-22所示。
在SPSS的变量视图中建立变量“id”“Math”“CHINESE”和“SEX”,分别表示学生班级、数学成绩、语文成绩和性别,在“id”变量中将“一班”和“二班”分别赋值为“1”和“2”;在“SEX”变量中将“男”和“女”分别赋值为“1”和“0”,如图3-23所示。
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P87_5234.jpg?sign=1739304502-dpXYsmmQ8gDvmWO6RxVTFGpWJCvlXjwZ-0-6f115d1ad246a21d4a9f4baf4d20d169)
图3-22 数据文件“3-3”的原始数据
在SPSS活动数据文件的数据视图中,把相关数据输入到各个变量中。输入后部分数据如图3-24所示。
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P88_5240.jpg?sign=1739304502-AxDQLxbWLafLBewBL0wDVhl3fsK8s8vV-0-e5d855770cc3213e32ef3039ba2a7dc1)
图3-23 数据文件“3-3”的变量视图
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P88_5244.jpg?sign=1739304502-FFbxFCsWYKWvbfDK05jBYaQGxOE2FH0n-0-570f5a9cd63d3b07a3debdcab0fa7813)
图3-24 数据文件“3-3”的数据视图
2.实验操作步骤
打开数据文件“3-3”,进入SPSS Statistics数据编辑器窗口,然后在菜单栏中选择“分析”|“描述统计”|“探索”命令,打开“探索”对话框。
将变量“Math”选入“因变量列表”列表框,将“SEX”选入“因子列表”列表框,将“班级”选入“个案标注依据”列表框。
单击“统计”按钮,在弹出的“探索:统计”对话框中选中“描述”复选框;单击“图”按钮,在弹出的“探索:图”对话框中选中“箱图”选项组的“因子级别并置”单选按钮、“描述”选项组的“茎叶图”复选框以及“含检验的正态图”复选框。
在“探索”对话框中选中“输出”选项组的“两者”单选按钮,然后单击“确定”按钮就可以输出探索分析的结果。
3.实验结果及分析
单击“确定”按钮,SPSS Statistics查看器窗口的输出结果如图3-25~图3-31所示。
图3-25给出了探索分析中的变量样本数据的有效个数和百分比、缺失个数和百分比及总计个数和百分比。通过“个案处理摘要”可以看出本实验中无数据缺失。
图3-26给出了数学成绩按照性别分类的一些统计量,如均值、中值、方差、标准差等。通过该图可以看出女生数学成绩均值要比男生大,而女生数学成绩中值却小于男生的中值。
图3-27给出了因变量样本数据按照因子变量分类的正态性检验结果。列中“统计”表示检验统计量的值,“自由度”表示检验的自由度,“显著性”表示检验的显著水平。对本实验而言,正态检验的原假设是:数据服从正态分布。从“正态性检验”中柯尔莫戈洛夫-斯米诺夫统计量、夏皮洛-威尔克统计量可以看出,女生和男生的数学成绩的显著水平都大于5%,接受原假设,即都服从正态分布。
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P89_5268.jpg?sign=1739304502-Rual7povDtueb6TAzmPkHOZGdI7btXKq-0-b29a2d83d1dd72f1c916301bd2d35376)
图3-25 个案处理摘要
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P89_5253.jpg?sign=1739304502-aQHz70rwkr8HiMqJDvAXTrHhu1kblHUx-0-566543251f6270f97a1a2060be760fec)
图3-26 变量描述
图3-28给出了女生数学成绩的茎叶图。图中“频率”表示相应数据的频数,“Stem”即茎,“叶”即叶子,两者分别表示数据的整数部分和小数部分,“主干宽度”表示茎宽。
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P89_5257.jpg?sign=1739304502-yXxU57viF8gbzPiaU05zO6Mo0nqCdeMc-0-ae23f205419f86e8be8f51df6441d861)
图3-27 正态性检验
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P89_5258.jpg?sign=1739304502-9Q3XClrLq5ao2BXbup8Lc3bS3pkwEqfr-0-20708e42ecb4610fcae547d44d2515e0)
图3-28 茎叶图
图3-29和图3-30分别给出了女生数学成绩的标准Q-Q图和趋降Q-Q图。标准Q-Q图中的观察点都分布在直线附近,趋降Q-Q图中的点除了极个别点外都分布在0值横线附近,因此显示样本数据服从正态分布,这个结论和正态性检验的结论一致。
图3-31给出了按因子变量性别区分的数学成绩的箱图,其中箱图两头的两条实线分别表示最大值和最小值,中间的黑色实线表示中位数,箱体的上下两端为四分位数。在本实验中女生数学成绩有一个编号为1的异常点或离群值。
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P90_5272.jpg?sign=1739304502-Pnlg4RuICyIcsLwJpqF7yig0w8htAfDK-0-8c4b7cef33ed6bae7b8cc959c7f1db46)
图3-29 标准Q-Q图
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P90_5273.jpg?sign=1739304502-CEpxZ40wkVbt0ifYb4YN0VzHRRk2JeDg-0-ca0d227a33e68a92697e7b972e1a16a7)
图3-30 趋降标准Q-Q图
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P90_5276.jpg?sign=1739304502-Nh10jDsFEFjIrVKcgwyX0IfFGRnWdoGC-0-41ece2ac8263c5f0635b051a6f3b8b5f)
图3-31 箱图