如何在SPSS中对样本进行正态分布检验?

我通过问卷获得了一组数据,但不知道是否符合正态分布,请问在SPSS中如何进行正态分布检验?或可用哪些方法来判断?谢谢

第1个回答  2019-12-28
一、图示法
1、P-P

以样本的累计频率作为横坐标以安装正态分布计算的相应累计概率作为纵坐标把样本值表现为直角坐标系中的散点。如果资料服从整体分布则样本点应围绕第一象限的对角线分布。
2、Q-Q

以样本的分位数作为横坐标以按照正态分布计算的相应分位点作为纵坐标把样本表现为指教坐标系的散点。如果资料服从正态分布则样本点应该呈一条围绕第一象限对角线的直线。
以上两种方法以
Q-Q
图为佳效率较高。
3、直方图
判断方法是否以钟形分布同时可以选择输出正态性曲线。
4、箱式图
判断方法观测离群值和中位数。
5、茎叶图
类似与直方图但实质不同。
二、计算法
1、偏度系数Skewness和峰度系数Kurtosis
计算公式
g1表示偏度
g2表示峰度
通过计算
g1

g2
及其标准误
σg1及
σg2然后作
U检验。两种检验同时得出
U0.05
的结论时才可以认为该组资料服从正态分布。由公式可见部分文献中所说的“偏度和峰度都接近
0……可以认为……近似服从正态分布”并不严谨。
2、非参数检验方法
非参数检验方法包括
Kolmogorov-Smirnov
检验
D
检验

Shapiro-
Wilk
W
检验。
SAS
中规定当样本含量
n
≤2000时结果以
Shapiro

WilkW
检验为准当样本含量
n
>2000
时结果以
Kolmogorov

SmirnovD
检验为准。
SPSS
中则这样规定1如果指定的是非整数权重则在加权样本大小位于
3

50
之间时计算
Shapiro-Wilk
统计量。对于无权重或整数权重在加权样本大小位于
3

5000
之间时计算该统计量。由此可见部分
SPSS
教材里面关于“Shapiro

Wilk
适用于样本量
3-50
之间的数据”的说法是在是理解片面误人子弟。
2
单样本Kolmogorov-Smirnov
检验可用于检验变量
例如
income是否为正态分布。
对于此两种检验如果
P
值大于
0.05表明资料服从正态分布。
三、SPSS
操作示例
SPSS
中有很多操作可以进行正态检验
在此只介绍最主要和最全面最方便的操作
1、工具栏--分析—描述性统计—探索性
2、选择要分析的变量选入因变量框内然后点选图表设置输出茎叶图和直方图选择输出正态性检验图表注意显示Display要选择双项Both。
3、Output
结果
1Descriptives描述中有峰度系数和偏度系数根据上述判断标准数据不符合正态分布。
Sk=0Ku=0
时分布呈正态Sk>0
时分布呈正偏态Sk<0
时分布呈负偏态时Ku>0
曲线比较陡峭Ku<0
时曲线比较平坦。由此可判断本数据分布为正偏态朝左偏较陡峭。
2Tests
of
NormalityD
检验和
W
检验均显示数据不服从正态分布当然在此数据样本量为
1000应以
W
检验为准。
3直方图
直方图验证了上述检验结果。
4此外还有茎叶图、P-P
图、Q-Q
图、箱式图等输出结果不再赘述。结果同样验证数据不符合正态分布。