方差分析

如题所述

第1个回答  2022-07-07
定义

通过对数据误差来源的分析判断不同总体的均值是否相等。分析中使用的是误差的方差,因此称为方差分析。

方差分析的基本假定

1每个总体都应服从正态分布

2各个总体的方差必须相同

3观察值独立

方差分析误差

系统误差:因素的不同水平(总体)之间观察值的差异。(若各个水平间没有差异,均值相同,则这种差异是由于随机误差引起的,即样本抽取的随机性引起的误差。若各个水平间有差异,即为不同的总体,均值不相同,则是由不同总体引起的系统误差。ps:这种情况下的误差也包含随机误差,因为随机误差是不可避免的。)

随机误差:因素同一水平(总体)之间观察值的差异。(各个水平下抽取样本值时的随机性引起的误差)

数据的误差用平方和表示,若只用误差计算,误差和为0,无法计算。

组间误差:若各个水平间没有差异,均值相同,则这种差异是由于随机误差引起的,即样本抽取的随机性引起的误差。若各个水平间有差异,即为不同的总体,均值不相同,则是由不同总体引起的系统误差。ps:这种情况下的误差也包含随机误差,因为随机误差是不可避免的。

组内误差:随机误差

方差分析

F = 组间均方 / 组内均方 = (系统误差+随机误差)/ (随机误差)

若系统误差误差为0,则F为1,所有的误差均是由随机误差引起的。即不同水平来自同一总体,不同水平间没有显著差异。

原假设:K个水平的均值完全相同。

备择假设:K个水平的均值不全相等。

【注意】 拒绝原假设只表明至少有两个水平的均值是不相等的。

单因素方差分析步骤

1 提出假设

2 构造检验统计量:

F = MSA/MSE -- F(k-1,n-k)

需要计算的统计量:每个水平的均值,全部观察值的平均值,误差平方和(SSA,SSE),均方(MSA,MSE)。

【注意】均方差:各个误差平方和除去自由度,将误差平方和进行平均,从而消除观察值个数不同所带来的影响,所以选择用均方差MSA,MSE。

3 统计决策

4多重比较,T-test