总变差是什么意思?

如题所述

什么是总变差,回归变差和剩余变差
总变差(总离差平方和):在回归模型中,被解释变量的观测值与其均值的离差平方和。因变量y的总变差反映的是各观察值与其平均数离差的平方和;
回归变差(回归平方和):在回归模型中,因变量的估计值与其均值的离差平方和,就是由解释变量解释的变差。回归变差反映的是在y的总变差中,由x和y的直线回归关系而引起的y的变化部分;
剩余变差(残差平方和):在回归模型中,因变量的观测值与估计值之差的平方和,不能由解释变量所解释的部分变差。剩余变差反映的是除了x对y的直线回归关系影响之外的其他一切因素对y的影响部分。

【拓展资料】
“回归方程”中的被解释变量y的各观测值之间的差异,也是由两个方面原因造成的:一是由解释变量x的不同取值造成的;二是由其他随机因素所造成的。
实际上,回归方程所反映的是:解释变量x的不同取值变化对被解释变量y的影响规律,因此其本质上揭示的是上述第一个原因。
统计学上,我们把这个因素引起的y的变差平方和称为“回归平方和”。对于由随机因素造成的y的变差平方和称为“剩余平方和”。
那么,y的总变差平方和,就等于其“回归平方和”与“剩余平方和”之和。
回到拟合优度的问题上,我们就容易理解,当所有样本点都落在回归线上时,回归方程的拟合优度一定是最高的。此时,y的SST只包含SSR部分,没有SSE。
由此可知,在y的SST中,如果SSR所占比例远大于SSE所占比例,换句话说,就是回归方程如果能够解释的变差所占比例较大,那么,这个回归方程的拟合优度就高。
在统计学中,对于一元线性回归方程,通常采用R^(R的平方)统计量来检验拟合优度,这个统计量也称为判定系数。
式中,R^(R的平方)反映了回归方程所能解释的变差比例,其取值在0~1之间,R^(R的平方)越接近1,说明回归方程对于样本数据点的拟合优度越高;反之,R^(R的平方)越接近0,说明回归方程对于样本数据点的拟合优度越低。
温馨提示:答案为网友推荐,仅供参考