名义和有序变量的应用(能否作因变量?能否作自变量?如果能如何处理?)

如题所述

我看了一下百度知道的解释,觉得意思差不多:
有序变量就是指可以用具体数字序列来衡量的变量,表示了样本间程度的差别。比如年龄,工资水平,人数之类的。而且也可以用+和-来表示增加或者减少。

名义变量也可以称作“无序变量”或者“虚拟变量”。这些一般是用来表示样本间的属性差别。比如年龄、性别、人种(黑人、白人、黄人)。

一般来说,有序变量的数值可以是某个定义下的任意数值。比如工资可以是1000块到10000块,因此,有序变量X=1000,X=1001.....X=10000。因此理论上变量X的赋值是1000-10000之间的任意数;而名义变量的值只能是某一定义下的某几个值。比如性别只有男、女之分。那么名义变量D=1,代表男人,D=0,代表女人,因此该变量D只能有这两个值1、0。

那么如何将他们引入回归模型呢?
其实名义变量和有序变量都是可以作为自变量,但据个人了解,只有有序变量能够做因变量。处理的理论我说不太清楚,给你举个例子:
比如,我想要研究CPI受什么因素的影响,例如GDP。如果只考虑有序变量,那么可以建立模型
CPI=C+a*GDP
C是常数项,也就是假定GDP=0时,CPI会是多少;
a是GDP与CPI的相关系数,也就是GDP若变化1个单位,CPI就会变化a个单位。也就是GDP能以什么程度影响CPI。

但这样的模型显然太简单,不可能反应现实情况。那么此时,就可以引入一些名义变量,或者称之为“虚拟变量”。例如设某季度变量为D。
D=0代表第一个季度的情况,也就是1-3月;
D=1代表第二个季度的情况,也就是4-6月;
D=2代表第三个季度的情况,也就是7-9月;
D=3代表第四个季度的情况,也就是10-12月。

现在将变量D引入回归模型,就变成了
CPI=C+a*GDP+b*D

下面把D的赋值分别代入方程:
当D=0时,CPI=C+a*GDP,也就是第一个季度的CPI是这么多;同理,
当D=1时,CPI=C+a*GDP+b,也就是第二个季度的CPI值;
当D=2时,CPI=C+a*GDP+2b,也就是第三个季度的CPI值;
当D=3时,CPI=C+a*GDP+3b,也就是第四个季度的CPI值。

那么,系数b的意思就是除了GDP的影响之外,季度也会对CPI产生影响,而b就是某一个季度,CPI额外增加或减少的值。

在确定了系数的具体数值之后,就可以检验其显著性了,例如t-检验之类的,就不多说了。
以上就是我自己对于这两种变量的定义和应用的理解,希望能对你有帮助。
温馨提示:答案为网友推荐,仅供参考