stata怎样定义虚拟变量?

数据已经在excel中处理好了,怎样定义这个变量为虚拟变量?

1、用list make weight 显示数据。

2、尝试执行 gen weight=weight/1000,系统提示变量已存在。

3、如果foreign==0,将price提高5%,如果foreign==1,将price提高10%。   gen predprice=1.05*price if foreign==0 和replace predprice=1.1*price if foreign==1   再显示结果list make foreign price predprice。

4、list中nolabel参数的使用。list make foreign price predprice,nobel。

5、gen where ="D" if foreign=="Domestic":origin replace where ="F" if foreign=="Foreign":origin如果foreign的值为domestic则where的值为D,否则where的值为F。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2021-04-12
什么是哑变量?
哑变量或虚拟变量,是人为设定的用于将分类变量引入回归模型中的方法。
为什么要使用哑变量
在回归分析中,自变量X既可以是定量数据也可以定类数据。回归分析计算时是将所有自变量X视为数字,但当数据为定类数据时,此时数字代表类别,数字大小本身没有比较意义。因此,这类数据在做回归分析时,需要设置成哑变量才能纳入回归分析正确分析数据。
哪些分析方法会使用到哑变量
通常情况下,回归分析,逐步回归,分层回归,Logistic回归,PLS回归等这类影响关系研究的方法时,才可能涉及到虚拟变量设置。其它分析方法并不会涉及。
如何使用哑变量
用一个例子说明:研究性别和工龄对基本工资的影响情况。
工龄是定量数据;性别为二分类数据,因而分析时性别不能直接放入回归模型,正确做法是将变量转化成取值为1和0的哑变量。

性别分为两类,因而需要设置2个虚拟变量(2列),分别表示男性和女性两个类别。
如果是男性,‘性别_男’虚拟变量取值为1,‘性别_女’虚拟变量取值为0。如果是女性则相反。
当变量分类超过两类时,也是类似的处理方式,在回归分析前将下面的“专业”类别转化为虚拟变量,结果如下图所示:

理科类取值=1代表专业为理科,0代表非理科
文科类取值=1代表专业为文科,0代表非文科
工科类取值=1代表专业为工科,0代表非工科
操作步骤:
SPSSAU可直接一步生成虚拟变量,具体操作如下:

分析时,要注意少放入一个虚拟变量。如果分为两类就放入一个虚拟变量,三类就放入两个,以此类推。

原因在于虚拟变量包括数字0和1;0是对比参考项。如果2个类别都放入了,就没有参考类别了。
如何解释分析结果

SPSSAU回归分析结果
由上表可知,回归模型通过F检验,性别_男一项P<0.01,说明性别对基础工资确实存在显著的影响关系。
模型公式为:月基本工资=2403.834 + 42.659*工龄 + 1377.873*性别_男。
当“性别_男”取值为1表示男性的月工资回归方程,0表示女性的月工资回归方程。回归系数值为1377.873,因此说明相同工龄下,男性的月基本工资比女性多1377.88元。
相反,放入的分析项若为性别_女,回归系数值应为-1377.873,代表同工龄的条件下,女性的月基本工资比男性少1377.88元。
其他说明
将虚拟变量放入回归中,一定要少放一个虚拟变量,否则系统会提示存在多重共线性问题。
SPSSAU会默认生成标题,设置完成后可进行‘标题修改’。
第2个回答  推荐于2018-03-07
假设你在excel中有个变量是性别,其中已经表明每个观测值是male or female。

gen a=.
replace a=1 if gender==male
replace a=0 if gender==female

那么a就是虚拟变量啦

如果你的gender variable中导入之后已经是num variable了,那么你tab gender能看到具体male or female等于几,之后replace也可以。本回答被提问者和网友采纳
第3个回答  2014-06-27
stata我来帮你,我替别人做这类的数据分析蛮多的