stata中如何去中心化处理
『壹』 如何处理stata的数据问题
两个办法:
1. 加内存条。需要说明的是32位操作系统仅能识别4GB以内的内存,想要更大的内存需要安装64位系统,并配套安装64位的Stata
2. 部分导入数据 use data in 1/10000 或者 use 变量名 using 数据名
『贰』 如何在stata中剔除部分数据
剔除数据的依据或者判断标准是哪些呢
『叁』 stata做回归分析时,有变量提示由于共线性被忽略,求大神指导如何处理是将其剔除再回归吗
不一定,首先变量提示由于共线性被剔除有两种原因,一种是正常的,不用管,一种是不正常的,需要处理,不过总的来说无论你是否处理,它都不会进入回归(stata会自动忽略),要处理的都是你的模型假设。
正常的,就是说例如这样:我们假设我们分析的群体是51~80岁的,我们想把年龄分成三组,变量1是虚拟变量代表在50~60岁间(是=1,否=0),变量2是虚拟变量代表在61~70岁间,变量3是虚拟变量代表在71~80岁间。那么当你回归时加入这三个虚拟变量控制年龄的时候,因为这三个变量的和一定为1(共线性),所以系统会自动忽略其中一个,但是这个时候你不用在模型中删除那个被忽略的变量,因为这是正常的,这代表那个变量被自动选为基准组。我们在解释其他组的变量的系数上,也是解释为“相对于被忽略的那个基准组,这个变量所代表的组如何影响因变量,这个组是有平均比起基准组更多还是更少的因变量“。
不正常的,就是说明明不是分组的虚拟变量,但也有共线性。比如说可能是这样,你想看丈夫和妻子的年龄差,然后又希望控制丈夫和妻子的年龄,这时由于(年龄差=年龄相减)产生了共线性,这说明你的模型本身就设定失误,我们只需要控制丈夫的年龄就可以达到都控制的效果。
也可能是这样:你想看”是否退休“对因变量的影响,但是因为你的样本比较窄,比如是”20~50“岁的样本,导致所有人都没有退休,”是否退休“变量对所有人都是0(没退休),所以被忽略掉,这时就意味着你的样本不支持做你想要的模型,此时也只得删掉这个变量了。
『肆』 stata如何回归
1、生成一个自变量和一个因变量。
『伍』 如何用stata对数据进行中心化处理
直接代码解决
ssc install center(安装center)
center vars即可
『陆』 如何在stata中处理面板数据
短面板处理
面板数据是指既有截面数据又有时间序列的数据,因此其存在截面数据没有的优势,在用stata进行面板数据的估计时,一般选择xtreg命令进行拟合。本节主要论述短面板的stata实现,即时间维度T相对于截面数n较小的数据。在那种情况下,由于T较小,每个个体的信息较少,故无从讨论扰动项是否存在自相关,我们一般假设其独立同分布。
面板数据维度的确定
在面板数据进行模型估计前,要进行面板数据的维度确定。由于面板数据既有截面数据又有时间序列,而stata不能自动识别,因此,必须使得stata得知哪一部分是截面数据,而哪一部分是时间序列。
设置面板数据维度的基本命令为:
xtset panelvar timvar [, tsoptions]
其中panelvar代表截面数据变量,timvar代表时间序列变量。
选取某一面板数据进行维度设定:
xtset fcode year
『柒』 怎么进行去中心化处理
根据侯杰泰的话:所谓中心化, 是指变量减去它的均值(即数学期望值)。对于样本数据,将一个变量的每个观测值减去该变量的样本平均值,变换后的变量就是中心化的。
对于你的问题,应是每个测量值减去均值。