当前位置:首页 » 算力简介 » 多重共线性去中心化

多重共线性去中心化

发布时间: 2022-02-21 12:24:10

⑴ 计量经济学的多重共线性是怎么回事

多重共线性,Multi-collinearity,是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。一般来说,由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系。完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。 多重共线性产生的原因主要有3方面: 1. 经济变量相关的共同趋势 2.滞后变量的引入 3.样本资料的限制 多重共线性的影响有: 1.完全共线性下参数估计量不存在 2.近似共线性下OLS估计量非有效. 多重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子(Variance Inflation Factor, VIF) 3.参数估计量经济含义不合理 4.变量的显著性检验失去意义,可能将重要的解释变量排除在模型之外 5.模型的预测功能失效, 变大的方差容易使区间预测的“区间”变大,使预测失去意义. 需要注意:即使出现较高程度的多重共线性,OLS估计量仍具有线性性等良好的统计性质.但是OLS法在统计推断上无法给出真正有用的信息. 多重共线性的解决方法有: 1.排除引起共线性的变量, 找出引起多重共线性的解释变量,将它排除出去,以逐步回归法得到最广泛的应用. 2.差分法, 时间序列数据,线性模型: 将原模型变换为差分模型3.减小参数估计量的方差: 岭回归法(Ridge Regression)

⑵ 什么是多元共线性

多元共线性:当自变量高度相关时,就会互相削弱各自对y的边际影响,使本身的回归系数下降而其标准误扩大,于是就会出现回归方程整体显著,但各个自变量都不显著的现象,即多重共线性。解决方法之一就是对变量去中心化处理。

⑶ 多重共线性解决方法是什么

多重共线性解决方法:

1、保留重要解释变量,去掉次要或可替代解释变量:自变量之间存在共线性,说明自变量所提供的信息是重叠的,可以删除不重要的自变量减少重复信息。

但从模型中删去自变量时应该注意:从实际经济分析确定为相对不重要并从偏相关系数检验证实为共线性原因的那些变量中删除。如果删除不当,会产生模型设定误差,造成参数估计严重有偏的后果。

2、改变解释变量的形式:改变解释变量的形式是解决多重共线性的一种简易方法,例如对于横截面数据采用相对数变量,对于时间序列数据采用增量型变量。

3、差分法

4、逐步回归分析:逐步回归(Stepwise Regression)是一种常用的消除多重共线性、选取“最优”回归方程的方法。

其做法是将逐个引入自变量,引入的条件是该自变量经F检验是显著的,每引入一个自变量后,对已选入的变量进行逐个检验,如果原来引入的变量由于后面变量的引入而变得不再显著,那么就将其剔除。

引入一个变量或从回归方程中剔除一个变量,为逐步回归的一步,每一步都要进行F 检验,以确保每次引入新变量之前回归方程中只包含显著的变量。这个过程反复进行,直到既没有不显著的自变量选入回归方程,也没有显著自变量从回归方程中剔除为止。

5、主成份分析:主成分分析作为多元统计分析的一种常用方法在处理多变量问题时具有其一定的优越性,其降维的优势是明显的,主成分回归方法对于一般的多重共线性问题还是适用的,尤其是对共线性较强的变量之间。

6、偏最小二乘回归

7、岭回归:岭回归估计是通过最小二乘法的改进允许回归系数的有偏估计量存在而补救多重共线性的方法,采用它可以通过允许小的误差而换取高于无偏估计量的精度, 因此它接近真实值的可能性较大。灵活运用岭回归法, 可以对分析各变量之间的作用和关系带来独特而有效的帮助。

8、增加样本容量:多重共线性问题的实质是样本信息的不充分而导致模型参数的不能精确估计,因此追加样本信息是解决该问题的一条有效途径。但是,由于资料收集及调查的困难,要追加样本信息在实践中有时并不容易。

(3)多重共线性去中心化扩展阅读:

注意事项:在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X1,X2,……,Xk中的任何一个都不能是其他解释变量的线性组合。

如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。

一般来说,由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系。完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。

⑷ 多重共线性问题的几种解决方法

多重共线性问题的几种解决方法

在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X1,X2,……,Xk中的任何一个都不能是其他解释变量的线性组合。如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。
这里,我们总结了8个处理多重共线性问题的可用方法,大家在遇到多重共线性问题时可作参考:
1、保留重要解释变量,去掉次要或可替代解释变量
2、用相对数变量替代绝对数变量
3、差分法
4、逐步回归分析
5、主成份分析
6、偏最小二乘回归
7、岭回归
8、增加样本容量
这次我们主要研究逐步回归分析方法是如何处理多重共线性问题的。
逐步回归分析方法的基本思想是通过相关系数r 、拟合优度R2 和标准误差三个方面综合判断一系列回归方程的优劣,从而得到最优回归方程。具体方法分为两步:
第一步,先将被解释变量y对每个解释变量作简单回归:
对每一个回归方程进行统计检验分析(相关系数r 、拟合优度R2 和标准误差),并结合经济理论分析选出最优回归方程,也称为基本回归方程。
第二步,将其他解释变量逐一引入到基本回归方程中,建立一系列回归方程,根据每个新加的解释变量的标准差和复相关系数来考察其对每个回归系数的影响,一般根据如下标准进行分类判别:
1.如果新引进的解释变量使R2 得到提高,而其他参数回归系数在统计上和经济理论上仍然合理,则认为这个新引入的变量对回归模型是有利的,可以作为解释变量予以保留。
2.如果新引进的解释变量对R2 改进不明显,对其他回归系数也没有多大影响,则不必保留在回归模型中。
3.如果新引进的解释变量不仅改变了R2 ,而且对其他回归系数的数值或符号具有明显影响,则认为该解释变量为不利变量,引进后会使回归模型出现多重共线性问题。不利变量未必是多余的,如果它可能对被解释变量是不可缺少的,则不能简单舍弃,而是应研究改善模型的形式,寻找更符合实际的模型,重新进行估计。如果通过检验证明回归模型存在明显线性相关的两个解释变量中的其中一个可以被另一个很好地解释,则可略去其中对被解释变量影响较小的那个变量,模型中保留影响较大的那个变量。
下边我们通过实例来说明逐步回归分析方法在解决多重共线性问题上的具体应用过程。
具体实例
例1 设某地10年间有关服装消费、可支配收入、流动资产、服装类物价指数、总物价指数的调查数据如表1,请建立需求函数模型。
表1 服装消费及相关变量调查数据
年份
服装开支
C
(百万元)
可支配收入
Y
(百万元)
流动资产
L
(百万元)
服装类物价指数Pc
1992年=100
总物价指数
P0
1992年=100
1988
8.4
82.9
17.1
92
94
1989
9.6
88.0
21.3
93
96
1990
10.4
99.9
25.1
96
97
1991
11.4
105.3
29.0
94
97
1992
12.2
117.7
34.0
100
100
1993
14.2
131.0
40.0
101
101
1994
15.8
148.2
44.0
105
104
1995
17.9
161.8
49.0
112
109
1996
19.3
174.2
51.0
112
111
1997
20.8
184.7
53.0
112
111
(1)设对服装的需求函数为

用最小二乘法估计得估计模型:

模型的检验量得分,R2=0.998,D·W=3.383,F=626.4634
R2接近1,说明该回归模型与原始数据拟合得很好。由得出拒绝零假设,认为服装支出与解释变量间存在显著关系。
(2)求各解释变量的基本相关系数

上述基本相关系数表明解释变量间高度相关,也就是存在较严重的多重共线性。
(3)为检验多重共线性的影响,作如下简单回归:

各方程下边括号内的数字分别表示的是对应解释变量系数的t检验值。
观察以上四个方程,根据经济理论和统计检验(t检验值=41.937最大,拟合优度也最高),收入Y是最重要的解释变量,从而得出最优简单回归方程。
(4)将其余变量逐个引入,计算结果如下表2:
表2服装消费模型的估计
结果分析:
①在最优简单回归方程中引入变量Pc,使R2由0.9955提高到0.9957;根据经济理论分析,正号,负号是合理的。然而t检验不显著(),而从经济理论分析,Pc应该是重要因素。虽然Y与Pc高度相关,但并不影响收入Y回归系数的显著性和稳定性。依照第1条判别标准,Pc可能是“有利变量”,暂时给予保留。
②模型中引入变量L ,R2 由0.9957提高到0.9959, 值略有提高。一方面,虽然Y 与L ,Pc与L 均高度相关,但是L 的引入对回归系数、的影响不大(其中的值由0.1257变为0.1387,值由-0.0361变为-0.0345,变化很小);另一方面,根据经济理论的分析,L与服装支出C之间应该是正相关关系,即的符号应该为正号而非负号,依照第2条判别标准,解释变量L不必保留在模型中。
③舍去变量L ,加入变量P0 ,使R2 由0.9957提高到0.9980,R2 值改进较大。、、均显著(这三个回归系数的t检验值绝对值均大于),从经济意义上看也是合理的(服装支出C与Y,P0之间呈正相关,而与服装价格Pc之间呈负相关关系)。根据判别标准第1条,可以认为Pc、P0皆为“有利变量”,给予保留。
④最后再引入变量L ,此时R2 =0.9980没有增加(或几乎没有增加),新引入变量对其他三个解释变量的参数系数也没有产生多大影响,可以确定L 是多余变量,根据判别标准第2条,解释变量L 不必保留在模型中。
因此我们得到如下结论:回归模型为最优模型。
通过以上案例的分析,我们从理论和实际问题两方面具体了解了逐步回归分析是如何对多重共线性问题进行处理的。事实上,一般统计软件如SPSS,在回归模型的窗口中都会提供变量逐步进入的选项,勾选后实际上就是选择了运用逐步回归的思想来构建回归模型。运用SPSS软件不需要我们懂得其背后的运行规律,然而作为分析师,了解并理解模型背后的理论知识,将更有助于我们理解模型、解释结论背后的内在含义,从而达到更好地分析问题的目的。

⑸ 为什么当模型存在严重的多重共线性时,ols估计量将不具备一致性

在现实经济运行中,许多经济变量在随时间的变化过程中往往存在共同的变化趋势,使之产生多重共线性;使用截面数据建立回归模型时,根据研究的具体问题选择的解释变量常常从经济意义上存在着密切的关联度;在建模过程中由于认识上的局限性造成便来那个选择不当,从而引起变量之间的多重共线性;在模型中大量采用滞后变量也容易产生多重共线性。

多重共线性的危害有几个方面:

一是在完全共线性下参数估计量不存在,理由是;1()XX-不存在;

二是近似共线性下OLS参数估计量非有效,理由是参数估计量的方差将可能变得很大;

三是参数估计量经济意义不合理,如当2X和3X存在线性关系时,2X和3X前的参数并不能反映各自与被解释变量之间的结构关系;四是变量的显著性检验失去意义,因为无论是t检验还是F检验,都与参数估计量的方差有关;五是模型的预测功能失效。

检验多重共线性的方法思路:用统计上求相关系数的原理,如果变量之间的相关系数较大则认为它们之间存在多重共线性。

克服多重共线性的方法主要有:增加样本观测值,略去不重要的解释变量,用被解释变量的滞后值代替解释变量的滞后值,利用参数之间的关系,利用解释变量之间的关系,变换模型的形式,对数据进行中心化处理,修正Frisch法等。

⑹ 什么是多重共线性

多重共线性是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。

多重共线性是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。一般来说,由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系。

多重共线性产生的原因主要有3各方面:

1、经济变量相关的共同趋势。

2、滞后变量的引入。

3、样本资料的限制。

多重共线性的主要影响:

完全共线性下参数估计量不存在;近似共线性下OLS估计量非有效。

多重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子(Variance Inflation Factor, VIF)。

参数估计量经济含义不合理;变量的显着性检验失去意义,可能将重要的解释变量排除在模型之外。

模型的预测功能失效。变大的方差容易使区间预测的“区间”变大,使预测失去意义。

⑺ 检验调节效应如果不存在多重共线性需要中心化处理吗

一般情况下,回归的交互项是显著的,画成两条线之后,一条线显著,而另一条线不显著。有没有例外】
对于交叉点的意义目前没有讨论,但是交叉的两条线非常有意思,因为它们的方向是相反的,在这种情况下不建议再用来解释主效应。

⑻ 多重共线性的解决方法

(1)排除引起共线性的变量
找出引起多重共线性的解释变量,将它排除出去,以逐步回归法得到最广泛的应用。
(2)差分法
时间序列数据、线性模型:将原模型变换为差分模型。
(3)减小参数估计量的方差:岭回归法(Ridge Regression)。

⑼ 数据中心化为什么能够消除多重共线性

一篇JA的论文。应该还是很权威。可能我的表述没清楚。另外我看教程有的地方讲如果解决多重共线性问题时候,也有提到通过“数据中心化”来达到的。但是为什么呢?原理是什么?

原文是
为了减少连续变量“经验/理性导向理解过程”(此变量在此研究中是自变量)与其他自变量“图片类型”间交互影响产生的多重共线性,自变量在回归中都进行了均值中心化处理。

“Because indivial difference is a continuous variable, the hypotheses tests used multiple regression analyses. To rece problems with multicollinearity among the continuous variable (experiential–rational processing) and its interaction term with the other variable (picture type), the independent variables were mean centered for the regressions.

⑽ 如何克服和处理多重共线性

在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X1,X2,……,Xk中的任何一个都不能是其他解释变量的线性组合。如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。

所谓多重共线性是指线性回归模型的解释变量之间由于存在精确相关关系或者高度相关关系而使模型评估失真或者不准确。这里,我们总结了8个处理多重共线性问题的可用方法,大家在遇到多重共线性问题时可作参考:

1、保留重要解释变量,去掉次要或可替代解释变量

自变量之间存在共线性,说明自变量所提供的信息是重叠的,可以删除不重要的自变量减少重复信息。但从模型中删去自变量时应该注意:从实际经济分析确定为相对不重要并从偏相关系数检验证实为共线性原因的那些变量中删除。如果删除不当,会产生模型设定误差,造成参数估计严重有偏的后果。

热点内容
ltcwalletapp 发布:2024-07-04 11:40:42 浏览:706
区块链和大数据对立吗 发布:2024-07-04 11:31:31 浏览:829
显卡怎么不挖矿 发布:2024-07-04 11:29:48 浏览:305
比特币合约4点暂停 发布:2024-07-04 11:24:22 浏览:244
道奇trx霸王龙内饰 发布:2024-07-04 11:23:20 浏览:769
矿机声音大怎么办 发布:2024-07-04 11:15:33 浏览:122
数字货币前十大交易所 发布:2024-07-04 09:46:14 浏览:757
买卖USDT犯法 发布:2024-07-04 09:39:28 浏览:206
rust里面矿机怎么启动 发布:2024-07-04 09:32:14 浏览:348
挖矿用什么矿机 发布:2024-07-04 09:22:10 浏览:463