當前位置:首頁 » 算力簡介 » 多重共線性去中心化

多重共線性去中心化

發布時間: 2022-02-21 12:24:10

⑴ 計量經濟學的多重共線性是怎麼回事

多重共線性,Multi-collinearity,是指線性回歸模型中的解釋變數之間由於存在精確相關關系或高度相關關系而使模型估計失真或難以估計准確。一般來說,由於經濟數據的限制使得模型設計不當,導致設計矩陣中解釋變數間存在普遍的相關關系。完全共線性的情況並不多見,一般出現的是在一定程度上的共線性,即近似共線性。 多重共線性產生的原因主要有3方面: 1. 經濟變數相關的共同趨勢 2.滯後變數的引入 3.樣本資料的限制 多重共線性的影響有: 1.完全共線性下參數估計量不存在 2.近似共線性下OLS估計量非有效. 多重共線性使參數估計值的方差增大,1/(1-r2)為方差膨脹因子(Variance Inflation Factor, VIF) 3.參數估計量經濟含義不合理 4.變數的顯著性檢驗失去意義,可能將重要的解釋變數排除在模型之外 5.模型的預測功能失效, 變大的方差容易使區間預測的「區間」變大,使預測失去意義. 需要注意:即使出現較高程度的多重共線性,OLS估計量仍具有線性性等良好的統計性質.但是OLS法在統計推斷上無法給出真正有用的信息. 多重共線性的解決方法有: 1.排除引起共線性的變數, 找出引起多重共線性的解釋變數,將它排除出去,以逐步回歸法得到最廣泛的應用. 2.差分法, 時間序列數據,線性模型: 將原模型變換為差分模型3.減小參數估計量的方差: 嶺回歸法(Ridge Regression)

⑵ 什麼是多元共線性

多元共線性:當自變數高度相關時,就會互相削弱各自對y的邊際影響,使本身的回歸系數下降而其標准誤擴大,於是就會出現回歸方程整體顯著,但各個自變數都不顯著的現象,即多重共線性。解決方法之一就是對變數去中心化處理。

⑶ 多重共線性解決方法是什麼

多重共線性解決方法:

1、保留重要解釋變數,去掉次要或可替代解釋變數:自變數之間存在共線性,說明自變數所提供的信息是重疊的,可以刪除不重要的自變數減少重復信息。

但從模型中刪去自變數時應該注意:從實際經濟分析確定為相對不重要並從偏相關系數檢驗證實為共線性原因的那些變數中刪除。如果刪除不當,會產生模型設定誤差,造成參數估計嚴重有偏的後果。

2、改變解釋變數的形式:改變解釋變數的形式是解決多重共線性的一種簡易方法,例如對於橫截面數據採用相對數變數,對於時間序列數據採用增量型變數。

3、差分法

4、逐步回歸分析:逐步回歸(Stepwise Regression)是一種常用的消除多重共線性、選取「最優」回歸方程的方法。

其做法是將逐個引入自變數,引入的條件是該自變數經F檢驗是顯著的,每引入一個自變數後,對已選入的變數進行逐個檢驗,如果原來引入的變數由於後面變數的引入而變得不再顯著,那麼就將其剔除。

引入一個變數或從回歸方程中剔除一個變數,為逐步回歸的一步,每一步都要進行F 檢驗,以確保每次引入新變數之前回歸方程中只包含顯著的變數。這個過程反復進行,直到既沒有不顯著的自變數選入回歸方程,也沒有顯著自變數從回歸方程中剔除為止。

5、主成份分析:主成分分析作為多元統計分析的一種常用方法在處理多變數問題時具有其一定的優越性,其降維的優勢是明顯的,主成分回歸方法對於一般的多重共線性問題還是適用的,尤其是對共線性較強的變數之間。

6、偏最小二乘回歸

7、嶺回歸:嶺回歸估計是通過最小二乘法的改進允許回歸系數的有偏估計量存在而補救多重共線性的方法,採用它可以通過允許小的誤差而換取高於無偏估計量的精度, 因此它接近真實值的可能性較大。靈活運用嶺回歸法, 可以對分析各變數之間的作用和關系帶來獨特而有效的幫助。

8、增加樣本容量:多重共線性問題的實質是樣本信息的不充分而導致模型參數的不能精確估計,因此追加樣本信息是解決該問題的一條有效途徑。但是,由於資料收集及調查的困難,要追加樣本信息在實踐中有時並不容易。

(3)多重共線性去中心化擴展閱讀:

注意事項:在多元線性回歸模型經典假設中,其重要假定之一是回歸模型的解釋變數之間不存在線性關系,也就是說,解釋變數X1,X2,……,Xk中的任何一個都不能是其他解釋變數的線性組合。

如果違背這一假定,即線性回歸模型中某一個解釋變數與其他解釋變數間存在線性關系,就稱線性回歸模型中存在多重共線性。多重共線性違背了解釋變數間不相關的古典假設,將給普通最小二乘法帶來嚴重後果。

一般來說,由於經濟數據的限制使得模型設計不當,導致設計矩陣中解釋變數間存在普遍的相關關系。完全共線性的情況並不多見,一般出現的是在一定程度上的共線性,即近似共線性。

⑷ 多重共線性問題的幾種解決方法

多重共線性問題的幾種解決方法

在多元線性回歸模型經典假設中,其重要假定之一是回歸模型的解釋變數之間不存在線性關系,也就是說,解釋變數X1,X2,……,Xk中的任何一個都不能是其他解釋變數的線性組合。如果違背這一假定,即線性回歸模型中某一個解釋變數與其他解釋變數間存在線性關系,就稱線性回歸模型中存在多重共線性。多重共線性違背了解釋變數間不相關的古典假設,將給普通最小二乘法帶來嚴重後果。
這里,我們總結了8個處理多重共線性問題的可用方法,大家在遇到多重共線性問題時可作參考:
1、保留重要解釋變數,去掉次要或可替代解釋變數
2、用相對數變數替代絕對數變數
3、差分法
4、逐步回歸分析
5、主成份分析
6、偏最小二乘回歸
7、嶺回歸
8、增加樣本容量
這次我們主要研究逐步回歸分析方法是如何處理多重共線性問題的。
逐步回歸分析方法的基本思想是通過相關系數r 、擬合優度R2 和標准誤差三個方面綜合判斷一系列回歸方程的優劣,從而得到最優回歸方程。具體方法分為兩步:
第一步,先將被解釋變數y對每個解釋變數作簡單回歸:
對每一個回歸方程進行統計檢驗分析(相關系數r 、擬合優度R2 和標准誤差),並結合經濟理論分析選出最優回歸方程,也稱為基本回歸方程。
第二步,將其他解釋變數逐一引入到基本回歸方程中,建立一系列回歸方程,根據每個新加的解釋變數的標准差和復相關系數來考察其對每個回歸系數的影響,一般根據如下標准進行分類判別:
1.如果新引進的解釋變數使R2 得到提高,而其他參數回歸系數在統計上和經濟理論上仍然合理,則認為這個新引入的變數對回歸模型是有利的,可以作為解釋變數予以保留。
2.如果新引進的解釋變數對R2 改進不明顯,對其他回歸系數也沒有多大影響,則不必保留在回歸模型中。
3.如果新引進的解釋變數不僅改變了R2 ,而且對其他回歸系數的數值或符號具有明顯影響,則認為該解釋變數為不利變數,引進後會使回歸模型出現多重共線性問題。不利變數未必是多餘的,如果它可能對被解釋變數是不可缺少的,則不能簡單舍棄,而是應研究改善模型的形式,尋找更符合實際的模型,重新進行估計。如果通過檢驗證明回歸模型存在明顯線性相關的兩個解釋變數中的其中一個可以被另一個很好地解釋,則可略去其中對被解釋變數影響較小的那個變數,模型中保留影響較大的那個變數。
下邊我們通過實例來說明逐步回歸分析方法在解決多重共線性問題上的具體應用過程。
具體實例
例1 設某地10年間有關服裝消費、可支配收入、流動資產、服裝類物價指數、總物價指數的調查數據如表1,請建立需求函數模型。
表1 服裝消費及相關變數調查數據
年份
服裝開支
C
(百萬元)
可支配收入
Y
(百萬元)
流動資產
L
(百萬元)
服裝類物價指數Pc
1992年=100
總物價指數
P0
1992年=100
1988
8.4
82.9
17.1
92
94
1989
9.6
88.0
21.3
93
96
1990
10.4
99.9
25.1
96
97
1991
11.4
105.3
29.0
94
97
1992
12.2
117.7
34.0
100
100
1993
14.2
131.0
40.0
101
101
1994
15.8
148.2
44.0
105
104
1995
17.9
161.8
49.0
112
109
1996
19.3
174.2
51.0
112
111
1997
20.8
184.7
53.0
112
111
(1)設對服裝的需求函數為

用最小二乘法估計得估計模型:

模型的檢驗量得分,R2=0.998,D·W=3.383,F=626.4634
R2接近1,說明該回歸模型與原始數據擬合得很好。由得出拒絕零假設,認為服裝支出與解釋變數間存在顯著關系。
(2)求各解釋變數的基本相關系數

上述基本相關系數表明解釋變數間高度相關,也就是存在較嚴重的多重共線性。
(3)為檢驗多重共線性的影響,作如下簡單回歸:

各方程下邊括弧內的數字分別表示的是對應解釋變數系數的t檢驗值。
觀察以上四個方程,根據經濟理論和統計檢驗(t檢驗值=41.937最大,擬合優度也最高),收入Y是最重要的解釋變數,從而得出最優簡單回歸方程。
(4)將其餘變數逐個引入,計算結果如下表2:
表2服裝消費模型的估計
結果分析:
①在最優簡單回歸方程中引入變數Pc,使R2由0.9955提高到0.9957;根據經濟理論分析,正號,負號是合理的。然而t檢驗不顯著(),而從經濟理論分析,Pc應該是重要因素。雖然Y與Pc高度相關,但並不影響收入Y回歸系數的顯著性和穩定性。依照第1條判別標准,Pc可能是「有利變數」,暫時給予保留。
②模型中引入變數L ,R2 由0.9957提高到0.9959, 值略有提高。一方面,雖然Y 與L ,Pc與L 均高度相關,但是L 的引入對回歸系數、的影響不大(其中的值由0.1257變為0.1387,值由-0.0361變為-0.0345,變化很小);另一方面,根據經濟理論的分析,L與服裝支出C之間應該是正相關關系,即的符號應該為正號而非負號,依照第2條判別標准,解釋變數L不必保留在模型中。
③捨去變數L ,加入變數P0 ,使R2 由0.9957提高到0.9980,R2 值改進較大。、、均顯著(這三個回歸系數的t檢驗值絕對值均大於),從經濟意義上看也是合理的(服裝支出C與Y,P0之間呈正相關,而與服裝價格Pc之間呈負相關關系)。根據判別標准第1條,可以認為Pc、P0皆為「有利變數」,給予保留。
④最後再引入變數L ,此時R2 =0.9980沒有增加(或幾乎沒有增加),新引入變數對其他三個解釋變數的參數系數也沒有產生多大影響,可以確定L 是多餘變數,根據判別標准第2條,解釋變數L 不必保留在模型中。
因此我們得到如下結論:回歸模型為最優模型。
通過以上案例的分析,我們從理論和實際問題兩方面具體了解了逐步回歸分析是如何對多重共線性問題進行處理的。事實上,一般統計軟體如SPSS,在回歸模型的窗口中都會提供變數逐步進入的選項,勾選後實際上就是選擇了運用逐步回歸的思想來構建回歸模型。運用SPSS軟體不需要我們懂得其背後的運行規律,然而作為分析師,了解並理解模型背後的理論知識,將更有助於我們理解模型、解釋結論背後的內在含義,從而達到更好地分析問題的目的。

⑸ 為什麼當模型存在嚴重的多重共線性時,ols估計量將不具備一致性

在現實經濟運行中,許多經濟變數在隨時間的變化過程中往往存在共同的變化趨勢,使之產生多重共線性;使用截面數據建立回歸模型時,根據研究的具體問題選擇的解釋變數常常從經濟意義上存在著密切的關聯度;在建模過程中由於認識上的局限性造成便來那個選擇不當,從而引起變數之間的多重共線性;在模型中大量採用滯後變數也容易產生多重共線性。

多重共線性的危害有幾個方面:

一是在完全共線性下參數估計量不存在,理由是;1()XX-不存在;

二是近似共線性下OLS參數估計量非有效,理由是參數估計量的方差將可能變得很大;

三是參數估計量經濟意義不合理,如當2X和3X存在線性關系時,2X和3X前的參數並不能反映各自與被解釋變數之間的結構關系;四是變數的顯著性檢驗失去意義,因為無論是t檢驗還是F檢驗,都與參數估計量的方差有關;五是模型的預測功能失效。

檢驗多重共線性的方法思路:用統計上求相關系數的原理,如果變數之間的相關系數較大則認為它們之間存在多重共線性。

克服多重共線性的方法主要有:增加樣本觀測值,略去不重要的解釋變數,用被解釋變數的滯後值代替解釋變數的滯後值,利用參數之間的關系,利用解釋變數之間的關系,變換模型的形式,對數據進行中心化處理,修正Frisch法等。

⑹ 什麼是多重共線性

多重共線性是指線性回歸模型中的解釋變數之間由於存在精確相關關系或高度相關關系而使模型估計失真或難以估計准確。

多重共線性是指線性回歸模型中的解釋變數之間由於存在精確相關關系或高度相關關系而使模型估計失真或難以估計准確。一般來說,由於經濟數據的限制使得模型設計不當,導致設計矩陣中解釋變數間存在普遍的相關關系。

多重共線性產生的原因主要有3各方面:

1、經濟變數相關的共同趨勢。

2、滯後變數的引入。

3、樣本資料的限制。

多重共線性的主要影響:

完全共線性下參數估計量不存在;近似共線性下OLS估計量非有效。

多重共線性使參數估計值的方差增大,1/(1-r2)為方差膨脹因子(Variance Inflation Factor, VIF)。

參數估計量經濟含義不合理;變數的顯著性檢驗失去意義,可能將重要的解釋變數排除在模型之外。

模型的預測功能失效。變大的方差容易使區間預測的「區間」變大,使預測失去意義。

⑺ 檢驗調節效應如果不存在多重共線性需要中心化處理嗎

一般情況下,回歸的交互項是顯著的,畫成兩條線之後,一條線顯著,而另一條線不顯著。有沒有例外】
對於交叉點的意義目前沒有討論,但是交叉的兩條線非常有意思,因為它們的方向是相反的,在這種情況下不建議再用來解釋主效應。

⑻ 多重共線性的解決方法

(1)排除引起共線性的變數
找出引起多重共線性的解釋變數,將它排除出去,以逐步回歸法得到最廣泛的應用。
(2)差分法
時間序列數據、線性模型:將原模型變換為差分模型。
(3)減小參數估計量的方差:嶺回歸法(Ridge Regression)。

⑼ 數據中心化為什麼能夠消除多重共線性

一篇JA的論文。應該還是很權威。可能我的表述沒清楚。另外我看教程有的地方講如果解決多重共線性問題時候,也有提到通過「數據中心化」來達到的。但是為什麼呢?原理是什麼?

原文是
為了減少連續變數「經驗/理性導向理解過程」(此變數在此研究中是自變數)與其他自變數「圖片類型」間交互影響產生的多重共線性,自變數在回歸中都進行了均值中心化處理。

「Because indivial difference is a continuous variable, the hypotheses tests used multiple regression analyses. To rece problems with multicollinearity among the continuous variable (experiential–rational processing) and its interaction term with the other variable (picture type), the independent variables were mean centered for the regressions.

⑽ 如何克服和處理多重共線性

在多元線性回歸模型經典假設中,其重要假定之一是回歸模型的解釋變數之間不存在線性關系,也就是說,解釋變數X1,X2,……,Xk中的任何一個都不能是其他解釋變數的線性組合。如果違背這一假定,即線性回歸模型中某一個解釋變數與其他解釋變數間存在線性關系,就稱線性回歸模型中存在多重共線性。多重共線性違背了解釋變數間不相關的古典假設,將給普通最小二乘法帶來嚴重後果。

所謂多重共線性是指線性回歸模型的解釋變數之間由於存在精確相關關系或者高度相關關系而使模型評估失真或者不準確。這里,我們總結了8個處理多重共線性問題的可用方法,大家在遇到多重共線性問題時可作參考:

1、保留重要解釋變數,去掉次要或可替代解釋變數

自變數之間存在共線性,說明自變數所提供的信息是重疊的,可以刪除不重要的自變數減少重復信息。但從模型中刪去自變數時應該注意:從實際經濟分析確定為相對不重要並從偏相關系數檢驗證實為共線性原因的那些變數中刪除。如果刪除不當,會產生模型設定誤差,造成參數估計嚴重有偏的後果。

熱點內容
beam幣礦池平台抽水 發布:2024-07-07 01:54:11 瀏覽:613
11系列顯卡屏蔽挖礦 發布:2024-07-07 01:30:36 瀏覽:567
去電腦售後服務中心檢測電腦 發布:2024-07-07 01:15:07 瀏覽:704
比特幣指數交易的保證金 發布:2024-07-07 00:29:40 瀏覽:296
挖礦eth效率 發布:2024-07-07 00:29:30 瀏覽:760
波網usdt怎麼賣 發布:2024-07-07 00:11:57 瀏覽:898
單機挖礦的游戲手機版 發布:2024-07-07 00:04:32 瀏覽:490
礦機比特幣尺寸 發布:2024-07-06 23:59:55 瀏覽:392
eth0網卡丟失 發布:2024-07-06 23:47:41 瀏覽:765
地球幣礦機 發布:2024-07-06 23:27:00 瀏覽:674