面板數據的變數怎麼去中心化
⑴ 如何在面板數據模型中引入虛擬變數
比如你的變數叫做REG1,針對2010年。你同時還有一個變數叫YEAR,裡面是每一個變數對應的年數。那麼用以下命令,你能生成一個新的變數,只有當對應的YEAR變數為你想要的2010年時,數值取值為1,其他的都取值為0 : gen REG1 = (YEAR==2010)。
⑵ 面板數據變數有一階單整有平穩的怎麼回歸
不是的,其他變數都平穩的話,只需要把那個一階差分平穩的變數差分後建模即可,但是意義會有所差別。如果所有變數都同階差分平穩的話,可以直接建模,進行協整檢驗。
⑶ 請問面板數據里我需要把時間設成固定效應下的虛擬變數要怎麼弄加分
比如你的變數叫做REG1,針對2010年。你同時還有一個變數叫YEAR,裡面是每一個變數對應的年數。那麼用以下命令,你能生成一個新的變數,只有當對應的YEAR變數為你想要的2010年時,數值取值為1,其他的都取值為0 : gen REG1 = (YEAR==2010)。
還有一種方法更加方便,就是用TABULATE命令。如果你的變數YEAR非常的規則,比如1990-2010年。共有21個年份。沒有其他的比如小數、無理數之類的亂七八糟的數。那麼
tabulate YEAR, gen(REG)
會直接生成21個變數,REG1,REG2,....REG21。REG1就是當YEAR =1990時取值為1,其他時候取值為0.類似的REG2就是當YEAR =1991時取值為1,其他時候取值為0.。。。。
⑷ stata面板數據回歸中行業的虛擬變數怎麼設置
結果的前兩行表示模型的類別,LZ採用的為randomeffect隨機模型,截面變數:province,樣本數目310.群組數目31,也就是每組10個觀測值.
3-5行表示模型的擬合優度,分別為within,between,overall,組內,組間,總體三個層次.
6-7行表示針對參數聯合檢驗的wald chi2檢驗和Pvalue,p=0.000表示參數整體上灰常顯著.
8-10行表示解釋變數的估計權重,截距,標准差,Z統計量,P值及95%置信區間.這塊兒跟截面回歸的產出結果是一樣的,關於你的解釋變數base的權重解釋是,在其他多有條件都不變的情況下,base每增加一單位,city會增加0.0179單位,P值0.000,灰常顯著.
最後三行分別是隨機效應模型中個體效應和隨機干擾項的方差估計值,分別為sigma_u,sigma_e.以上兩者之間的關系rho.
需要注意的是你的模型擬合度不高,R方只有26%,當然這要看具體是哪方面的研究以及同方向其他學者的擬合結果,如果大家都在20多,那就OK.
⑸ 如何在面板數據中檢驗變數的內生性
解釋變數內生性檢驗
首先檢驗解釋變數內生性(解釋變數內生性的Hausman 檢驗:使用工具變數法的前提是存在內生解釋變數。Hausman 檢驗的原假設為:所有解釋變數均為外生變數,如果拒絕,則認為存在內生解釋變數,要用IV;反之,如果接受,則認為不存在內生解釋變數,應該使用OLS。
reg ldi lofdi
estimates store ols
xtivreg ldi (lofdi=l.lofdi ldep lexr)
estimates store iv
hausman iv ols
(在面板數據中使用工具變數,Stata提供了如下命令來執行2SLS:xtivreg depvar [varlist1] (varlist_2=varlist_iv) (選擇項可以為fe,re等,表示固定效應、隨機效應等。詳見help xtivreg)
如果存在內生解釋變數,則應該選用工具變數,工具變數個數不少於方程中內生解釋變數的個數。「恰好識別」時用2SLS。2SLS的實質是把內生解釋變數分成兩部分,即由工具變數所造成的外生的變動部分,以及與擾動項相關的其他部分;然後,把被解釋變數對中的這個外生部分進行回歸,從而滿足OLS前定變數的要求而得到一致估計量。tptqtp
二、異方差與自相關檢驗
在球型擾動項的假定下,2SLS是最有效的。但如果擾動項存在異方差或自相關,
面板異方差檢驗:
xtgls enc invs exp imp esc mrl,igls panel(het)
estimates store hetero
xtgls enc invs exp imp esc mrl,igls
estimates store homo
local df = e(N_g) - 1
lrtest hetero homo, df(`df')
面板自相關:xtserial enc invs exp imp esc mrl
則存在一種更有效的方法,即GMM。從某種意義上,GMM之於2SLS正如GLS之於OLS。好識別的情況下,GMM還原為普通的工具變數法;過度識別時傳統的矩估計法行不通,只有這時才有必要使用GMM,過度識別檢驗(Overidentification Test或J Test):estat overid
三、工具變數效果驗證
工具變數:工具變數要求與內生解釋變數相關,但又不能與被解釋變數的擾動項相關。由於這兩個要求常常是矛盾的,故在實踐上尋找合適的工具變數常常很困難,需要相當的想像力與創作性。常用滯後變數。
需要做的檢驗:
檢驗工具變數的有效性:
(1) 檢驗工具變數與解釋變數的相關性
如果工具變數z與內生解釋變數完全不相關,則無法使用工具變數法;如果與僅僅微弱地相關,。這種工具變數被稱為「弱工具變數」(weak instruments)後果就象樣本容量過小。檢驗弱工具變數的一個經驗規則是,如果在第一階段回歸中,F統計量大於10,則可不必擔心弱工具變數問題。Stata命令:estat first(顯示第一個階段回歸中的統計量)
(2) 檢驗工具變數的外生性(接受原假設好)
在恰好識別的情況下,無法檢驗工具變數是否與擾動項相關。在過度識別(工具變數個數>內生變數個數)的情況下,則可進行過度識別檢驗(Overidentification Test),檢驗原假設所有工具變數都是外生的。如果拒絕該原假設,則認為至少某個變數不是外生的,即與擾動項相關。0H
Sargan統計量,Stata命令:estat overid
四、GMM過程
在Stata輸入以下命令,就可以進行對面板數據的GMM估計。
. ssc install ivreg2 (安裝程序ivreg2 )
. ssc install ranktest (安裝另外一個在運行ivreg2 時需要用到的輔助程序ranktest)
. use "traffic.dta"(打開面板數據)
. xtset panelvar timevar (設置面板變數及時間變數)
. ivreg2 y x1 (x2=z1 z2),gmm2s (進行面板GMM估計,其中2s指的是2-step GMM)
⑹ 怎麼進行去中心化處理
根據侯傑泰的話:所謂中心化, 是指變數減去它的均值(即數學期望值)。對於樣本數據,將一個變數的每個觀測值減去該變數的樣本平均值,變換後的變數就是中心化的。
對於你的問題,應是每個測量值減去均值。
⑺ eviews 怎麼對數據進行去中心化
減去均數就可以去中心化
⑻ 數據,交互變數一定要去中心化嗎
不一定,中心化處理只不過是為了方便解釋而已,並不影響各項回歸系數。(南心網 調節效應中心化處理)