stata中如何去中心化處理
『壹』 如何處理stata的數據問題
兩個辦法:
1. 加內存條。需要說明的是32位操作系統僅能識別4GB以內的內存,想要更大的內存需要安裝64位系統,並配套安裝64位的Stata
2. 部分導入數據 use data in 1/10000 或者 use 變數名 using 數據名
『貳』 如何在stata中剔除部分數據
剔除數據的依據或者判斷標準是哪些呢
『叄』 stata做回歸分析時,有變數提示由於共線性被忽略,求大神指導如何處理是將其剔除再回歸嗎
不一定,首先變數提示由於共線性被剔除有兩種原因,一種是正常的,不用管,一種是不正常的,需要處理,不過總的來說無論你是否處理,它都不會進入回歸(stata會自動忽略),要處理的都是你的模型假設。
正常的,就是說例如這樣:我們假設我們分析的群體是51~80歲的,我們想把年齡分成三組,變數1是虛擬變數代表在50~60歲間(是=1,否=0),變數2是虛擬變數代表在61~70歲間,變數3是虛擬變數代表在71~80歲間。那麼當你回歸時加入這三個虛擬變數控制年齡的時候,因為這三個變數的和一定為1(共線性),所以系統會自動忽略其中一個,但是這個時候你不用在模型中刪除那個被忽略的變數,因為這是正常的,這代表那個變數被自動選為基準組。我們在解釋其他組的變數的系數上,也是解釋為「相對於被忽略的那個基準組,這個變數所代表的組如何影響因變數,這個組是有平均比起基準組更多還是更少的因變數「。
不正常的,就是說明明不是分組的虛擬變數,但也有共線性。比如說可能是這樣,你想看丈夫和妻子的年齡差,然後又希望控制丈夫和妻子的年齡,這時由於(年齡差=年齡相減)產生了共線性,這說明你的模型本身就設定失誤,我們只需要控制丈夫的年齡就可以達到都控制的效果。
也可能是這樣:你想看」是否退休「對因變數的影響,但是因為你的樣本比較窄,比如是」20~50「歲的樣本,導致所有人都沒有退休,」是否退休「變數對所有人都是0(沒退休),所以被忽略掉,這時就意味著你的樣本不支持做你想要的模型,此時也只得刪掉這個變數了。
『肆』 stata如何回歸
1、生成一個自變數和一個因變數。
『伍』 如何用stata對數據進行中心化處理
直接代碼解決
ssc install center(安裝center)
center vars即可
『陸』 如何在stata中處理面板數據
短面板處理
面板數據是指既有截面數據又有時間序列的數據,因此其存在截面數據沒有的優勢,在用stata進行面板數據的估計時,一般選擇xtreg命令進行擬合。本節主要論述短面板的stata實現,即時間維度T相對於截面數n較小的數據。在那種情況下,由於T較小,每個個體的信息較少,故無從討論擾動項是否存在自相關,我們一般假設其獨立同分布。
面板數據維度的確定
在面板數據進行模型估計前,要進行面板數據的維度確定。由於面板數據既有截面數據又有時間序列,而stata不能自動識別,因此,必須使得stata得知哪一部分是截面數據,而哪一部分是時間序列。
設置面板數據維度的基本命令為:
xtset panelvar timvar [, tsoptions]
其中panelvar代表截面數據變數,timvar代表時間序列變數。
選取某一面板數據進行維度設定:
xtset fcode year
『柒』 怎麼進行去中心化處理
根據侯傑泰的話:所謂中心化, 是指變數減去它的均值(即數學期望值)。對於樣本數據,將一個變數的每個觀測值減去該變數的樣本平均值,變換後的變數就是中心化的。
對於你的問題,應是每個測量值減去均值。