• stata學習筆記 聯系客服

    經濟數據的特點與類型。

    1、橫截面數據:多個經濟個體的變量在同一時間點上的取值,如2012年中國各省的GDP 2、時間數列數據:指的是某個經濟個體的變量在不同時點上的取值,如1978-2012年山東省每年的GDP

    3、面板數據:多個經濟個體的變量在不同時點上的取值,如1978-2012年中國各省的GDP

    小樣本OLS(最小二乘法):單一方程線性回歸最常見方法

    條件:解釋變量與擾動項正交、擾動項無自相關、同方差。 擬合優度:衡量線性回歸模型對樣本數據的擬合程度(R2),越高說明模型擬合程度越好。

    單系數T檢驗:對回歸方程擾動項的具體概率進行假設

    顯著性水平進行檢驗

    F檢驗:整個回歸方程是否顯著 STATA操作簡介:

    如果數據中包含1949-10-01或1949/10/01的時間變量,導入stata后可能會被視為字符串,因此對于日度數據,可以使用命令gen newvar=date(varname,YMD),將其轉換為整數日期變量,其中YMD說明原始數據的格式為年月日,如果原始數據的格式為月日年則使用MDY;對于月度數據則gen newvar=monthly(varname,YM)。

    .describe:數據的概貌 .drop keep:刪除和保留 .su:統計特征 Pwcorr:變量之間相關系數 Star(.05):5%顯著性水平 gen:產生 g intc=log(tc):取自然對數. reg:OLS回歸 .Vce:協方差矩陣 reg。。。,noc表示在進行回歸時不要常數項

    大樣本OLS:只要求解釋變量與同期的擾動項正交即可

    Robust:穩健標準誤,如果存在異方差,則應使用穩健標準誤

    最大似然估計法:如果回歸方程存在非線性,則使用最大似然估計法(MLE)或非線性最小二乘法(NLS)

    三類在大樣本下漸進等價的統計檢驗:Wald test LR(似然比檢驗) LM 操作步驟如下:sysuse auto(調用數據集)

    Hist mpg,normal(畫變量mpg的直方圖,并與正態密度比較)

    .1Density.020.04.06.081020Mileage (mpg)3040

    直方圖顯示,變量mpg的分布于正態分布有一定差距。 變量可以取對數解決非正態分布的問題。

    異方差與GLS(廣義最小二乘法)

    異方差的檢驗:看殘差圖、懷特檢驗(white test)、BP檢驗(Breusch and Pagan) 異方差的處理:1、OLS+穩健標準誤(最好的) 2、廣義最小二乘法(GLS) 3、加權最小二乘法(WLS) 實例操作:

    1、 使用數據:use nerlove.dta,clear

    2、 reg intc inq inpl inpk inpf(進行回歸) 3、

    Source SS df MS Number of obs = 145 F( 4, 140) = 437.90 Model 269.524728 4 67.3811819 Prob > F = 0.0000 Residual 21.5420958 140 .153872113 R-squared = 0.9260 Adj R-squared = 0.9239 Total 291.066823 144 2.02129738 Root MSE = .39227 intc Coef. Std. Err. t P>|t| [95% Conf. Interval] inq .7209135 .0174337 41.35 0.000 .6864462 .7553808 inpl .4559645 .299802 1.52 0.131 -.1367602 1.048689 inpk -.2151476 .3398295 -0.63 0.528 -.8870089 .4567136 inpf .4258137 .1003218 4.24 0.000 .2274721 .6241554 _cons -3.566513 1.779383 -2.00 0.047 -7.084448 -.0485779 4、 畫殘差圖:rvfplot

    2Residuals-101-20Fitted values24

    上圖可以發現當擬合值較小時,擾動項方差較大,繼續考察殘差與解釋變量inq的散點圖:rvpplot inq,結果與上圖幾乎一致,可能存在異方差,即擾動項的方差隨著觀測值而變。

    5、 完成回歸后,進行懷特檢驗:estat imtest,white

    White's test for Ho: homoskedasticity against Ha: unrestricted heteroskedasticity chi2(14) = 73.88 Prob > chi2 = 0.0000Cameron & Trivedi's decomposition of IM-test Source chi2 df p Heteroskedasticity 73.88 14 0.0000 Skewness 22.79 4 0.0001 Kurtosis 2.62 1 0.1055 Total 99.29 19 0.0000

    P值顯著,認為存在異方差 6、完成回歸后,進行BP檢驗:estat hettest,iid estat hottest,rhs iid estat hottest inq,iid

    Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: inq inpl inpk inpf chi2(4) = 36.16 Prob > chi2 = 0.0000

    三種形式的檢驗都強烈拒絕同方差的原假設,存在異方差(這里只放一個形式的檢驗結果) 7、 處理異方差

    自相關 :擾動項之間自相關

    自相關的例子:1、時間序列數據中通常具有某種連續性和持久性,如相鄰兩年的GDP增長率;2、截面數據中相鄰的觀測單位之間可能存在溢出效應,如相鄰地區的農業產量收到類似天氣變化的影響;3、對數據的人為處理如數據中包含移動平均數等;4、如果模型設定中遺漏了某個自相關的解釋變量并被納入到擾動項中,則會引起擾動項的自相關。

    自相關的檢驗:1、畫圖(不推薦)2、BG檢驗estat bgodfrey 3、BOX-Pierce Q檢驗 4、DW檢驗 estat dwatson. 檢驗都要在OLS做完后才能做。

    自相關的處理:1、使用OLS+異方差自相關穩健的標準誤;2、OLS+聚類穩健的標準誤;3、使用可行廣義最小二乘法(FGLS);4、修改模型設定

    自相關處理實例:1、使用數據 icecream 然后進行回歸