• stata學習筆記 聯系客服

    有變量,如het(age married children)),LR檢驗原假設為同方差。

    多值選擇模型

    個體面臨的選擇有時是多值的,因此可能需要使用到多項probit或多項logit,或者在有某項條件時需要用到條件logit,還有在不隨方案而變的多項logit模型和解釋變量隨方案而變的條件logit模型混合的logit模型。

    舉例來說,問卷調查將受訪者職業分為五類(OCC),解釋變量為是否白人、受教育年限、工齡,解釋變量都依賴于個體而不依賴于方案,因此使用多項logit或多項probit回歸:

    進行多項logit回歸:

    上述結果說明白人更不可能選擇服務業或工匠;是否白人對選擇藍領或白領沒顯著影響。。。

    排序與計數模型

    1、 泊松回歸:被解釋變量只能取非負整數,即0,1,2….,這時常用泊松回歸。

    Poisson y x1 x2 x3,r irr

    Poisson y x1 x2 x3,r exposure(x1) Poisson y x1 x2 x3,r offset(x1)

    其中,r為穩健標準誤,irr為顯示發生率比,exposure表示把inx1作為解釋變量并使其系數為1,offset表示將x1作為解釋變量并使其系數為1.

    2、 負二項回歸:泊松回歸的局限是泊松分布的期望與方差一定相等,但如果被解釋變量的

    方差明顯大于期望,即存在過度分散,這時候可以使用負二項回歸。 Nbreg y x1 x2 x3,r exposure(x1)

    Nbreg y x1 x2 x3,r dispersion(constant) offset(x1) 其中dispersion(constant)表示使用NB1模型。

    3、 零膨脹泊松回歸與負二項回歸:如計數數據中包含大量0值,則可以使用零膨脹泊松回

    歸或零膨脹負二項回歸。如果vuong統計量很大為正數,則應該使用零膨脹泊松回歸,如果統計量很小為負數,則使用零膨脹負二項回歸。 Zip y x1 x2 x3,inflate(varlist) vuong(零膨脹泊松回歸)

    Zinb y x1 x2 x3,inflate(varlist) vuong(零膨脹負二項回歸),其中inflate(varlist)不可缺少列出所有變量。

    如果研究者只關注參數的估計值,則泊松回歸。 Stata舉例:

    被解釋變量narr86(1986年被逮捕的次數),被解釋變量為計數數據,盡管如此,還是使用OLS回歸進行觀察:

    R的平方為0.07,但大多數解釋變量都顯著,下面進行泊松回歸,并使用穩健標準誤:

    (nolog)表示不顯示迭代記錄。上倆圖可以看出雖然OLS和泊松的系數相差很大,但兩者并不具有可比性,為方便比較,計算泊松回歸的平均邊際效應:

    可以看出,泊松模型的平均邊際效應與OLS的回歸系數很接近,為便于解釋系數,下面計算發生率比:

    可以看出黑人被逮捕次數比白人多93.6%。此外使用泊松回歸的前提之一是被解釋變量的期望與方差相等,因此考察被解釋變量的統計特征:

    結果顯示樣本方差幾乎是樣本均值的兩倍,為放松此假定進行負二項回歸(NB2):

    上圖中alpha的置信區間為0.7-1.24,因此可在5%的顯著性水平下拒絕過度分散參數