當前位置:生活全書館 >

綜合知識

> 內生性檢驗可以刪除對照組資料嗎

內生性檢驗可以刪除對照組資料嗎

內生性檢驗可以刪除對照組資料嗎

內生性檢驗不可以刪除對照組資料。對照組資料對於研究問題有重要作用,會影響結果,所以不能刪。內生性,是模型中的一個或多個解釋變數與隨機擾動項相關,解決方法有工具變數估計、工具變數的優劣等。導致原因:遺漏變數,且遺漏變數與引入模型的其他變數相關;解釋變數和被解釋變數相互作用,相互影響,互為因果;自我選擇偏誤;樣本選擇偏誤。最好收集資料之前就加以考慮,尤其是準備獲取一手資料的情況下。考慮可以應用經濟理論。

內生性檢驗不可以刪除對照組資料。對照組資料對於研究問題有重要作用,會影響結果,所以不能刪。內生性,是模型中的一個或多個解釋變數與隨機擾動項相關,解決方法有工具變數估計、工具變數的優劣等。導致原因:遺漏變數,且遺漏變數與引入模型的其他變數相關;解釋變數和被解釋變數相互作用,相互影響,互為因果;自我選擇偏誤;樣本選擇偏誤。最好收集資料之前就加以考慮,尤其是準備獲取一手資料的情況下。考慮可以應用經濟理論。

小編還為您整理了以下內容,可能對您也有幫助:

如何用SPSS進行解釋變數的內生性檢驗與效果檢驗

在SPSS中,您可以使用迴歸分析來進行內生性檢驗和效應檢驗。

首先,您需要準備好資料並將其匯入SPSS。然後,開啟“分析”選單並選擇“迴歸”>“線性...”。在“線性迴歸”對話方塊中,在“因變數”框中選擇您希望預測的變數,並在“自變數”框中選擇您希望用作預測因子的變數。

接下來,您可以在“選項”選項卡中選擇進行內生性檢驗的方法。SPSS提供了多種內生性檢驗方法,包括Hausman檢驗、Arellano-Bond檢驗和Baum-Schaffer-Stillman檢驗。您可以在“內生性檢驗”下拉選單中選擇您希望使用的方法。

如果您希望進行效應檢驗,則可以在“輸出”選項卡中選擇“效應檢驗”複選框。這將在輸出中生成對效應的檢驗統計量和p值。

最後,單擊“確定”按鈕執行迴歸分析。SPSS將生成輸出,其中包含內生性檢驗的結果和(如果選擇了)效應檢驗的結果。

內生性問題的解決方法

事實上,僅僅為了解決內生性問題,並不需要我們對內生性問題的緣起有很深入的理解。對於應用型的實證研究而言,我們只需要掌握解決內生性問題的具體方案即可。內生性問題的解決方案一共四種,理論上來講,這四種方案應對內生性問題都很有效。但於我個人而言,我對四種方法的評價是有高低的,由高到低分別介紹如下。

1.自然實驗法

所謂自然實驗,就是發生了某些外部突發事件,使得研究物件彷彿被隨機分成了實驗組或控制組。

這是我最喜歡的方法,只是自然實驗需要尋找一個事件,並且這個事件隻影響解釋變數而不影響被解釋變數。遇著這種事件是一種緣分,還要能識別出來,這對學者的眼光也是一種挑戰。

有很多文章聲稱使用了自然實驗,但嚴格來講,並沒有做到對研究物件進行了隨機分組。雖然如此,我對此類文章仍然很是喜歡。

2.雙重差分法

Difference-in-Difference (DID)一般稱為雙重差分法,或倍差法。倘若出現了一次外部衝擊,這次衝擊影響了一部分樣本,對另一部分樣本則無影響,而我們想看一下這次外部衝擊到底有何影響,雙重差分法就是用來研究這次衝擊的淨效應的。

其基本思想是,將受衝擊的樣本視作實驗組,再按照一定標準在未受衝擊的樣本中尋求與實驗組匹配的對照組,而後做差,做差剩下來的便是這次衝擊的淨效應。

雙重差分法實際上是固定效應的一個變種,差分的過程實際上是排除固定效應的過程。ZERA在《計量論文寫作和發表的黑客教程》有一個非常簡明風趣的舉例,我轉述於此,以饗讀者。

“大家都知道買房子靠不靠學校醫院等設施還是有很大差別的。但是,影響房價的因素又不止學區那麼簡單。

學校旁邊的學區房價格上升,難道一定是學區房因素導致的嗎?

現在我們要使用雙重差分法檢驗一個假設:學區房因素導致房價上升。

差分再差分,這個方法要湊效的祕訣是:學區房因素髮生變化,而其他因素基本維持不變。例如教育管理機構重新劃分學區,一個著名國小突然在某個沒學校的地方建分校,或者一個著名國小搬遷,這些因素導致房子是否屬於學區房發生了變化。

以建分校為例。建校後周圍一片區域A的房子都屬於學區房,這個區域以外附近區域(B)的其他房子就不算該校學區房。然後收集建校前後兩個時間點上、A和B區域房價的資料。

所謂的差分再差分法,就是:A區域兩個時間點上的平均房價差距 - B區域兩時間點上的平均房價差距 = d,這個d就是建校對房價的影響了。d是兩個差距之間的差距,所以才叫做差分再差分。用計量回歸把這個d給估計出來,是有辦法的:

P= b0 + b1*Da +b2*Dt + d*(Da*Dt) + Xb + e

P是房價,Da是虛擬變數,在區域A則為1,否則為0, Dt是時間虛擬變數,建校後為1,建校前為0。 STATA一跑,就把d估計出來了。為什麼d可以如此表示?自己思考一下啦。實在想不出來,Wooldridge的書上有精確嚴格的解釋。這裡給出一個直觀的粗略解釋:北京所有區域的房價每個月都在上升,因此需要控制這部分因素,這就是時間因素Dt;區域不同自然也有差別,需要控制區域位置因素,這就是Da,這就控制了即使不建校也存在的差距;控制住其他因素X,那麼剩下的Da*Dt就是建校帶來的房價提升效應了。這下明白了哦。”

當然,如果你想看到更學術化的探討,可以參考2015年第7期《數量經濟技術經濟研究》所刊文章《國內雙重差分法的研究現狀與潛在問題》。

3.工具變數法

這是一種處理內生性問題的經典方法,或者說被濫用最嚴重的方法。

這種方法相信大家都已經學過,就是找到一個變數和內生解釋變數相關,但是和隨機擾動項不相關。在OLS的框架下同時有多個工具變數(IV),這些工具變數被稱為two stage least squares (2SLS) estimator。具體的說,這種方法是找到影響內生變數的外生變數,連同其他已有的外生變數一起迴歸,得到內生變數的估計值,以此作為IV,放到原來的迴歸方程中進行迴歸。

工具變數法最大的問題是滿足研究條件的工具變數難以找到,而不合乎條件的工具變數只能帶來更嚴重的估計問題。

當然,我確實見過非常精巧的工具變數,譬如,殖民地時代的死亡率。

4. 動態面板迴歸法

基本思想是將解釋變數和被解釋變數的滯後項作為工具變數(IV)。其實,我是不認可這種處理方法,除非萬不得已,我不推薦這種方法,我也不太相信這種方法能真正緩解內生性問題。可是,確實很多人都在用。算了,不多說了。

內生性檢驗方法

最近也在學習這個問題,還處於小白階段,分享下我的理解。

內生性問題,是指解釋變數x和殘差項u之間存在相關性。導致內生性問題的原因有多個,所以也就有多個與之對應的解決內生性的方法。

首先有可能是遺漏變數,遺漏的變數和x相關。如果你知道遺漏變數是什麼,直接加進來作為控制變數即可。這是最簡單的一種。

如果不知道遺漏變數是什麼,或者Y和X互為因果。可以使用工具變數法。工具變數法其實也就是2SLS迴歸(當你選的工具變數個數和內生性變數相同時),或者GMM迴歸(工具變數個數大於解釋變數個數)。在使用工具變數時還要考慮工具變數是不是弱工具變數,是不是存在無效工具變數,這都要進行檢驗。

其次,導致內生性問題的原因,還可能是面板資料中,由於個體特異性沒有考慮進去,這些個體特異性如果與解釋變數相關,那麼也會導致內生性問題(x與u相關)。這種情況下,如果你的自變數是隨時間變化的,用固定效應模型;如果你的自變數是不隨時間變化的,用hausman-taylor模型。

第三種,如果你的樣本存在自選擇的問題,也會導致內生性問題。這種情況下就會使用heckman二階段檢驗。

至於具體的實現命令,你直接在stata裡面 help+你想用的迴歸方式,stata裡面提供的材料就挺清楚的了。樓主可以根據自己的需要看看。

剛開始這方面的學習,所以我的知識水平只到這。

至於你說的PSM傾向匹配得分法,DID雙重差分,據我所知,是工具變數法的替代解決方式,工具變數法有個非常致命的弱點是好工具變數非常難找。但是具體背後的原理我還不是特別清楚。

以上,希望對樓主有所幫助。

內生性問題如何解決?

在Stata中,可以使用Hausman檢驗和Durbin-Wu-Hausman(DWH)檢驗來檢驗內生性問題。

1、Hausman檢驗:在執行固定效應模型(FE) 和隨機效應模型(RE) 之前,可以使用hausman命令來進行檢驗。該檢驗的零假設是隨機效應模型是一致且有效的,即不存在內生性問題。如果p值小於0.05,則拒絕零假設,表示存在內生性問題,需要使用固定效應模型。

2、DWH檢驗:執行迴歸後,先儲存隨機效應估計量和固定效應估計量,然後使用estimates store命令。接著,使用predict reghdfehat、predict xtfehat分別生成隨機效應估計量和固定效應估計量的預測值。最後,使用dwatson2命令進行檢驗。

該檢驗的零假設是隨機效應模型是一致且有效的。如果p值小於0.05,則拒絕零假設,表示存在內生性問題,需要使用固定效應模型。

內生性的問題通常由以下三個原因產生:

1、遺漏重要的解釋變數,雖然也可加入被解釋變數的滯後項,但結果可能不精準而產生其他的問題。而可以從其中主要是由於存在自選擇和公司異質性的兩個問題入手,對於自選擇可以選擇Heckman兩階段檢驗,而對於異質性則可以採取公司固定效應。但需要注意公司固定效應只能控制公司隨時間不變的變數,卻不能控制動態變化的變數。

2、變數之間實際上是屬於聯立方程、互相影響的關係,不是單純的因果關係,可採取工具變數法解決。

3、測量誤差,也可採取工具變數法。

穩健性檢驗與內生性檢驗區別

目標與內容的不同和應用領域的不同。

1、目標與內容的不同:穩健性檢驗:穩健性檢驗主要關注對資料中存在異常值、離群點或模型假設不滿足等情況的魯棒性。它旨在驗證經濟模型對異常情況的敏感程度,並保證在存在這些異常情況下仍能得到可靠的結果。穩健性檢驗通常採用一些魯棒的統計方法或模型,如中位數迴歸、分位數迴歸等。內生性檢驗:內生性檢驗主要關注在經濟模型中存在內生性問題,即因果關係的反向性或模型中存在遺漏變數等問題。內生性檢驗旨在識別和解決內生性問題,以確保模型估計的結果具有因果解釋的有效性。內生性檢驗通常採用諸如工具變數、雙重差分等方法來解決內生性問題。

2、應用領域的不同:穩健性檢驗:穩健性檢驗廣泛應用於經濟學和統計學中,特別是在處理具有異常值或非常態分佈的資料時。它可用於迴歸分析、方差分析、聚類分析等各種統計方法中,以提高分析的穩定性和可靠性。內生性檢驗:內生性檢驗主要應用於經濟學中的因果推斷和處理內生性問題的研究。例如,在計量經濟學中,研究人員常常使用內生性檢驗來驗證經濟模型中的內生性假設,確保因果關係的一致性和可信度。

內生性處理:工具變數法

內生性問題是解釋變數與擾動項相關導致的,具體的表現形式有遺漏變數、雙向因果和測量誤差。

OLS能夠成立的最重要前提條件是解釋變數與擾動項不相關。否則,OLS估計量將是有偏且不一致的。

無偏是指估計量的期望等於真實值。一致性是指,隨著樣本的增大,估計量無限接近於真實值。

固定效應模型在 一定程度上 可以緩解內生性。因為使用固定效應模型的原因是存在個體效應、時間效應與解釋變數相關。此時如果不用固定效應模型,這些個體、時間影響就會溜到擾動項中,就產生了內生性問題。

解決內生性問題常見的做法是使用工具變數。

工具變數:與模型中內生變數(解釋變數)高度相關,但卻不與誤差項相關,估計過程中被作為工具使用,以替代模型中與誤差項相關的解釋變數的變數。

“找好的工具變數好比尋找一個好的伴侶,ta應該強烈地愛著你(強相關),但不能愛著別人(外生性)。”

IV法可以視為2SLS的特例。 當內生變數個數=工具變數個數時,稱為IV法;當內生變數個數<工具變數個數時,稱為2SLS

2SLS思路如下:

y=α+βx1+γx2+u,其中x1是嚴格外生的,x2是內生的,則至少需要1個工具變數,z1為工具變數。

第一階段迴歸:內生變數和工具變數

x2=a+bz1+cx1+e

第二階段迴歸:內生變數的預測值和被解釋變數

y=α+βx1+γx2'+v

2SLS背後邏輯:

將內生解釋變數分為兩部分,有工具變數造成的外生部分和與擾動項相關的內生部分。

第一階段:通過外生變數的預測迴歸,得到這些變數的外生部分。

第二階段:把被解釋變數對解釋變數中的外生部分進行迴歸,消除偏誤得到一致估計。

注意:為了保證2SLS的一致性,必須把原方程中所有的外生解釋變數都放入第一階段迴歸。

2SLS的難點在於恰當的工具變數選擇。若存在N個內生解釋變數,則至少需要N個工具變數。

假設迴歸模型

stata命令如下:

以上命令ivregress 2sls 和 ivreg2是等價的,只是 ivreg2顯示的內容更為豐富。xtivreg2 相較於ivreg2,就是OLS和FE/FD模型的差別,ivreg2 ... i.Year i.id等價於xtivreg2 ... i.Year, fe。

針對工具變數有三大檢驗:

以上三大檢驗,優先做相關性檢驗。這是由於弱工具變數會對估計結果以及外生性檢驗結果產生影響。

(1)相關性檢驗

a.不可識別檢驗

不可識別檢驗的原假設是秩條件不成立,即工具變數與解釋變數不相關。不可識別檢驗在一定程度上可以驗證是否存在弱工具變數,但不能取代對弱工具變數的檢驗。關於弱工具變數的檢驗,可以分為單個內生變數和多個內生變數。

b.弱工具變數檢驗

如果方程中有一個內生變數,一個經驗規則是在第一階段迴歸中,如果F統計量>10,則可拒絕“存在弱工具變數”的原假設,不必擔心弱工具變數的問題。

如果方程中有多個內生變數,Stock & Yogo給出了檢驗規則:如果弱識別檢驗的最小特徵值統計量>15% maximal IV size對應的臨界值,就可以認為工具變數不存在弱相關問題。

如果發現是弱工具變數,解決的方法有:

(2)內生性檢驗

首先假定內生性進行2SLS迴歸,然後假定不存在內生性進行OLS迴歸,最後使用豪斯曼檢驗。

當p值<0.1時,表明兩個迴歸的係數存在顯著的系統性差異,及關注的核心變數有內生性。

(3)外生性檢驗

在恰好識別的情況下,即工具變數數=內生變數數,此時公認無法檢驗工具變數的外生性,即工具變數與擾動項不相關。在這種情況下,只能進行定性討論或依賴於專家的意見。在過度識別的情況下,可以進行“過度識別檢驗”。當p>0.1,接受原假設,說明工具變數具有外生性。

注意,如果誤差項存在異方差或自相關,那麼2SLS的估計雖然是一致估計量,但不是有效估計量。更有效的方法是“廣義矩估計”GMM。 某種意義上,GMM之於2SLS,正如GLS之於OLS,前者可以獲得有效估計量,後者只能獲得一致估計量。

該方法的前提條件是:工具變數數>內生變數數,且2SLS存在異方差或自相關

綜上,在使用stata進行2SLS時,推薦使用ivreg2或xtivreg2。

對於面板資料,建議先對模型進行變換,然後對變換後的模型使用2SLS:

參考資料:

《高階計量經濟學及stata應用》

面板資料分析與Stata應用

測量誤差及其對統計分析的影響

有人能講講工具變數和2SLS之間的關係嗎?

工具變數法(五): 為何第一階段迴歸應包括所有外生解釋變數

xtivreg2和它的山寨者

內生性的檢驗

基本思想:直接比較OLS和IV估計值,若所有變數都是外生的,則OLS和IV估計都是一致的,若明顯不同,則我們就斷定解釋變數有內生性。

操作前提:首先找到一個外生變數用做工具變數。

一個問題:工具變數本身的外生性如果檢測?

對於面板資料模型內生性檢驗都有哪些命令

dmexogxt命令

你可以把你結果放上來,讓我們看過。連老師在他的課程裡有說過,hausman檢驗如果出現負值的話是拒絕原假設的徵兆,但此時最好使用麥金農的dmexogxt命令。

內生性檢驗一定要做嗎

內生性

就是模型中的一個或多個解釋變數與隨機擾動項相關。

中文名

內生性

外文名

Endogeneity

性質

數學模型

導致原因

遺漏變數

解決方法

工具變數估計!導致原因

1:遺漏變數,且遺漏變數與引入模型的其他變數相關。

2:解釋變數和被解釋變數相互作用,相互影響,互為因果。

3.自我選擇偏誤。

4.樣本選擇偏誤。

解決方法

工具變數估計

工具變數:假定我們有一個可觀測到的變數Z,它滿足兩個假定

(1):Z與U不相關,即與Cov(Z,U)=0;

(2):Z與X相關,即與Cov(Z,X)不等於0;

我們則稱Z是X的工具變數(instrumental variable 簡稱IV)

舉例:以雙變數模型為例

Y=Q+WX+U;

其中X與U相關,因而OLS估計有偏,有X的工具變數Z,

於是有Cov(Z,Y)=Cov(Z,Q+WX+U)

=Cov(Z,WX)+Cov(Z,U)(Q為常數)

=WCov(Z,X)

所以有W=Cov(Z,Y)/Cov(Z,X)

工具變數的優劣

(1):Z與U不相關,即與Cov(Z,U)=0;

相關性越低,則越好

(2):Z與X相關,即與Cov(Z,X)不等於0;

相關性越高,則越好

Z與U相關性低,Z與X相關性高,這樣的工具變數被稱為好工具變數,反之則稱為劣工具變數。

好的工具變數的識別

(1):Z與U不相關,即與Cov(Z,U)=0;

由於U無法觀察,因而難以用正式的工具進行測量,通常由經濟理論來使人們相信。

(2):Z與X相關,即與Cov(Z,X)不等於0;

將X對Z迴歸即可,看看X的係數是否顯著異於零?

IV與OLS估計量的簡單比較

IV估計量:C1=Cov(Z,Y)/Cov(Z,X)

而OLS估計量是:C2=Cov(X,Y)/Cov(X,X)

(1)因此,Z=X時,兩者將完全一致,換句話說,當X外生時,它可用做自身的IV,IV估計量便等同於OLS估計量。

(2)若Z與X不相關,Cov(Z,X)等於0,則IV法無法給出估計量。

IV與OLS的取捨

(1)儘管當Z與U不相關,而Z與X存在著或正或負的相關時,IV是一致的,但當Z與X只是弱相關時IV估計值的標準誤可能很大,Z與X之間的弱相關可能產生更加嚴重的後果:即使Z與U只是適度相關,IV估計的漸進偏誤也可能很大。也即是說,當解釋變數外生時,IV與OLS估計都是一致的,但IV估計不如OLS有效。

(2)所以,當內生性程度不嚴重或者好的工具變數找不到時,還不如用OLS。反之,當內生性程度嚴重時,就一定要想辦法解決,否則,OLS估計就是不可接受的,當然,差的IV同樣是不可接受的。

其它解決辦法

(1)代理變數:某變數無法直接觀測,而用其它變數替代。

(2)前定變數:用變數的前一期或前幾期資料。

(3)面板資料模型。

檢驗

基本思想:直接比較OLS和IV估計值,若所有變數都是外生的,則OLS和IV估計都是一致的,若明顯不同,則我們就斷定解釋變數有內生性。

操作前提:首先找到一個外生變數用做工具變數。

一個問題:工具變數本身的外生性如何檢測?

對待態度

(1)需要重點考慮的問題之一;

(2)最好的收集資料之前就加以考慮,尤其是準備獲取一手資料的情況下。如何考慮?應用經濟理論。

內生性檢驗和穩健性檢驗的區別

內生性檢驗和穩健性檢驗的區別如下:

面板資料迴歸後,穩健性檢驗一定要做。

穩健性檢驗的方法:從資料出發,根據不同的標準調整分類,檢驗結果是否依然顯著;從變量出發,從其他的變數替換,如:公司size可以用totalassets衡量,也可以用totalsales衡量從計量方法出發,可以用OLS,FIXEFFECT,GMM等來回歸,看結果是否依然robust。

穩健性檢驗

考察的是評價方法和指標解釋能力的強壯性,也就是當改變某些引數時,評價方法和指標是否仍然對評價結果保持一個比較一致、穩定的解釋。通俗些,就是改變某個特定的引數,進行重複的實驗,來觀察實證結果是否隨著引數設定的改變而發生變化,如果改變引數設定以後,結果發現符號和顯著性發生了改變,說明不是穩健性的,需要尋找問題的所在。

概念和檢驗方法。

1、概念。穩健性檢驗是指在資料存在離群值的情況下,檢驗方法仍然能夠保持有效性和穩定性的檢驗方法。而異質性檢驗是指在資料存在異質性的情況下,檢驗方法能夠有效地檢測出不同樣本之間的差異性的檢驗方法。

2、檢驗方法。穩健性檢驗使用中位數等魯棒性較強的統計量進行檢驗,以避免離群值對檢驗結果的影響。而異質性檢驗通常使用方差分析、卡方檢驗等方法進行檢驗,以確定樣本之間的差異是否顯著。

  • 文章版權屬於文章作者所有,轉載請註明 https://shqsg.com/zonghezhishi/5l04o9.html