认真回答一下这个问题,学艺不精求轻喷。
首先需要知道的是,对弱工具变量的检验以及判定是一个至今为止仍在发展的领域。
题主问题:弱工具变量的判定指标都有什么?我会把现有的指标罗列出来,尽可能详细地介绍一下。首先,这类指标应当分为两类,
第一类单纯地叫做weak identification test(弱识别检验);
第二类叫weak-identification-robust inference(稳健弱识别推断,不太确定中文是不是这么翻译)。
为什么会把现有的指标分为两类,后面我将会提到。但在正式进入之前,我十分想强调:弱工具变量检验的指标和你的模型假设紧密相连的,也就是说,不谈specification的test都是耍流氓!
首先讲weak identification test,原本只想介绍用法,但是这里不得不提一下一个最基本的理论,一个“好的”工具变量应该具有什么样的性质:
1. 弱外生性:就是说你的工具变量和你的误差项直接没有关联,及Cov(z, e) = 0;
2. Rank condition:你的工具变量得和你潜在有内生性问题的变量有关联,及Cov(z, x) 不等于0;
3. 这个关联不等于零还不够,还不能太小。
这三个性质可以概括为工具变量的“validity"(有效)和“strength”(强),但是这三个性质如何分组变成以上两个,据我们老师说,不同文献里表现得也有些混乱,有的把违背1单独认为叫无效工具变量。而由于违背了2也就同时违背了3,这样的工具变量称为弱工具。但是更多的是认为,1和2为有效工具变量的条件,3为强工具的条件。多说了很多,其实就是为了说明在涉及工具变量检验的问题上,无效工具变量问题是和弱工具变量问题紧密联系的。这也就是为什么我们可以把一系列无效识别检验统计量进行一些“延伸”便可以进行弱识别检验。其中这个F大于10其实就是关于Cragg-Donald statistic 的一个约定俗称的要求。说了这么多,不如直接把我之前presentation里整理的内容贴出来:
我目前知道的Stata里可用的也就这四种,而且,我也说了,不谈specification就是耍流氓,第一个第二个的假设你们也看到了。
从LM到Wald就是一个从underidentification到weakidentification“延伸”的过程,而且你还可以选择“延伸”多少,其实就是通过显示不同“延伸”程度的p-value来帮助你观察弱工具变量问题,随便发些文献里出现的表格和我自己搞的东西感受一下:
说到这里,发现才讲了一半。为什么会有另一种更“高级”的东西叫weak-instrument-robust inference这种东西出现呢?原因正如高票答主已经说到的,一般的假设检验会因为你的弱工具变量问题而失效的。如果我们使用上述几种检验作为pre-test,会产生严重的pre-test bias problems。那么我们有什么办法去避免这一问题?一种可行的方法就是放弃点估计方法而去构造一个区间,也就是所谓的Anderson-Rubin test,以及之后进一步发展的Kleibergen K test和Moreira CLR test,这一方法化解上述问题的机制大家可以用下面这张图感受一下,这里不做更多说明。
具体选用哪个也是有讲究的,但一般来说CLR更为普遍。上面那张表格里就有采用报告CLR confidence set来判断弱工具变量问题,从检验结果看显而易见,如果这个区间构造不出来,那么我们并不能排除弱工具变量问题。不得不提到的是,目前Stata可用的weak-instrument-robust inference命令——weakiv,上述三种指标都能report。最重要的是,它可以在non-i.i.d.data乃至GMM dynamic pannel data下使用的(吹一波,我们的计量老师是作者之一。)
以上便是我对弱工具变量判定指标的罗列,至于这么多指标,他们的具体标准是什么,甚至不同指标间产生相反的结果,我个人认为除了需如实面对以外,更多地是要结合具体问题以及涉及的经济学理论去讨论的,这一部分的文献读得不多,看到的结果貌似更多像是上面那张图展示的那么统一,这里就不作误导了。