说到工具变量怎能不提《mostly harmless econometrics》的作者之一Angrist?Wooldridge的教科书《Econometric Analysis of Cross Section and Panel Data》举了两个Angrist使用工具变量的例子。
第一个是1991年QJE上 Angrist&Krueger 的 Does Compulsory School Attendance Affect Schooling and Earnings? 。这篇论文研究的是一个老问题:教育对收入的影响。我们知道,由于有遗漏变量的问题,直接做OLS回归会有内生性问题。这篇论文考虑到,由于美国的义务教育规定是按年龄限制的,不到一定的年龄就不能离开学校,所以一月出生的人在一月份就可以走了,但六月出生的人必须要在学校待到六月,这样出生月份不一样的人结束教育的时间也不一样,但是他们开始教育的时间都是学校开学的时候。结果出生月份就会影响受教育时间的长短。于是这篇论文就用是否出生在第一季度作为教育时间的工具变量,发现用工具变量的结果和用OLS的结果没有显著区别。这个工具变量后来也受到了一些质疑,因为这是一个弱工具变量,出生月份对受教育时间的影响尽管存在但很小,这样即使出生月份和遗漏变量只有很微弱的相关性,估计结果也会有比较大的偏差。
第二个是1990年AER上Angrist的 Lifetime Earnings and the Vietnam Era Draft Lottery: Evidence from Social Security Administrative Records 。这也是他的博士论文工作。这篇论文研究的是参加越战经历对之后收入的影响,这显然也是一个有内生性的问题。作者注意到,国防部征兵的时候是给适龄的男性抽一个号码(Draft Lottery),然后定一个上限,号码小于这个上限的人在征兵范围之内。于是他定义征兵号是否小于这个上限为draft eligibility,显然draft eligibility为1的人更可能参加越战,而这个数字是随机抽的,所以draft eligibility是一个合适的工具变量。这是一个巧妙利用自然实验的例子。
最近又知道一个很有意思的。1998年AER的 Angrist&Evans 的 Children and Their Parents' Labor Supply: Evidence from Exogenous Variation in Family Size 。这篇论文研究的是子女数目增加对父母劳动市场参与的影响。这里的问题就是找一个影响子女数目的外生冲击。这方面的研究有的用的是双胞胎,有的用的是流产失败。双胞胎的产生当然一般是随机的,而不是预料到设计出来的,所以这是直接增加子女个数的外生冲击。这篇论文考虑了一个间接增加子女个数的因素,就是头两个孩子的性别构成。这为什么会影响子女数量呢?他们的理论是这样的:父母一般希望子女的性别构成多样化,所以如果头两胎都是男孩或女孩,那么他们就希望再生一个性别不一样的,但如果前两胎一个男孩一个女孩,那性别多样化的任务已经完成了,就不会再生了,所以前两个孩子性别一样的家庭会有更多的子女。我觉得这个思路确实很神奇。总之,找工具变量就是要开动脑筋,大胆联想。
怎么没有人提兰小欢的这篇用Chinese Student Protection Act of 1992 (俗称人血馒头法案) 的研究啊。
原文
Lan, Xiaohuan. "Permanent visas and temporary jobs: Evidence from postdoctoral participation of foreign PhDs in the US." (2009).
作者研究的题目本身就很有趣,是看美国的博士后劳动力市场的。他想实证的主题是:为什么那么多在美国拿到博士的非美国居民愿意干工资很低的博士后的工作呢?一般有两个可能性, 一个是这些博士们本身非常热爱科研而不计较工资报酬,另外一个就是博士后工作可以得到在美国合法居住的身份。
可能大部分人都会直觉上觉得是后者,但是要从实证的角度来证明得到美国合法居留身份就是很多人愿意从事博士后工作的原因 其实是很难的。(关于计量里面causal-inference的问题太多了需要另开一贴讨论,在这里就不展开了)。
那么有没有一种可能,就是假设美国政府给所有外国籍博士一毕业就给绿卡,保证他们都可以合法留在美国, 然后这样就可以清楚的看到还有多少博士处于科研上的热情愿意去干博士后了嘛!
可是到底有没有这样的事情发生过呢?
有没有呢?
现在视线拉回遥远的东方。在80年代末曾经发生过一个著名的事件(你懂的)。在该事件发生以后,美国在1992年颁布了一项法案,该法案规定,对于所有在1990 年4月11日之前抵达美国的中华人民共和国的居民全部授予永久居留权(绿卡) (具体法案详情请自行搜索Chinese Student Protection Act of 1992 )。当然当时所有博士毕业的中国学生也包括在内。
他具体操作使用2SLS,然后得出的结论大家大概也能猜得到,当然是证实了大多数人的猜想。这里就不赘述了。
这篇文章的结论是:当时,中国人在美国读博士的有57%选择继续申请博士后。但是如果博士毕业就能拿绿卡,那么申请的概率就下降到43%。 换句话说,在美国申请博后的中国人中,有四分之一是为了绿卡而去的。要是博士毕业就有绿卡的话,他们博士毕业就离开学术界了。
2. Updated on April 15th, 2018
评论区有几个同学问道这篇文章的工具变量到底是什么。我把文章的abstract 贴上来吧。知乎的作用是普及,又不是深入学习经济学的地方。对这篇文章感兴趣的自己去看原文啊。
About 75 percent of U.S. -trained, noncitizen PhDs in science and engineering work in the United States after graduation, and 54 percent of those who stay take postdoctoral positions. The probability of postdoctoral participation is substantially higher for tem porary visa holders than for permanent visa holders because of visa-related restrictions in the U.S. labor market. To identify the causal effects of visa status on entry into a postdoctoral position, this paper uses a unique shock to visa status generated by the Chinese Student Protection Act of 1992. Eligibility for the act is used as an instrumental variable for visa status. Two-stage least-square estimates show that permanent visa holders are 24 percent less likely to take postdoctoral positions than temporary visa holders. The effects of a permanent visa vary considerably across research fields, but for most fields, it reduces postdoctoral participation sinigificantly。
----------------------------------------------------------------------------------------------
这大概是我最初读得很过瘾并且有“哇塞 原来学经济学的脑洞还可以这样开” 的感觉的论文之一吧。虽然后来转行了,但是想起来当初的感觉还在。
这要从 @比利海灵顿 讲的一个段子[1]说起。据说二战期间,为了防止德国间谍伪装成美军混入阵地后方,美军曾以此问题盘问过往军人:“伊利诺伊州的首府是哪里?”正确答案是:斯普林菲尔德(春田市)。间谍经过系统培训,自然知道正确答案。但回答斯普林菲尔德的人都要受到严密审问。因为真正的美国当地大头兵受教育程度有限,他们的答案通常是芝加哥。如果对这个段子仅仅是一笑而过,那就亏大了。因为,你可能因此错失了一篇AER;)
看上面这张伊利诺伊州的地图,有两个信息非常明显。首先,最大城市芝加哥不在首府;其次,作为首府的斯普林菲尔德,位置几乎在整个州的正中心。这一点是巧合吗?不是的。Campante和Do 2014年的研究引用了很多政治学的文献,告诉我们:美国建国之初,交通和通讯条件不便。为了平等保障各地的代表权,不要给代表施加太高的参政议政成本,各州都偏向把首府放在整个州的中心[2]。因此,伊利诺伊州的情况不是特例:首府放在中间,也不是州里最大的城市。
利用这一点,前面提到的二位作者漂亮地回答了一个历史相当悠久的问题:要尽可能预防腐败,政治中心和经济中心(通常也是人口最多的地方)的距离应该要多远?有的学者说,两者应该隔得近一点。这样,企业和人民可以更好地参与政治、监督政府;也有学者说应该远一点。这样,政府更超然,盘踞在经济中心的各利益集团更难俘获政府。利用开头段子里提到的“斯普林菲尔德-芝加哥判别法”,二位学者构造了两个很棒的工具变量,证实前一种观点才是正确的。
具体来说,文章要研究的,是州内居民到首府的平均距离(用人口普查数据计算),和各州的腐败率、腐败感知度、政治参与率、公共品供给间的关系。文章采用的工具变量,是“两个中心的距离”:其中一个是人口中心,也就是州的范围内,距离全体居民的平均距离最小的点[3];另一个是地理上的中心。这个距离和居民到首府的距离高度相关,又不太可能通过以外的途径影响最终的腐败。因此,这是个很棒的工具变量。当然,个人认为:如果算灯光而非人口的中心,就更好了。
简单叙述他们的结论:工具变量法发现,州内居民到首府的平均距离增加,会导致各州的腐败案件数量显著增加、腐败感知度提高、搜索“腐败+州名”的频率上升、公共品开支下降。导致这一结果的渠道,很可能是缺乏监督。作者同时发现:州内居民到首府的平均距离增加,会导致当地媒体报道中政治新闻的比重下降、选举投票率下降、两党竞选开支下降。用一句话概括结果,就是“县官也得现管”。开头提到的伊利诺伊,确实也是美国贪污案件比较多的州,印证了这一结论。
[1] 段子原文请见比利海灵顿:你都见过什么样的地理盲?。
[2] 对这一点的深入讨论和文献列举,请见原文第10-11页。
[3] 为了防止人口数据可能造成的干扰,文章还用农作物适种指数计算了一个中心,替代人口中心。
文献来源:Campante, Filipe R, Quoc-Anh Do. "Isolated capital cities, accountability, and corruption: Evidence from US states." The American Economic Review 104.8 (2014): 2456-2481.