稍微复杂一点的structure form需要的计量和计算的知识就很大了。
如果模型需要解一个博弈,那么博弈的解怎么快速用算法实现?有时候一个2x2的game,如果加入了game heterogeneity (X),研究者要解的可能就是上千个game的equilibrium,对于计算量复杂的MLE 来说,这可能是致命的。
接下来,如果你要做inference呢。很多structural model需要的计量工具都不是first year core 会讲到的。比如什么时候可以bootstrap,如何正确的bootstrap。
对于很多问题研究来说,这种复杂是得不偿失的。structural model的好处在于研究者可以做counterfactual,有很好的政策上的policy implication。而对于仅仅想解释x对y的影响,你更需要的是好的instrument而不是5-6页的结构模型。
关于这个问题,我也思考过很久,到底什么时候用reduced form,什么时候用structural form,具体行为模型和纯统计分析方法到底如何结合。 仅仅是纯reduced form足够吗?我自己学到现在可以肯定的是,MHE是非常非常非常重要的(可以说最重要)应用微观教材,它背后的那套angrist和imbens提出的框架,也是最最基础的所有研究者必须掌握的工具。但是,要做研究,除非你是讲故事的天才,或者intuition超级无敌牛逼,不需要建模就可以发现自己研究中可能存在的问题及解决方案,否则只有MHE是绝对不够的。
这个问题我和我的老板Ronni Pavan,还有madison的chao fu老师都有过深谈,先把坑占了,有空了再具体写写我的感受。
两位老师给出的建议都是,不同的问题,不同的研究目标,要选用不同的方法。
reduced form的优点在于,1. 直观,能够迅速得到想要的某组因果关系;2. 模型估计假设要求少,因为我们在进行所谓的reduced form的研究的时候,实际上就是在把一个复杂的经济过程和人类行为模型看成了黑箱。这样的话我们就不用impose复杂的模型行为假设了,尤其是当我们使用非参或者半参的方法时,我们所做的假设是很弱很弱的。
但是reduced form的缺点就在于,我们把这个过程看作了黑箱,就使得我们无法得到任何有关这组因果关系的具体实现机制的信息了。按我老板的话说,reduced form非常不“economics”,因为我们根本没有给予任何作用机制,也就是行为主体行动的解释。所以,当我们想要考察一个具体作用机制,那就必须impose更多的structure,更多的行为的经济环境假设。这就是structural approach能够补充reduced form的地方。我不是做经济史的,但是我个人感觉经济史数据偏少,目标大多是限定在因果关系本身,建模困难,所以大多用reduced form是有道理的。
再继续说说structural approach。Structural approach和reduced form最大的区别就在于,我们不再只考虑某一组因果关系本身,不再把行为人的决策过程和不同行为人之间的交互过程(及导致的市场均衡)看做一个黑箱,而是尝试着从最基础的行为人效用最大化开始建立关于整个决策过程的模型。这样做的好处有两个,1. 通过构建整个决策过程的模型,我们能分析一个因果关系的作用机制,而不仅是因果关系本身。我老板是个很structural的人,所以他一直觉得reduced form太偷懒,对于我们理解人的行为本身没有太多的助益,而经济学本身最重要的任务之一,就是探寻人的整个决策过程。如果我们永远局限于reduced form,那么其实就完全不需要经济学,只做一个统计学家就可以了。 2. 通过一个完整的决策模型(而不是纯粹的简约式模型),我们能做很多reduced form里无法做的counterfactual analysis,而这个对于具体的政策指导,有着极大的帮助。比如,考虑一个Colas(2017)里关于移民影响美国就业市场的例子。在Colas的这篇JMP里,他用structural approach建立了一个关于美国的就业市场如何通过国内迁移(domestic migration),平衡各地的劳动力,来作为对国际移民进入的反应的动态一般均衡模型。在这个大模型里,他考虑了一种counterfactual,假设美国政府通过了某一种Paid Visa Program,也就是说,有偿卖出美国工作签证,然后把这些收上来的签证费作为补偿返还给国内受到移民冲击的工人,这样的政策是否能提升国家的整体福利水平。这种比较复杂的counterfactual analysis,是reduced form所无法做的。只有构建出具体的关于行为人行为方式的模型,以及市场结构的模型,我们才能够分析类似的复杂政策。 3. 在应用上,我个人能够感受到,即便你个人只想做一个reduced form的分析,构建一个具体的结构模型,有助于理解reduced form relationship里可能存在的漏洞和问题(内生性)。
虽然看上去structural approach比reduced form逼格高很多,但是其实它的问题也比reduced form多很多。1. 在进行建模的时候,我们必须impose更多假设,尤其是如果想要用MLE来进行估计的话,就必须有关于unobservable的大量分布假设,比如logit里面的EV1,或者正态分布等等。这些unobservable的分布假设完全是从天而降没道理的,假设成某种形式完全只是为了模型好解或者好估计(比如EV1能推导出一个closed form的logit),同时这些假设也是无法验证的。这也是我对structural form最大的怀疑之处,因为我觉得这样的建模方式违背了科学研究最基本的一些方法论。我和fu老师也聊过这个问题,她说目前确实没有太好的办法解决,但是已经有了一些前沿研究在考虑这些unobservable分布的假设了。2. 更复杂的结构意味着模型更难解,更难估计。事实上,不要说识别并估计一个复杂的game了(一般稍微复杂一点的game就必须借助set identification或者均衡选择这种玄学的东西了),估计一个动态的古典模型都很困难,直到Rust(1987) 和 Hotz and Miller(1993) 提出了NFP算法或者用CCP近似解value function,我们才有了比较好的数值方法。
总的来说,structural approach需要更多的假设,但能reveal问题里更多的方面。但是为了能reveal问题更多的方面,你就只能以这更多的假设为代价。按fu老师的话说,这就是你必须pay的price。
当你仔细了解了两种方法的优缺点之后,才能够看菜下饭,根据自己的研究目标和研究课题,选取不同的方法。如果你只想要某组因果关系,reduced form就够了。
然后说一个chao fu老师给我的具体例子。
考虑一个简单的妇女劳动参与模型。我们现在希望研究,丈夫收入对妇女工作决策的影响。
c是消费,w是参与工作能获得的工资,y是每一期获得的固定收入(丈夫收入,妇女自己工不工作都有)。pa是表示是否工作的discrete choice,即,若i参与劳动市场则pa=1,反之pa=0. X代表控制的其他变量, 代表某个人固有的不可观测的preference。
对于简约式来说,我们要的只是一个CEF,也就是:
对于这个模型的估计,我们只需要非参的方法就可以。
如果我们简单假设线性概率模型,那就变成了一个我们最常见的回归:
在这里,我们没有给予任何有关丈夫收入对女性劳动选择的作用机制的解释,而是把它看成了一个黑箱,用纯统计学的方法,靠某种外生冲击(或者试验),去识别 . 我们能在很少的假设下,得到比较robust的关于某种平均处理效应的结论(如用Angrist的方法,通过非参估计得到的LATE)。但是研究到这里就结束了,没有更多的东西了。
假设我们写出行为人的具体模型,以偏好和一个简单的partial equilibrium为primitive,我们就可以构造一个更复杂的行为结构,一个structural model。
然后我们通过解这个模型,可以得到
这是一个最简单的典型的discrete choice model的潜变量表达形式。
如果我们假设 在人群中的分布是EV1,那就能得到一个logit模型。
之后再通过MLE就可以进行估计了。但是要注意,如果想估计这个模型,就必须给 某一个分布的假设,EV1也好,正态分布也好。这就是你为更复杂的结构而付出的代价之一。
参考资料:
John Rust(1987) Optimal Replacement of GMC Bus Engines: An Empirical Model of Harold Zurcher, ECMA
Joseph Hotz and Robert Miller(1993) Conditional Choice Probabilities and the Estimation of Dynamic Models, REStud
Mark Colas(2017) Dynamic Responses to Immigration, JMP
Chao Fu's Slides
举一个简单的例子来澄清一下吧。
假设某个变量 由 , , 三个因素决定,并且它的真实决定式是 。Take log,我们得到 。
既然如此,structural form 总是更优的咯?
未必。
在现实中,其实我们常常写不出 的决定式来。即便能够做出预测力还算可以的结构模型,也要费时甚久。这时,reduced form 就是退而求其次的选择。
还记得我们上面提到过,在一些特殊情况下,reduced form 能够得出和 structural form 等价的结果吗?这就是以《基本无害的计量经济学》为代表的简约学派所追求的目标。
所以,很难直接比较 structural form 和 reduced form 到底谁好。
Structural form 直面问题的本质,它的结果看起来更加权威和规范,但也有可能你设定出来的 theoretical basis 根本就是错的。此外,结构方法非常 time-consuming。
Reduced form 一开始就放弃去打开黑箱,而是另辟蹊径,希望借助足够强的外生冲击,间接识别出关键系数来。这样,问题就变成你的 IV 到底够不够好。
我不认为经济学界存在 reduced form 泛滥的问题。认识事物总是要经历由浅入深的过程。如果打开黑箱的难度太大,reduced form 就是早期探索中更灵活的替代选择。一般来说, reduced form 做的足够多了,对这个问题的讨论足够充分了,下一步理论经济学家才会开始尝试去 generalize,从而转到 structural form 的路线上去。
正好前段时间上了微观计量大牛Arthur Lewbel的讲座课,另外我导师组内目前也存在题主提出的“费时费力”整理数据库的状况,所以针对题主的问题谈一些理解。
第一,Reduced Form不仅在经济史领域是潮流,在其他经济研究领域也是潮流。因为计量在本质上是要实现“识别”(Identification)问题。在研究中,我们对济规律的理解,可以抽象成一个具体的模型(Model),而识别问题也就是通过我们可以观测到的数据(Observation),准确的估计出模型的参数。Reduced Form的好处其他答案已经说了很多,我认为最关键的思想在于,在保证处理措施(Treatment)具有随机性(Randomness)的基础上,Reduced Form在建模环节对经济结构施加了最小程度的假设,因此不会像Structural Model一样容易出现系统性的模型错误,而Treatment的随机性保证了对照组和实验组的可比性,从而保证了结果的可信性。那么,Reduced Form就相当于是,在放弃了对经济结构性规律进行揭露的同时,把现实数据中所反映的真实规律识别出来。所以,Reduced Form背后其实是关于经济理论建模、模型检验等问题的一种思想范式,那么它的流行也可想而知。
第二,根据课上和Arthur Lewbel的交流,Reduced Form其实可以用来检验Structural Form是否合理。就像第一点中讲的,Reduced Form回归得到的参数是现实数据中所反映的真实规律(实验组与对照组在Treatment后的真实差异),而Structural Form则是对经济规律施加了更多的结构性(方程组)假设,比如,认为经济变量之间是通过一个方程组的形式相互联系着的。而Reduced Form则把Structural Form中的所有传导机制合并压缩到一起了。所以SF的结果和RF的结果其实是可以在一定程度上相互比较的,毕竟Treatment和Dependent(我们关心的变量)都在模型中。如果结构模型出现了模型的错误设置,也就是说我们错误的理解了经济的内在规律,那么很可能用SF估计出来的总效应和RF估计的总效应会截然不同(比如,一正一负)。总体来说,SF野心更大,对理论的“信心”更大,所以错误的风险也大,如果模型是正确的,那么SF的结果应该和RF在可比范围内相近,否则说明模型设置存在问题。
第三,数据库要区分基础性数据库和针对专门问题的数据库。基础性数据库是一种公共品,比如大规模微观调查数据、统计年鉴、县志等,通常由专业部门进行供应;针对专门问题的数据库一般是特定研究者根据要研究的问题,在基础型数据库基础上,通过匹配等方式,增加一定数量的变量,使得一个“新的研究问题”可以有充分的数据加以解决,完成“识别”任务。我个人认为,整理专门性数据库是任何经济学研究者的必经之路。首先,新问题一般要求对数据进行补充,这是自然而然的;其次,可以类比企业进行R&D投资,实际上这种“龙穴里有太多龙”的问题是普遍现象,先到先得,企业率先创新则可以保留秘密或申请专利,科研率先创新可以发表论文,论文是一种信号,告诉其他人这个问题已经有人做过了,一定程度上减轻了题主所批判的问题;最后,其实每个新的领域都只有一小撮人在做,相互之间的关系比题主想象的要更透明一些。说到底,经济学本身就是研究资源配置的学科,在这个巨大的由经济学家组成的community里,演化出一定的合作机制,来尽可能的降低由于创新不确定性和投入重复性造成的浪费,应该是意料之中的。