这个问题很大,试着从IO角度来答一发,顺便复习下两年前学的东西。IO可以说引领了Structural的发展,比较有代表性。以下的例子基于经典的Bresnahan & Reiss在90年代初的几篇paper,包括90年RES和91年JPE等。
Entry问题简单来说是这样的:假设你是某种产品/服务的生产者,比如理发师。与你的无数个潜在的理发师同行一样,你们都面对着许多个市场(比如全国的各个社区)。你选择进入哪个市场的时候,要考虑市场需求,包括市场大小、弹性。另一方面,成本也很重要,包括边际成本如电费水费,和固定成本比如租金等。这些用来构造市场均衡的基本变量是如何决定的?这就是所谓模型的primitives。此外,注意到你的决策和你同行的决策是互相影响的,因此决策时需要考虑也包括有多少同行以及同行对竞争是如何反应的。这个competitive conduct也可以被model为一个primitive。
我们加一些假设来找均衡。假设如下:
可以解出来均衡是这样的:社区人口直接决定了这个社区的理发店数量。打个比方,如果一个垄断的理发师每个月需要给1000人理发才能保证break-even(未来赚的全部利润在discount后能够支付固定成本),又假设平均每人每月理发一次,那么需要一个1000人的社区才能支持一家理发店开张。要想支持两家理发店,则至少需要2000人的社区。
看到这里,我们已经有了一个可以用来test的prediction:社区的理发店数量与人口有非常强的正相关。当然,在实际的数据中,还有无数的问题要解决。第一个问题就是得找到相对隔离的社区。然后是各个变量的measurement问题。比如人口是怎么度量的?只用现在的人口显然不行,需要考虑到对未来人口变化的预期。只考虑本社区的人口也不一定合理,说不定有旁边社区的人愿意走几步过来理发等等。又如收入不一样的地区很可能对理发服务的需求也不一样,需要控制。对因变量的测量也是个问题,因为实际上理发店很可能大小不一,大到几十上百位“老师”、“总监”,小到一位师傅一把剪刀支个摊。reduced-form model要做的就是在控制了其他所有因素的情况下,直接验证这个prediction。一个理想的实验是找到在各个方面都近似,唯有人口数量不一样的社区,看看理发店的数目,做一个简单的OLS。更复杂的情况下,可以考虑找人口数的IV,或者利用比如库区移民之类的外生冲击来做DiD,再或者看看有没有什么类似的政策导致社区人口数量的不连续变化从而做RD之类。
下一步我们还可以考虑理发师之间的竞争。前一段提到,如果需要1000人才能支持一个理发店,那么要想支持两家理发店,则至少需要2000人的社区。这个“至少”是很重要的,因为这是在两家理发店没有竞争,互相合谋定价时才能实现。如果两家店有竞争,那么势必导致价格和利润的下降,因而需要比2000人更大的市场才能支持这两家店的共存。通过比较数据中一家vs两家理发店的市场大小,我们的数据又能帮助我们理解理发师之间的竞争行为。假如你认为理发师之间确有竞争,那就有了另一个prediction:一个社区的人口数需要在(只有一家理发店的社区人口数)两倍以上时,才能支持两家理发店共存。同样,对这个prediction的验证也是可以通过reduced-form来完成。
(顺便提一下,另外一种可能性是两家理发店差异化,从而弱化了竞争,有可能反而不需要两倍人口。在卖车的例子中,BR1990 的发现就是Ford与GM dealer之间差异化的效应就超过了竞争的效应。)
那么Structuralist会怎么做呢?structural的想法是这样的,既然我用primitives可以解出均衡,并且用数据来验证均衡解,那为何不用数据来估计我的primitives呢?
具体来说,我们最感兴趣的参数有这几个。其一,是成本曲线(固定、边际成本)。其二,是需求曲线。其三,是competitive conduct,或者说竞争的激烈程度。下一步,则是看数据能够identify其中哪些参数。
(插一句无关话题,现在identification几乎成了exclusive restriction的同义词,其本意是模型参数能否由数据唯一决定。如果几套不同的参数能generate一样的数据,那这个模型就不是identified)
假设我们手头有社区人口(及几个其他可能影响市场大小的变量,如人口变化率)、收入、工资等可能同时影响需求与可变成本的变量、几个可能只影响固定成本的变量(比如租金),最后是模型的outcome variable即理发店数目。那么我们的目的就是用可观测的这些数据与模型的关系作为primitives,然后用均衡解来给出outcome,最后调整model的参数使得我们模型的解能够fit数据中理发店的数量。具体到这个理发店的entry model,我们最感兴趣的是成本曲线和competitive conduct。因此,我们对需求可以暂时不用model得特别仔细,在BR1990 RES paper中采取的办法是省去从需求和可变成本到均衡价格这一步,直接用人均利润作为潜在变量之一(它由收入等影响需求弹性和可变成本的变量决定,同时,根据市场中理发店是否垄断,还受到可能的竞争的影响,这些关系构成了模型的一部分primitives)。用市场大小作为潜在变量之二(由现有人口、周边人口、人口变化率决定,这是模型的另一部分primitives)。最后,加上固定成本作为第三个潜在变量(租金等如何决定它将成为模型最后一部分primitives)。最后我们需要一些error term,根据不同的model可以放在不同的地方。这里暂时不对它过多的处理,只是需要它来保证likelihood在任何参数都不为零以便于MLE的计算。根据每一套参数,我们都可以计算出这三个潜在变量,利用均衡条件可以解出理发店数目。用MLE等方法,我们可以不断迭代优化求解一套拟合最佳的参数,并且根据MLE的asymptotic性质得到standard error。
可以看出,这套思路和reduced-form是有所相通,但又很不相同的。具体到这个例子中,它在需求这一步其实已经部分的reduced-form了,因为它model的人均利润是个均衡下的结果,而非真正的效用、成本这样的primitive。不难看出,如果我们有更好的数据(如价格、销量等),那么更进一步的model是可能的(这也是structural IO / quantitative marketing最重要的工作之一demand estimation的内容)。但是整体看来,它和之前直接test model prediction的思路差别是显而易见的。
那么比较这同一个问题、同一数据的两种做法,各有何优劣呢?简单说几句。
以上只是structural model非常早期的一个例子,权当抛砖引玉。最新的进展在模型和计算上都可谓日新月异,我也是刚刚接触不多,就不献丑了。
匆匆写完,望各位方家指正。