在中国人的传统观念中,世间万物,有因才有果,有果必有因。可是,人类经济活动如此复杂,我们真的有能力把握其中的因果关系吗?

2021年诺贝尔经济学奖颁给了“用因果推断的方法在经济学领域中的实证研究”:美国加州大学伯克利分校经济学教授戴维·卡德(David Card)因其对劳动经济学的实证贡献获得了一半的奖项,美国麻省理工学院福特经济学教授乔舒亚·安格里斯特(Joshua D. Angrist)和美国斯坦福大学经济学教授吉多·因本斯(Guido W. Imbens)因他们对于因果关系分析的方法论的贡献而分享了另外一半的奖项。卡德的研究领域主要在劳动经济学,但他用的方法主要是因果推断(双重差分);而安格里斯特和因本斯的获奖理由主要是因果推断。

因果关系——看上去如此天经地义的问题值得一个诺贝尔奖?究竟什么是计量经济学中的因果推断?此次获得诺奖的三位经济学家在因果推断领域作出了哪些贡献?又对现实社会有着怎样的意义?新闻对浙江工商大学经济学教授李井奎进行了专访。李井奎

李井奎

李井奎是安格里斯特的著作《基本无害的计量经济学——实证研究者指南》的译者之一,他还自己创作了经济学科普著作、因果推断研究入门读物《大侦探经济学——现代经济学中因果推断革命》。

李井奎认为,近30年来,伴随着数据可得性的改善和计量经济学的发展,现代经济学爆发了一场因果推断革命。这场因果推断革命,使得经济学家的工作变得越来越有趣,经济学家也越来越像侦探——从纷繁复杂的世事以及各色各样的数据中,使用因果推断的计量工具,探寻一个又一个积年“悬案”背后的真相,解开了一个又一个历史、社会和经济的谜团。《大侦探经济学——现代经济学中因果推断革命》

《大侦探经济学——现代经济学中因果推断革命》

揭开因果关系的神秘面纱

新闻:你是从什么时候开始了解经济学中的因果推断问题的?

李井奎:我第一次接触“因果推断”,就是因为安格里斯特(Angrist)与皮什克合著的那本《基本无害的计量经济学》(Mostly Harmless Econometrics: An Empiricist’s Companion)。2009年,我那时还在读博士,这本书的第一译者郎金焕博士在网上看到了这本书的电子版初稿,我们当时读了之后很是感到震撼。尤其是这本书前两章讨论的“反事实结果”(counterfactual outcome)框架,我们理解起来很感吃力。那时候我已经是博士三年级了,算得上是一个很好学的人。这样一本计量经济学的教科书看不懂,反而激起了我的求知欲。

新闻:当时最让你觉得难以理解的地方在哪里?

李井奎:过去我们对因果关系的理解,总是认为有因有果,无论执果求因有多么困难,总是以为果与因都是清楚明白地可以被观察到的。我们想不到的是,因果关系其实并不能这样定义,要真正定义因果关系,必需借助于“反事实结果”,而之所以称为“反事实”指的是没有在事实上发生过。过去,我们考察因果关系,是借助于理论模型,“因”是外部环境参数,“果”则是模型的结论,也就是说,如果外部参数发生变化,那么模型结论就发生变化。“反事实结果”又称为“潜在结果”,它不是真实发生的。

借用19世纪英国哲学家约翰·斯图亚特·穆勒(John Stuart Mill)在逻辑学名著《逻辑体系》中曾经探讨的对因果关系说法就是:如果A吃了某道菜之后死了,那么,只有当A同时又没有吃这道菜之后还活着,这两种状态都为我们所观察到时,我们才能说,这道菜是A死去的原因。也就是说,只有当我们观察到A吃了某道菜死了,A没有吃这道菜时的生死情况是反事实结果,或者说潜在结果。

这就跟我们过去对因果关系的理论思考完全不一致。在认识因果关系上,最开始人们是很难接受这样的观念的。20世纪的英国哲学家罗素甚至将因果关系视为一种迷信。而同一时期得到发展的统计学,更是认为“相关不是因果”,恪守着因果关系是无法通过统计学加以研究的戒条。

新闻:你刚才提到了“反事实结果”框架是解决因果推断难题的关键。你能给我们详细介绍“反事实结果”究竟是怎么回事吗?

李井奎:这一框架可以追溯到统计学家鲁宾(Donald B. Rubin)提出的基于处理效应(Treatment Effect)的因果推断理论。关于因果关系的思想在上个世纪二、三十年代就已经开始有了一些突破,但统计学界长时间以来不接受因果推断,他们认为因果推断不可能被研究。直到上个世纪70年代哈佛大学的统计学教授鲁宾提出基于“处理效应”的因果推断理论,也就是后来在经济学界广泛应用的“反事实结果”框架,才逐渐为人们所接受。在我的《大侦探经济学》一书的序章里,对“反事实框架”有详细的介绍。差不多与鲁宾教授同时,人工智能领域的权威专家朱迪亚·珀尔提出了因果关系的演算法——因果图(casual diagrams)框架。(编者注:朱迪亚·珀尓(Judea Pearl),现加州大学洛杉矶分校计算机科学教授,“贝叶斯网络”之父,2011年因创立因果推理演算法获得图灵奖。

新闻:Angrist和Imbens今年会获奖,正是因为将经济学中常用的工具变量(IV)框架和统计学中常用于因果推理的“反事实结果”(counterfactual outcome)框架相结合,提出了“局部平均干预效应”。他们的这一发现对经济学界的贡献是什么?

李井奎:鲁宾的因果推断框架提出之后,引起了很多学科的重视,经济学显然是受到其影响最深的领域之一。但这个思想一开始并没有进入到经济学界,直到上个世纪90年代才开始有学者使用这个方法。其中David Card教授、Angrist教授就是其中的先锋,值得特别提到的是已经去世的艾伦·克鲁格教授,他在这个领域也非常杰出。

可以说,经济学中的因果推断理论在过去几十年受劳动经济学的学者影响最大,此次获奖的David Card和Angrist是其中的杰出代表。因为在劳动经济学里有很多需要精确性进行解答的问题。例如,上大学到底能不能带来收入的增加?数据表明,上了大学的人肯定比没上大学的人毕业若干年之后平均收入更高。但上了大学的这部分群体所取得的收益,很可能并不仅是源于大学教育本身带来的收益,还混杂了个人能力、家庭背景、社会关系等等其他因素。这些因素使得评估的结果不准确,这就不能把使用回归估计出来的上大学与否这个变量的系数看成是因果效应了。

计量经济学将客观经济活动中的变量分为相关关系(随机关系)和因果关系。相关关系是指两个以上的变量的样本观测值序列之间表现出来的随机数学关系。因果关系是指两个或两个以上变量在行为机制上的依赖性,作为结果的变量是由作为原因的变量所决定的,原因变量的变化引起结果变量的变化。具有因果关系的变量之间一定具有统计上的相关关系,而具有相关关系的变量之间并不一定具有因果关系。

经济学中因果推断有五种方法:随机试验方法、回归方法(倾向得分匹配方法)、双重差分方法、断点回归方法以及工具变量(IV)方法。因果关系研究是可以在随机控制实验中得到完全展示的,但是随机控制实验是人为地设计实验,可是很多的社会生活当中的问题都不可能使用随机控制实验来研究。我们一般只能拿到观测性的数据,这种数据的产生不是根据研究者的意愿搜集得到的,比如我们的GDP数据、家庭住户调查数据等等都是观测性数据。

在“反事实结果”框架中,可将“干预”之后的实际状态与没有进行“干预”的“反事实”状态之间的区别定义为这项“干预”的因果效应。从事因果推断的经济学家给出的方案是,如果从观测性数据中寻找到一种自然实验的情境,在控制一些因素后,让是否接受“干预”完全随机,就可以通过比较“干预组”的平均表现和“对照组”的平均表现来获得因果效应。

通过这个方法,再去观察上大学的那个群体和没有上大学的群体,对比他们的平均结果,就可以得出因果关系,又称为平均干预效应。

经济学的经验研究转向

新闻:诺贝尔经济学奖近三年里有两次都颁给了实证研究,这对中国有什么启示?

李井奎:诺奖基本上是奖励理论和方法,其实这两次都是奖给方法的,包括2019年的奖项也是表彰他们在经济学方法上的贡献。这说明经济学正从传统的注重理论与数理模型转到注重实证和经验研究。当然这并不是说理论和模型不再重要,事实上它们依然非常重要,只是说经验研究的比重增加了。这次David Card教授获奖就非常明显,他是完全做经验研究的。

传统的经济学重模型、重理论,比如,他们认为像最低工资法就是会造成失业,这个结论有理论基础,几乎认为是不可怀疑的信条,所以当card教授得到相反的结论时就很受质疑。直到现在,理论派和经验派之间的斗争仍然很激烈。David Card关于最低工资的文章是双重差分这种因果推断方法的应用典范,但后来有批评指出他们在数据收集方面存在一些问题,David Card自己后来也做了相应的修正。可是自然实验的问题正在于,这些数据只能发生一次,不可能再收集。一旦发生过就不能重复,只能等到下一次再有这样的机会。

经济学研究中的经验派与理论派经常展开论战。David Card和Angrist的许多文章使用的是所谓的简约式方法(reduced-formal approach),但计量经济学中还发展出了一派叫“结构计量”方法的,先有模型,然后用数据去拟合模型当中的参数,再来做因果推断,这个推断就有了理论模型作为基础。这次获奖的Imbens实际上也做过许多结构计量的研究,他与鲁宾有很多合作,二人还合作写过书。

总体而言,这次诺奖表彰的都是他们30年前的成果——通过自然实验来解答社会的核心问题,如最低工资、教育如何影响收入等。不过,西方的学者都不会固守在一个“阵地”上,这几位学者也都还在不断地做新的东西。

新闻:为什么诺奖今天赋予了自然实验如此大的时代意义?

李井奎:在当今的时代,数据的可得性增强了很多,此外还有计算机处理数据能力的大大提高,这在上个世纪80年代是不可以想象的。但在经济思想上,这些研究未必就更深刻。

一场认知的革命

新闻:你将因果推断研究称为经济学领域的一场革命,为什么这么说?

李井奎:这是一场认知上的革命。过去我们以为可能回答不了一些问题的因果关系,但这几十年的进展告诉我们,还是有一些方法可以去推动对这些问题的解答的。从这个意义上讲,这是认知层面的一个进步。此外,因果识别方法如今已经基本上进入经济学研究的主流,也进入到了教科书中,这增加和扩充了我们的知识,在这个层面上,当然是意义很重大的。

我认为所有的学科都是在寻找真相,每一个学科都为真相建立了一套逻辑,经济学也可以使用数据和更精密的方法,提高经济逻辑接近真相的概率。我写《大侦探经济学》这本书,尽管是以因果推断为主线、系统地介绍了因果推断的方法,但我同时也通过10个主题大量地还原了历史、制度和社会环境的细节,从这些方面去讨论重要的社会问题。我希望通过经济学研究的因果推断去揭示真相之后,能够提供一种如何看待真相并对真相本身进行反思的路径,对宏观的社会经济问题提供更纵深的理解和更精确的回答,并最终提高我们对经济逻辑的信心。

新闻:因此在这个层面上,你眼中的经济学的因果推断很像侦探在做推理?

李井奎:取这个书名的直接原因是我女儿很喜欢一些侦探故事。我去年在哈佛访学期间着手写这本书,我记得是去年的5月6号,哈佛经济系的梅里莎·戴尔教授获得了去年的约翰·贝茨·克拉克奖,我偶然看到她的关于墨西哥毒品战争的文章。读这篇文章时,突然想到这真像一个探案的故事——经济学家,尤其是实证学者,他们的工作就像是在探案,搜集各种各样的证据,然后用精细的方法告诉你真相,并且让我们相信这就是真相。

就像福尔摩斯作为侦探需要有很多知识储备一样,一个优秀的做经验研究的经济学家也要有相关的知识储备:首先要懂因果推断的基本方法,其次需要“上天入地”寻找数据,第三要去思考其中内在的逻辑和作用机理,排除掉其他的逻辑。

我去年在哈佛大学上计量经济学课,有一次的课后阅读作业是让我们阅读David Card教授为哈佛大学打官司所做的证词。哈佛大学被亚裔学生控告存在入学录取歧视,哈佛就请了David Card来做调查。那份证词大概有七八百页,但是他最后的结论是:既没有证据证明存在歧视,现有证据也不能证明不存在歧视。

这个例子就说明,因果关系研究并不是绝对的,并不是任何问题都可以使用到因果关系,因为真正的自然实验并不是那么容易寻找到。

新闻:有评论认为,因为中国经常通过试点的方式来进行经济改革,我们做自然实验的环境很优越。

李井奎:这一点未必。美国有50个州,某些州执行了某项政策或新的法案,有些则没有,那么就可以有很多的比较。我们中国当然也会发生大量的自然实验,但是政策试点的问题在于,有一些地区之所以被选中做试点,可能是被有意识的选择的,这就会使它们与那些没有被做试点的地区相比存在特殊性,从而可能有一些遗漏的变量。理想的自然实验是通过掷骰子来选择哪个地区该试点。

新闻:中国经济学界对因果推断的研究处于什么样的阶段?

李井奎:我们进展非常快,尤其是2013年-2014年之后。因为大量的数据是在那个时候才有的。我们在2009年刚接触《基本无害的经济学》这本书时,还做不了这方面的研究,因为拿不到数据。后来北大国家发展研究院、人大和复旦大学等都建设了自己的数据库,我们中国的学者当前在这个领域做得非常好,丝毫不逊色于英美。