2019年11月21日,清华大学公共管理学院刘生龙副教授应经济学院邀请,于本科生教学楼221教室为同学们带来了小院经济圆桌系列讲座第三讲:从OLS到IV估计:为什么要解决内生性?此次讲座由经济学院副院长李石强副教授主持。
刘生龙教授简介
清华大学公共管理学院副教授,清华大学国情研究院副研究员。2008年获得中国社会科学院研究生院经济学博士学位。曾工作于中国社会科学院数量经济与技术经济研究所,加拿大多伦多大学的访问学者。在《经济研究》、《人口研究》、《中国工业经济》Econometrics Journal、Economic Modeling等国内外期刊发表论文四十余篇,其中有十余篇论文被人大复印资料全文转载。
Part1 计量回归理论回顾
刘教授先用一个简单的身高体重关系模型图向同学们介绍回归的基本概念:回归是利用数据统计原理,对大量统计数据进行数学处理,并确定因变量和某些自变量的相关关系,建立一个相关性较好的回归方程,如:
Y=xiβ+εi
随后,刘教授对回归方程的原理进行了简单分析,并列举出了常见回归方程所需满足的基本假设条件,刘教授指出假设条件并不是在所有情况下都成立,借此进入主题——在基本假设不成立时由于内生变量产生回归误差以及如何解决内生性问题。刘教授为同学们举出了一些常见的内生性来源:遗漏变量、测量误差、反向因果(被解释变量与解释变量互为因果关系)、逆向选择(一方通过多于另一方的信息优势使得自己获利)等。同时,刘教授表明,有些时候内生性对回归运算影响不大,但更多时候内生性会导致明显的误差,使方程拟合不准确。为了解决这个问题,刘教授向同学们介绍了一个新的概念——IV(工具变量)。工具变量是是一个不属于原方程并且与内生解释变量相关的变量。在线性模型中,一个有效的工具变量应该满足以下两点:
▪此变量和内生解释变量(自变量)存在相关性;
▪此变量和误差项不相关,也就是说工具变量严格外生。
工具变量与内生性变量个数存在下面几个对应关系:在工具变量少于内生性变量时,称之为不可识别;在工具变量等于内生性变量时,称之为恰好识别;在工具变量多余内生性变量时,称之为过度识别。当恰好识别的时候,我们可以利用工具变量得到相关性更好的回归方程。
刘教授指出,大学生常见的计量经济模型,只有一个内生变量而有多个可用的工具变量的简化式模型居多,这种简化式模型属于过度识别。在过度识别中,无法得到工具变量估计量,若抛弃多余的工具变量则会浪费有用的信息,此时可以通过2SLS对多余的工具变量进行线性组合。
接着,刘教授举出了一个工具变量实际应用的例子:当研究高速公路建设对县域经济发展的因果效应时,遇到的的内生性问题是交通基础设施建设和经济发展存在反向因果的关系,此时可以引入地理信息(如地域平均坡度)作为工具变量。原因是平均坡度与高速公路建设负相关且显著;且平均坡度不受经济发展影响,即外生于经济发展。
随后,刘教授向同学们列举了一些其它的内生变量处理方法:面板计量模型(用于处理多维度数据)、DID、MM(将对照组和控制组匹配,使其拥有相同性质从而找出内生来源)、RDD(精确度高但使用难度大)、RTC(成本过高一般不使用)。
在第一部分的最后,同学们提出寻找IV方法的疑问,刘教授为同学们提供了两个方便实用的方法:一是借鉴前人的方法,将前人设计出的工具变量待解决问题上;二是同学们还要熟悉一些典型的工具变量,如政策、天灾、大工程(三峡、供暖)。刘教授提醒同学们,一个方法只能应用于某一个经济学问题,没有解决每个问题的通解,遇事还需具体情况具体分析。
Part2 论文分析
接下来的时间里,刘教授用一篇他新近完成的论文“The Air Pollution and Foreign Direct Investment”为同学们具体讲述如何利用IV进行内生变量处理和论文写作方法。
一篇优秀、创新点突出的文章的首要条件是拥有一个新颖的主题,这来自于专业知识的深厚积累和对日常生活的敏锐观察。刘教授观察到中国的外资企业普遍分布在东部沿海城市,同时联想到东部沿海城市的另一个特点——污染。因此刘教授决定探究FDI与污染指数的关系。过去经济研究者们更多将注意力放在FDI与经济增长的关系上,而这篇文章转而研究FDI与环境的关系。
刘教授指出,在这个研究问题中,影响最大的内生变量是地方官员对发展策略的调控会显著影响到计量结果。因此,刘教授选择了2008年的金融海啸作为工具变量。一方面金融海啸与FDI有极强的关联性,另一方面金融海啸与官员发展策略不存在任何联系,可以看出,金融海啸是这个问题中合适的工具变量。
接着,刘教授向同学们介绍了一些关于论文格式、数据收集、误差分析的具体方法;最后刘教授还指出了这篇论文的不足之处是没有关注实际政策。
在提问环节中,同学们对寻找数据的渠道进行提问。刘教授向同学们推荐了一些经济学常用数据获取方式。同时,刘教授表明现在这个时代数据获得已经不是一件困难的事情,研究者更需要的能力是数据处理。
讲座最后,李石强副教授对整个讲座内容进行了简单的总结,并表示有机会要邀请专家来小院经济圆桌讲授有关数据处理方法,尤其是应用数据清理的方法,以提升经院学生们的数据处理能力。
可以看到,刘教授这次所讲的一些论文写作方法,如论文观点的产生方法、创新点的重要性以及严谨的写作格式,与两周前倪红福教授在小院经济圆桌所讲的论文写作方法不谋而合,通过这次对具体论文的分析,同学们更加清晰地了解了工具变量在经济学研究中的实际应用,同时对论文写作有了更加深入的认识。
附录
文中出现计量经济学名词中文释义
IV: instrumental variables 工具变量法
OLS: optical least squares 普通最小二乘法
2SLS: 2 stage least square 二阶段最小二乘法
MM: moment method 矩估计
RDD: Regression Discontinuity Design 断点回归设计
RCT: randomized controlled trial 随机对照试验
FDI: Foreign Direct Investment 国际直接投资