2021年7月19日上午9:00-12:00,中国社会科学院经济研究所的付明卫老师进行了第四期香樟青苗计划的第一场讲座——断点回归设计的潜规则与真功夫。香樟经济学圈学者、第四期香樟青苗计划入选学员参加了本次讲座。
付明卫,中国社会科学院经济研究所副研究员,北京大学经济学博士,美国宾州州立大学访问学者,研究领域为医疗卫生和乡村治理,在《经济研究》、《世界经济》和《金融研究》等刊物发表多篇论文,主持一项国家社科基金,参与多项国务院办公厅、财政部、人社部和卫计委等主办的医改课题,医改调研足迹到达北京、福建、昆明和洛阳等20多个城市。
本次讲座的思维导图如下图所示:
在讲座主体内容展开前,付老师首先以“上本科大学对工资影响”的例子引出了断点回归(RD)的思想,即:RD是在断点附近做的局部随机试验。如果在这一案例中使用普通最小二乘法,则会遗漏了能力变量,因此需要构造一个随机可控实验,而RD局部随机试验的性质决定了断点附近的个体无明显差异,所以可以将RD方法看作随机可控实验。正是这种随机可控实验的性质,使得RD与OLS,IV,DID并称为实证研究的四大法宝。虽然RD是四种方法中发展最晚的,但由于RD是四种方法中性质最优的因果推断方法,在近年国内外的实证研究中运用广泛。然而,讲授RD的教材少之又少,且内容过于简单;不同论文使用RD的招式,差别也十分显著。例如:部分文献使用四次多项式进行拟合,而部分文献使用二次多项式进行拟合;部分文献会在拟合曲线中画出95%的置信区间,部分尚未涉及。因此,进行断点回归亟需一定的方法范式,以进行规范的实证研究,这也就是付老师讲座主题“潜规则与真功夫”的含义与初衷。
介绍完讲座的背景后,付老师接着就断点回归设计的缘起与理论研究进展,进一步说明RD方法运用的广泛性。RD首先在奖学金对学习成绩影响的研究中首次引入,但由于理论支撑的缺乏和高质量数据获取的困难,RD方法直到20世纪90年代晚期才得到较广泛的应用。自2010年以来,RD理论在多配置变量RD (RD designs with assignment variables),分位数RD,拐点回归设计(regression kink designs),多断点RD (RD designs with multiple cutoffs),远离断点处的处理效应的识别方法(methods for extrapolation away from the cutoff),离散型配置变量RD等方面获得了长足的发展。断点回归之所以在30多年的时间内发展如此迅速,正是因为其运用的广泛性:从国外的研究文献来看,RD运用于对考试成绩,得票份额,法定饮酒年龄(以估计饮酒对死亡率的影响)等研究中;从国内的研究文献来看,RD也在退休年龄(以估计医疗保险对健康的影响),淮河分界线(以估计供暖对预期受命的影响),省界线(以估计行政级别提高对经济发展程度的影响)等社会政策的评估。可以看出,断点回归作为识别因果效应的“最干净”的方法,获得了广泛应用。
接着,付老师对RD的基本原理进行了详细地阐述。RD的基本原理包括以下四点:
1.RD模型的要素与前提假设
RD模型中须包含结果变量(Y),处理变量(D),前定变量(W),配置变量(X)以及扰动项。其中,配置变量不能被完全操控是RD须满足的前提假设。
2.模型设定
根据断点左右拟合曲线的不同,断点回归一般化的模型设定可基本分为以下四种情形:①直线在断点两侧的斜率相同;②直线在断点两侧的斜率不同;③断点两侧是相同的抛物线;④断点两侧是不同的抛物线——不同的情形对应不同的模型设定。
3.RD模型的分类
根据干预的分配是否完全由配置变量决定,RD可分为清晰RD (sharp RD)与模糊RD(fuzzy RD)。清晰RD的典例为研究禁毒政策对毒品暴力犯罪的影响的文献(Dell,2015);模糊RD的典例为研究退休对医药费用的影响的文献(付明卫等,2020)
4.RD的估计方法
RD的估计方法可分为参数估计与非参数估计。其中,参数估计的核心为确定配置变量的次数K;非参数估计有两大要点:一是选择合适的核密度函数,二是选择最优带宽(选择带宽时需要注意权衡取舍问题:偏误与代表性之间的抉择)。
随后,付老师针对RD的规范步骤进行了详细的讲解,并根据Lee and Lemieux提出的规范步骤,对比国内外RD实际进行参考。RD的规范步骤为:利用配置变量检验RD的适用性;利用前定变量检验RD的适用性;画结果变量的图;参数估计以及非参数估计。然而,根据付老师的文献整理,国内外的论文并未完全遵循Lee and Lemieux提出的五条规范化原则,均对规范有所背离。同时,国内应用RD也存在着忽视适用性检验,描述统计图的运用不规范,使用非参数估计细节为做说明等问题。
最后,付老师在RD的实战层面给予了同学们充分的建议。一是希望同学们模仿经典RD论文,对RD的方法有完整的把握;二是结合付老师自己团队的工作论文How Does Physician Respond to Change in Healthcare Prices?一文就RD-DID方法进行一定说明,并将RD画图的有关代码进行展示,便于同学们参考。
同学们在会后与付老师进行了热烈的讨论,付老师对大家的发言进行了耐心的回答。王天乐(兰州大学)就时间序列断点的特殊性进行了提问,对时间序列断点与传统断点之间的区别产生了一些疑惑。付老师表明,时间序列断点存在一些时间序列的特性,应该比传统断点多做一些稳健性检验,可能需要将RD与DID相结合以进行检验;桂平舒(中国社会科学院大学)就带宽选择的权衡取舍问题进行提问;付老师认为,偏误(bias)是计量经济学中无偏性的含义,大带宽能够使估计结果变动减小,从而更具有代表性。蒋晓晖(香港科技大学)对阶数K值的确定进行提问,付老师进一步解释,传统做法是尝试到驱动变量的5次方或6次方,根据AIC取值最小的进行选择;但也有部分学者认为只需要试到2次方即可,本身不存在断点的情况下,全域多项式方法得到错误结果的概率高于合理水平,而局部一次(或二次)多项式方法得到错误的概率和合理水平差不多。陈卓宇(中国人民大学)对参数估计与非参数估计的确定标准进行提问,付老师认为,方法的选择完全取决于个人研究者的喜好,不同期刊的偏好,以及结果变量图的性质,并没有统一的确定标准。赵方潇(华中农业大学)对时间断点的周度数据与月度数据进行了提问,付老师表明,数据频度越高越好,做时间断点最好使用日度数据,并以王岳龙的论文加以阐释。陈波(深圳大学)对IV与RD之间的区别提出疑问,付老师表示,模糊断点(或称为两阶段最小二乘法)本身就是IV,模糊断点的机制与IV是一致的。最后,韦芷曦(中国政法大学)对模仿RD论文写作方法的数据来源提出困惑,付老师建议模仿公开数据的RD论文,这样更具有可操作性。付老师对同学们问题的耐心解答鞭辟入里,发人深省。大家表示受益匪浅。讲座在同学们的感谢中结束。
本期小编:王天乐