断点运行的参数_断点回归设计(RDD)及其在STATA软件的实现过程

1模型应用价值

断点回归设计(Regression Discontinuity Design,RDD)最早是由Thistlethwaite and Campbell(1960)提出,用来研究奖学金对学生未来成绩的影响。随着自然实验的兴起,RDD在经济学领域沉寂多年后被重新发现,用于检验因果关系。Hahn et al.(2001)对RDD策略的识别条件、估计方法、统计推断进行了理论上的证明,使得断点回归在经济学、政治学及 会学等领域广泛应用,成为目前政策效应评估的实证分析中最为热门的一种研究设计策略。

以奖学金对学生未来成绩的影响为例说明断点回归的应用价值。假设获取奖学金的分数线为60分,

   

④对断点回归的结果进行稳健性检验。

若断点回归方程包括其他协变量,需要检验协变量在临界值处是否存在跳跃。若协变量存在跳跃,那么被解释变量在临界值处的跳跃不仅仅是由处理变量带来的,也可能是发生跳跃的协变量导致的。

可以选择不同的带宽或不同的估计核,检验RDD估计结果是否稳健。

4 STATA软件实现及操作案例

断点回归的基本命令是rd,该命令的基本句式如下:

rd yd x, z0 (real) mbw (*) graph bdep oxline kernel(rectangle)

其中mbw(numlist) 用来指定最优带宽的倍数,默认值为mbw(50 100 200)

z0(real) 用来指定断点的位置,默认值为z0(0)

graph 根据每一带宽,画出局部线性回归图

bdep 根据画图来考察断点回归估计量对带宽的依赖性

oxline表示在此图的默认带宽上画出一条直线,以便识别

kernel(rectangle)表示使用均匀核(矩阵核),默认使用三角核

covar(varlist) 表示用来指定加入局部线性回归的协变量

x(varlist) 表示检验这些协变量在断点处是否存在跳跃(估计跳跃值和显著性)

①数据生成

本例中使用生成的数据用于RDD演示,读者可根据研究的问题自行输入数据。数据生成do文件可在文后所附百度U盘中下载。

②内生分组检验

输入命令

DCdensityx, breakpoint(0.5) generate(Xj Yj r0 fhat se_fhat)

x为分组变量名,0.5为临界点,命令中其余部分不需改动。DCdensity命令需读者搜索下载后添加到默认路径方可运行。本例运行结果如图1。图1中临界点左右置信区间基本重合,可以判断分组变量在临界点附近未发生跳跃,估计系数亦显示拒绝原假设(分组变量在临界点附近存在内生分组)。因此,本例数据适合使用RDD进行分析。若存在内生分组,则不应使用RDD对数据进行分析。

表1 断点回归类型检验结果

newT和T完全一致,判断应是精确断点回归。

④因果效应检验

先考虑没有协变量情形下RDD的估计结果,输入命令:

rdy1 x, gr bdep oxline z0(0.5)

得到不同带宽下临界点两侧回归图形(未在命令中设置带宽,则默认使用0.5倍、1倍和2倍带宽),如下图:

表2 LATE系数估计结果(无协变量)

结合不同带宽下临界点两侧回归图形和LATE估计系数,可以认为不考虑协变量时,处置变量T是被解释变量发生变化的原因,且对被解释变量有正向影响。例如,对奖学金是否影响学生未来成绩的案例,则可得出结论:不考虑协变量时,学生获得奖学金会促使未来学习成绩提高。

接着在RDD中加入协变量,输入命令:

rdy1 x, gr bdep covar(z) bdep ox z0(0.5)

可得到存在协变量时临界点两侧回归图形和LATE估计系数,

表3 LATE系数估计结果(有协变量)

结合不同带宽下临界点两侧回归图形和LATE估计系数,可以认为考虑协变量影响时,处置变量T是被解释变量发生变化的原因,且对被解释变量有正向影响。例如,对奖学金是否影响学生未来成绩的案例,则可得出结论:考虑协变量时,学生获得奖学金会促使未来学习成绩提高。

⑤稳健性检验

上述命令中,我们并未对带宽进行设置,采用了rd命令的默认带宽。若读者希望对最优带宽做更细致的选择,可设置更多带宽。以没有协变量的情形为例,命令如下:

rdy1 x, bdep oxline z0(0.5) mbw(25(5) 300)

表4 矩形核RDD估计结果

当我们在RDD中加入协变量时,要注意检验协变量在临界点附近是否发生跳跃。若协变量发生跳跃,我们就不能由RDD得出被解释变量变化的原因完全是处理效应的结果,这时,可以考虑剔除发生跳跃的协变量(剔除协变量也可能产生内生性问题)。检验协变量是否发生跳跃的命令如下:

rdy1 x,  x(z) z0(0.5)

f5f99a104039ee73666333e0da107a37.png

表5 协变量检验结果

不同带宽下协变量z的P值(0.635、0.834、0.486)均不显著,认为协变量未发生跳跃。此时,带有协变量z的RDD估计结果是有效的。

链接:https://pan.baidu.com/s/1ff3RNYd8wQqog8EfCSNTdg

提取码:vz06

参考文献:

曹静, 王鑫,钟笑寒(2014): “限行政策是否改善了北京市的空气质量 经济学(季刊), 13, 1091-1126.

何文剑, 徐静文,张红霄(2016): “森林采伐限额管理制度能否起到保护森林资源的作用,” 中国人口·资源与环境, 26, 128-136.

贾男 (2020): “老龄化背景下退休对城镇家庭金融资产选择的影响——基于模糊断点回归设计,”统计研究, 37,46-58.

晋晶, 王宇澄,郑新业(2020): “集中供暖要跨过淮河吗—基于中国家庭能源消费数据的估计,”经济学(季刊), 19,685-708.

任明丽, 孙琦 (2020): “退休与家庭旅游消费:经济状况与闲暇时间的调节作用,” 南开管理评论, 23,4-17.

余静文,  王春超 (2011): “新“拟随机实验”方法的兴起——断点回归及其在经济学中的应用,”经济学动态,125-131.

邹红,喻开志 (2015): “退休与城镇家庭消费:基于断点回归设计的经验证据,”经济研究, 50,124-139.

Hahn Todd and van der Klaauw (2001):”Identification and estimation of treatment effects with a regressiondiscontinuity design”, Econometrica 69(1): 201-209.

Thomas Cook (2008): “”Waiting forLife to Arriv”: A history of the regression-discontinuity design inPsychology, Statistics and Economics”, Journal of Econometrics 142:636-645.

Thistlethwaite,D.L. and Campbell, D.T., 1960. Regression-discontinuity analysis: analternative to the ex-post facto experiment. Journal of Educational Psychology51, 309–317

往期计量经济模型:

半参数动态面板空间滞后模型

截面数据空间杜宾模型

面板数据空间向量自回归模型

全局向量自回归模型

截面数据半参数回归模型

面板数据门限回归模型及扩展

相关资源:晶体学查看软件_晶体结构查询-软件测试其他资源-CSDN文库

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年11月15日
下一篇 2020年11月15日

相关推荐