断点运行的参数_断点回归设计(RDD)及其在STATA软件的实现过程

计量经济学公众号发布《面板数据门限回归模型及扩展》的文章后，关注公众号的朋友提出门限模型和断点回归有什么区别限模型解决的问题是，门限变量达到某一数值后，其对应的解释变量和被解释变量的因果关系发生了较彻底的改变，如对应解释变量的系数由负数变为正数，或数值上发生很大变化。断点回归本质上可以看作“弱化版”的随机实验，解决的问题是某个事件(如政策实施，以处理变量表示)的发生对一组性质“差不多”的个体产生何种影响。断点回归的具体内容如下：

1模型应用价值

断点回归设计(Regression Discontinuity Design,RDD)最早是由Thistlethwaite and Campbell(1960)提出，用来研究奖学金对学生未来成绩的影响。随着自然实验的兴起，RDD在经济学领域沉寂多年后被重新发现，用于检验因果关系。Hahn et al.(2001)对RDD策略的识别条件、估计方法、统计推断进行了理论上的证明，使得断点回归在经济学、政治学及社会学等领域广泛应用，成为目前政策效应评估的实证分析中最为热门的一种研究设计策略。

以奖学金对学生未来成绩的影响为例说明断点回归的应用价值。假设获取奖学金的分数线为60分，

分别是取得奖学金和未取得奖学金学生的未来成绩。最直观的想法是直接计算

的值。RDD解决这个问题的思路是，假定考试成绩为57、58、59、60、61、62的学生的知识基础、学习能力、努力程度、智力水平、应试能力等各个方面决定考试成绩的因素都没有显著差异。我们将考试成绩为60、61、62分的样本划分为处理组，将考试成绩为57、58、59分的样本划分为控制组，两组样本的成绩分布很大程度上是随机的。更一般地，对于较小的c>0，考试分数在[60-c,60+c]范围内的学生，可以认为是随机分组的。由于是随机分组的，可对在60分附近的局部平均处理效应(Local average treatmenteffect, LATE)进行一致估计：

是断点回归方程的二阶导数，R是断点回归估计时的范围，2.702是矩形核估计的常数。

④对断点回归的结果进行稳健性检验。

若断点回归方程包括其他协变量，需要检验协变量在临界值处是否存在跳跃。若协变量存在跳跃，那么被解释变量在临界值处的跳跃不仅仅是由处理变量带来的，也可能是发生跳跃的协变量导致的。

可以选择不同的带宽或不同的估计核，检验RDD估计结果是否稳健。

4 STATA软件实现及操作案例

断点回归的基本命令是rd，该命令的基本句式如下：

rd yd x, z0 (real) mbw (*) graph bdep oxline kernel(rectangle)

其中mbw(numlist) 用来指定最优带宽的倍数，默认值为mbw(50 100 200)

z0(real) 用来指定断点的位置，默认值为z0(0)

graph 根据每一带宽，画出局部线性回归图

bdep 根据画图来考察断点回归估计量对带宽的依赖性

oxline表示在此图的默认带宽上画出一条直线，以便识别

kernel(rectangle)表示使用均匀核(矩阵核)，默认使用三角核

covar(varlist) 表示用来指定加入局部线性回归的协变量

x(varlist) 表示检验这些协变量在断点处是否存在跳跃(估计跳跃值和显著性)

①数据生成

本例中使用生成的数据用于RDD演示，读者可根据研究的问题自行输入数据。数据生成do文件可在文后所附百度U盘中下载。

②内生分组检验

输入命令

DCdensityx, breakpoint(0.5) generate(Xj Yj r0 fhat se_fhat)

x为分组变量名，0.5为临界点，命令中其余部分不需改动。DCdensity命令需读者搜索下载后添加到默认路径方可运行。本例运行结果如图1。图1中临界点左右置信区间基本重合，可以判断分组变量在临界点附近未发生跳跃，估计系数亦显示拒绝原假设(分组变量在临界点附近存在内生分组)。因此，本例数据适合使用RDD进行分析。若存在内生分组，则不应使用RDD对数据进行分析。

表1 断点回归类型检验结果

newT和T完全一致，判断应是精确断点回归。

④因果效应检验

先考虑没有协变量情形下RDD的估计结果，输入命令：

rdy1 x, gr bdep oxline z0(0.5)

得到不同带宽下临界点两侧回归图形(未在命令中设置带宽，则默认使用0.5倍、1倍和2倍带宽)，如下图：

表2 LATE系数估计结果(无协变量)

结合不同带宽下临界点两侧回归图形和LATE估计系数，可以认为不考虑协变量时，处置变量T是被解释变量发生变化的原因，且对被解释变量有正向影响。例如，对奖学金是否影响学生未来成绩的案例，则可得出结论：不考虑协变量时，学生获得奖学金会促使未来学习成绩提高。

接着在RDD中加入协变量，输入命令：

rdy1 x, gr bdep covar(z) bdep ox z0(0.5)

可得到存在协变量时临界点两侧回归图形和LATE估计系数，

表3 LATE系数估计结果(有协变量)

结合不同带宽下临界点两侧回归图形和LATE估计系数，可以认为考虑协变量影响时，处置变量T是被解释变量发生变化的原因，且对被解释变量有正向影响。例如，对奖学金是否影响学生未来成绩的案例，则可得出结论：考虑协变量时，学生获得奖学金会促使未来学习成绩提高。

⑤稳健性检验

上述命令中，我们并未对带宽进行设置，采用了rd命令的默认带宽。若读者希望对最优带宽做更细致的选择，可设置更多带宽。以没有协变量的情形为例，命令如下：

rdy1 x, bdep oxline z0(0.5) mbw(25(5) 300)

表4 矩形核RDD估计结果

当我们在RDD中加入协变量时，要注意检验协变量在临界点附近是否发生跳跃。若协变量发生跳跃，我们就不能由RDD得出被解释变量变化的原因完全是处理效应的结果，这时，可以考虑剔除发生跳跃的协变量(剔除协变量也可能产生内生性问题)。检验协变量是否发生跳跃的命令如下：

rdy1 x, x(z) z0(0.5)

表5 协变量检验结果

不同带宽下协变量z的P值(0.635、0.834、0.486)均不显著，认为协变量未发生跳跃。此时，带有协变量z的RDD估计结果是有效的。

链接：https://pan.baidu.com/s/1ff3RNYd8wQqog8EfCSNTdg

提取码：vz06

参考文献:

曹静, 王鑫,钟笑寒(2014): “限行政策是否改善了北京市的空气质量 经济学(季刊), 13, 1091-1126.

何文剑, 徐静文,张红霄(2016): “森林采伐限额管理制度能否起到保护森林资源的作用,” 中国人口·资源与环境, 26, 128-136.

贾男 (2020): “老龄化背景下退休对城镇家庭金融资产选择的影响——基于模糊断点回归设计,”统计研究, 37,46-58.

晋晶, 王宇澄,郑新业(2020): “集中供暖要跨过淮河吗—基于中国家庭能源消费数据的估计,”经济学(季刊), 19,685-708.

任明丽, 孙琦 (2020): “退休与家庭旅游消费：经济状况与闲暇时间的调节作用,” 南开管理评论, 23,4-17.

余静文, 王春超 (2011): “新“拟随机实验”方法的兴起——断点回归及其在经济学中的应用,”经济学动态,125-131.

邹红,喻开志 (2015): “退休与城镇家庭消费:基于断点回归设计的经验证据,”经济研究, 50,124-139.

Hahn Todd and van der Klaauw (2001):”Identification and estimation of treatment effects with a regressiondiscontinuity design”, Econometrica 69(1): 201-209.

Thomas Cook (2008): “”Waiting forLife to Arriv”: A history of the regression-discontinuity design inPsychology, Statistics and Economics”, Journal of Econometrics 142:636-645.

Thistlethwaite,D.L. and Campbell, D.T., 1960. Regression-discontinuity analysis: analternative to the ex-post facto experiment. Journal of Educational Psychology51, 309–317

往期计量经济模型：

半参数动态面板空间滞后模型

截面数据空间杜宾模型

面板数据空间向量自回归模型

全局向量自回归模型

截面数据半参数回归模型

面板数据门限回归模型及扩展

相关资源：晶体学查看软件_晶体结构查询-软件测试其他资源-CSDN文库

来源：weixin_39745933

声明：本站部分文章及图片转载于互联网，内容版权归原作者所有，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！

断点运行的参数_断点回归设计(RDD)及其在STATA软件的实现过程

1模型应用价值

4 STATA软件实现及操作案例

相关推荐