香樟青苗
当前位置是: 网站首页 -- 学术科研 -- 香樟青苗 -- 正文

香樟青苗简报:李春涛:Stata与中文地图

发布日期:2021-07-30   点击量:

李春涛:香港大学博士,中南财经政法大学金融学院教授、博士生导师,河南大学攀登计划特聘教授,主要研究领域是公司治理和企业创新,在《经济研究》、《管理世界》、《中国工业经济》、《金融研究》、《财贸经济》、《会计研究》、Stata journal、Journal of Comparative Economics等主流期刊上发表学术论文50余篇。李春涛教授是数据分析的专家,有20余年的stata编程经验,编写过许多stata命令,比如wordconvert, subinfile, psemail, reg2docx, sum2docx, t2docx, corr2docx, cntrade, cnstock, cntop10, hkstock,cnintraday, cngcode, cnaddress, cntraveltime, cntraveltime等,这些命令让中国数据免费且唾手可得,让实证研究异常容易。李教授有十多名学生正在或曾经在海外名校从事研究助理工作。

2021年7月27日下午,中南财经政法大学金融学院李春涛老师担任青苗计划主讲人,授课题目为“Stata与中文地图”。本次讲座由刘安然主持,第四期青苗计划学员参加。

在正式授课之前,李老师提到了当前宏观和微观经济学实证研究中存在的差异,即宏观经济研究往往数据较为缺乏、单一,但数理模型比较复杂;而在微观实证研究中,则往往是数据丰富而模型相对简单。因此,本次授课主要目的在于帮助大家理解和提炼中文地图的数据、掌握Stata的结果输出,以求在未来实证研究中解决微观数据的相关问题。

(1)第一个数据处理案例讲解:

李老师分享的第一个数据处理案例是,针对银行在不同地区设立分支机构,银监会官网会发出一个公告,公告中关于分支机构的地址描述并不规范,没有严格按照省市县等层级区分,当数据量巨大时,不利于我们进行手工整理,难以提高学术研究效率。

首先,李老师分享了提取中文地址中城市名称的方法。其一是通过“gen city = ustrregexs(2) if ustrregexm(机构地址, "(.+省)?(.+?市)")”的命令语句进行地址提取,即可以从设立银行分支机构的公告中,提取地址中的地级市名称。其二,还介绍了更加精确的地址搜索命令,如replace city = "池州市" if ustrregexm(机构地址, "^(安徽省?)?东至县?")。最后,也可以结合行政区划表进行精确查找,具体命令如下;

(2)第二个数据处理案例:

通过赋予Stata新的功能,尝试把中文地址转换为经纬度、再把经纬度转换为中文地址。此外,尝试搜索某一半径范围内的地铁站、医院、商场等;并计算两个位置之间的交通距离和通勤时间。

首先,可以先用指令“cngcode”把中文地址转换为经纬度,再用“cnaddress”命令将经纬度转换为中文地址,这样既可以得到对应的省市区名称。其次,可以使用老师开发的“cnmapsearch”命令搜索某一半径范围内的地铁站、医院、商场,或者用“cntraveltime”命令确定两个位置之间的实际交通距离和通勤时间,而不是空间上的直线距离。以上四个命令由李老师团队自主开发,能大幅提高研究中的地址数据处理效率。同时,为了辅助大家理解,李老师还列举了几个案例,并进行了实操分享。其次,李老师还分享了用“cntraveltime”命令确定两个位置之间的实际交通距离和通勤时间的实操案例,并具体按bus、car、bike等多种交通模式进行了分类演示。

(3)第三个数据处理案例:

在以上案例中,用“cngcode”把中文地址转换为经纬度,再用“cnaddress”命令将经纬度转换为中文地址,可以得到准确的地级市的名称,但无法得到更详细的街道名称及位置,因此需要用百度地图来搜索确定经营机构的具体地址并计算两地通勤距离和时间。如过往研究上市公司避税问题的案例中,部分研究认为上市公司距离税局较近,则税局方便经常到上市公司查账,这样上市公司避税将减少。当然也有观点认为,若上市公司距离税局较近,则上市公司经理人方便与税局领导进行沟通,从而建立一种友好关系,有利于公司避税。为检验以上结论,需要具体爬取上市公司和税局地址,再计算两地距离,并用于实证。

李老师在分享过程中,考虑到上市公司为避税可能选择离税局较远的地点作为办公地点,而税局也可能因为要增加税收而选择离上市公司较近的办公地,因此直接检验两地距离对避税影响可能存在内生问题,需要寻找工具变量,即找到一个跟税局地点相关又不直接影响上市公司地址的变量,综合考量选择了上市公司和税局附近的商场地址作为IV工具变量。具体的操作流程如下:

1、先确定股票的代码,copy其办公地址;2、用cngcode命令获取办公地址的经纬度信息;3、用cnmapsearch命令获得最近的税务局和公司、商场的地理信息;4、用cntraveltime命令获取两点间的通行距离和时间;5、将得到通行距离或时间作为边长计算余弦角cosB和角度B。这样既可以根据B角度判断税局工作人员前往上市公司是否顺路,若为钝角则可以认为是顺路,并可以将得到的数据用于模型回归,来检验距离和避税的关系。

最后,李老师还向同学们介绍了其他相关的理论和Stata中的地图数据处理方法,并回答了多位同学提出的疑问。今天的授课,李老师深入浅出,谆谆善诱,让同学们对如何用理论并运用Stata搜集处理地图数据,解决微观实证中的数据问题有了更好的把握,同时授课中分享的关于上市公司和税局距离对其避税影响的案例,也让同学们对实证中工具变量的选择有了更多的认识。在随后的互动环节,各位同学积极就自己的疑问与李老师进行了深入交流,对同学们的疑问,老师也做了详细解答,大家都受益匪浅并收获满满。

感谢李春涛老师的辛劳付出,为青苗学子讲授的Stata技巧!讲座至此圆满成功!(文案:张年华 华南师范大学)

版权所有 © 中国社会科学院大学    邮编:102488

地址:北京市房山区长于大街11号