香樟青苗
当前位置是: 网站首页 -- 学术科研 -- 香樟青苗 -- 正文

香樟青苗简报 | 李春涛:ChatGPT在文本分析领域的应用

发布日期:2023-08-03   点击量:

2023727日下午,河南大学国际商学院李春涛教授担任青苗计划主讲人向全体学员讲授“ChatGPT在文本分析领域的应用”。

图片

嘉宾简介

李春涛,香港大学博士,河南省特聘教授,河南大学至善特聘教授,博士生导师,主要研究领域是公司治理和企业创新,在《经济研究》《管理世界》《中国工业经济》《金融研究》《财贸经济》《会计研究》、Stata JournalJournal of Comparative Economics等主流期刊上发表学术论文50余篇。李春涛教授是数据分析的专家,有20余年的stata编程经验,编写过许多stata命令,比如wordconvert, subinfile, psemail, reg2docx, sum2docx, t2docx, corr2docx, cntrade, cnstock, cntop10, hkstockcnintraday, cngcode, cnaddress, cntraveltime, cntraveltime等,这些命令极大地便利了实证研究的数据分析过程,并得到了广大Stata用户的支持。

 

在本次讲座中,李老师依托ChatGPT的基础知识,帮助大家了解ChatGPT在经济学研究中的应用,以及如何让ChatGPT服务于Stata数据处理和文本分析,提高科研效率。本次讲座从ChatGPT基础知识、最优雅的Stata帮助命令和ChatGPT与文本分析三个部分展开

首先,李老师为大家介绍了ChatGPT的基础知识及使用方法。ChatGPT是由OpenAI公司基于Transformer模型开发的大语言交互模型,其通过文本信息学习,精通各国语言,掌握海量知识。使用ChatGPT需要在官方网站注册账号,并登录OpenAI官网获取API KEY,成功注册的 OpenAI 账号通常有5$的测试额度。李老师团队开发的chatgpt命令,可以实现ChatGPT直接辅助Stata的数据处理。

图片

接着,李老师详细介绍了如何依托ChatGPT,生成最优雅的Stata帮助命令。其一,实现用自然语言描述需求,通过GPT直接生成Stata命令。例如:在Stata中输入命令“chatgpt talk, openai_api_key($OPENAI_API_KEY) command(如何描述变量mpg的基本统计信息) stata”,在点击执行后结果窗口中会直接给出可使用的Stata命令“summarize mpg”,执行该命令后,即可得出需要的结果。另外,我们也可以在已生成的结果上进一步提问,ChatGPT也会通过Stata的结果窗口给出相关命令。

图片

其二,向GPT提交文本或数据,GPT在进行分析后作答。例如:如果需要查询数据结果相应的Stata命令,可以在Stata命令窗口中输入“chatgpt read, openai_api_key($OPENAI_API_KEY) stata command(观察数据详情,请指出如何通过stkcdyear生成delta") do("list")”,在点击执行后结果窗口会给出相应的命令。除此之外,read模式还能够阅读help文件、do文档,给出相关命令示例或回答关键问题。

图片

其三,针对特殊复杂的数据清洗,GPT能快速给出解决方案。例如:在Stata中输入命令“chatgpt talk, openai_api_key($OPENAI_API_KEY) command(仅在前5个奇数行生成新变量LL= weight*length ") stata”,在点击执行后结果窗口就会给出对应的Stata命令。目前,该命令还可以实现实证答疑、报错答疑、绘图答疑、翻译、润色等功能,能够大大提高科研效率。

最后,李老师介绍了Stata与文本分析。依托chatgpt命令,Stata能够轻松实现文本分析,例如:直接提取json中的数据或信息;通过余弦相似度实现文本相似度分析;快速实现文本及文本标签分类;可读性计算;摘要提取等。

李春涛老师将前沿工具带入课堂,深入浅出、化繁为简的讲解不仅让学生充分了解ChatGPT在经济学研究中的应用,更拓宽了未来的研究思路。感谢李春涛老师对香樟青苗的辛劳付出,讲座至此圆满成功!

版权所有 © 中国社会科学院大学    邮编:102488

地址:北京市房山区长于大街11号