文本大数据分析在经济学和金融学中的应用:一个文献综述

被引:96
作者
沈艳 [1 ,2 ]
陈赟 [1 ,2 ]
黄卓 [1 ,2 ]
机构
[1] 北京大学国家发展研究院
[2] 北京大学数字金融研究中心
关键词
文本大数据; 机器学习; 投资者情绪;
D O I
10.13821/j.cnki.ceq.2019.03.01
中图分类号
F01 [经济学基本问题]; F830 [金融、银行理论]; F224 [经济数学方法];
学科分类号
0201 ; 1201 ; 020204 ; 0701 ; 070104 ;
摘要
本文对文本大数据分析在经济学和金融学中的应用进行综述。文本大数据具有来源多样化、数据量增长快和高频等特征,为经济学和金融学研究提供了新的分析视角。本文梳理了文本大数据的信息提取步骤,总结了词典法、机器学习方法和深度学习方法的实现原理和技术特点,并对文本大数据在经济学和金融学中的应用研究的数据来源、处理方法和实证结果进行了全面梳理。本文还讨论了基于文本大数据的实证分析的新特征和未来研究趋势。
引用
收藏
页码:1153 / 1186
页数:34
相关论文
共 78 条
[1]   年报文本信息复杂性与管理者自利——来自中国上市公司的证据 [J].
王克敏 ;
王华杰 ;
李栋栋 ;
戴杏云 .
管理世界, 2018, 34 (12) :120-132+194
[2]   测量中国的金融不确定性——基于大数据的方法 [J].
黄卓 ;
邱晗 ;
沈艳 ;
童晨 .
金融研究, 2018, (11) :30-46
[3]   年报语调与内部人交易:“表里如一”还是“口是心非”? [J].
曾庆生 ;
周波 ;
张程 ;
陈信元 .
管理世界, 2018, 34 (09) :143-160
[4]   中国的数字金融发展:现在与未来 [J].
黄益平 ;
黄卓 .
经济学(季刊), 2018, 17 (04) :1489-1502
[5]   情绪、违约率与反向挤兑——来自某互金企业的证据 [J].
张皓星 ;
黄益平 .
经济学(季刊), 2018, 17 (04) :1503-1524
[6]   金融科技媒体情绪的刻画与对网贷市场的影响 [J].
王靖一 ;
黄益平 .
经济学(季刊), 2018, 17 (04) :1623-1650
[7]   基于网络大数据挖掘的实证资产定价研究进展 [J].
张学勇 ;
吴雨玲 .
经济学动态, 2018, (06) :129-140
[8]   政策不确定性、财务柔性价值与资本结构动态调整 [J].
顾研 ;
周强龙 .
世界经济, 2018, 41 (06) :102-126
[9]   经济政策不确定性与公司商业信用供给 [J].
陈胜蓝 ;
刘晓玲 .
金融研究, 2018, (05) :172-190
[10]  
经济不确定性对金融市场的影响:一个文献综述[J]. 黄卓,童晨,梁方.金融科学. 2017(02)