基于文本挖掘和百度指数的投资者情绪指数研究

被引:51
作者
孟雪井 [1 ,2 ]
孟祥兰 [3 ]
胡杨洋 [3 ]
机构
[1] 中南财经政法大学博士后流动站
[2] 湖北经济学院统计学院、湖北数据与分析中心
[3] 中南财经政法大学统计与数学学院
基金
中国博士后科学基金;
关键词
文本挖掘; 百度指数; 投资者情绪; 股票市场;
D O I
10.16304/j.cnki.11-3952/f.2016.01.014
中图分类号
F124 [经济建设和发展];
学科分类号
0201 ; 020105 ;
摘要
本文首先运用文本挖掘技术对中国知网CSSCI期刊与新浪微博话题信息进行文本分析,并结合百度自身关键词推荐系统,在综合三大词库的基础上确定我国投资者相关的初始网络搜索关键词;其次,以上证指数为参照,对三大词库关键词的百度指数周数据的时间序列采用时差相关系数法、随机森林算法进行筛选,过滤后得到最能反映我国投资者行为的关键词词库;最后利用因子分析法构建了具有领先性的沪市投资者情绪指数。
引用
收藏
页码:144 / 153
页数:10
相关论文
共 19 条
[1]   我国股票市场投资者情绪SENT指数的构建——基于上证A股公司的面板数据 [J].
马若微 ;
张娜 .
中央财经大学学报, 2015, (07) :42-49
[2]   金融危机背景下中美投资者情绪的传染性分析 [J].
文凤华 ;
杨鑫 ;
龚旭 ;
黄创霞 ;
杨晓光 .
系统工程理论与实践, 2015, (03) :623-629
[3]   基于网络搜索数据的房地产价格预测 [J].
董倩 ;
孙娜娜 ;
李伟 .
统计研究, 2014, 31 (10) :81-88
[4]   中国宏观经济波动的隐性通货膨胀目标分析 [J].
宋平平 ;
孙皓 .
南方金融, 2012, (12) :4-9
[5]   投资者有限关注与股票收益——以百度指数作为关注度的一项实证研究 [J].
俞庆进 ;
张兵 .
金融研究, 2012, (08) :152-165
[6]   网络搜索数据与CPI的相关性研究 [J].
张崇 ;
吕本富 ;
彭赓 ;
刘颖 .
管理科学学报, 2012, 15 (07) :50-59+70
[7]   我国投资者情绪波动性与股市收益 [J].
王朝晖 ;
李心丹 .
宁波大学学报(人文科学版), 2008, (06) :89-93+98
[8]   新股投资者情绪度量及其与新股价格行为关系 [J].
王春峰 ;
赵威 ;
房振明 .
系统工程, 2007, (07) :1-6
[9]   不完全理性、投资者情绪与封闭式基金之谜 [J].
伍燕然 ;
韩立岩 .
经济研究, 2007, (03) :117-129
[10]   中国股市收益、收益波动与投资者情绪 [J].
王美今 ;
孙建军 .
经济研究, 2004, (10) :75-83