融合百度指数的流感预测机理与实证研究

被引:23
作者
王若佳 [1 ,2 ]
机构
[1] 北京大学信息管理系
[2] 北京大学海洋研究院
关键词
流感预测; 百度指数; 神经网络; 支持向量机; 多元线性回归;
D O I
暂无
中图分类号
G353.1 [情报资料的分析和研究]; R511.7 [流行性感冒];
学科分类号
1205 ; 100401 ;
摘要
本文通过挖掘网络搜索数据与我国流感疫情的在内在机理,利用关键词的时序特征实现了较为精准的提前预测。研究首先从信息行为、信息搜寻行为等理论概念出发,对百度指数与流感病例数据之间的逻辑关系进行探讨,建立理论框架;然后以理论框架为基础,用范围选词法对百度搜索词进行初步筛选,并利用互相关分析选出具有先行性质的关键词,用于构建预测模型;最后,对比融合百度指数的三种预测模型,评估其预测效果。互相关分析结果大致符合本文提出的逻辑框架,可提前十周预测流感疫情的关键词内容和流感疫苗相关;提前一周的关键词多涉及流感的症状表现;而同步类关键词多为常用搜索词或治疗方法。模型对比结果显示,多元线性回归模型、支持向量机模型和神经网络模型都能有效地进行流感预测,无论提前十周还是提前一周,支持向量机的效果最好。
引用
收藏
页码:206 / 219
页数:14
相关论文
共 17 条
[1]   基于互联网搜索数据的流感监测模型比较与优化 [J].
王若佳 ;
李培 .
图书情报工作, 2016, 60 (18) :122-132
[2]  
基于支持向量机的浙江省流感样病例预警模型研究[J]. 卢汉体,李傅冬,林君芬,何凡,沈毅.浙江大学学报(医学版). 2015 (06)
[3]   基于互联网搜索数据研究全球高致病性禽流感病毒H5N1的暴发监测 [J].
李锐 ;
孙利谦 ;
熊成龙 ;
胡艺 ;
林燧恒 ;
张志杰 ;
姜庆五 .
中华疾病控制杂志, 2015, 19 (08) :773-777
[4]   网络搜索关键词时序变化特征研究——以H7N9禽流感关键词实验为例 [J].
卢洪涛 ;
李纲 .
情报杂志, 2014, 33 (11) :175-180
[5]   基于网络信息搜索的旅游需求预测——来自黄金周的证据 [J].
王炼 ;
贾建民 .
系统管理学报, 2014, 23 (03) :345-350+358
[6]   基于互联网搜索数据的中国流感监测 [J].
李秀婷 ;
刘凡 ;
董纪昌 ;
吕本富 .
系统工程理论与实践, 2013, 33 (12) :3028-3034
[7]   基于谷歌趋势的乙型肝炎预测模型 [J].
杨艳红 ;
曾庆 ;
赵寒 ;
易娟 ;
李勤 ;
夏宇 .
上海交通大学学报(医学版), 2013, 33 (02) :204-208
[8]   网络搜索数据与CPI的相关性研究 [J].
张崇 ;
吕本富 ;
彭赓 ;
刘颖 .
管理科学学报, 2012, 15 (07) :50-59+70
[9]   时间序列分析在流感疫情预测预警中的应用 [J].
朱猛 ;
祖荣强 ;
霍翔 ;
鲍昌俊 ;
赵杨 ;
彭志行 ;
喻荣彬 ;
沈洪兵 ;
陈峰 .
中华预防医学杂志, 2011, (12)
[10]   健康信息需求研究的内容与意义 [J].
张馨遥 .
医学与社会, 2010, 23 (01) :51-53