基于D-S证据理论的微博客蕴含交通信息提取方法

被引:6
作者
张恒才
陆锋
仇培元
机构
[1] 中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室
关键词
微博客; 交通信息; 文本聚类; 证据理论; 维基百科;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP393.092 [];
学科分类号
081203 ; 0835 ; 080402 ;
摘要
微博客消息中经常蕴含大量实时交通信息,有望与现有实时交通信息采集方式形成互补。该文针对微博客消息语义模糊性及用户描述差异性问题,提出了一种微博客消息蕴含交通信息的D-S证据理论提取方法。该方法首先构建微博客消息蕴含交通状态信息评价体系,利用百科知识提高评价精度,然后定义微博客消息源的基本概率分配函数,通过证据合成与证据决策,实现微博客消息蕴含实时交通信息的甄别与融合。实验结果表明,该方法能够对微博客消息蕴含实时交通信息的可信度进行有效判断,并能够在最大程度上利用不同微博客用户发布消息的信息内容,且较之传统的文本聚类融合方法具有更高的准确率。
引用
收藏
页码:170 / 178
页数:9
相关论文
共 17 条
[1]   微博文本处理研究综述 [J].
张剑峰 ;
夏云庆 ;
姚建民 .
中文信息学报, 2012, (04) :21-27+42
[2]   基于情感分布的微博热点事件发现 [J].
杨亮 ;
林原 ;
林鸿飞 .
中文信息学报, 2012, 26 (01) :84-90+109
[3]   概念向量文本聚类算法 [J].
白秋产 ;
金春霞 ;
周海岩 .
计算机工程与应用, 2011, 47 (35) :155-157+209
[4]   基于维基百科类别的文本特征表示 [J].
王锦 ;
王会珍 ;
张俐 .
中文信息学报, 2011, (02) :27-31
[5]   大规模短文本的不完全聚类 [J].
彭泽映 ;
俞晓明 ;
许洪波 ;
刘春阳 .
中文信息学报, 2011, 25 (01) :54-59
[6]   基于《知网》的词语相似度算法研究 [J].
刘青磊 ;
顾小丰 .
中文信息学报, 2010, (06) :31-36
[7]   维基百科研究综述 [J].
赵飞 ;
周涛 ;
张良 ;
马鸣卉 ;
刘金虎 ;
余飞 ;
查一龙 ;
李睿琪 .
电子科技大学学报, 2010, 39 (03) :321-334
[8]   自然语言表达实时路况信息的路网匹配融合技术 [J].
陈传彬 ;
陆锋 ;
励惠国 ;
王钦敏 .
中国图象图形学报, 2009, (08) :1669-1676
[9]   出行信息服务关键技术研究进展与问题探讨 [J].
陆锋 ;
郑年波 ;
段滢滢 ;
张健钦 .
中国图象图形学报, 2009, (07) :1219-1229
[10]   基于多重信息融合的高分辨率遥感影像道路信息提取 [J].
李晓峰 ;
张树清 ;
韩富伟 ;
秦喜文 ;
于欢 .
测绘学报, 2008, (02) :178-184