共 1 条
基于内容分析的话题检测研究
被引:19
作者:
赵华
赵铁军
张姝
王浩畅
机构:
[1] 哈尔滨工业大学计算机科学与技术学院
来源:
关键词:
话题检测;
内容分析;
错误检测开销;
标识词;
内容词;
D O I:
暂无
中图分类号:
TP391.4 [模式识别与装置];
学科分类号:
0811 ;
081101 ;
081104 ;
1405 ;
摘要:
通过分析大量的英文报道的特点,针对目前话题检测研究中存在的难以区分两次不同的火车事故或爆炸事件的问题提出了基于内容分析的话题检测算法.该算法以S ingle-Pass聚类策略为基础,通过内容分析将话题表示成两个中心向量:标识中心向量及内容中心向量.实验证明基于内容分析的话题检测算法不但简单易行,而且对于解决上述的“难以区分”问题非常有效.
引用
收藏
页码:1740 / 1743
页数:4
相关论文