基于隐马尔可夫模型的中文科研论文信息抽取

被引:8
作者
于江德
樊孝忠
尹继豪
顾益军
机构
[1] 北京理工大学计算机科学技术学院
关键词
隐马尔可夫模型; 信息抽取; 论文头部信息;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
随着大量的科研论文出现在互联网上,从中精确地抽取论文头部信息和引文信息显得十分重要。该文提出了一种基于隐马尔可夫模型的中文科研论文头部信息和引文信息抽取算法,分析了模型结构的学习和参数估计方法。在进行信息抽取时,利用分隔符、特定标识符等格式信息对文本进行分块,利用隐马尔可夫模型进行指定域的抽取。实验结果表明,该算法具有良好的准确率和召回率。
引用
收藏
页码:190 / 192
页数:3
相关论文
共 3 条
[1]   基于最大熵的隐马尔可夫模型文本信息抽取 [J].
林亚平 ;
刘云中 ;
周顺先 ;
陈治平 ;
蔡立军 .
电子学报, 2005, (02) :236-240
[2]   基于隐马尔可夫模型的文本信息抽取 [J].
刘云中 ;
林亚平 ;
陈治平 .
系统仿真学报, 2004, (03) :507-510
[3]   基于隐马尔可夫模型的引文信息提取 [J].
张玲 ;
黄铁军 ;
高文 .
计算机工程, 2003, (20) :33-34+54