基于二阶隐马尔可夫模型的文本信息抽取

被引:25
作者
周顺先 [1 ]
林亚平 [1 ]
王耀南 [2 ]
易叶青 [1 ]
机构
[1] 湖南大学计算机与通信学院
[2] 湖南大学电气与信息工程学院
关键词
文本信息抽取; 一阶隐马尔可夫模型; 二阶隐马尔可夫模型; 精确度;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
隐马尔可夫模型是文本信息抽取的重要方法之一.在一阶隐马尔可夫模型中,假设状态转移概率和观察值输出概率仅依赖于模型当前的状态,一定程度降低了信息抽取的精确度.而二阶隐马尔可夫模型合理地考虑了概率和模型历史状态的关联性,对错误信息有更强的识别能力.提出了基于二阶隐马尔可夫模型的文本信息抽取算法;分析了二阶隐马尔可夫模型在文本信息抽取中的有效性;仿真实验表明,新的算法比基于一阶隐马尔可夫模型的算法具有更高的抽取精确度.
引用
收藏
页码:2226 / 2231
页数:6
相关论文
共 5 条
[1]   基于条件随机场(CRFs)的中文词性标注方法 [J].
洪铭材 ;
张阔 ;
唐杰 ;
李涓子 .
计算机科学, 2006, (10) :148-151+155
[2]   基于层叠条件随机场模型的中文机构名自动识别 [J].
周俊生 ;
戴新宇 ;
尹存燕 ;
陈家骏 .
电子学报, 2006, (05) :804-809
[3]   基于最大熵的隐马尔可夫模型文本信息抽取 [J].
林亚平 ;
刘云中 ;
周顺先 ;
陈治平 ;
蔡立军 .
电子学报, 2005, (02) :236-240
[4]   基于隐马尔可夫模型的文本信息抽取 [J].
刘云中 ;
林亚平 ;
陈治平 .
系统仿真学报, 2004, (03) :507-510
[5]   二阶隐马尔可夫模型的学习算法及其与一阶隐马尔可夫模型的关系 [J].
史笑兴 ;
王太君 ;
何振亚 .
应用科学学报, 2001, (01) :29-32