基于最大熵的汉语人名地名识别方法研究

被引:25
作者
钱晶 [1 ]
张杰 [1 ]
张涛 [2 ]
机构
[1] 复旦大学计算机科学与工程系
[2] 上海财经大学信息管理与工程学院
关键词
最大熵模型; 专有名词识别; 特征提取; 语言学规则;
D O I
暂无
中图分类号
TP391.43 [];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
构建了一个基于最大熵原理的汉语人名地名自动识别混合模型.该模型分为训练和识别两个模块.先从训练语料中抽取特征,利用最大熵方法对特征进行训练.然后使用经过训练的特征,并结合动态词表和少量规则,对测试文本中的汉语人名地名进行识别.达到了比较满意的识别效果.最后对实验结果进行了分析.
引用
收藏
页码:1761 / 1765
页数:5
相关论文
共 4 条
[1]   使用最大熵模型进行中文文本分类 [J].
李荣陆 ;
王建会 ;
陈晓云 ;
陶晓鹏 ;
胡运发 .
计算机研究与发展, 2005, (01) :94-101
[2]   基于最大熵方法的中英文基本名词短语识别 [J].
周雅倩 ;
郭以昆 ;
黄萱菁 ;
吴立德 .
计算机研究与发展, 2003, (03) :440-446
[3]   基于统计的中文地名识别 [J].
黄德根 ;
岳广玲 ;
杨元生 .
中文信息学报, 2003, (02) :36-41
[4]   一种基于最大熵原理的汉语实体提取方法 [J].
丁丰 ;
袁保宗 .
铁道学报, 2001, (05) :34-37