基于统计的中文地名识别

被引:51
作者
黄德根
岳广玲
杨元生
机构
[1] 大连理工大学计算机科学与工程系
[2] 大连理工大学计算机科学与工程系 大连
[3] 大连
关键词
计算机应用; 中文信息处理; 中文地名识别; 构词可信度; 接续可信度; 自动分词;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
本文针对有特征词的中文地名识别进行了研究。该系统使用从大规模地名词典和真实文本语料库得到的统计信息以及针对地名特点总结出来的规则 ,通过计算地名的构词可信度和接续可信度从而识别中文地名。该模型对自动分词的切分作了有效的调整 ,系统闭式召回率和精确率分别为 90 2 4 %和 93 14 % ,开式召回率和精确率分别达 86 86 %和 91 4 8%。
引用
收藏
页码:36 / 41
页数:6
相关论文
共 6 条
[1]   基于统计方法的中文姓名识别 [J].
黄德根 ;
杨元生 ;
王省 ;
张艳丽 ;
钟万勰 .
中文信息学报, 2001, (02) :31-37+44
[2]   基于统计方法的中文姓名识别 [J].
刘秉伟 ;
黄萱菁 ;
郭以昆 ;
吴立德 .
中文信息学报, 2000, (03) :16-24+36
[3]   基于语料库的中文姓名识别方法研究 [J].
郑家恒 ;
李鑫 ;
谭红叶 .
中文信息学报, 2000, (01) :7-12
[4]   中文姓名的自动辨识 [J].
孙茂松,黄昌宁,高海燕,方捷 .
中文信息学报, 1995, (02) :16-27
[5]  
中文文本自动分词和标注[M]. 商务印书馆 , 刘开瑛著, 2000
[6]  
中国地名录[M]. 地图出版社 , 国家测绘局地名研究所 编, 1983