基于统计方法的中文姓名识别

被引:33
作者
黄德根
杨元生
王省
张艳丽
钟万勰
机构
[1] 大连理工大学计算机科学与工程系!大连大连理工大学工程力学研究所大连,大连理工大学计算机科学与工程系!大连,大连理工大学计算机科学与工程系!大连,大连理工大学计算机科学与工程系!大连,大连理工大学工程力学研究所!大连
关键词
双词同现频度; 单词频度; 学习机制; 中文姓名识别;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
专有名词的识别对自动分词有重要意义。本文针对如何识别中文姓名做了有益的尝试 ,主要采用基于统计方法 ,进行中文姓名识别。本文建立了有监督学习机制 ,提出了句子切分结果可信度等概念 ,并在此基础上建立了较好的统计模型 ,系统闭式精确率和召回率分别达 95 .97%和 95 .5 2 % ,开式精确率和召回率分别达 92 .37%和 88.6 2 %
引用
收藏
页码:31 / 37+44 +44
页数:8
相关论文
共 5 条
[1]   汉语词语边界自动划分的模型与算法 [J].
付国宏 ;
王晓龙 ;
不详 .
计算机研究与发展 , 1999, (09) :1142-1147
[2]   利用汉字二元语法关系解决汉语自动分词中的交集型歧义 [J].
孙茂松 ;
黄昌宁 ;
邹嘉彦 ;
陆方 ;
沈达阳 .
计算机研究与发展 , 1997, (05) :14-21
[3]   一种汉语分词方法 [J].
吴胜远 .
计算机研究与发展, 1996, (04) :306-311
[4]   中文姓名的自动辨识 [J].
孙茂松,黄昌宁,高海燕,方捷 .
中文信息学报, 1995, (02) :16-27
[5]   多语料库作法之中文姓名辨识 [J].
张俊盛 ;
陈舜德 ;
郑萦 ;
刘显仲 ;
柯淑津 .
中文信息学报, 1992, (03) :7-15