基于转换的无指导词义标注方法

被引:9
作者
李涓子
黄昌宁
机构
[1] 清华大学计算机科学与技术系!北京,清华大学计算机科学与技术系!北京
关键词
自然语言处理; 词义标注; 无指导学习;
D O I
10.16511/j.cnki.qhdxxb.1999.07.028
中图分类号
TP301 [理论、方法];
学科分类号
081202 ;
摘要
词义标注是自然语言处理的难题之一。该文提出用于文本词义标注的转换规则自动获取算法及相应的词义排歧算法。该算法用可能的句法关系对语境进行限制,减少了训练数据中的噪音; 为提高学习算法的速度,提出利用预排序方法减少规则搜索次数,以及只调整变化部分数据的计算方法; 并给了改善召回率的词义排歧算法。在近5 万词的语料库上对本算法进行了实验,开放测试的词义排歧正确率为743% 。
引用
收藏
页码:116 / 120
页数:5
相关论文
共 2 条
[1]  
现代汉语辞海.[M].倪文杰等主编;.人民中国出版社.1994,
[2]  
同义词词林.[M].梅家驹;竺一鸣;高蕴琦;殷鸿翔 编.上海辞书出版社.1983,