汉语词语语义相似度计算研究

被引:63
作者
夏天
机构
[1] 中国人民大学信息资源管理学院
关键词
词语相似度; 知网; 概念; 义原;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
汉语词语的语义相似度计算是中文信息处理中的一个关键问题。该文提出了一种基于知网、面向语义、可扩展的相似度计算新方法,该方法从信息论的角度出发,定义了知网义原间的相似度计算公式,通过对未登录词进行概念切分和语义自动生成,解决了未登录词无法参与语义计算的难题,实现了任意词语在语义层面上的相似度计算。针对同义词词林的实验结果表明,该方法的准确率比现有方法高出近15个百分点。
引用
收藏
页码:191 / 194
页数:4
相关论文
共 4 条
[1]   基于ALICE的汉语自然语言接口 [J].
夏天 ;
樊孝忠 ;
刘林 ;
骆正华 .
北京理工大学学报, 2004, (10) :885-889
[2]   一种基于加权语义相似度模型的自动问答系统 [J].
刘亚军 ;
徐易 .
东南大学学报(自然科学版), 2004, (05) :609-612
[3]   计算机识别汉语同义词的两种算法比较和测评 [J].
朱毅华 ;
侯汉清 ;
沙印亭 .
中国图书馆学报, 2002, (04) :81-84
[4]   基于词义的关键词抽取方法研究 [J].
李有梅 .
情报理论与实践 , 2000, (02) :81-83