基于特征词关联性的同义词集挖掘算法

被引:10
作者
陈建超
郑启伦
李庆阳
严桂夺
机构
[1] 华南理工大学计算机科学与工程学院
基金
广东省自然科学基金;
关键词
自然语言处理; 同义词集; 特征词; 概念;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
一词多义和多词同义是语言中广泛存在的现象,它给自然语言处理带来了很多困难,解决这个难题的有效办法是建立包含上下文信息的同义词集。深入分析了概念、词汇和特征词三者的内在关系,并在此基础上提出了一种基于同义词汇的特征词的关联性,从文本中挖掘同义词集的算法。根据特征词之间存在关联性的特点,算法以成熟的关联规则挖掘算法作为基础,获得了明显优于同类算法的实验效果。算法获得的同义词集附带上下文信息,可有效解决文本中词汇的多义性和同义性问题。
引用
收藏
页码:2517 / 2519+2532 +2532
页数:4
相关论文
共 2 条
[1]   一种基于“是一个”模式的下位概念获取方法 [J].
刘磊 ;
曹存根 ;
王海涛 ;
陈威 .
计算机科学, 2006, (09) :146-151
[2]  
Discovering word senses from a network of lexical cooc-currences .2 OLIVIER F. Proc of the20th International Conference on Compu-tational Linguistics . 2004