基于语义理解的文本倾向性识别机制

被引:121
作者
徐琳宏
林鸿飞
杨志豪
机构
[1] 大连理工大学计算机科学与工程系
关键词
计算机应用; 中文信息处理; 倾向性识别; 知网; 语义相似度; 否定句; 程度副词;
D O I
暂无
中图分类号
TP391.43 [];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
文本倾向性识别在垃圾邮件过滤、信息安全和自动文摘等领域都有广泛的应用。本文提出了基于语义理解的文本倾向性识别机制。其主要思想是首先计算词汇与知网中已标注褒贬性的词汇间的相似度,获取词汇的倾向性;再选择倾向性明显的词汇作为特征值,用SVM分类器分析文本的褒贬性;最后采用否定规则匹配文本中的语义否定的策略提高分类效果,同时处理程度副词附近的褒义词和贬义词,以加强对文本褒贬义强度的识别。
引用
收藏
页码:96 / 100
页数:5
相关论文
共 5 条
[1]   基于HowNet的词汇语义倾向计算 [J].
朱嫣岚 ;
闵锦 ;
周雅倩 ;
黄萱菁 ;
吴立德 .
中文信息学报, 2006, (01) :14-20
[2]   程度副词的特点范围与分类 [J].
蔺璜 ;
郭姝慧 .
山西大学学报(哲学社会科学版), 2003, (02) :71-74
[3]   语义关系的表达和知识系统的建造 [J].
董振东 .
语言文字应用, 1998, (03) :79-85
[4]  
基于HowNet的话题跟踪及倾向性分类研究[J]. 金珠,林鸿飞,赵晶.情报学报. 2005 (05)
[5]  
中国现代语法[M]. 商务印书馆 , 王力著, 1985