基于示例的文本标题分类机制

被引:14
作者
林鸿飞
机构
[1] 大连理工大学计算机科学系!大连
关键词
文本分类; 潜在语义索引; 向量空间模型; 标题分类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
文本分类有助于用户有选择地阅读和处理海量文本 ,给出了基于示例的文本标题分类机制 .它以具有确定分类标准的标题分类为应用背景 ,在计算标题与分类主题词表直接匹配的基础上 ,利用基于分类树的上位概念匹配机制和基于潜在语义空间的相似度判定 ,综合评价文本标题与类别的相关关系 .其特点是充分利用上下文环境来确定标题与类别相关程度 ,而不是单纯地依赖于其共现信息 .
引用
收藏
页码:1132 / 1136
页数:5
相关论文
共 3 条
[1]   基于概念的文本结构分析方法 [J].
林鸿飞 ;
战学刚 ;
姚天顺 .
计算机研究与发展, 2000, (03) :324-328
[2]   基于潜在语义索引的文本分析方法 [J].
林鸿飞 ;
战学刚 ;
姚天顺 .
模式识别与人工智能, 2000, 13 (01) :47-51
[3]   中文文献的层次分类方法 [J].
战学刚 ;
林鸿飞 ;
姚天顺 .
中文信息学报, 1999, (06) :20-25