文本聚类综述

被引:19
作者
吴启明
易云飞
机构
[1] 河池学院计算机与信息科学系
关键词
文本聚类; 综述; 降维; 聚类算法; 聚类评价;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
聚类作为一种自动化程度较高的无监督机器学习方法,近年来在信息检索、多文档自动文摘、智能搜索引擎、短文本信息处理等领域获得了广泛的应用。本文首先讨论了文本聚类(Text clustering)的应用,然后对文本聚类算法、聚类关键技术进行了综述。
引用
收藏
页码:86 / 91
页数:6
相关论文
共 16 条
[1]  
知识发现.[M].史忠植著;.清华大学出版社.2002,
[2]   利用上下文提高文本聚类的效果 [J].
丘志宏 ;
宫雷光 .
中文信息学报, 2007, (06) :109-115
[3]   基于COSA算法的中文文本聚类 [J].
谷波 ;
李济洪 ;
刘开瑛 .
中文信息学报, 2007, (06) :65-70
[4]   密度敏感的半监督谱聚类 [J].
王玲 ;
薄列峰 ;
焦李成 .
软件学报, 2007, (10) :2412-2422
[5]   SOM聚类算法在文本分类上的应用 [J].
丁露 ;
崔平 .
现代情报, 2007, (09) :162-164
[6]   一种基于DASOM的两阶段中文文本聚类方法 [J].
朱红灿 ;
唐毅 .
情报杂志, 2007, (09) :101-104
[7]   一种基于语义内积空间模型的文本聚类算法 [J].
彭京 ;
杨冬青 ;
唐世渭 ;
付艳 ;
蒋汉奎 .
计算机学报, 2007, (08) :1354-1363
[8]   海量短语信息文本聚类技术研究 [J].
王永恒 ;
贾焰 ;
杨树强 .
计算机工程, 2007, (14) :38-40
[9]   基于混合并行遗传算法的文本聚类研究 [J].
何婷婷 ;
戴文华 ;
焦翠珍 .
中文信息学报, 2007, (04) :55-60
[10]   一种基于《知网》的中文文本聚类算法的研究 [J].
赵鹏 ;
蔡庆生 .
计算机工程与应用 , 2007, (12) :162-163