文本挖掘研究进展

被引:50
作者
谌志群
张国煊
机构
[1] 杭州电子科技大学计算机学院
基金
浙江省自然科学基金;
关键词
文本挖掘; 数据挖掘; 文本知识发现; 自然语言处理; 关联规则; 文本聚类; 趋势分析;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
文本挖掘又称为文本数据挖掘或文本知识发现,是指在大规模文本集合中发现隐含的、以前未知的、潜在有用的模式的过程。本文首先介绍了文本挖掘的概念,包括文本挖掘的定义、特点、与其它几个研究领域(数据挖掘、信息检索、信息抽取、计算语言学等)的关系;然后讨论了文本挖掘模型、文本特征抽取与中间表示、文本挖掘的分类与实现技术;最后介绍了几个文本挖掘产品。
引用
收藏
页码:65 / 74
页数:10
相关论文
共 12 条
[1]   Web日志中有趣关联规则的发现 [J].
李颖基 ;
彭宏 ;
郑启伦 ;
曾炜 .
计算机研究与发展, 2003, (03) :435-439
[2]   文本挖掘中的特征表示及聚类方法 [J].
胥桂仙 ;
许建潮 ;
连远锋 ;
李昱翠 .
吉林工学院学报(自然科学版), 2002, (03) :12-15
[3]   一种基于SOM的中文Web文档层次聚类方法 [J].
陈福集 ;
杨善林 .
情报学报, 2002, (02) :173-176
[4]   基于关联规则的Web文档聚类算法 [J].
宋擒豹 ;
沈钧毅 .
软件学报, 2002, (03) :417-423
[5]   关于文本特征抽取新方法的研究 [J].
李凡 ;
鲁明羽 ;
陆玉昌 .
清华大学学报(自然科学版), 2001, (07) :98-101
[6]   文本数据的数据挖掘算法 [J].
陈玉泉 ;
朱锡钧 ;
陆汝占 .
上海交通大学学报, 2000, (07) :936-938
[7]   中文文本挖掘的特征导航机制 [J].
林鸿飞 ;
战学刚 ;
姚天顺 .
东北大学学报, 2000, (03) :240-243
[8]   Web文本挖掘技术研究 [J].
王继成 ;
潘金贵 ;
张福炎 .
计算机研究与发展, 2000, (05) :513-520
[9]   Knowledge discovery in texts for constructing decision support systems [J].
Loh, S ;
De Oliveira, JPM ;
Gameiro, MA .
APPLIED INTELLIGENCE, 2003, 18 (03) :357-366
[10]   MedMiner: An Internet text-mining tool for biomedical information, with application to gene expression profiling [J].
Tanabe, L ;
Scherf, U ;
Smith, LH ;
Lee, JK ;
Hunter, L ;
Weinstein, JN .
BIOTECHNIQUES, 1999, 27 (06) :1210-+