文本挖掘研究进展

被引:50
作者
谌志群
张国煊
机构
[1] 杭州电子科技大学计算机学院
基金
浙江省自然科学基金;
关键词
文本挖掘; 数据挖掘; 文本知识发现; 自然语言处理; 关联规则; 文本聚类; 趋势分析;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
文本挖掘又称为文本数据挖掘或文本知识发现,是指在大规模文本集合中发现隐含的、以前未知的、潜在有用的模式的过程。本文首先介绍了文本挖掘的概念,包括文本挖掘的定义、特点、与其它几个研究领域(数据挖掘、信息检索、信息抽取、计算语言学等)的关系;然后讨论了文本挖掘模型、文本特征抽取与中间表示、文本挖掘的分类与实现技术;最后介绍了几个文本挖掘产品。
引用
收藏
页码:65 / 74
页数:10
相关论文
共 12 条
[11]   Mining text using keyword distributions [J].
Feldman, R ;
Dagan, I ;
Hirsh, H .
JOURNAL OF INTELLIGENT INFORMATION SYSTEMS, 1998, 10 (03) :281-300
[12]  
A new and versatile method for association generation.[J].Amihood Amir;Ronen Feldman;Reuven Kashi.Information Systems.1997, 6