文本挖掘研究进展

被引：50

作者：

谌志群

张国煊

机构：

[1] 杭州电子科技大学计算机学院

来源：

模式识别与人工智能 | 2005年 / 18卷 / 01期

基金：

浙江省自然科学基金;

关键词：

文本挖掘; 数据挖掘; 文本知识发现; 自然语言处理; 关联规则; 文本聚类; 趋势分析;

D O I：

暂无

中图分类号：

TP18 [人工智能理论];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

文本挖掘又称为文本数据挖掘或文本知识发现,是指在大规模文本集合中发现隐含的、以前未知的、潜在有用的模式的过程。本文首先介绍了文本挖掘的概念,包括文本挖掘的定义、特点、与其它几个研究领域(数据挖掘、信息检索、信息抽取、计算语言学等)的关系;然后讨论了文本挖掘模型、文本特征抽取与中间表示、文本挖掘的分类与实现技术;最后介绍了几个文本挖掘产品。

引用

页码：65 / 74

页数：10