文本知识发现:基于信息抽取的文本挖掘

被引：31

作者：

周雪忠

吴朝晖

机构：

[1] 浙江大学计算机系,浙江大学计算机系杭州,杭州

来源：

计算机科学 | 2003年 / 01期

关键词：

Text mining; Text data mining; Information extraction; Knowledge discovery in text. Sublanguage;

D O I：

暂无

中图分类号：

TP311.13 [];

学科分类号：

1201 ;

摘要：

<正> 1.引言大家熟知,所谓“数据丰富但知识缺乏“的现状导致了数据挖掘(Data Mining)技术研究的兴起,数据挖掘又称数据库知识发现(Knowledge Discovery in Databases)是从海量的结构化信息中抽取或挖掘隐含信息和知识的重要方法和途径。数据挖掘技术已相当成熟。因为除了结构化的数据之外,在数字化信息中更多地存在大量自由、非结构化或半结构化的文本信息如新闻文章、电子书本、电子图书馆藏、Web页面内容、Email、文档数据库等,显然手工处理需要花费大量的人力物力,并且具有不确定性。所以出现了从文本中发现知

引用

页码：63 / 66

页数：4