Web文本挖掘在互联网信息统计中的研究与设计

被引：5

作者：

李颖

阎保平

机构：

[1] 中国科学院研究生院,中国科学院研究生院中国科学院计算机网络信息中心北京,中国科学院计算机网络信息中心北京

来源：

微电子学与计算机 | 2005年 / 01期

关键词：

互联网; 信息统计; Web挖掘; 文本挖掘; 文本分类; 模式匹配;

D O I：

10.19304/j.cnki.issn1000-7180.2005.01.017

中图分类号：

TP393.4 [国际互联网];

学科分类号：

081201 ; 1201 ;

摘要：

互联网的迅猛发展,越来越迫切地需要全面准确对网上信息进行分类及统计,Web挖掘技术的兴起,尤其是该技术中的文本挖掘,使这种统计成为可能。本文研究了互联网信息统计的现状,介绍了Web挖掘技术并分析了Web文本挖掘的关键技术。继而结合文本挖掘技术设计了网站分类系统的模型,同时对其开发步骤进行了说明。最后展望了此技术方案在相关领域的应用前景。

引用

页码：62 / 65+69 +69

页数：5