Web文本挖掘在互联网信息统计中的研究与设计

被引:5
作者
李颖
阎保平
机构
[1] 中国科学院研究生院,中国科学院研究生院中国科学院计算机网络信息中心北京,中国科学院计算机网络信息中心北京
关键词
互联网; 信息统计; Web挖掘; 文本挖掘; 文本分类; 模式匹配;
D O I
10.19304/j.cnki.issn1000-7180.2005.01.017
中图分类号
TP393.4 [国际互联网];
学科分类号
081201 ; 1201 ;
摘要
互联网的迅猛发展,越来越迫切地需要全面准确对网上信息进行分类及统计,Web挖掘技术的兴起,尤其是该技术中的文本挖掘,使这种统计成为可能。本文研究了互联网信息统计的现状,介绍了Web挖掘技术并分析了Web文本挖掘的关键技术。继而结合文本挖掘技术设计了网站分类系统的模型,同时对其开发步骤进行了说明。最后展望了此技术方案在相关领域的应用前景。
引用
收藏
页码:62 / 65+69 +69
页数:5
相关论文
共 4 条
[1]  
数据挖掘.[M].朱明编著;.中国科学技术大学出版社.2002,
[2]  
Internet信息获取技术的研究.[D].唐飞龙.合肥工业大学.2002, 01
[3]   Web文本挖掘技术 [J].
郭庚麒 .
计算机与网络, 2004, (Z1) :114-116
[4]   数据挖掘技术在Web上的应用及其工具设计 [J].
谢丹夏 ;
李晓东 .
计算机应用, 2001, (02) :42-44