一个简单的Web日志挖掘系统

被引:30
作者
杨怡玲
管旭东
陆丽娜
尤晋元
机构
[1] 上海交通大学计算机科学与工程系!上海,上海交通大学计算机科学与工程系!上海,西安交通大学计算机科学与工程系!西安,上海交通大学计算机科学与工程系!上海
关键词
数据挖掘; Web日志挖掘; 序列模式识别; 最大向前路径;
D O I
10.16183/j.cnki.jsjtu.2000.07.020
中图分类号
TP393 [计算机网络];
学科分类号
081201 ; 1201 ;
摘要
在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序列模式识别过程和算法 ,包括最大向前路径的识别和频繁遍历路径的发现 ,并给出了实验结果
引用
收藏
页码:932 / 935
页数:4
相关论文
共 1 条
[1]  
Data Preparation for Mining World Wide Web Browsing Patterns[J] . Robert Cooley,Bamshad Mobasher,Jaideep Srivastava.Knowledge and Information Systems . 1999 (1)