网络日志规模分析和用户兴趣挖掘

被引:63
作者
郭岩
白硕
杨志峰
张凯
机构
[1] 中国科学院计算技术研究所软件研究室
[2] 中国科学院计算技术研究所软件研究室 北京
[3] 中国科学院研究生院
[4] 北京
关键词
Web日志挖掘; 日志规模; 兴趣; 用户行为;
D O I
暂无
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
文章围绕网络日志中是否蕴含用户访问Web的规律性特性以及如何利用这些特性,研究了日志规模与用户数、Web文档数以及单位用户访问的Web文档数的关系;通过用户对Web访问动机的分析得出结论:一定时间段的Web访问日志中蕴含了用户的稳定兴趣;利用日志中蕴含的用户稳定兴趣,提出了一个基于用户行为的相关文档检索模型和搜索引擎系统SISI.SISI的实际检索性能与分析检索模型所得结论一致:检索准确率和检索时间主要依赖于用户数,检索返回的记录数主要依赖于文档数.
引用
收藏
页码:1483 / 1496
页数:14
相关论文
共 5 条
[1]   基于网络用户行为的搜索引擎系统SISI [J].
郭岩 .
计算机工程, 2004, (16) :9-11+13
[2]   基于网络用户行为的相关页面挖掘模型 [J].
郭岩 .
微电子学与计算机, 2003, (05) :76-82+109
[3]   Web日志的高效多能挖掘算法 [J].
宋擒豹 ;
沈钧毅 .
计算机研究与发展, 2001, (03) :328-333
[4]  
信息组织与检索[M]. 科学出版社 , 李国辉等编著, 2003
[5]  
个性心理学[M]. 华东师范大学出版社 , 叶奕乾, 1993