轻量级的自学习网页分类方法

被引:2
作者
沙泓州 [1 ,2 ,3 ]
周舟 [2 ,3 ]
刘庆云 [2 ,3 ]
秦鹏 [2 ,3 ]
机构
[1] 北京邮电大学计算机学院
[2] 中国科学院信息工程研究所
[3] 信息内容安全技术国家工程实验室
关键词
URL分类; 黑名单; 访问关系; 恶意网页; 网页评价;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
提出了一种自学习的轻量级网页分类方法 SLW。SLW首次引入了访问关系的概念,使其具有反馈和自学习的特点。SLW从已有的恶意网页集合出发,自动发现可信度低的用户和对应的访问关系,从而进一步利用低可信度用户对其他网页的访问关系来发现未知的恶意网址集合。实验结果表明,在相同数据集上,相比于传统检测方法,SLW方法可以显著提高恶意网页检测效果,大幅降低平均检测时间。
引用
收藏
页码:32 / 39
页数:8
相关论文
共 3 条
[1]   基于社会信任的恶意网页协防机制 [J].
刘昕 ;
贾春福 ;
刘国友 ;
胡志超 ;
王冬 .
通信学报, 2012, 33 (12) :11-18
[2]   Preventing Recommendation Attack in Trust-Based Recommender Systems [J].
张富国 .
Journal of Computer Science & Technology, 2011, 26 (05) :823-828
[3]   HoneyBow:一个基于高交互式蜜罐技术的恶意代码自动捕获器 [J].
诸葛建伟 ;
韩心慧 ;
周勇林 ;
宋程昱 ;
郭晋鹏 ;
邹维 .
通信学报 , 2007, (12) :8-13