共 3 条
轻量级的自学习网页分类方法
被引:2
作者:
沙泓州
[1
,2
,3
]
周舟
[2
,3
]
刘庆云
[2
,3
]
秦鹏
[2
,3
]
机构:
[1] 北京邮电大学计算机学院
[2] 中国科学院信息工程研究所
[3] 信息内容安全技术国家工程实验室
来源:
关键词:
URL分类;
黑名单;
访问关系;
恶意网页;
网页评价;
D O I:
暂无
中图分类号:
TP393.092 [];
学科分类号:
080402 ;
摘要:
提出了一种自学习的轻量级网页分类方法 SLW。SLW首次引入了访问关系的概念,使其具有反馈和自学习的特点。SLW从已有的恶意网页集合出发,自动发现可信度低的用户和对应的访问关系,从而进一步利用低可信度用户对其他网页的访问关系来发现未知的恶意网址集合。实验结果表明,在相同数据集上,相比于传统检测方法,SLW方法可以显著提高恶意网页检测效果,大幅降低平均检测时间。
引用
收藏
页码:32 / 39
页数:8
相关论文