基于页面布局相似性的钓鱼网页发现方法

被引:8
作者
邹学强 [1 ,2 ]
张鹏 [1 ]
黄彩云 [1 ]
陈志鹏 [1 ]
孙永 [1 ]
刘庆云 [1 ]
机构
[1] 中国科学院信息工程研究所
[2] 国家计算机网络应急技术处理协调中心
关键词
页面布局; 钓鱼网页; 标签序列树;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
针对钓鱼网页与真实网页布局结构相似的特点,提出了基于页面布局相似性的钓鱼网页发现方法,该方法首先抽取出网页中带链接属性的标签作为特征,然后基于该特征提取网页标签序列分支来标识网页;接着通过网页标签序列树对齐算法将网页标签序列树的对齐转换成网页标签序列分支的对齐,使二维的树结构转换成一维的字符串结构,最后通过生物信息学BLOSUM62编码的替换矩阵快速计算对齐分值,从而提高钓鱼网页的检测效果,仿真实验表明该方法可行,并具有较高的准确率和召回率。
引用
收藏
页码:116 / 124
页数:9
相关论文
共 9 条
[1]  
Prophiler:a fast filter for the large-scale detection of malicious Web pages. Canali D,Cova M,Vigna G,et al. International Conference on World Wide Web (WWW) . 2011
[2]  
Finding the linchpins of the dark Web:a study on topologically dedicated hosts on malicious web infrastructures. LI Z,ALRWAIS S,XIE Y,et al. IEEE Symposium on Security and Privacy (SP) . 2013
[3]  
Binspect: Holistic analysis and detection of malicious web pages. Eshete, Birhanu,Adolfo Villafiorita,Komminist Weldemariam. Security and Privacy in Communication Networks . 2013
[4]  
PhishNet:Predictive Blacklisting to Detect Phishing Attacks. P. Prakash,M. Kumar,R. R. Kompella,M. Gupta. INFOCOM . 2010
[5]  
Automatic detection of phishing target from phishing webpage. Liu G,Qiu B,Liu W Y. 2010 20th International Conference on Pattern Recognition . 2010
[6]  
URoulette Home Page http://www.uroulette.com . 2007
[7]  
An empirical analysis of phishing blacklists. SHENG S,WARDMAN B,WARNER G,et al. The 6th Conference in Email and Anti-Spam (CEAS) . 2009
[8]  
PhishTank. OpenDNS. http://www.phishtank.com . 2014
[9]  
BLOSUM62 substitution matrix. http://www.uky.edu/Classes/BIO/520/BIO520WWW/blosum62.htm .