基于网络蜘蛛的搜索引擎自动发现

被引:1
作者
藕军
任明仑
靳鹏
机构
[1] 合肥工业大学计算机网络研究所
关键词
元搜索引擎; 自动发现; 网络蜘蛛; 元信息;
D O I
10.16652/j.issn.1004-373x.2007.12.044
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
自动发现Web上大量的搜索引擎对于构造大规模元搜索引擎是有益的,提出一种用优化爬行规则的网络蜘蛛自动发现搜索引擎并提取其元信息的方法:通过优化爬行规则的网络蜘蛛爬取页面;利用专门的识别规则从爬取到的页面中识别搜索界面,并提取其相关的元信息。试验结果表明该方法简单有效,自动发现的查准率和查全率分别达到97%和91%。
引用
收藏
页码:127 / 129
页数:3
相关论文
共 4 条
[1]   基于Google的网站优化技术 [J].
杨帆 ;
王秀伟 ;
白振兴 .
现代电子技术, 2006, (19) :149-151
[2]   基于数据挖掘和证据理论的综合评价的研究 [J].
谢武 ;
韩元杰 .
现代电子技术, 2005, (17) :56-58+61
[3]   基于标记树对象抽取技术的Hidden Web获取研究 [J].
宋晖 ;
张岭 ;
叶允明 ;
马范援 .
计算机工程与应用, 2002, (23) :9-12+24
[4]   集成搜索引擎的文本数据库选择 [J].
孟卫一 ;
吴宗寰 .
计算机研究与发展, 2001, (04) :396-404