基于网络蜘蛛的搜索引擎自动发现

被引：1

作者：

藕军

任明仑

靳鹏

机构：

[1] 合肥工业大学计算机网络研究所

来源：

现代电子技术 | 2007年 / 12期

关键词：

元搜索引擎; 自动发现; 网络蜘蛛; 元信息;

D O I：

10.16652/j.issn.1004-373x.2007.12.044

中图分类号：

TP391.3 [检索机];

学科分类号：

081203 ; 0835 ;

摘要：

自动发现Web上大量的搜索引擎对于构造大规模元搜索引擎是有益的,提出一种用优化爬行规则的网络蜘蛛自动发现搜索引擎并提取其元信息的方法:通过优化爬行规则的网络蜘蛛爬取页面;利用专门的识别规则从爬取到的页面中识别搜索界面,并提取其相关的元信息。试验结果表明该方法简单有效,自动发现的查准率和查全率分别达到97%和91%。

引用

页码：127 / 129

页数：3

共 4 条

[1] 基于Google的网站优化技术 [J].