主题爬虫的设计与实现

被引:42
作者
汪涛
樊孝忠
机构
[1] 北京理工大学计算机科学工程系,北京理工大学计算机科学工程系北京中国人民解放军炮兵学院三系,安徽合肥,北京
关键词
搜索引擎; 主题爬虫; 主题相关度; 链接分析; 信息采集;
D O I
暂无
中图分类号
TP393.08 [];
学科分类号
0839 ; 1402 ;
摘要
文章以主题相关度为核心研究了设计主题爬虫的相关技术 ,通过实验给出了具体实现。实验结果充分论证了其可行性与实用性 ,为进行主题搜索引擎设计和主题信息采集奠定了良好的基础。
引用
收藏
页码:270 / 272
页数:3
相关论文
共 4 条
[1]   Google的PageRank技术剖析 [J].
曹军 .
情报杂志 , 2002, (10) :15-18
[2]  
搜索引擎与Web挖掘进展.[M].李晓明;李星主编;.高等教育出版社.2003,
[3]  
语言计算与基于内容的文本处理.[M].孙茂松;陈群秀主编;.清华大学出版社.2003,
[4]  
网络机器人Java编程指南.[M].(美)JeffHeaton著;童兆丰等译;.电子工业出版社.2002,