中文网页标引源主题表达能力的调查统计

被引:25
作者
丁璇
侯汉清
章成志
机构
[1] 南京农业大学信息管理系,南京农业大学信息管理系,南京农业大学信息管理系南京,,南京,,南京,
关键词
汉语; 网页; 主题标引; 加权; 自动标引; 调查;
D O I
暂无
中图分类号
G353.2 [情报编译报道];
学科分类号
1205 ;
摘要
通过对随机采集的300篇中文经济类网页进行人工自由标引、人工打分、词频统计,并进行统计数据的分析,得出网页内容主题与网页题名、文章标题等12个标引源的关系,分析中文网页的不同部位的主题表达能力,并为之设计加权标引时的适当权值,以便为自动标引及人工智能搜索引擎的研制提供数据。
引用
收藏
页码:70 / 72+91 +91
页数:4
相关论文
共 3 条
[1]   统计分析法自动标引的改进 [J].
赵云志 .
情报学报, 2000, (04) :333-337
[2]  
主题法导论.[M].侯汉清;马张华主编;张涵等编著;.北京大学出版社.1991,
[3]  
基于知识库的中文网络检索工具——经济信息智能搜索引擎研究.[D].薛鹏军.南京农业大学.2001, 01