关键词-分类号关联词表构建

被引:6
作者
杨贺 [1 ,2 ]
杨奕虹 [1 ,2 ]
李宁 [2 ]
机构
[1] 中国科学技术信息研究所
[2] 北京万方数据股份有限公司
基金
国家高技术研究发展计划(863计划);
关键词
关键词-分类号关联词表; 文献加工; 自动标引; 自动分类;
D O I
暂无
中图分类号
G254.1 [分类法];
学科分类号
1205 ; 120501 ;
摘要
在多年海量文献人工标引的数据基础上,采用互信息法(MI)、卡方检验法(Chi-Square)、最大似然估计法(MLE)等概率与数理统计方法计量分析关键词与《中国图书资料分类法》分类号的关联关系,构建适用于科技文献自动标引的关键词-分类号关联词表,并通过实际标引文献数据的封闭与开放测试分析其应用效果。
引用
收藏
页码:107 / 113
页数:7
相关论文
共 9 条
[1]   用于计算机辅助文献标引加工系统的自然语言词表构建 [J].
杨贺 ;
杨奕虹 ;
乔晓东 ;
李宁 ;
朱礼军 .
现代图书情报技术, 2010, (06) :17-24
[2]   潜在语义索引中特征优化技术的研究 [J].
季铎 ;
郑伟 ;
蔡东风 .
中文信息学报, 2009, 23 (02) :69-76
[3]   中文文本分类中的特征选择算法研究 [J].
胡佳妮 ;
徐蔚然 ;
郭军 ;
邓伟洪 .
光通信研究, 2005, (03) :44-46
[4]   中文文本分类中的特征选择研究 [J].
周茜 ;
赵明生 ;
扈旻 .
中文信息学报, 2004, (03) :17-23
[5]   中文文本分类中特征抽取方法的比较研究 [J].
代六玲 ;
黄河燕 ;
陈肇雄 .
中文信息学报, 2004, (01) :26-32
[6]   基于字频向量的中文文本自动分类系统 [J].
王梦云 ;
曹素青 .
情报学报, 2000, (06) :644-649
[7]  
中文信息自动分类用知识库的设计与构建[J]. 侯汉清,薛鹏军. 情报学报. 2003 (06)
[8]   An Evaluation of Statistical Approaches to Text Categorization [J].
Yiming Yang .
Information Retrieval, 1999, 1 (1-2) :69-90
[9]  
中国分类主题词表第二版及其电子版手册 .2 国家图书馆《中国图书馆分类法》编辑委员会编. 北京图书馆出版社 . 2006