关联数据发布流程与关键问题研究——以科技文献、科学数据发布为例

被引:62
作者
沈志宏 [1 ]
刘筱敏 [2 ]
郭学兵 [3 ]
张晓林 [2 ]
黎建辉 [1 ]
机构
[1] 中国科学院计算机网络信息中心
[2] 中国科学院国家科学图书馆
[3] 中国科学院地理科学与资源研究所
关键词
关联数据; 关联开放数据; 数据发布; 科技文献; 科学数据; D2R Server;
D O I
10.13530/j.cnki.jlis.2013.02.010
中图分类号
G253 [藏书建设和藏书组织];
学科分类号
1205 ; 120501 ;
摘要
本文结合中国科学引文数据库和中国生态系统研究网络通量数据的关联数据发布,以关联数据的发布技术框架为研究对象,采取实例阐释的方法,提出了关联数据发布过程中可参考的标准化流程,并详细分析了其中的关键问题。研究表明,关联数据发布流程可以分解成数据建模、实体命名、实体RDF化、实体关联化、实体发布、开放查询六个关键步骤,发布过程中需要考虑到多语种问题、值词表的发布、RDF词表的发布等关键问题。关于利用D2R Server发布数据,本文建议:不要采用空白节点;尽量做好关系型数据库的前期设计;指定非文本属性的数据类型;适当进行实体表的拆分与合并。图5。表3。参考文献31。
引用
收藏
页码:53 / 62
页数:10
相关论文
共 2 条
[1]  
A survey of current approaches for mapping of relational databases to RDF. Sahoo S,Halb W,Hellmann S,et al. W3C RDB2RDF Incubator Report . 2009
[2]  
AKSW/Sparqlify:Overview. https://github.com/AKSW/Sparqlify . 2012