基于本体的Web文本挖掘与信息检索

被引:8
作者
艾伟
孙四明
张峰
机构
[1] 中国航天工程咨询中心
关键词
本体; Web文本挖掘; 向量空间模型; 信息检索;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
针对传统Web文本挖掘技术缺少语义理解能力的不足,提出并实现一种基于本体的Web文本挖掘模型,即利用基于本体概念体系的向量空间模型替代传统的向量空间模型来表示文档,在此基础上进行Web文本挖掘,并给出一种集成语义信息检索的设计。实验结果初步验证了本体模型在Web文本挖掘技术上应用的可行性。
引用
收藏
页码:75 / 77+80 +80
页数:4
相关论文
共 4 条
[1]   一种基于语义内积空间模型的文本聚类算法 [J].
彭京 ;
杨冬青 ;
唐世渭 ;
付艳 ;
蒋汉奎 .
计算机学报, 2007, (08) :1354-1363
[2]   领域本体的概念相似度计算 [J].
陈杰 ;
蒋祖华 .
计算机工程与应用 , 2006, (33) :163-166
[3]   Ontology研究综述 [J].
邓志鸿 ;
唐世渭 ;
张铭 ;
杨冬青 ;
陈捷 .
北京大学学报(自然科学版), 2002, (05) :730-738
[4]   Web文本挖掘技术研究 [J].
王继成 ;
潘金贵 ;
张福炎 .
计算机研究与发展, 2000, (05) :513-520