专利文本的可视化及应用

被引:2
作者
陈赣 [1 ]
陆庭辉 [2 ]
文贵华 [2 ]
机构
[1] 广东联合电子收费股份有限公司
[2] 华南理工大学计算机科学与工程学院
关键词
专利文本; 高维数据; 可视化; 流形;
D O I
10.16208/j.issn1000-7024.2009.03.020
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
专利文本集的可视化有利于发现专利之间隐含的关系或聚类结构,进而实现技术趋势预测、技术跟踪、竞争分析等。专利文本向量化后形成的文本向量是典型的高维数据,采用经典的降维算法难以得到所期望的可视化效果。认为专利文本向量化后形成的高维数据实际是低维流形,需要采用有效的流形学习来实现降维,通过对比两种最新的流形学习方法,结果表明局部线性嵌入方法最适合于专利文本的可视化,将其应用到基于专利的创造支持系统取得了较好的可视化效果。
引用
收藏
页码:759 / 762
页数:4
相关论文
共 5 条
[1]   邻域参数动态变化的局部线性嵌入 [J].
文贵华 ;
江丽君 ;
文军 .
软件学报, 2008, (07) :1666-1673
[2]   基于领域知识的专利自动分类 [J].
郭炜强 ;
戴天 ;
文贵华 .
计算机工程, 2005, (23) :52-54
[3]   基于贝叶斯模型的专利分类 [J].
郭炜强 ;
文军 ;
文贵华 .
计算机工程与设计, 2005, (08) :1986-1987+1996
[4]   Using locally estimated geodesic distance to optimize neighborhood graph for isometric data embedding [J].
Wen, Guihua ;
Jiang, Lijun ;
Wen, Jun .
PATTERN RECOGNITION, 2008, 41 (07) :2226-2236
[5]  
Intellectual assets management: from patents to knowledge[J] . Caterina Camus,Riccardo Brancaleon.World Patent Information . 2003 (2)