汉语词同现网络的小世界效应和无标度特性

被引:39
作者
刘知远
孙茂松
机构
[1] 清华大学计算机科学与技术系清华信息科学与技术国家实验室
关键词
计算机应用; 中文信息处理; 词的同现; 复杂网络; 小世界; 无标度; 核心词典;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
人类语言的某些重要方面可以通过复杂网络来刻画。本文基于不同规模和类型的语料库,建立了汉语词同现网络,并从复杂网络的角度对这些网络进行了系统的实验考察。实验结果表明汉语词同现网络具有复杂网络的两个基本性质:(1)网络的平均最短路径为2.63-2.75,聚合系数远大于相同参数下的随机网络,这揭示了汉语同现网络的小世界效应;(2)网络中词的度大体上呈幂律分布,表明汉语同现网络具有无标度特性。本文还对实验中所得到的汉语核心词典进行了定量分析。
引用
收藏
页码:52 / 58
页数:7
相关论文
共 16 条
[1]   语义网络的结构:我们怎样学习语义知识(英文) [J].
唐璐 ;
张永光 ;
付雪 .
Journal of Southeast University(English Edition), 2006, (03) :413-417
[2]   幂律分布研究简史 [J].
胡海波 ;
王林 .
物理, 2005, (12) :889-896
[3]   汉语词组网的组织结构与无标度特性 [J].
韦洛霞 ;
李勇 ;
康世勇 ;
罗诗裕 .
科学通报, 2005, (15) :1575-1579
[4]   汉字网络的3度分隔与小世界效应 [J].
韦洛霞 ;
李勇 ;
李伟 ;
邵明珠 ;
罗诗裕 .
科学通报, 2004, (24) :2615-2616
[5]   说汉语的失语患者言语表达的初步分析 [J].
施琪嘉 ;
高素荣 ;
刘锡民 ;
蔡转 .
中国康复医学杂志, 2004, (01) :8-11
[6]   言语产生中的词汇通达理论 [J].
张清芳 ;
杨玉芳 .
心理科学进展, 2003, (01) :6-11
[7]  
普通话三千常用词表[M]. 文字改革出版社 , 郑林曦编, 1987
[8]  
语法讲义[M]. 商务印书馆 , 朱德熙[著], 1982
[9]  
汉语语法分析问题[M]. 商务印书馆 , 吕叔湘 著, 1979
[10]   Small world patterns in food webs [J].
Montoya, JM ;
Solé, RV .
JOURNAL OF THEORETICAL BIOLOGY, 2002, 214 (03) :405-412