Zipf定律与汉字字频分布

被引:20
作者
游荣彦
机构
[1] 华南师范大学计算机科学系!广州
关键词
计量语言模型; 汉字字频分布; Zipf定律; 拟合频率;
D O I
暂无
中图分类号
TP391.12 [];
学科分类号
081203 ; 0835 ;
摘要
本文证明了在以Zipf定律描述整个汉字字频分布时 ,不管如何精心挑选参数a和c,一些累计拟合频率都有明显的误差。针对这一现象 ,本文提出了一个解决办法 ,那就是以Zipf定律仅描述汉字字频分布的尾部的方法。
引用
收藏
页码:60 / 65
页数:6
相关论文
共 2 条
[1]   现代汉语计算语言模型中语言单位的频度—频级关系 [J].
关毅 ;
王晓龙 ;
张凯 .
中文信息学报, 1999, (02) :9-16
[2]  
语言和计算机[M]. 中国社会科学出版社 , 《语言和计算机》编辑组编, 1986