学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
Zipf定律与汉字字频分布
被引:20
作者
:
论文数:
引用数:
h-index:
机构:
游荣彦
机构
:
[1]
华南师范大学计算机科学系!广州
来源
:
中文信息学报
|
2000年
/ 03期
关键词
:
计量语言模型;
汉字字频分布;
Zipf定律;
拟合频率;
D O I
:
暂无
中图分类号
:
TP391.12 [];
学科分类号
:
081203 ;
0835 ;
摘要
:
本文证明了在以Zipf定律描述整个汉字字频分布时 ,不管如何精心挑选参数a和c,一些累计拟合频率都有明显的误差。针对这一现象 ,本文提出了一个解决办法 ,那就是以Zipf定律仅描述汉字字频分布的尾部的方法。
引用
收藏
页码:60 / 65
页数:6
相关论文
共 2 条
[1]
现代汉语计算语言模型中语言单位的频度—频级关系
[J].
论文数:
引用数:
h-index:
机构:
关毅
;
王晓龙
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系自然语言理解研究室
王晓龙
;
论文数:
引用数:
h-index:
机构:
张凯
.
中文信息学报,
1999,
(02)
:9
-16
[2]
语言和计算机[M]. 中国社会科学出版社 , 《语言和计算机》编辑组编, 1986
←
1
→
共 2 条
[1]
现代汉语计算语言模型中语言单位的频度—频级关系
[J].
论文数:
引用数:
h-index:
机构:
关毅
;
王晓龙
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系自然语言理解研究室
王晓龙
;
论文数:
引用数:
h-index:
机构:
张凯
.
中文信息学报,
1999,
(02)
:9
-16
[2]
语言和计算机[M]. 中国社会科学出版社 , 《语言和计算机》编辑组编, 1986
←
1
→