共 13 条
一种改进的快速分词算法
被引:54
作者:

陈桂林
论文数: 0 引用数: 0
h-index: 0
机构: 上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海

王永成
论文数: 0 引用数: 0
h-index: 0
机构: 上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:
机构:
[1] 上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海
来源:
关键词:
分词;
Hash;
二分查找;
近邻匹配;
时间复杂度;
D O I:
暂无
中图分类号:
TP301.6 [算法理论];
学科分类号:
081202 ;
摘要:
首先介绍了一种高效的中文电子词表数据结构 ,它支持首字 Hash和标准的二分查找 ,且不限词条长度 ;然后提出了一种改进的快速分词算法 ,在快速查找两字词的基础上 ,利用近邻匹配方法来查找多字词 ,明显提高了分词效率 .理论分析表明 ,该分词算法的时间复杂度为 1.6 6 ,在速度方面 ,优于目前所见的同类算法
引用
收藏
页码:418 / 424
页数:7
相关论文
共 13 条
[1]
一种高效的中文电子词表数据结构
[J].
陈桂林
;
王永成
;
韩客松
;
王刚
.
计算机研究与发展,
2000, (01)
:109-116

陈桂林
论文数: 0 引用数: 0
h-index: 0
机构: 上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海

王永成
论文数: 0 引用数: 0
h-index: 0
机构: 上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:
[2]
基于两字词簇的汉语快速自动分词算法
[J].
郭祥昊
;
钟义信
;
杨丽
.
情报学报,
1998, (05)
:34-39

郭祥昊
论文数: 0 引用数: 0
h-index: 0
机构: 北京邮电大学人工智能实验室

钟义信
论文数: 0 引用数: 0
h-index: 0
机构: 北京邮电大学人工智能实验室

杨丽
论文数: 0 引用数: 0
h-index: 0
机构: 北京邮电大学人工智能实验室
[3]
利用汉字二元语法关系解决汉语自动分词中的交集型歧义
[J].
孙茂松
;
黄昌宁
;
邹嘉彦
;
陆方
;
沈达阳
.
计算机研究与发展 ,
1997, (05)
:14-21

孙茂松
论文数: 0 引用数: 0
h-index: 0
机构: 清华大学计算机科学与技术系

论文数: 引用数:
h-index:
机构:

邹嘉彦
论文数: 0 引用数: 0
h-index: 0
机构: 清华大学计算机科学与技术系

陆方
论文数: 0 引用数: 0
h-index: 0
机构: 清华大学计算机科学与技术系

沈达阳
论文数: 0 引用数: 0
h-index: 0
机构: 清华大学计算机科学与技术系
[4]
一种改进的MM分词方法的算法设计
[J].
骆正清
;
陈增武
;
胡上序
.
中文信息学报,
1996, (03)
:30-36

骆正清
论文数: 0 引用数: 0
h-index: 0
机构: 浙江大学!杭州,浙江大学!杭州,浙江大学!杭州

陈增武
论文数: 0 引用数: 0
h-index: 0
机构: 浙江大学!杭州,浙江大学!杭州,浙江大学!杭州

胡上序
论文数: 0 引用数: 0
h-index: 0
机构: 浙江大学!杭州,浙江大学!杭州,浙江大学!杭州
[6]
基于神经网络的分词方法
[J].
徐秉铮
;
詹剑
;
贺前华
.
中文信息学报,
1993, (02)
:36-44

徐秉铮
论文数: 0 引用数: 0
h-index: 0
机构: 华南理工大学无线电与自控所,华南理工大学无线电与自控所,华南理工大学无线电与自控所

詹剑
论文数: 0 引用数: 0
h-index: 0
机构: 华南理工大学无线电与自控所,华南理工大学无线电与自控所,华南理工大学无线电与自控所

贺前华
论文数: 0 引用数: 0
h-index: 0
机构: 华南理工大学无线电与自控所,华南理工大学无线电与自控所,华南理工大学无线电与自控所
[7]
快速书面汉语自动分词系统及其算法设计
[J].
张国煊
;
王小华
;
周必水
.
计算机研究与发展,
1993, (01)
:61-65

张国煊
论文数: 0 引用数: 0
h-index: 0
机构: 杭州电子工业学院计算机系,杭州电子工业学院计算机系,杭州电子工业学院计算机系,,

王小华
论文数: 0 引用数: 0
h-index: 0
机构: 杭州电子工业学院计算机系,杭州电子工业学院计算机系,杭州电子工业学院计算机系,,

周必水
论文数: 0 引用数: 0
h-index: 0
机构: 杭州电子工业学院计算机系,杭州电子工业学院计算机系,杭州电子工业学院计算机系,,
[8]
多语料库作法之中文姓名辨识
[J].
张俊盛
;
陈舜德
;
郑萦
;
刘显仲
;
柯淑津
.
中文信息学报,
1992, (03)
:7-15

张俊盛
论文数: 0 引用数: 0
h-index: 0
机构: 台湾清华大学资讯系及语言研究所

陈舜德
论文数: 0 引用数: 0
h-index: 0
机构: 台湾清华大学资讯系及语言研究所

郑萦
论文数: 0 引用数: 0
h-index: 0
机构: 台湾清华大学资讯系及语言研究所

刘显仲
论文数: 0 引用数: 0
h-index: 0
机构: 台湾清华大学资讯系及语言研究所

柯淑津
论文数: 0 引用数: 0
h-index: 0
机构: 台湾清华大学资讯系及语言研究所
[10]
基于规则的汉语自动分词系统
[J].
姚天顺
;
张桂平
;
吴映明
;
不详
.
中文信息学报 ,
1990, (01)
:37-43

姚天顺
论文数: 0 引用数: 0
h-index: 0
机构: 东北工学院

张桂平
论文数: 0 引用数: 0
h-index: 0
机构: 东北工学院

吴映明
论文数: 0 引用数: 0
h-index: 0
机构: 东北工学院

不详
论文数: 0 引用数: 0
h-index: 0
机构: 东北工学院