一种中文自然语言表达交通信息的跨阶分词算法

被引:3
作者
陆锋 [1 ]
刘焕焕 [1 ,2 ]
陈传彬 [1 ,3 ]
机构
[1] 中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室
[2] 中国矿业大学(北京)资源与安全工程学院
[3] 福州大学福建省空间信息工程研究中心
关键词
交通信息; 中文自然语言处理; 分词; 跨阶法;
D O I
10.13203/j.whugis2009.08.023
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
在分析中文分词算法和交通信息自然语言表达特点基础上,提出了一种自然语言表达交通信息的跨阶匹配分词算法,以适应动态出行信息服务对数字形式结构化实时交通信息的迫切需求。该算法充分考虑了交通信息自然语言描述词库记录长度特点,通过设置对应的中文分词阶数,将传统中文分词的字符串指针1阶跨越方法改进为依词库性质变化的多阶跨越方法,对可能成词的中文字符串进行整体处理,极大地提高了自然语言表达交通信息的实时分词与理解效率。通过与改进MM(maximum matching)算法的实验比较,本方法在理解成功率和容错性相同的情况下,效率比MM分词算法提高了10倍以上。
引用
收藏
页码:943 / 947
页数:5
相关论文
共 11 条
[1]   移动GIS中语音与自然语言的应用模式探讨 [J].
龙毅 ;
张翎 ;
胡雷地 ;
闾国年 .
测绘科学技术学报, 2008, (01) :8-12
[2]   中文分词十年回顾 [J].
黄昌宁 ;
赵海 .
中文信息学报, 2007, (03) :8-19
[3]   GIS中文查询系统的词典设计与分词研究 [J].
徐爱萍 ;
边馥苓 .
武汉大学学报(信息科学版), 2006, (04) :348-351
[4]   基于空间语义角色的自然语言空间概念提取 [J].
乐小虬 ;
杨崇俊 ;
于文洋 .
武汉大学学报(信息科学版), 2005, (12) :1100-1103
[5]   地理信息系统中自然语言查询的分词处理与应用 [J].
吴静 ;
蔡砥 ;
王铮 .
地球信息科学, 2005, (03) :67-71
[6]   基于自然语言理解的文本标图系统设计与实现 [J].
胡斌 ;
汤伟 ;
刘晓明 .
解放军理工大学学报(自然科学版), 2005, (02) :132-136
[7]   汉语自动分词的研究现状与困难 [J].
张春霞 ;
郝天永 .
系统仿真学报, 2005, (01) :138-143+147
[8]   汉语自动分词研究展望 [J].
文庭孝 ;
邱均平 ;
侯经川 .
现代图书情报技术, 2004, (07) :6-10
[9]   空间信息自然语言查询接口的研究与应用 [J].
马林兵 ;
龚健雅 .
武汉大学学报(信息科学版), 2003, (03) :301-305
[10]  
汉语自动分词与内容分析法研究[J]. 邱均平,文庭孝,周黎明.情报学报. 2005 (03)