地理信息系统中自然语言查询的分词处理与应用

被引:5
作者
吴静
蔡砥
王铮
机构
[1] 华东师范大学地理信息科学教育部重点实验室
[2] 华东师范大学地理信息科学教育部重点实验室 上海
[3] 上海
[4] 中国科学院科技政策与管理科学研究所
[5] 北京
关键词
地理信息系统; 自然语言分词; 首字扩词; 长词优先;
D O I
暂无
中图分类号
P208 [测绘数据库与信息系统];
学科分类号
070503 ; 081603 ; 0818 ; 081802 ;
摘要
随着地理信息系统应用的不断发展,本文提出了在地理信息系统中对基于受限自然语言的查询语句进行分词处理的方法——首字扩词分词法。该分词方法在汲取正向最大匹配分词方法的核心思想--长词优先原则。为了缩小匹配范围,提高匹配效率,该方法首先根据查询自然语言的首字对词汇库的记录进行筛选,得到以该首字开头的词汇库子集;然后再按照长词优先原则把原查询语句与词汇库子集进行匹配,切分查询语句。通过比较,该方法比正向最大匹配方法具有较小的时间复杂度。同时,采用DELPHI编程语言在计算机上得到了实现。
引用
收藏
页码:67 / 71
页数:5
相关论文
共 5 条
[1]   地理信息查询语言发展趋势 [J].
李满春 ;
李延满 ;
陈刚 .
计算机工程与应用, 2002, (06) :70-73
[2]   一种改进的MM分词算法 [J].
郭辉 ;
苏中义 ;
王文 ;
崔骏 .
微型电脑应用, 2002, (01) :13-15+2
[3]   汉语自动分词研究综述 [J].
骆正清 ;
陈增武 ;
王泽兵 ;
胡上序 .
浙江大学学报(自然科学版), 1997, (03) :31-37
[4]   汉语分词研究漫谈 [J].
董振东 .
语言文字应用, 1997, (01)
[5]   中文信息处理中的分词问题 [J].
黄昌宁 .
语言文字应用, 1997, (01)