基于规则的中文地址要素解析方法

被引:71
作者
张雪英
闾国年
李伯秋
陈文君
机构
[1] 南京师范大学虚拟地理环境教育部重点实验室
关键词
中文地址; 语义解析; 地址编码; 地址表示;
D O I
暂无
中图分类号
P208 [测绘数据库与信息系统];
学科分类号
070503 ; 081603 ; 0818 ; 081802 ;
摘要
在日常生产与生活中,地址是最常见的使用自然语言描述地理位置的参考系统之一。地址地理编码技术被认为是大量业务数据的G IS实现可视化定位和空间分析的桥梁,在房地产管理、土地管理、城市规划、公安、邮政、税收、电讯和公共卫生等领域中具有十分重要的应用前景。地址要素解析是中文地址编码的核心技术之一。它是将自然语言描述的地址拆分为在某一限定区域内,可以指定某一地理范围的地址要素的过程。实际上,这个过程可以被看作是一种特定的中文分词任务。由于语言和文化的原因,中文地址描述采用连续的字符串,而且普遍存在不规范现象。目前,采用的地址解析方法在较大程度上受限于词典的更新维护和规则的不完备问题。本文以大规模地名词典和地址数据库为数据源,通过系统分析地址要素的构词特征和句法模式,构建了各类地址要素的特征字库,提出了中文地址的数字表达方法,设计了RBAI中文地址要素解析算法,开发了相应的原型系统。实验结果准确率达到92%以上,处理效率达2800条/秒。这表明该方法符合大规模数据处理的应用需求,具有重要的推广应用价值。
引用
收藏
页码:9 / 16
页数:8
相关论文
共 19 条
[1]   地理编码系统设计与实现 [J].
郭会 ;
宋关福 ;
马柳青 ;
王少华 .
计算机工程, 2009, 35 (01) :250-252
[2]   GIS数据库中地址自动匹配方法研究 [J].
胡青 ;
徐建华 ;
王志海 .
测绘与空间地理信息, 2008, 31 (06) :50-52
[3]   地理编码系统中地址匹配引擎的设计与实现 [J].
张林曼 ;
吴升 .
测绘信息与工程, 2008, (06) :12-14
[4]   城市地址编码发展历史及现状分析 [J].
张鹤 ;
孔令彦 ;
陈倬 ;
孙乐兵 .
测绘通报, 2008, (07) :58-60
[5]   城市地理空间字典——地理编码 [J].
高昭良 .
城市勘测, 2008, (02) :20-22
[6]   地理信息系统地址自动匹配 [J].
王秀明 .
闽西职业技术学院学报, 2007, (02) :75-77
[7]   地理信息系统地址编码技术标准化研究 [J].
江洲 ;
李小林 ;
刘碧松 .
世界标准化与质量管理, 2007, (05) :22-25
[8]   上海市基础地理要素编码标准编制研究 [J].
江绵康 .
地理与地理信息科学, 2006, (02) :1-4
[9]   我国城市地理信息标准化述评 [J].
蒋景曈 ;
刘若梅 .
工程勘察, 2006, (03) :50-54
[10]   城市地理编码系统应用与研究 [J].
陈细谦 ;
迟忠先 ;
金妮 .
计算机工程, 2004, (23) :50-52