CN103324749B - 一种基于标准文本地址的空间化解析及纠偏方法 - Google Patents
一种基于标准文本地址的空间化解析及纠偏方法 Download PDFInfo
- Publication number
- CN103324749B CN103324749B CN201310281315.3A CN201310281315A CN103324749B CN 103324749 B CN103324749 B CN 103324749B CN 201310281315 A CN201310281315 A CN 201310281315A CN 103324749 B CN103324749 B CN 103324749B
- Authority
- CN
- China
- Prior art keywords
- address
- parsing
- spatialization
- data
- latitude
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Navigation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明是将标准地址做空间化处理,建立标准地址空间库,采用了对谷歌的地名地址库进行经纬度的解析,并对解析后的数据再进行纠偏处理,赋予文本地址空间信息,可以在地图上直观的表示出客户的分布情况,进而量化分析和科学决策在这个区域内,市场的占有率情况,并实现客户资源的空间管理,和对客户群进行成分分析,为以后的规划选址,开拓市场,有了很好的数据准备和决策依据。
Description
技术领域
本发明涉及文本地址空间化处理技术,特别是一种基于标准文本地址的空间化解析及纠偏方法。
背景技术
2012年,各GIS类业务系统陆续调用平台基础地图,平台也在面临着越来越多的需求挑战。其中标准地址空间库的建设需求在业务系统中尤为突出,资源系统正在对全省非标准地址按照电信行业地址规范进行标准化,但所获得的标准地址均为文本性的地址,无法进行可视化定位,虽然国内已建成全国1:25万等比例尺的地名数据库,但精度较低,暂无基于楼宇建筑的空间地名库的电信业务应用,其次,邮政、快递行业应用中所使用的地名库粒度较粗,一般到区、县、投递站粒度,以文本应用为主,而电信企业业务需精细到户的管理,还有电力、广电等行业目前地名应用也是以文本应用为主,其业务特点和数据模型与电信差别较大,而且目前国内较为成熟的GPS、导航等应用均以道路数据、POI兴趣点数据为主,建筑物数据极少;所以,电信自己急需建设自己的标准地址空间库,以满足电信业务精细化的管理。
发明内容
本发明的目的是提供一种基于标准文本地址的空间化解析及纠偏方法,能在地图上直观的表示出客户的分布情况,能大大提高客户位置的精度。
本发明采用以下方案实现:一种基于标准文本地址的空间化解析及纠偏方法,其特征在于:首先根据地址分级规范标准化地址,以Google地址解析进行地址空间化,采用树型结构进行存储建立的地址空间库;然后进行经纬度解析,并对解析后的数据再进行纠偏处理,赋予文本地址空间信息。
在本发明一实施例中,所述经纬度解析按如下方式:
(1)、将需要空间化的标准地址通过谷歌地名地址进行解析,获得坐标结果写入"X","Y"字段,结果保存为Access2007和Excel2003两种数据格式;
(2)、在原有字段基础上增加[UpdateAddress],[SecondAddress],[Bark]三个字段;
其中,[UpdateAddress]:标准化地址;
[SecondAddress]:定位地址;
[Bark]:特殊记录说明;
(3)、地址定位原则:
a.带有“道路”名称的定位到道路
b.带有“村”名称的定位到xx村;
c.带有“大道”名称的定位到xx大道;
f.带有"小学","中学","卫生院"、"xx局"、"政府"名称的,定位到其POI点;
g.对于以上仍然不能定位的情况,按照地址依次定位到所在乡、镇、县。
在本发明一实施例中,对于所述[Bark]主要有以下几种情况:
已废弃:地址已经废弃;
再丢弃:地址已经丢弃;
再丢弃:地址已经废弃,但是定位到乡\镇\县;
再次标准化:较为重要POI,可以把地址做的更加详细;
再次标准化:较为重要POI,但是定位到乡\镇\县。
在本发明一实施例中,所述纠偏处理是:根据坐标点经纬度信息,确定其所在行政区域和经纬网,运用多元线性回归算法,找到影响坐标偏移的因子以及其权重,结合因子信息与权重信息,获得影响数据偏移的因子以及权重,从而确定解析方案,进行数据反偏移解析。
在本发明一实施例中,所述的影响坐标偏移的因子为8项。
本发明能在地图上直观的表示出客户的分布情况,能大大提高客户位置的精度,进而量化分析和科学决策在这个区域内,市场的占有率情况,并实现客户资源的空间管理,和对客户群进行成分分析,为以后的规划选址,开拓市场,有了很好的数据准备和决策依据。
具体实施方式
本发明根据地址分级规范标准化地址,以Google地址解析进行地址空间化,采用树型结构进行存储建立的地址空间库;以OGC数据服务的形式进行接入应用,包括地址标准化、地址空间化、地址格式存储、地址接入应用;所述地址标准化为客户端应用程序,支持在PC电脑和智能手机上运行,实现客户与所述系统的交互;地址空间库是空间定位型的关系数据库,是将国家基本比例尺地形图上各类地名注记包括楼宇建筑物、居民地、水系、山脉、海洋、岛屿、沙漠等的名称,连同其属性特征、行政区域、所属道路、更新日期、XY坐标、经纬度位置信息等录入计算机建成的图形数据库。
本发明首先根据地址分级规范标准化地址,以Google地址解析进行地址空间化,采用树型结构进行存储建立的地址空间库;然后进行经纬度解析,并对解析后的数据再进行纠偏处理,赋予文本地址空间信息。
具体的,数据先从SRM的数据库读取(例如:三明市数据2900547条),以电信标准地址为根据按照研究的算法分批处理(县为单位)数据,从这些数据中抽取34W(343759)条来定位其经纬度。将这34W条数据利用经纬度解析工具自动解析其地址所对应的经纬度。
本发明中,还可以通过人为的对上述经纬度进行人工验证,该人工验证可以在经纬度存在问题时(比如地址解析出来的经纬度明显的不对、多条地址解析出来的经纬度一样等),所以解析出来的经纬度可以经过人工验证。比如有些地址的原始地址不能在谷歌地图上定位到,所以可能需要变换地址关键字对其再次定位;另或是一些地址需要重新删减地址的一部分才能在谷歌地图上进行定位;或是一些模糊的地址需要反馈给地址录入的单位对其确认。
数据处理有两个重要的步骤和流程,经纬度解析和数据逆偏,经纬度解析的具体说明如下:
1、将需要空间化的标准地址通过谷歌地名地址进行解析,获得坐标结果写入"X","Y"字段,结果保存为Access2007和Excel2003两种数据格式。
2、在原有字段基础上增加
[UpdateAddress],[SecondAddress],[Bark]三个字段。
[UpdateAddress]:标准化地址
[SecondAddress]:定位地址
[Bark]:特殊记录说明
【对于[Bark]主要有以下几种情况:
已废弃:地址已经废弃;
再丢弃:地址已经丢弃;
再丢弃(定位到乡\镇\县):地址已经废弃,但是定位到乡\镇\县;
再次标准化:较为重要POI,可以把地址做的更加详细;
再次标准化(定位到乡\镇\县):较为重要POI,但是定位到乡\镇\县;】
3、地址定位原则:
a.带有“道路”名称的定位到道路
【如果地址包含既“道路”又包含“xx厂或者xx公司”,按照实验结果,定位结果是一样的,且定位“道路”更准确】。
b.带有“村”名称的定位到xx村;
c.带有“大道”名称的定位到xx大道;
d.带有如“版洋”名称的定位到xx版洋;
e.带有如“龙丁坂”名称的定位到xx龙丁坂;
f.带有如"小学","中学","卫生院"、"xx局"、"政府"等名称的,定位到其POI点;
g.对于以上仍然不能定位的情况,按照地址依次定位到所在乡、镇、县。
以此种方式对全省所有的需要空间化的标准地址进行解析,再将解析后的经纬度进行数据逆偏处理。
数据逆偏的方法概述如下:读取加密的经纬度数据之后,根据坐标点经纬度信息,确定其所在行政区域和经纬网,运用多元线性回归算法,找到影响坐标偏移的因子以及其权重,结合因子信息与权重信息,获得影响数据偏移的8项因子以及权重,从而确定解析方案,进行数据反偏移解析,从而得到准确的经纬度信息。数据准确率保证在10米以内。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。
Claims (4)
1.一种基于标准文本地址的空间化解析及纠偏方法,其特征在于:首先根据地址分级规范标准化地址,以Google地址解析进行地址空间化,采用树型结构进行存储建立的地址空间库;然后进行经纬度解析,并对解析后的数据再进行纠偏处理,赋予文本地址空间信息;
所述纠偏处理是:根据坐标点经纬度信息,确定其所在行政区域和经纬网,运用多元线性回归算法,找到影响坐标偏移的因子以及其权重,结合因子信息与权重信息,获得影响数据偏移的因子以及权重,从而确定解析方案,进行数据反偏移解析。
2.根据权利要求1所述的标准文本地址的空间化解析及纠偏方法,其特征在于:所述经纬度解析按如下方式:
(1)、将需要空间化的标准地址通过谷歌地名地址进行解析,获得坐标结果写入"X","Y"字段,结果保存为Access2007和Excel2003两种数据格式;
(2)、在原有字段基础上增加[UpdateAddress],[SecondAddress],[Bark]三个字段;
其中,[UpdateAddress]:标准化地址;
[SecondAddress]:定位地址;
[Bark]:特殊记录说明;
(3)、地址定位原则:
a.带有“道路”名称的定位到道路
b.带有“村”名称的定位到xx村;
c.带有“大道”名称的定位到xx大道;
f.带有"小学","中学","卫生院"、"xx局"、"政府"名称的,定位到其POI点;
g.对于以上仍然不能定位的情况,按照地址依次定位到所在乡、镇、县。
3.根据权利要求2所述的标准文本地址的空间化解析及纠偏方法,其特征在于:对于所述[Bark]主要有以下几种情况:
已废弃:地址已经废弃;
再丢弃:地址已经丢弃;
再丢弃:地址已经废弃,但是定位到乡\镇\县;
再次标准化:较为重要POI,把地址做的更加详细;
再次标准化:较为重要POI,但是定位到乡\镇\县。
4.根据权利要求1所述的标准文本地址的空间化解析及纠偏方法,其特征在于:所述的影响坐标偏移的因子为8项。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310281315.3A CN103324749B (zh) | 2013-07-05 | 2013-07-05 | 一种基于标准文本地址的空间化解析及纠偏方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310281315.3A CN103324749B (zh) | 2013-07-05 | 2013-07-05 | 一种基于标准文本地址的空间化解析及纠偏方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103324749A CN103324749A (zh) | 2013-09-25 |
CN103324749B true CN103324749B (zh) | 2016-06-22 |
Family
ID=49193492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310281315.3A Active CN103324749B (zh) | 2013-07-05 | 2013-07-05 | 一种基于标准文本地址的空间化解析及纠偏方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103324749B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103763122A (zh) * | 2013-12-25 | 2014-04-30 | 北京大唐融合通信技术有限公司 | 一种故障信息的处理方法和服务系统 |
CN104750799B (zh) * | 2015-03-23 | 2018-04-13 | 华南理工大学 | 一种基于地址解析数据的建设用地类型快速识别方法 |
CN106649532B (zh) * | 2016-10-31 | 2020-12-11 | 电子科技大学 | 一种针对地址信息的数据脱敏方法 |
CN110019625B (zh) * | 2017-12-20 | 2021-03-16 | 中国电信股份有限公司 | 文本标准地址空间化方法和装置、计算机可读存储介质 |
CN112100161B (zh) * | 2019-09-17 | 2021-05-28 | 上海寻梦信息技术有限公司 | 数据处理方法及系统、电子设备及存储介质 |
CN111209355B (zh) * | 2019-10-31 | 2023-12-22 | 浙江中测时空科技有限公司 | 企业亩均效益专题地图可视化制图方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102288183A (zh) * | 2011-06-22 | 2011-12-21 | 北京农业信息技术研究中心 | 用于农村事件上报的地址定位系统及方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080065605A1 (en) * | 2006-09-08 | 2008-03-13 | Group 1 Software Inc. | Rich browser-based interface for address standardization and geocoding |
-
2013
- 2013-07-05 CN CN201310281315.3A patent/CN103324749B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102288183A (zh) * | 2011-06-22 | 2011-12-21 | 北京农业信息技术研究中心 | 用于农村事件上报的地址定位系统及方法 |
Non-Patent Citations (1)
Title |
---|
基于规则的中文地址分词与匹配方法;谭侃侃;《中国优秀硕士学位论文全文数据库基础科学辑》;20120615(第6期);第A008-29页 * |
Also Published As
Publication number | Publication date |
---|---|
CN103324749A (zh) | 2013-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11550826B2 (en) | Method and system for generating a geocode trie and facilitating reverse geocode lookups | |
CN103324749B (zh) | 一种基于标准文本地址的空间化解析及纠偏方法 | |
CN109376761B (zh) | 一种地址标识及其经纬度的挖掘方法及装置 | |
US11061985B2 (en) | System and method for linking data records for parcels | |
CN107239531B (zh) | 一种扩展GeoServer发布自定义瓦片WMS服务的实现方法 | |
CN106779417A (zh) | 工程勘察信息数字化采集、管理及综合应用方法 | |
US20060041375A1 (en) | Automated georeferencing of digitized map images | |
CN101988961B (zh) | 地理位置数据采集系统 | |
US20100250599A1 (en) | Method and apparatus for integration of community-provided place data | |
CN102147795A (zh) | 兴趣点检索方法、兴趣点检索装置和导航系统 | |
CN103514235B (zh) | 一种增量码库的建立方法和装置 | |
Davis Jr et al. | Evaluation of the quality of an online geocoding resource in the context of a large Brazilian city | |
CN103500060B (zh) | 电子地图的制作方法、制作装置、显示方法及显示装置 | |
CN104317909A (zh) | 兴趣点数据的校验方法和装置 | |
Karl et al. | Discovering ecologically relevant knowledge from published studies through geosemantic searching | |
Zandbergen et al. | Positional accuracy of TIGER 2000 and 2009 road networks | |
CN105913347A (zh) | 一种面向住房信息采集的房屋编码方法 | |
CN107741982A (zh) | 一种坐标与行政区域匹配系统及方法 | |
CN102682128A (zh) | 一种用于兴趣点信息的排重方法 | |
CN113360789A (zh) | 兴趣点数据处理方法、装置、电子设备及存储介质 | |
CN108731649B (zh) | 2000测绘基准框架统一方法、装置与计算机可读存储介质 | |
Yildiz et al. | Cadastral updating: the case of Turkey | |
Moradi et al. | Exploring five indicators for the quality of OpenStreetMap road networks: A case study of Québec, Canada | |
KR102184048B1 (ko) | Gis 기반 토지 이용 계획 검토 시스템 및 방법 | |
CN108345662A (zh) | 一种考虑用户分布区域差异的签到微博数据加权统计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C53 | Correction of patent for invention or patent application | ||
CB02 | Change of applicant information |
Address after: 350005 Cangshan science and Technology Park, Fujian District, Fuzhou, No. 6, No. 1 Applicant after: China Youke Communication Technology Co., Ltd. Address before: 350005 Cangshan science and Technology Park, Fujian District, Fuzhou, No. 6, No. 1 Applicant before: Fujian Youke Communication Technology Co., Ltd. |
|
COR | Change of bibliographic data |
Free format text: CORRECT: APPLICANT; FROM: FUJIAN YOUKE COMMUNICATION TECHNOLOGY CO., LTD. TO: CHINA YOUKE COMMUNICATION TECHNOLOGY CO., LTD. |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |