CN105808715B - 一种位置一张图的构建方法 - Google Patents
一种位置一张图的构建方法 Download PDFInfo
- Publication number
- CN105808715B CN105808715B CN201610127003.0A CN201610127003A CN105808715B CN 105808715 B CN105808715 B CN 105808715B CN 201610127003 A CN201610127003 A CN 201610127003A CN 105808715 B CN105808715 B CN 105808715B
- Authority
- CN
- China
- Prior art keywords
- spatial
- model
- location
- relationship
- self
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000012545 processing Methods 0.000 claims abstract description 17
- 238000007621 cluster analysis Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000003064 k means clustering Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims 4
- 238000006243 chemical reaction Methods 0.000 abstract description 3
- 235000019580 granularity Nutrition 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B29/00—Maps; Plans; Charts; Diagrams, e.g. route diagram
- G09B29/003—Maps
- G09B29/005—Map projections or methods associated specifically therewith
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Remote Sensing (AREA)
- Mathematical Physics (AREA)
- Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种位置一张图的构建方法,包括了泛在位置信息和位置大数据中常用的位置描述方式,通过分别构建标准地址、经纬度、邮政编码、电话号码、自我参考位置、它物参考位置等位置类型空间范围图层,确定了各种位置描述方式表达空间范围的尺度、粒度的能力;通过建立统一的空间基准参考与精度要求,实现数据的转换处理与重用;通过建立统一的自我参考位置模型组、它物参考位置模型组,将松散化的、模糊化的自然语言描述位置的方式进行规则化处理,可以实现位置的语义关联与汇集。因此,实施本发明的技术方案在电子地图对泛在位置信息与位置大数据处理领域是一种突破和创新。
Description
技术领域
本发明属于电子地图数据处理与位置服务数据整合技术领域,尤其涉及一种位置一张图的构建方法。
背景技术
随着电子地图数据处理技术及快速制图技术的发展,电子地图在人们日常生活中发挥越来越重要的作用。与此同时,当今世界正进入泛在信息社会和大数据时代,传感网、物联网和智能移动终端技术的飞速发展,人们可以方便地通过泛在网络获取与位置相关的泛在信息和大数据,这就对传统的电子地图提出了更高的要求,如何能够在传统电子地图的基础上,对获取的泛在位置信息和位置大数据进行处理、关联、汇集、分析,继而提供更加智能化、个性化的位置服务成为研究的热点。
全息位置地图是以泛在位置为基础,通过对泛在网络获取泛在位置信息进行处理、汇集、分析等技术,经制图可全面反映位置本身及其与位置相关的各种特征、事件或事物的位置服务电子地图平台,是电子地图家族中适应当代位置服务业发展需求而发展起来的一种新型地图产品。其中,泛在位置主要包括标准地址、经纬度、邮政编码、电话号码、自我参考位置、它物参考位置等直接的或逻辑上能够表达一定空间范围(地理位置)的位置类型。
不同类型的泛在位置,空间基准各异,表达空间范围的尺度、粒度各不相同,即使对于同一类型,数据的精度与描述方式也各不相同。因此,如何解决泛在位置信息和位置大数据中存在的上述问题,在统一的时空地理坐标系下实现泛在位置信息的动态分析、位置的语义关联与汇集、模式提取与情景推理,继而为公众位置服务、政府部门决策和应急预警等提供多层次、多粒度的全方位信息感知、态势预测的综合服务,提升泛在位置信息服务的标准化和智能化水平,成为是全息位置地图平台中的关键问题。
发明内容
为了解决上述问题,本发明提出了一种位置一张图的构建方法,通过分别对标准地址、经纬度、邮政编码、电话号码、自我参考位置、它物参考位置等类型的位置进行建模与空间范围的网格化,确定每种位置类型表达空间范围的尺度与粒度,进而可以实现不同泛在位置类型的动态关联、汇集与转换。
本发明所采用的技术方案是:一种位置一张图的构建方法,其特征在于,包括以下步骤:
步骤1:对标准地址进行结构化的预处理,在满足标准地址模型的基础上,以门牌号为最小的位置单元,获得标准地址的空间范围划分图层;
步骤2:对经纬度进行空间基准与精度的转换,使其转化为统一的空间参考系,并且具有相同的精度,获得经纬度的空间范围划分图层;
步骤3:对邮政编码按照行政区划以区一级为最小位置单元进行空间范围划分,获得邮政编码的空间范围划分图层;
步骤4:对电话号码按照具有相同前缀可分为同一类簇的原则进行分层处理,获得不同类簇,再对每个类簇进行聚类分析,得到子类簇,以子类簇为最小的位置单元,获得电话号码的空间范围划分图层;
步骤5:从位置描述中提取自我参考位置的自我位置与关系,将其转化为自我参考位置模型组中的一种,再根据自我中心点的位置获得自我参考位置的空间范围划分图层;
步骤6:从位置描述中提取它物参考位置的参考物形状、位置与关系,将其转化为它物参考位置模型组中的一种,之后根据参考物的形状、位置与关系获得它物参考位置的空间范围划分图层。
作为优选,步骤1中所述标准地址模型为:XX省XX市XX区XX路(街)XX号。
作为优选,步骤2中所述统一的空间参考系,为国际地心坐标系WGS84,精度为保留小数点后6位。
作为优选,步骤4中所述进行分层处理及聚类分析获得子类簇的过程,具体实现包括以下子步骤:
步骤4.1:设定Jaro-Winkler算法中相同前缀调节参数L=1和阈值T,阈值T代表用户认为两电话号码是相似的临界值,大于该值表示两电话号码是类似的,小于等于该值表示两电话号码是非类似的;
步骤4.2:使用Jaro-Winkler算法计算电话号码的相似度SJ,并与阈值T进行比较,当SJ≥T时,执行步骤4.3;否则不做任何处理;
步骤4.3:对上一步骤分层处理后得到的不同类簇,根据其经纬度进行K-means聚类,得到子类簇;
步骤4.4:遍历子类簇,求得子类簇中各号段的概率分布及最大概率Pmax,并与阈值PT进行比较;
步骤4.5:当Pmax≥PT时,表示该号段所在的子类簇满足纯度需求,执行步骤4.6;当Pmax<PT时,设置聚类中心点加1,重复步骤4.3;
步骤4.6:判断此时相同前缀调节参数L,若L<4,L递增1后重复步骤4.2;若L≥4,结束程序。
作为优选,步骤5中所述自我参考位置模型组,根据与自我中心点关系的不同可分为:自我中心点&空间关系模型、自我中心点&拓扑关系模型、自我中心点&空间关系&拓扑关系模型。
作为优选,步骤6中所述它物参考位置模型组,根据参考物形状的不同可分为:点状参考物&空间关系模型、点状参考物&拓扑关系模型、点状参考物&空间关系&拓扑关系模型、线状参考物&空间关系模型、线状参考物&拓扑关系模型、线状参考物&空间关系&拓扑关系模型、面状参考物&空间关系模型、面状参考物&拓扑关系模型、面状参考物&空间关系&拓扑关系模型。
本发明的技术方案比较全面地包括了泛在位置信息和位置大数据中常用的位置描述方式,通过分别构建标准地址、经纬度、邮政编码、电话号码、自我参考位置、它物参考位置等位置类型空间范围图层,确定了各种位置描述方式表达空间范围的尺度、粒度的能力;通过建立统一的空间基准参考与精度要求,实现数据的转换处理与重用;通过建立统一的自我参考位置模型组、它物参考位置模型组,将松散化的、模糊化的自然语言描述位置的方式进行规则化处理,可以实现位置的语义关联与汇集。因此,实施本发明的技术方案在电子地图对泛在位置信息与位置大数据处理领域是一种突破和创新。实践表明,本方法不仅较全面的包括了各种泛在位置信息类型,并且能够解决不同类型之间空间基准、表达范围、数据精度等方面的差异,方便地构建出满足全息位置电子地图要求的位置一张图。
附图说明
图1为本发明实施例的系统流程示意图;
图2为本发明实施例的获得电话号码子类簇的流程图;
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1,本发明提供的一种位置一张图的构建方法,包括以下步骤:
步骤1:对标准地址进行结构化的预处理,在满足标准地址模型的基础上,以门牌号为最小的位置单元,获得标准地址的空间范围划分图层;
由于标准地址的层次结构以及逻辑完整性并不一致,所以需要首先对标准地址按照标准地址模型(XX省XX市XX区XX路(街)XX号)进行排列、补充、删除等预处理,对出现逻辑错误的地址编码需要人工纠正,然后获得由最小的位置单元(门牌号包括的空间范围)组成的空间范围划分图层。
步骤2:对经纬度进行空间基准与精度的转换,使其转化为统一的空间参考系,并且具有相同的精度,获得经纬度的空间范围划分图层;
由于不同来源的经纬度数据的空间基准各异,比如,有的使用WGS84,而有的使用CGCS2000;此外,精度与表达方式也存在着一定的差异,比如点(121.768292,38.323780)与点(121.768292999,38.323780432),有的使用度分秒表示而有的使用度表示,因此,需要进行空间基准与精度的转换,使其在相同的表述方式下具有相同的空间基准与数据精度,达不到精度位数的后面补0,本实施例采用国际地心坐标系WGS84作为统一的空间参考系,精度为保留小数点后6位。
步骤3:对邮政编码按照行政区划以区一级为最小位置单元进行空间范围划分,获得邮政编码的空间范围划分图层;
步骤4:对电话号码按照具有相同前缀可分为同一类簇的原则进行分层处理,获得不同类簇,再对每个类簇进行聚类分析,得到子类簇,以子类簇为最小的位置单元,获得电话号码的空间范围划分图层;
请见图2,对电话号码进行分层处理、聚类分析,获得子类簇的过程,其具体实现包括以下子步骤:
步骤4.1:设定Jaro-Winkler算法中相同前缀调节参数L=1和阈值T,阈值T代表用户认为两电话号码是相似的临界值,大于该值表示两电话号码是类似的,小于等于该值表示两电话号码是非类似的。
步骤4.2:使用Jaro-Winkler算法计算电话号码的相似度SJ,并与阈值T进行比较,当SJ≥T时,执行步骤4.3;否则不做任何处理。
步骤4.3:对上一步骤分层处理后得到的不同类簇,根据其经纬度进行K-means聚类,得到子类簇。
步骤4.4:遍历子类簇,求得子类簇中各号段的概率分布及最大概率Pmax,并与阈值PT进行比较。
步骤4.5:当Pmax≥PT时,表示该号段所在的子类簇满足纯度需求,执行步骤4.6;当Pmax<PT时,设置聚类中心点加1,重复步骤4.3。
步骤4.6:判断此时相同前缀调节参数L,若L<4,L递增1后重复步骤4.2;若L≥4,结束程序。
需要注意的是:子类簇与子类簇之间相同前缀的长度不一定都是4.
步骤5:从位置描述中提取自我参考位置的自我位置与关系,将其转化为自我参考位置模型组中的一种,再根据自我中心点的位置获得自我参考位置的空间范围划分图层;其中自我参考位置模型组,根据与自我中心点关系的不同可分为:自我中心点&空间关系模型、自我中心点&拓扑关系模型、自我中心点&空间关系&拓扑关系模型。
针对泛在的位置信息,一种重要的描述方式是类似于人们使用自然语言进行表达位置,例如,在我的东边500米处,可以使用现有的技术,将其提取为自我参考位置类型,然后转化为自我参考位置模型组中的“自我中心点&空间关系&拓扑关系”的模型,然后根据自我位置及关系进行空间范围图层的划分。
步骤6:从位置描述中提取它物参考位置的参考物形状、位置与关系,将其转化为它物参考位置模型组中的一种,之后根据参考物的形状、位置与关系获得它物参考位置的空间范围划分图层;其中它物参考位置模型组,根据参考物形状的不同可分为:点状参考物&空间关系模型、点状参考物&拓扑关系模型、点状参考物&空间关系&拓扑关系模型、线状参考物&空间关系模型、线状参考物&拓扑关系模型、线状参考物&空间关系&拓扑关系模型、面状参考物&空间关系模型、面状参考物&拓扑关系模型、面状参考物&空间关系&拓扑关系模型。
另一种类似于人们常用自然语言进行表达位置的模型可以提取为它物参考位置类型,例如本实施例的:在武汉市珞喻路中段,可以使用现有的技术,将其提取为它物参考位置类型,然后转化为它物参考位置模型组中的“线状参考物&拓扑关系”的模型,然后根据它物位置作为最小位置单元,结合关系进行本图层空间范围的划分。
本实施例通过对标准地址、经纬度、邮政编码、自我参考位置、它物参考位置进行模型(组)的建立,进行相应图层的空间划分;通过提出针对电话号码进行分层、分类的技术算法,获得电话号码的最小位置单元并且进行了该图层的空间划分;确定了各种位置描述方式表达空间范围的尺度、粒度的能力。本实施例在解决泛在位置信息和位置大数据中存在的空间基准各异、表达空间范围的尺度与粒度各不相同、难以实现位置的语义关联与汇集等电子地图对泛在位置信息与位置大数据处理领域是一种突破和创新。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
Claims (5)
1.一种位置一张图的构建方法,其特征在于,包括以下步骤:
步骤1:对标准地址进行结构化的预处理,在满足标准地址模型的基础上,以门牌号为最小的位置单元,获得标准地址的空间范围划分图层;
步骤2:对经纬度进行空间基准与精度的转换,使其转化为统一的空间参考系,并且具有相同的精度,获得经纬度的空间范围划分图层;
步骤3:对邮政编码按照行政区划以区一级为最小位置单元进行空间范围划分,获得邮政编码的空间范围划分图层;
步骤4:对电话号码按照具有相同前缀可分为同一类簇的原则进行分层处理,获得不同类簇,再对每个类簇进行聚类分析,得到子类簇,以子类簇为最小的位置单元,获得电话号码的空间范围划分图层;
所述进行分层处理及聚类分析得到子类簇的过程,具体实现包括以下子步骤:
步骤4.1:设定Jaro-Winkler算法中相同前缀调节参数L=1和阈值T,阈值T代表用户认为两电话号码是相似的临界值,大于该值表示两电话号码是类似的,小于等于该值表示两电话号码是非类似的;
步骤4.2:使用Jaro-Winkler算法计算电话号码的相似度SJ,并与阈值T进行比较,当SJ≥T时,执行步骤4.3;否则不做任何处理;
步骤4.3:对上一步骤分层处理后得到的不同类簇,根据其经纬度进行K-means聚类,得到子类簇;
步骤4.4:遍历子类簇,求得子类簇中各号段的概率分布及最大概率Pmax,并与阈值PT进行比较;
步骤4.5:当Pmax≥PT时,表示该号段所在的子类簇满足纯度需求,执行步骤4.6;当Pmax<PT时,设置聚类中心点加1,重复步骤4.3;
步骤4.6:判断此时相同前缀调节参数L,若L<4,L递增1后重复步骤4.2;若L≥4,结束程序;
步骤5:从位置描述中提取自我参考位置的自我位置与关系,将其转化为自我参考位置模型组中的一种,再根据自我中心点的位置获得自我参考位置的空间范围划分图层;
步骤6:从位置描述中提取它物参考位置的参考物形状、位置与关系,将其转化为它物参考位置模型组中的一种,之后根据参考物的形状、位置与关系获得它物参考位置的空间范围划分图层。
2.根据权利要求1所述的位置一张图的构建方法,其特征在于:步骤1中所述标准地址模型为:XX省XX市XX区XX路(街)XX号。
3.根据权利要求1所述的位置一张图的构建方法,其特征在于:步骤2中所述统一的空间参考系,为国际地心坐标系WGS84,精度为保留小数点后6位。
4.根据权利要求1所述的位置一张图的构建方法,其特征在于:步骤5中所述自我参考位置模型组,根据与自我中心点关系的不同可分为:自我中心点&空间关系模型、自我中心点&拓扑关系模型、自我中心点&空间关系&拓扑关系模型。
5.根据权利要求1所述的位置一张图的构建方法,其特征在于:步骤6中所述它物参考位置模型组,根据参考物形状的不同可分为:点状参考物&空间关系模型、点状参考物&拓扑关系模型、点状参考物&空间关系&拓扑关系模型、线状参考物&空间关系模型、线状参考物&拓扑关系模型、线状参考物&空间关系&拓扑关系模型、面状参考物&空间关系模型、面状参考物&拓扑关系模型、面状参考物&空间关系&拓扑关系模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610127003.0A CN105808715B (zh) | 2016-03-07 | 2016-03-07 | 一种位置一张图的构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610127003.0A CN105808715B (zh) | 2016-03-07 | 2016-03-07 | 一种位置一张图的构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105808715A CN105808715A (zh) | 2016-07-27 |
CN105808715B true CN105808715B (zh) | 2017-02-22 |
Family
ID=56466809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610127003.0A Expired - Fee Related CN105808715B (zh) | 2016-03-07 | 2016-03-07 | 一种位置一张图的构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105808715B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107564401A (zh) * | 2017-10-25 | 2018-01-09 | 安徽建工集团有限公司 | 项目地图的实时展现方法 |
CN109635063A (zh) * | 2018-12-06 | 2019-04-16 | 拉扎斯网络科技(上海)有限公司 | 地址库的信息处理方法、装置、电子设备和存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2620770A1 (en) * | 2005-08-30 | 2007-03-08 | Google Inc. | Local search |
CN102567492B (zh) * | 2011-12-22 | 2013-10-30 | 哈尔滨工程大学 | 一种海陆矢量地图数据集成与融合的方法 |
CN104346467B (zh) * | 2014-11-14 | 2017-12-22 | 北京百度网讯科技有限公司 | 地理信息校验方法、相关装置及相应的数据库 |
CN105069118B (zh) * | 2015-08-11 | 2018-04-03 | 北京思特奇信息技术股份有限公司 | 一种基于gis配置的应用场景管理方法及系统 |
-
2016
- 2016-03-07 CN CN201610127003.0A patent/CN105808715B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN105808715A (zh) | 2016-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103136371B (zh) | 多源空间数据的剖分标识生成方法以及数据检索方法 | |
Compton et al. | Geotagging one hundred million twitter accounts with total variation minimization | |
CN106649656B (zh) | 一种面向数据库的时空轨迹大数据存储方法 | |
US10034141B2 (en) | Systems and methods to identify home addresses of mobile devices | |
US20200008039A1 (en) | Normalizing insufficient signals based on additional information | |
CN108446293A (zh) | 一种基于城市多源异构数据构建城市画像的方法 | |
CN110264709A (zh) | 基于图卷积网络的道路的交通流量的预测方法 | |
CN115774861B (zh) | 一种自然资源多源异构数据汇聚融合服务系统 | |
CN105243128A (zh) | 一种基于签到数据的用户行为轨迹聚类方法 | |
WO2016095749A1 (zh) | 电子地图中查询空间对象和建立空间索引的方法及装置 | |
WO2022068745A1 (zh) | 数据处理方法及设备 | |
CN103714185A (zh) | 主题事件更新方法库及城市多源时空信息并行更新方法 | |
CN102306169A (zh) | 数字矢量海、陆图融合方法和系统 | |
CN104361025B (zh) | 一种多源空间数据融合与集成的方法 | |
CN102081764A (zh) | 一种基于uldb的海洋环境监测数据管理系统 | |
CN106326923B (zh) | 一种顾及位置重复和密度峰值点的签到位置数据聚类方法 | |
CN104166695A (zh) | 一种面向遥感数据内容的剖分、查询及动态显示方法 | |
CN104182475B (zh) | 一种基于掩码技术和剖分编码的位置信息快速检索方法 | |
CN104615734B (zh) | 一种社区管理服务大数据处理系统及其处理方法 | |
CN116522272A (zh) | 一种基于城市信息单元的多源时空数据透明融合方法 | |
US10324948B1 (en) | Normalizing ingested signals | |
CN105808715B (zh) | 一种位置一张图的构建方法 | |
Sun et al. | Deep convolutional autoencoder for urban land use classification using mobile device data | |
KR101646926B1 (ko) | 멀티 모달리티 데이터 복원을 위한 심층 개념망 구축 방법 및 그 시스템 | |
CN112287503B (zh) | 用于交通需求预测的动态空间网络构建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170222 Termination date: 20210307 |
|
CF01 | Termination of patent right due to non-payment of annual fee |