CN114513550A - 一种地理位置信息的处理方法、装置及电子设备 - Google Patents
一种地理位置信息的处理方法、装置及电子设备 Download PDFInfo
- Publication number
- CN114513550A CN114513550A CN202111653374.XA CN202111653374A CN114513550A CN 114513550 A CN114513550 A CN 114513550A CN 202111653374 A CN202111653374 A CN 202111653374A CN 114513550 A CN114513550 A CN 114513550A
- Authority
- CN
- China
- Prior art keywords
- standard
- information
- position information
- location information
- original
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000012545 processing Methods 0.000 title claims abstract description 35
- 238000004590 computer program Methods 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 9
- 230000009193 crawling Effects 0.000 claims description 8
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 230000007547 defect Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 8
- 238000010606 normalization Methods 0.000 description 6
- 238000003672 processing method Methods 0.000 description 5
- 238000004140 cleaning Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L61/00—Network arrangements, protocols or services for addressing or naming
- H04L61/09—Mapping addresses
- H04L61/10—Mapping addresses of different types
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/021—Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/025—Services making use of location information using location based information parameters
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例提供了一种地理位置信息的处理方法、装置及电子设备,涉及地址解析技术领域。本申请中,基于预设的标准位置信息数据集,对原始位置信息进行位置标签匹配,从而获得至少一个标准位置标签,进而将至少一个标准位置标签对应的标准位置信息,作为目标地理实体的目标位置信息。采用本申请,根据预设的标准位置信息数据集,获取相应的至少一个标准位置标签,避免了传统方式中,用户终端发送的定位信息通常是非标准化的,导致在获取地理坐标信息过程中,进行定位信息的语义识别时错误率高的技术缺陷,提高了地理位置信息获取的准确性。
Description
技术领域
本申请涉及地址解析技术领域,尤其涉及一种地理位置信息的处理方法、装置及电子设备。
背景技术
地理位置信息是社会活动中连接各种信息,形成在空间和时间上连续分布的综合信息的基础;因此,地理位置信息的获取俨然成为解决众多业务需求的重要一环;进一步地,随着涉及地理位置信息的业务需求的飞速增长,出现了各式各样的地理位置信息获取方法。
例如,在日常生活中,为了实现对地理位置信息的获取,需要根据定位系统获取用户终端发送的定位信息,再通过访问在线地图应用程序接口(Application ProgrammingInterface,API)的方式,根据定位信息获取用户终端当前的地理坐标信息,并最终根据地理坐标信息及预设的地理位置-地理坐标的对应关系,获取用户终端当前的地理位置信息。
然而,采用上述方式的地理位置信息获取方法,根据定位信息获取用户终端当前的地理坐标信息,会因用户终端发送的定位信息通常是非标准化的,导致在获取地理坐标信息过程中,进行定位信息的语义识别时错误率高。
因此,采用上述方式,降低了地理位置信息获取的准确性。
发明内容
本申请提供一种地理位置信息的处理方法、装置及电子设备,用以提高地理位置信息获取的准确性。
第一方面,本申请实施例提供了一种地理位置信息的处理方法,所述方法包括:
获取目标地理实体的原始位置信息;其中,原始位置信息包括:至少一个原始位置标签。
基于预设的标准位置信息数据集,对原始位置信息进行位置标签匹配,获得至少一个标准位置标签;其中,标准位置信息数据集包括:至少一个标准位置信息,每个标准位置信息包括:至少一个标准位置标签。
确定至少一个标准位置标签对应的标准位置信息,并将标准位置信息作为目标地理实体的目标位置信息。
第二方面,本申请实施例还提供了一种地理位置信息的处理装置,所述装置包括:
获取模块,用于获取目标地理实体的原始位置信息;其中,原始位置信息包括:至少一个原始位置标签。
选取模块,用于基于预设的标准位置信息数据集,对原始位置信息进行位置标签匹配,获得至少一个标准位置标签;其中,标准位置信息数据集包括:至少一个标准位置信息,每个标准位置信息包括:至少一个标准位置标签。
处理模块,用于确定至少一个标准位置标签对应的标准位置信息,并将标准位置信息作为目标地理实体的目标位置信息。
一种可选的实施例中,在获取目标地理实体的原始位置信息时,所述获取模块具体用于:
获取目标地理实体的标识信息。
基于所标识信息,从预设的位置信息集合中,确定与标识信息相匹配的第一位置信息以及第二位置信息;其中,第一位置信息是通过网格搜索获得的;第二位置信息是通过爬取位置信息数据库获得的。
对第一位置信息和第二位置信息进行汇总,获得目标地理实体的原始位置信息。
一种可选的实施例中,在基于预设的标准位置信息数据集,对原始位置信息进行位置标签匹配,获得至少一个标准位置标签时,所述选取模块具体用于:
获取原始位置信息中的各个原始位置标签。
针对各个原始位置标签,分别执行以下操作:
获取一个原始位置标签的语义特征值。
基于语义特征值,从标准位置数据集中,选取出满足预设语义相似度条件的标准位置标签。
一种可选的实施例中,在基于预设的标准位置信息数据集,对原始位置信息进行位置标签匹配,获得至少一个标准位置标签的过程中,所述选取模块还用于:
获取各个原始位置标签各自对应的区域划分等级。
若获得的各个原始区域划分等级之间存在遗漏,则查询标准位置数据集,确定至少一个遗漏的区域划分等级。
基于各个原始位置标签,从标准位置数据集中,获得至少一个遗漏的区域划分等级各自对应的标准位置标签。
一种可选的实施例中,在确定至少一个标准位置标签对应的标准位置信息时,所述处理模块具体用于:
获取至少一个标准位置标签各自对应的区域划分等级。
按照各区域划分等级,对至少一个标准位置标签进行排序,获得标准位置信息。
一种可选的实施例中,在确定至少一个标准位置标签对应的标准位置信息,并将标准位置信息作为目标地理实体的目标位置信息之后,所述处理模块还用于:
确定对应目标位置信息的经纬度信息。
将经纬度信息作为目标地理实体的目标经纬度信息。
第三方面,提供一种电子设备,包括:处理器、存储器;所述存储器,存储计算机指令;所述处理器,用于读取所述计算机指令,执行如第一方面所述的地理位置信息的处理方法。
第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如第一方面所述的地理位置信息的处理方法。
第五方面,提供一种计算机程序产品,所述计算机程序产品在被计算机调用时,使得所述计算机执行如第一方面所述的地理位置信息的处理方法。
本申请实施例中,基于预设的标准位置信息数据集,对原始位置信息进行位置标签匹配,从而获得至少一个标准位置标签,进而将至少一个标准位置标签对应的标准位置信息,作为目标地理实体的目标位置信息。采用这种方式,根据预设的标准位置信息数据集,获取相应的至少一个标准位置标签,避免了传统方式中,用户终端发送的定位信息通常是非标准化的,导致在获取地理坐标信息过程中,进行定位信息的语义识别时错误率高的技术缺陷。因此,采用本申请的地理位置信息的处理方法,提高了地理位置信息获取的准确性。
附图说明
图1示例性示出了本申请实施例所适用的一种地理位置信息的处理系统;
图2示例性示出了本申请实施例提供的一种获取目标地理实体的目标位置信息的方法流程示意图;
图3示例性示出了本申请实施例提供的一种获取目标地理实体的原始位置信息的逻辑示意图;
图4示例性示出了本申请实施例提供的一种网格搜索方法的逻辑示意图;
图5示例性示出了本申请实施例提供的一种爬取位置信息数据库方法的逻辑示意图;
图6示例性示出了本申请实施例提供的一种选取标准位置标签的逻辑判断图;
图7示例性示出了本申请实施例提供的一种构建标准位置信息数据库的方法流程示意图;
图8示例性示出了本申请实施例提供的一种基于图2的逻辑示意图;
图9示例性示出了本申请实施例提供的一种地理位置信息的处理装置的结构示意图;
图10示例性示出了本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为了提高地理位置信息获取的准确性,本申请实施例中,基于预设的标准位置信息数据集,对原始位置信息进行位置标签匹配,从而获得至少一个标准位置标签,进而将至少一个标准位置标签对应的标准位置信息,作为目标地理实体的目标位置信息。
为了更好地理解本申请实施例,下面首先对本申请实施例中涉及的技术术语进行说明。
(1)兴趣点(Point of Interest,POI):是指在地图上任何非地理意义的有意义的点位,每个POI包含四方面信息:名称、类别、地址、经纬度。例如,“J大学X校区”的POI为:A大学C校区、教育学校-大学、S省C市Q区R大街H号、(125.283196°E,43.829919°N)。
(2)网格搜索:是指将城市的最西南端和最东北端作为一个大矩形的两个顶点,用这个大矩形框粗略地划分出城市的范围,再通过规定小网格的边长大小,将大的矩形区域分成很多个小网格;接着,通过地图提供商矩形区域检索服务,将不同标签(例如:金融,美食等)作为搜索关键字,对网格内部所有类型商家进行检索。
(3)位置信息数据库:是指各大中介网站各个城市房产信息,具体可包括:小区地址、小区名以及经纬度信息等。
需要说明的是,上述技术术语命名方式仅为一种示例,本申请实施例对上述技术术语的命名方式不做限制。
下面将结合本发明实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本申请的描述中“多个”理解为“至少两个”。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。A与B连接,可以表示:A与B直接连接和A与B通过C连接这两种情况。另外,在本申请的描述中,“第一”、“第二”等词汇,仅用于区分描述的目的,而不能理解为指示或暗示相对重要性,也不能理解为指示或暗示顺序。
图1示例性示出了本申请实施例所适用的系统架构图,如图1所示,该系统架构包括:采集模块101、标准化模块102以及匹配模块103。其中,采集模块101将获取到的目标地理实体的原始位置信息发送至标准化模块102,标准化模块102将根据原始位置信息得到的各个标准位置标签发送至匹配模块103。需要说明的是,采集模块101与标准化模块102,以及标准化模块102与匹配模块103之间可通过无线通信方式或有线通信方式进行信息交互。
下面首先简要对上述地理位置信息的处理系统中的各组成模块的功能进行说明。
采集模块101,用于获取目标地理实体的原始位置信息,其中,原始位置信息包括:至少一个原始位置标签。
标准化模块102,用于根据标准位置信息数据集,对原始位置信息进行位置标签匹配,获得至少一个标准位置标签,其中,标准位置信息数据集包括:至少一个标准位置信息,每个标准位置信息包括:至少一个标准位置标签。
匹配模块103,用于确定至少一个标准位置标签对应的标准位置信息,并将标准位置信息作为目标地理实体的目标位置信息。
进一步地,基于上述系统架构,针对目标地理实体的原始位置信息,获得相应的目标位置信息,参阅图2所示,获取目标地理实体的目标位置信息,具体步骤如下:
S201:获取目标地理实体的原始位置信息。
具体的,参阅图3所示,在执行步骤S201时,服务器中的采集模块获取目标地理实体的标识信息,再根据标识信息,从预设的位置信息集合中,确定与标识信息相匹配的第一位置信息和第二位置信息,并最终对第一位置信息和第二位置信息进行汇总,获得目标地理实体的原始位置信息。其中,第一位置信息是通过网格搜索获得的;第二位置信息是通过爬取位置信息数据库获得的。
示例性的,服务器根据目标地理实体的标识信息,以及标识信息与位置信息之间的对应关系,从预设的位置信息集合中,选取出通过网格搜索的方法,从多家地图服务商提供的矩形范围POI点检索接口,获取各个城市原始地址以及经纬度信息;以及选取出通过爬取各大中介网站各个城市房产信息,获取小区地址、小区名以及经纬度信息。
例如:参阅图4所示,将城市的最西南端和最东北端,作为一个大矩形的两个顶点,用这个大矩形框粗略地划分出城市的范围,再通过规定小网格的边长大小,将大的矩形区域分成很多个小网格,接着,通过地图提供商矩形区域检索服务,将不同标签(例如:金融,美食等)作为搜索关键字,进行网格内部所有类型商家检索,获取名称,地址,经纬度,商家类型,行政区划等内容,判断返回地址的行政区划是否在当前城市,若不是当前城市,则删除。
又例如:参阅图5所示,,先按照特定城市的区来进行区分,找到该区的小区数量,如果小区数量大于50页能显示的内容(>=1500)则再找到下级行政单位进行爬取,最终在房屋中介综合页面上获取小区的名称以及ID,从而利用ID进入小区的主页面,获取小区的经纬度信息和地址,并将其存储进文件当中。
进一步地,服务器根据正则规则,将采集模块获取到目标地理实体的POI点原始地址以及小区原始地址(第一位置信息与第二位置信息)进行汇总,进而得到目标地理实体对应的,市、区/县、镇/街道、乡/村/队/屯、路/道、号/弄/里、名称、类型的形式的原始位置信息。
S202:基于预设的标准位置信息数据集,对原始位置信息进行位置标签匹配,获得至少一个标准位置标签。
具体的,参阅图6所示,在执行步骤S202时,具体步骤如下:
S601:获取各个原始位置标签各自对应的语义特征值。
S602:获取各个标准位置标签各自对应的语义特征值。
S603:判断是否满足预设语义相似度条件,若是,则转入S604;若否,则转入S605。
S604:选取相应的标准位置标签。
S605:保留相应的标准位置标签。
示例性的,假定标准化模块根据一个原始位置标签的语义特征值,以及标准位置数据库中的各个标准位置标签的语义特征值,确定存在5个与该原始位置标签的语义特征相似度大于95%的标准位置标签,则对5个标准位置标签按照语义特征相似度从大到小进行排序,从而选取具有最大语义特征相似度的标准位置标签,作为该原始位置标签对应的标准位置标签。
需要说明的是,包含各个标准位置信息的预设的标准位置信息数据库,可通过构建清洗地址库来对原始地址进行标准化,如图7所示,构建标准位置信息数据库,具体步骤如下:
S701:获取各个候选地理实体各自对应的POI点原始地址,以及爬取各大中介网站各个城市房产信息中各个候选地理实体各自对应的原始地址。
该步骤中,服务器通过网格搜索的方法从多家地图服务商提供的矩形范围POI点检索接口获取各个城市原始地址以及经纬度信息;通过爬取各大中介网站各个城市房产信息,获取小区地址、小区名以及经纬度信息。
S702:正则规则标准化采集的原始地址。
该步骤中,服务器通过正则规则将地址采集模块获取的POI点原始地址以及小区原始地址标准化成市、区/县、镇/街道、乡/村/队/屯、路/道、号/弄/里、名称、类型的形式。
示例性的,服务器可对于各个候选地理实体的POI点原始地址,判断地址是否有市关键字,若存在,将市以及之前的内容截取下来,作为市名称;依此类推,标准化区以及镇两级行政单位;对于村和路两级单位,判断村和路出现的先后顺序,匹配和截取先出现的行政单位。将剩余部分汉字数字转换为阿拉伯数字作为号,以市、区、镇、村、路、号、POI名称,类型、纬度、经度为列,构建标准POI库;对于中介网站采集的原始地址,除了采用上述POI点原始地址的相关操作,还需保留小区名称字段,从而以市、区、镇、村、路、号、小区名、纬度、经度为列构建标准小区库。
S703:利用标准化地址,建立清洗地址库。
该步骤中,市库、区库、镇库、村库均从中国最新行政区划中对应行政单位去重得到。由于中国行政区划单位没有到路一级,因此,选取标准化后的外部地址(POI和小区地址)路一级进行去重,得到路库。选取房产中介网站获取的小区名与POI类型为房地产的名称合并去重,得到小区库。
示例性的,将xx与xx市两个名称放到市库;建立区库的步骤是:从标准地址库中读出区列,去重,并演化出xx与xxx县,并按照xx区、xx县、xx的顺序排列,放到区库;建立镇库的步骤是:从标准地址库中读取镇列,去重,并按照名称从大到小的顺序排列,放入镇库。建立村、路库的步骤同镇库步骤。建立小区库的步骤是:从标准小区库中取出小区名与标准POI库中类型为房地产的POI名称合并去重,并按照名称(区域划分等级)从大到小的顺序排列,放入小区库。
S704:标准化内部原始地址。
该步骤中,原始地址可能存在错别字情况,因此将原始地址与错别字库进行比对,并把比对上含有错别字的词组替换成正确字的词组。错别字纠错后,内部地址首先匹配清洗地址库中市库,若匹配上市库的关键字,则内部地址标准化后地址的市一级行政单位为该市;并去除匹配位置之前的所有字符,剩下字符接着匹配区库关键字。以此类推,依次匹配镇库、村库、路库、小区库。
具体的,错别字纠错后,让原始地址与市库进行匹配,匹配上的字段是否含有市关键字,若不含有,则加上市关键字写入市列,同时截取匹配之前的字符串。剩余字符串匹配区库,匹配上的字段是否含有区/县关键字,若不含有,加上区/县关键字写入区/县列,同时截取匹配之前的字符串。剩余字符串匹配镇库写入镇列,同时截取匹配之前的字符串。利用正则规则判断剩余字符串中路名在前还是村名在前,按谁在前先截取谁的原则截取村名和路名写入村列和路列。将剩余字符串中号/弄/组/幢之前的文字数字转换为阿拉伯数字作为号写入号列。最后拿剩余字符串匹配小区名,写入小区列。
一种优选的实现方式中,服务器中的标准化模块可获取各个原始位置标签各自对应的区域划分等级,若获得的各个原始区域划分等级之间存在遗漏,则查询标准位置数据集,确定至少一个遗漏的区域划分等级,接着,根据各个原始位置标签,从标准位置数据集中,获得至少一个遗漏的区域划分等级各自对应的标准位置标签。
例如,服务器在判定原始区域划分等级之间存在跳跃时,即,可能漏填中间某一行政单位,因此,需用缺失处的下一级行政单位与中国行政区划数据库比对,并将比对上的行政单位上一级区划名称填入缺失处。比如,原始位置信息对应的区域划分等级只有第1级和第3级,则可判定原始位置信息存在一个遗漏的区域划分等级2,从而用行政单位缺失处的下一级行政单位与行政区划库比对,并将比对上的行政单位上一级区划名称填入缺失处。
S203:确定至少一个标准位置标签对应的标准位置信息,并将标准位置信息作为目标地理实体的目标位置信息。
具体的,在执行步骤S203时,服务器在获得至少一个标准位置标签之后,服务器中的匹配模块获取至少一个标准位置标签各自对应的区域划分等级,按照各区域划分等级,对至少一个标准位置标签进行排序,获得标准位置信息。
例如,服务器获得标准位置标签:SH市、PDX区以及JH路之后,可获得相应的区域划分等级依次为:第一等级、第二等级以及第三等级,其中,区域划分等级按照行政规划等级从大到小可分为:第一等级、第二等级以及第三等级;接着,根据上述各个区域划分等级,从大到小对各个标准位置标签进行排序,排序结果为:SH市、PDXX区、JH路;最终,可根据排序结果确定标准位置信息为:SH市PDX区JH路。
进一步地,服务器中的匹配模块可确定对应目标位置信息的经纬度信息,并将经纬度信息作为目标地理实体的目标经纬度信息。
示例性的,本申请实施例中,服务器采用多重Key:Value结构存放用于比对的经纬度信息。例如:{SH市:{PDX区:{JH路:{547:[XXX.XX°E,XX.XX°N]}}}}。建立这样的非结构化数据库,必须建立匹配市库、匹配区库、匹配村库(区、村两列)、匹配路库(区、路两列)、匹配地址库(市、区、路\村、号、纬度、经度)、匹配小区库(小区名、纬度、经度)。建立匹配库的步骤基本相同,均从之前建立的标准POI库与标准小区库中根据要选择的列去重,删除行政单位缺失或经纬度缺失的记录,写入对应的匹配地址库中。
特别指出,匹配地址库是由市、区、路、号、纬度、经度标准路库与市、区、村、号、纬度、经度标准村库合并而来。
对于匹配模块,主要实施步骤如下:
1、比对数据库初始化和赋值。比对数据库初始化具体步骤为:利用建立好的匹配市库首先建立{市:{}}的字典;接着,根据匹配区库,建立{市:{区:{}}}字典;依此类推,最终建立{xx市:{xx区:{xx路:{xx号:[纬度,经度]}}}}这样的字典。比对数据库赋值步骤是:根据之前建立的匹配地址库的提供的索引:市-区-村/路-号,找到要赋值的value,最终给value赋值[经度,纬度]类型的数组值。
2、内外部地址匹配。内外部地址匹配具体步骤为:判断内部标准地址中小区名是否在小区匹配库中,若在,精确匹配,直接取小区匹配库中该小区地址经纬度作为客户地址经纬度;若否,继续下一步骤;判断内部标准地址中市是否在比对数据库中,若否,无法匹配;若是,继续下一步骤。判断内部标准地址中区是否在比对数据库中,若否,跳过区,直接匹配路或村;若是,进行下一步骤;判断内部标准地址中路是否在比对数据库中,若否,判断内部标准地址中村是否在比对数据库中;若是,进行下一步骤;判断内部标准地址中号是否在比对数据库中,若否,判断内部标准地址中号是否为空;若是,精确匹配,从字典中取出市、区、路、号对应的经纬度作为匹配经纬度。其中,下一步骤为模糊匹配。
基于上述的方法步骤,如图8所示,服务器基于预设的标准位置数据集中的各个标准位置标签,对原始位置信息中的各个原始位置标签进行位置标签匹配,从而将获得的相应标准位置标签对应的标准位置信息,作为目标地理实体的目标位置信息。
本申请实施例中,基于预设的标准位置信息数据集,对原始位置信息进行位置标签匹配,从而获得至少一个标准位置标签,进而将至少一个标准位置标签对应的标准位置信息,作为目标地理实体的目标位置信息。采用这种方式,根据预设的标准位置信息数据集,获取相应的至少一个标准位置标签,避免了传统方式中,用户终端发送的定位信息通常是非标准化的,导致在获取地理坐标信息过程中,进行定位信息的语义识别时错误率高的技术缺陷。因此,采用本申请的地理位置信息的处理方法,提高了地理位置信息获取的准确性。
基于相同的技术构思,本申请实施例还提供了一种地理位置信息的处理装置,该地理位置信息的处理装置可以实现本申请实施例的上述方法流程。如图9所示,该地理位置信息的处理装置包括:获取模块901、选取模块902、以及处理模块903,其中:
获取模块901,用于获取目标地理实体的原始位置信息;其中,原始位置信息包括:至少一个原始位置标签。
选取模块902,用于基于预设的标准位置信息数据集,对原始位置信息进行位置标签匹配,获得至少一个标准位置标签;其中,标准位置信息数据集包括:至少一个标准位置信息,每个标准位置信息包括:至少一个标准位置标签。
处理模块903,用于确定至少一个标准位置标签对应的标准位置信息,并将标准位置信息作为目标地理实体的目标位置信息。
一种可选的实施例中,在获取目标地理实体的原始位置信息时,所述获取模块901具体用于:
获取目标地理实体的标识信息。
基于所标识信息,从预设的位置信息集合中,确定与标识信息相匹配的第一位置信息以及第二位置信息;其中,第一位置信息是通过网格搜索获得的;第二位置信息是通过爬取位置信息数据库获得的。
对第一位置信息和第二位置信息进行汇总,获得目标地理实体的原始位置信息。
一种可选的实施例中,在基于预设的标准位置信息数据集,对原始位置信息进行位置标签匹配,获得至少一个标准位置标签时,所述选取模块902具体用于:
获取原始位置信息中的各个原始位置标签。
针对各个原始位置标签,分别执行以下操作:
获取一个原始位置标签的语义特征值。
基于语义特征值,从标准位置数据集中,选取出满足预设语义相似度条件的标准位置标签。
一种可选的实施例中,在基于预设的标准位置信息数据集,对原始位置信息进行位置标签匹配,获得至少一个标准位置标签的过程中,所述选取模块902还用于:
获取各个原始位置标签各自对应的区域划分等级。
若获得的各个原始区域划分等级之间存在遗漏,则查询标准位置数据集,确定至少一个遗漏的区域划分等级。
基于各个原始位置标签,从标准位置数据集中,获得至少一个遗漏的区域划分等级各自对应的标准位置标签。
一种可选的实施例中,在确定至少一个标准位置标签对应的标准位置信息时,所述处理模块903具体用于:
获取至少一个标准位置标签各自对应的区域划分等级。
按照各区域划分等级,对至少一个标准位置标签进行排序,获得标准位置信息。
一种可选的实施例中,在确定至少一个标准位置标签对应的标准位置信息,并将标准位置信息作为目标地理实体的目标位置信息之后,所述处理模块903还用于:
确定对应目标位置信息的经纬度信息。
将经纬度信息作为目标地理实体的目标经纬度信息。
基于相同的技术构思,本申请实施例还提供了一种电子设备,该电子设备可实现本申请上述实施例提供的方法流程。在一种实施例中,该电子设备可以是服务器,也可以是终端设备或其他电子设备。如图10所示,该电子设备可包括:
至少一个处理器1001,以及与至少一个处理器1001连接的存储器1002,本申请实施例中不限定处理器1001与存储器1002之间的具体连接介质,图10中是以处理器1001和存储器1002之间通过总线1000连接为例。总线1000在图10中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线1000可以分为地址总线、数据总线、控制总线等,为便于表示,图10中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。或者,处理器1001也可以称为控制器,对于名称不做限制。
在本申请实施例中,存储器1002存储有可被至少一个处理器1001执行的指令,至少一个处理器1001通过执行存储器1002存储的指令,可以执行前文论述的一种地理位置信息的处理方法。处理器1001可以实现图9所示的装置中各个模块的功能。
其中,处理器1001是该装置的控制中心,可以利用各种接口和线路连接整个该控制设备的各个部分,通过运行或执行存储在存储器1002内的指令以及调用存储在存储器1002内的数据,该装置的各种功能和处理数据,从而对该装置进行整体监控。
在一种可能的设计中,处理器1001可包括一个或多个处理单元,处理器1001可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1001中。在一些实施例中,处理器1001和存储器1002可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
处理器1001可以是通用处理器,例如CPU(CPU)、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的一种地理位置信息的处理方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器1002作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器1002可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器1002是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本申请实施例中的存储器1002还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
通过对处理器1001进行设计编程,可以将前述实施例中介绍的一种地理位置信息的处理方法所对应的代码固化到芯片内,从而使芯片在运行时能够执行图2所示的实施例的一种地理位置信息的处理方法的步骤。如何对处理器1001进行设计编程为本领域技术人员所公知的技术,这里不再赘述。
基于同一发明构思,本申请实施例还提供一种存储介质,该存储介质存储有计算机指令,当该计算机指令在计算机上运行时,使得计算机执行前文论述的一种地理位置信息的处理方法。
在一些可能的实施方式中,本申请提供一种地理位置信息的处理方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在装置上运行时,程序代码用于使该控制设备执行本说明书上述描述的根据本申请各种示例性实施方式的一种地理位置信息的处理方法中的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
Claims (10)
1.一种地理位置信息的处理方法,其特征在于,包括:
获取目标地理实体的原始位置信息;其中,所述原始位置信息包括:至少一个原始位置标签;
基于预设的标准位置信息数据集,对所述原始位置信息进行位置标签匹配,获得至少一个标准位置标签;其中,所述标准位置信息数据集包括:至少一个标准位置信息,每个标准位置信息包括:至少一个标准位置标签;
确定所述至少一个标准位置标签对应的标准位置信息,并将所述标准位置信息作为所述目标地理实体的目标位置信息。
2.如权利要求1所述的方法,其特征在于,所述获取目标地理实体的原始位置信息,包括:
获取所述目标地理实体的标识信息;
基于所述标识信息,从预设的位置信息集合中,确定与所述标识信息相匹配的第一位置信息以及第二位置信息;其中,所述第一位置信息是通过网格搜索获得的;所述第二位置信息是通过爬取位置信息数据库获得的;
对所述第一位置信息和所述第二位置信息进行汇总,获得所述目标地理实体的原始位置信息。
3.如权利要求1所述的方法,其特征在于,所述基于预设的标准位置信息数据集,对所述原始位置信息进行位置标签匹配,获得至少一个标准位置标签,包括:
获取所述原始位置信息中的各个原始位置标签;
针对各个原始位置标签,分别执行以下操作:
获取一个原始位置标签的语义特征值;
基于所述语义特征值,从所述标准位置数据集中,选取出满足预设语义相似度条件的标准位置标签。
4.如权利要求1所述的方法,其特征在于,所述基于预设的标准位置信息数据集,对所述原始位置信息进行位置标签匹配,获得至少一个标准位置标签的过程中,还包括:
获取各个原始位置标签各自对应的区域划分等级;
若获得的各个原始区域划分等级之间存在遗漏,则查询所述标准位置数据集,确定至少一个遗漏的区域划分等级;
基于所述各个原始位置标签,从所述标准位置数据集中,获得所述至少一个遗漏的区域划分等级各自对应的标准位置标签。
5.如权利要求1-4中任一项所述的方法,其特征在于,所述确定所述至少一个标准位置标签对应的标准位置信息,包括:
获取所述至少一个标准位置标签各自对应的区域划分等级;
按照各区域划分等级,对所述至少一个标准位置标签进行排序,获得所述标准位置信息。
6.如权利要求1-4中任一项所述的方法,其特征在于,所述确定所述至少一个标准位置标签对应的标准位置信息,并将所述标准位置信息作为所述目标地理实体的目标位置信息之后,还包括:
确定对应所述目标位置信息的经纬度信息;
将所述经纬度信息作为所述目标地理实体的目标经纬度信息。
7.一种地理位置信息的处理装置,其特征在于,包括:
获取模块,用于获取目标地理实体的原始位置信息;其中,所述原始位置信息包括:至少一个原始位置标签;
选取模块,用于基于预设的标准位置信息数据集,对所述原始位置信息进行位置标签匹配,获得至少一个标准位置标签;其中,所述标准位置信息数据集包括:至少一个标准位置信息,每个标准位置信息包括:至少一个标准位置标签;
处理模块,用于确定所述至少一个标准位置标签对应的标准位置信息,并将所述标准位置信息作为所述目标地理实体的目标位置信息。
8.一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-6中任一项所述的方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6中任一所述方法的步骤。
10.一种计算机程序产品,其特征在于,所述计算机程序产品在被计算机调用时,使得所述计算机执行如权利要求1-6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111653374.XA CN114513550B (zh) | 2021-12-30 | 2021-12-30 | 一种地理位置信息的处理方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111653374.XA CN114513550B (zh) | 2021-12-30 | 2021-12-30 | 一种地理位置信息的处理方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114513550A true CN114513550A (zh) | 2022-05-17 |
CN114513550B CN114513550B (zh) | 2024-03-08 |
Family
ID=81547456
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111653374.XA Active CN114513550B (zh) | 2021-12-30 | 2021-12-30 | 一种地理位置信息的处理方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114513550B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114880423A (zh) * | 2022-07-08 | 2022-08-09 | 高德软件有限公司 | 高精资料数据的切分方法、装置、设备及产品 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101137158A (zh) * | 2006-09-19 | 2008-03-05 | 中兴通讯股份有限公司 | 一种对无线通信数据进行位置定位的方法 |
CN101350012A (zh) * | 2007-07-18 | 2009-01-21 | 北京灵图软件技术有限公司 | 一种地址匹配的方法和系统 |
US20120058778A1 (en) * | 2010-09-08 | 2012-03-08 | Texas Instruments Incorporated | System and method for determining a position of a mobile wireless device |
US9311416B1 (en) * | 2012-12-31 | 2016-04-12 | Google Inc. | Selecting content using a location feature index |
CN110462712A (zh) * | 2017-04-06 | 2019-11-15 | 权要汉 | 使用网格和单词显示和搜索位置的装置和方法 |
CN111324679A (zh) * | 2018-12-14 | 2020-06-23 | 阿里巴巴集团控股有限公司 | 地址信息的处理方法、装置和系统 |
WO2021017679A1 (zh) * | 2019-07-26 | 2021-02-04 | 苏宁易购集团股份有限公司 | 地址信息解析方法、装置、系统及数据获取方法 |
CN112398895A (zh) * | 2019-08-19 | 2021-02-23 | 阿里巴巴集团控股有限公司 | 提供服务信息的方法及装置 |
-
2021
- 2021-12-30 CN CN202111653374.XA patent/CN114513550B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101137158A (zh) * | 2006-09-19 | 2008-03-05 | 中兴通讯股份有限公司 | 一种对无线通信数据进行位置定位的方法 |
CN101350012A (zh) * | 2007-07-18 | 2009-01-21 | 北京灵图软件技术有限公司 | 一种地址匹配的方法和系统 |
US20120058778A1 (en) * | 2010-09-08 | 2012-03-08 | Texas Instruments Incorporated | System and method for determining a position of a mobile wireless device |
US9311416B1 (en) * | 2012-12-31 | 2016-04-12 | Google Inc. | Selecting content using a location feature index |
CN110462712A (zh) * | 2017-04-06 | 2019-11-15 | 权要汉 | 使用网格和单词显示和搜索位置的装置和方法 |
CN111324679A (zh) * | 2018-12-14 | 2020-06-23 | 阿里巴巴集团控股有限公司 | 地址信息的处理方法、装置和系统 |
WO2021017679A1 (zh) * | 2019-07-26 | 2021-02-04 | 苏宁易购集团股份有限公司 | 地址信息解析方法、装置、系统及数据获取方法 |
CN112398895A (zh) * | 2019-08-19 | 2021-02-23 | 阿里巴巴集团控股有限公司 | 提供服务信息的方法及装置 |
Non-Patent Citations (2)
Title |
---|
MINGQIN SHAO; XUELIN YANG: "Programming to Achieve the Reception Extraction and Translation of GPS Positioning Information", 2015 INTERNATIONAL CONFERENCE ON COMPUTER SCIENCE AND MECHANICAL AUTOMATION (CSMA) * |
鲁明;顾国强;: "基于地理实体特征的地址空间分类方法研究", 计算机应用与软件, no. 10 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114880423A (zh) * | 2022-07-08 | 2022-08-09 | 高德软件有限公司 | 高精资料数据的切分方法、装置、设备及产品 |
Also Published As
Publication number | Publication date |
---|---|
CN114513550B (zh) | 2024-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Acheson et al. | A quantitative analysis of global gazetteers: Patterns of coverage for common feature types | |
US7533112B2 (en) | Context hierarchies for address searching | |
EP2363816B1 (en) | Destination search in a navigation system using a spatial index structure | |
CN109101474B (zh) | 一种地址聚合的方法、包裹聚合的方法以及设备 | |
CN105183733A (zh) | 一种文本信息的匹配、业务对象的推送方法和装置 | |
Neumaier et al. | Enabling spatio-temporal search in open data | |
CN110516011B (zh) | 一种多源实体数据融合方法、装置及设备 | |
Christen et al. | A probabilistic geocoding system based on a national address file | |
CN110688434B (zh) | 一种兴趣点处理方法、装置、设备和介质 | |
CN114780680A (zh) | 基于地名地址数据库的检索与补全方法及系统 | |
US8799314B2 (en) | System and method for managing information map | |
Nowak et al. | Geotagging of natural history collections for reuse in environmental research | |
CN114513550B (zh) | 一种地理位置信息的处理方法、装置及电子设备 | |
CN113468881B (zh) | 一种地址标准化方法及装置 | |
Souza et al. | The role of gazetteers in geographic knowledge discovery on the web | |
CN114638217A (zh) | 地址文本处理方法及装置 | |
EP2783308B1 (en) | Full text search based on interwoven string tokens | |
Chatterjee et al. | SAGEL: smart address geocoding engine for supply-chain logistics | |
van Erp et al. | Georeferencing animal specimen datasets | |
CN111325235B (zh) | 面向多语种的通用地名语义相似度计算方法及其应用 | |
CN117633033A (zh) | 基于知识图谱的地理空间信息查询方法、系统、设备及介质 | |
Li et al. | Geospatial data mining on the web: Discovering locations of emergency service facilities | |
Mehta et al. | Natural Language processing approach and geospatial clustering to explore the unexplored geotags using media | |
CN115935086A (zh) | 地址信息识别方法、信息推送方法以及信息展示方法 | |
Bui | Automatic construction of POI address lists at city streets from geo-tagged photos and web data: a case study of San Jose City |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |