CN112597755B - 一种地理位置信息生成方法、装置、电子设备及存储介质 - Google Patents
一种地理位置信息生成方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112597755B CN112597755B CN202011600510.4A CN202011600510A CN112597755B CN 112597755 B CN112597755 B CN 112597755B CN 202011600510 A CN202011600510 A CN 202011600510A CN 112597755 B CN112597755 B CN 112597755B
- Authority
- CN
- China
- Prior art keywords
- information
- position information
- address information
- target area
- generating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000011218 segmentation Effects 0.000 claims description 49
- 238000004590 computer program Methods 0.000 claims description 8
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000004364 calculation method Methods 0.000 description 7
- 238000002372 labelling Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Remote Sensing (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种地理位置信息生成方法,包括:获取待处理的地址信息;利用已有地址信息与地址信息进行文本匹配,得到地址信息对应的相似位置信息及初始目标区域;利用相似位置信息及初始目标区域,生成地址信息的位置信息。本发明首先利用已有地址信息与地址信息进行文本匹配,根据文本匹配结果获取会出现在地址信息周围的相似位置信息,并可利用这些已有的相似位置信息进行位置信息生成;同时,本发明采用初始位置区域对位置信息的生成位置进行控制,可有效避免生成偏移程度较大的位置信息,并最终确保同时利用相似位置信息及初始目标区域生成的位置信息有效可靠。本发明还提供一种地理位置信息生成装置、电子设备及存储介质,具有上述有益效果。
Description
技术领域
本发明涉及地理位置信息生成领域,特别涉及一种地理位置信息生成方法、装置、电子设备及存储介质。
背景技术
随着定位导航技术的不断发展以及城市规模的不断扩张,越来越多物流配送平台依靠导航进行准确的物流配送。物流平台在接收到待配送的订单信息后,会使用导航系统查询目标位置信息,并利用目标位置信息生成导航路径,以便司机进行运输。由此可知,目标位置信息对导航路径的生成至关重要。
相关技术中,目标位置信息的生成依靠人工标注。若地址信息并未在导航系统中标注,该导航系统将无法确定目标位置信息,进而无法生成导航路径,为司机的运输工作带来困扰。
发明内容
本发明的目的是提供一种地理位置信息生成方法、装置、电子设备及存储介质,可利用已有地址信息对应的已有位置信息对待处理地址信息的位置信息进行生成,进而为导航系统提供生成导航路径的数据,为司机的运输工作带来便利。
为解决上述技术问题,本发明提供一种地理位置信息生成方法,包括:
获取待处理的地址信息;
利用已有地址信息与所述地址信息进行文本匹配,得到所述地址信息对应的相似位置信息及初始目标区域;
利用所述相似位置信息及所述初始目标区域,生成所述地址信息的位置信息。
可选地,所述利用已有地址信息与所述地址信息进行文本匹配,得到所述地址信息对应的相似位置信息及初始目标区域,包括:
利用第一预设格式对所述地址信息进行分词,得到分词信息;
利用所述分词信息与已有地址信息进行匹配,得到文本匹配度;
将所述文本匹配度大于预设阈值的已有地址信息对应的已有位置信息设置为所述相似位置信息;
利用所述分词信息中的建筑实体信息,在所述已有地址信息中获取所述初始目标区域。
可选地,所述利用所述分词信息中的建筑实体信息,在所述已有地址信息中获取所述初始目标区域,包括:
利用所述建筑实体信息,在所述已有地址信息中查询所述地址信息对应的建筑实体;
利用所述建筑实体对应的图像信息生成所述初始目标区域。
可选地,所述获取待处理的地址信息,包括:
获取原始文本信息;
判断所述原始本文信息是否符合第二预设格式要求;
若是,则将所述原始文本信息作为所述地址信息。
可选地,所述利用所述相似位置信息及所述初始目标区域,生成所述地址信息的位置信息,包括:
利用所述相似位置信息生成兴趣点;
计算所述兴趣点至所述初始目标区域对应边界的最近距离,并确定所述兴趣点与所述初始目标区域的相对位置;
利用所述最近距离及所述相对位置生成所述位置信息。
可选地,所述利用所述相似位置信息生成兴趣点,包括:
利用所述相似位置信息生成初始兴趣点;
计算所述初始兴趣点的质心,并将所述质心设置为所述兴趣点。
可选地,所述利用所述最近距离及所述相对位置生成所述位置信息,包括:
当所述最近距离小于第二阈值且所述兴趣点在所述初始目标区域外时,将所述兴趣点投影至所述最近距离对应的边界得到生成点,并将所述生成点的地理信息作为所述位置信息;或,
当所述最近距离大于等于第二阈值且所述兴趣点在所述初始目标区域外时,移除所述兴趣点;或,
当所述最近距离小于第二阈值且所述兴趣点在所述初始目标区域内时,将所述兴趣点投影至所述最近距离对应的边界得到生成点,并将所述生成点的地理信息作为所述位置信息;或,
当所述最近距离大于等于第二阈值且所述兴趣点在所述初始目标区域内时,将所述兴趣点的对应的已有位置信息作为所述位置信息。
本发明还提供一种地理位置信息生成装置,包括:
获取模块,用于获取待处理的地址信息;
文本匹配模块,用于利用已有地址信息与所述地址信息进行文本匹配,得到所述地址信息对应的相似位置信息及初始目标区域;
位置信息生成模块,用于利用所述相似位置信息及所述初始目标区域,生成所述地址信息的位置信息。
本发明还提供一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述所述的地理位置信息生成方法。
本发明还提供一种存储介质,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如上述所述的地理位置信息生成方法。
本发明提供一种地理位置信息生成方法,包括:获取待处理的地址信息;利用已有地址信息与所述地址信息进行文本匹配,得到所述地址信息对应的相似位置信息及初始目标区域;利用所述相似位置信息及所述初始目标区域,生成所述地址信息的位置信息。
可见,本方法中首先利用已有地址信息与待处理地址信息进行文本匹配,获得了待处理地址信息对应的相似位置信息。由于与待处理地址信息相似的已有地址信息,其对应的相似位置信息会出现在待生成位置信息的周围,因此本方法可利用相似位置信息确定待生成位置信息的位置。同时,本方法还获取了待处理地址信息对应的初始位置区域,并利用初始位置区域与相似位置信息一同生成位置信息。由于相似位置信息会出现偏移情况,利用偏移的位置信息进行数据生成会降低待处理地址信息对应位置信息的可靠性,因此本方法采用初始位置区域对位置信息的生成进行控制,可有效避免生成偏移程度较大的位置信息,并最终确保同时利用相似位置信息及初始目标区域生成的位置信息有效可靠。本发明还提供一种地理位置信息生成装置、电子设备及存储介质,具有上述有益效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例所提供的一种地理位置信息生成方法的流程图;
图2为本发明实施例所提供的位置信息生成的示意图;
图3为本发明实施例所提供的一种地理位置信息生成装置的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,地址信息对应的位置信息在地图系统中确定主要依靠人工标注的方式进行。若地址信息已经过标记,地图系统便可直接利用对应的位置信息生成定位点,进而生成规划路径。但对于未标记的地址信息,地图系统无法查询到相应的位置信息,进而无法规划路径,会为司机的运输工作造成不便。有鉴于此,本发明提供一种地理位置信息生成方法,可利用已经过标注的已有地址信息对应的已有位置信息,为待处理的地址信息生成位置信息,可为地图系统生成定位点提供有效数据,最终为司机的运输工作提供便利。请参考图1,图1为本发明实施例所提供的一种地理位置信息生成方法的流程图,该方法可以包括:
S101、获取待处理的地址信息。
需要说明的是,本发明实施例并不限定地址信息中需要包含的具体内容,例如可以省、市、区、街道、某具体建筑名称等内容,用户可根据实际应用需求进行设定。本发明实施例也不限定地址信息的内容格式,可以理解的是,地址信息的内容格式与地址信息中包含的内容有关,同时也与用户的输入习惯有关,进而地址信息的内容格式可能有多种。本发明实施例也不限定是否需要将地址信息的内容格式限制为某种特定的内容格式,当可确保任何内容格式的地址信息均能满足位置信息的生成效率时,可无需限制地址信息的内容格式,当需要提升位置信息的生成效率时,也可限制地址信息的内容格式。在本发明实施例中,为了进一步提升位置信息生成效率,并有效管理地址信息,可将地址信息的内容格式限制为某种特定的内容格式。本发明实施例也不限定具体的限制方式,例如要求以该内容格式进行地址信息输入,或是在获取到原始地址信息后,利用该内容格式对原始地址信息的内容形式进行判定。由于第二种方式简单有效,因此在本发明实施例中可采用该特征内容格式对原始地址信息进行判定。
在一种可能的情况中,获取待处理的地址信息的过程包括:
步骤11:获取原始文本信息;
步骤12:判断原始本文信息是否符合第二预设格式要求;若是,则进入步骤13,若否,则执行不符合第二预设格式要求的相应操作。
需要说明的是,本发明实施例并不限定第二预设格式要求的具体内容,该内容与地址信息中需要检测的内容及具体的内容格式有关,用户可根据实际的应用需求进行设定。本发明实施例也不限定不符合第二预设格式要求的相应操作,例如输出提示信息,也可以利用第二预设格式要求对原始文本信息进行格式转换。
步骤13:将原始文本信息作为地址信息。
进一步,本发明实施例并不限定是否需要对地址信息的标注情况进行确定,当可确保待处理的地址信息均为未标注的地址信息时,可无需确定地址信息的标注情况;当待处理地址信息中可能存在已在地图系统中标注过的地址信息时,也可以对待处理的地址信息的标注情况进行确定。在本发明实施例中,由于获取到的待处理地址信息中存在标注和未标注的地址信息,因此可对待检测的地址信息的标注情况进行确定。本发明实施例并不限定标注情况的确定方式,例如在地图系统中查询所述地址信息,若可查询到则说明地址信息已标记,若无法查询到则说明地址信息未经标记;当地址信息包含标记信息时,也可以通过判定所述标记信息是否表示未标记进行确定。
进一步,本发明实施例并不限定待处理地址信息的获取方式,例如可通过用户输入的方式获得,也可以直接通过获取地址提供平台发送的数据获得。本发明实施例并不限定具体的地址提供平台,例如可以是物流平台,也可以是电商平台,也可以是其他平台。
S102、利用已有地址信息与地址信息进行文本匹配,得到地址信息对应的相似位置信息及初始目标区域。
本发明实施例首先利用已有地址信息与待处理的地址信息进行文本匹配,并根据文本匹配的结果得到地址信息对应的相似位置信息,由于与待处理地址信息文本相近的已有地址信息,其对应的已有位置信息会出现在待处理地址信息的周边,可利用该已有位置信息确定待处理地址信息的大致位置,因此本发明实施例利用通过文本匹配获得到的地址信息对应的相似位置信息,可有效生成地址信息的位置信息。同时,本发明实施例还根据文本匹配结果获取到了地址信息对应的初始目标区域,该区域表示地址信息可能出现的区域。由于已有位置信息可能出现错误或偏差,仅利用已有位置信息进行数据生成难以保证位置信息的可靠程度,因此本发明实施例同时利用初始目标区域及相似位置信息,确保利用相似位置信息生成的位置信息出现在初始目标区域中,可有效避免生成位置偏差较大的位置信息,确保位置信息可靠有效。
需要说明的是,本发明并不限定地址信息与已有地址信息进行文本匹配的方式,例如可以是地址信息直接与已有地址信息进行匹配,也可以是对地址信息进行分词处理,得到分词信息,并利用分词信息与已有地址信息进行匹配。由于利用分词信息进行匹配效率和计算准确度更高,因此在本发明实施例中,可以首先对地址信息进行分词处理得到分词信息,然后利用分词信息与已有地址信息进行匹配。
可以理解的是,地址信息对应的相似位置信息及初始目标区域应当根据文本匹配的结果得到。本发明实施例并不限定根据何种文本匹配结果进行数据获取,例如在文本匹配时可计算文本匹配度,并根据文本匹配度进行数据获取,也可以匹配上的分词信息数量进行数据获取。由于文本匹配度计算准确度更高,因此在本发明实施例中,可根据文本匹配度进行数据获取。
本发明实施例并不限定地址信息对应的相似位置信息的数量,该数量可为任意数量,只要能够满足计算精度要求即可。本发明实施例也不限定相似位置信息包含的具体内容,例如可以包含经纬度坐标,也可以包含具体的地址信息,也可以包含其他内容,用户可根据实际应用需求进行选择。本发明实施例也不限定初始目标区域的具体内容,只要能够确保位置信息在该初始目标区域中生成即可。
在一种可能的情况中,利用已有地址信息与地址信息进行文本匹配,得到地址信息对应的相似位置信息及初始目标区域的过程,可以包括:
步骤21:利用第一预设格式对地址信息进行分词,得到分词信息。
需要说明的是,本发明实施例并不限定第一预设格式的具体内容,该内容与地址信息中需要检测的内容信息有关,用户可根据实际应用需求进行设定。本发明实施例也不限定第一预设格式是否与上述实施例中用于限制地址信息内容格式的第二预设格式相同,当地址信息中的内容均需要检测时,第一预设格式可与第二预设格式相同;当只对地址信息中部分内容进行检测时,第一预设格式也可与第二预设格式不同。
本发明实施例也不限定利用第一预设格式进行分词的具体方式,用户可参考文本分词的相关技术,例如可通过查找关键字的方式进行分词,也可通、过正则表达式进行字符串格式查找的方式进行分词。
步骤22:利用分词信息与已有地址信息进行匹配,得到文本匹配度。
本发明实施例并不限定利用分词信息与已有地址信息进行匹配的具体方式,用户可参考字符串对比的相关技术。本发明实施例也不限定是否根据分词信息对应的行政层级进行匹配,例如当分词信息中存在省、市、区、道路、小区信息时,先匹配省信息,然后再匹配市信息,然后再匹配区信息,以此类推。当直接进行文本匹配可确保匹配精度及效率时,可不依据分词信息对应的区域层级进行匹配,当需要提升匹配精度及效率时,也可依据分词信息对应的行政层级进行匹配。在本发明实施例中,由于匹配精度会对后续的位置信息计算产生较大影响,需要提升匹配精度已确保后续数据生成环节的可靠性,因此根据分词信息的行政层级进行匹配。
进一步,本发明实施例并不限定文本匹配度的具体计算方式,例如可以通过计算成功匹配的分词信息数量与分词信息总数量的比值,也可以计算成功匹配的字符串长度与字符串总长度的比值,只要可反映文本匹配情况即可。
步骤23:将文本匹配度大于预设阈值的已有地址信息对应的已有位置信息设置为相似位置信息。
需要说明的是,本发明实施例并不限定预设阈值的具体数据,用户可根据实际应用需求进行设定。
步骤24:利用分词信息中的建筑实体信息,在已有地址信息中获取初始目标区域。
本发明实施例采用分词信息中的建筑实体信息生成地址信息对应的初始目标区域。该建筑实体信息代表该地址信息所处的建筑区域,例如小区、大厦等。可以理解的是,当分词信息带有区域层级信息,且分词信息依照区域层级信息从大到小的顺序进行排列时,建筑实体信息所处的区域层级应当大于地址信息中包含的最小区域层级,例如,在一种情况中,分词信息依据区域层级信息从大到小的顺序进行排列时,可包含省、市、区、道路、大厦、房间号时,此时地址信息中最小的区域层级为房间号,而建筑实体信息可以为大厦、道路、区、市、省。进一步,为了提升初始目标区域的实际应用意义,在本发明实施例中,建筑实体信息可以为地址信息中最小区域层级的上一区域层级,例如在上述例子中,建筑实体信息可以为大厦。
需要说明的是,本发明实施例并不限定确定分词信息中建筑实体信息的具体方式,例如可通过查找关键字、根据分词信息的区域层级排列顺序等进行确定。
进一步,可以理解的是初始目标区域为一个带有边界的区域,且该区域应当通过图像方式进行获取。本发明实施并不限定初始目标区域的具体形状和尺寸,只要该区域可覆盖建筑实体所在区域即可。本发明实施例也不限定利用何种图像信息进行初始目标区域的生成,例如可以为电子地图图像,也可以为卫星图像。
在一种可能的情况中,利用分词信息中的建筑实体信息,在已有地址信息中获取初始目标区域的过程,可以包括:
步骤31:利用建筑实体信息,在已有地址信息中查询地址信息对应的建筑实体。
步骤32:利用建筑实体对应的图像信息生成初始目标区域。
需要说明的是,本发明实施例并不限定利用图像信息生成区域信息的具体方式,用户可参考图像识别的相关技术。
S103、利用相似位置信息及初始目标区域,生成地址信息的位置信息。
需要说明的是,本发明实施例并不限定利用相似位置信息及初始目标区域生成位置信息的具体方式,例如可依照文本匹配度,对相似位置信息中的经纬度信息进行加权计算,得到初始位置信息,并根据初始位置信息与初始目标区域的位置关系确定最终的位置信息,也可以利用相似位置信息生成兴趣点,并利用兴趣点与初始目标区域的位置关系确定位置信息。由于利用利用兴趣点进行数据生成的方式更加准确,因此在本发明实施例中,可利用相似位置信息生成兴趣点,并利用兴趣点与初始目标区域的位置关系确定位置信息。
进一步,本发明实施例并不限定兴趣点与初始目标区域的具体的位置关系,例如可以为兴趣点与初始目标区域的最近距离,也可以为兴趣点是否位于初始目标区域中,也可以为其他形式的位置关系;当然,也可以为多种位置关系的组合。在本发明实施例中,为了准确描述兴趣点与初始目标区域的位置关系,可采用最近距离及兴趣点是否位于初始目标区域中这两种位置关系的组合。
在一种可能的情况中,利用相似位置信息及初始目标区域,生成地址信息的位置信息的过程,可以包括:
步骤41:利用相似位置信息生成兴趣点。
需要说明的是,本发明实施例并不限定利用相似位置信息生成兴趣点的具体方式,例如可为每个相似位置信息生成对应的初始兴趣点,并根据相似位置信息对应的文本匹配度确定兴趣点,也可以为利用多个相似位置信息共同生成一个兴趣点。在本发明实施例中,为了提升位置信息的生成准确度,可利用多个相似位置信息共同生成一个兴趣点。本发明实施例并不限定利用多个相似位置信息共同生成一个兴趣点的具体方式,例如对多个相似位置信息对应的经纬度信息进行平均计算,得到该兴趣点的经纬度信息,也可以首先生成多个相似位置信息对应的初始兴趣点,并计算这些初始兴趣点的质心,最后将该质心作为该兴趣点。考虑到计算质心的方式更加可靠,在本发明实施例中,首先生成多个相似位置信息对应的初始兴趣点,并计算这些初始兴趣点的质心,最后将该质心作为该兴趣点的方式。
在一种可能的情况中,利用相似位置信息生成兴趣点的过程,可以包括:
步骤51:利用相似位置信息生成初始兴趣点;
步骤52:计算初始兴趣点的质心,并将质心设置为兴趣点。
需要说明的是,本发明实施例并不限定质心计算的具体方式,用户可参考质心计算的相关技术。
本发明实施例也不限定如何确定哪些相似位置信息可以用于计算兴趣点,例如可直接利用所有相似位置信息计算兴趣点,也可以对所有相似位置信息进行聚类计算,并利用汇聚为一类的相似位置信息进行兴趣点计算。
步骤42:计算兴趣点至初始目标区域对应边界的最近距离,并确定兴趣点与初始目标区域的相对位置。
需要说明的是,本发明实施例并不限定兴趣点至边界最近距离的具体计算方式,用户可参考计算点到直线最近距离的相关技术。本发明实施例也不限定确定与兴趣点相隔最近的边界的确定方式,例如可计算每条边界至该兴趣点的最近距离,并选择最近距离最小的边界为与兴趣点相隔最近的边界。
本发明实施例也不限定确定兴趣点是否在初始目标区域内的具体方式,用户可参考判别点是否在多边形区域内外的相关技术。
步骤43:利用最近距离及相对位置生成位置信息。
本发明实施例并不限定利用最近距离及相对位置生成位置信息的具体方式,例如可首先确定兴趣点是否在初始目标区域内,若兴趣点在初始目标区域内,则将兴趣点的信息作为该位置信息,若兴趣点在初始目标区域外,则判断最近距离是否小于预设阈值,若是则将兴趣点的信息设置为该位置信息;也可以先判断兴趣点的最近距离是否小于预设阈值,若是则将兴趣点垂直投射至最近边界上,得到生成点,并将生成点的信息作为该位置信息,若最近距离大于等于预设阈值,则判断兴趣点是否在初始区域内,若是则直接利用兴趣点的信息作为该位置信息。由于后一种方法的生成精度更高,因此在本发明实施例中可采用第二种方式。
在一种可能的情况中,利用最近距离及相对位置生成位置信息的过程,可以包括:
步骤51:当最近距离小于第二阈值且兴趣点在初始目标区域外时,将兴趣点投影至最近距离对应的边界得到生成点,并将生成点的地理信息作为位置信息;或,
需要说明的是,本发明实施例并不限定将兴趣点投影至最近距离对应的边界的具体方式,用户可参考将点投影至直线的相关技术。
步骤52:当最近距离大于等于第二阈值且兴趣点在初始目标区域外时,移除兴趣点;或,
需要说明的是,本发明实施例并不限定移除兴趣点的后续操作,例如退出位置信息的生成操作,也可以是利用下一兴趣点继续进行位置信息生成。
步骤53:当最近距离小于第二阈值且兴趣点在初始目标区域内时,将兴趣点投影至最近距离对应的边界得到生成点,并将生成点的地理信息作为位置信息;或,
步骤54:当最近距离大于等于第二阈值且兴趣点在初始目标区域内时,将兴趣点的对应的已有位置信息作为位置信息。
下面结合具体实例介绍上述位置信息生成过程,请参考图2,图2为本发明实施例提供的位置信息生成的示意图。其中,该边框围绕的区域为初始目标区域,点M为该区域外的一点,其与初始目标区域的最近距离为i,点M在最近距离对应边界上的投影点为M’;点N为该区域内的一点,其与初始目标区域的最近距离为j,点N在最近距离对应边界上的投影点为N’,设置第二阈值为ρ。对于点M,当i<ρ时,将点M’的信息设置为位置信息;当i≥ρ时,将该点排除,并利用下一兴趣点进行位置信息生成。对于点N,当j<ρ时,将点N’的信息设置为位置信息,当j≥ρ时,将N的信息设置为位置信息。
基于上述实施例,本方法中首先利用已有地址信息与待处理地址信息进行文本匹配,获得了待处理地址信息对应的相似位置信息。由于与待处理地址信息相似的已有地址信息,其对应的相似位置信息会出现在待生成位置信息的周围,因此本方法可利用相似位置信息确定待生成位置信息的位置。同时,本方法还获取了待处理地址信息对应的初始位置区域,并利用初始位置区域与相似位置信息一同生成位置信息。由于相似位置信息会出现偏移情况,利用偏移的位置信息进行数据生成会降低待处理地址信息对应位置信息的可靠性,因此本方法采用初始位置区域对位置信息的生成进行控制,可有效避免生成偏移程度较大的位置信息,并最终确保同时利用相似位置信息及初始目标区域生成的位置信息有效可靠。
下面对本发明实施例提供的一种地理位置信息生成装置、电子设备及存储介质进行介绍,下文描述的一种地理位置信息生成装置、电子设备及存储介质与上文描述的地址位置信息生成方法可相互对应参照。
请参考图3,图3为本发明实施例所提供的一种地址位置信息生成装置的结构框图,该设备可以包括:
获取模块201,用于获取待处理的地址信息;
文本匹配模块202,用于利用已有地址信息与地址信息进行文本匹配,得到地址信息对应的相似位置信息及初始目标区域;
位置信息生成模块203,用于利用相似位置信息及初始目标区域,生成地址信息的位置信息。
可选地,文本匹配模块202,可以包括:
分词子模块,用于利用第一预设格式对地址信息进行分词,得到分词信息;
文本匹配子模块,用于利用分词信息与已有地址信息进行匹配,得到文本匹配度;
相似信息设置子模块,用于将文本匹配度大于预设阈值的已有地址信息对应的已有位置信息设置为相似位置信息;
区域确定子模块,用于利用分词信息中的建筑实体信息,在已有地址信息中获取初始目标区域。
可选地,区域确定子模块,可以包括:
建筑实体查找单元,用于利用建筑实体信息,在已有地址信息中查询地址信息对应的建筑实体;
区域确定单元,用于利用建筑实体对应的图像信息生成初始目标区域。
可选地,获取模块201,包括:
获取子模块,用于获取原始文本信息;
判断子模块,用于判断原始本文信息是否符合第二预设格式要求;
地址信息设置子模块,用于将原始文本信息作为地址信息。
可选地,位置信息生成模块203,可以包括:
兴趣点生成子模块,用于利用相似位置信息生成兴趣点;
第一计算子模块,用于计算兴趣点至初始目标区域对应边界的最近距离,并确定兴趣点与初始目标区域的相对位置;
位置信息生成子模块,用于利用最近距离及相对位置生成位置信息。
可选地,兴趣点生成子模块,可以包括:
初始兴趣点生成单元,用于利用相似位置信息生成初始兴趣点;
第二计算单元,用于计算初始兴趣点的质心,并将质心设置为兴趣点。
可选地,位置信息生成子模块,可以包括:
第一生成单元,用于当最近距离小于第二阈值且兴趣点在初始目标区域外时,将兴趣点投影至最近距离对应的边界得到生成点,并将生成点的地理信息作为位置信息;
移除单元,用于当最近距离大于等于第二阈值且兴趣点在初始目标区域外时,移除兴趣点;
第二生成单元,用于当最近距离小于第二阈值且兴趣点在初始目标区域内时,将兴趣点投影至最近距离对应的边界得到生成点,并将生成点的地理信息作为位置信息;
第三生成单元,用于当最近距离大于等于第二阈值且兴趣点在初始目标区域内时,将兴趣点的对应的已有位置信息作为位置信息。
本发明实施例还提供一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序时实现如上述的地理位置信息生成方法的步骤。
由于电子设备部分的实施例与地理位置信息生成方法部分的实施例相互对应,因此电子设备部分的实施例请参见地理位置信息生成方法部分的实施例的描述,这里暂不赘述。
本发明实施例还提供一种存储介质,存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述任意实施例的地理位置信息生成方法的步骤。
由于存储介质部分的实施例与地理位置信息生成方法部分的实施例相互对应,因此存储介质部分的实施例请参见地理位置信息生成方法部分的实施例的描述,这里暂不赘述。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的一种地理位置信息生成方法、装置、电子设备及存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
Claims (7)
1.一种地理位置信息生成方法,其特征在于,包括:
获取待处理的地址信息;
利用已有地址信息与所述地址信息进行文本匹配,得到所述地址信息对应的相似位置信息及初始目标区域;
利用所述相似位置信息生成兴趣点;
计算所述兴趣点至所述初始目标区域对应边界的最近距离,并确定所述兴趣点与所述初始目标区域的相对位置;
利用所述最近距离及所述相对位置生成所述位置信息;
利用已有地址信息与所述地址信息进行文本匹配,得到所述地址信息对应的初始目标区域,包括:
利用第一预设格式对所述地址信息进行分词,得到分词信息;
利用所述分词信息中的建筑实体信息,在所述已有地址信息中查询所述地址信息对应的建筑实体;
利用所述建筑实体对应的图像信息生成所述初始目标区域;
利用所述最近距离及所述相对位置生成所述位置信息,包括:
当所述最近距离小于第二阈值且所述兴趣点在所述初始目标区域外时,将所述兴趣点投影至所述最近距离对应的边界得到生成点,并将所述生成点的地理信息作为所述位置信息;
当所述最近距离大于等于第二阈值且所述兴趣点在所述初始目标区域外时,移除所述兴趣点;
当所述最近距离小于第二阈值且所述兴趣点在所述初始目标区域内时,将所述兴趣点投影至所述最近距离对应的边界得到生成点,并将所述生成点的地理信息作为所述位置信息;
当所述最近距离大于等于第二阈值且所述兴趣点在所述初始目标区域内时,将所述兴趣点的对应的已有位置信息作为所述位置信息。
2.根据权利要求1所述的地理位置信息生成方法,其特征在于,所述利用已有地址信息与所述地址信息进行文本匹配,得到所述地址信息对应的相似位置信息,包括:
利用第一预设格式对所述地址信息进行分词,得到分词信息;
利用所述分词信息与已有地址信息进行匹配,得到文本匹配度;
将所述文本匹配度大于预设阈值的已有地址信息对应的已有位置信息设置为所述相似位置信息。
3.根据权利要求1所述的地理位置信息生成方法,其特征在于,所述获取待处理的地址信息,包括:
获取原始文本信息;
判断所述原始文本信息是否符合第二预设格式要求;
若是,则将所述原始文本信息作为所述地址信息。
4.根据权利要求1所述的地理位置信息生成方法,其特征在于,所述利用所述相似位置信息生成兴趣点,包括:
利用所述相似位置信息生成初始兴趣点;
计算所述初始兴趣点的质心,并将所述质心设置为所述兴趣点。
5.一种地理位置信息生成装置,其特征在于,包括:
获取模块,用于获取待处理的地址信息;
文本匹配模块,用于利用已有地址信息与所述地址信息进行文本匹配,得到所述地址信息对应的相似位置信息及初始目标区域;
位置信息生成模块,用于利用所述相似位置信息及所述初始目标区域,生成所述地址信息的位置信息;
所述位置信息生成模块,包括:
兴趣点生成子模块,用于利用所述相似位置信息生成兴趣点;
第一计算子模块,用于计算所述兴趣点至所述初始目标区域对应边界的最近距离,并确定所述兴趣点与所述初始目标区域的相对位置;
位置信息生成子模块,用于利用所述最近距离及所述相对位置生成所述位置信息;
所述文本匹配模块,包括:
分词子模块,用于利用第一预设格式对所述地址信息进行分词,得到分词信息;
区域确定子模块,包括:建筑实体查找单元,用于利用所述分词信息中的建筑实体信息,在所述已有地址信息中查询所述地址信息对应的建筑实体;区域确定单元,用于利用所述建筑实体对应的图像信息生成所述初始目标区域;
所述位置信息生成子模块,包括:
第一生成单元,用于当所述最近距离小于第二阈值且所述兴趣点在所述初始目标区域外时,将所述兴趣点投影至所述最近距离对应的边界得到生成点,并将所述生成点的地理信息作为所述位置信息;
移除单元,用于当所述最近距离大于等于第二阈值且所述兴趣点在所述初始目标区域外时,移除所述兴趣点;
第二生成单元,用于当所述最近距离小于第二阈值且所述兴趣点在所述初始目标区域内时,将所述兴趣点投影至所述最近距离对应的边界得到生成点,并将所述生成点的地理信息作为所述位置信息;
第三生成单元,用于当所述最近距离大于等于第二阈值且所述兴趣点在所述初始目标区域内时,将所述兴趣点的对应的已有位置信息作为所述位置信息。
6.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至4任一项所述的地理位置信息生成方法。
7.一种存储介质,其特征在于,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如权利要求1至4任一项所述的地理位置信息生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011600510.4A CN112597755B (zh) | 2020-12-29 | 2020-12-29 | 一种地理位置信息生成方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011600510.4A CN112597755B (zh) | 2020-12-29 | 2020-12-29 | 一种地理位置信息生成方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112597755A CN112597755A (zh) | 2021-04-02 |
CN112597755B true CN112597755B (zh) | 2024-06-11 |
Family
ID=75203883
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011600510.4A Active CN112597755B (zh) | 2020-12-29 | 2020-12-29 | 一种地理位置信息生成方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112597755B (zh) |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101882163A (zh) * | 2010-06-30 | 2010-11-10 | 中国科学院地理科学与资源研究所 | 一种基于匹配规则的模糊中文地址地理赋值方法 |
EP2631877A2 (en) * | 2012-02-24 | 2013-08-28 | Canon Kabushiki Kaisha | Mesh generating apparatus and method |
WO2014166284A1 (zh) * | 2013-04-10 | 2014-10-16 | 腾讯科技(深圳)有限公司 | Ip地址所在区域的确定方法及装置 |
CN104484790A (zh) * | 2014-12-26 | 2015-04-01 | 清华大学深圳研究生院 | 一种物流业务的地址匹配方法及装置 |
CN105095205A (zh) * | 2014-04-17 | 2015-11-25 | 阿里巴巴集团控股有限公司 | 地址定位方法及装置 |
CN106936887A (zh) * | 2015-12-31 | 2017-07-07 | 珠海金山办公软件有限公司 | 一种地理位置定位方法及装置 |
CN108520070A (zh) * | 2018-04-13 | 2018-09-11 | 百度在线网络技术(北京)有限公司 | 用于电子地图的筛选兴趣点的方法和装置 |
CN109992638A (zh) * | 2019-03-29 | 2019-07-09 | 北京三快在线科技有限公司 | 地理位置poi的生成方法、装置、电子设备和存储介质 |
CN110674423A (zh) * | 2019-09-23 | 2020-01-10 | 拉扎斯网络科技(上海)有限公司 | 一种地址定位的方法、装置、可读存储介质和电子设备 |
CN111382212A (zh) * | 2020-03-02 | 2020-07-07 | 拉扎斯网络科技(上海)有限公司 | 关联地址获取方法、装置、电子设备及存储介质 |
CN111460327A (zh) * | 2020-03-10 | 2020-07-28 | 口口相传(北京)网络技术有限公司 | 兴趣地搜索方法及装置、存储介质、计算机设备 |
CN111507080A (zh) * | 2020-03-18 | 2020-08-07 | 北京百度网讯科技有限公司 | 数据质检方法、装置、电子设备及存储介质 |
CN111639493A (zh) * | 2020-05-22 | 2020-09-08 | 上海微盟企业发展有限公司 | 一种地址信息标准化方法、装置、设备及可读存储介质 |
CN111738352A (zh) * | 2020-07-17 | 2020-10-02 | 浙江口碑网络技术有限公司 | 建筑实体内部的定位方法、装置及设备 |
CN111783419A (zh) * | 2020-06-12 | 2020-10-16 | 上海东普信息科技有限公司 | 地址相似度计算方法、装置、设备和存储介质 |
CN111859060A (zh) * | 2020-01-10 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 一种信息查询方法、装置、电子设备和可读存储介质 |
CN111896016A (zh) * | 2020-07-28 | 2020-11-06 | 拉扎斯网络科技(上海)有限公司 | 位置信息的处理方法及装置、存储介质、终端 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8681022B2 (en) * | 2011-02-02 | 2014-03-25 | Mapquest, Inc. | Systems and methods for generating electronic map displays with points-of-interest based on density thresholds |
JP5617027B1 (ja) * | 2013-12-25 | 2014-10-29 | ナレッジスイート株式会社 | 情報管理システム及び情報管理プログラム |
CN109145219B (zh) * | 2018-09-10 | 2020-12-25 | 百度在线网络技术(北京)有限公司 | 基于互联网文本挖掘的兴趣点有效性判断方法和装置 |
-
2020
- 2020-12-29 CN CN202011600510.4A patent/CN112597755B/zh active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101882163A (zh) * | 2010-06-30 | 2010-11-10 | 中国科学院地理科学与资源研究所 | 一种基于匹配规则的模糊中文地址地理赋值方法 |
EP2631877A2 (en) * | 2012-02-24 | 2013-08-28 | Canon Kabushiki Kaisha | Mesh generating apparatus and method |
WO2014166284A1 (zh) * | 2013-04-10 | 2014-10-16 | 腾讯科技(深圳)有限公司 | Ip地址所在区域的确定方法及装置 |
CN105095205A (zh) * | 2014-04-17 | 2015-11-25 | 阿里巴巴集团控股有限公司 | 地址定位方法及装置 |
CN104484790A (zh) * | 2014-12-26 | 2015-04-01 | 清华大学深圳研究生院 | 一种物流业务的地址匹配方法及装置 |
CN106936887A (zh) * | 2015-12-31 | 2017-07-07 | 珠海金山办公软件有限公司 | 一种地理位置定位方法及装置 |
CN108520070A (zh) * | 2018-04-13 | 2018-09-11 | 百度在线网络技术(北京)有限公司 | 用于电子地图的筛选兴趣点的方法和装置 |
CN109992638A (zh) * | 2019-03-29 | 2019-07-09 | 北京三快在线科技有限公司 | 地理位置poi的生成方法、装置、电子设备和存储介质 |
CN110674423A (zh) * | 2019-09-23 | 2020-01-10 | 拉扎斯网络科技(上海)有限公司 | 一种地址定位的方法、装置、可读存储介质和电子设备 |
CN111859060A (zh) * | 2020-01-10 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 一种信息查询方法、装置、电子设备和可读存储介质 |
CN111382212A (zh) * | 2020-03-02 | 2020-07-07 | 拉扎斯网络科技(上海)有限公司 | 关联地址获取方法、装置、电子设备及存储介质 |
CN111460327A (zh) * | 2020-03-10 | 2020-07-28 | 口口相传(北京)网络技术有限公司 | 兴趣地搜索方法及装置、存储介质、计算机设备 |
CN111507080A (zh) * | 2020-03-18 | 2020-08-07 | 北京百度网讯科技有限公司 | 数据质检方法、装置、电子设备及存储介质 |
CN111639493A (zh) * | 2020-05-22 | 2020-09-08 | 上海微盟企业发展有限公司 | 一种地址信息标准化方法、装置、设备及可读存储介质 |
CN111783419A (zh) * | 2020-06-12 | 2020-10-16 | 上海东普信息科技有限公司 | 地址相似度计算方法、装置、设备和存储介质 |
CN111738352A (zh) * | 2020-07-17 | 2020-10-02 | 浙江口碑网络技术有限公司 | 建筑实体内部的定位方法、装置及设备 |
CN111896016A (zh) * | 2020-07-28 | 2020-11-06 | 拉扎斯网络科技(上海)有限公司 | 位置信息的处理方法及装置、存储介质、终端 |
Non-Patent Citations (3)
Title |
---|
Geographical localization of web domains and organization addresses recognition by employing natural language processing, Pattern Matching and clustering;Nesi, Paolo等;《ENGINEERING APPLICATIONS OF ARTIFICIAL INTELLIGENCE》;20160501;第202-211页 * |
地名地址数据快速采集方法的应用创新――以诸城市为例;史卫杰;;山东国土资源;20170615(06);全文 * |
基于地图地理信息点的数据融合算法的改进;吕丹;龙华;赵继东;邵玉斌;杜庆治;;西北大学学报(自然科学版);20171025(05);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112597755A (zh) | 2021-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107656913B (zh) | 地图兴趣点地址提取方法、装置、服务器和存储介质 | |
US6668226B2 (en) | Polar coordinate-based isochrone generation | |
CN109410735B (zh) | 反射值地图构建方法和装置 | |
CN109543680B (zh) | 兴趣点的位置确定方法、装置设备和介质 | |
US11118921B2 (en) | Vehicle routing guidance to an authoritative location for a point of interest | |
JPH11265441A (ja) | 地理データベース内の形状情報を表示し、使用する方法及び装置 | |
CN111783844B (zh) | 基于深度学习的目标检测模型训练方法、设备及存储介质 | |
CN114459471B (zh) | 定位信息确定方法、装置、电子设备及存储介质 | |
CN110555432B (zh) | 一种兴趣点处理方法、装置、设备和介质 | |
CN112798004A (zh) | 一种车辆的定位方法、装置、设备及存储介质 | |
CN111046669A (zh) | 一种兴趣点的匹配方法、装置及计算机系统 | |
CN112597755B (zh) | 一种地理位置信息生成方法、装置、电子设备及存储介质 | |
CN114677458A (zh) | 用于高精地图的道路标识生成方法、装置及电子设备、存储介质 | |
CN111506678B (zh) | 到达点负样本生成方法、装置与设备 | |
CN111522896A (zh) | 确定平面多边形凹凸点的方法及系统 | |
CN111488771B (zh) | Ocr挂接方法、装置与设备 | |
CN106443732B (zh) | 一种基于gps的路径图绘制方法和系统 | |
CN113990066B (zh) | 道路信息匹配及路口识别方法及装置 | |
CN110263114B (zh) | 路段描述方法、装置、设备和介质 | |
CN113254809B (zh) | 地理信息获得方法、装置、电子设备 | |
US20240175705A1 (en) | System and method for generating a semantic map for a road | |
CN116222607A (zh) | 导航提示信息的生成方法、装置、车辆及介质 | |
CN118031952A (zh) | 一种地图场景验证方法、路径规划方法及相关装置 | |
CN115546752A (zh) | 高精地图的车道线标注方法和装置、电子设备和存储介质 | |
CN111506695A (zh) | Gpx数据处理成面数据时的坐标方向识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |