CN110413904A - 一种兴趣点地址数据处理方法、装置、服务器和介质 - Google Patents

一种兴趣点地址数据处理方法、装置、服务器和介质 Download PDF

Info

Publication number
CN110413904A
CN110413904A CN201910677496.9A CN201910677496A CN110413904A CN 110413904 A CN110413904 A CN 110413904A CN 201910677496 A CN201910677496 A CN 201910677496A CN 110413904 A CN110413904 A CN 110413904A
Authority
CN
China
Prior art keywords
poi
address date
target
data
target poi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910677496.9A
Other languages
English (en)
Inventor
肖京格
宋宽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910677496.9A priority Critical patent/CN110413904A/zh
Publication of CN110413904A publication Critical patent/CN110413904A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Abstract

本发明实施例公开了一种兴趣点地址数据处理方法、装置、服务器和介质。其中,该方法包括:依据目标兴趣点POI坐标数据,获取与目标POI关联的至少两个参考POI地址数据;依据所述至少两个参考POI地址数据,对所述目标POI地址数据进行校验;其中,POI地址数据包括道路名称和/或门牌号;若校验未通过,则依据所述至少两个参考POI地址数据,对所述目标POI地址数据进行修改。通过本发明实施例提供的技术方案,无需花费大量的人工成本,具有较高的地址准确率,同时满足了时效性的要求。

Description

一种兴趣点地址数据处理方法、装置、服务器和介质
技术领域
本发明实施例涉及信息处理技术领域,尤其涉及一种兴趣点地址数据处理方法、装置、服务器和介质。
背景技术
随着科技的发展,电子地图的出现为人们的生活提供了便利。其中,电子地图中所展示的图形基本是由点线面组成,而兴趣点(Point of Interest,POI)作为点数据的重要组成部分是电子地图中不可或缺的组成部分,其质量好坏,直接决定了电子地图的用户体验。每个POI包含名称、地址、坐标等信息,而地址是对POI空间位置的语义化表达。若POI地址错误,用户使用电子地图时可能在地址指定位置无法找到想要的地物实体,这对用户体验的影响是致命的。然而,现实电子地图开发中,地址来源众多,有些来自互联网信息收集,这类数据质量参差不齐,地址中道路门牌号错误的情况普遍存在,因此需对电子地图POI地址进行校验与修正。
目前对于电子地图POI地址的校验与修正主要采用下述三种方式进行:1)专业人员进行实地采集:选定需要采集地址的地物实体,而后派出专业人员到实地辨别出实体并将其与线上POI进行关联,根据实际观察到的信息辨别POI地址,若线上地址存在错误,则更新电子地图中对应的POI地址信息;2)人工电话核实:确定待核实对象并收集待核实对象的电话等信息,之后分发人工,打电话核实POI地址并将核实情况入库,更新在线数据;3)用户主动进行上报:用户在发现有POI存在地址错误后,主动进行上报。
然而,上述三种方式分别存在如下问题:1)对于专业人员进行实地采集方式而言,需要大量的专业人员进行实地采集,导致数据采集成本高,而且时效性;2)对于人工电话核实而言,可以获取到联系方式的POI只是一部分,很多POI无法获取其电话等联系方式,而且需要人工逐个去打电话核实地址,人工成本会比较高;3)对于用户主动进行上报方式,受用户认为因素影响较大,准确率难以得到保证,而且时效性无法得到保证。
发明内容
本发明实施例提供一种兴趣点地址数据处理方法、装置、服务器和介质,无需花费大量的人工成本,具有较高的地址准确率,同时满足了时效性的要求。
第一方面,本发明实施例提供了一种兴趣点地址数据处理方法,该方法包括:
依据目标兴趣点POI坐标数据,获取与目标POI关联的至少两个参考POI地址数据;
依据所述至少两个参考POI地址数据,对所述目标POI地址数据进行校验;其中,POI地址数据包括道路名称和/或门牌号;
若校验未通过,则依据所述至少两个参考POI地址数据,对所述目标POI地址数据进行修改。
第二方面,本发明实施例还提供了一种兴趣点地址数据处理装置,该装置包括:
参考数据获取模块,用于依据目标兴趣点POI坐标数据,获取与目标POI关联的至少两个参考POI地址数据;
目标数据校验模块,用于依据所述至少两个参考POI地址数据,对所述目标POI地址数据进行校验;其中,POI地址数据包括道路名称和/或门牌号;
目标数据修改模块,用于若校验未通过,则依据所述至少两个参考POI地址数据,对所述目标POI地址数据进行修改。
第三方面,本发明实施例还提供了一种服务器,该服务器包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所述的兴趣点地址数据处理方法。
第四方面,本发明实施例还提供了一种介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所述的兴趣点地址数据处理方法。
本发明实施例提供的一种兴趣点地址数据处理方法、装置、服务器和介质,通过对与目标POI关联的至少两个参考POI地址数据进行分析,即可发现目标POI地址数据是否存在异常,其中POI地址数据包括道路名称和/或门牌号;且在存在异常即校验未通过的情况下,可依据与目标POI关联的至少两个参考POI地址数据,对目标POI地址数据进行修改。相比于现有的技术方案,本方案无需花费大量的人工成本,而且不受人为因素的影响,可实时进行分析,保证了较高的地址准确率,同时满足了时效性的要求。
附图说明
图1A是本发明实施例一中提供的一种兴趣点地址数据处理方法的流程图;
图1B是本发明实施例一中提供的一种兴趣点地址数据的示意图;
图1C是本发明实施例一中提供的另一种兴趣点地址数据的示意图;
图2是本发明实施例二中提供的一种兴趣点地址数据处理方法的流程图;
图3是本发明实施例三中提供的一种兴趣点地址数据处理方法的流程图;
图4是本发明实施例四中提供的一种兴趣点地址数据处理装置的结构框图;
图5是本发明实施例五中提供的一种服务器的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1A是本发明实施例一中提供的一种兴趣点地址数据处理方法的流程图,本实施例可适用于对兴趣点POI地址数据进行处理的情况,该方法可以由兴趣点地址数据处理装置或服务器来执行,该装置可以通过软件和/或硬件的方式来实现。可选的,该装置可以配置于承载POI地址数据处理功能的服务器中。参见图1A,该方法具体可以包括:
S110,依据目标兴趣点POI坐标数据,获取与目标POI关联的至少两个参考POI地址数据。
本实施例中,每个POI数据中可包括POI坐标数据、POI地址数据以及POI名称数据等。本实施例可默认存储POI数据的数据库中POI坐标数据无误,且在此基础上,对POI的地址数据进行校验和修改。其中POI坐标数据可以包括POI的经纬度坐标;POI地址数据可以包括省、市、以及县,还可以包括道路名称和/或门牌号。
目标POI即为需要对地址数据进行校验的POI。可选的,服务器可以实时接收用户选择的目标POI,而后可依据目标POI的标识(如名称)获取目标POI数据。此外,服务器还可以按照存储POI数据的数据库中各POI存储顺序依次对各POI的地址数据进行校验;进而服务器可依据存储顺序,及上一次校验的POI,确定目标POI,并获取目标POI数据。
由于电子地图中的POI所对应的现实中的地物实体在空间中具有关联性、连续性和渐变性等(即空间相关性)。例如一片区域的经纬度、气温以及降水等是渐变的;此外,根据现有的道路门牌号编码规则,可知门牌号具有连续性等。基于上述描述,可获取与目标POI关联的多个参考POI地址数据对目标POI地址数据进行校验和修改。其中,参考POI可以是目标POI的周边POI,也就是说与目标POI之间距离在一定范围内的POI。
具体的,可将目标POI坐标数据显示于电子地图上,并以目标POI为中心,将与目标POI坐标数据之间的距离在一定范围内的所有POI作为参考POI;之后可从存储POI数据的数据库查询获取参考POI地址数据。
为了便于快速查询获取给定坐标周边一定半径范围内的POI数据,可选的,本实施例可基于当前电子地图上的全量POI数据,以及R-Tree数据结构构建空间索引数据库。进而依据目标兴趣点POI坐标数据,获取与目标POI关联的至少两个参考POI地址数据可以为:以目标POI坐标数据为中心,将空间索引数据库中预设半径范围内至少两个POI数据作为参考POI数据;其中POI数据包括POI地址数据;预设半径是预先设定的,可根据实际情况进行调整,例如可以是50m。
需要说明的是,R-Tree是一种空间索引数据结构,可以将POI数据有序的组织起来。空间索引是指依据空间对象的位置和形状或空间对象之间的某种空间关系按一定的顺序排列的一种数据结构。本实施例通过构建空间索引数据库可便于快速查询获取给定坐标周边一定半径范围内的POI数据。此外,参考POI数量越多,对目标POI地址数据的校验结果越准确。
S120,依据至少两个参考POI地址数据,对目标POI地址数据进行校验。
本实施例中,可依据地物实体之间的空间相关性,对所获取的多个参考POI地址数据进行分析,进而确定目标POI地址数据是否存在异常,即实现对目标POI地址数据的校验。
由于一定区域内的地物实体之间地址数据具有连续性,进而依据至少两个参考POI地址数据,对目标POI地址数据进行校验可以是:将至少两个参考POI地址数据,与目标POI地址数据进行连续一致性比对;若比对结果为不一致,则确定目标POI地址数据校验未通过。
需要说明的是,由于POI地址数据中包括道路名称和/或门牌号,进而只要目标POI地址数据中的道路名称和门牌号任意一个,与至少两个参考POI地址数据中的道路名称和门牌号的比对结果为不一致,即可确定目标POI地址数据校验未通过。
例如图1B所示,圆点代表幸福路边上的一些门店(即POI),且右侧方框是每个POI的地址数据中的道路名称和门牌号。假设目标POI的道路名称和门牌号为[幸福路][29号],参考POI的道路名称和门牌号分别为[幸福路][1号],[幸福路][2号],[幸福路][4号]以及[幸福路][5号]等。由于目标POI地址数据中的门牌号,与各参考POI地址数据中的门牌号相差较多,即比对结果为不一致,则确定目标POI地址数据校验未通过。
又如图1C,圆点代表幸福路边上的一些门店(即POI),且右侧方框是每个POI的地址数据中的道路名称和门牌号。假设目标POI的道路名称和门牌号为[建国路][18号],参考POI的道路名称和门牌号分别为[幸福路][1号],[幸福路][2号],[幸福路][4号]以及[幸福路][5号]等。由于目标POI地址数据中的门牌号,与各参考POI地址数据中的门牌号相差较多;而且目标POI地址数据中的道路名称,与各参考POI地址数据中的道路名称均不一致,即比对结果为不一致,则确定目标POI地址数据校验未通过。
需要说明的是,相比于现有的技术方案,本方案无需专业人员实地采集,不需要人工电话核实,也不需要用户主动反馈;可实时通过对现有POI地址数据进行分析,挖掘各POI地址数据之间的空间相关性,即可发现存在异常的POI地址数据,减少了大量的人工成本,而且不受人为因素的影响,保证了较高的地址准确率,同时满足了时效性的要求。
S130,若校验未通过,则依据至少两个参考POI地址数据,对目标POI地址数据进行修改。
具体的,若目标POI地址数据校验未通过,则说明目标POI地址数据存在异常;之后可依据各参考POI地址数据,对目标POI地址数据进行修改。例如,依据图1B所示的各参考POI地址数据中的道路名称和门牌号,可将目标POI地址数据中的门牌号修改为[3号]。
为了保证目标POI地址数据修改的准确度,进一步的,还可以获取目标POI的多个候选地址数据,进而依据至少两个参考POI地址数据,以及所获取的多个候选地址数据,对目标POI地址数据进行修改。具体对目标POI地址数据的修改将在后续实施例中详细说明。
本发明实施例提供的技术方案,通过对与目标POI关联的至少两个参考POI地址数据进行分析,即可发现目标POI地址数据是否存在异常,其中POI地址数据包括道路名称和/或门牌号;且在存在异常即校验未通过的情况下,可依据与目标POI关联的至少两个参考POI地址数据,对目标POI地址数据进行修改。相比于现有的技术方案,本方案无需花费大量的人工成本,而且不受人为因素的影响,可实时进行分析,保证了较高的地址准确率,同时满足了时效性的要求。
实施例二
图2是本发明实施例二中提供的一种兴趣点地址数据处理方法的流程图,本实施例在上述实施例的基础上,进一步对依据至少两个参考POI地址数据,对目标POI地址数据进行校验进行解释说明。参见图2,该方法具体可以包括:
S210,依据目标兴趣点POI坐标数据,获取与目标POI关联的至少两个参考POI地址数据。
S220,对至少两个参考POI地址数据进行切词处理,并从至少两个参考POI地址数据的切词处理结果中提取至少两个参考POI的道路名称和/或门牌号。
可选的,对至少两个参考POI地址数据进行切词处理之前,还可以利用自然语言处理相关技术,构建地址的码库和CRF(条件随机场,Conditional Random Field)切词算法,识别地址数据中的不同成分,并进行分割。例如,某一POI地址数据为“XX市西城区前海西街17号”,利用已构建的切词算法对其进行切词处理,切词处理结果为:[XX市][西城区][前海西街][17号]。
本实施例,可利用已构建的切词算法对各参考POI地址数据进行切词处理,而后可从各参考POI地址数据的切词处理结果中提取各参考POI的道路名称和/或门牌号。例如,某一参考POI地址数据为“XX市西城区前海西街45号”,利用已构建的切词算法对其进行切词处理,切词处理结果为:[XX市][西城区][前海西街][45号],进而从该切词处理结果中提取的该参考POI的道路名称和门牌号为:[前海西街][45号]。
S230,对目标POI地址数据进行切词处理,并从切词处理结果中提取目标POI的道路名称和/或门牌号。
具体的,也可利用已构建的切词算法对目标POI地址数据进行切词处理,并从切词处理结果中提取目标POI的道路名称和/或门牌号。例如,目标POI地址数据为“XX市西城区前海西街17号”,利用已构建的切词算法对该目标POI地址数据进行切词处理,从切词处理结果中所提取的目标POI的道路名称和门牌号为:[前海西街][17号]。
S240,将至少两个参考POI的道路名称和/或门牌号,与目标POI的道路名称和/或门牌号进行连续一致性比对。
具体的,可以将每个参考POI的道路名称和/或门牌号,与目标POI的道路名称和/或门牌号进行连续一致性比对;若存在目标POI的道路名称和/或门牌号,与任一参考POI的道路名称和/或门牌号的比对结果为不一致,则可以确定最终的比对结果为不一致,进而确定目标POI地址数据校验未通过。
示例性的,将至少两个参考POI的道路名称和/或门牌号,与目标POI的道路名称和/或门牌号进行连续一致性比对可以包括:1)若目标POI的道路名称与至少两个参考POI的道路名称不相同,则确定比对结果为不一致。具体的,可以是目标POI的道路名称与各参考POI的道路名称均不相同,例如图1C所示,则可以确定比对结果为不一致。
2)若至少两个参考POI的道路名称与目标POI的道路名称相同,且至少两个参考POI中各参考POI的门牌号与目标POI的门牌号之间的差值均大于设定数值,则确定比对结果为不一致。可选的,至少两个参考POI的道路名称与目标POI的道路名称相同可以是各参考POI的道路名称均与目标POI的道路名称相同例如图1B所示;还可以是,各参考POI中有大于或等于80%的参考POI的道路名称相同,进而若目标POI的道路名称与大于或等于80%的参考POI的道路名称相同,则可以确定至少两个参考POI的道路名称与目标POI的道路名称相同。
其中,设定数值是预先设定的,可以根据实际需求进行调整。例如设定数值可以是大于或等于15。具体的,若目标POI的道路名称和门牌号为:[前海西街][17号]。假设以目标POI坐标数据为中心,从空间索引数据库中获取预设半径为50m范围内所有(如10个)POI数据作为参考POI数据,且这10个参考POI的道路名称和门牌号分别为:[前海西街][44号]、[前海西街][45号]、[前海西街][46号]、[前海西街][47号]、[前海西街][48号]、[前海西街][49号]、[前海西街][50号]、[前海西街][51号]、[大翔凤胡同][1号]、以及[大翔凤胡同][2号]。由于目标POI的道路名称与80%的参考POI的道路名称相同,且80%的参考POI中各参考POI的门牌号与目标POI的门牌号之间的差值均大于15,进而可确定比对结果为不一致。
S250,若比对结果为不一致,则确定目标POI地址数据校验未通过。
S260,若校验未通过,则依据至少两个参考POI地址数据,对目标POI地址数据进行修改。
本发明实施例提供的技术方案,通过对与目标POI关联的至少两个参考POI的道路名称和/或门牌号进行分析,即可发现目标POI的道路名称和/或门牌号是否存在异常;且在存在异常即校验未通过的情况下,可依据与目标POI关联的至少两个参考POI地址数据,对目标POI地址数据进行修改。相比于现有的技术方案,本方案提供了一种基于道路名称和/或门牌号识别POI地址数据异常的方案,无需花费大量的人工成本,而且不受人为因素的影响,可实时进行分析,保证了较高的地址准确率,同时满足了时效性的要求。
实施例三
图3是本发明实施例三中提供的一种兴趣点地址数据处理方法的流程图,本实施例在上述实施例的基础上,进一步对依据至少两个参考POI地址数据,对目标POI地址数据进行修改进行解释说明。参见图3,该方法具体可以包括:
S310,依据目标兴趣点POI坐标数据,获取与目标POI关联的至少两个参考POI地址数据。
S320,依据至少两个参考POI地址数据,对目标POI地址数据进行校验。
其中,POI地址数据包括道路名称和/或门牌号。
S330,若校验未通过,则以目标POI标识为索引,获取目标POI的至少两个候选地址数据。
本实施例中,可预先构建以POI标识为索引(Key),以POI不同数据所组成的数据组为索引值(Value)的索引数据库。其中每一POI的数据组可以由多条不同POI数据组成;可选的,每条POI数据可以包括省、市、以及县,还可以包括道路名称和/或门牌号等。进一步的,同一POI的不同条数据可以是不同来源的数据,例如商家上传的、用户上传的、互联网搜集的等。
候选地址数据可以是索引数据库中所存储的,区别于S320中的目标POI地址数据的其他目标POI的地址数据。具体的,可以以目标POI标识为索引,从预先构建的索引数据库中查询获取目标POI标识所关联的数据组,并从该数据组中提取目标POI的多个候选地址数据。
S340,根据获取的目标POI的至少两个候选地址数据,以及至少两个参考POI地址数据,对目标POI地址数据进行修改。
具体的,在获取目标POI的至少两个候选地址数据之后,可以根据获取的目标POI的至少两个候选地址数据,以及至少两个参考POI地址数据,对目标POI地址数据进行修改。例如,可以根据至少两个参考POI地址数据,确定一个或多个目标POI的修改地址数据;而后将一个或多个目标POI的修改地址数据,与获取的目标POI的至少两个候选地址数据进行匹配,并将匹配结果成功的目标POI的修改地址数据作为目标POI新地址数据。
需要说明的是,本实施例结合目标POI的至少两个候选地址数据,以及至少两个参考POI地址数据,对目标POI地址数据进行修改,可保证目标POI地址数据修改的准确度。
示例性的,根据获取的目标POI的至少两个候选地址数据,以及至少两个参考POI地址数据,对目标POI地址数据进行修改可以包括:
A、针对至少两个候选地址数据中的每一候选地址数据,分别与至少两个参考POI地址数据进行连续一致性比对;
具体的,可以利用已构建的切词算法对各参考POI地址数据进行切词处理,而后可从各参考POI地址数据的切词处理结果中提取各参考POI的道路名称和/或门牌号;同时针对每一候选地址数据,可以利用已构建的切词算法对其地址数据进行切词处理,并从该候选地址数据的切词处理结果中提取候选道路名称和/或候选门牌号;之后可以将每一候选地址数据中提取的候选道路名称和/或候选门牌号,分别与每个参考POI的道路名称和/或门牌号进行连续一致性比对。
进一步的,若存在从某一候选地址数据中提取的候选道路名称与各参考POI的道路名称相同,且从该候选地址数据中提取的候选门牌号与各参考POI的门牌号之间的差值小于设定数值,则可以确定该候选地址的比对结果为一致。
B、将至少两个候选地址数据中比对结果为一致的候选地址数据,作为目标POI新地址数据。
具体的,若至少两个候选地址数据中比对结果为一致的候选地址数据的数量为一个,则可以直接将比对结果为一致的候选地址数据作为目标POI新地址数据。
例如,若各参考POI的道路名称和门牌号如实施例二中的S240所示的10个数据;各候选地址数据的候选道路名称和候选门牌号分别为:[前海西街][4号]、[前海西街][11号]、[前海西街][43号]、[前海西街][107号]、以及[前海西街][8号]。通过将每一候选地址数据中提取的候选道路名称和候选门牌号,分别与每个参考POI的道路名称和门牌号进行连续一致性比对,可得出候选地址数据[前海西街][43号]为比对结果一致的候选地址数据,进而可将其作为目标POI新地址数据。
若至少两个候选地址数据中比对结果为一致的候选地址数据的数量为至少两个,且不相同,则选择一个作为目标POI新地址数据。
例如,若各候选地址数据的候选道路名称和候选门牌号分别为:[前海西街][4号]、[前海西街][11号]、[前海西街][43号]、[前海西街][52号]、以及[前海西街][8号]。通过将每一候选地址数据中提取的候选道路名称和候选门牌号,分别与每个参考POI的道路名称和门牌号进行连续一致性比对,可得出候选地址数据[前海西街][43号]、以及[前海西街][52号]为比对结果一致的候选地址数据,且两者不相同,则可以随机从候选地址数据[前海西街][43号]、以及[前海西街][52号]中选择一个作为目标POI新地址数据。
若至少两个候选地址数据中比对结果为一致的候选地址数据的数量为至少三个,且至少两个相同,则从相同的候选地址数据中选择一个作为目标POI新地址数据。
例如,若各候选地址数据的候选道路名称和候选门牌号分别为:[前海西街][43号]、[前海西街][11号]、[前海西街][43号]、[前海西街][52号]、以及[前海西街][8号]。进而可得出候选地址数据[前海西街][43号]、[前海西街][43号]、以及[前海西街][52号]为比对结果一致的候选地址数据,且候选地址数据[前海西街][43号]相同个数为2,进而将候选地址数据[前海西街][43号]作为目标POI新地址数据。
进一步的,若至少两个候选地址数据中比对结果为一致的候选地址数据的数量为多个,且至少两种相同,则从相同数量多的候选地址数据中选择一个作为目标POI新地址数据。
例如,各候选地址数据的候选道路名称和候选门牌号分别为:[前海西街][43号]、[前海西街][11号]、[前海西街][43号]、[前海西街][52号]、[前海西街][52号]、[前海西街][52号]、以及[前海西街][8号]。由于比对结果一致的候选地址数据有两种分别为:[前海西街][43号]和[前海西街][52号],且[前海西街][52号]的数量多于[前海西街][43号],进而可将[前海西街][52号]作为目标POI新地址数据。
本发明实施例提供的技术方案,在通过对与目标POI关联的至少两个参考POI地址数据进行分析,发现目标POI地址数据存在异常即校验未通过的情况下,可依据与目标POI关联的至少两个参考POI地址数据、以及目标POI的至少两个候选地址数据,对目标POI地址数据进行修改,提供了一种修改异常POI地址数据的新思路。
实施例四
图4为本发明实施例四中提供的一种兴趣点地址数据处理装置的结构示意图,该装置可配置于承载POI地址数据处理功能的服务器上。该装置可执行本发明任意实施例所提供的兴趣点地址数据处理方法,具备执行方法相应的功能模块和有益效果。如图4所示,该装置可以包括:
参考数据获取模块410,用于依据目标兴趣点POI坐标数据,获取与目标POI关联的至少两个参考POI地址数据;
目标数据校验模块420,用于依据至少两个参考POI地址数据,对目标POI地址数据进行校验;其中,POI地址数据包括道路名称和/或门牌号;
目标数据修改模块430,用于若校验未通过,则依据至少两个参考POI地址数据,对目标POI地址数据进行修改。
本发明实施例提供的技术方案,通过对与目标POI关联的至少两个参考POI地址数据进行分析,即可发现目标POI地址数据是否存在异常,其中POI地址数据包括道路名称和/或门牌号;且在存在异常即校验未通过的情况下,可依据与目标POI关联的至少两个参考POI地址数据,对目标POI地址数据进行修改。相比于现有的技术方案,本方案无需花费大量的人工成本,而且不受人为因素的影响,可实时进行分析,保证了较高的地址准确率,同时满足了时效性的要求。
示例性的,参考数据获取模块410具体可以用于:
以目标POI坐标数据为中心,将空间索引数据库中预设半径范围内至少两个POI数据作为参考POI数据;其中POI数据包括POI地址数据。
示例性的,目标数据校验模块420可以包括:
连续性比对单元,用于将至少两个参考POI地址数据,与目标POI地址数据进行连续一致性比对;
校验结果确定单元,用于若比对结果为不一致,则确定目标POI地址数据校验未通过。
示例性的,连续性比对单元可以包括:
切词处理子单元,用于对至少两个参考POI地址数据进行切词处理,并从至少两个参考POI地址数据的切词处理结果中提取至少两个参考POI的道路名称和/或门牌号;
切词处理子单元,还用于对目标POI地址数据进行切词处理,并从切词处理结果中提取目标POI的道路名称和/或门牌号;
第一连续性比对子单元,用于将至少两个参考POI的道路名称和/或门牌号,与目标POI的道路名称和/或门牌号进行连续一致性比对。
示例性的,连续性比对子单元具体可以用于:
若目标POI的道路名称与至少两个参考POI的道路名称不相同,则确定比对结果为不一致;
若至少两个参考POI的道路名称与目标POI的道路名称相同,且至少两个参考POI中各参考POI的门牌号与目标POI的门牌号之间的差值均大于设定数值,则确定比对结果为不一致。
示例性的,目标数据修改模块430可以包括:
候选数据获取单元,用于以目标POI标识为索引,获取目标POI的至少两个候选地址数据;
目标数据修改单元,用于根据获取的目标POI的至少两个候选地址数据,以及至少两个参考POI地址数据,对目标POI地址数据进行修改。
示例性的,目标数据修改单元可以包括:
第二连续性比对子单元,用于针对至少两个候选地址数据中的每一候选地址数据,分别与至少两个参考POI地址数据进行连续一致性比对;
目标数据修改子单元,用于将至少两个候选地址数据中比对结果为一致的候选地址数据,作为目标POI新地址数据。
示例性的,目标数据修改子单元,具体可以用于:
若至少两个候选地址数据中比对结果为一致的候选地址数据的数量为至少两个,且不相同,则选择一个作为目标POI新地址数据;
若至少两个候选地址数据中比对结果为一致的候选地址数据的数量为至少三个,且至少两个相同,则从相同的候选地址数据中选择一个作为目标POI新地址数据。
实施例五
图5为本发明实施例五中提供的一种服务器的结构示意图。图5示出了适于用来实现本发明实施方式的示例性服务器12的框图。图5显示的服务器12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,服务器12以通用计算设备的形式表现。服务器12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,存储器28,连接不同系统组件(包括存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
服务器12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被服务器12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该服务器12交互的设备通信,和/或与使得该服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与服务器12的其它模块通信。应当明白,尽管图5中未示出,可以结合服务器12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的兴趣点地址数据处理方法。
实施例六
本发明实施例六中还提供了一种计算机可读存储介质,其上存储有计算机程序(或称为计算机可执行指令),该程序被处理器执行时用于执行本发明实施例所提供的兴趣点地址数据处理方法。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (11)

1.一种兴趣点地址数据处理方法,其特征在于,包括:
依据目标兴趣点POI坐标数据,获取与目标POI关联的至少两个参考POI地址数据;
依据所述至少两个参考POI地址数据,对所述目标POI地址数据进行校验;其中,POI地址数据包括道路名称和/或门牌号;
若校验未通过,则依据所述至少两个参考POI地址数据,对所述目标POI地址数据进行修改。
2.根据权利要求1所述的方法,其特征在于,依据目标兴趣点POI坐标数据,获取与所述目标POI关联的至少两个参考POI地址数据,包括:
以所述目标POI坐标数据为中心,将空间索引数据库中预设半径范围内至少两个POI数据作为参考POI数据;其中POI数据包括POI地址数据。
3.根据权利要求1所述的方法,其特征在于,依据所述至少两个参考POI地址数据,对所述目标POI地址数据进行校验,包括:
将所述至少两个参考POI地址数据,与所述目标POI地址数据进行连续一致性比对;
若比对结果为不一致,则确定所述目标POI地址数据校验未通过。
4.根据权利要求3所述的方法,其特征在于,将所述至少两个参考POI地址数据,与所述目标POI地址数据进行连续一致性比对,包括:
对所述至少两个参考POI地址数据进行切词处理,并从所述至少两个参考POI地址数据的切词处理结果中提取所述至少两个参考POI的道路名称和/或门牌号;
对所述目标POI地址数据进行切词处理,并从切词处理结果中提取目标POI的道路名称和/或门牌号;
将所述至少两个参考POI的道路名称和/或门牌号,与所述目标POI的道路名称和/或门牌号进行连续一致性比对。
5.根据权利要求4所述的方法,其特征在于,将所述至少两个参考POI的道路名称和/或门牌号,与所述目标POI的道路名称和/或门牌号进行连续一致性比对,包括:
若所述目标POI的道路名称与所述至少两个参考POI的道路名称不相同,则确定比对结果为不一致;
若所述至少两个参考POI的道路名称与所述目标POI的道路名称相同,且所述至少两个参考POI中各参考POI的门牌号与所述目标POI的门牌号之间的差值均大于设定数值,则确定比对结果为不一致。
6.根据权利要求1所述的方法,其特征在于,依据所述至少两个参考POI地址数据,对所述目标POI地址数据进行修改,包括:
以所述目标POI标识为索引,获取所述目标POI的至少两个候选地址数据;
根据获取的目标POI的至少两个候选地址数据,以及所述至少两个参考POI地址数据,对所述目标POI地址数据进行修改。
7.根据权利要求6所述的方法,其特征在于,根据获取的目标POI的至少两个候选地址数据,以及所述至少两个参考POI地址数据,对所述目标POI地址数据进行修改,包括:
针对所述至少两个候选地址数据中的每一候选地址数据,分别与所述至少两个参考POI地址数据进行连续一致性比对;
将所述至少两个候选地址数据中比对结果为一致的候选地址数据,作为所述目标POI新地址数据。
8.根据权利要求7所述的方法,其特征在于,将所述至少两个候选地址数据中比对结果为一致的候选地址数据,作为所述目标POI新地址数据,包括:
若所述至少两个候选地址数据中比对结果为一致的候选地址数据的数量为至少两个,且不相同,则选择一个作为目标POI新地址数据;
若所述至少两个候选地址数据中比对结果为一致的候选地址数据的数量为至少三个,且至少两个相同,则从相同的候选地址数据中选择一个作为目标POI新地址数据。
9.一种兴趣点地址数据处理装置,其特征在于,包括:
参考数据获取模块,用于依据目标兴趣点POI坐标数据,获取与目标POI关联的至少两个参考POI地址数据;
目标数据校验模块,用于依据所述至少两个参考POI地址数据,对所述目标POI地址数据进行校验;其中,POI地址数据包括道路名称和/或门牌号;
目标数据修改模块,用于若校验未通过,则依据所述至少两个参考POI地址数据,对所述目标POI地址数据进行修改。
10.一种服务器,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一项所述的兴趣点地址数据处理方法。
11.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一项所述的兴趣点地址数据处理方法。
CN201910677496.9A 2019-07-25 2019-07-25 一种兴趣点地址数据处理方法、装置、服务器和介质 Pending CN110413904A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910677496.9A CN110413904A (zh) 2019-07-25 2019-07-25 一种兴趣点地址数据处理方法、装置、服务器和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910677496.9A CN110413904A (zh) 2019-07-25 2019-07-25 一种兴趣点地址数据处理方法、装置、服务器和介质

Publications (1)

Publication Number Publication Date
CN110413904A true CN110413904A (zh) 2019-11-05

Family

ID=68363232

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910677496.9A Pending CN110413904A (zh) 2019-07-25 2019-07-25 一种兴趣点地址数据处理方法、装置、服务器和介质

Country Status (1)

Country Link
CN (1) CN110413904A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111177289A (zh) * 2019-12-12 2020-05-19 山东省国土测绘院 众源网络数据空间相关信息提取校验方法与系统
CN111723172A (zh) * 2020-06-10 2020-09-29 广东世纪高通科技有限公司 一种数据融合方法及装置
CN112988989A (zh) * 2019-12-18 2021-06-18 中国移动通信集团四川有限公司 一种地名地址匹配方法及服务器

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103021260A (zh) * 2012-12-14 2013-04-03 北京百度网讯科技有限公司 一种道路门牌数据的校验方法和装置
CN103886082A (zh) * 2014-03-26 2014-06-25 百度在线网络技术(北京)有限公司 对兴趣点的位置信息进行校验的方法和设备
US20150073709A1 (en) * 2013-09-10 2015-03-12 Apple Inc. Point of Interest Location Determination Based on Application Usage
CN105760360A (zh) * 2014-12-16 2016-07-13 高德软件有限公司 一种地址纠正方法和装置
CN106919567A (zh) * 2015-12-24 2017-07-04 北京四维图新科技股份有限公司 一种兴趣点poi地址的处理方法及装置
CN108304423A (zh) * 2017-03-29 2018-07-20 腾讯科技(深圳)有限公司 一种信息识别方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103021260A (zh) * 2012-12-14 2013-04-03 北京百度网讯科技有限公司 一种道路门牌数据的校验方法和装置
US20150073709A1 (en) * 2013-09-10 2015-03-12 Apple Inc. Point of Interest Location Determination Based on Application Usage
CN103886082A (zh) * 2014-03-26 2014-06-25 百度在线网络技术(北京)有限公司 对兴趣点的位置信息进行校验的方法和设备
CN105760360A (zh) * 2014-12-16 2016-07-13 高德软件有限公司 一种地址纠正方法和装置
CN106919567A (zh) * 2015-12-24 2017-07-04 北京四维图新科技股份有限公司 一种兴趣点poi地址的处理方法及装置
CN108304423A (zh) * 2017-03-29 2018-07-20 腾讯科技(深圳)有限公司 一种信息识别方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111177289A (zh) * 2019-12-12 2020-05-19 山东省国土测绘院 众源网络数据空间相关信息提取校验方法与系统
CN112988989A (zh) * 2019-12-18 2021-06-18 中国移动通信集团四川有限公司 一种地名地址匹配方法及服务器
CN111723172A (zh) * 2020-06-10 2020-09-29 广东世纪高通科技有限公司 一种数据融合方法及装置

Similar Documents

Publication Publication Date Title
CN107656913B (zh) 地图兴趣点地址提取方法、装置、服务器和存储介质
US11698261B2 (en) Method, apparatus, computer device and storage medium for determining POI alias
Li et al. An optimisation model for linear feature matching in geographical data conflation
US8306971B2 (en) Methods and systems of automatically geocoding a dataset for visual analysis
CN109492164A (zh) 一种简历的推荐方法、装置、电子设备及存储介质
CN110413904A (zh) 一种兴趣点地址数据处理方法、装置、服务器和介质
CN108647355A (zh) 测试用例的展示方法、装置、设备及存储介质
CN107221328B (zh) 修改源的定位方法及装置、计算机设备及可读介质
WO2021121296A1 (zh) 习题测试数据生成方法以及装置
CN110659433B (zh) Poi价值评估的方法、装置、设备和计算机存储介质
CN107506499A (zh) 兴趣点与建筑物之间建立逻辑关系的方法、装置及服务器
CN113239173B (zh) 问答数据的处理方法、装置、存储介质与电子设备
CN111881377A (zh) 位置兴趣点的处理方法及装置
US20090143125A1 (en) Population of landmarks for use with a map application
CN109492066A (zh) 一种兴趣点分支名称的确定方法、装置、设备及存储介质
JP2023530795A (ja) 地理的位置区域の符号化方法、符号化モデルを確立する方法、及び装置
CN110928964A (zh) 行政区域定位方法、装置、计算机设备及存储介质
US20110289086A1 (en) System, method and apparatus for data analysis
CN111126422B (zh) 行业模型的建立及行业的确定方法、装置、设备及介质
CN109446433B (zh) 一种兴趣点失效校验方法、装置、服务器及存储介质
CN107704589A (zh) 基于运单的兴趣点失效挖掘方法、装置、服务器及介质
CN110908980B (zh) 用户标识映射关系建立方法、系统、设备及存储介质
CN110457705B (zh) 一种兴趣点数据处理方法、装置、设备和存储介质
CN114237588A (zh) 一种代码仓库选择方法、装置、设备及存储介质
CN108021656B (zh) 比对坐标的生成方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191105

RJ01 Rejection of invention patent application after publication