CN107832325A - 一种poi数据校验方法与设备 - Google Patents

一种poi数据校验方法与设备 Download PDF

Info

Publication number
CN107832325A
CN107832325A CN201710835361.1A CN201710835361A CN107832325A CN 107832325 A CN107832325 A CN 107832325A CN 201710835361 A CN201710835361 A CN 201710835361A CN 107832325 A CN107832325 A CN 107832325A
Authority
CN
China
Prior art keywords
poi data
target
line
target poi
title
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710835361.1A
Other languages
English (en)
Other versions
CN107832325B (zh
Inventor
何守伟
魏承东
卢伟涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710835361.1A priority Critical patent/CN107832325B/zh
Publication of CN107832325A publication Critical patent/CN107832325A/zh
Application granted granted Critical
Publication of CN107832325B publication Critical patent/CN107832325B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请的目的是提供一种POI数据校验方法,获取用户提交的目标POI数据;根据所述目标POI数据的坐标信息确定所述目标POI数据对应的一个或多个线上POI数据,其中,每个线上POI数据与所述目标POI数据的距离小于或等于距离阈值;根据所述线上POI数据对所述目标POI数据进行校验处理。本申请提高了审核的时效性、数据的利用率。

Description

一种POI数据校验方法与设备
技术领域
本申请涉及计算机领域,尤其涉及一种POI数据校验技术。
背景技术
随着时代的发展,电子地图POI(Point of Interest,兴趣点)是基于位置服务最核心的数据,在电子地图上运用场景广泛。POI-UGC(User Generated Content,用户生成内容)新增是一种借助于地图用户提供的情报加工成为基础POI数据的重要手段,目前在实际的加工场景中,我们常常使用外业人工审核,依赖人工电话核实的手段进行用户工单数据的核实。目前,确定电子地图中POI是否有效,主要是通过采集人员现场调查、用户反馈等。由于人工的固有劣势,这种生产方式并不能保证工单审核的时效性,而且生产成本较高。
发明内容
本申请的一个目的是提供一种POI数据校验方法。
根据本申请的一个方面,提供了一种POI数据校验方法,包括:
a获取用户提交的目标POI数据;
b根据所述目标POI数据的坐标信息确定所述目标POI数据对应的一个或多个线上POI数据,其中,每个线上POI数据与所述目标POI数据的距离小于或等于距离阈值;
c根据所述线上POI数据对所述目标POI数据进行校验处理。
优选地,所述步骤c包括:
检查所述一个或多个线上POI数据中是否存在与所述目标POI数据名称相匹配的线上POI数据;
若存在与所述目标POI数据名称相匹配的线上POI数据,将对应的名称匹配信息作为所述目标POI数据的校验结果信息。
优选地,所述名称匹配信息包括以下任一项:
名称全等;
名称相似;
名称关联;
核心词匹配。
优选地,所述步骤c还包括:
若所述一个或多个线上POI数据中不存在与所述目标POI数据名称相匹配的线上POI数据,检查所述一个或多个线上POI数据中是否存在与所述目标POI数据名称关联或核心词匹配的线上POI数据;
若存在与所述目标POI数据核心词相匹配的线上POI数据,确定所述所述目标POI数据的校验结果信息为核心词匹配。
优选地,检查所述一个或多个线上POI数据中是否存在与所述目标POI数据核心词匹配的线上POI数据,包括:
通过通用词过滤处理确定所述线上POI数据对应的核心词;
检查所述线上POI数据对应的核心词是否与所述目标POI数据的核心词相匹配。
优选地,所述方法还包括:
对所述线上POI数据进行预处理;
其中,所述步骤c包括:
根据预处理后的所述线上POI数据对所述目标POI数据进行校验处理。
优选地,所述方法还包括:
对所述目标POI数据进行校正处理;
其中,所述步骤c包括:
根据所述线上POI数据对校正处理后的所述目标POI数据进行校验处理。
优选地,所述方法还包括:
r根据所述目标POI数据对应的实体信息确定所述目标POI数据对应的距离阈值;
其中,所述步骤b包括:
根据所述目标POI数据的坐标信息确定所述目标POI数据对应的一个或多个线上POI数据,其中,每个线上POI数据与所述目标POI数据的距离小于或等于所述距离阈值。
优选地,所述步骤r包括:
根据所述目标POI数据对应的实体信息,确定所述实体信息对应的实体尺寸信息;
根据所述实体尺寸信息确定所述目标POI数据对应的距离阈值。
根据本申请的另一个方面,提供了一种POI数据校验装置,包括:
第一模块,用于获取用户提交的目标POI数据;
第二模块,用于根据所述目标POI数据的坐标信息确定所述目标POI数据对应的一个或多个线上POI数据,其中,每个线上POI数据与所述目标POI数据的距离小于或等于距离阈值;
第三模块,用于根据所述线上POI数据对所述目标POI数据进行校验处理。
优选地,所述第三模块用于:
检查所述一个或多个线上POI数据中是否存在与所述目标POI数据名称相匹配的线上POI数据;
若存在与所述目标POI数据名称相匹配的线上POI数据,将对应的名称匹配信息作为所述目标POI数据的校验结果信息。
优选地,所述名称匹配信息包括以下至少任一项:
名称全等;
名称相似;
名称关联;
核心词匹配。
优选地,所述第三模块还用于:
若所述一个或多个线上POI数据中不存在与所述目标POI数据名称相匹配的线上POI数据,检查所述一个或多个线上POI数据中是否存在与所述目标POI数据名称关联或核心词匹配的线上POI数据;
若存在与所述目标POI数据核心词相匹配的线上POI数据,确定所述所述目标POI数据的校验结果信息为核心词匹配。
优选地,检查所述一个或多个线上POI数据中是否存在与所述目标POI数据核心词匹配的线上POI数据,包括:
通过通用词过滤处理确定所述线上POI数据对应的核心词;
检查所述线上POI数据对应的核心词是否与所述目标POI数据的核心词相匹配。
优选地,所述装置还包括第五模块,用于:
对所述线上POI数据进行预处理;
其中,所述第三模块用于:
根据预处理后的所述线上POI数据对所述目标POI数据进行校验处理。
优选地,所述装置还包括第六模块,用于:
对所述目标POI数据进行校正处理;
其中,所述第三模块用于:
根据所述线上POI数据对校正处理后的所述目标POI数据进行校验处理。
优选地,所述装置还包括第四模块,用于:
根据所述目标POI数据对应的实体信息确定所述目标POI数据对应的距离阈值;
其中,所述第二模块用于:
根据所述目标POI数据的坐标信息确定所述目标POI数据对应的一个或多个线上POI数据,其中,每个线上POI数据与所述目标POI数据的距离小于或等于所述距离阈值。
优选地,所述第四模块用于:
根据所述目标POI数据对应的实体信息,确定所述实体信息对应的实体尺寸信息;
根据所述实体尺寸信息确定所述目标POI数据对应的距离阈值。
根据本申请的另一个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机代码,当所述计算机代码被执行时,如上述任一项所述的方法被执行。
根据本申请的另一个方面,提供了一种计算机程序产品,当所述计算机程序产品被计算机设备执行时,如上述任一项所述的方法被执行。
一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个计算机程序;
当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述任一项所述的方法。
与现有技术相比,本申请提供了一种基于周边POI信息,实现自动审核验证新POI的方法,用户提交新POI后,根据新POI的坐标获取附近线上POI信息,经过数据校正处理操作,对比分析最终确定新POI机审结论为名称全等、名称相似、名称关联、核心词匹配等;解决了现有技术中依赖人工电话核实、生产成本高等问题,提高了审核的时效性、数据的利用率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1所示为本申请一个方面的一种POI数据校验装置;
图2所示为本申请优选的一种POI数据校验装置的结构示意图;
图3所示为本申请在一种具体示例中所描绘的内容;
图4所示为本申请一个方面的一种POI数据校验方法流程图;
图5所示为本申请优选的一种POI数据校验方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时处理可以被终止,但是还可以具有未包括在附图中的附加步骤。处理可以对应于方法、函数、规程、子例程、子程序等等。
在上下文中所称“计算机设备”,也称为“电脑”,是指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备,其可以包括处理器与存储器,由处理器执行在存储器中预存的存续指令来执行预定处理过程,或是由ASIC、FPGA、DSP等硬件执行预定处理过程,或是由上述二者组合来实现。计算机设备包括但不限于服务器、个人电脑、笔记本电脑、平板电脑、智能手机等。
计算机设备包括用户设备与网络设备。其中,用户设备包括但不限于电脑、智能手机、PDA等;网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,计算机设备可单独运行来实现本申请,也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本申请。其中,计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
需要说明的是,用户设备、网络设备和网络等仅为举例,其他现有的或今后可能出现的计算机设备或网络如可适用于本申请,也应包含在本申请保护范围以内,并以引用方式包含于此。
后面所讨论的方法(其中一些通过流程图示出)可以通过硬件、软件、固件、中间件、微代码、硬件描述语言或者其任意组合来实施。当用软件、固件、中间件或微代码来实施时,用以实施必要任务的程序代码或代码段可以被存储在机器或计算机可读介质(比如存储介质)中。(一个或多个)处理器可以实施必要的任务。
这里所公开的具体结构和功能细节仅仅是代表性的,并且是用于描述本申请的示例性实施例的目的。但是本申请可以通过许多替换形式来具体实现,并且不应当被解释成仅仅受限于这里所阐述的实施例。
应当理解的是,虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元,但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说,在不背离示例性实施例的范围的情况下,第一单元可以被称为第二单元,并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。
应当理解的是,当一个单元被称为“连接”或“耦合”到另一单元时,其可以直接连接或耦合到另一单元,或者可以存在中间单元。与此相对,当一个单元被称为“直接连接”或“直接耦合”到另一单元时,则不存在中间单元。应当按照类似的方式来解释被用于描述单元之间的关系的其他词语(例如“处于...之间”相比于“直接处于...之间”,“与...邻近”相比于“与...直接邻近”等等)。
这里所使用的术语仅仅是为了描述具体实施例而不意图限制示例性实施例。除非上下文明确地另有所指,否则这里所使用的单数形式“一个”、“一项”还意图包括复数。还应当理解的是,这里所使用的术语“包括”和/或“包含”规定所陈述的特征、整数、步骤、操作、单元和/或组件的存在,而不排除存在或添加一个或更多其他特征、整数、步骤、操作、单元、组件和/或其组合。
还应当提到的是,在一些替换实现方式中,所提到的功能/动作可以按照不同于附图中标示的顺序发生。举例来说,取决于所涉及的功能/动作,相继示出的两幅图实际上可以基本上同时执行或者有时可以按照相反的顺序来执行。
基于上述技术背景中提到的实际工作中所产生的问题,为提升对POI数据审核校验的速度以及准确性,降低审核成本以及提升数据上传用户以及被验证用户的体验。
如图1所示,根据本申请一个方面,提供了一种POI数据校验装置。其中,装置1包括:第一模块11、第二模块12和第三模块13。其中,第一模块11获取用户提交的目标POI数据;第二模块12根据目标POI数据的坐标信息确定目标POI数据对应的一个或多个线上POI数据,其中,每个线上POI数据与目标POI数据的距离小于或等于距离阈值;第三模块13根据线上POI数据对目标POI数据进行校验处理。装置中的各模块可以是基于处理器执行程序时对所连接的存储器、网络接口等硬件按时序调用而构成硬件组合。利用相应硬件组合而得到的模块将执行程序所描述的工作过程。
具体地,第一模块11获取POI-UGC系统上报页面用户提交的目标POI数据,其中,目标POI数据包括但不限于:POI数据的名称信息、POI数据的坐标信息。例如,获取的目标POI数据名称信息“香醇咖啡厅(AB大厦)”、经纬度信息。获取用户提交的目标POI数据,包括但不限于通过电子地图的数据递交页面获取用户填写的POI数据、使用一般后台数据获取,例如通过查询系统可访问的数据库获取。
当然,本领域技术人员应能理解,上述目标POI数据仅为举例,其他现有的或今后可能出现的目标POI数据若可适用于本申请,也应被包含在本申请的保护范围之内,并在此以引用的方式包含于此。
第二模块12根据目标POI数据的坐标信息确定目标POI数据对应的一个或多个线上POI数据,其中,每个线上POI数据与目标POI数据的距离小于或等于距离阈值。在一些实施例中,线上POI数据的获取途径包括从可访问数据来源的网络设备(例如,包括但不限于网络主机、云端服务器等)获得。在此,该坐标信息可以包含于该目标POI数据,例如,用户在提交该目标POI数据的同时输入了该目标POI数据的坐标信息;或者,从存储该目标POI数据的数据库中读取该坐标信息。
例如,第二模块12在获得目标POI数据“香醇咖啡厅(AB大厦)”后,根据该目标POI数据的名称信息“香醇咖啡厅(AB大厦)”匹配获得对应该目标POI数据的坐标信息及经纬度信息;再根据该目标POI数据的坐标信息获得包括“AB大厦”在内的一个或多个线上POI数据。
本领域技术人员应能理解上述确定与目标POI数据相匹配的一个或多个线上POI数据的方式仅为举例,其他现有的或今后可能出现的确定与目标POI数据相匹配的一个或多个线上POI数据的方式如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。
第三模块13根据线上POI数据对目标POI数据进行校验处理。具体例如,第二模块12确定与目标POI数据“香醇咖啡厅(AB大厦)”相对应的一个或多个线上POI数据,其中包括线上POI数据“AB大厦”,与上述目标POI数据名称进行一一比较检查和匹配查询。
在一些实施例中,第三模块13检查一个或多个线上POI数据中是否存在与目标POI数据名称相匹配的线上POI数据;若存在与目标POI数据名称相匹配的线上POI数据,将对应的名称匹配信息作为目标POI数据的校验结果信息。
优选的,名称匹配信息包括以下任一项:名称全等或名称相似。例如,两个POI数据的名称完全相同,则该两个POI数据存在名称全等,将名称全等作为目标POI数据的校验结果信息;名称相似也称为两个POI数据的名称存在高阈值相似,例如若目标POI数据名称与线上POI数据名称不存在名称全等,将进一步匹配校验是否存在名称相似。名称相似的判断可与名称全等的判断同步进行,也可在名称全等的判断之后进行。
在一些实施例中,匹配校验是否存在名称相似(或称为是否存在高阈值相似),例如相似度阈值设置为75%时,当两个POI数据名称Jaccard(杰卡德)字符串相似度>75%,则存在名称相似。其中Jaccard字符串相似度为字符串集A与字符串集B交集的大小与字符串集A与字符串集B并集的大小的比值。在其他实施例中,名称相似的判断还需要结合两个POI数据名称的长度差信息,例如设置长度差阈值为5,当两个POI数据的长度差不大于该长度差阈值,再对该两个POI数据进行字符串相似度的计算。
例如,检查目标POI数据名称“上海市北京酒店”与线上POI数据名称“上海市北京大酒店”,两个字符串集交集与并集大小之比为87.5%,因此字符串相似度为87.5%,由于该相似度87.5%>相似度阈值75%,则目标POI数据名称与线上POI数据名称存在名称相似(有时也可称为高阈值相似)。最终将名称相似作为目标POI数据的校验结果信息。
在另一些实施例中,匹配校验是否存在名称相似(或称为是否存在高阈值相似),从的目标POI数据名称A逐字剔除掉线上POI数据名称B;如果剔除后的结果仅剩余的词是通用词表中通用词,则存在名称相似。其中,通用词表包括但不限于对线上全量POI名称进行分词(将汉字序列切分成单独的词)清洗维护的通用词表;在一些实施例中,线上全量POI使用一般后台数据获取。
例如,目标POI数据名称是“CDE”,线上POI数据名称是“CDE农家乐”,从线上POI数据名称中逐字剔除目标POI数据名称,剔除后剩余“农家乐”,而“农家乐”是通用词表中的通用词,则存在名称相似。最终将名称相似作为目标POI数据的校验结果信息。
优选的,名称匹配信息还包括名称关联或核心词匹配。在一些实施例中,名称关联或核心词匹配的判断,可与目标POI数据名称与线上POI数据名称全等或名称相似的判断同步进行,也可在名称全等或名称相似的判断之后进行,例如不存在名称全等或名称相似时。
在一些实施例中,第三模块13对目标POI数据和第二模块12获得的一个或多个线上POI数据校验处理,若一个或多个线上POI数据中不存在与目标POI数据名称相匹配的线上POI数据,检查一个或多个线上POI数据中是否存在与目标POI数据名称关联或核心词匹配的线上POI数据;
若存在与目标POI数据核心词相匹配的线上POI数据,确定目标POI数据的校验结果信息为核心词匹配。
在一些实施例中,当满足POI数据名称A全包含POI数据名称B,其中,POI数据名称A的部分和POI数据名称B的全部或部分完全相同,并且POI数据名称A的长度大于POI数据名称B,则两者存在名称关联。
例如,目标POI数据名称“XX科技大厦(香醇咖啡厅店)”和线上POI数据名称“XX科技大厦”,满足目标POI数据名称全包含线上POI数据名称,则存在名称关联。
若不存在名称关联,进一步检查目标POI数据名称与线上POI数据名称是否存在核心词匹配。其中,将两个POI数据名称全部剔除通用词,得到核心词,对核心词比较检查;当两个POI数据名称Jaccard字符串相似度小于等于预设的相似度阈值,判定满足阈值则判定存在核心词匹配。例如,目标POI数据名称“AB市漫风婚纱摄影”,和线上POI数据名称“AB市漫风摄影工作室”,剔除通用词(同上)后两个POI名称均只剩下“漫风”,此时由于目标POI数据名称“AB市漫风婚纱摄影”与线上POI数据名称“AB市漫风摄影工作室”具有相同的核心词“漫风”,即目标POI数据名称与线上POI数据名称的校验结果信息为核心词匹配。
例如,目标POI数据名称“ABC咖啡厅”和线上POI数据名称“DE咖啡”,剔除通用词(同上)后两个POI名称分别剩下“ABC”、“CD”,则不存在核心词匹配,最终确定的校验结果信息为不存在核心词匹配。
优选的,第三模块13检查一个或多个线上POI数据中是否存在与目标POI数据核心词匹配的线上POI数据,包括:通过通用词过滤处理确定线上POI数据对应的核心词;检查线上POI数据对应的核心词是否与目标POI数据的核心词相匹配。
具体而言,其中,通用词表包括但不限于利用线上全量POI名称进行分词清洗1万多个POI名称获得,并按照长度排序。例如,目标POI数据“AB咖啡店”通过通用词表过滤获得核心词“AB”。
一个或多个线上POI数据名称与通用词表如下表1所示。
表1
线上POI数据 通用词表
CD工作室 书店
AB学校 体育场
…… ……
通过通用词表过滤线上POI数据名称“CD工作室”获得核心词为“CD”,过滤线上POI数据名称“AB学校”获得核心词为“AB”。
检查线上POI数据对应的核心词是否与目标POI数据的核心词相匹配。
表2
例如,如表2所示,线上POI数据名称“CD工作室”的核心词为“CD”、线上POI数据名称“AB学校”的核心词为“AB”分别于目标POI数据的核心词“AB”进行匹配,最终获得线上POI数据名称“CD工作室”与目标POI数据名称“AB咖啡店”不存在核心词匹配,而线上POI数据名称“AB学校”与目标POI数据“AB咖啡店”存在核心词匹配。
参考图2,在一些实施例中,装置1还包括第四模块14。其中,第一模块11获取用户提交的目标POI数据;第四模块14根据目标POI数据对应的实体信息确定目标POI数据对应的距离阈值;第二模块12根据目标POI数据的坐标信息确定目标POI数据对应的一个或多个线上POI数据,其中,每个线上POI数据与目标POI数据的距离小于或等于距离阈值;第三模块13根据线上POI数据对目标POI数据进行校验处理。装置中的各模块可以是基于处理器执行程序时对所连接的存储器、网络接口等硬件按时序调用而构成硬件组合。利用相应硬件组合而得到的模块将执行程序所描述的工作过程。
具体的,如图3的具体示例中所描绘第四模块14根据目标POI数据对应的实体信息确定目标POI数据对应的距离阈值;此时,第二模块12根据目标POI数据的坐标信息确定目标POI数据对应的一个或多个线上POI数据,其中,每个线上POI数据与目标POI数据的距离小于或等于距离阈值。
例如,第四模块14根据目标POI数据通过通用词表获得对应的实体,进而获得实体信息,其中实体信息可包括(但不限于)实体名称或实体距离,根据该实体信息可以进一步确定目标POI数据对应的距离阈值。其中,距离阈值用于表征目标POI数据对应目标实体的范围,例如,参考表3,当目标POI数据对应的实体信息为“书店”,该实体信息“书店”对应的距离阈值是300m。
表3
序号 实体信息 距离阈值
1 书店 300m
2 学校 1000m
3 体育场 1500m
例如,继续参考表3,此时,第二模块12根据目标POI数据的坐标信息确定目标POI数据对应的一个或多个线上POI数据,其中,每个线上POI数据与目标POI数据的距离小于或等于距离阈值。在一些实施例中,根据目标POI数据与上述距离阈值,确定一定范围内的一个或多个线上POI数据,例如该范围是以目标POI数据对应坐标为圆心、相应距离阈值为半径的圆形区域。例如,目标POI数据对应的一个或多个线上POI数据包括“AB书店”、“XX学校”、“CD体育场”,其中“AB书店”与目标POI数据对应坐标的距离≤“书店”对应的距离阈值“300m”,“XX学校”与目标POI数据对应坐标的距离≤“学校”的距离阈值“1000m”;“CD体育场”与目标POI数据对应坐标的距离≤距离阈值“1500m”。
优选的,第四模块14根据目标POI数据对应的实体信息,确定实体信息对应的实体尺寸信息;根据实体尺寸信息确定目标POI数据对应的距离阈值。其中,实体尺寸信息是一个参考值,用于表征目标POI数据对应目标所占区域大小,例如圆形区域的半径或方形区域的边长。例如,目标POI数据“DF书店”对应的实体信息“书店”,在一些实施例中,通过通用词表查询匹配获得“书店”对应的实体尺寸信息“100m”,其中,通过通用词表查询匹配实体尺寸信息包括但不限于使用一般后台数据获取,进而确定目标POI数据对应的距离阈值,例如,取实体尺寸信息的一定倍数作为该目标POI数据对应的距离阈值。例如,假设预定距离阈值为实体尺寸信息的5倍,则上例中的目标POI数据对应的距离阈值为500m。
表4
序号 实体信息 实体尺寸信息 距离阈值
4 书店 100m 300m
5 学校 800m 1000m
6 体育场 1000m 1500m
例如,如表4所见,根据实体尺寸信息确定目标POI数据对应的距离阈值,如根据上述“AB书店”获得对应实体尺寸信息“100m”,进而匹配对应的距离阈值“300m”;根据“XX学校”获得对应实体尺寸信息“800m”,进而匹配对应的距离阈值“1000m”;根据“CD体育场”获得对应实体尺寸信息“1000m”,进而匹配对应的距离阈值“1500m”。
在一些实施例中,装置还包括第五模块(图中未标出),第五模块对线上POI数据进行校正处理;其中,对线上POI数据名称校正处理包括但不限于:特殊字符过滤、括号统一化、剔除省市区信息或同义词替换。例如,线上POI数据名称中有一些字符,比如"-"等直接剔除;线上POI数据名称中的非全角小括号的括号统一转换成全角括号;对于线上POI数据名称,省市县信息会影响校验的准确性,因此直接剔除,如“XX市AB县CD大酒店”中“XX市AB县”直接剔除掉;某些词语同义不同名,直接根据同义词词表进行统一地转换,提高字符校验策略准确率,如“XX网咖”统一转换成“XX网吧”,自动存取款机转换成ATM。
在一些实施例中,装置还包括第六模块(图中未标出),第六模块对目标POI数据进行校正处理;其中,对目标POI名称校正处理包括但不限于:繁体字过滤、压缩空白、特殊字符过滤、括号统一化、剔除省信息或同义词替换。例如,目标POI数据名称中的有繁体字,比如“滙”等直接剔除;目标POI数据名称中有一些误输入,比如";!"等直接剔除;目标POI数据名称如“XX书香#苑”直接压缩成“XX书香苑”(其中,“#”代表空格);目标POI数据名称中的非全角小括号的括号统一转换成全角括号;对于目标POI数据名称,省信息会影响校验的准确性,因此直接剔除,如“XX市AB大酒店”中“XX市”直接剔除掉;某些词语同义不同名,直接根据同义词词表进行统一地转换,提高字符校验策略准确率,如“XX网咖”统一转换成“XX网吧”,自动存取款机转换成ATM。
如图4所示,根据本申请一个方面,提供了一种POI数据校验方法。其中,该方法包括步骤S11、步骤S12和步骤S13。其中,在步骤S11中,装置1获取用户提交的目标POI数据;在步骤S12中,装置1根据目标POI数据的坐标信息确定目标POI数据对应的一个或多个线上POI数据,其中,每个线上POI数据与目标POI数据的距离小于或等于距离阈值;在步骤S13中,装置1根据线上POI数据对目标POI数据进行校验处理。装置中的各模块可以是基于处理器执行程序时对所连接的存储器、网络接口等硬件按时序调用而构成硬件组合。利用相应硬件组合而得到的模块将执行程序所描述的工作过程。
具体地,在步骤S11中,装置1获取POI-UGC系统上报页面用户提交的目标POI数据,其中,目标POI数据包括但不限于:POI数据的名称信息、POI数据的坐标信息。例如,获取的目标POI数据名称信息“香醇咖啡厅(AB大厦)”、经纬度信息。获取用户提交的目标POI数据,包括但不限于通过电子地图的数据递交页面获取用户填写的POI数据、使用一般后台数据获取,例如通过查询系统可访问的数据库获取。
当然,本领域技术人员应能理解,上述目标POI数据仅为举例,其他现有的或今后可能出现的目标POI数据若可适用于本申请,也应被包含在本申请的保护范围之内,并在此以引用的方式包含于此。
在步骤S12中,装置1根据目标POI数据的坐标信息确定目标POI数据对应的一个或多个线上POI数据,其中,每个线上POI数据与目标POI数据的距离小于或等于距离阈值。在一些实施例中,线上POI数据的获取途径包括从可访问数据来源的网络设备(例如,包括但不限于网络主机、云端服务器等)获得。
例如,在步骤S12中,装置1在获得目标POI数据“香醇咖啡厅(AB大厦)”后,根据该目标POI数据的名称信息“香醇咖啡厅(AB大厦)”匹配获得对应该目标POI数据的坐标信息及经纬度信息;再根据该目标POI数据的坐标信息获得包括“AB大厦”在内的一个或多个线上POI数据。
本领域技术人员应能理解上述确定与目标POI数据相匹配的一个或多个线上POI数据的方式仅为举例,其他现有的或今后可能出现的确定与目标POI数据相匹配的一个或多个线上POI数据的方式如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。
在步骤S13中,装置1根据线上POI数据对目标POI数据进行校验处理。具体例如,在步骤S12中,装置1确定与目标POI数据“香醇咖啡厅(AB大厦)”相对应的一个或多个线上POI数据,其中包括线上POI数据“AB大厦”,与上述目标POI数据名称进行一一比较检查和匹配查询。
在一些实施例中,在步骤S13中,装置1检查一个或多个线上POI数据中是否存在与目标POI数据名称相匹配的线上POI数据;若存在与目标POI数据名称相匹配的线上POI数据,将对应的名称匹配信息作为目标POI数据的校验结果信息。
优选的,名称匹配信息包括以下任一项:名称全等或名称相似。例如,两个POI数据的名称完全相同,则该两个POI数据存在名称全等,将名称全等作为目标POI数据的校验结果信息;名称相似也称为两个POI数据的名称存在高阈值相似,例如若目标POI数据名称与线上POI数据名称不存在名称全等,将进一步匹配校验是否存在名称相似。名称相似的判断可与名称全等的判断同步进行,也可在名称全等的判断之后进行。
在一些实施例中,匹配校验是否存在名称相似(或称为是否存在高阈值相似),例如相似度阈值设置为75%时,当两个POI数据名称Jaccard字符串相似度>75%,则存在名称相似。其中Jaccard字符串相似度为字符串集A与字符串集B交集的大小与字符串集A与字符串集B并集的大小的比值。在其他实施例中,名称相似的判断还需要结合两个POI数据名称的长度差信息,例如设置长度差阈值为5,当两个POI数据的长度差不大于该长度差阈值,再对该两个POI数据进行字符串相似度的计算。
例如,检查目标POI数据名称“上海市北京酒店”与线上POI数据名称“上海市北京大酒店”,两个字符串集交集与并集大小之比为87.5%,因此字符串相似度为87.5%,由于该相似度87.5%>相似度阈值75%,则目标POI数据名称与线上POI数据名称存在名称相似(有时也可称为高阈值相似)。最终将名称相似作为目标POI数据的校验结果信息。
在另一些实施例中,匹配校验是否存在名称相似(或称为是否存在高阈值相似),从的目标POI数据名称A逐字剔除掉线上POI数据名称B;如果剔除后的结果仅剩余的词是通用词表中通用词,则存在名称相似。其中,通用词表包括但不限于对线上全量POI名称进行分词(将汉字序列切分成单独的词)清洗维护的通用词表;在一些实施例中,线上全量POI使用一般后台数据获取。
例如,目标POI数据名称是“CDE”,线上POI数据名称是“CDE农家乐”,从线上POI数据名称中逐字剔除目标POI数据名称,剔除后剩余“农家乐”,而“农家乐”是通用词表中的通用词,则存在名称相似。最终将名称相似作为目标POI数据的校验结果信息。
优选的,名称匹配信息还包括名称关联或核心词匹配。在一些实施例中,名称关联或核心词匹配的判断,可与目标POI数据名称与线上POI数据名称全等或名称相似的判断同步进行,也可在名称全等或名称相似的判断之后进行,例如不存在名称全等或名称相似时。
在一些实施例中,在步骤S13中,装置1对目标POI数据和在步骤S12中,装置1获得的一个或多个线上POI数据校验处理,若一个或多个线上POI数据中不存在与目标POI数据名称相匹配的线上POI数据,检查一个或多个线上POI数据中是否存在与目标POI数据名称关联或核心词匹配的线上POI数据;
若存在与目标POI数据核心词相匹配的线上POI数据,确定目标POI数据的校验结果信息为核心词匹配。
在一些实施例中,当满足POI数据名称A全包含POI数据名称B,其中,POI数据名称A的部分和POI数据名称B的全部或部分完全相同,并且POI数据名称A的长度大于POI数据名称B,则两者存在名称关联。
例如,目标POI数据名称“XX科技大厦(香醇咖啡厅店)”和线上POI数据名称“XX科技大厦”,满足目标POI数据名称全包含线上POI数据名称,则存在名称关联。
若不存在名称关联,进一步检查目标POI数据名称与线上POI数据名称是否存在核心词匹配。其中,将两个POI数据名称全部剔除通用词,得到核心词,对核心词比较检查;当两个POI数据名称Jaccard字符串相似度小于等于预设的相似度阈值,判定满足阈值则判定存在核心词匹配。例如,目标POI数据名称“AB市漫风婚纱摄影”,和线上POI数据名称“AB市漫风摄影工作室”,剔除通用词(同上)后两个POI名称均只剩下“漫风”,此时由于目标POI数据名称“AB市漫风婚纱摄影”与线上POI数据名称“AB市漫风摄影工作室”具有相同的核心词“漫风”,即目标POI数据名称与线上POI数据名称的校验结果信息为核心词匹配。
例如,目标POI数据名称“ABC咖啡厅”和线上POI数据名称“DE咖啡”,剔除通用词(同上)后两个POI名称分别剩下“ABC”、“CD”,则不存在核心词匹配,最终确定的校验结果信息为不存在核心词匹配。
优选的,在步骤S13中,装置1检查一个或多个线上POI数据中是否存在与目标POI数据核心词匹配的线上POI数据,包括:通过通用词过滤处理确定线上POI数据对应的核心词;检查线上POI数据对应的核心词是否与目标POI数据的核心词相匹配。
具体而言,其中,通用词表包括但不限于利用线上全量POI名称进行分词清洗1万多个POI名称获得,并按照长度排序。例如,目标POI数据“AB咖啡店”通过通用词表过滤获得核心词“AB”。
一个或多个线上POI数据名称与通用词表如下表5所示。
表5
线上POI数据 通用词表
CD工作室 书店
AB学校 体育场
…… ……
通过通用词表过滤线上POI数据名称“CD工作室”获得核心词为“CD”,过滤线上POI数据名称“AB学校”获得核心词为“AB”。
检查线上POI数据对应的核心词是否与目标POI数据的核心词相匹配。
表6
例如,如表6所示,线上POI数据名称“CD工作室”的核心词为“CD”、线上POI数据名称“AB学校”的核心词为“AB”分别于目标POI数据的核心词“AB”进行匹配,最终获得线上POI数据名称“CD工作室”与目标POI数据名称“AB咖啡店”不存在核心词匹配,而线上POI数据名称“AB学校”与目标POI数据“AB咖啡店”存在核心词匹配。
参考图5,在一些实施例中,所述方法还包括步骤S14。其中,在步骤S11中,装置1获取用户提交的目标POI数据;在步骤S14中,装置1根据目标POI数据对应的实体信息确定目标POI数据对应的距离阈值;在步骤S12中,装置1根据目标POI数据的坐标信息确定目标POI数据对应的一个或多个线上POI数据,其中,每个线上POI数据与目标POI数据的距离小于或等于距离阈值;在步骤S13中,装置1根据线上POI数据对目标POI数据进行校验处理。装置中的各模块可以是基于处理器执行程序时对所连接的存储器、网络接口等硬件按时序调用而构成硬件组合。利用相应硬件组合而得到的模块将执行程序所描述的工作过程。
具体的,如图3的具体示例中所描绘,在步骤S14中,装置1根据目标POI数据对应的实体信息确定目标POI数据对应的距离阈值;此时,在步骤S12中,装置1根据目标POI数据的坐标信息确定目标POI数据对应的一个或多个线上POI数据,其中,每个线上POI数据与目标POI数据的距离小于或等于距离阈值。
例如,在步骤S14中,装置1根据目标POI数据通过通用词表获得对应的实体,进而获得实体信息,其中实体信息可包括(但不限于)实体名称或实体距离,根据该实体信息可以进一步确定目标POI数据对应的距离阈值。其中,距离阈值用于表征目标POI数据对应目标实体的范围,例如,参考表7,当目标POI数据对应的实体信息为“书店”,该实体信息“书店”对应的距离阈值是300m。
表7
序号 实体信息 距离阈值
7 书店 300m
8 学校 1000m
9 体育场 1500m
例如,继续参考表7,此时,在步骤S12中,装置1根据目标POI数据的坐标信息确定目标POI数据对应的一个或多个线上POI数据,其中,每个线上POI数据与目标POI数据的距离小于或等于距离阈值。在一些实施例中,根据目标POI数据与上述距离阈值,确定一定范围内的一个或多个线上POI数据,例如该范围是以目标POI数据对应坐标为圆心、相应距离阈值为半径的圆形区域。例如,目标POI数据对应的一个或多个线上POI数据包括“AB书店”、“XX学校”、“CD体育场”,其中“AB书店”与目标POI数据对应坐标的距离≤“书店”对应的距离阈值“300m”,“XX学校”与目标POI数据对应坐标的距离≤“学校”的距离阈值“1000m”;“CD体育场”与目标POI数据对应坐标的距离≤距离阈值“1500m”。
优选的,在步骤S14中,装置1根据目标POI数据对应的实体信息,确定实体信息对应的实体尺寸信息;根据实体尺寸信息确定目标POI数据对应的距离阈值。其中,实体尺寸信息是一个参考值,用于表征目标POI数据对应目标所占区域大小,例如圆形区域的半径或方形区域的边长。例如,目标POI数据“DF书店”对应的实体信息“书店”,在一些实施例中,通过通用词表查询匹配获得“书店”对应的实体尺寸信息“100m”,其中,通过通用词表查询匹配实体尺寸信息包括但不限于使用一般后台数据获取,进而确定目标POI数据对应的距离阈值。
表8
序号 实体信息 实体尺寸信息 距离阈值
10 书店 100m 300m
11 学校 800m 1000m
12 体育场 1000m 1500m
例如,如表8所见,根据实体尺寸信息确定目标POI数据对应的距离阈值,如根据上述“AB书店”获得对应实体尺寸信息“100m”,进而匹配对应的距离阈值“300m”;根据“XX学校”获得对应实体尺寸信息“800m”,进而匹配对应的距离阈值“1000m”;根据“CD体育场”获得对应实体尺寸信息“1000m”,进而匹配对应的距离阈值“1500m”。
在一些实施例中,所述方法还包括步骤S15(图中未标出),在步骤S15中,装置1对线上POI数据进行校正处理;其中,对线上POI数据名称校正处理包括但不限于:特殊字符过滤、括号统一化、剔除省市区信息或同义词替换。例如,线上POI数据名称中有一些字符,比如"-"等直接剔除;线上POI数据名称中的非全角小括号的括号统一转换成全角括号;对于线上POI数据名称,省市县信息会影响校验的准确性,因此直接剔除,如“XX市AB县CD大酒店”中“XX市AB县”直接剔除掉;某些词语同义不同名,直接根据同义词词表进行统一地转换,提高字符校验策略准确率,如“XX网咖”统一转换成“XX网吧”,自动存取款机转换成ATM。
在一些实施例中,所述方法还包括步骤S16(图中未标出),在步骤S16中,装置1对目标POI数据进行校正处理;其中,对目标POI名称校正处理包括但不限于:繁体字过滤、压缩空白、特殊字符过滤、括号统一化、剔除省信息或同义词替换。例如,目标POI数据名称中的有繁体字,比如“滙”等直接剔除;目标POI数据名称中有一些误输入,比如";!"等直接剔除;目标POI数据名称如“XX书香#苑”直接压缩成“XX书香苑”(其中,“#”代表空格);目标POI数据名称中的非全角小括号的括号统一转换成全角括号;对于目标POI数据名称,省信息会影响校验的准确性,因此直接剔除,如“XX市AB大酒店”中“XX市”直接剔除掉;某些词语同义不同名,直接根据同义词词表进行统一地转换,提高字符校验策略准确率,如“XX网咖”统一转换成“XX网吧”,自动存取款机转换成ATM。
根据本申请的另一个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机代码,当所述计算机代码被执行时,如上述任一项所述的方法被执行。
根据本申请的另一个方面,提供了一种计算机程序产品,当所述计算机程序产品被计算机设备执行时,如上述任一项所述的方法被执行。
一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个计算机程序;
当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述任一项所述的方法。
需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本申请的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本申请的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本申请的方法和/或技术方案。而调用本申请的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本申请的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本申请的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (21)

1.一种POI数据校验方法,包括:
a获取用户提交的目标POI数据;
b根据所述目标POI数据的坐标信息确定所述目标POI数据对应的一个或多个线上POI数据,其中,每个线上POI数据与所述目标POI数据的距离小于或等于距离阈值;
c根据所述线上POI数据对所述目标POI数据进行校验处理。
2.根据权利要求1所述的方法,其中,所述步骤c包括:
检查所述一个或多个线上POI数据中是否存在与所述目标POI数据名称相匹配的线上POI数据;
若存在与所述目标POI数据名称相匹配的线上POI数据,将对应的名称匹配信息作为所述目标POI数据的校验结果信息。
3.根据权利要求2所述的方法,其中,所述名称匹配信息包括以下任一项:
名称全等;
名称相似;
名称关联;
核心词匹配。
4.根据权利要求2所述的方法,其中,所述步骤c还包括:
若所述一个或多个线上POI数据中不存在与所述目标POI数据名称相匹配的线上POI数据,检查所述一个或多个线上POI数据中是否存在与所述目标POI数据名称关联或核心词匹配的线上POI数据;
若存在与所述目标POI数据核心词相匹配的线上POI数据,确定所述所述目标POI数据的校验结果信息为核心词匹配。
5.根据权利要求4所述的方法,其中,检查所述一个或多个线上POI数据中是否存在与所述目标POI数据核心词匹配的线上POI数据,包括:
通过通用词过滤处理确定所述线上POI数据对应的核心词;
检查所述线上POI数据对应的核心词是否与所述目标POI数据的核心词相匹配。
6.根据权利要求1至5中任一项所述的方法,其中,所述方法还包括:
对所述线上POI数据进行预处理;
其中,所述步骤c包括:
根据预处理后的所述线上POI数据对所述目标POI数据进行校验处理。
7.根据权利要求1至6中任一项所述的方法,所述方法还包括:
对所述目标POI数据进行校正处理;
其中,所述步骤c包括:
根据所述线上POI数据对校正处理后的所述目标POI数据进行校验处理。
8.根据权利要求1至7中任一项所述的方法,其中,所述方法还包括:
r根据所述目标POI数据对应的实体信息确定所述目标POI数据对应的距离阈值;
其中,所述步骤b包括:
根据所述目标POI数据的坐标信息确定所述目标POI数据对应的一个或多个线上POI数据,其中,每个线上POI数据与所述目标POI数据的距离小于或等于所述距离阈值。
9.根据权利要求8所述的方法,其中,所述步骤r包括:
根据所述目标POI数据对应的实体信息,确定所述实体信息对应的实体尺寸信息;
根据所述实体尺寸信息确定所述目标POI数据对应的距离阈值。
10.一种POI数据校验装置,包括:
第一模块,用于获取用户提交的目标POI数据;
第二模块,用于根据所述目标POI数据的坐标信息确定所述目标POI数据对应的一个或多个线上POI数据,其中,每个线上POI数据与所述目标POI数据的距离小于或等于距离阈值;
第三模块,用于根据所述线上POI数据对所述目标POI数据进行校验处理。
11.根据权利要求10所述的装置,其中,所述第三模块用于:
检查所述一个或多个线上POI数据中是否存在与所述目标POI数据名称相匹配的线上POI数据;
若存在与所述目标POI数据名称相匹配的线上POI数据,将对应的名称匹配信息作为所述目标POI数据的校验结果信息。
12.根据权利要求11所述的装置,其中,所述名称匹配信息包括以下任一项:
名称全等;
名称相似;
名称关联;
核心词匹配。
13.根据权利要求11所述的装置,其中,所述第三模块还用于:
若所述一个或多个线上POI数据中不存在与所述目标POI数据名称相匹配的线上POI数据,检查所述一个或多个线上POI数据中是否存在与所述目标POI数据名称关联或核心词匹配的线上POI数据;
若存在与所述目标POI数据核心词相匹配的线上POI数据,确定所述所述目标POI数据的校验结果信息为核心词匹配。
14.根据权利要求13所述的装置,其中,检查所述一个或多个线上POI数据中是否存在与所述目标POI数据核心词匹配的线上POI数据,包括:
通过通用词过滤处理确定所述线上POI数据对应的核心词;
检查所述线上POI数据对应的核心词是否与所述目标POI数据的核心词相匹配。
15.根据权利要求10至14中任一项所述的装置,其中,所述装置还包括第五模块,用于:
对所述线上POI数据进行预处理;
其中,所述第三模块用于:
根据预处理后的所述线上POI数据对所述目标POI数据进行校验处理。
16.根据权利要求10至15中任一项所述的装置,所述装置还包括第六模块,用于:
对所述目标POI数据进行校正处理;
其中,所述第三模块用于:
根据所述线上POI数据对校正处理后的所述目标POI数据进行校验处理。
17.根据权利要求10至16中任一项所述的装置,其中,所述装置还包括第四模块,用于:
根据所述目标POI数据对应的实体信息确定所述目标POI数据对应的距离阈值;
其中,所述第二模块用于:
根据所述目标POI数据的坐标信息确定所述目标POI数据对应的一个或多个线上POI数据,其中,每个线上POI数据与所述目标POI数据的距离小于或等于所述距离阈值。
18.根据权利要求17所述的装置,其中,所述第四模块用于:
根据所述目标POI数据对应的实体信息,确定所述实体信息对应的实体尺寸信息;
根据所述实体尺寸信息确定所述目标POI数据对应的距离阈值。
19.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机代码,当所述计算机代码被执行时,如权利要求1至10中任一项所述的方法被执行。
20.一种计算机程序产品,当所述计算机程序产品被计算机设备执行时,如权利要求1至10中任一项所述的方法被执行。
21.一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个计算机程序;
当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至10中任一项所述的方法。
CN201710835361.1A 2017-09-15 2017-09-15 一种poi数据校验方法与设备 Active CN107832325B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710835361.1A CN107832325B (zh) 2017-09-15 2017-09-15 一种poi数据校验方法与设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710835361.1A CN107832325B (zh) 2017-09-15 2017-09-15 一种poi数据校验方法与设备

Publications (2)

Publication Number Publication Date
CN107832325A true CN107832325A (zh) 2018-03-23
CN107832325B CN107832325B (zh) 2021-11-16

Family

ID=61643386

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710835361.1A Active CN107832325B (zh) 2017-09-15 2017-09-15 一种poi数据校验方法与设备

Country Status (1)

Country Link
CN (1) CN107832325B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108846111A (zh) * 2018-06-22 2018-11-20 阿里巴巴集团控股有限公司 一种检测店铺位置正确性的方法及装置
CN109446433A (zh) * 2018-12-24 2019-03-08 北京百度网讯科技有限公司 一种兴趣点失效校验方法、装置、服务器及存储介质
CN109947819A (zh) * 2019-03-12 2019-06-28 百度在线网络技术(北京)有限公司 疑似作弊区域的挖掘方法、装置、计算机设备和存储介质
CN110245205A (zh) * 2019-06-20 2019-09-17 腾讯科技(深圳)有限公司 地图兴趣点数据的验证方法、装置、设备及存储介质
CN110362645A (zh) * 2019-07-17 2019-10-22 北京百度网讯科技有限公司 兴趣点校正方法、装置、设备及计算机可读存储介质
CN110399361A (zh) * 2019-07-31 2019-11-01 腾讯科技(深圳)有限公司 一种信息处理的方法以及信息处理装置
CN110647601A (zh) * 2018-06-26 2020-01-03 百度在线网络技术(北京)有限公司 一种存疑poi的校验方法、装置、服务器及存储介质
CN113051923A (zh) * 2021-04-22 2021-06-29 平安普惠企业管理有限公司 数据验证方法、装置、计算机设备和存储介质
WO2021147458A1 (zh) * 2020-01-20 2021-07-29 腾讯科技(深圳)有限公司 一种无线热点与兴趣点的匹配方法及装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101388023A (zh) * 2008-09-12 2009-03-18 北京搜狗科技发展有限公司 电子地图兴趣点数据冗余检测方法和系统
CN102902596A (zh) * 2012-09-29 2013-01-30 北京百度网讯科技有限公司 一种兴趣点数据校验方法及装置
CN103514199A (zh) * 2012-06-25 2014-01-15 高德软件有限公司 Poi数据处理方法及其装置、poi检索方法及其装置
CN104080054A (zh) * 2014-07-18 2014-10-01 百度在线网络技术(北京)有限公司 一种异常兴趣点的获取方法及装置
US20150088860A1 (en) * 2013-09-20 2015-03-26 Decarta Inc. Location Searching with Category Indices
CN104537027A (zh) * 2014-12-19 2015-04-22 百度在线网络技术(北京)有限公司 信息推荐方法及装置
KR20150092514A (ko) * 2014-02-05 2015-08-13 에스케이플래닛 주식회사 Poi 분포도를 이용한 관심 지역 추출 방법, 이를 이용한 장치 및 시스템, 그리고 이를 실행하는 프로그램을 기록한 컴퓨터 판독 가능한 기록매체
CN104866542A (zh) * 2015-05-05 2015-08-26 腾讯科技(深圳)有限公司 一种poi数据验证方法和装置
CN105095205A (zh) * 2014-04-17 2015-11-25 阿里巴巴集团控股有限公司 地址定位方法及装置
CN106528597A (zh) * 2016-09-23 2017-03-22 百度在线网络技术(北京)有限公司 兴趣点的标注方法以及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101388023A (zh) * 2008-09-12 2009-03-18 北京搜狗科技发展有限公司 电子地图兴趣点数据冗余检测方法和系统
CN103514199A (zh) * 2012-06-25 2014-01-15 高德软件有限公司 Poi数据处理方法及其装置、poi检索方法及其装置
CN102902596A (zh) * 2012-09-29 2013-01-30 北京百度网讯科技有限公司 一种兴趣点数据校验方法及装置
US20150088860A1 (en) * 2013-09-20 2015-03-26 Decarta Inc. Location Searching with Category Indices
KR20150092514A (ko) * 2014-02-05 2015-08-13 에스케이플래닛 주식회사 Poi 분포도를 이용한 관심 지역 추출 방법, 이를 이용한 장치 및 시스템, 그리고 이를 실행하는 프로그램을 기록한 컴퓨터 판독 가능한 기록매체
CN105095205A (zh) * 2014-04-17 2015-11-25 阿里巴巴集团控股有限公司 地址定位方法及装置
CN104080054A (zh) * 2014-07-18 2014-10-01 百度在线网络技术(北京)有限公司 一种异常兴趣点的获取方法及装置
CN104537027A (zh) * 2014-12-19 2015-04-22 百度在线网络技术(北京)有限公司 信息推荐方法及装置
CN104866542A (zh) * 2015-05-05 2015-08-26 腾讯科技(深圳)有限公司 一种poi数据验证方法和装置
CN106528597A (zh) * 2016-09-23 2017-03-22 百度在线网络技术(北京)有限公司 兴趣点的标注方法以及装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108846111A (zh) * 2018-06-22 2018-11-20 阿里巴巴集团控股有限公司 一种检测店铺位置正确性的方法及装置
CN110647601A (zh) * 2018-06-26 2020-01-03 百度在线网络技术(北京)有限公司 一种存疑poi的校验方法、装置、服务器及存储介质
CN109446433A (zh) * 2018-12-24 2019-03-08 北京百度网讯科技有限公司 一种兴趣点失效校验方法、装置、服务器及存储介质
CN109947819A (zh) * 2019-03-12 2019-06-28 百度在线网络技术(北京)有限公司 疑似作弊区域的挖掘方法、装置、计算机设备和存储介质
CN109947819B (zh) * 2019-03-12 2021-05-28 百度在线网络技术(北京)有限公司 疑似作弊区域的挖掘方法、装置、计算机设备和存储介质
CN110245205A (zh) * 2019-06-20 2019-09-17 腾讯科技(深圳)有限公司 地图兴趣点数据的验证方法、装置、设备及存储介质
CN110245205B (zh) * 2019-06-20 2023-08-29 腾讯科技(深圳)有限公司 地图兴趣点数据的验证方法、装置、设备及存储介质
CN110362645A (zh) * 2019-07-17 2019-10-22 北京百度网讯科技有限公司 兴趣点校正方法、装置、设备及计算机可读存储介质
CN110399361A (zh) * 2019-07-31 2019-11-01 腾讯科技(深圳)有限公司 一种信息处理的方法以及信息处理装置
WO2021147458A1 (zh) * 2020-01-20 2021-07-29 腾讯科技(深圳)有限公司 一种无线热点与兴趣点的匹配方法及装置
CN113051923A (zh) * 2021-04-22 2021-06-29 平安普惠企业管理有限公司 数据验证方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN107832325B (zh) 2021-11-16

Similar Documents

Publication Publication Date Title
CN107832325A (zh) 一种poi数据校验方法与设备
JP5198689B2 (ja) 取引情報に基づいたipアドレスデータベースの更新
CN104216992B (zh) 一种信息处理方法及装置
CN102591867B (zh) 一种基于移动设备位置的搜索服务方法
CN103455613B (zh) 基于MapReduce模型的兴趣感知服务推荐方法
CN105989082A (zh) 报表视图生成方法和装置
CN106991576A (zh) 一种地理区域的热力展现方法和装置
CN105493085B (zh) 创建数据库表的样本的方法、系统和计算机可读存储介质
CN104281665B (zh) 一种用于确定评论的有效性的方法与装置
CN107733854A (zh) 一种网络虚拟用户的风险控制方法及系统
CN103399862B (zh) 确定目标查询序列所对应的搜索引导信息的方法与设备
CN107251017A (zh) 经由基数估计的有效联结路径确定
CN104281701A (zh) 分布式多尺度空间数据查询方法及系统
WO2019242343A1 (zh) 营销信息投放平台构建方法及装置
CN108108454A (zh) 一种基于多语种舆情分析的旅游大数据系统
CN107408114A (zh) 基于事务访问模式识别联结关系
CN103186666A (zh) 基于收藏进行搜索的方法、装置与设备
CN110263022A (zh) 酒店数据匹配方法及装置
CN106357835A (zh) 一种用于确定目标ip地址所属地域的方法与设备
CN106445907A (zh) 一种领域词典的生成方法及装置
KR20160017016A (ko) 위치 기반 정보의 디스플레이를 위한 데이터 클러스터링 장치, 방법 및 컴퓨터 판독 가능한 기록 매체
KR20140055663A (ko) 위치 기반 정보의 디스플레이를 위한 데이터 클러스터링 장치, 방법 및 컴퓨터 판독 가능한 기록 매체
CN106027692B (zh) 信息获取方法、装置及服务器
CN104298786B (zh) 一种图像检索方法及装置
CN104537016B (zh) 一种确定文件所在分区的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant