CN105159921A - 地图中兴趣点poi数据去重的方法及装置 - Google Patents

地图中兴趣点poi数据去重的方法及装置 Download PDF

Info

Publication number
CN105159921A
CN105159921A CN201510454370.7A CN201510454370A CN105159921A CN 105159921 A CN105159921 A CN 105159921A CN 201510454370 A CN201510454370 A CN 201510454370A CN 105159921 A CN105159921 A CN 105159921A
Authority
CN
China
Prior art keywords
poi data
poi
data
contact method
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510454370.7A
Other languages
English (en)
Inventor
王智广
傅彤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201510454370.7A priority Critical patent/CN105159921A/zh
Publication of CN105159921A publication Critical patent/CN105159921A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及计算机技术领域,公开了地图中兴趣点POI数据去重的方法及装置,所述POI数据中包括联系方式信息;所述方法包括:将各个POI数据中的联系方式信息进行比较;将比较结果符合相同标准的POI数据判定为相同POI数据;从相同POI数据中选择一个或多个POI数据进行保留,从数据库中去除掉相同POI数据中未被选择的POI数据。本发明解决了地图中POI数据中的重复数据过多的问题,取得了去除POI中重复数据,节约存储空间和数据维护成本的有益效果。

Description

地图中兴趣点POI数据去重的方法及装置
技术领域
本发明涉及计算机技术领域,具体涉及一种地图中兴趣点POI数据去重的方法及装置。
背景技术
随着计算机技术的发展,电子地图被越来越多的使用。在制作电子地图时,需要使用地址信息。举例而言,地址信息可以为POI(兴趣点,PointofInterest),一个POI可以是一栋房子、一个商铺、一个邮筒、一个公交站等。在现有技术中,派遣工作人员到现场对兴趣点进行经纬度测量,记录下兴趣点的经纬度。
由于互联网具有数据丰富的特点,可以利用互联网中数据提取POI。但是,互联网网页中提取的POI中具有大量重复数据,因此,需要提供一种技术方案去除地图中POI数据中的重复数据。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的地图中兴趣点POI数据去重的方法及装置。
依据本发明的一个方面,提供了一种地图中兴趣点POI数据去重的方法,所述POI数据中包括联系方式信息;所述方法包括:
将各个POI数据中的联系方式信息进行比较;
将比较结果符合相同标准的POI数据判定为相同POI数据;
从相同POI数据中选择一个或多个POI数据进行保留,从数据库中去除掉相同POI数据中未被选择的POI数据。
可选地,所述POI数据中包括地理位置信息;所述方法还包括:
在将各个POI数据中的联系方式信息进行比较前,将各个POI数据中的地理位置信息进行比较;
将地理位置信息相同的POI数据确定为同一地址下的POI数据;
所述将各个POI数据中的联系方式信息进行比较,进一步包括:
将同一地址下的POI数据中的联系方式信息进行比较。
可选地,所述相同标准包括:联系方式全部相同;
所述将比较结果符合相同标准的POI数据判定为相同POI数据,进一步包括:
将联系方式全部相同的POI数据判定为相同POI数据。
可选地,所述联系方式包括电话号码,所述相同标准包括:电话号码中后n位相同,n为正整数;
所述将比较结果符合相同标准的POI数据判定为相同POI数据,进一步包括:
将电话号码中后n位相同的POI数据判定为相同POI数据。
可选地,所述从相同POI数据中选择一个或多个POI数据进行保留,进一步包括:
按对应时间从新到旧的顺序从相同POI数据中选择一个或多个POI数据进行保留。
可选地,所述地理位置信息包括:经纬度信息。
根据本发明的另一方面,提供了一种地图中兴趣点POI数据去重的装置,所述POI数据中包括联系方式信息;所述装置包括:
比较模块,适于将各个POI数据中的联系方式信息进行比较;
判定模块,适于将比较结果符合相同标准的POI数据判定为相同POI数据;
去重模块,适于从相同POI数据中选择一个或多个POI数据进行保留,从数据库中去除掉相同POI数据中未被选择的POI数据。
可选地,所述POI数据中包括地理位置息;
所述比较模块,还适于在将各个POI数据中的联系方式信息进行比较前,将各个POI数据中的地理位置信息进行比较;
所述判定模块,还适于将地理位置信息相同的POI数据确定为同一地址下的POI数据;
所述比较模块,进一步适于将同一地址下的POI数据中的联系方式信息进行比较。
可选地,所述相同标准包括:联系方式全部相同;
所述判定模块,进一步适于将联系方式全部相同的POI数据判定为相同POI数据。
可选地,所述联系方式包括电话号码,所述相同标准包括:电话号码中后n位相同,n为正整数;
所述判定模块,进一步适于将电话号码中后n位相同的POI数据判定为相同POI数据。
可选地,所述去重模块,进一步适于按对应时间从新到旧的顺序从相同POI数据中选择一个或多个POI数据进行保留。
可选地,所述地理位置信息包括:经纬度信息。
根据本发明的技术方案可以将各个POI数据中的联系方式信息进行比较;将比较结果符合相同标准的POI数据判定为相同POI数据;从相同POI数据中选择一个或多个POI数据进行保留,从数据库中去除掉相同POI数据中未被选择的POI数据。由此解决了地图中POI数据中的重复数据过多的问题,取得了去除POI中重复数据,节约存储空间和数据维护成本的有益效果。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的地图中兴趣点POI数据去重的方法的流程图;
图2示出了根据本发明一个实施例的地理位置信息比较的方法的流程图;以及
图3示出了根据本发明一个实施例的地图中兴趣点POI数据去重的方法的流程图;以及
图4示出了根据本发明一个实施例的地图中兴趣点POI数据去重的装置的结构图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的地图中兴趣点POI数据去重的方法的流程图。该方法适于任何一种服务器。其中,POI数据中包括联系方式信息,如图1所示,该方法包括如下步骤S110-S130。
在步骤S110中,将各个POI数据中的联系方式信息进行比较。
举例而言,从互联网网页中获取的POI数据如下表一所示。
表一
联系方式包括电话号码,将POI数据中的电话号码进行比较,即将POI数据中的电话号码数字进行比较。
在步骤S120中,将比较结果符合相同标准的POI数据判定为相同POI数据。
在一实施例中,所述相同标准包括:联系方式全部相同;
所述将比较结果符合相同标准的POI数据判定为相同POI数据,进一步包括:将联系方式全部相同的POI数据判定为相同POI数据。
例如,表一中的联系方式为:“AA火锅”的联系方式为“(010)82589332”,“AA(巴沟店)”的联系方式为“010-82589332”,“AA火锅(巴沟店)”的联系方式为“010-82589332”,“AA火锅(万柳华联分店)”的联系方式为“010-82589332”,“AA(万柳店)”的联系方式为“010-82589332”。将表一中联系方式比较,后4个POI的数据的联系方式相同,都为“010-82589332”。因此,将后4个POI数据“AA(巴沟店)”、“AA火锅(巴沟店)”、“AA火锅(万柳华联分店)”、“AA(万柳店)”判定为相同POI数据。
在一实施例中,联系方式包括电话号码,相同标准包括:电话号码中后n位相同,n为正整数。所述将比较结果符合相同标准的POI数据判定为相同POI数据,进一步包括:将电话号码中后n位相同的POI数据判定为相同POI数据。
例如,将n设置为8,将表一中联系方式比较,表一中5个POI的数据的联系方式相同,都为“82589332”。因此,将5个POI数据“AA火锅”、“AA(巴沟店)”、“AA火锅(巴沟店)”、“AA火锅(万柳华联分店)”、“AA(万柳店)”判定为相同POI数据。
在步骤S130中,从相同POI数据中选择一个或多个POI数据进行保留,从数据库中去除掉相同POI数据中未被选择的POI数据。
在实施例一中,所述从相同POI数据中选择一个或多个POI数据进行保留,进一步包括:按对应时间从新到旧的顺序从相同POI数据中选择一个或多个POI数据进行保留。
例如,各个POI具有对应的获取时间,按对应的获取时间从新到旧的顺序,将相同POI数据排序。按配置从相同POI数据中选择m个POI数据,m为配置的正整数,将选择的m个POI数据保留,从数据库中去除掉相同POI数据中未被选择的POI数据。
在本实施例中,根据本发明的技术方案可以将各个POI数据中的联系方式信息进行比较;将比较结果符合相同标准的POI数据判定为相同POI数据;从相同POI数据中选择一个或多个POI数据进行保留,从数据库中去除掉相同POI数据中未被选择的POI数据。由此解决了地图中POI数据中的重复数据过多的问题,取得了去除POI中重复数据,节约存储空间和数据维护成本的有益效果。并且,在联系方式包括电话号码时,对数字进行比较,而不需要对字符串相似度进行比较,使得POI去重操作更加容易实施,提高了操作效率。
在一实施例中,所述POI数据中包括地理位置信息;如图2所示,所述方法还包括:
在步骤S210中,在将各个POI数据中的联系方式信息进行比较前,将各个POI数据中的地理位置信息进行比较。
在步骤S220中,将地理位置信息相同的POI数据确定为同一地址下的POI数据。
所述将各个POI数据中的联系方式信息进行比较,进一步包括:将同一地址下的POI数据中的联系方式信息进行比较。
其中,所述地理位置信息包括:经纬度信息。
例如,将表一中各个POI数据的经纬度信息进行比较,其中5个POI数据的经纬度都为“东经:116.294712,北纬:39.9731761”,5个POI数据的经纬度相同,将5个POI数据确定为同一地址下的POI数据。将表一中同一地址下的5个POI数据的联系方式进行比较,5个POI数据的联系方式的后8位相同,将5个POI数据判定为相同的POI。表一中5个POI具有对应的获取时间,按对应的获取时间从新到旧的顺序,将相同POI数据排序。按配置从相同POI数据中选择m个POI数据,m为配置的正整数,将选择的m个POI数据保留,从数据库中去除掉相同POI数据中未被选择的POI数据。
在本实施例中,在将POI数据的联系方式进行比较前,进行地理位置信息比较,当判定POI数据在同一地址下后,再进行POI数据的联系方式比较。例如,在地址相同的前提下利用电话信息去重POI数据,将汉字字符串相似度计算转换为数字字符串是否相同的比较。如此,进一步增加重复POI数据判断的准确性。
图3示出了根据本发明一个实施例的地图中兴趣点POI数据去重的方法的流程图。该方法适于任何一种服务器。其中,POI数据中包括联系方式信息和地理位置信息,联系方式信息包括电话号码,地理位置信息包括经纬度,如图3所述,包括如下步骤。
在步骤S310中,将各个POI数据中的经纬度进行比较。
在步骤S320中,将经纬度相同的POI数据确定为同一地址下的POI数据。
在步骤S330中,将同一地址下的POI数据的电话号码进行比较。
在步骤S340中,将电话号码中后n位相同的POI数据判定为相同POI数据。
其中,n为配置的正整数。
在步骤S350中,按对应时间从新到旧的顺序从相同POI数据中选择多个POI数据进行保留,从数据库中去除掉相同POI数据中未被选择的POI数据。
上述仅为本发明的地图中兴趣点POI数据去重的方法的实例性说明,本发明不限于此。凡在本发明的精神或原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
图4示出了根据本发明一个实施例的地图中兴趣点POI数据去重的装置的结构图。该装置适于任何一种服务器。其中,POI数据中包括联系方式信息,如图4所示,该装置包括如下模块。
比较模块410,适于将各个POI数据中的联系方式信息进行比较;
判定模块420,适于将比较结果符合相同标准的POI数据判定为相同POI数据;
去重模块430,适于从相同POI数据中选择一个或多个POI数据进行保留,从数据库中去除掉相同POI数据中未被选择的POI数据。
在一实施例中,所述相同标准包括:联系方式全部相同;
判定模块420,进一步适于将联系方式全部相同的POI数据判定为相同POI数据。
举例而言,从互联网网页中获取的POI数据如下表一所示。表一中的联系方式为:“AA火锅”的联系方式为“(010)82589332”,“AA(巴沟店)”的联系方式为“010-82589332”,“AA火锅(巴沟店)”的联系方式为“010-82589332”,“AA火锅(万柳华联分店)”的联系方式为“010-82589332”,“AA(万柳店)”的联系方式为“010-82589332”。判定模块420将表一中联系方式比较,后4个POI的数据的联系方式相同,都为“010-82589332”。因此,将后4个POI数据“AA(巴沟店)”、“AA火锅(巴沟店)”、“AA火锅(万柳华联分店)”、“AA(万柳店)”判定为相同POI数据。
在一实施例中,所述联系方式包括电话号码,所述相同标准包括:电话号码中后n位相同,n为正整数;
判定模块420,进一步适于将电话号码中后n位相同的POI数据判定为相同POI数据。
例如,将n设置为8,将表一中联系方式比较,表一中5个POI的数据的联系方式相同,都为“82589332”。判定模块420将5个POI数据“AA火锅”、“AA(巴沟店)”、“AA火锅(巴沟店)”、“AA火锅(万柳华联分店)”、“AA(万柳店)”判定为相同POI数据。
在一实施例中,去重模块430,进一步适于按对应时间从新到旧的顺序从相同POI数据中选择一个或多个POI数据进行保留。
例如,各个POI具有对应的获取时间,去重模块430按对应的获取时间从新到旧的顺序,将相同POI数据排序。去重模块430按配置从相同POI数据中选择m个POI数据,m为配置的正整数,将选择的m个POI数据保留,从数据库中去除掉相同POI数据中未被选择的POI数据。
在本实施例中,解决了地图中POI数据中的重复数据过多的问题,取得了去除POI中重复数据,节约存储空间和数据维护成本的有益效果。并且,在联系方式包括电话号码时,对数字进行比较,而不需要对字符串相似度进行比较,使得POI去重操作更加容易实施,提高了操作效率。
在一实施例中,所述POI数据中包括地理位置息;
比较模块410,还适于在将各个POI数据中的联系方式信息进行比较前,将各个POI数据中的地理位置信息进行比较;
判定模块420,还适于将地理位置信息相同的POI数据确定为同一地址下的POI数据;
比较模块410,进一步适于将同一地址下的POI数据中的联系方式信息进行比较。
其中,所述地理位置信息包括:经纬度信息。
例如,比较模块410将表一中各个POI数据的经纬度信息进行比较,其中5个POI数据的经纬度都为“东经:116.294712,北纬:39.9731761”,5个POI数据的经纬度相同,判定模块420将5个POI数据确定为同一地址下的POI数据。比较模块410将表一中同一地址下的5个POI数据的联系方式进行比较,5个POI数据的联系方式的后8位相同,判定模块420将5个POI数据判定为相同的POI。表一中5个POI具有对应的获取时间,去重模块430按对应的获取时间从新到旧的顺序,将相同POI数据排序。去重模块430按配置从相同POI数据中选择m个POI数据,m为配置的正整数,将选择的m个POI数据保留,从数据库中去除掉相同POI数据中未被选择的POI数据。
在本实施例中,在将POI数据的联系方式进行比较前,进行地理位置信息比较,当判定POI数据在同一地址下后,再进行POI数据的联系方式比较。例如,在地址相同的前提下利用电话信息去重POI数据,将汉字字符串相似度计算转换为数字字符串是否相同的比较。如此,进一步增加重复POI数据判断的准确性。
需要说明的是:
在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的地图中兴趣点POI数据去重的设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (12)

1.一种地图中兴趣点POI数据去重的方法,所述POI数据中包括联系方式信息;所述方法包括:
将各个POI数据中的联系方式信息进行比较;
将比较结果符合相同标准的POI数据判定为相同POI数据;
从相同POI数据中选择一个或多个POI数据进行保留,从数据库中去除掉相同POI数据中未被选择的POI数据。
2.根据权利要求1所述的方法,其中,所述POI数据中包括地理位置信息;所述方法还包括:
在将各个POI数据中的联系方式信息进行比较前,将各个POI数据中的地理位置信息进行比较;
将地理位置信息相同的POI数据确定为同一地址下的POI数据;
所述将各个POI数据中的联系方式信息进行比较,进一步包括:
将同一地址下的POI数据中的联系方式信息进行比较。
3.根据权利要求1或2所述的方法,其中,所述相同标准包括:联系方式全部相同;
所述将比较结果符合相同标准的POI数据判定为相同POI数据,进一步包括:
将联系方式全部相同的POI数据判定为相同POI数据。
4.根据权利要求2所述的方法,其中,所述联系方式包括电话号码,所述相同标准包括:电话号码中后n位相同,n为正整数;
所述将比较结果符合相同标准的POI数据判定为相同POI数据,进一步包括:
将电话号码中后n位相同的POI数据判定为相同POI数据。
5.根据权利要求1至4任一所述的方法,其中,所述从相同POI数据中选择一个或多个POI数据进行保留,进一步包括:
按对应时间从新到旧的顺序从相同POI数据中选择一个或多个POI数据进行保留。
6.根据权利要求1至5任一所述的方法,其中,所述地理位置信息包括:经纬度信息。
7.一种地图中兴趣点POI数据去重的装置,所述POI数据中包括联系方式信息;所述装置包括:
比较模块,适于将各个POI数据中的联系方式信息进行比较;
判定模块,适于将比较结果符合相同标准的POI数据判定为相同POI数据;
去重模块,适于从相同POI数据中选择一个或多个POI数据进行保留,从数据库中去除掉相同POI数据中未被选择的POI数据。
8.根据权利要求7所述的装置,其中,所述POI数据中包括地理位置息;
所述比较模块,还适于在将各个POI数据中的联系方式信息进行比较前,将各个POI数据中的地理位置信息进行比较;
所述判定模块,还适于将地理位置信息相同的POI数据确定为同一地址下的POI数据;
所述比较模块,进一步适于将同一地址下的POI数据中的联系方式信息进行比较。
9.根据权利要求7或8所述的装置,其中,所述相同标准包括:联系方式全部相同;
所述判定模块,进一步适于将联系方式全部相同的POI数据判定为相同POI数据。
10.根据权利要求8所述的装置,其中,所述联系方式包括电话号码,所述相同标准包括:电话号码中后n位相同,n为正整数;
所述判定模块,进一步适于将电话号码中后n位相同的POI数据判定为相同POI数据。
11.根据权利要求7至10任一所述的装置,其中,所述去重模块,进一步适于按对应时间从新到旧的顺序从相同POI数据中选择一个或多个POI数据进行保留。
12.根据权利要求7至11任一所述的装置,其中,所述地理位置信息包括:经纬度信息。
CN201510454370.7A 2015-07-29 2015-07-29 地图中兴趣点poi数据去重的方法及装置 Pending CN105159921A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510454370.7A CN105159921A (zh) 2015-07-29 2015-07-29 地图中兴趣点poi数据去重的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510454370.7A CN105159921A (zh) 2015-07-29 2015-07-29 地图中兴趣点poi数据去重的方法及装置

Publications (1)

Publication Number Publication Date
CN105159921A true CN105159921A (zh) 2015-12-16

Family

ID=54800778

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510454370.7A Pending CN105159921A (zh) 2015-07-29 2015-07-29 地图中兴趣点poi数据去重的方法及装置

Country Status (1)

Country Link
CN (1) CN105159921A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105608153A (zh) * 2015-12-18 2016-05-25 晶赞广告(上海)有限公司 一种通用的poi信息关联方法
CN113255398A (zh) * 2020-02-10 2021-08-13 百度在线网络技术(北京)有限公司 兴趣点判重方法、装置、设备和存储介质
CN113505134A (zh) * 2021-05-21 2021-10-15 武汉旷视金智科技有限公司 多线程数据处理方法、多线程底库数据入库方法及装置
CN114861062A (zh) * 2022-05-26 2022-08-05 北京百度网讯科技有限公司 信息过滤方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567385A (zh) * 2010-12-29 2012-07-11 上海博泰悦臻电子设备制造有限公司 兴趣点信息搜索设备、系统及方法
CN103164480A (zh) * 2011-12-13 2013-06-19 北京千橡网景科技发展有限公司 用于在社交网络中推荐兴趣点的方法和设备
CN103218375A (zh) * 2012-01-20 2013-07-24 北京四维图新科技股份有限公司 一种poi信息补充方法及装置
CN103514199A (zh) * 2012-06-25 2014-01-15 高德软件有限公司 Poi数据处理方法及其装置、poi检索方法及其装置
CN104050196A (zh) * 2013-03-15 2014-09-17 阿里巴巴集团控股有限公司 一种兴趣点数据冗余检测方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567385A (zh) * 2010-12-29 2012-07-11 上海博泰悦臻电子设备制造有限公司 兴趣点信息搜索设备、系统及方法
CN103164480A (zh) * 2011-12-13 2013-06-19 北京千橡网景科技发展有限公司 用于在社交网络中推荐兴趣点的方法和设备
CN103218375A (zh) * 2012-01-20 2013-07-24 北京四维图新科技股份有限公司 一种poi信息补充方法及装置
CN103514199A (zh) * 2012-06-25 2014-01-15 高德软件有限公司 Poi数据处理方法及其装置、poi检索方法及其装置
CN104050196A (zh) * 2013-03-15 2014-09-17 阿里巴巴集团控股有限公司 一种兴趣点数据冗余检测方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105608153A (zh) * 2015-12-18 2016-05-25 晶赞广告(上海)有限公司 一种通用的poi信息关联方法
CN113255398A (zh) * 2020-02-10 2021-08-13 百度在线网络技术(北京)有限公司 兴趣点判重方法、装置、设备和存储介质
CN113255398B (zh) * 2020-02-10 2023-08-18 百度在线网络技术(北京)有限公司 兴趣点判重方法、装置、设备和存储介质
CN113505134A (zh) * 2021-05-21 2021-10-15 武汉旷视金智科技有限公司 多线程数据处理方法、多线程底库数据入库方法及装置
CN113505134B (zh) * 2021-05-21 2023-02-24 武汉旷视金智科技有限公司 多线程数据处理方法、多线程底库数据入库方法及装置
CN114861062A (zh) * 2022-05-26 2022-08-05 北京百度网讯科技有限公司 信息过滤方法和装置
CN114861062B (zh) * 2022-05-26 2023-05-16 北京百度网讯科技有限公司 信息过滤方法和装置

Similar Documents

Publication Publication Date Title
CN105224660A (zh) 一种地图兴趣点poi数据的处理方法和装置
CN105608113B (zh) 判断文本中poi数据的方法及装置
CN103902701B (zh) 一种数据存储系统和存储方法
CN105160031A (zh) 一种地图兴趣点poi数据的挖掘方法和装置
CN103902702A (zh) 一种数据存储系统和存储方法
CN110413742B (zh) 简历信息的查重方法、装置、设备及存储介质
CN105159921A (zh) 地图中兴趣点poi数据去重的方法及装置
CN111241389A (zh) 基于矩阵的敏感词过滤方法、装置、电子设备、存储介质
CN108228657B (zh) 一种关键字检索的实现方法及装置
CN110968654A (zh) 文本数据的地址类目确定方法、设备以及系统
CN105095391A (zh) 利用分词程序识别机构名称的装置及方法
CN105183908A (zh) 一种兴趣点poi数据的分类方法和装置
CN104933171B (zh) 兴趣点数据关联方法和装置
CN105550169A (zh) 一种基于字符长度识别兴趣点名称的方法和装置
CN110706015A (zh) 一种面向广告点击率预测的特征选取方法
CN110634050B (zh) 一种鉴别房源类型的方法、装置、电子设备及存储介质
CN103678315A (zh) 图像处理装置、图像处理方法和电子设备
CN105373528A (zh) 一种文本内容敏感性分析方法和装置
US8112070B2 (en) Electronic device and method for searching a merchandise location
CN105227737A (zh) 电话号码的识别方法及装置
CN105893614A (zh) 信息推荐的方法、装置及电子设备
CN105528441A (zh) 基于自动标注的中心词提取方法和装置
CN109033210A (zh) 一种挖掘地图兴趣点poi的方法和装置
CN111061869B (zh) 一种基于TextRank的应用偏好文本分类方法
CN105260440A (zh) 识别电话号码的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20151216

RJ01 Rejection of invention patent application after publication