CN110110017A - 一种兴趣点数据关联方法、装置及服务器 - Google Patents
一种兴趣点数据关联方法、装置及服务器 Download PDFInfo
- Publication number
- CN110110017A CN110110017A CN201810072186.XA CN201810072186A CN110110017A CN 110110017 A CN110110017 A CN 110110017A CN 201810072186 A CN201810072186 A CN 201810072186A CN 110110017 A CN110110017 A CN 110110017A
- Authority
- CN
- China
- Prior art keywords
- interest point
- point data
- title
- data
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 96
- 230000008569 process Effects 0.000 claims description 32
- 241001269238 Data Species 0.000 claims description 27
- 238000012549 training Methods 0.000 claims description 23
- 238000013500 data storage Methods 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 241000208340 Araliaceae Species 0.000 claims description 3
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims description 3
- 235000003140 Panax quinquefolius Nutrition 0.000 claims description 3
- 235000008434 ginseng Nutrition 0.000 claims description 3
- 238000007477 logistic regression Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 230000011218 segmentation Effects 0.000 description 5
- 238000012827 research and development Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Remote Sensing (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供一种兴趣点数据关联方法、装置及服务器,该方法包括:从第一兴趣点数据中获取第一位置和第一名称;从第二兴趣点数据中获取第二位置和第二名称;根据第一位置和第二位置的距离、第一名称和第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;若是,则将所述第一兴趣点数据和所述第二兴趣点数据进行关联。通过本申请的技术方案,可以对不同来源的兴趣点数据进行融合,方便在同一个地图产品上,统一展示融合后的兴趣点数据,提高用户体验。
Description
技术领域
本申请涉及互联网领域,尤其是一种兴趣点数据关联方法、装置及服务器。
背景技术
POI(Point Of Interest,兴趣点)数据是基于位置服务的核心数据,在电子地图上的运用场景非常广泛,例如,导航前选择目的地、查看周边的餐馆等。
随着互联网技术的快速发展,POI数据的来源也越来越多,如谷歌地图、百度地图、高德地图等。针对同一个地点A,不同来源的POI数据(如POI名称和经纬度坐标等)也可能不同。例如,针对地点A,谷歌地图提供的POI数据1包括POI名称(如中心大厦)和经纬度坐标(如30.2798746584,120.0261959655),百度地图提供的POI数据2包括POI名称(如电子中心大厦)和经纬度坐标(如30.2858048989,120.0327567404),高德地图提供的POI数据3包括POI名称(如电子研发中心大厦)和经纬度坐标(如30.2798800000,120.0262100000)。
由于POI数据1、POI数据2、POI数据3的POI名称不同,经纬度坐标也不同,因此,无法将针对同一个地点A的POI数据1、POI数据2、POI数据3关联起来,也就无法基于POI数据1、POI数据2、POI数据3进行统一处理。
发明内容
本申请提供一种兴趣点数据关联方法,应用于服务器,该方法包括:
从第一兴趣点数据中获取第一位置和第一名称;
从第二兴趣点数据中获取第二位置和第二名称;
根据第一位置和第二位置的距离、第一名称和第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;
若是,则将所述第一兴趣点数据和所述第二兴趣点数据进行关联。
本申请提供一种兴趣点数据关联方法,应用于服务器,该方法包括:
从第一兴趣点数据中获取第一参数;
从第二兴趣点数据中获取第二参数;
根据所述第一参数和所述第二参数之间的匹配程度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;
若是,则将所述第一兴趣点数据和所述第二兴趣点数据进行关联。
本申请提供一种兴趣点数据关联装置,应用于服务器,该装置包括:
获取模块,用于从第一兴趣点数据中获取第一位置和第一名称,并从第二兴趣点数据中获取第二位置和第二名称;
确定模块,用于根据第一位置和第二位置的距离、第一名称和第二名称的相似度,确定所述第一兴趣点数据和第二兴趣点数据是否为同一地点的数据;
处理模块,用于当所述第一兴趣点数据和第二兴趣点数据是同一地点的数据时,则将所述第一兴趣点数据和所述第二兴趣点数据进行关联。
本申请提供一种兴趣点数据关联装置,应用于服务器,该装置包括:
获取模块,用于从第一兴趣点数据中获取第一参数,并从第二兴趣点数据中获取第二参数;
确定模块,用于根据所述第一参数和所述第二参数之间的匹配程度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;
处理模块,用于当所述第一兴趣点数据和第二兴趣点数据是同一地点的数据时,则将所述第一兴趣点数据和所述第二兴趣点数据进行关联。
本申请提供一种服务器,所述服务器包括:处理器,用于从第一兴趣点数据中获取第一位置和第一名称;从第二兴趣点数据中获取第二位置和第二名称;根据所述第一位置和所述第二位置的距离、所述第一名称和所述第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;若是,则将所述第一兴趣点数据和所述第二兴趣点数据进行关联。
本申请提供一种服务器,包括:处理器,用于从第一兴趣点数据中获取第一参数;从第二兴趣点数据中获取第二参数;根据第一参数和第二参数之间的匹配程度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;若是,则将所述第一兴趣点数据和所述第二兴趣点数据进行关联。
基于上述技术方案,本申请实施例中,针对不同来源的兴趣点数据,可以根据不同兴趣点数据的位置(如经纬度坐标)之间的距离(即经纬度坐标之间的距离)、不同兴趣点数据的名称(如兴趣点名称)之间的相似度,确定不同兴趣点数据是否为同一地点的数据,若是,则可以将这些兴趣点数据进行关联,并对这些兴趣点数据进行融合。这样,可以对不同来源的兴趣点数据进行融合,方便在同一个地图产品上,统一展示融合后的兴趣点数据,提高用户体验。
附图说明
为了更加清楚地说明本申请实施例或者现有技术中的技术方案,下面将对本申请实施例或者现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据本申请实施例的这些附图获得其它的附图。
图1是本申请一种实施方式中的应用场景示意图;
图2是本申请一种实施方式中的兴趣点数据关联方法的流程图;
图3A-3C是本申请另一种实施方式中的兴趣点数据关联方法的流程图;
图4是本申请另一种实施方式中的兴趣点数据关联方法的流程图;
图5是本申请一种实施方式中的兴趣点数据关联装置的结构图。
具体实施方式
在本申请使用的术语仅仅是出于描述特定实施例的目的,而非限制本申请。本申请和权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其它含义。还应当理解,本文中使用的术语“和/或”是指包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,此外,所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
本申请实施例中提出一种兴趣点数据(即POI数据)关联方法,兴趣点数据可以包括但不限于:名称(即POI名称,如电子中心大厦等)、位置(即经纬度坐标,如经度30.2798746584,纬度120.0261959655等)、类别(如停车场类型、品牌商类型等)、个性化数据(如停车场详细数据、品牌商详细数据等)。当然,上述数据只是兴趣点数据的几个示例,对兴趣点数据的内容不做限制。
由于兴趣点数据的来源越来越多,如谷歌地图、百度地图、高德地图,而且,针对同一个地点(如地点A),不同来源的兴趣点数据可能不同,如兴趣点数据的名称不同,兴趣点数据的位置也不同。因此,为了对不同来源的兴趣点数据进行关联,则无法基于名称、位置等信息,直接将兴趣点数据进行关联。
例如,针对地点A,谷歌地图提供的兴趣点数据1包括名称“中心大厦”、百度地图提供的兴趣点数据2包括名称“电子中心大厦”,高德地图提供的兴趣点数据3包括名称“电子研发中心大厦”,由于兴趣点数据1、兴趣点数据2和兴趣点数据3的名称不同,因此无法基于名称将这些兴趣点数据进行关联。
例如,针对地点A,谷歌地图提供的兴趣点数据1包括位置“30.2798746584,120.0261959655”,而百度地图提供的兴趣点数据2包括位置“30.2858048989,120.0327567404”,而高德地图提供的兴趣点数据3包括位置“30.2798800000,120.0262100000”,由于兴趣点数据1、兴趣点数据2和兴趣点数据3的位置不同,因此,无法基于各兴趣点数据的位置将这些兴趣点数据进行关联。
其中,针对同一个地点,不同来源的兴趣点数据的位置(经纬度坐标)不同,其原因在于:不同的地图产品(即不同来源)的坐标系(如WGS-84、GCJ-02、BD-09等)不同,因此,针对同一个地点,在不同坐标系下的经纬度坐标不同。
虽然无法基于名称、位置等信息,直接将兴趣点数据进行关联,但是,考虑到针对同一个地点,各兴趣点数据包括的名称相似,各兴趣点数据包括的位置之间的距离较短,因此,可以根据不同兴趣点数据的位置(如经纬度坐标)之间的距离、不同兴趣点数据的名称(如兴趣点名称)之间的相似度,确定不同兴趣点数据是否为同一地点的数据,从而将不同来源的兴趣点数据进行关联。
例如,名称“中心大厦”、名称“电子中心大厦”、名称“电子研发中心大厦”之间的相似度比较高,且位置“30.2798746584,120.0261959655”、位置“30.2858048989,120.0327567404”、位置“30.2798800000,120.0262100000”之间的距离比较短,因此,可以将兴趣点数据1、兴趣点数据2和兴趣点数据3进行关联,从而将不同来源的兴趣点数据进行关联,并对这些数据进行融合。
为了实现上述过程,即根据不同兴趣点数据的位置之间的距离、不同兴趣点数据的名称之间的相似度,确定不同兴趣点数据是否为同一地点的数据,则本申请实施例中提出一种兴趣点数据关联方法,该方法可以应用于服务器,对此服务器的类型不做限制,如服务器可以是PC(Personal Computer,个人计算机)、笔记本电脑、移动终端等,只要服务器能够实现兴趣点数据的关联即可。
参见图1所示,为本申请实施例的应用场景示意图,兴趣点数据的来源可以是谷歌地图、百度地图、高德地图等,对此兴趣点数据的来源不做限制。此外,可以通过文件(如excel文件)提供兴趣点数据,还可以通过接口提供兴趣点数据,还可以通过数据库提供兴趣点数据,对此不做限制。而且,兴趣点数据的内容可以包括但不限于:名称(POI名称)、位置(经纬度坐标)、类别(如停车场类型、品牌商类型等)、个性化数据(如停车场详细数据、品牌商详细数据等),对此兴趣点数据不做限制,如表1所示,为兴趣点数据的一个示例。
表1
POI名称 | 经度坐标 | 纬度坐标 | 类别 | 个性化数据 |
中心大厦 | 30.2798746584 | 120.0261959655 | 停车场类型 | 停车场详细数据 |
… | … | … | … | … |
参见图1所示,对于各种来源的兴趣点数据,可以从兴趣点数据中获取名称(POI名称)、位置(经纬度坐标),并基于名称(POI名称)确定不同兴趣点数据的名称之间的相似度,基于位置(经纬度坐标)确定不同兴趣点数据的位置之间的距离,然后,根据名称之间的相似度、位置之间的距离,就可以对不同兴趣点数据进行关联,并根据关联结果将各兴趣点数据存储到数据库中。
在上述应用场景下,参见图2所示,为本申请实施例中提出的兴趣点数据关联方法的流程图,该方法应用于服务器,该方法可以包括以下步骤:
步骤201,从第一兴趣点数据中获取第一位置和第一名称。
步骤202,从第二兴趣点数据中获取第二位置和第二名称。
步骤203,根据该第一位置和该第二位置的距离、该第一名称和该第二名称的相似度,确定该第一兴趣点数据和该第二兴趣点数据是否为同一地点的数据。
如果是,则可以执行步骤204;如果否,则可以执行步骤205。
步骤204,将该第一兴趣点数据和该第二兴趣点数据进行关联。
步骤205,将该第一兴趣点数据存储到数据库中。
在一个例子中,上述执行顺序只是为了方便描述给出的一个示例,在实际应用中,还可以改变步骤之间的执行顺序,对此执行顺序不做限制。而且,在其它实施例中,并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其它实施例中可能被分解为多个步骤进行描述;本说明书中所描述的多个步骤,在其它实施例也可能被合并为单个步骤进行描述。
针对步骤201和步骤202,在一个例子中,每次获取到新的兴趣点数据(如从谷歌地图获取到新的兴趣点数据1)后,就可以执行上述步骤201-步骤205。
为了区分方便,可以将获取到的兴趣点数据称为第一兴趣点数据,并将本地数据库中的兴趣点数据称为第二兴趣点数据(第二兴趣点数据为多个)。然后,从第一兴趣点数据中获取第一位置(为了区分方便,将第一兴趣点数据中的位置(经纬度坐标)称为第一位置)和第一名称(为了区分方便,将第一兴趣点数据中的名称(POI名称)称为第一名称)。此外,还可以从第二兴趣点数据中获取第二位置(为了区分方便,将第二兴趣点数据中的位置称为第二位置)和第二名称(为了区分方便,将第二兴趣点数据中的名称称为第二名称)。
例如,假设第一兴趣点数据如表1所示,且数据库可以如表2所示,表2中以3个兴趣点数据为例进行说明,实际应用中,兴趣点数据的数量可以更多。基于此,第一兴趣点数据的第一名称为“中心大厦”,第一位置为“30.2798746584,120.0261959655”,第二兴趣点数据A的第二名称为“电子中心大厦”,第二位置为“30.2858048989,120.0327567404”,第二兴趣点数据B的第二名称为“创新大楼”,第二位置为“38.1254986578,112.1254698788”,第二兴趣点数据C的第二名称为“科技中心”,第二位置为“12.2665548988,35.1210003256”。
表2
hash值 | POI名称 | 经度坐标 | 纬度坐标 | 类别 | 个性化数据 |
1234 | 电子中心大厦 | 30.2858048989 | 120.0327567404 | 品牌商类型 | 品牌商详细数据 |
1336 | 创新大楼 | 38.1254986578 | 112.1254698788 | ||
1457 | 科技中心 | 12.2665548988 | 35.1210003256 | 停车场类型 | 停车场详细数据 |
… | … | … | … | … | … |
针对步骤203,在一个例子中,针对“根据该第一位置和该第二位置的距离、该第一名称和该第二名称的相似度,确定该第一兴趣点数据和该第二兴趣点数据是否为同一地点的数据”的过程,可以包括但不限于如下方式:
方式一、针对数据库中的每个第二兴趣点数据,根据该第一位置和该第二兴趣点数据的第二位置的距离、该第一名称和该第二兴趣点数据的第二名称的相似度,确定该第一兴趣点数据和该第二兴趣点数据是否为同一地点的数据。
在方式一中,可以根据第一位置“30.2798746584,120.0261959655”和第二位置“30.2858048989,120.0327567404”的距离,第一名称“中心大厦”和第二名称“电子中心大厦”的相似度,确定第一兴趣点数据和第二兴趣点数据A是否为同一地点的数据。可以根据第一位置“30.2798746584,120.0261959655”和第二位置“38.1254986578,112.1254698788”的距离,第一名称“中心大厦”和第二名称“创新大楼”的相似度,确定第一兴趣点数据和第二兴趣点数据B是否为同一地点的数据。以此类推,针对每个第二兴趣点数据进行上述处理。
方式二、确定候选集合,该候选集合用于存储第二兴趣点数据;若候选集合不为空,针对候选集合中的每个第二兴趣点数据,根据该第一位置和该第二兴趣点数据的第二位置的距离、该第一名称和该第二兴趣点数据的第二名称的相似度,确定该第一兴趣点数据和该第二兴趣点数据是否为同一地点的数据。
在一个例子中,针对确定候选集合的过程,可以包括但不限于如下方式:
方式A、将数据库中的第二兴趣点数据存储到候选集合,例如,可以将数据库中的第二兴趣点数据,均存储到候选集合,也就是说,所述候选集合可以包括上述第二兴趣点数据A、第二兴趣点数据B和第二兴趣点数据C。
针对候选集合中的第二兴趣点数据A,可以根据第一位置“30.2798746584,120.0261959655”和第二位置“30.2858048989,120.0327567404”的距离,第一名称“中心大厦”和第二名称“电子中心大厦”的相似度,确定第一兴趣点数据和第二兴趣点数据A是否为同一地点的数据。此外,针对候选集合中的第二兴趣点数据B和第二兴趣点数据C,其处理过程类似,在此不再重复赘述。
方式B、针对数据库中的第二兴趣点数据(如数据库中的每个第二兴趣点数据),可以根据该第二兴趣点数据中的第二位置,确定是否将该第二兴趣点数据存储到上述候选集合。如果是,则可以将该第二兴趣点数据存储到所述候选集合,如果否,则可以拒绝将该第二兴趣点数据存储到所述候选集合。
在一个例子中,针对“根据该第二兴趣点数据中的第二位置,确定是否将该第二兴趣点数据存储到上述候选集合”的过程,可以包括但不限于:若该第二位置与该第一位置的距离小于距离阈值,则可以将该第二兴趣点数据存储到所述候选集合;否则,可以拒绝将该第二兴趣点数据存储到所述候选集合。
针对数据库中的第二兴趣点数据A,可以根据该第二位置“30.2858048989,120.0327567404”,确定是否将第二兴趣点数据A存储到候选集合。例如,若该第二位置“30.2858048989,120.0327567404”与上述第一位置“30.2798746584,120.0261959655”的距离,小于距离阈值,则可以将第二兴趣点数据A存储到候选集合;否则,拒绝将第二兴趣点数据A存储到候选集合。针对数据库中的第二兴趣点数据B和第二兴趣点数据C,其处理过程类似,在此不再重复赘述。
假设将第二兴趣点数据A存储到候选集合,拒绝将第二兴趣点数据B和第二兴趣点数据C存储到候选集合,则候选集合包括第二兴趣点数据A。
进一步的,针对所述候选集合中的第二兴趣点数据A,则还可以根据上述第一位置“30.2798746584,120.0261959655”以及该第二位置“30.2858048989,120.0327567404”的距离,第一名称“中心大厦”和第二名称“电子中心大厦”的相似度,确定第一兴趣点数据和第二兴趣点数据A是否为同一地点的数据。
方式C、针对数据库中的第二兴趣点数据(如数据库中的每个第二兴趣点数据),可以根据该第二兴趣点数据中的第二名称,确定是否将该第二兴趣点数据存储到上述候选集合。如果是,则可以将该第二兴趣点数据存储到所述候选集合,如果否,则可以拒绝将该第二兴趣点数据存储到所述候选集合。
在一个例子中,针对“根据该第二兴趣点数据中的第二名称,确定是否将该第二兴趣点数据存储到上述候选集合”的过程,可以包括但不限于:若该第二名称与该第一名称的相似度大于相似度阈值,则可以将该第二兴趣点数据存储到所述候选集合;否则,可以拒绝将该第二兴趣点数据存储到所述候选集合。
针对数据库中的第二兴趣点数据A,可以根据第二名称“电子中心大厦”,确定是否将第二兴趣点数据A存储到候选集合。例如,若第二名称“电子中心大厦”与第一名称“中心大厦”的相似度大于相似度阈值,则将第二兴趣点数据A存储到候选集合;否则拒绝将第二兴趣点数据A存储到候选集合。针对数据库中的第二兴趣点数据B和第二兴趣点数据C,其处理过程类似,不再赘述。
若将第二兴趣点数据A存储到候选集合,拒绝将第二兴趣点数据B和第二兴趣点数据C存储到候选集合,候选集合包括第二兴趣点数据A,参见方式B。
方式D、针对数据库中的第二兴趣点数据(如数据库中的每个第二兴趣点数据),可以根据该第二兴趣点数据中的第二位置和第二名称,确定是否将该第二兴趣点数据存储到候选集合。如果是,则可以将该第二兴趣点数据存储到所述候选集合,如果否,则可以拒绝将该第二兴趣点数据存储到所述候选集合。
在一个例子中,针对“根据第二兴趣点数据中的第二位置和第二名称,确定是否将该第二兴趣点数据存储到候选集合”的过程,可以包括但不限于:若第二位置与第一位置的距离小于距离阈值,且第二名称与第一名称的相似度大于相似度阈值,则可以将该第二兴趣点数据存储到所述候选集合;否则(即第二位置与第一位置的距离不小于距离阈值,和/或,第二名称与第一名称的相似度大于相似度阈值),可以拒绝将该第二兴趣点数据存储到所述候选集合。
针对数据库中的第二兴趣点数据A,可以根据第二名称“电子中心大厦”、第二位置“30.2858048989,120.0327567404”,确定是否将第二兴趣点数据A存储到候选集合。例如,若第二名称“电子中心大厦”与第一名称“中心大厦”的相似度大于相似度阈值,第二位置“30.2858048989,120.0327567404”与第一位置“30.2798746584,120.0261959655”的距离小于距离阈值,将第二兴趣点数据A存储到候选集合;否则拒绝将第二兴趣点数据A存储到候选集合。针对数据库中第二兴趣点数据B和第二兴趣点数据C,处理过程类似,不再赘述。
若将第二兴趣点数据A存储到候选集合,拒绝将第二兴趣点数据B和第二兴趣点数据C存储到候选集合,候选集合包括第二兴趣点数据A,参见方式B。
在上述实施例中,从数据库中获取的第二兴趣点数据,可以是数据库中的所有第二兴趣点数据,也可以是部分第二兴趣点数据,对此不做限制。然后,可以基于从数据库中获取的第二兴趣点数据,执行上述步骤202和步骤203。
例如,假设第一兴趣点数据对应北京市东城区的某个兴趣点,则可以从数据库中获取北京市东城区的第二兴趣点数据。又例如,假设第一兴趣点数据的第一位置是“30.2798746584,120.0261959655”,则可以从数据库中获取经度坐标位于区间(28-32)、且纬度坐标位于区间(118-122)的第二兴趣点数据。
在方式二中,在确定候选集合后,若该候选集合为空(即候选集合不包括第二兴趣点数据),则确定不存在与第一兴趣点数据是同一地点的第二兴趣点数据,并将该第一兴趣点数据存储到数据库中,具体实现方式参见步骤205。
针对步骤203,在一个例子中,针对“根据该第一位置和该第二位置的距离、该第一名称和该第二名称的相似度,确定该第一兴趣点数据和该第二兴趣点数据是否为同一地点的数据”的过程,可以包括但不限于:根据该第一位置和该第二位置的距离、距离权重因子,该第一名称和该第二名称的相似度、相似度权重因子,确定该第一兴趣点数据和该第二兴趣点数据是否为同一地点的数据。
进一步的,针对“根据该第一位置和该第二位置的距离、距离权重因子,该第一名称和该第二名称的相似度、相似度权重因子,确定该第一兴趣点数据和该第二兴趣点数据是否为同一地点的数据”的过程,可以包括但不限于:根据第一位置和第二位置的距离、距离权重因子计算第一参考值,并根据第一名称和第二名称的相似度、相似度权重因子计算第二参考值;根据第一参考值和第二参考值,确定第一兴趣点数据和第二兴趣点数据是否为同一地点的数据。
在一个例子中,针对“根据第一位置和第二位置的距离、距离权重因子计算第一参考值”的过程,可以包括:可以将第一位置和第二位置的距离、与距离权重因子的乘积,确定为该第一参考值。针对“根据第一名称和第二名称的相似度、相似度权重因子计算第二参考值”的过程,可以包括:可以将第一名称和第二名称的相似度、与相似度权重因子的乘积,确定为该第二参考值。
在一个例子中,针对“根据第一参考值和第二参考值,确定第一兴趣点数据和第二兴趣点数据是否为同一地点的数据”的过程,可以包括但不限于:
当第一参考值小于第一阈值,且第二参考值大于第二阈值时,则可以确定第一兴趣点数据和第二兴趣点数据是同一地点的数据,否则,可以确定第一兴趣点数据和第二兴趣点数据不是同一地点的数据。或者,计算预设数值(如数值1等)与第一参考值的商,当计算结果与第二参考值的和大于第三阈值时,则可以确定第一兴趣点数据和第二兴趣点数据是同一地点的数据,否则,可以确定第一兴趣点数据和第二兴趣点数据不是同一地点的数据。或者,计算预设数值(如数值1等)与第二参考值的商,当计算结果与第一参考值的和小于第四阈值时,则可以确定第一兴趣点数据和第二兴趣点数据是同一地点的数据,否则,可以确定第一兴趣点数据和第二兴趣点数据不是同一地点的数据。
上述过程给出了“根据第一参考值和第二参考值,确定是否为同一地点的数据”的几个示例,对此不做限制,只要第一参考值越小,且第二参考值越大时,第一兴趣点数据和第二兴趣点数据是同一地点的数据的可能性越高即可。
其中,第一阈值、第二阈值可以根据经验进行配置,对此不做限制,当第一参考值小于第一阈值,且第二参考值大于第二阈值时,表示同一地点的数据。
其中,第三阈值可以根据经验进行配置,对此不做限制,当预设数值与第一参考值的商、与第二参考值的和大于第三阈值时,表示同一地点的数据。
其中,第四阈值可以根据经验进行配置,对此不做限制,当预设数值与第二参考值的商、与第一参考值的和小于第四阈值时,表示同一地点的数据。
在一个例子中,针对“根据该第一位置和该第二位置的距离、该第一名称和该第二名称的相似度,确定该第一兴趣点数据和该第二兴趣点数据是否为同一地点的数据”的过程,上述基于距离和距离权重因子,相似度和相似度权重因子的确定方式,只是确定方式的一个示例,对此不做限制,只要第一位置和第二位置之间的距离越小,且第一名称和第二名称之间的相似度越高时,第一兴趣点数据和第二兴趣点数据是同一地点的数据的可能性越高即可。
在上述实施例中,第一位置和第二位置的距离是指:由于第一位置是一个经纬度坐标,且第二位置是另一个经纬度坐标,因此,可以直接基于这两个经纬度坐标,确定出第一位置和第二位置的距离,对此确定方式不做限制。
在上述实施例中,第一名称和第二名称的相似度是指:可以对第一名称进行分词处理,得到一个或者多个第一短语,并对第二名称进行分词处理,得到一个或者多个第二短语。然后,可以确定第一短语与第二短语之间的相似度。
其中,为了实现分词处理,可以采用预设的分词技术,对此分词技术不做限制。例如,在对第二名称“电子中心大厦”进行分词处理后,得到电子、中心、大厦,而对第一名称“中心大厦”进行分词处理后,得到中心、大厦。
其中,为了确定第一短语与第二短语之间的相似度,可以采用预设的短语相似度比较算法,对此短语相似度比较算法不做限制。例如,短语“电子、中心、大厦”与短语“中心、大厦”的相似度为66.7%,即三个短语中有两个相同。
针对步骤204,在一个例子中,针对“将第一兴趣点数据和第二兴趣点数据进行关联”的过程,可以包括但不限于如下方式:在数据库中记录该第一兴趣点数据和该第二兴趣点数据的对应关系,如表3所示,为将第一兴趣点数据和第二兴趣点数据A进行关联的一个示例,对此不做限制。或者,还可以对该第一兴趣点数据和该第二兴趣点数据生成同一hash值,并在数据库中记录该hash值、该第一兴趣点数据和该第二兴趣点数据的对应关系,如表4所示,为将第一兴趣点数据和第二兴趣点数据A进行关联的一个示例,对此不做限制。
表3
表4
hash值 | POI名称 | 经度坐标 | 纬度坐标 | 类别 | 个性化数据 |
1234 | 电子中心大厦 | 30.2858048989 | 120.0327567404 | 品牌商类型 | 品牌商详细数据 |
1336 | 创新大楼 | 38.1254986578 | 112.1254698788 | ||
1457 | 科技中心 | 12.2665548988 | 35.1210003256 | 停车场类型 | 停车场详细数据 |
1234 | 中心大厦 | 30.2798746584 | 120.0261959655 | 停车场类型 | 停车场详细数据 |
… | … | … | … | … | … |
表3中不存在hash值,通过将第一兴趣点数据和第二兴趣点数据A记录到同一行,从而将第一兴趣点数据和第二兴趣点数据A关联。在表4中,第一兴趣点数据和第二兴趣点数据A具有相同的hash值“1234”,因此,可以基于hash值将第一兴趣点数据和第二兴趣点数据A关联。当然,即使存在hash值“1234”,也可以将第一兴趣点数据和第二兴趣点数据A记录到同一行,对此不做限制。
其中,针对“对第一兴趣点数据和第二兴趣点数据生成同一hash值”的过程,可以将第二兴趣点数据当前对应的hash值(如1234),确定为二者共同的hash值,即表4的情况,也可以生成一个新的hash值,并使用这个新的hash值更新第二兴趣点数据对应的hash值,且第一兴趣点数据对应该新的hash值。
针对步骤205,在一个例子中,针对“将该第一兴趣点数据存储到数据库中”的过程,可以包括但不限于如下方式:在数据库中记录第一兴趣点数据,如表5所示,对此不做限制。或者,对第一兴趣点数据生成hash值,并在数据库中记录该hash值、该第一兴趣点数据的对应关系,如表6所示,对此不做限制。
表5
POI名称 | 经度坐标 | 纬度坐标 | 类别 | 个性化数据 |
电子中心大厦 | 30.2858048989 | 120.0327567404 | 品牌商类型 | 品牌商详细数据 |
创新大楼 | 38.1254986578 | 112.1254698788 | ||
科技中心 | 12.2665548988 | 35.1210003256 | 停车场类型 | 停车场详细数据 |
中心大厦 | 30.2798746584 | 120.0261959655 | 停车场类型 | 停车场详细数据 |
… | … | … | … | … |
表6
hash值 | POI名称 | 经度坐标 | 纬度坐标 | 类别 | 个性化数据 |
1234 | 电子中心大厦 | 30.2858048989 | 120.0327567404 | 品牌商类型 | 品牌商详细数据 |
1336 | 创新大楼 | 38.1254986578 | 112.1254698788 | ||
1457 | 科技中心 | 12.2665548988 | 35.1210003256 | 停车场类型 | 停车场详细数据 |
1289 | 中心大厦 | 30.2798746584 | 120.0261959655 | 停车场类型 | 停车场详细数据 |
… | … | … | … | … | … |
针对步骤204和步骤205,在将第一兴趣点数据存储到数据库后,在下次执行步骤201-步骤205时,这个第一兴趣点数据成为第二兴趣点数据,不再赘述。
基于上述技术方案,本申请实施例中,针对不同来源的兴趣点数据,可以根据不同兴趣点数据的位置(如经纬度坐标)之间的距离(即经纬度坐标之间的距离)、不同兴趣点数据的名称(如兴趣点名称)之间的相似度,确定不同兴趣点数据是否为同一地点的数据,若是,则可以将这些兴趣点数据进行关联,并对这些兴趣点数据进行融合。这样,可以对不同来源的兴趣点数据进行融合,方便在同一个地图产品上,统一展示融合后的兴趣点数据,提高用户体验。
在上述实施例中,涉及距离阈值、相似度阈值、距离权重因子、相似度权重因子,这些参数可以根据经验进行配置,也可以训练得到这些参数。以下对训练得到距离阈值、相似度阈值、距离权重因子、相似度权重因子进行说明。
参见图3A所示,为训练得到距离阈值的流程示意图,该过程可以包括:
步骤311,获取训练集合,该训练集合包括多个位置,且位置具有打标数据。
例如,训练集合包括位置1、位置2、位置3、位置4、位置5。位置1、位置2、位置3具有打标数据A,即位置1、位置2、位置3是针对同一地点的位置,位置4、位置5具有打标数据B,即位置4、位置5是针对同一地点的位置。
步骤312,从训练集合中获取针对同一地点的两个位置,并计算所述两个位置的距离,针对每次获取的两个位置,均需要计算所述两个位置的距离。
例如,计算位置1和位置2之间的距离1,计算位置1和位置3之间的距离2,计算位置2和位置3之间的距离3,计算位置4和位置5之间的距离4。
步骤313,利用计算的距离的平均值,获取距离阈值。
例如,将距离1、距离2、距离3、距离4的平均值,确定为距离阈值。
参见图3B所示,为训练得到相似度阈值的流程示意图,该过程可以包括:
步骤321,获取训练集合,该训练集合包括多个名称,且名称具有打标数据。
例如,训练集合包括名称1、名称2、名称3、名称4、名称5。名称1、名称2、名称3具有打标数据A,即名称1、名称2、名称3是针对同一地点的名称,名称4、名称5具有打标数据B,即名称4、名称5是针对同一地点的名称。
步骤322,从训练集合中获取针对同一地点的两个名称,并计算所述两个名称的相似度,即针对每次获取的两个名称,均需要计算所述两个名称的相似度。
为了计算两个名称的相似度,可以对这两个名称进行分词处理,得到一个或多个短语,并确定短语之间的相似度,参见上述过程的介绍,在此不再赘述。
例如,可以计算名称1和名称2之间的相似度1,名称1和名称3之间的相似度2,名称2和名称3之间的相似度3,名称4和名称5之间的相似度4。
步骤323,利用计算的相似度的平均值,获取相似度阈值。例如,可以将相似度1、相似度2、相似度3、相似度4的平均值,确定为相似度阈值。
参见图3C所示,为训练得到距离权重因子、相似度权重因子的流程示意图。
步骤331,获取训练集合,该训练集合可以包括多个位置和多个名称。
其中,每个位置可以具有打标数据,参见步骤311所示,在此不再赘述。
其中,每个名称可以具有打标数据,参见步骤321所示,在此不再赘述。
步骤332,从训练集合中获取针对同一地点的两个位置,并计算所述两个位置的距离,针对每次获取的两个位置,均需要计算所述两个位置的距离。
其中,步骤332的处理过程,可以参见步骤312所示,在此不再赘述。
步骤333,从训练集合中获取针对同一地点的两个名称,并计算所述两个名称的相似度,即针对每次获取的两个名称,均需要计算所述两个名称的相似度。
其中,步骤333的处理过程,可以参见步骤322所示,在此不再赘述。
步骤334,利用计算的距离(即步骤332得到的多个距离)、计算的相似度(即步骤333得到的多个相似度),获取距离权重因子和相似度权重因子。
在一个例子中,针对“利用计算的距离、计算的相似度,获取距离权重因子和相似度权重因子”的过程,可以包括但不限于:基于计算的距离、计算的相似度,利用逻辑回归算法获取距离权重因子和相似度权重因子。例如,将距离1、距离2、距离3、距离4、相似度1、相似度2、相似度3、相似度4等数据作为输入数据,利用逻辑回归算法获取距离权重因子和相似度权重因子。
基于与上述方法同样的申请构思,本申请实施例还提供另一种兴趣点数据关联方法,该方法可以应用于服务器,参见图4所示,为该方法的流程图。
步骤401,从第一兴趣点数据中获取第一参数,如第一位置和/或第一名称。
步骤402,从第二兴趣点数据中获取第二参数,如第二位置和/或第二名称。
步骤403,根据第一参数和第二参数之间的匹配程度,确定第一兴趣点数据和第二兴趣点数据是否为同一地点的数据。若是,则执行步骤404。
步骤404,将第一兴趣点数据和第二兴趣点数据进行关联。
其中,根据第一参数和第二参数之间的匹配程度,确定第一兴趣点数据和第二兴趣点数据是否为同一地点的数据,可以包括但不限于如下方式:
方式一、若第一参数包括第一位置,第二参数包括第二位置,根据第一位置和第二位置的距离,确定第一兴趣点数据和第二兴趣点数据是否为同一地点的数据;例如,若第一位置和第二位置的距离小于距离阈值,确定第一兴趣点数据和第二兴趣点数据为同一地点的数据,否则确定不是同一地点的数据。
方式二、若第一参数包括第一名称,第二参数包括第二名称,根据第一名称和第二名称的相似度,确定第一兴趣点数据和第二兴趣点数据是否为同一地点的数据;例如,若第一名称和第二名称的相似度大于相似度阈值,确定第一兴趣点数据和第二兴趣点数据为同一地点的数据,否则不是同一地点的数据。
方式三、若第一参数包括第一位置和第一名称,第二参数包括第二位置和第二名称,则根据第一位置和第二位置的距离、第一名称和第二名称的相似度,确定第一兴趣点数据和第二兴趣点数据是否为同一地点的数据。具体实现方式可以参见上述实施例(如图2、图3A-3C所示的流程),在此不再赘述。
基于与上述方法同样的申请构思,本申请实施例还提供一种兴趣点数据关联装置,应用于服务器,如图5所示,为所述装置的结构图,所述装置包括:
获取模块501,用于从第一兴趣点数据中获取第一位置和第一名称,并从第二兴趣点数据中获取第二位置和第二名称;
确定模块502,用于根据第一位置和第二位置的距离、第一名称和第二名称的相似度,确定第一兴趣点数据和第二兴趣点数据是否为同一地点的数据;
处理模块503,用于当所述第一兴趣点数据和第二兴趣点数据是同一地点的数据时,则将所述第一兴趣点数据和所述第二兴趣点数据进行关联。
所述确定模块502,具体用于确定候选集合,所述候选集合用于存储第二兴趣点数据;若所述候选集合不为空,针对所述候选集合中的第二兴趣点数据,根据所述第一位置和第二位置的距离、所述第一名称和第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据。
所述确定模块502,具体用于在确定候选集合的过程中,将数据库中的第二兴趣点数据存储到所述候选集合;或者,针对数据库中的第二兴趣点数据,根据所述第二兴趣点数据中的第二位置,确定是否将所述第二兴趣点数据存储到所述候选集合;或者,针对数据库中的第二兴趣点数据,根据所述第二兴趣点数据中的第二名称,确定是否将所述第二兴趣点数据存储到所述候选集合;或者,针对数据库中的第二兴趣点数据,根据所述第二兴趣点数据中的第二位置和第二名称,确定是否将所述第二兴趣点数据存储到所述候选集合。
所述确定模块502,具体用于根据所述第一位置和所述第二位置的距离、距离权重因子,所述第一名称和所述第二名称的相似度、相似度权重因子,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据。
所述确定模块502,具体用于在根据所述第一位置和所述第二位置的距离、距离权重因子,所述第一名称和所述第二名称的相似度、相似度权重因子,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据的过程中,根据所述第一位置和所述第二位置的距离、距离权重因子计算第一参考值,根据所述第一名称和所述第二名称的相似度、相似度权重因子计算第二参考值;根据所述第一参考值和第二参考值,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据。
基于与上述方法同样的申请构思,本申请实施例还提供一种服务器,所述服务器包括:处理器;其中,所述处理器,用于从第一兴趣点数据中获取第一位置和第一名称;从第二兴趣点数据中获取第二位置和第二名称;根据所述第一位置和所述第二位置的距离、所述第一名称和所述第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;若是,则将所述第一兴趣点数据和所述第二兴趣点数据进行关联。
基于与上述方法同样的申请构思,本申请实施例还提供一种机器可读存储介质,所述机器可读存储介质上存储有若干计算机指令,所述计算机指令被执行时进行如下处理:从第一兴趣点数据中获取第一位置和第一名称;从第二兴趣点数据中获取第二位置和第二名称;根据所述第一位置和所述第二位置的距离、所述第一名称和所述第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;若是,则将所述第一兴趣点数据和所述第二兴趣点数据进行关联。
基于与上述方法同样的申请构思,本申请实施例还提供一种兴趣点数据关联装置,应用于服务器,所述装置包括:
获取模块,用于从第一兴趣点数据中获取第一参数,并从第二兴趣点数据中获取第二参数;确定模块,用于根据所述第一参数和所述第二参数之间的匹配程度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;处理模块,用于当所述第一兴趣点数据和第二兴趣点数据是同一地点的数据时,则将所述第一兴趣点数据和所述第二兴趣点数据进行关联。
所述确定模块在根据所述第一参数和所述第二参数之间的匹配程度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据时具体用于:若所述第一参数包括第一位置,所述第二参数包括第二位置,则根据所述第一位置和所述第二位置的距离,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;或者,若所述第一参数包括第一名称,所述第二参数包括第二名称,则根据所述第一名称和所述第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;或者,若所述第一参数包括第一位置和第一名称,所述第二参数包括第二位置和第二名称,则根据第一位置和第二位置的距离、第一名称和第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据。
基于与上述方法同样的申请构思,本申请实施例还提供一种服务器,所述服务器包括:处理器;其中,所述处理器,用于从第一兴趣点数据中获取第一参数;从第二兴趣点数据中获取第二参数;根据第一参数和第二参数之间的匹配程度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;若是,则将所述第一兴趣点数据和所述第二兴趣点数据进行关联。
基于与上述方法同样的申请构思,本申请实施例还提供一种机器可读存储介质,所述机器可读存储介质上存储有若干计算机指令,所述计算机指令被执行时进行如下处理:从第一兴趣点数据中获取第一参数;从第二兴趣点数据中获取第二参数;根据第一参数和第二参数之间的匹配程度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;若是,则将所述第一兴趣点数据和所述第二兴趣点数据进行关联。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可以由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其它可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其它可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
而且,这些计算机程序指令也可以存储在能引导计算机或其它可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或者多个流程和/或方框图一个方框或者多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其它可编程数据处理设备上,使得在计算机或者其它可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其它可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (26)
1.一种兴趣点数据关联方法,其特征在于,应用于服务器,该方法包括:
从第一兴趣点数据中获取第一位置和第一名称;
从第二兴趣点数据中获取第二位置和第二名称;
根据第一位置和第二位置的距离、第一名称和第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;
若是,则将所述第一兴趣点数据和所述第二兴趣点数据进行关联。
2.根据权利要求1所述的方法,其特征在于,
所述根据第一位置和第二位置的距离、第一名称和第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据,包括:
确定候选集合,所述候选集合用于存储第二兴趣点数据;
若所述候选集合不为空,针对所述候选集合中的第二兴趣点数据,根据所述第一位置和第二位置的距离、所述第一名称和第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据。
3.根据权利要求2所述的方法,其特征在于,所述确定候选集合,包括:
将数据库中的第二兴趣点数据存储到所述候选集合;或者,
针对数据库中的第二兴趣点数据,根据所述第二兴趣点数据中的第二位置,确定是否将所述第二兴趣点数据存储到所述候选集合;或者,
针对数据库中的第二兴趣点数据,根据所述第二兴趣点数据中的第二名称,确定是否将所述第二兴趣点数据存储到所述候选集合;或者,
针对数据库中的第二兴趣点数据,根据所述第二兴趣点数据中的第二位置和第二名称,确定是否将所述第二兴趣点数据存储到所述候选集合。
4.根据权利要求3所述的方法,其特征在于,根据所述第二兴趣点数据中的第二位置,确定是否将所述第二兴趣点数据存储到所述候选集合,包括:
若所述第二位置与所述第一位置的距离小于距离阈值,则将所述第二兴趣点数据存储到候选集合;否则,拒绝将所述第二兴趣点数据存储到候选集合。
5.根据权利要求3所述的方法,其特征在于,根据所述第二兴趣点数据中的第二名称,确定是否将所述第二兴趣点数据存储到所述候选集合,包括:
若所述第二名称与所述第一名称的相似度大于相似度阈值,将所述第二兴趣点数据存储到候选集合;否则,拒绝将所述第二兴趣点数据存储到候选集合。
6.根据权利要求3所述的方法,其特征在于,
所述根据所述第二兴趣点数据中的第二位置和第二名称,确定是否将所述第二兴趣点数据存储到所述候选集合的过程,具体包括:
若所述第二位置与所述第一位置的距离小于距离阈值,且所述第二名称与所述第一名称的相似度大于相似度阈值,则将所述第二兴趣点数据存储到候选集合;否则,拒绝将所述第二兴趣点数据存储到候选集合。
7.根据权利要求4或6所述的方法,其特征在于,所述方法还包括:
获取训练集合,所述训练集合包括多个位置;
从训练集合中获取针对同一地点的两个位置,并计算所述两个位置的距离;
利用计算的距离的平均值,获取所述距离阈值。
8.根据权利要求5或6所述的方法,其特征在于,所述方法还包括:
获取训练集合,所述训练集合包括多个名称;
从训练集合中获取针对同一地点的两个名称,计算所述两个名称的相似度;
利用计算的相似度的平均值,获取所述相似度阈值。
9.根据权利要求2所述的方法,其特征在于,所述方法还包括:
若所述候选集合为空,则确定不存在与所述第一兴趣点数据是同一地点的第二兴趣点数据,并将所述第一兴趣点数据存储到数据库中。
10.根据权利要求1或2所述的方法,其特征在于,
所述根据第一位置和第二位置的距离、第一名称和第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据,包括:
根据所述第一位置和所述第二位置的距离、距离权重因子,所述第一名称和所述第二名称的相似度、相似度权重因子,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据。
11.根据权利要求10所述的方法,其特征在于,
所述根据所述第一位置和所述第二位置的距离、距离权重因子,所述第一名称和所述第二名称的相似度、相似度权重因子,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据的过程,具体包括:
根据所述第一位置和所述第二位置的距离、距离权重因子计算第一参考值,根据所述第一名称和所述第二名称的相似度、相似度权重因子计算第二参考值;
根据所述第一参考值和所述第二参考值,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据。
12.根据权利要求10所述的方法,其特征在于,所述方法还包括:
获取训练集合,所述训练集合包括多个位置和多个名称;
从训练集合中获取针对同一地点的两个位置,计算所述两个位置的距离;
从训练集合中获取针对同一地点的两个名称,计算所述两个名称的相似度;
利用计算的距离、计算的相似度,获取距离权重因子和相似度权重因子。
13.根据权利要求12所述的方法,其特征在于,所述利用计算的距离、计算的相似度,获取距离权重因子和相似度权重因子的过程,包括:
基于计算的距离、计算的相似度,利用逻辑回归算法获取所述距离权重因子和所述相似度权重因子。
14.根据权利要求1所述的方法,其特征在于,
所述将所述第一兴趣点数据和所述第二兴趣点数据进行关联的过程,包括:
在数据库记录所述第一兴趣点数据和所述第二兴趣点数据的对应关系;或,对所述第一兴趣点数据和所述第二兴趣点数据生成同一hash值,在数据库记录所述hash值、所述第一兴趣点数据和所述第二兴趣点数据的对应关系。
15.根据权利要求1所述的方法,其特征在于,所述根据第一位置和第二位置的距离、第一名称和第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据之后,所述方法还包括:
若否,则将所述第一兴趣点数据存储到数据库中。
16.一种兴趣点数据关联方法,其特征在于,应用于服务器,该方法包括:
从第一兴趣点数据中获取第一参数;
从第二兴趣点数据中获取第二参数;
根据所述第一参数和所述第二参数之间的匹配程度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;
若是,则将所述第一兴趣点数据和所述第二兴趣点数据进行关联。
17.根据权利要求16所述的方法,其特征在于,
所述根据所述第一参数和所述第二参数之间的匹配程度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据,包括:
若所述第一参数包括第一位置,所述第二参数包括第二位置,则根据所述第一位置和所述第二位置的距离,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;或者,
若所述第一参数包括第一名称,所述第二参数包括第二名称,则根据所述第一名称和所述第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;或者,
若所述第一参数包括第一位置和第一名称,所述第二参数包括第二位置和第二名称,则根据第一位置和第二位置的距离、第一名称和第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据。
18.一种兴趣点数据关联装置,其特征在于,应用于服务器,该装置包括:
获取模块,用于从第一兴趣点数据中获取第一位置和第一名称,并从第二兴趣点数据中获取第二位置和第二名称;
确定模块,用于根据第一位置和第二位置的距离、第一名称和第二名称的相似度,确定所述第一兴趣点数据和第二兴趣点数据是否为同一地点的数据;
处理模块,用于当所述第一兴趣点数据和第二兴趣点数据是同一地点的数据时,则将所述第一兴趣点数据和所述第二兴趣点数据进行关联。
19.根据权利要求18所述的装置,其特征在于,
所述确定模块,具体用于确定候选集合,所述候选集合用于存储第二兴趣点数据;若所述候选集合不为空,针对所述候选集合中的第二兴趣点数据,根据所述第一位置和第二位置的距离、所述第一名称和第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据。
20.根据权利要求19所述的装置,其特征在于,
所述确定模块,具体用于在确定候选集合的过程中,将数据库中的第二兴趣点数据存储到所述候选集合;或者,针对数据库中的第二兴趣点数据,根据所述第二兴趣点数据中的第二位置,确定是否将所述第二兴趣点数据存储到所述候选集合;或者,针对数据库中的第二兴趣点数据,根据所述第二兴趣点数据中的第二名称,确定是否将所述第二兴趣点数据存储到所述候选集合;或者,针对数据库中的第二兴趣点数据,根据所述第二兴趣点数据中的第二位置和第二名称,确定是否将所述第二兴趣点数据存储到所述候选集合。
21.根据权利要求18或19所述的装置,其特征在于,
所述确定模块,具体用于根据所述第一位置和所述第二位置的距离、距离权重因子,所述第一名称和所述第二名称的相似度、相似度权重因子,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据。
22.根据权利要求21所述的装置,其特征在于,所述确定模块,具体用于在根据所述第一位置和所述第二位置的距离、距离权重因子,所述第一名称和所述第二名称的相似度、相似度权重因子,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据的过程中,根据所述第一位置和所述第二位置的距离、距离权重因子计算第一参考值,根据所述第一名称和所述第二名称的相似度、相似度权重因子计算第二参考值;根据所述第一参考值和第二参考值,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据。
23.一种兴趣点数据关联装置,其特征在于,应用于服务器,该装置包括:
获取模块,用于从第一兴趣点数据中获取第一参数,并从第二兴趣点数据中获取第二参数;
确定模块,用于根据所述第一参数和所述第二参数之间的匹配程度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;
处理模块,用于当所述第一兴趣点数据和第二兴趣点数据是同一地点的数据时,则将所述第一兴趣点数据和所述第二兴趣点数据进行关联。
24.根据权利要求23所述的装置,其特征在于,
所述确定模块在根据所述第一参数和所述第二参数之间的匹配程度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据时具体用于:若所述第一参数包括第一位置,所述第二参数包括第二位置,则根据所述第一位置和所述第二位置的距离,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;或者,若所述第一参数包括第一名称,所述第二参数包括第二名称,则根据所述第一名称和所述第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;或者,若所述第一参数包括第一位置和第一名称,所述第二参数包括第二位置和第二名称,则根据第一位置和第二位置的距离、第一名称和第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据。
25.一种服务器,其特征在于,所述服务器包括:处理器,用于从第一兴趣点数据中获取第一位置和第一名称;从第二兴趣点数据中获取第二位置和第二名称;根据所述第一位置和所述第二位置的距离、所述第一名称和所述第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;若是,则将所述第一兴趣点数据和所述第二兴趣点数据进行关联。
26.一种服务器,其特征在于,包括:处理器,用于从第一兴趣点数据中获取第一参数;从第二兴趣点数据中获取第二参数;根据第一参数和第二参数之间的匹配程度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;若是,则将所述第一兴趣点数据和所述第二兴趣点数据进行关联。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810072186.XA CN110110017B (zh) | 2018-01-25 | 2018-01-25 | 一种兴趣点数据关联方法、装置及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810072186.XA CN110110017B (zh) | 2018-01-25 | 2018-01-25 | 一种兴趣点数据关联方法、装置及服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110110017A true CN110110017A (zh) | 2019-08-09 |
CN110110017B CN110110017B (zh) | 2024-03-15 |
Family
ID=67483599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810072186.XA Active CN110110017B (zh) | 2018-01-25 | 2018-01-25 | 一种兴趣点数据关联方法、装置及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110110017B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110457706A (zh) * | 2019-08-15 | 2019-11-15 | 腾讯科技(深圳)有限公司 | 兴趣点名称选择模型训练方法、使用方法、装置及存储介质 |
CN110837607A (zh) * | 2019-11-14 | 2020-02-25 | 腾讯云计算(北京)有限责任公司 | 兴趣点匹配方法、装置、计算机设备以及存储介质 |
CN110851547A (zh) * | 2019-10-11 | 2020-02-28 | 上海中旖能源科技有限公司 | 一种多数据源地图数据融合方法 |
CN112650822A (zh) * | 2019-10-09 | 2021-04-13 | 浙江宇视科技有限公司 | 地图接入方法、装置、电子设备和机器可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090100005A1 (en) * | 2007-10-12 | 2009-04-16 | Microsoft Corporation | Mapping network addresses to geographical locations |
CN101963961A (zh) * | 2009-07-23 | 2011-02-02 | 高德软件有限公司 | 兴趣点数据关联方法及装置 |
CN104050196A (zh) * | 2013-03-15 | 2014-09-17 | 阿里巴巴集团控股有限公司 | 一种兴趣点数据冗余检测方法及装置 |
CN107609186A (zh) * | 2017-09-30 | 2018-01-19 | 百度在线网络技术(北京)有限公司 | 信息处理方法及装置、终端设备及计算机可读存储介质 |
-
2018
- 2018-01-25 CN CN201810072186.XA patent/CN110110017B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090100005A1 (en) * | 2007-10-12 | 2009-04-16 | Microsoft Corporation | Mapping network addresses to geographical locations |
CN101963961A (zh) * | 2009-07-23 | 2011-02-02 | 高德软件有限公司 | 兴趣点数据关联方法及装置 |
CN104050196A (zh) * | 2013-03-15 | 2014-09-17 | 阿里巴巴集团控股有限公司 | 一种兴趣点数据冗余检测方法及装置 |
CN107609186A (zh) * | 2017-09-30 | 2018-01-19 | 百度在线网络技术(北京)有限公司 | 信息处理方法及装置、终端设备及计算机可读存储介质 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110457706A (zh) * | 2019-08-15 | 2019-11-15 | 腾讯科技(深圳)有限公司 | 兴趣点名称选择模型训练方法、使用方法、装置及存储介质 |
CN110457706B (zh) * | 2019-08-15 | 2023-08-22 | 腾讯科技(深圳)有限公司 | 兴趣点名称选择模型训练方法、使用方法、装置及存储介质 |
CN112650822A (zh) * | 2019-10-09 | 2021-04-13 | 浙江宇视科技有限公司 | 地图接入方法、装置、电子设备和机器可读存储介质 |
CN112650822B (zh) * | 2019-10-09 | 2023-09-15 | 浙江宇视科技有限公司 | 地图接入方法、装置、电子设备和机器可读存储介质 |
CN110851547A (zh) * | 2019-10-11 | 2020-02-28 | 上海中旖能源科技有限公司 | 一种多数据源地图数据融合方法 |
CN110837607A (zh) * | 2019-11-14 | 2020-02-25 | 腾讯云计算(北京)有限责任公司 | 兴趣点匹配方法、装置、计算机设备以及存储介质 |
CN110837607B (zh) * | 2019-11-14 | 2023-03-10 | 腾讯云计算(北京)有限责任公司 | 兴趣点匹配方法、装置、计算机设备以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110110017B (zh) | 2024-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106303955B (zh) | 用于对无线热点和poi进行匹配的方法和装置 | |
CN110110017A (zh) | 一种兴趣点数据关联方法、装置及服务器 | |
US9454580B2 (en) | Recommendation system with metric transformation | |
US20180357312A1 (en) | Generating a playlist | |
US20160358042A1 (en) | Electronic Travel Album Generating Method and Computing Device | |
US10769428B2 (en) | On-device image recognition | |
JP2017508197A (ja) | オブジェクト認識システムにおける動的な特徴データベース管理のためのインクリメンタル学習 | |
US10217224B2 (en) | Method and system for sharing-oriented personalized route planning via a customizable multimedia approach | |
CN107796395A (zh) | 一种用于室内目标位置的导航方法、装置及终端设备 | |
CN110598791A (zh) | 地址相似度评价方法、装置、设备及介质 | |
CN104850238A (zh) | 对输入法所产生的候选项进行排序的方法和装置 | |
CN105488176A (zh) | 数据处理方法和装置 | |
CN108268504A (zh) | 一种划分兴趣点的搜索区域的方法及设备 | |
CN111858785B (zh) | 地图离散型要素的匹配方法、装置、系统及存储介质 | |
US12014654B2 (en) | Information processing apparatus, information system, information processing method, and program | |
CN111737374B (zh) | 位置坐标确定方法、装置、电子设备及存储介质 | |
CN111461328B (zh) | 一种神经网络的训练方法 | |
CN109697234A (zh) | 实体的多属性信息存储、查询方法、装置、服务器和介质 | |
CN116295466A (zh) | 地图生成方法、装置、电子设备、存储介质、及车辆 | |
JP2015207168A (ja) | 情報提示システム、方法及びプログラム | |
CN111008864B (zh) | 一种营销码与商户之间的铺设关系的确定方法、装置及电子设备 | |
CN113607183A (zh) | 一种车辆的运输路线规划方法、装置、存储介质及终端 | |
Yan et al. | [Retracted] FastQR: Fast Pose Estimation of Objects Based on Multiple QR Codes and Monocular Vision in Mobile Embedded Devices | |
CN110619086B (zh) | 用于处理信息的方法和装置 | |
US10149649B2 (en) | Method for identifying exercise path, method for searching for exercise path, and system thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40011579 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |