CN108536695B - 一种地理位置信息点的聚合方法以及装置 - Google Patents

一种地理位置信息点的聚合方法以及装置 Download PDF

Info

Publication number
CN108536695B
CN108536695B CN201710119976.4A CN201710119976A CN108536695B CN 108536695 B CN108536695 B CN 108536695B CN 201710119976 A CN201710119976 A CN 201710119976A CN 108536695 B CN108536695 B CN 108536695B
Authority
CN
China
Prior art keywords
data point
points
longitude
information
geographic position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710119976.4A
Other languages
English (en)
Other versions
CN108536695A (zh
Inventor
张怡菲
董琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN201710119976.4A priority Critical patent/CN108536695B/zh
Publication of CN108536695A publication Critical patent/CN108536695A/zh
Application granted granted Critical
Publication of CN108536695B publication Critical patent/CN108536695B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0639Item locations

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Navigation (AREA)

Abstract

本发明公开一种地理位置信息点的聚合方法以及装置,涉及地理位置信息点领域。其中,所述方法包括:获取订单数据中的多个地理位置信息点,地理位置信息点包括用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息;对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点,所述数据点包括所述地理位置名称、所述经纬度信息和初始聚合权重;采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点。通过本发明,经过聚合的地理位置信息点不仅可提供较高准确率的经纬度信息,而且还可提供满足个性化用户需求的地理位置名称。

Description

一种地理位置信息点的聚合方法以及装置
技术领域
本发明涉及地理位置信息点领域,具体地,涉及一种地理位置信息点的聚合方法以及装置。
背景技术
随着互联网的普及与发展,大量服务与应用已经深入渗透到日常生活,基于地理位置信息提供个性化服务已经成为互联网应用的一个重要趋势,基于地理位置信息提供个性化服务能够显著提高用户的服务满意度和粘着度。
在地理位置信息编码的过程中,一般需要政府或图商雇佣专人测绘采集的地理位置坐标数据,或直接向图商购买对方测绘的地理位置信息对应的坐标数据。
然而,现有技术中,自行测绘采集坐标数据或向图商购买坐标数据的成本往往较高,并且坐标数据对应的地点名称比较正式化,不能满足口语化(哩语化)的个性化用户需求。此外,坐标数据的准确度较低。
发明内容
针对现有技术的缺陷,本发明提供一种地理位置信息点的聚合方法,通过获取客户端的订单数据中的地理位置信息点,并对地理位置信息点进行格式化和处理,解决了现有技术中存在的如何为地理位置名称提供较高准确率的经纬度信息,及如何提供满足个性化用户需求的地理位置名称的技术问题。
依据本发明的第一方面,提出了一种地理位置信息点的聚合方法,所述方法包括:
获取订单数据中的多个地理位置信息点,地理位置信息点包括用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息;
对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点,所述数据点包括所述地理位置名称、所述经纬度信息和初始聚合权重;
采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点。
可选地,所述采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点,包括:
将所述地理位置名称具有相同关键字的数据点放置于第一数据点集合中;
对于所述第一数据点集合中任意一个数据点,遍历所述第一数据点集合中剩余的每一个数据点,并根据两个数据点的经纬度信息计算得到与两个数据点分别对应的地理位置信息点的球面距离;
在所述球面距离小于预设的聚合阈值的情况下,将遍历的数据点与当前数据点进行聚合,得到新的数据点;
对于所述新的数据点,继续遍历所述第一数据点集合中剩余的每一个数据点,并根据所述新的数据点和遍历的数据点的经纬度信息计算得到所述新的数据点对应的地理位置信息点与所述遍历的数据点对应的地理位置信息点的球面距离;
在所述新的数据点对应的地理位置信息点与所述第一数据点集合中剩余的每一个数据点对应的地理位置信息点的球面距离均大于或等于所述预设的聚合阈值的情况下,将所述新的数据点从所述第一数据点集合中移除,并放置于第二数据点集合中,从而得到聚合后的数据点。
可选地,所述将遍历的数据点与当前数据点进行聚合,得到新的数据点,包括:
根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息;以及
将当前数据点的聚合权重加一,得到新的数据点的聚合权重。
可选地,所述根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息,包括:
根据以下公式计算得到新的数据点的经纬度信息:
Figure BDA0001236713870000031
Figure BDA0001236713870000032
其中,lati表示当前待聚合数据点的纬度,lngi表示当前待聚合数据点的经度,lats表示当前数据点的纬度,lngs表示当前数据点的经度,w表示当前数据点的聚合权重,latr表示新的数据点的纬度,lngr表示新的数据点的经度。
可选地,所述方法还包括:
在判断所述第一数据点集合为空的情况下,根据所述第二数据点集合中的新的数据点得到与所述新的数据点分别对应的地理位置信息点。
依据本发明的第二方面,提出了一种地理位置信息点的聚合装置,所述装置包括:
获取单元,用于获取订单数据中的多个地理位置信息点,地理位置信息点包括用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息;
格式化单元,用于对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点,所述数据点包括所述地理位置名称、所述经纬度信息和初始聚合权重;
聚合单元,用于采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点。
可选地,所述聚合单元,具体用于:
将所述地理位置名称具有相同关键字的数据点放置于第一数据点集合中;
对于所述第一数据点集合中任意一个数据点,遍历所述第一数据点集合中剩余的每一个数据点,并根据两个数据点的经纬度信息计算得到与两个数据点分别对应的地理位置信息点的球面距离;
在所述球面距离小于预设的聚合阈值的情况下,将遍历的数据点与当前数据点进行聚合,得到新的数据点;
对于所述新的数据点,继续遍历所述第一数据点集合中剩余的每一个数据点,并根据所述新的数据点和遍历的数据点的经纬度信息计算得到所述新的数据点对应的地理位置信息点与所述遍历的数据点对应的地理位置信息点的球面距离;
在所述新的数据点对应的地理位置信息点与所述第一数据点集合中剩余的每一个数据点对应的地理位置信息点的球面距离均大于或等于所述预设的聚合阈值的情况下,将所述新的数据点从所述第一数据点集合中移除,并放置于第二数据点集合中,从而得到聚合后的数据点。
可选地,所述聚合单元,还用于:
根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息;以及
将当前数据点的聚合权重加一,得到新的数据点的聚合权重。
可选地,所述聚合单元,还用于:
根据以下公式计算得到新的数据点的经纬度信息:
Figure BDA0001236713870000041
Figure BDA0001236713870000042
其中,lati表示当前待聚合数据点的纬度,lngi表示当前待聚合数据点的经度,lats表示当前数据点的纬度,lngs表示当前数据点的经度,w表示当前数据点的聚合权重,latr表示新的数据点的纬度,lngr表示新的数据点的经度。
可选地,所述装置还包括:
判断单元,用于在判断所述第一数据点集合为空的情况下,根据所述第二数据点集合中的新的数据点得到与所述新的数据点分别对应的地理位置信息点。
通过上述技术方案,获取订单数据中的多个包含用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息的地理位置信息点;并对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点,所述数据点包括所述地理位置名称、所述经纬度信息和初始聚合权重;及采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点,不仅可为地理位置名称提供较高准确率的经纬度信息,而且还可提供满足个性化用户需求的地理位置名称。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些图获得其他的附图。
图1是本公开一实施例提供的地理位置信息点的聚合方法的流程图;
图2是本公开一实施例提供的地理位置信息点的聚合装置的结构示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
以下对本公开实施例中提及的部分词语进行举例说明。
本公开实施例中提及的用户设备(User Equipment,简称UE)是所使用的移动终端或个人计算机(Personal Computer,简称PC)等设备。例如智能手机、个人数码助理(PDA)、平板电脑、笔记本电脑、车载电脑(carputer)、掌上游戏机、智能眼镜、智能手表、可穿戴设备、虚拟显示设备或显示增强设备(如Google Glass、Oculus Rift、Hololens、Gear VR)等。
图1是本公开一实施例提供的地理位置信息点的聚合方法的流程图。如图1所示,本公开一实施例提供的地理位置信息点的聚合方法包括:
在步骤S101中,获取订单数据中的多个地理位置信息点。
其中,订单数据是从装载有打车客户端软件的用户设备中获取的,用户设备可为移动终端或PC端等,终端为所持的用于提供运营服务的移动终端或PA端等设备,所述地理位置信息点包括用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息。用户输入的地理位置名称包括订单数据中用户输入的出发地和订单数据中用户输入的目的地。
订单数据中可以产生与用户输入的地理位置名称对应的经纬度信息,由用户在打车行为发生时产生。用户输入地点名称,打车客户端通过gps定位获取经纬度,从而可以得到与用户输入的地理位置名称对应的经纬度信息。
接着,在步骤S102中,对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点。
其中,所述数据点包括用户输入的地理位置名称、与所述地理位置名称对应的经纬度信息和初始聚合权重。具体地,用户输入的地理位置名称包括用户输入的出发地的地点名称和用户输入的目的地的地点名称。对地理位置信息点进行格式化时,会产生聚合权重的初始值。在对数据点进行聚合之前,每个数据点的聚合权重均为初始值1。聚合权重代表了数据点的聚合程度,即用户选择或推荐的程度。具体地,聚合权重代表了聚合后的数据点是由多少个原始数据点聚合成的,没聚合时,即原始数据点,也就是1个点的聚合,2个点聚合其聚合权重就是2,n个点聚合权重就是n。
最后,在步骤S103中,采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点。
其中,该步骤具体包括:将所述地理位置名称具有相同关键字的数据点放置于第一数据点集合中;对于所述第一数据点集合中任意一个数据点,遍历所述第一数据点集合中剩余的每一个数据点,并根据两个数据点的经纬度信息计算得到与两个数据点分别对应的地理位置信息点的球面距离;在所述球面距离小于预设的聚合阈值的情况下,将遍历的数据点与当前数据点进行聚合,得到新的数据点;对于所述新的数据点,继续遍历所述第一数据点集合中剩余的每一个数据点,并根据所述新的数据点和遍历的数据点的经纬度信息计算得到所述新的数据点对应的地理位置信息点与所述遍历的数据点对应的地理位置信息点的球面距离;在所述新的数据点对应的地理位置信息点与所述第一数据点集合中剩余的每一个数据点对应的地理位置信息点的球面距离均大于或等于所述预设的聚合阈值的情况下,将所述新的数据点从所述第一数据点集合中移除,并放置于第二数据点集合中,从而得到聚合后的数据点。
具体地,将所述地理位置名称具有相同关键字的数据点放置于待聚合的数据点集合S,对于待聚合的数据点集合S中任意一个数据点,遍历其它数据点,并根据两个数据点的经纬度坐标计算得到与两个数据点分别对应的地理位置信息点的球面距离。在所述球面距离小于预设的聚合阈值的情况下,将遍历的数据点与当前数据点进行聚合,得到新的数据点。重复上述过程,直到新的数据点无法聚合更多的数据点。也就是说,待聚合的数据点集合S中的剩余的数据点对应的地理位置信息点与该新的数据点对应的地理位置信息点之间的球面距离均大于或等于预设的聚合阈值。在新的数据点无法聚合数据点的情况下,将该新的数据点从待聚合的数据点集合S中移除,并放置于聚合完毕的数据点集合R中,从而得到聚合后的地理位置信息点。其中,待聚合的数据点集合中的各数据点的地理位置名称具有相同的关键字,在将遍历的数据点与当前数据点进行聚合得到新的数据点时,将所述当前数据点的地理位置名称作为所述新的数据点的地理位置名称。此外,对待聚合的数据点集合中的数据点进行聚合之后,根据地理位置名称的相同关键字从聚合完毕的数据点集合中提取地理位置名称具有相同关键字的数据点,并比较各数据点的聚合权重,确定聚合权重最大的数据点作为最终选择的数据点,并根据聚合权重最大的数据点得到与该数据点对应的地理位置信息点。具体地,聚合权重最大的数据点的地理位置名称为与该数据点对应的地理位置信息点的地理位置名称,聚合权重最大的数据点的经纬度信息为与该数据点对应的地理位置信息点的经纬度信息。
在具体的应用中,所述将遍历的数据点与当前数据点进行聚合,得到新的数据点,包括:根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息;以及将当前数据点的聚合权重加一,得到新的数据点的聚合权重。
其中,所述根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息,包括:
根据以下公式计算得到新的数据点的经纬度信息:
Figure BDA0001236713870000091
Figure BDA0001236713870000092
其中,lati表示当前待聚合数据点的纬度,lngi表示当前待聚合数据点的经度,lats表示当前数据点的纬度,lngs表示当前数据点的经度,w表示当前数据点的聚合权重,latr表示新的数据点的纬度,lngr表示新的数据点的经度。需要说明的是,前待聚合数据点即为遍历的数据点。
在本实施例中,所述方法还包括:在判断所述第一数据点集合为空的情况下,根据所述第二数据点集合中的新的数据点得到与所述新的数据点分别对应的地理位置信息点。
随着新的数据点不断从待聚合的数据点集合S中移除,最终待聚合的数据点集合S为空集。在待聚合的数据点集合S为空集后,根据聚合完毕的数据点集合R中所有的新的数据点能够分别得到与之对应的地理位置信息点。由于订单数据是基于用户输入和共同选择的,所以根据聚合后的数据点得到的地理位置信息点不仅可提供较高准确率的经纬度信息,而且还可提供满足个性化用户需求的地点名称。
本实施例通过获取订单数据中的多个包含用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息的地理位置信息点;并对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点,所述数据点包括所述地理位置名称、所述经纬度信息和初始聚合权重;及采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点,不仅可为地理位置名称提供较高准确率的经纬度信息,而且还可提供满足个性化用户需求的地理位置名称。
对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开实施例并不受所描述的动作顺序的限制,因为依据本公开实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本公开实施例所必须的。
图2是本公开一实施例提供的地理位置信息点的聚合装置的结构示意图。如图2所示,本公开一实施例提供的地理位置信息点的聚合装置包括:
获取单元201,用于获取订单数据中的多个地理位置信息点,地理位置信息点包括用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息;
格式化单元202,用于对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点,所述数据点包括所述地理位置名称、所述经纬度信息和初始聚合权重;
聚合单元203,用于采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点。
在本公开一可选实施例中,所述聚合单元203,具体用于:
将所述地理位置名称具有相同关键字的数据点放置于第一数据点集合中;
对于所述第一数据点集合中任意一个数据点,遍历所述第一数据点集合中剩余的每一个数据点,并根据两个数据点的经纬度信息计算得到与两个数据点分别对应的地理位置信息点的球面距离;
在所述球面距离小于预设的聚合阈值的情况下,将遍历的数据点与当前数据点进行聚合,得到新的数据点;
对于所述新的数据点,继续遍历所述第一数据点集合中剩余的每一个数据点,并根据所述新的数据点和遍历的数据点的经纬度信息计算得到所述新的数据点对应的地理位置信息点与所述遍历的数据点对应的地理位置信息点的球面距离;
在所述新的数据点对应的地理位置信息点与所述第一数据点集合中剩余的每一个数据点对应的地理位置信息点的球面距离均大于或等于所述预设的聚合阈值的情况下,将所述新的数据点从所述第一数据点集合中移除,并放置于第二数据点集合中,从而得到聚合后的数据点。
在本公开一可选实施例中,所述聚合单元203,还用于:
根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息;以及
将当前数据点的聚合权重加一,得到新的数据点的聚合权重。
在本公开一可选实施例中,所述聚合单元203,还用于:
根据以下公式计算得到新的数据点的经纬度信息:
Figure BDA0001236713870000111
Figure BDA0001236713870000112
其中,lati表示当前待聚合数据点的纬度,lngi表示当前待聚合数据点的经度,lats表示当前数据点的纬度,lngs表示当前数据点的经度,w表示当前数据点的聚合权重,latr表示新的数据点的纬度,lngr表示新的数据点的经度。
在本公开一可选实施例中,所述装置还包括:
判断单元204,用于在判断所述第一数据点集合为空的情况下,根据所述第二数据点集合中的新的数据点得到与所述新的数据点分别对应的地理位置信息点。
需要说明的是,对于本公开提供的地理位置信息点的聚合装置还涉及的具体细节已在本公开提供的地理位置信息点的聚合方法中作了详细的说明,在此不在赘述。
应当注意的是,在本公开的系统的各个部件中,根据其要实现的功能而对其中的部件进行了逻辑划分,但是,本公开不受限于此,可以根据需要对各个部件进行重新划分或者组合,例如,可以将一些部件组合为单个部件,或者可以将一些部件进一步分解为更多的子部件。
本公开的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开实施例的系统中的一些或者全部部件的一些或者全部功能。本公开还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本公开的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本公开进行说明而不是对本公开进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
以上实施方式仅适于说明本公开,而并非对本公开的限制,有关技术领域的普通技术人员,在不脱离本公开的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本公开的范畴,本公开的专利保护范围应由权利要求限定。

Claims (8)

1.一种地理位置信息点的聚合方法,其特征在于,所述方法包括:
获取订单数据中的多个地理位置信息点,地理位置信息点包括用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息;
对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点,所述数据点包括所述地理位置名称、所述经纬度信息和初始聚合权重;
采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点;
所述采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点,包括:
将所述地理位置名称具有相同关键字的数据点放置于第一数据点集合中;
对于所述第一数据点集合中任意一个数据点,遍历所述第一数据点集合中剩余的每一个数据点,并根据两个数据点的经纬度信息计算得到与两个数据点分别对应的地理位置信息点的球面距离;
在所述球面距离小于预设的聚合阈值的情况下,将遍历的数据点与当前数据点进行聚合,得到新的数据点;
所述将遍历的数据点与当前数据点进行聚合,得到新的数据点,包括:
根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息;以及
将当前数据点的聚合权重加一,得到新的数据点的聚合权重。
2.根据权利要求1所述的地理位置信息点的聚合方法,其特征在于,所述采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点,还包括:
对于所述新的数据点,继续遍历所述第一数据点集合中剩余的每一个数据点,并根据所述新的数据点和遍历的数据点的经纬度信息计算得到所述新的数据点对应的地理位置信息点与所述遍历的数据点对应的地理位置信息点的球面距离;
在所述新的数据点对应的地理位置信息点与所述第一数据点集合中剩余的每一个数据点对应的地理位置信息点的球面距离均大于或等于所述预设的聚合阈值的情况下,将所述新的数据点从所述第一数据点集合中移除,并放置于第二数据点集合中,从而得到聚合后的数据点。
3.根据权利要求1所述的地理位置信息点的聚合方法,其特征在于,所述根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息,包括:
根据以下公式计算得到新的数据点的经纬度信息:
Figure FDA0002899269640000021
Figure FDA0002899269640000022
其中,lati表示当前待聚合数据点的纬度,lngi表示当前待聚合数据点的经度,lats表示当前数据点的纬度,lngs表示当前数据点的经度,w表示当前数据点的聚合权重,latr表示新的数据点的纬度,lngr表示新的数据点的经度。
4.根据权利要求2所述的地理位置信息点的聚合方法,其特征在于,所述方法还包括:
在判断所述第一数据点集合为空的情况下,根据所述第二数据点集合中的新的数据点得到与所述新的数据点分别对应的地理位置信息点。
5.一种地理位置信息点的聚合装置,其特征在于,所述装置包括:
获取单元,用于获取订单数据中的多个地理位置信息点,地理位置信息点包括用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息;
格式化单元,用于对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点,所述数据点包括所述地理位置名称、所述经纬度信息和初始聚合权重;
聚合单元,用于采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点;
所述聚合单元,具体用于:
将所述地理位置名称具有相同关键字的数据点放置于第一数据点集合中;
对于所述第一数据点集合中任意一个数据点,遍历所述第一数据点集合中剩余的每一个数据点,并根据两个数据点的经纬度信息计算得到与两个数据点分别对应的地理位置信息点的球面距离;
在所述球面距离小于预设的聚合阈值的情况下,将遍历的数据点与当前数据点进行聚合,得到新的数据点;
所述聚合单元,还用于:
根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息;以及
将当前数据点的聚合权重加一,得到新的数据点的聚合权重。
6.根据权利要求5所述的地理位置信息点的聚合装置,其特征在于,所述聚合单元,具体用于:
对于所述新的数据点,继续遍历所述第一数据点集合中剩余的每一个数据点,并根据所述新的数据点和遍历的数据点的经纬度信息计算得到所述新的数据点对应的地理位置信息点与所述遍历的数据点对应的地理位置信息点的球面距离;
在所述新的数据点对应的地理位置信息点与所述第一数据点集合中剩余的每一个数据点对应的地理位置信息点的球面距离均大于或等于所述预设的聚合阈值的情况下,将所述新的数据点从所述第一数据点集合中移除,并放置于第二数据点集合中,从而得到聚合后的数据点。
7.根据权利要求5所述的地理位置信息点的聚合装置,其特征在于,所述聚合单元,还用于:
根据以下公式计算得到新的数据点的经纬度信息:
Figure FDA0002899269640000041
Figure FDA0002899269640000042
其中,lati表示当前待聚合数据点的纬度,lngi表示当前待聚合数据点的经度,lats表示当前数据点的纬度,lngs表示当前数据点的经度,w表示当前数据点的聚合权重,latr表示新的数据点的纬度,lngr表示新的数据点的经度。
8.根据权利要求6所述的地理位置信息点的聚合装置,其特征在于,所述装置还包括:
判断单元,用于在判断所述第一数据点集合为空的情况下,根据所述第二数据点集合中的新的数据点得到与所述新的数据点分别对应的地理位置信息点。
CN201710119976.4A 2017-03-02 2017-03-02 一种地理位置信息点的聚合方法以及装置 Active CN108536695B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710119976.4A CN108536695B (zh) 2017-03-02 2017-03-02 一种地理位置信息点的聚合方法以及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710119976.4A CN108536695B (zh) 2017-03-02 2017-03-02 一种地理位置信息点的聚合方法以及装置

Publications (2)

Publication Number Publication Date
CN108536695A CN108536695A (zh) 2018-09-14
CN108536695B true CN108536695B (zh) 2021-06-04

Family

ID=63489123

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710119976.4A Active CN108536695B (zh) 2017-03-02 2017-03-02 一种地理位置信息点的聚合方法以及装置

Country Status (1)

Country Link
CN (1) CN108536695B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109299747B (zh) * 2018-10-24 2020-12-15 北京字节跳动网络技术有限公司 一种类簇中心的确定方法、装置、计算机设备及存储介质
CN111563639A (zh) * 2019-02-14 2020-08-21 北京嘀嘀无限科技发展有限公司 一种订单分配的方法和系统
CN109992638B (zh) * 2019-03-29 2020-11-20 北京三快在线科技有限公司 地理位置poi的生成方法、装置、电子设备和存储介质
CN110909103B (zh) * 2019-11-22 2022-05-24 口碑(上海)信息技术有限公司 基于电子地图的数据展示方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101576892A (zh) * 2008-05-07 2009-11-11 爱帮聚信(北京)科技有限公司 地点区域确定方法和装置
CN103514199A (zh) * 2012-06-25 2014-01-15 高德软件有限公司 Poi数据处理方法及其装置、poi检索方法及其装置
US8843494B1 (en) * 2012-03-28 2014-09-23 Emc Corporation Method and system for using keywords to merge document clusters
CN104346411A (zh) * 2013-08-09 2015-02-11 北大方正集团有限公司 对多个稿件进行聚类的方法和设备
CN105468632A (zh) * 2014-09-05 2016-04-06 高德软件有限公司 一种地理编码方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819604B (zh) * 2012-08-20 2015-06-10 徐亮 基于内容相关性的文件涉密内容检索、密级判定及标注方法
CN103207905B (zh) * 2013-03-28 2015-12-23 大连理工大学 一种基于目标文本的计算文本相似度的方法
CN104636354B (zh) * 2013-11-07 2018-02-06 华为技术有限公司 一种位置兴趣点聚类方法和相关装置
CN104765733B (zh) * 2014-01-02 2018-06-15 华为技术有限公司 一种社交网络事件分析的方法和装置
CN104572955B (zh) * 2014-12-29 2016-08-24 北京奇虎科技有限公司 一种基于聚类确定poi名称的系统及方法
CN105045858B (zh) * 2015-07-10 2018-04-13 湖南科技大学 基于投票的出租车载客点推荐方法
CN105844349A (zh) * 2016-03-21 2016-08-10 上海壹佰米网络科技有限公司 一种订单自动分配方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101576892A (zh) * 2008-05-07 2009-11-11 爱帮聚信(北京)科技有限公司 地点区域确定方法和装置
US8843494B1 (en) * 2012-03-28 2014-09-23 Emc Corporation Method and system for using keywords to merge document clusters
CN103514199A (zh) * 2012-06-25 2014-01-15 高德软件有限公司 Poi数据处理方法及其装置、poi检索方法及其装置
CN104346411A (zh) * 2013-08-09 2015-02-11 北大方正集团有限公司 对多个稿件进行聚类的方法和设备
CN105468632A (zh) * 2014-09-05 2016-04-06 高德软件有限公司 一种地理编码方法及装置

Also Published As

Publication number Publication date
CN108536695A (zh) 2018-09-14

Similar Documents

Publication Publication Date Title
CN107315824B (zh) 用于生成热力图的方法和装置
CN108536695B (zh) 一种地理位置信息点的聚合方法以及装置
CN107424022B (zh) 一种订单的推送方法及系统
CN110634047B (zh) 一种推荐房源的方法、装置、电子设备及存储介质
CN110096655B (zh) 搜索结果的排序方法、装置、设备及存储介质
CN110413742B (zh) 简历信息的查重方法、装置、设备及存储介质
CN111651685A (zh) 一种兴趣点获取方法、装置、电子设备及存储介质
CN110618982B (zh) 一种多源异构数据的处理方法、装置、介质及电子设备
CN105894028B (zh) 用户识别方法和装置
US9787557B2 (en) Determining semantic place names from location reports
CN110362750B (zh) 目标用户确定方法、装置、电子设备和计算机可读介质
CN110888866A (zh) 数据扩充方法、装置、数据处理设备及存储介质
JP2020501277A (ja) サービスオペレーションを実施するための画像ベースの方法および装置
CN110083677B (zh) 联系人的搜索方法、装置、设备及存储介质
CN110427574B (zh) 路线相似度确定方法、装置、设备和介质
WO2014036879A1 (en) Method, device, and terminal for sns system application prompt
CN107357797B (zh) 一种信息推送方法及装置
US9092409B2 (en) Smart scoring and filtering of user-annotated geocoded datasets
CN111177585A (zh) 地图poi反馈方法及装置
CN111737374B (zh) 位置坐标确定方法、装置、电子设备及存储介质
CN113515687B (zh) 物流信息的获取方法和装置
WO2016132507A1 (ja) プログラム及び統計処理システム
US10149649B2 (en) Method for identifying exercise path, method for searching for exercise path, and system thereof
CN110619087B (zh) 用于处理信息的方法和装置
JP2014035750A (ja) 名物を代表する地域の推定装置及び方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant