CN108536695A - 一种地理位置信息点的聚合方法以及装置 - Google Patents
一种地理位置信息点的聚合方法以及装置 Download PDFInfo
- Publication number
- CN108536695A CN108536695A CN201710119976.4A CN201710119976A CN108536695A CN 108536695 A CN108536695 A CN 108536695A CN 201710119976 A CN201710119976 A CN 201710119976A CN 108536695 A CN108536695 A CN 108536695A
- Authority
- CN
- China
- Prior art keywords
- point
- data point
- geographical location
- location information
- latitude
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0639—Item locations
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Navigation (AREA)
Abstract
本发明公开一种地理位置信息点的聚合方法以及装置,涉及地理位置信息点领域。其中,所述方法包括:获取订单数据中的多个地理位置信息点,地理位置信息点包括用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息;对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点,所述数据点包括所述地理位置名称、所述经纬度信息和初始聚合权重;采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点。通过本发明,经过聚合的地理位置信息点不仅可提供较高准确率的经纬度信息,而且还可提供满足个性化用户需求的地理位置名称。
Description
技术领域
本发明涉及地理位置信息点领域,具体地,涉及一种地理位置信息点的聚合方法以及装置。
背景技术
随着互联网的普及与发展,大量服务与应用已经深入渗透到日常生活,基于地理位置信息提供个性化服务已经成为互联网应用的一个重要趋势,基于地理位置信息提供个性化服务能够显著提高用户的服务满意度和粘着度。
在地理位置信息编码的过程中,一般需要政府或图商雇佣专人测绘采集的地理位置坐标数据,或直接向图商购买对方测绘的地理位置信息对应的坐标数据。
然而,现有技术中,自行测绘采集坐标数据或向图商购买坐标数据的成本往往较高,并且坐标数据对应的地点名称比较正式化,不能满足口语化(哩语化)的个性化用户需求。此外,坐标数据的准确度较低。
发明内容
针对现有技术的缺陷,本发明提供一种地理位置信息点的聚合方法,通过获取客户端的订单数据中的地理位置信息点,并对地理位置信息点进行格式化和处理,解决了现有技术中存在的如何为地理位置名称提供较高准确率的经纬度信息,及如何提供满足个性化用户需求的地理位置名称的技术问题。
依据本发明的第一方面,提出了一种地理位置信息点的聚合方法,所述方法包括:
获取订单数据中的多个地理位置信息点,地理位置信息点包括用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息;
对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点,所述数据点包括所述地理位置名称、所述经纬度信息和初始聚合权重;
采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点。
可选地,所述采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点,包括:
将所述地理位置名称具有相同关键字的数据点放置于第一数据点集合中;
对于所述第一数据点集合中任意一个数据点,遍历所述第一数据点集合中剩余的每一个数据点,并根据两个数据点的经纬度信息计算得到与两个数据点分别对应的地理位置信息点的球面距离;
在所述球面距离小于预设的聚合阈值的情况下,将遍历的数据点与当前数据点进行聚合,得到新的数据点;
对于所述新的数据点,继续遍历所述第一数据点集合中剩余的每一个数据点,并根据所述新的数据点和遍历的数据点的经纬度信息计算得到所述新的数据点对应的地理位置信息点与所述遍历的数据点对应的地理位置信息点的球面距离;
在所述新的数据点对应的地理位置信息点与所述第一数据点集合中剩余的每一个数据点对应的地理位置信息点的球面距离均大于或等于所述预设的聚合阈值的情况下,将所述新的数据点从所述第一数据点集合中移除,并放置于第二数据点集合中,从而得到聚合后的数据点。
可选地,所述将遍历的数据点与当前数据点进行聚合,得到新的数据点,包括:
根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息;以及
将当前数据点的聚合权重加一,得到新的数据点的聚合权重。
可选地,所述根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息,包括:
根据以下公式计算得到新的数据点的经纬度信息:
其中,lati表示当前待聚合数据点的纬度,lngi表示当前待聚合数据点的经度,lats表示当前数据点的纬度,lngs表示当前数据点的经度,w表示当前数据点的聚合权重,latr表示新的数据点的纬度,lngr表示新的数据点的经度。
可选地,所述方法还包括:
在判断所述第一数据点集合为空的情况下,根据所述第二数据点集合中的新的数据点得到与所述新的数据点分别对应的地理位置信息点。
依据本发明的第二方面,提出了一种地理位置信息点的聚合装置,所述装置包括:
获取单元,用于获取订单数据中的多个地理位置信息点,地理位置信息点包括用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息;
格式化单元,用于对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点,所述数据点包括所述地理位置名称、所述经纬度信息和初始聚合权重;
聚合单元,用于采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点。
可选地,所述聚合单元,具体用于:
将所述地理位置名称具有相同关键字的数据点放置于第一数据点集合中;
对于所述第一数据点集合中任意一个数据点,遍历所述第一数据点集合中剩余的每一个数据点,并根据两个数据点的经纬度信息计算得到与两个数据点分别对应的地理位置信息点的球面距离;
在所述球面距离小于预设的聚合阈值的情况下,将遍历的数据点与当前数据点进行聚合,得到新的数据点;
对于所述新的数据点,继续遍历所述第一数据点集合中剩余的每一个数据点,并根据所述新的数据点和遍历的数据点的经纬度信息计算得到所述新的数据点对应的地理位置信息点与所述遍历的数据点对应的地理位置信息点的球面距离;
在所述新的数据点对应的地理位置信息点与所述第一数据点集合中剩余的每一个数据点对应的地理位置信息点的球面距离均大于或等于所述预设的聚合阈值的情况下,将所述新的数据点从所述第一数据点集合中移除,并放置于第二数据点集合中,从而得到聚合后的数据点。
可选地,所述聚合单元,还用于:
根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息;以及
将当前数据点的聚合权重加一,得到新的数据点的聚合权重。
可选地,所述聚合单元,还用于:
根据以下公式计算得到新的数据点的经纬度信息:
其中,lati表示当前待聚合数据点的纬度,lngi表示当前待聚合数据点的经度,lats表示当前数据点的纬度,lngs表示当前数据点的经度,w表示当前数据点的聚合权重,latr表示新的数据点的纬度,lngr表示新的数据点的经度。
可选地,所述装置还包括:
判断单元,用于在判断所述第一数据点集合为空的情况下,根据所述第二数据点集合中的新的数据点得到与所述新的数据点分别对应的地理位置信息点。
通过上述技术方案,获取订单数据中的多个包含用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息的地理位置信息点;并对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点,所述数据点包括所述地理位置名称、所述经纬度信息和初始聚合权重;及采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点,不仅可为地理位置名称提供较高准确率的经纬度信息,而且还可提供满足个性化用户需求的地理位置名称。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些图获得其他的附图。
图1是本公开一实施例提供的地理位置信息点的聚合方法的流程图;
图2是本公开一实施例提供的地理位置信息点的聚合装置的结构示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
以下对本公开实施例中提及的部分词语进行举例说明。
本公开实施例中提及的用户设备(User Equipment,简称UE)是所使用的移动终端或个人计算机(Personal Computer,简称PC)等设备。例如智能手机、个人数码助理(PDA)、平板电脑、笔记本电脑、车载电脑(carputer)、掌上游戏机、智能眼镜、智能手表、可穿戴设备、虚拟显示设备或显示增强设备(如Google Glass、Oculus Rift、Hololens、Gear VR)等。
图1是本公开一实施例提供的地理位置信息点的聚合方法的流程图。如图1所示,本公开一实施例提供的地理位置信息点的聚合方法包括:
在步骤S101中,获取订单数据中的多个地理位置信息点。
其中,订单数据是从装载有打车客户端软件的用户设备中获取的,用户设备可为移动终端或PC端等,终端为所持的用于提供运营服务的移动终端或PA端等设备,所述地理位置信息点包括用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息。用户输入的地理位置名称包括订单数据中用户输入的出发地和订单数据中用户输入的目的地。
订单数据中可以产生与用户输入的地理位置名称对应的经纬度信息,由用户在打车行为发生时产生。用户输入地点名称,打车客户端通过gps定位获取经纬度,从而可以得到与用户输入的地理位置名称对应的经纬度信息。
接着,在步骤S102中,对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点。
其中,所述数据点包括用户输入的地理位置名称、与所述地理位置名称对应的经纬度信息和初始聚合权重。具体地,用户输入的地理位置名称包括用户输入的出发地的地点名称和用户输入的目的地的地点名称。对地理位置信息点进行格式化时,会产生聚合权重的初始值。在对数据点进行聚合之前,每个数据点的聚合权重均为初始值1。聚合权重代表了数据点的聚合程度,即用户选择或推荐的程度。具体地,聚合权重代表了聚合后的数据点是由多少个原始数据点聚合成的,没聚合时,即原始数据点,也就是1个点的聚合,2个点聚合其聚合权重就是2,n个点聚合权重就是n。
最后,在步骤S103中,采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点。
其中,该步骤具体包括:将所述地理位置名称具有相同关键字的数据点放置于第一数据点集合中;对于所述第一数据点集合中任意一个数据点,遍历所述第一数据点集合中剩余的每一个数据点,并根据两个数据点的经纬度信息计算得到与两个数据点分别对应的地理位置信息点的球面距离;在所述球面距离小于预设的聚合阈值的情况下,将遍历的数据点与当前数据点进行聚合,得到新的数据点;对于所述新的数据点,继续遍历所述第一数据点集合中剩余的每一个数据点,并根据所述新的数据点和遍历的数据点的经纬度信息计算得到所述新的数据点对应的地理位置信息点与所述遍历的数据点对应的地理位置信息点的球面距离;在所述新的数据点对应的地理位置信息点与所述第一数据点集合中剩余的每一个数据点对应的地理位置信息点的球面距离均大于或等于所述预设的聚合阈值的情况下,将所述新的数据点从所述第一数据点集合中移除,并放置于第二数据点集合中,从而得到聚合后的数据点。
具体地,将所述地理位置名称具有相同关键字的数据点放置于待聚合的数据点集合S,对于待聚合的数据点集合S中任意一个数据点,遍历其它数据点,并根据两个数据点的经纬度坐标计算得到与两个数据点分别对应的地理位置信息点的球面距离。在所述球面距离小于预设的聚合阈值的情况下,将遍历的数据点与当前数据点进行聚合,得到新的数据点。重复上述过程,直到新的数据点无法聚合更多的数据点。也就是说,待聚合的数据点集合S中的剩余的数据点对应的地理位置信息点与该新的数据点对应的地理位置信息点之间的球面距离均大于或等于预设的聚合阈值。在新的数据点无法聚合数据点的情况下,将该新的数据点从待聚合的数据点集合S中移除,并放置于聚合完毕的数据点集合R中,从而得到聚合后的地理位置信息点。其中,待聚合的数据点集合中的各数据点的地理位置名称具有相同的关键字,在将遍历的数据点与当前数据点进行聚合得到新的数据点时,将所述当前数据点的地理位置名称作为所述新的数据点的地理位置名称。此外,对待聚合的数据点集合中的数据点进行聚合之后,根据地理位置名称的相同关键字从聚合完毕的数据点集合中提取地理位置名称具有相同关键字的数据点,并比较各数据点的聚合权重,确定聚合权重最大的数据点作为最终选择的数据点,并根据聚合权重最大的数据点得到与该数据点对应的地理位置信息点。具体地,聚合权重最大的数据点的地理位置名称为与该数据点对应的地理位置信息点的地理位置名称,聚合权重最大的数据点的经纬度信息为与该数据点对应的地理位置信息点的经纬度信息。
在具体的应用中,所述将遍历的数据点与当前数据点进行聚合,得到新的数据点,包括:根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息;以及将当前数据点的聚合权重加一,得到新的数据点的聚合权重。
其中,所述根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息,包括:
根据以下公式计算得到新的数据点的经纬度信息:
其中,lati表示当前待聚合数据点的纬度,lngi表示当前待聚合数据点的经度,lats表示当前数据点的纬度,lngs表示当前数据点的经度,w表示当前数据点的聚合权重,latr表示新的数据点的纬度,lngr表示新的数据点的经度。需要说明的是,前待聚合数据点即为遍历的数据点。
在本实施例中,所述方法还包括:在判断所述第一数据点集合为空的情况下,根据所述第二数据点集合中的新的数据点得到与所述新的数据点分别对应的地理位置信息点。
随着新的数据点不断从待聚合的数据点集合S中移除,最终待聚合的数据点集合S为空集。在待聚合的数据点集合S为空集后,根据聚合完毕的数据点集合R中所有的新的数据点能够分别得到与之对应的地理位置信息点。由于订单数据是基于用户输入和共同选择的,所以根据聚合后的数据点得到的地理位置信息点不仅可提供较高准确率的经纬度信息,而且还可提供满足个性化用户需求的地点名称。
本实施例通过获取订单数据中的多个包含用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息的地理位置信息点;并对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点,所述数据点包括所述地理位置名称、所述经纬度信息和初始聚合权重;及采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点,不仅可为地理位置名称提供较高准确率的经纬度信息,而且还可提供满足个性化用户需求的地理位置名称。
对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开实施例并不受所描述的动作顺序的限制,因为依据本公开实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本公开实施例所必须的。
图2是本公开一实施例提供的地理位置信息点的聚合装置的结构示意图。如图2所示,本公开一实施例提供的地理位置信息点的聚合装置包括:
获取单元201,用于获取订单数据中的多个地理位置信息点,地理位置信息点包括用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息;
格式化单元202,用于对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点,所述数据点包括所述地理位置名称、所述经纬度信息和初始聚合权重;
聚合单元203,用于采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点。
在本公开一可选实施例中,所述聚合单元203,具体用于:
将所述地理位置名称具有相同关键字的数据点放置于第一数据点集合中;
对于所述第一数据点集合中任意一个数据点,遍历所述第一数据点集合中剩余的每一个数据点,并根据两个数据点的经纬度信息计算得到与两个数据点分别对应的地理位置信息点的球面距离;
在所述球面距离小于预设的聚合阈值的情况下,将遍历的数据点与当前数据点进行聚合,得到新的数据点;
对于所述新的数据点,继续遍历所述第一数据点集合中剩余的每一个数据点,并根据所述新的数据点和遍历的数据点的经纬度信息计算得到所述新的数据点对应的地理位置信息点与所述遍历的数据点对应的地理位置信息点的球面距离;
在所述新的数据点对应的地理位置信息点与所述第一数据点集合中剩余的每一个数据点对应的地理位置信息点的球面距离均大于或等于所述预设的聚合阈值的情况下,将所述新的数据点从所述第一数据点集合中移除,并放置于第二数据点集合中,从而得到聚合后的数据点。
在本公开一可选实施例中,所述聚合单元203,还用于:
根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息;以及
将当前数据点的聚合权重加一,得到新的数据点的聚合权重。
在本公开一可选实施例中,所述聚合单元203,还用于:
根据以下公式计算得到新的数据点的经纬度信息:
其中,lati表示当前待聚合数据点的纬度,lngi表示当前待聚合数据点的经度,lats表示当前数据点的纬度,lngs表示当前数据点的经度,w表示当前数据点的聚合权重,latr表示新的数据点的纬度,lngr表示新的数据点的经度。
在本公开一可选实施例中,所述装置还包括:
判断单元204,用于在判断所述第一数据点集合为空的情况下,根据所述第二数据点集合中的新的数据点得到与所述新的数据点分别对应的地理位置信息点。
需要说明的是,对于本公开提供的地理位置信息点的聚合装置还涉及的具体细节已在本公开提供的地理位置信息点的聚合方法中作了详细的说明,在此不在赘述。
应当注意的是,在本公开的系统的各个部件中,根据其要实现的功能而对其中的部件进行了逻辑划分,但是,本公开不受限于此,可以根据需要对各个部件进行重新划分或者组合,例如,可以将一些部件组合为单个部件,或者可以将一些部件进一步分解为更多的子部件。
本公开的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开实施例的系统中的一些或者全部部件的一些或者全部功能。本公开还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本公开的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本公开进行说明而不是对本公开进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
以上实施方式仅适于说明本公开,而并非对本公开的限制,有关技术领域的普通技术人员,在不脱离本公开的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本公开的范畴,本公开的专利保护范围应由权利要求限定。
Claims (10)
1.一种地理位置信息点的聚合方法,其特征在于,所述方法包括:
获取订单数据中的多个地理位置信息点,地理位置信息点包括用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息;
对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点,所述数据点包括所述地理位置名称、所述经纬度信息和初始聚合权重;
采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点。
2.根据权利要求1所述的地理位置信息点的聚合方法,其特征在于,所述采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点,包括:
将所述地理位置名称具有相同关键字的数据点放置于第一数据点集合中;
对于所述第一数据点集合中任意一个数据点,遍历所述第一数据点集合中剩余的每一个数据点,并根据两个数据点的经纬度信息计算得到与两个数据点分别对应的地理位置信息点的球面距离;
在所述球面距离小于预设的聚合阈值的情况下,将遍历的数据点与当前数据点进行聚合,得到新的数据点;
对于所述新的数据点,继续遍历所述第一数据点集合中剩余的每一个数据点,并根据所述新的数据点和遍历的数据点的经纬度信息计算得到所述新的数据点对应的地理位置信息点与所述遍历的数据点对应的地理位置信息点的球面距离;
在所述新的数据点对应的地理位置信息点与所述第一数据点集合中剩余的每一个数据点对应的地理位置信息点的球面距离均大于或等于所述预设的聚合阈值的情况下,将所述新的数据点从所述第一数据点集合中移除,并放置于第二数据点集合中,从而得到聚合后的数据点。
3.根据权利要求2所述的地理位置信息点的聚合方法,其特征在于,所述将遍历的数据点与当前数据点进行聚合,得到新的数据点,包括:
根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息;以及
将当前数据点的聚合权重加一,得到新的数据点的聚合权重。
4.根据权利要求3所述的地理位置信息点的聚合方法,其特征在于,所述根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息,包括:
根据以下公式计算得到新的数据点的经纬度信息:
其中,lati表示当前待聚合数据点的纬度,lngi表示当前待聚合数据点的经度,lats表示当前数据点的纬度,lngs表示当前数据点的经度,w表示当前数据点的聚合权重,latr表示新的数据点的纬度,lngr表示新的数据点的经度。
5.根据权利要求2所述的地理位置信息点的聚合方法,其特征在于,所述方法还包括:
在判断所述第一数据点集合为空的情况下,根据所述第二数据点集合中的新的数据点得到与所述新的数据点分别对应的地理位置信息点。
6.一种地理位置信息点的聚合装置,其特征在于,所述装置包括:
获取单元,用于获取订单数据中的多个地理位置信息点,地理位置信息点包括用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息;
格式化单元,用于对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点,所述数据点包括所述地理位置名称、所述经纬度信息和初始聚合权重;
聚合单元,用于采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点。
7.根据权利要求6所述的地理位置信息点的聚合装置,其特征在于,所述聚合单元,具体用于:
将所述地理位置名称具有相同关键字的数据点放置于第一数据点集合中;
对于所述第一数据点集合中任意一个数据点,遍历所述第一数据点集合中剩余的每一个数据点,并根据两个数据点的经纬度信息计算得到与两个数据点分别对应的地理位置信息点的球面距离;
在所述球面距离小于预设的聚合阈值的情况下,将遍历的数据点与当前数据点进行聚合,得到新的数据点;
对于所述新的数据点,继续遍历所述第一数据点集合中剩余的每一个数据点,并根据所述新的数据点和遍历的数据点的经纬度信息计算得到所述新的数据点对应的地理位置信息点与所述遍历的数据点对应的地理位置信息点的球面距离;
在所述新的数据点对应的地理位置信息点与所述第一数据点集合中剩余的每一个数据点对应的地理位置信息点的球面距离均大于或等于所述预设的聚合阈值的情况下,将所述新的数据点从所述第一数据点集合中移除,并放置于第二数据点集合中,从而得到聚合后的数据点。
8.根据权利要求7所述的地理位置信息点的聚合装置,其特征在于,所述聚合单元,还用于:
根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息;以及
将当前数据点的聚合权重加一,得到新的数据点的聚合权重。
9.根据权利要求8所述的地理位置信息点的聚合装置,其特征在于,所述聚合单元,还用于:
根据以下公式计算得到新的数据点的经纬度信息:
其中,lati表示当前待聚合数据点的纬度,lngi表示当前待聚合数据点的经度,lats表示当前数据点的纬度,lngs表示当前数据点的经度,w表示当前数据点的聚合权重,latr表示新的数据点的纬度,lngr表示新的数据点的经度。
10.根据权利要求7所述的地理位置信息点的聚合装置,其特征在于,所述装置还包括:
判断单元,用于在判断所述第一数据点集合为空的情况下,根据所述第二数据点集合中的新的数据点得到与所述新的数据点分别对应的地理位置信息点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710119976.4A CN108536695B (zh) | 2017-03-02 | 2017-03-02 | 一种地理位置信息点的聚合方法以及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710119976.4A CN108536695B (zh) | 2017-03-02 | 2017-03-02 | 一种地理位置信息点的聚合方法以及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108536695A true CN108536695A (zh) | 2018-09-14 |
CN108536695B CN108536695B (zh) | 2021-06-04 |
Family
ID=63489123
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710119976.4A Active CN108536695B (zh) | 2017-03-02 | 2017-03-02 | 一种地理位置信息点的聚合方法以及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108536695B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109299747A (zh) * | 2018-10-24 | 2019-02-01 | 北京字节跳动网络技术有限公司 | 一种类簇中心的确定方法、装置、计算机设备及存储介质 |
CN109992638A (zh) * | 2019-03-29 | 2019-07-09 | 北京三快在线科技有限公司 | 地理位置poi的生成方法、装置、电子设备和存储介质 |
CN110909103A (zh) * | 2019-11-22 | 2020-03-24 | 口碑(上海)信息技术有限公司 | 基于电子地图的数据展示方法及装置 |
CN111563639A (zh) * | 2019-02-14 | 2020-08-21 | 北京嘀嘀无限科技发展有限公司 | 一种订单分配的方法和系统 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101576892A (zh) * | 2008-05-07 | 2009-11-11 | 爱帮聚信(北京)科技有限公司 | 地点区域确定方法和装置 |
CN102819604A (zh) * | 2012-08-20 | 2012-12-12 | 徐亮 | 基于内容相关性的文件涉密内容检索、密级判定及标注方法 |
CN103207905A (zh) * | 2013-03-28 | 2013-07-17 | 大连理工大学 | 一种基于目标文本的计算文本相似度的方法 |
CN103514199A (zh) * | 2012-06-25 | 2014-01-15 | 高德软件有限公司 | Poi数据处理方法及其装置、poi检索方法及其装置 |
US8843494B1 (en) * | 2012-03-28 | 2014-09-23 | Emc Corporation | Method and system for using keywords to merge document clusters |
CN104346411A (zh) * | 2013-08-09 | 2015-02-11 | 北大方正集团有限公司 | 对多个稿件进行聚类的方法和设备 |
CN104572955A (zh) * | 2014-12-29 | 2015-04-29 | 北京奇虎科技有限公司 | 一种基于聚类确定poi名称的系统及方法 |
CN104636354A (zh) * | 2013-11-07 | 2015-05-20 | 华为技术有限公司 | 一种位置兴趣点聚类方法和相关装置 |
CN104765733A (zh) * | 2014-01-02 | 2015-07-08 | 华为技术有限公司 | 一种社交网络事件分析的方法和装置 |
CN105045858A (zh) * | 2015-07-10 | 2015-11-11 | 湖南科技大学 | 基于投票的出租车载客点推荐方法 |
CN105468632A (zh) * | 2014-09-05 | 2016-04-06 | 高德软件有限公司 | 一种地理编码方法及装置 |
CN105844349A (zh) * | 2016-03-21 | 2016-08-10 | 上海壹佰米网络科技有限公司 | 一种订单自动分配方法及系统 |
-
2017
- 2017-03-02 CN CN201710119976.4A patent/CN108536695B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101576892A (zh) * | 2008-05-07 | 2009-11-11 | 爱帮聚信(北京)科技有限公司 | 地点区域确定方法和装置 |
US8843494B1 (en) * | 2012-03-28 | 2014-09-23 | Emc Corporation | Method and system for using keywords to merge document clusters |
CN103514199A (zh) * | 2012-06-25 | 2014-01-15 | 高德软件有限公司 | Poi数据处理方法及其装置、poi检索方法及其装置 |
CN102819604A (zh) * | 2012-08-20 | 2012-12-12 | 徐亮 | 基于内容相关性的文件涉密内容检索、密级判定及标注方法 |
CN103207905A (zh) * | 2013-03-28 | 2013-07-17 | 大连理工大学 | 一种基于目标文本的计算文本相似度的方法 |
CN104346411A (zh) * | 2013-08-09 | 2015-02-11 | 北大方正集团有限公司 | 对多个稿件进行聚类的方法和设备 |
CN104636354A (zh) * | 2013-11-07 | 2015-05-20 | 华为技术有限公司 | 一种位置兴趣点聚类方法和相关装置 |
CN104765733A (zh) * | 2014-01-02 | 2015-07-08 | 华为技术有限公司 | 一种社交网络事件分析的方法和装置 |
CN105468632A (zh) * | 2014-09-05 | 2016-04-06 | 高德软件有限公司 | 一种地理编码方法及装置 |
CN104572955A (zh) * | 2014-12-29 | 2015-04-29 | 北京奇虎科技有限公司 | 一种基于聚类确定poi名称的系统及方法 |
CN105045858A (zh) * | 2015-07-10 | 2015-11-11 | 湖南科技大学 | 基于投票的出租车载客点推荐方法 |
CN105844349A (zh) * | 2016-03-21 | 2016-08-10 | 上海壹佰米网络科技有限公司 | 一种订单自动分配方法及系统 |
Non-Patent Citations (1)
Title |
---|
包全福: ""基于混合式球面退化格网的空间对象聚合研究"", 《中国优秀硕士学位论文全文数据库 基础科学辑》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109299747A (zh) * | 2018-10-24 | 2019-02-01 | 北京字节跳动网络技术有限公司 | 一种类簇中心的确定方法、装置、计算机设备及存储介质 |
CN109299747B (zh) * | 2018-10-24 | 2020-12-15 | 北京字节跳动网络技术有限公司 | 一种类簇中心的确定方法、装置、计算机设备及存储介质 |
CN111563639A (zh) * | 2019-02-14 | 2020-08-21 | 北京嘀嘀无限科技发展有限公司 | 一种订单分配的方法和系统 |
CN109992638A (zh) * | 2019-03-29 | 2019-07-09 | 北京三快在线科技有限公司 | 地理位置poi的生成方法、装置、电子设备和存储介质 |
CN109992638B (zh) * | 2019-03-29 | 2020-11-20 | 北京三快在线科技有限公司 | 地理位置poi的生成方法、装置、电子设备和存储介质 |
CN110909103A (zh) * | 2019-11-22 | 2020-03-24 | 口碑(上海)信息技术有限公司 | 基于电子地图的数据展示方法及装置 |
CN110909103B (zh) * | 2019-11-22 | 2022-05-24 | 口碑(上海)信息技术有限公司 | 基于电子地图的数据展示方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108536695B (zh) | 2021-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109377329B (zh) | 一种房源推荐方法、装置、存储介质及电子设备 | |
CN110726418B (zh) | 兴趣点区域确定方法、装置、设备及存储介质 | |
CN104899252B (zh) | 一种信息推送的方法及装置 | |
CN109478184B (zh) | 识别、处理和显示数据点聚类 | |
USRE44876E1 (en) | Proximity search methods using tiles to represent geographical zones | |
US10921136B2 (en) | Efficient processing for vector tile generation | |
CN108536695A (zh) | 一种地理位置信息点的聚合方法以及装置 | |
CN109859054A (zh) | 网络社团挖掘方法、装置、计算机设备及存储介质 | |
CN111858820A (zh) | 用地性质识别方法、装置、电子设备及存储介质 | |
CN103984556B (zh) | 一种地图区域构造设备、方法和监控终端 | |
CN110617831B (zh) | 生成导航路线的方法、装置及设备 | |
CN106767772B (zh) | 地磁指纹分布图的构建方法和装置及定位方法和装置 | |
CN107092623B (zh) | 一种兴趣点查询方法及装置 | |
CN108011987A (zh) | Ip地址定位方法及装置,电子设备及存储介质 | |
CN110399445B (zh) | 一种兴趣点的处理方法、装置及设备 | |
CN107085600A (zh) | Poi推荐方法、装置、设备及计算机可读存储介质 | |
CN111128398A (zh) | 一种基于人口迁徙大数据的流行病感染人数估算方法 | |
CN110781415A (zh) | 一种兴趣点推荐方法、装置、设备及介质 | |
CN103198072A (zh) | 一种流行检索词的挖掘、推荐方法及装置 | |
US10444062B2 (en) | Measuring and diagnosing noise in an urban environment | |
CN103198135A (zh) | 一种地理区域格网划分的微博签到数据在线获取方法 | |
CN112380299A (zh) | 关系网络构建方法、装置及存储介质 | |
CN110427574B (zh) | 路线相似度确定方法、装置、设备和介质 | |
CN111694914B (zh) | 用户常驻区域确定方法及装置 | |
CN107169005A (zh) | Poi推荐方法、装置、设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |