CN112328880A - 地理区域聚类方法、装置、存储介质和电子设备 - Google Patents

地理区域聚类方法、装置、存储介质和电子设备 Download PDF

Info

Publication number
CN112328880A
CN112328880A CN202011224525.5A CN202011224525A CN112328880A CN 112328880 A CN112328880 A CN 112328880A CN 202011224525 A CN202011224525 A CN 202011224525A CN 112328880 A CN112328880 A CN 112328880A
Authority
CN
China
Prior art keywords
clustered
region
determining
clustering
regions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011224525.5A
Other languages
English (en)
Inventor
薛淼
孟格思
李敏
王瑜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN202011224525.5A priority Critical patent/CN112328880A/zh
Publication of CN112328880A publication Critical patent/CN112328880A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种地理区域聚类方法、装置、存储介质和电子设备,通过确定多个待聚类区域对应的位置信息和属性信息,以根据各待聚类区域对应的位置信息和属性信息确定多个包括两个待聚类区域的关联区域组合以及非关联区域组合。将关联区域组合和非关联区域组合作为约束条件,对各所述待聚类区域进行聚类,以确定包括多个区域集合目标聚类结果。本发明实施例在对地理区域进行聚类的过程中引入了关联区域组合和非关联区域组合,并将关联区域组合和非关联区域组合作为约束条件进行聚类,同时保证局部和全局的最优以提高聚类效果。

Description

地理区域聚类方法、装置、存储介质和电子设备
技术领域
本发明涉及数据处理领域,尤其涉及一种地理区域聚类方法、装置、存储介质和电子设备。
背景技术
随着聚类算法的蓬勃发展,在数据挖掘、统计学、机器学习的多个领域做出贡献。在共享车辆、外卖配送、快递配送等多个领域中,需要对地理区域进行聚类以划分得到多个运营区域,以便于调度、任务分发等处理。现有用于对地理区域聚类的聚类算法存在难以保证全局最优的不足。
发明内容
有鉴于此,本发明实施例提供了一种地理区域聚类方法、装置、存储介质和电子设备,旨在同时保证局部和全局的最优以提高聚类效果。
第一方面,本发明实施例提供了一种地理区域聚类方法,所述方法包括:
确定多个待聚类区域对应的位置信息和属性信息;
根据各所述待聚类区域对应的位置信息和属性信息确定多个关联区域组合和多个非关联区域组合,所述关联区域组合中包括两个聚类后必在同一类簇中的待聚类区域,所述非关联区域组合中包括两个在聚类后必不在同一类簇中的待聚类区域;
以各所述关联区域组合和非关联区域组合作为约束条件,对各所述待聚类区域进行聚类,以确定目标聚类结果,所述目标聚类结果包括多个类簇,各所述类簇中包括多个区域。
第二方面,本发明实施例提供了一种地理区域聚类装置,所述装置包括:
信息确定模块,用于确定多个待聚类区域对应的位置信息和属性信息;
区域组合确定模块,用于根据各所述待聚类区域对应的位置信息和属性信息确定多个关联区域组合和多个非关联区域组合,所述关联区域组合中包括两个聚类后必在同一类簇中的待聚类区域,所述非关联区域组合中包括两个在聚类后必不在同一类簇中的待聚类区域;
聚类模块,用于以各所述关联区域组合和非关联区域组合作为约束条件,对各所述待聚类区域进行聚类,以确定目标聚类结果,所述目标聚类结果包括多个类簇,各所述类簇中包括多个区域。
第三方面,本发明实施例提供了一种计算机可读存储介质,用于存储计算机程序指令,所述计算机程序指令在被处理器执行时实现如第一方面所述的方法。
第四方面,本发明实施例提供了一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如第一方面所述的方法。
本发明实施例通过确定多个待聚类区域对应的位置信息和属性信息,以根据各待聚类区域对应的位置信息和属性信息确定多个包括两个待聚类区域的关联区域组合以及非关联区域组合。将关联区域组合和非关联区域组合作为约束条件,对各所述待聚类区域进行聚类,以确定包括多个区域集合目标聚类结果。本发明实施例在对地理区域进行聚类的过程中引入了关联区域组合和非关联区域组合,并将关联区域组合和非关联区域组合作为约束条件进行聚类,同时保证局部和全局的最优以提高聚类效果。
附图说明
通过以下参照附图对本发明实施例的描述,本发明的上述以及其它目的、特征和优点将更为清楚,在附图中:
图1为本发明实施例的地理区域聚类方法的流程图;
图2为本发明实施例一种可选实现方式确定的位置信息的示意图;
图3为本发明实施例另一种可选实现方式确定的位置信息的示意图;
图4为本发明实施例一种可选实现方式确定属性信息的示意图;
图5为本发明实施例另一种可选实现方式确定属性信息的示意图;
图6为本发明实施例确定关联区域组合和非关联区域组合过程的流程图;
图7为本发明实施例以迭代方式确定目标聚类结果的流程图;
图8为本发明实施例的地理区域聚类装置的示意图;
图9为本发明实施例的电子设备的示意图。
具体实施方式
以下基于实施例对本发明进行描述,但是本发明并不仅仅限于这些实施例。在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。为了避免混淆本发明的实质,公知的方法、过程、流程、元件和电路并没有详细叙述。
此外,本领域普通技术人员应当理解,在此提供的附图都是为了说明的目的,并且附图不一定是按比例绘制的。
除非上下文明确要求,否则在说明书的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。
在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
本发明实施例所述的地理区域聚类方法可以应用于终端设备或服务器等任意可以部署应用本发明实施例的地理区域聚类方法的聚类框架的设备。其中,所述终端设备可以是能够运行计算机程序的、具有加速度传感器的通用数据处理终端,例如,智能手机或平板电脑等。所述服务器可以为单个服务器、也可以是以分布式方式配置的服务器集群。以所述地理区域聚类方法通过部署对应聚类框架的服务器实现为例进行说明。服务器通过接收终端设备发送的多个地理区域或直接获取数据库中存储的多个地理区域等方式确定多个待聚类区域,由服务器端部署的聚类框架运行本发明实施例的地理区域聚类方法进行聚类,得到包括多个类簇的目标聚类结果,其中各类簇中包括多个地理区域。
进一步地,本发明实施例的地理区域聚类方法可以应用于共享车辆场景、外卖配送场景、同城快递等任意需要对多个较小的地理区域聚类的应用场景。以所述地理区域聚类方法应用于共享车辆场景为例进行说明。所述地理区域可以为共享车辆平台预先确定的多个停车点,通过所述地理区域聚类方法将多个停车点进行聚类,得到多个包括至少一个停车点的车辆调度区域,以便于车辆调度和管理。
图1为本发明实施例的地理区域聚类方法的流程图。如图1所示,本发明实施例的地理区域聚类方法包括以下步骤:
步骤S100、确定多个待聚类区域对应的位置信息和属性信息。
具体地,确定多个地理区域作为待聚类区域。当本发明实施例的地理区域聚类方法通过服务器实现时,可以通过与服务器连接的终端设备传输多个地理区域至服务器作为待聚类区域。或者,服务器还可以直接从本地数据库或连接的数据库中获取多个预先存储的地理区域作为待聚类区域。例如,当本发明实施例应用于共享车辆领域时,各所述待聚类区域可以为共享车辆平台服务器预先设定并存储在本地数据库或外置数据库中的共享车辆停车区域。
其中,各所述待聚类区域具有对应的位置信息和属性信息。所述位置信息可以根据对应待聚类区域中任意点确定,用于表征待聚类区域的位置。进一步地,所述位置信息可以通过经纬度信息构成的二维向量表示,或通过待聚类区域在地球坐标系中位置对应的三维向量表示。所述属性信息中可以包括对应待聚类区域的至少一种属性,各属性可以根据所述地理区域聚类方法的应用场景选择。以本发明实施例应用于共享车辆领域为例进行说明。所述待聚类区域为共享车辆停车区,所述属性信息中可以包括停车区类型、停车高峰时间、用车高峰时间、各时段停车量和各时段用车量等属性。所述停车区类型可以通过对应的待聚类区域周边的设施类型确定,所述停车高峰时间、用车高峰时间、各时段停车量和各时段用车量可以根据对应的待聚类区域历史运营情况确定。
在本发明实施例中,各待聚类区域对应位置信息和属性信息的确定过程可以包括以下步骤:
步骤S110、获取各所述待聚类区域对应的经纬度数据作为位置信息。
具体地,所述待聚类区域可以为形状规则的区域或不规则区域,在本发明实施例中,可以预先设定各所述待聚类区域中任意点为特征点,将所述特征点的经纬度数据作为待聚类区域的经纬度数据。也就是说,直接确定待聚类区域中特征点的经纬度信息为位置信息。例如,当所述待聚类区域为不规则区域时,可以确定所述不规则区域边缘的任意点或区域内包括的一个建筑物所在位置点等为对应的特征点。
图2为本发明实施例一种可选实现方式确定的位置信息的示意图。如图2所示,所述待聚类区域20可以为矩形区域。当预先设定待聚类区域20左上角顶点21为特征点时,获取待聚类区域20左上角顶点21的经纬度信息,将所述经纬度信息作为待聚类区域20的位置信息存储。进一步地,所述特征点还可以是待聚类区域20的中心点、或包括的标志性建筑所在位置点等其他待聚类区域30内、或待聚类区域30边缘上的点。
图3为本发明实施例另一种可选实现方式确定的位置信息的示意图。如图3所示,所述待聚类区域30可以为圆形区域。当预先设定待聚类区域30的中心点31为特征点时,获取待聚类区域30中心点31的经纬度信息,将所述经纬度信息作为待聚类区域30的位置信息存储。进一步地,所述特征点还可以是待聚类区域30中包括的标志性建筑所在位置点等其他待聚类区域30内、或待聚类区域30边缘上的点。
步骤S120、根据各所述待聚类区域周围预设区域内的设施确定对应的属性信息。
具体地,各所述待聚类区域对应的属性信息至少包括待聚类区域的类型,所述待聚类区域的类型可以根据周围预设区域内的设施和预先设定的确定规则确定。在本发明实施例中,所述确定规则可以为确定与待聚类区域所在位置距离最近的设施类型为所述待聚类区域类型,或者先确定待聚类区域距离为预设阈值的范围内各设施的类型,确定数量最多的设施类型为所述待聚类区域类型。其中,所述设施可以为包括一个独立建筑物或多个建筑物的建筑设施或湖畔、森林等包括自然资源的设施,类型可以为小区、商场、大厦、游乐园等。
以本发明实施例应用于共享车辆领域为例进行说明。所述待聚类区域为共享车辆的停车区,可以根据停车区距离最近的设施或者停车区所在位置预设范围内各设施的类型确定停车区类型。例如,当所述停车区距离最近的设施为大厦时,确定停车区的类型为大厦停车区。或者,当所述停车区预定范围内包括1个大厦、2个小区时,确定停车区的类型为小区停车区。
图4为本发明实施例一种可选实现方式确定属性信息的示意图。如图4所示,待聚类区域1、2、3、4、5、6和7周围的设施包括A大厦、B商场、C小区和D公园。以所述属性信息中仅包括对应待聚类区域的类型,且各待聚类区域对应的类型通过距离最近的设施类型确定为例进行说明。待聚类区域1和待聚类区域2距离最近的设施为A大厦,即将A大厦的类型“大厦”作为待聚类区域1和2的属性信息;待聚类区域3和待聚类区域4距离最近的设施为B商场,即将B商场的类型“商场”作为待聚类区域3和4的属性信息;待聚类区域5距离最近的设施为C小区,即将C小区的类型“小区”作为待聚类区域5的属性信息;待聚类区域6和待聚类区域7距离最近的设施为D公园,即将D公园的类型“公园”作为待聚类区域6和7的属性信息。
图5为本发明实施例另一种可选实现方式确定属性信息的示意图。如图5所示,待聚类区域50周围的设施包括A小区、B商场、C小区和D公园。以所述属性信息中仅包括对应待聚类区域50的类型,且各待聚类区域50对应的类型通过预设范围内各设施的设施类型确定为例进行说明。确定待聚类区域50对应的预设区域51,例如以待聚类区域50所在位置为圆心,确定预设距离为半径得到圆形的预设区域51。所述预设区域51内包括A小区、B小区和D公园三个设施,其中两个设施的类型为小区,一个设施的类型为公园。因此,可以确定对应预设区域51内最多的设施类型为待聚类区域50的属性信息,即所述待聚类区域50的属性信息为“小区”。
进一步地,各待聚类区域的属性信息中还可以包括除了待聚类区域的类型之外的其他信息。
步骤S200、根据各所述待聚类区域对应的位置信息和属性信息确定多个关联区域组合和多个非关联区域组合。
具体地,在确定各待聚类区域的位置信息和属性信息后,基于各待聚类区域的位置信息和属性信息判断聚类后各待聚类区域之间的关系,以确定多个用于表征必在同一类簇中待聚类区域的关联区域组合以及多个用于表征必不在同一类簇中待聚类区域的非关联区域组合。也就是说,每个关联区域组合中包括两个聚类后必在同一类簇中的待聚类区域,每个非关联区域组合中包括两个在聚类后必不在同一类簇中的待聚类区域。
图6为本发明实施例确定关联区域组合和非关联区域组合过程的流程图。如图6所示,本发明实施例在多个待聚类区域中确定关联的区域以及非关联的区域,以确定多个关联区域组合和非关联区域组合的过程包括以下步骤:
步骤S210、在多个待聚类区域中确定第一待聚类区域和第二待聚类区域。
具体地,在确定多个待聚类区域后,通过随机选择、顺序选择或条件选择等预设的选择方式在多个待聚类区域中选择一个待聚类区域作为第一待聚类区域,并确定所述第一待聚类区域以外的其他待聚类区域为第二待聚类区域。以在确定第一待聚类区域和多个第二待聚类区域后,确定第一待聚类区域与各第二待聚类区域之间关系,即当前第一待聚类区域是否与各第二待聚类区域关联,或是否与各第二待聚类区域非关联。进一步地,在确定当前第一待聚类区域与各第二待聚类区域之间的关系后,在多个待聚类区域中重新确定第一待聚类区域和第二待聚类区域以再次确定当前第一待聚类区域和各第二待聚类区域之间的关系,直到确定了全部待聚类区域与其他区域之间的关系。
步骤S220、根据对应的位置信息确定第一待聚类区域和各第二待聚类区域的位置距离。
具体地,确定当前第一待聚类区域和第二待聚类区域后,确定所述第一待聚类区域和各第二待聚类区域对应的位置信息,以计算得到第一聚类区域和各第二待聚类区域之间的位置距离。可选地,所述位置距离可以通过计算第一待聚类区域位置和第二待聚类区域位置的欧式距离确定。以在四个待聚类区域中确定一个第一待聚类区域和三个第二待聚类区域为例进行说明。当第一待聚类区域的位置信息为(x1,y1),单个第二待聚类区域的位置信息分别为(x2,y2)、(x3,y3)和(x4,y4)时,各第二待聚类区域与第一待聚类区域的位置距离依次为
Figure BDA0002763210540000081
Figure BDA0002763210540000082
步骤S230、确定用于表征属性信息之间对应关系的对应关系集合。
具体地,通过获取终端设备传输的对应关系集合或数据库中预先存储的对应关系集合等方式确定对应关系集合,所述对应关系集合用于表征各属性关系是否对应,包括多个由两个具有对应关系属性信息构成的属性信息组。其中,各属性信息之间的对应关系可以根据应用场景需要预先设定,并以“属性信息-属性信息”的形式存储。以本发明实施例应用于共享车辆场景中为例进行说明。当所述属性信息中包括属性类型时,所述对应关系集合中可以包括多个由两个具有对应关系的属性类型组成的属性类型组。实际应用过程中,在早高峰时期用户通常会由小区附近的停车点取用车辆,并停放在学校附近的停车点或大厦附近的停车点。因此,属性类型“小区”分别和属性类型“学校”、“大厦”形成对应关系,所述对应关系集合中可以包括“小区-大厦”和“小区-学校”两个属性类型组。
步骤S240、根据对应关系集合确定第一待聚类区域和各第二待聚类区域的属性信息是否对应。
具体地,在确定对应关系集合后,根据所述对应关系集合中各属性信息之间的对应关系判断所述第一待聚类区域和各第二待聚类区域的属性信息是否对应。以所述对应关系集合中包括由两个具有对应关系的属性信息组成的如下属性信息组:“小区-大厦”、“小区-学校”、“学校-宿舍”、“大厦-商场”为例进行说明。在当前第一待聚类区域对应的属性信息为“学校”,第二待聚类区域1、第二待聚类区域2和第二待聚类区域3对应的属性信息分别为“小区”、“商场”和“大厦”时,根据对应关系集合确定第一待聚类区域与第二待聚类区域1的属性信息对应,与第二待聚类区域2和第二待聚类区域3的属性信息均无对应关系。
步骤S250、响应于第二待聚类区域与第一待聚类区域的位置距离小于预设阈值,且属性信息为对应关系,确定第二待聚类区域与所述第一待聚类区域为关联区域组合。
具体地,在计算第一待聚类区域与各第二待聚类区域的位置距离,以及第一待聚类区域以及各所述第二待聚类区域的属性信息对应关系后,进一步根据位置距离和属性信息的对应关系判断第一待聚类区域和第二待聚类区域的关系。在本发明实施例中,当存在第二待聚类区域与第一待聚类区域的位置距离小于预设阈值,且属性信息为对应关系时,判断所述第二待聚类区域与所述第一待聚类区域为对应关系。也就是说,第一待聚类区域和所述对应关系的第二待聚类区域可以组成对应的关联区域组合。
以在四个待聚类区域中确定一个第一待聚类区域和三个第二待聚类区域为例进行说明。当所述第一待聚类区域与第二待聚类区域1、第二待聚类区域2和第二待聚类区域3的位置距离依次为10、27、13,且第一待聚类区域和第二待聚类区域1以及第二待聚类区域2的属性信息为非对应关系,第一待聚类区域和第二待聚类区域3的属性信息为对应关系时。在预设的阈值为15的情况下,确定第一待聚类区域和第二待聚类区域3为在聚类后在同一个类簇中的地理区域,即可以根据第一待聚类区域和第二待聚类区域3组成对应的关联区域组合。
进一步地,响应于第二待聚类区域与所述第一待聚类区域的位置距离大于预设阈值,且属性信息非对应关系,确定所述第二待聚类区域与所述第一待聚类区域为非关联区域组合。也就是说,当存在第二待聚类区域与第一待聚类区域的位置距离大于预设阈值,且属性信息为非对应关系时,判断所述第二待聚类区域与所述第一待聚类区域为非对应关系,即第一待聚类区域和所述非对应关系的第二待聚类区域可以组成非关联区域组合。
仍以在四个待聚类区域中确定一个第一待聚类区域和三个第二待聚类区域为例进行说明。当所述第一待聚类区域与第二待聚类区域1、第二待聚类区域2和第二待聚类区域3的位置距离依次为10、27、13,且第一待聚类区域和第二待聚类区域1以及第二待聚类区域2的属性信息为非对应关系,第一待聚类区域和第二待聚类区域3的属性信息为对应关系时。在预设的阈值为15的情况下,确定第一待聚类区域和第二待聚类区域2为在聚类后不在同一个类簇中的地理区域,即可以根据第一待聚类区域和第二待聚类区域2组成非关联区域组合。
步骤S300、以各所述关联区域组合和非关联区域组合作为约束条件,对各所述待聚类区域进行聚类,以确定目标聚类结果。
具体地,在确定了多个关联区域组合和非关联区域组合后,将各所述关联区域组合和非关联区域组合作为约束条件,对各所述待聚类区域进行聚类以得到聚类结果。为保证聚类效果,可以对各所述待聚类区域进行多次聚类,并在每次聚类后计算本次聚类过程的误差,以在误差值满足预设条件时确定当前的聚类结果为目标聚类结果。所述目标聚类结果包括多个类簇,各所述类簇中包括多个地理区域。在本发明实施例中,对待聚类区域进行聚类的算法为凸聚类算法,即聚类后得到的每个类簇都是一个包含多个地理区域的凸包,且各凸包不相交的聚类算法。可选地,所述凸聚类算法可以为BIRCH算法(平衡迭代削减聚类算法)、K-means算法等聚类算法。
图7为本发明实施例以迭代方式确定目标聚类结果的流程图。如图7所示,本发明实施例确定目标聚类结果的过程为迭代过程,且包括以下步骤:
步骤S310、以各所述关联区域组合和非关联区域组合作为约束条件,对各所述待聚类区域进行当前迭代过程的聚类以得到多个区域集合。
具体地,以各所述关联区域组合和非关联区域组合作为约束条件,通过预先设定的聚类算法对各待聚类区域进行本次迭代过程的聚类,以得到多个区域集合,所述区域集合为本次聚类得到的类簇。其中,本发明实施例中的聚类算法为凸聚类算法,即BIRCH算法(平衡迭代削减聚类算法)、K-means算法等聚类后得到的类簇均为包含多个地理区域的凸包,且各类簇对应的凸包不相交的聚类算法。
步骤S320、根据预设的凸函数基于当前聚类结果计算对应的误差值。
具体地,在确定本次聚类结果后,根据预设的凸函数计算本次聚类结果对应的误差值。可选地,所述计算误差值的凸函数为如下函数:
Figure BDA0002763210540000111
其中,
Figure BDA0002763210540000112
为误差值,k为本次迭代过程聚类后得到的类簇数量,即区域集合数量,πc为k个类簇中的一个类簇,M为包括各关联区域组合的关联组合集合,C为包括各非关联区域组合的非关联组合集合li是xi对应的聚类标签,ωij是违反关联和非关联约束带来的正则化惩罚。可选地,本发明实施例计算聚类结果误差值的方法可以为交替方向乘子法(alternating direction method of multipliers,ADMM)。
步骤S330、误差值满足预设条件。
具体地,判断当前迭代过程得到的误差值是否满足预设条件,以在不满足预设条件时进入下一次迭代过程,即重新执行步骤S310,再次进行聚类。在本发明实施例的一个可选的实现方式中,所述预设条件可以为预先设定一个误差阈值,在当前迭代过程聚类后得出的误差值小于误差阈值时,判断所述误差值满足预设条件。在本发明实施例的另一个可选的实现方式中,所述预设条件还可以为预先设定一个迭代次数阈值和初始值为0的误差下降值,在每一次迭代过程得到的误差值较上一次迭代得到的误差值下降或不变时将所述误差下降值加一,在迭代过程得到的误差值较上一次迭代得到的误差值上升时将所述误差下降值归零,直到所述误差下降值达到预设的迭代次数阈值时判断当前误差值满足预设条件。应理解,所述预设条件还可以为其他用于约束误差值,以确定最好聚类效果的条件,本发明实施例中并不加以限制。
步骤S340、确定当前聚类结果为目标聚类结果。
具体地,在根据步骤S330判断当前迭代过程得到的误差值满足预设条件时,确定当前聚类结果为目标聚类结果。也就是说,根据当前聚类后得到的多个类簇进行区域划分,以确定各类簇对应的面积较大的地理区域,其中包括对应类簇中的多个面积较小的地理区域。
本发明实施例的地理区域聚类方法在对地理区域进行聚类的过程中引入了关联区域组合和非关联区域组合,并将关联区域组合和非关联区域组合作为约束条件进行聚类,同时保证局部和全局的最优以提高聚类效果。
图8为本发明实施例的地理区域聚类装置的示意图。如图8所示,所述地理区域聚类装置包括信息确定模块80、区域组合确定模块81和聚类模块82。
具体地,信息确定模块80用于确定多个待聚类区域对应的位置信息和属性信息。区域组合确定模块81用于根据各所述待聚类区域对应的位置信息和属性信息确定多个关联区域组合和多个非关联区域组合,所述关联区域组合中包括两个聚类后必在同一类簇中的待聚类区域,所述非关联区域组合中包括两个在聚类后必不在同一类簇中的待聚类区域。聚类模块82用于以各所述关联区域组合和非关联区域组合作为约束条件,对各所述待聚类区域进行聚类,以确定目标聚类结果,所述目标聚类结果包括多个类簇,各所述类簇中包括多个区域。
进一步地,所述信息确定模块80包括:
位置确定子模块,用于获取各所述待聚类区域对应的经纬度数据作为位置信息;
属性信息确定子模块,用于根据各所述待聚类区域周围预设区域内的设施确定对应的属性信息。
进一步地,所述区域组合确定模块81包括:
区域确定子模块,用于在多个待聚类区域中确定一个第一待聚类区域,同时确定出第一待聚类区域以外的其他待聚类区域为第二待聚类区域;
位置确定子模块,用于根据对应的位置信息确定所述第一待聚类区域和各所述第二待聚类区域的位置距离;
集合确定子模块,用于确定用于表征属性信息之间对应关系的对应关系集合;
对应关系确定子模块,用于根据所述对应关系集合确定所述第一待聚类区域和各所述第二待聚类区域的属性信息是否对应;
第一组合确定子模块,用于响应于第二待聚类区域与所述第一待聚类区域的位置距离小于预设阈值,且属性信息为对应关系,确定所述第二待聚类区域与所述第一待聚类区域为关联区域组合。
进一步地,所述区域组合确定模块81还包括:
第二组合确定子模块,用于响应于第二待聚类区域与所述第一待聚类区域的位置距离大于预设阈值,且属性信息非对应关系,确定所述第二待聚类区域与所述第一待聚类区域为非关联区域组合。
进一步地,所述聚类模块82包括:
用于以迭代方式执行以下步骤的:
聚类子模块,用于以各所述关联区域组合和非关联区域组合作为约束条件,对各所述待聚类区域进行当前迭代过程的聚类以得到多个区域集合;
误差确定子模块,用于根据预设的凸函数基于当前聚类结果计算对应的误差值;
结果确定模块,用于响应于所述误差值满足预设条件,确定当前聚类结果为目标聚类结果。
进一步地,所述聚类结果的误差值可以通过交替方向乘子法计算得到。
本发明实施例在对地理区域进行聚类的过程中引入了关联区域组合和非关联区域组合,并将关联区域组合和非关联区域组合作为约束条件进行聚类,同时保证局部和全局的最优以提高聚类效果。
图6为本发明实施例的电子设备的示意图。如图6所示,图6所示的电子设备为通用地址查询装置,其包括通用的计算机硬件结构,其至少包括处理器60和存储器61。处理器60和存储器61通过总线62连接。存储器61适于存储处理器60可执行的指令或程序。处理器60可以是独立的微处理器,也可以是一个或者多个微处理器集合。由此,处理器60通过执行存储器61所存储的指令,从而执行如上所述的本发明实施例的方法流程实现对于数据的处理和对于其它装置的控制。总线62将上述多个组件连接在一起,同时将上述组件连接到显示控制器63和显示装置以及输入/输出(I/O)装置64。输入/输出(I/O)装置64可以是鼠标、键盘、调制解调器、网络接口、触控输入装置、体感输入装置、打印机以及本领域公知的其他装置。典型地,输入/输出装置64通过输入/输出(I/O)控制器64与系统相连。
本领域的技术人员应明白,本申请的实施例可提供为方法、装置(设备)或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可读存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品。
本申请是参照根据本申请实施例的方法、装置(设备)和计算机程序产品的流程图来描述的。应理解可由计算机程序指令实现流程图中的每一流程。
这些计算机程序指令可以存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现流程图一个流程或多个流程中指定的功能。
也可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程中指定的功能的装置。
本发明的另一实施例涉及一种非易失性存储介质,用于存储计算机可读程序,所述计算机可读程序用于供计算机执行上述部分或全部的方法实施例。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指定相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种地理区域聚类方法,其特征在于,所述方法包括:
确定多个待聚类区域对应的位置信息和属性信息;
根据各所述待聚类区域对应的位置信息和属性信息确定多个关联区域组合和多个非关联区域组合,所述关联区域组合中包括两个聚类后必在同一类簇中的待聚类区域,所述非关联区域组合中包括两个在聚类后必不在同一类簇中的待聚类区域;
以各所述关联区域组合和非关联区域组合作为约束条件,对各所述待聚类区域进行聚类,以确定目标聚类结果,所述目标聚类结果包括多个类簇,各所述类簇中包括多个区域。
2.根据权利要求1所述的方法,其特征在于,所述确定多个待聚类区域对应的位置信息和属性信息包括:
获取各所述待聚类区域对应的经纬度数据作为位置信息;
根据各所述待聚类区域周围预设区域内的设施确定对应的属性信息。
3.根据权利要求1所述的方法,其特征在于,所述根据各所述待聚类区域对应的位置信息和属性信息确定多个关联区域组合和多个非关联区域组合包括:
在多个待聚类区域中确定一个第一待聚类区域,同时确定出第一待聚类区域以外的其他待聚类区域为第二待聚类区域;
根据对应的位置信息确定所述第一待聚类区域和各所述第二待聚类区域的位置距离;
确定用于表征属性信息之间对应关系的对应关系集合;
根据所述对应关系集合确定所述第一待聚类区域和各所述第二待聚类区域的属性信息是否对应;
响应于第二待聚类区域与所述第一待聚类区域的位置距离小于预设阈值,且属性信息为对应关系,确定所述第二待聚类区域与所述第一待聚类区域为关联区域组合。
4.根据权利要求3所述的方法,其特征在于,所述根据各所述待聚类区域对应的位置信息和属性信息确定多个关联区域组合和多个非关联区域组合还包括:
响应于第二待聚类区域与所述第一待聚类区域的位置距离大于预设阈值,且属性信息非对应关系,确定所述第二待聚类区域与所述第一待聚类区域为非关联区域组合。
5.根据权利要求1所述的方法,其特征在于,所述以各所述关联区域组合和非关联区域组合作为约束条件,对各所述待聚类区域进行聚类,以确定目标聚类结果包括:
以迭代方式执行以下步骤:
以各所述关联区域组合和非关联区域组合作为约束条件,对各所述待聚类区域进行当前迭代过程的聚类以得到多个区域集合;
根据预设的凸函数基于当前聚类结果计算对应的误差值;
响应于所述误差值满足预设条件,确定当前聚类结果为目标聚类结果。
6.根据权利要求5所述的方法,其特征在于,所述聚类结果的误差值可以通过交替方向乘子法计算得到。
7.一种地理区域聚类装置,其特征在于,所述装置包括:
信息确定模块,用于确定多个待聚类区域对应的位置信息和属性信息;
区域组合确定模块,用于根据各所述待聚类区域对应的位置信息和属性信息确定多个关联区域组合和多个非关联区域组合,所述关联区域组合中包括两个聚类后必在同一类簇中的待聚类区域,所述非关联区域组合中包括两个在聚类后必不在同一类簇中的待聚类区域;
聚类模块,用于以各所述关联区域组合和非关联区域组合作为约束条件,对各所述待聚类区域进行聚类,以确定目标聚类结果,所述目标聚类结果包括多个类簇,各所述类簇中包括多个区域。
8.根据权利要求7所述的装置,其特征在于,所述信息确定模块包括:
位置确定子模块,用于获取各所述待聚类区域对应的经纬度数据作为位置信息;
属性信息确定子模块,用于根据各所述待聚类区域周围预设区域内的设施确定对应的属性信息。
9.根据权利要求7所述的装置,其特征在于,所述区域组合确定模块包括:
区域确定子模块,用于在多个待聚类区域中确定一个第一待聚类区域,同时确定出第一待聚类区域以外的其他待聚类区域为第二待聚类区域;
位置确定子模块,用于根据对应的位置信息确定所述第一待聚类区域和各所述第二待聚类区域的位置距离;
集合确定子模块,用于确定用于表征属性信息之间对应关系的对应关系集合;
对应关系确定子模块,用于根据所述对应关系集合确定所述第一待聚类区域和各所述第二待聚类区域的属性信息是否对应;
第一组合确定子模块,用于响应于第二待聚类区域与所述第一待聚类区域的位置距离小于预设阈值,且属性信息为对应关系,确定所述第二待聚类区域与所述第一待聚类区域为关联区域组合。
10.根据权利要求9所述的装置,其特征在于,所述区域组合确定模块还包括:
第二组合确定子模块,用于响应于第二待聚类区域与所述第一待聚类区域的位置距离大于预设阈值,且属性信息非对应关系,确定所述第二待聚类区域与所述第一待聚类区域为非关联区域组合。
11.根据权利要求7所述的装置,其特征在于,所述聚类模块包括:
用于以迭代方式执行以下步骤的:
聚类子模块,用于以各所述关联区域组合和非关联区域组合作为约束条件,对各所述待聚类区域进行当前迭代过程的聚类以得到多个区域集合;
误差确定子模块,用于根据预设的凸函数基于当前聚类结果计算对应的误差值;
结果确定模块,用于响应于所述误差值满足预设条件,确定当前聚类结果为目标聚类结果。
12.根据权利要求11所述的装置,其特征在于,所述聚类结果的误差值可以通过交替方向乘子法计算得到。
13.一种计算机可读存储介质,用于存储计算机程序指令,其特征在于,所述计算机程序指令在被处理器执行时实现如权利要求1-6中任一项所述的方法。
14.一种电子设备,包括存储器和处理器,其特征在于,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如权利要求1-6中任一项所述的方法。
CN202011224525.5A 2020-11-05 2020-11-05 地理区域聚类方法、装置、存储介质和电子设备 Pending CN112328880A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011224525.5A CN112328880A (zh) 2020-11-05 2020-11-05 地理区域聚类方法、装置、存储介质和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011224525.5A CN112328880A (zh) 2020-11-05 2020-11-05 地理区域聚类方法、装置、存储介质和电子设备

Publications (1)

Publication Number Publication Date
CN112328880A true CN112328880A (zh) 2021-02-05

Family

ID=74315881

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011224525.5A Pending CN112328880A (zh) 2020-11-05 2020-11-05 地理区域聚类方法、装置、存储介质和电子设备

Country Status (1)

Country Link
CN (1) CN112328880A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113313101A (zh) * 2021-08-02 2021-08-27 杭州安恒信息技术股份有限公司 一种建筑物轮廓自动聚合方法、装置、设备及存储介质
CN113570004A (zh) * 2021-09-24 2021-10-29 西南交通大学 一种乘车热点区域预测方法、装置、设备及可读存储介质
CN113836358A (zh) * 2021-09-14 2021-12-24 北京百度网讯科技有限公司 数据处理方法、装置、电子设备及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113313101A (zh) * 2021-08-02 2021-08-27 杭州安恒信息技术股份有限公司 一种建筑物轮廓自动聚合方法、装置、设备及存储介质
CN113313101B (zh) * 2021-08-02 2021-10-29 杭州安恒信息技术股份有限公司 一种建筑物轮廓自动聚合方法、装置、设备及存储介质
CN113836358A (zh) * 2021-09-14 2021-12-24 北京百度网讯科技有限公司 数据处理方法、装置、电子设备及存储介质
CN113570004A (zh) * 2021-09-24 2021-10-29 西南交通大学 一种乘车热点区域预测方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
CN112328880A (zh) 地理区域聚类方法、装置、存储介质和电子设备
CN107808122B (zh) 目标跟踪方法及装置
CN110472534A (zh) 基于rgb-d数据的3d目标检测方法、装置、设备和存储介质
CN108090208A (zh) 融合数据处理方法及装置
CN108229740B (zh) 一种商圈边界的确定方法、装置、服务器及存储介质
CN101377851A (zh) 点云到点云的最近距离计算系统及方法
CN112717414B (zh) 游戏场景编辑方法、装置、电子设备以及存储介质
US20210248795A1 (en) Method, apparatus, and computer program for completing painting of image, and method, apparatus, and computer program for training artificial neural network
CN116628123B (zh) 基于空间数据库的动态切片生成方法和系统
CN112381616A (zh) 物品推荐引导方法、装置及计算机设备
CN110782472B (zh) 点云地面点的识别方法及装置
CN109961129A (zh) 一种基于改进粒子群的海上静止目标搜寻方案生成方法
CN117172633B (zh) 一种面向工业互联网平台的制造服务子图仿真方法及系统
CN108280135B (zh) 实现数据结构可视化的方法、装置和电子设备
CN116611678B (zh) 数据处理方法、装置、计算机设备和存储介质
CN112991008A (zh) 一种位置推荐方法、装置及电子设备
CN114463499A (zh) 建筑物三维建模方法及装置
CN112927232B (zh) 基于通勤找房的房源召回方法及装置
CN115661444A (zh) 图像处理方法、装置、设备、存储介质及产品
CN115525841A (zh) 兴趣点信息的获取方法、电子设备及存储介质
CN111524446B (zh) 数据处理方法、装置、电子设备及可读存储介质
CN111737374B (zh) 位置坐标确定方法、装置、电子设备及存储介质
CN113658338A (zh) 点云树木单体分割方法、装置、电子设备及存储介质
CN109685751B (zh) 配送区域的合并方法、装置、电子设备及存储介质
CN112434653A (zh) 一种遥感图像建筑区检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination