CN114357099B - 一种聚类方法、聚类系统和存储介质 - Google Patents
一种聚类方法、聚类系统和存储介质 Download PDFInfo
- Publication number
- CN114357099B CN114357099B CN202111629314.4A CN202111629314A CN114357099B CN 114357099 B CN114357099 B CN 114357099B CN 202111629314 A CN202111629314 A CN 202111629314A CN 114357099 B CN114357099 B CN 114357099B
- Authority
- CN
- China
- Prior art keywords
- clustering
- grid
- processed
- grids
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000004590 computer program Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 230000006870 function Effects 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 3
- 238000011166 aliquoting Methods 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Remote Sensing (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Image Analysis (AREA)
Abstract
本申请适用于数据处理领域,提供了一种聚类方法、聚类系统和存储介质。聚类方法包括:根据点对象集合数据和障碍物面数据确定多个待处理网格;对待处理网格中的点对象进行聚类以得到聚类区域;将与聚类区域相邻的网格确定为邻近网格;对邻近网格中的点对象进行重归类,以更新聚类区域。如此,由于对邻近网格中的点对象进行重归类,故将聚类区域周边的邻近网格中的点对象纳入了考虑的范围,使得更新后的聚类区域更加准确。
Description
技术领域
本申请属于数据处理领域,尤其涉及一种聚类方法、聚类系统和存储介质。
背景技术
相关技术通常通过聚类方法来实现ATM选址、设备安装地选址、区域划分等目的。
相关技术中的聚类方法例如为划分类方法、分层类方法、基于密度类方法、基于网格类方法和基于模型类方法。这些聚类方法隐含一个假设,即样本间是可以直达的,一般采用样本间的直线距离来衡量样本间的相似性,而忽略了障碍物的约束条件。
而且,相关技术中的聚类方法通常到基于网格的划分得出聚类区域就已经结束了,并不会考虑聚类区域周边网格中的点对象。然而,聚类区域周边相邻的网格中的部分点对象非常靠近聚类区域,只是由于网格划分的精度将而被排除在了最终的聚类区域外。这会导致聚类不够准确。
基于此,如何基于障碍物和聚类区域相邻的网格来提高聚类的准确性,成为了亟待解决的问题。
发明内容
本申请提供一种聚类方法、聚类系统和存储介质,旨在解决如何基于障碍物和聚类区域相邻的网格来提高聚类的准确性的问题。
第一方面,本申请提供的聚类方法,包括:
根据点对象集合数据和障碍物面数据确定多个待处理网格;
对所述待处理网格中的点对象进行聚类以得到聚类区域,所述聚类区域对应的网格为聚类网格;
将与所述聚类区域相邻的网格确定为邻近网格;
对所述邻近网格中的点对象进行重归类,以更新所述聚类区域。
可选地,根据点对象集合数据和障碍物面数据确定多个待处理网格,包括:
确定所述点对象集合数据的最小外接矩形;
等分所述最小外接矩形以生成多个等分网格;
根据所述点对象集合数据和所述障碍物面数据对所述等分网格的数据进行标准化处理,以得到多个所述待处理网格。
可选地,在所述对所述待处理网格中的点对象进行聚类以得到聚类区域的步骤之前,所述聚类方法包括:
将与所述点对象集合数据不相交的所述待处理网格确定为无关网格;
从多个所述待处理网格中删除所述无关网格。
可选地,所述聚类区域对应的网格为聚类网格,在所述对所述待处理网格中的点对象进行聚类以得到聚类区域的步骤中,对每一个所述待处理网格进行下述处理:
确定当前的所述待处理网格是否处于预设状态;
在当前的所述待处理网格未处于所述预设状态的情况下,将下一个所述待处理网格作为当前的所述待处理网格,并进入所述确定当前的所述待处理网格是否处于预设状态的步骤;
在当前的所述待处理网格处于所述预设状态的情况下,采用对应的网格标识标记当前的所述待处理网格,并将当前的所述待处理网格确定为当前的所述聚类网格;
在与当前的所述聚类网格相邻的全部网格均不处于所述预设状态的情况下,将下一个所述待处理网格作为当前的所述待处理网格,并进入所述确定当前的所述待处理网格是否处于预设状态的步骤;
将与当前的所述聚类网格相邻的每个网格作为所述待处理网格,并进入所述确定当前的所述待处理网格是否处于预设状态的步骤。
可选地,网格状态包括密集状态、未处理状态和不相交状态,所述不相交状态为与所述障碍物面数据不相交的状态,确定当前的所述待处理网格是否处于预设状态,包括:
在当前的所述待处理网格处于所述密集状态、且处于所述未处理状态且处于与所述不相交状态的情况下,确定当前的所述待处理网格处于所述预设状态;
否则,确定当前的所述待处理网格未处于所述预设状态。
可选地,所述聚类区域为一个聚类网格;和/或,所述聚类区域为多个相连的聚类网格;
在所述聚类区域为多个相连的聚类网格的情况下,多个相连的聚类网格的网格标识相同。
可选地,在所述对所述邻近网格中的点对象进行重归类的步骤中,对于每个点对象进行下述处理:
计算当前的所述点对象与所述聚类区域中的点对象的最近距离;
计算对应的所述聚类区域中所有点对象的平均距离;
在所述最近距离小于所述平均距离的情况下,将当前的所述点对象归纳到对应的所述聚类区域。
可选地,所述聚类区域对应的网格为聚类网格,所述聚类方法包括:
计算所述聚类区域中所有点对象的平均点,以得到域平均点;
在所述域平均点未与所述障碍物面数据相交的情况下,所述域平均点为所述聚类区域的中心点;
在所述域平均点与所述障碍物面数据相交的情况下,计算所述聚类区域对应的每个所述聚类网格的平均点,以得到格平均点;
计算每个所述聚类网格中的点对象到对应的所述格平均点的非欧氏距离的总和;
将对应的所述总和最小的所述格平均点作为所述中心点。
第二方面,本申请提供的聚类系统,包括处理器和存储器,所述存储器存储有计算机可执行指令,所述计算机可执行指令被所述处理器执行时,实现上述任一项所述的聚类方法。
第三方面,本申请提供的存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现上述任一项所述的聚类方法。
本申请实施例的聚类方法、聚类系统和存储介质中,由于对邻近网格中的点对象进行重归类,故将聚类区域周边的邻近网格中的点对象纳入了考虑的范围,使得更新后的聚类区域更加准确。
附图说明
图1-6是本申请各实施例的聚类方法的流程示意图;
图7是本申请实施例的聚类方法的场景示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请由于对邻近网格中的点对象进行重归类,故将聚类区域周边的邻近网格中的点对象纳入了考虑的范围,使得聚类更加准确。
实施例一
请参阅图1,本申请实施例的聚类方法,包括:
步骤S11:根据点对象集合数据和障碍物面数据确定多个待处理网格;
步骤S14:对待处理网格中的点对象进行聚类以得到聚类区域;
步骤S15:将与聚类区域相邻的网格确定为邻近网格;
步骤S16:对邻近网格中的点对象进行重归类,以更新聚类区域。
本申请实施例的聚类方法,由于对邻近网格中的点对象进行重归类,故将聚类区域周边的邻近网格中的点对象纳入了考虑的范围,使得更新后的聚类区域更加准确。
具体地,本申请实施例的聚类方法基于开源数据库PostGIS。在步骤S11中,可将点对象集合数据和障碍物面数据导入PostGIS数据库中。PostGIS是一款开源GIS数据库,基于PostGIS实现的本申请实施例的聚类方法不仅能够克服现有技术的缺点,还能充分利用PostGIS内置的空间函数提升算法效率。
具体地,待处理的空间区域A内的N个点对象的集合可记为{P1,P2,P3,......,Pn}、C个障碍物面可记为{O1,O2,O3,......,Oc}。换言之,点对象集合数据为{P1,P2,P3,......,Pn},障碍物面数据为{O1,O2,O3,......,Oc}。
请参阅图2,在一些可选实施例中,步骤S11包括:
步骤S111:确定点对象集合数据的最小外接矩形;
步骤S112:等分最小外接矩形以生成多个等分网格;
步骤S113:根据点对象集合数据和障碍物面数据对等分网格的数据进行标准化处理,以得到多个待处理网格。
如此,高效地实现根据点对象集合数据和障碍物面数据确定多个待处理网格。
具体地,在步骤S111中,可利用范围函数计算出点对象集合数据的最小外接矩形。
具体地,在步骤S112中,可分别计算最小外接矩形的宽和高;分别对宽和高按照预设数值等分,以得到宽的等分数量count_x和高的等分数量count_y;将待处理的空间区域A沿横轴和纵轴方向分别等分拆分为宽的等分数量count_x份和高的等分数量count_y份,以使待处理的空间区域A拆分成count=count_x×count_y个连续网格;根据最小外接矩形、宽的等分数量count_x和高的等分数量count_y生成网格表。如此,高效地实现等分最小外接矩形,从而高效地生成多个等分网格。
进一步地,预设数值可由工作人员根据实际情况设置。如此,使得等分更加灵活,能够适应多种情形。进一步地,可利用距离函数分别计算最小外接矩形的宽和高。进一步地,可对等分计算的结果进行向上取整,从而分别得到宽的等分数量count_x和高的等分数量count_y。进一步地,可利用自定义函数create_grid根据最小外接矩形、宽的等分数量count_x和高的等分数量count_y生成网格表。
具体地,在步骤S113中,可对等分网格添加字段并初始化,从而对等分网格的数据进行标准化处理,以得到多个待处理网格。如此,可以通过字段来确定或修改待处理网格的状态。
进一步地,可添加“是否与障碍物相交”字段,初始化为false;进一步地,可添加“聚类ID”字段,初始化为null;进一步地,可增加“内含点数”字段,初始化为0,“内含点数”字段用于存储网格内包含的点数量;进一步地,可添加“是否密集”字段,初始化为false;进一步地,可增加“内含点中心”字段,初始化为null,“内含点中心”字段用于记录该网格内的所有点的中心点;进一步地,可添加“是否已处理”字段,初始化为false;进一步地,可添加“geom”几何字段,使用对应的x坐标和y坐标来构建该字段的值,“geom”几何字段用于存储点对象的位置信息;进一步地,可添加“聚类中心点”字段,初始化为null,用于记录聚类区域中所有点对象的聚类中心点。
请参阅图3,在一些可选实施例中,在步骤S14之前,聚类方法包括:
步骤S12:将与点对象集合数据不相交的待处理网格确定为无关网格;
步骤S13:从多个待处理网格中删除无关网格。
如此,可以有效减少参与最终聚类计算的网格数据量,避免无关网格造成不必要的开销。
具体地,可利用PostGIS中的空间相交函数从多个待处理网格中确定并删除无关网格。如此,可以高效地确认并删除无关网格。
请参阅图4,在一些可选实施例中,聚类区域对应的网格为聚类网格,在步骤S14中,对每一个待处理网格进行下述处理:
步骤S141:确定当前的待处理网格是否处于预设状态;
步骤S142:在当前的待处理网格未处于预设状态的情况下,将下一个待处理网格作为当前的待处理网格,并进入步骤S141;
步骤S143:在当前的待处理网格处于预设状态的情况下,采用对应的网格标识标记当前的待处理网格,并将当前的待处理网格确定为当前的聚类网格;
步骤S144:在与当前的聚类网格相邻的全部网格均不处于预设状态的情况下,将下一个待处理网格作为当前的待处理网格,并进入步骤S141;
步骤S145:将与当前的聚类网格相邻的每个网格作为待处理网格,并进入步骤S141。
如此,实现对待处理网格中的点对象进行聚类。
具体地,在步骤S141中,可通过当前的待处理网格的字段来确定当前的待处理网格的状态,从而确定当前的待处理网格是否处于预设状态。
具体地,网格状态包括三种,分别为相交状态、不相交状态;密集状态、不密集状态;已处理状态、未处理状态。预设状态可为一种、两种或三种。
例如,预设状态为密集状态;又如,预设状态为密集状态和未处理状态;再如,预设状态为密集状态、未处理状态和不相交状态。在此不对预设状态的具体内容进行限定,工作人员可根据实际需要对预设状态进行设置。
具体地,在步骤S142中,每个待处理网格可对应一个序号,在当前的待处理网格未处于预设状态的情况下,根据当前的待处理网格的序号确定下一个待处理网格的序号,从而确定下一个待处理网格,进而将下一个待处理网格作为当前的待处理网格并进入步骤S141。
例如,待处理网格的数量为100个,分别对应1-100的序号,当前的待处理网格的序号为10,在序号为10的待处理网格未处于预设状态的情况下,可确定下一个待处理网格的序号为11,则将序号为11的待处理网格作为当前的待处理网格并进入步骤S141,判断序号为11的待处理网格是否处于预设状态。
具体地,在步骤S143中,对应的网格标识可添加到当前的待处理网格的“聚类ID”字段。如此,实现对当前的待处理网格的标记。而且,可通过读取该字段,确定该网格的网格标识,即聚类ID。
具体地,在步骤S144和步骤S145中,可对与当前的聚类网格相邻的全部网格逐一进行判断,在与当前的聚类网格相邻的全部网格均不处于预设状态的情况下,确定无需对当前的聚类网格相邻的全部网格中的点对象进行聚类,关于当前的聚类网格的处理结束。在与当前的聚类网格相邻的网格处于预设状态的情况下,对该相邻的网格进行标记,并继续分析与该相邻的网格相邻的网格。
这样,以第一个被标记的聚类网格为中心,不断向外延伸来判断网格是否处于预设状态,最后得到聚类区域。可以理解,在第一个被标记的聚类网格相邻的全部网格均不处于预设状态的情况下,聚类区域对应这一个聚类网格;否则,聚类区域对应多个相连的聚类网格。
在一些可选实施例中,网格状态包括密集状态、未处理状态和不相交状态,不相交状态为与障碍物面数据不相交的状态,步骤S141包括:
在当前的待处理网格处于密集状态、且处于未处理状态且处于不相交状态的情况下,确定当前的待处理网格处于预设状态;
否则,确定当前的待处理网格未处于预设状态。
如此,实现确定当前的待处理网格是否处于预设状态。
具体地,聚类方法包括:在待处理网格中的点对象的数量大于预设阈值的情况下,确定待处理网格处于密集状态;在待处理网格中的点对象的数量小于或等于预设阈值的情况下,确定待处理网格未处于密集状态。如此,通过预设阈值确定待处理网格是否处于密集状态,高效准确可量化。
进一步地,聚类方法包括:使用空间相交函数将与当前的待处理网格的点对象的总数更新到“内含点数”字段。如此,可以通过读取网格的“内含点数”字段,来确定当前的待处理网格的点对象的数量,从而确定该数量与预设阈值的大小关系,进而确定当前的待处理网格是否处于密集状态。
进一步地,在确定待处理网格处于密集状态的情况下,将初始化为false的“是否密集”字段更新为true;在确定待处理网格未处于密集状态的情况下,将“是否密集”字段保持在初始化为false的状态。如此,可以通过读取网格的“是否密集”字段,来确定当前的待处理网格是否处于密集状态。
具体地,聚类方法包括:在待处理网格经过步骤S141处理的情况下,确定待处理网格处于已处理状态;在待处理网格未经过步骤S141处理的情况下,确定待处理网格处于未处理状态。
进一步地,在待处理网格经过步骤S141处理的情况下,将初始化为false的“是否已处理”字段更新为true;在待处理网格未经过步骤S141处理的情况下,将“是否已处理”字段保持在初始化为false的状态。如此,可以通过读取网格的“是否已处理”字段,来确定当前的待处理网格是否处于未处理状态。
具体地,聚类方法包括:在待处理网格中的点对象与障碍物面数据不相交的情况下,确定待处理网格处于不相交状态;在待处理网格中的点对象与障碍物面数据相交的情况下,确定待处理网格处于相交状态。
进一步地,在待处理网格中的点对象与障碍物面数据相交的情况下,将初始化为false的“是否与障碍物相交”字段更新为true;在待处理网格中的点对象与障碍物面数据不相交的情况下,将“是否与障碍物相交”字段保持在初始化为false的状态。更进一步地,可利用空间相交函数将初始化为false的“是否与障碍物相交”字段更新为true。如此,可以通过读取网格的“是否与障碍物相交”字段,来确定当前的待处理网格是否处于未相交状态。
在一些可选实施例中,聚类区域为一个聚类网格;和/或,聚类区域为多个相连的聚类网格;在聚类区域为多个相连的聚类网格的情况下,多个相连的聚类网格的网格标识相同。如此,由于多个相连的聚类网格的网格标识相同,故可以通过网格标识快速确定多个网格是否属于同一聚类区域。
例如,聚类区域的数量为2个,其中一个聚类区域为3个相连的聚类网格,网格标识,即“聚类ID”字段,均为001;其中另一个聚类区域为4个相连的聚类网格,网格标识,即“聚类ID”字段,均为002。
可以理解,在其他的实施例中,在聚类区域为多个相连的聚类网格的情况下,可多个相连的聚类网格的网格标识连续,并与其他的网格不连续。例如,聚类区域为5个相连的聚类网格,网格标识分别为01-05,其他的网格中最小的序号为07。如此,可通过网络标识的连续性快速确定聚类区域对应的网格。
请参阅图5,在一些可选实施例中,在步骤S16中,对于每个点对象进行下述处理:
步骤S161:计算当前的点对象与聚类区域中的点对象的最近距离;
步骤S162:计算对应的聚类区域中所有点对象的平均距离;
步骤S163:在最近距离小于平均距离的情况下,将当前的点对象归纳到对应的聚类区域。
如此,可以对邻近网格中的点对象进行重归类,以更新聚类区域,这样将聚类区域周边的邻近网格中的点对象纳入了考虑的范围,使得更新后的聚类区域更加准确。
可以理解,对于划分网格时被划分到聚类区域邻近的网格内的点对象,其中的部分点对象与聚类区域的距离也很近,只是由于恰好被网格所隔开。因此,对这些点对象进行重归类,可以减少划分网格引起的误差,从而提高聚类的准确性。
请参阅图6,在一些可选实施例中,聚类区域对应的网格为聚类网格,聚类方法包括:
步骤S171:计算聚类区域中所有点对象的平均点,以得到域平均点;
步骤S172:在域平均点未与障碍物面数据相交的情况下,域平均点为聚类区域的中心点;
步骤S173:在域平均点与障碍物面数据相交的情况下,计算聚类区域对应的每个聚类网格的平均点,以得到格平均点;
步骤S174:计算每个聚类网格中的点对象到对应的格平均点的非欧氏距离的总和;
步骤S175:将对应的总和最小的格平均点作为中心点。
如此,可以得到聚类区域的中心点,便于进行ATM选址、设备安装地选址。
具体地,在步骤S174中,非欧氏距离是指绕过障碍物的非直线距离。
具体地,可返回聚类区域中耗费值最小的网格的中心点。
在一个例子中,在农村地区安装离散式设备时,对于联户一设施的需求,可通过空间聚类进行设施点的提取,适用于被道路等障碍物隔开的户室需要分开聚类的情况。具体地,可将农村地区房屋面数据及道路面数据导入PostGIS中,得到表房屋面表resa以及道路面roada。可使用ST_Centroid函数提取房屋面中心点数据集resp,即点对象集合数据resp。通过ST_Extent函数提取点对象集合数据resp的最小外接矩形box2d。通过ST_Distance函数分别计算最小外接矩形box2d的宽w和高h,然后分别对宽w和高h按照10米等分,对结果进行向上取整,分别得到宽和高对应的按照10米等分的等分数量cell_x和cell_y。通过自定义函数create_grid传入参数box2d、cell_x以及cell_y,以生成等距网格数据集gridcell,也即是网格表。利用ST_Intersects查询出与点对象集合数据resp相交的网格并删除。将预设阈值d设为1,换言之,预设阈值d为1。遍历等距网格数据集gridcell,如果记录中的“内含点数”字段(total_num)值大于阈值d,则将该记录的“是否密集”字段(isdense)标记为true。通过ST_Intersects将等距网格数据集gridcell与道路面roada相交的记录的“是否与障碍物相交”(isobstructed)字段标记为true。遍历等距网格数据集gridcell,如果记录的“是否密集”字段(isdense)为true并且“是否与障碍物相交”(isobstructed)字段为false,进行下一步。如果等距网格数据集gridcell的当前记录的“是否已处理”字段(ishandled)为false,则构建一个聚类区域(Cluster)记为r,聚类区域r的id设置为idNum,将该等距网格数据集gridcell的记录添加到聚类区域r中,即,将该等距网格数据集gridcell的记录的“聚类ID”字段(cluster_id)设置为clusterId。将该网格周边相邻的被标记为密集(isdense为true)以及存在未被标记为相交(isobstructed为false)的其它等距网格数据集gridcell的记录放到一个队列queue(Q)中。取出队列queue(Q)中的第一个元素,将该元素相邻的未被处理过、且被标记为密集且未相交的等距网格数据集gridcell的记录添加到聚类区域r中,即,将“聚类ID”字段(cluster_id)值设置为idNum,idNum++。计算最终聚类区域相邻格网内点到聚类区域内最近点的距离d1,将该距离d1与聚类区域中所有点之间的平均距离d2做对比,将d1小于d2的点归类到该聚类区域中。这样,针对联户一设施的需求,基于以上聚类结果,得到初步划分边界。
请参阅图7,聚类区域有四个,分别为第一聚类区域211、第二聚类区域212、第三聚类区域213、第四聚类区域214。点对象集合数据为图中的点,障碍物面标记为220。空白的网格中没有点,未与点对象集合数据相交,为无关网格,从待处理网格中被删除,故可从网格32开始处理非空白的网格。网格32-网格37、网格42、网格43、网格45、网格47和网格52均不处于密集状态,故均不处于预设状态。网格53密集、未处理且不与障碍物面220相交,故处于预设状态,采用网格标识“1”来标记网格53。而与网格53相邻的网格54、网格63也处于预设状态,故也用采用网格标识“1”来标记网格54、网格63。与网格54相邻的网格64也处于预设状态,故也用采用网格标识“1”来标记网格64。与网格64相邻的网格65也处于预设状态,故也用采用网格标识“1”来标记网格65。而网格53、网格54、网格63、网格64和网格65相邻的全部网格均不处于预设状态,故由网格53引起的聚类结束,得到更新前的第一个聚类区域,标识为“1”。网格55-网格57均不处于密集状态,故均不处于预设状态。网格59密集、未处理且不与障碍物面220相交,故处于预设状态,采用网格标识“2”来标记网格53,按照前述的方法处理,得到更新前的第二个聚类区域,标识为“2”。以此类推,得到更新前的第三个和第四个聚类区域,分别标识为“3”和“4”。然后,分别对四个聚类区域的邻近网格中的点对象进行重归类,从而更新这四个聚类区域。例如,对于网格55中的左右两个点,如果网格55中左侧的点与标识为“1”的聚类区域中的点对象的最近距离,小于标识为“1”的聚类区域中点对象的平均距离,则将网格55中左侧的点归类到标识为“1”的聚类区域,实现重归类。邻近网格中其余的点对象进行重归类的方法与此类似,为避免冗余,在此不再赘述。另外,第一聚类区域211、第二聚类区域212、第三聚类区域213、第四聚类区域214的中心点均在图7中标出,是图7中比点对象大的黑点。
综合以上,本申请实施例的聚类方法,结合PostGIS的空间函数,构建包含聚类物和障碍物的等分空间网格,然后剔除无关网格,减少参与计算的网格数据量,从而缩短算法执行时间,提升执行效率。而且,考虑了聚类区域周边的邻近网格中的点对象,使得更新后的聚类区域更加准确。
关于该实施例的其他解释和说明可参照本文的其他部分,为避免冗余,在此不再赘述。
实施例二
本申请提供的聚类系统,包括处理器和存储器,存储器存储有计算机可执行指令,计算机可执行指令被处理器执行时,实现上述任一项的聚类方法。
本申请实施例的聚类系统中,由于对邻近网格中的点对象进行重归类,故将聚类区域周边的邻近网格中的点对象纳入了考虑的范围,使得更新后的聚类区域更加准确。
关于该实施例的其他解释和说明可参照本文的其他部分,为避免冗余,在此不再赘述。
实施例三
本申请提供的存储介质存储有计算机程序,计算机程序被处理器执行时,实现上述任一项的聚类方法。
本申请实施例的存储介质中,由于对邻近网格中的点对象进行重归类,故将聚类区域周边的邻近网格中的点对象纳入了考虑的范围,使得更新后的聚类区域更加准确。
关于该实施例的其他解释和说明可参照本文的其他部分,为避免冗余,在此不再赘述。
以上仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本申请的保护范围之内。
Claims (8)
1.一种聚类方法,其特征在于,包括:
根据点对象集合数据和障碍物面数据确定多个待处理网格,所述点对象集合数据包括房屋面中心点数据集,所述障碍物面数据包括道路面数据;
对所述待处理网格中的点对象进行聚类以得到聚类区域;
将与所述聚类区域相邻的网格确定为邻近网格;
对所述邻近网格中的点对象进行重归类,以更新所述聚类区域;
具体地,所述聚类区域对应的网格为聚类网格,在所述对所述待处理网格中的点对象进行聚类以得到聚类区域的步骤中,对每一个所述待处理网格进行下述处理:
确定当前的所述待处理网格是否处于预设状态;
在当前的所述待处理网格未处于所述预设状态的情况下,将下一个所述待处理网格作为当前的所述待处理网格,并进入所述确定当前的所述待处理网格是否处于预设状态的步骤;
在当前的所述待处理网格处于所述预设状态的情况下,采用对应的网格标识标记当前的所述待处理网格,并将当前的所述待处理网格确定为当前的所述聚类网格;
在与当前的所述聚类网格相邻的全部网格均不处于所述预设状态的情况下,将下一个所述待处理网格作为当前的所述待处理网格,并进入所述确定当前的所述待处理网格是否处于预设状态的步骤;
将与当前的所述聚类网格相邻的每个网格作为所述待处理网格,并进入所述确定当前的所述待处理网格是否处于预设状态的步骤;
具体地,网格状态包括密集状态、未处理状态和不相交状态,所述不相交状态为与所述障碍物面数据不相交的状态,确定当前的所述待处理网格是否处于预设状态,包括:
在当前的所述待处理网格处于所述密集状态、且处于所述未处理状态且处于与所述不相交状态的情况下,确定当前的所述待处理网格处于所述预设状态;
否则,确定当前的所述待处理网格未处于所述预设状态。
2.根据权利要求1所述的聚类方法,其特征在于,根据点对象集合数据和障碍物面数据确定多个待处理网格,包括:
确定所述点对象集合数据的最小外接矩形;
等分所述最小外接矩形以生成多个等分网格;
根据所述点对象集合数据和所述障碍物面数据对所述等分网格的数据进行标准化处理,以得到多个所述待处理网格。
3.根据权利要求1所述的聚类方法,其特征在于,在所述对所述待处理网格中的点对象进行聚类以得到聚类区域的步骤之前,所述聚类方法包括:
将与所述点对象集合数据不相交的所述待处理网格确定为无关网格;
从多个所述待处理网格中删除所述无关网格。
4.根据权利要求1所述的聚类方法,其特征在于,所述聚类区域为一个聚类网格;和/或,所述聚类区域为多个相连的聚类网格;
在所述聚类区域为多个相连的聚类网格的情况下,多个相连的聚类网格的网格标识相同。
5.根据权利要求1所述的聚类方法,其特征在于,在所述对所述邻近网格中的点对象进行重归类的步骤中,对于每个点对象进行下述处理:
计算当前的所述点对象与所述聚类区域中的点对象的最近距离;
计算对应的所述聚类区域中所有点对象的平均距离;
在所述最近距离小于所述平均距离的情况下,将当前的所述点对象归纳到对应的所述聚类区域。
6.根据权利要求1所述的聚类方法,其特征在于,所述聚类区域对应的网格为聚类网格,所述聚类方法包括:
计算所述聚类区域中所有点对象的平均点,以得到域平均点;
在所述域平均点未与所述障碍物面数据相交的情况下,所述域平均点为所述聚类区域的中心点;
在所述域平均点与所述障碍物面数据相交的情况下,计算所述聚类区域对应的每个所述聚类网格的平均点,以得到格平均点;
计算每个所述聚类网格中的点对象到对应的所述格平均点的非欧氏距离的总和;
将对应的所述总和最小的所述格平均点作为所述中心点。
7.一种聚类系统,其特征在于,所述聚类系统包括处理器和存储器,所述存储器存储有计算机可执行指令,所述计算机可执行指令被所述处理器执行时,实现权利要求1-6任意一项所述的聚类方法。
8.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现权利要求1-6任意一项所述的聚类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111629314.4A CN114357099B (zh) | 2021-12-28 | 2021-12-28 | 一种聚类方法、聚类系统和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111629314.4A CN114357099B (zh) | 2021-12-28 | 2021-12-28 | 一种聚类方法、聚类系统和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114357099A CN114357099A (zh) | 2022-04-15 |
CN114357099B true CN114357099B (zh) | 2024-03-19 |
Family
ID=81103757
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111629314.4A Active CN114357099B (zh) | 2021-12-28 | 2021-12-28 | 一种聚类方法、聚类系统和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114357099B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114786199B (zh) * | 2022-04-21 | 2024-06-14 | 中国联合网络通信集团有限公司 | 一种网络问题点的确定方法、装置、设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104303193A (zh) * | 2011-12-28 | 2015-01-21 | 派尔高公司 | 基于聚类的目标分类 |
CN107064955A (zh) * | 2017-04-19 | 2017-08-18 | 北京汽车集团有限公司 | 障碍物聚类方法及装置 |
CN107273532A (zh) * | 2017-06-28 | 2017-10-20 | 济南大学 | 一种基于密度和扩展网格的数据流聚类方法 |
CN108256577A (zh) * | 2018-01-18 | 2018-07-06 | 东南大学 | 一种基于多线激光雷达的障碍物聚类方法 |
CN111275099A (zh) * | 2020-01-17 | 2020-06-12 | 湖北工业大学 | 一种基于网格粒度计算的聚类方法及聚类系统 |
CN112053105A (zh) * | 2019-06-05 | 2020-12-08 | 北京京东振世信息技术有限公司 | 划分服务区域的方法和装置 |
CN112597937A (zh) * | 2020-12-29 | 2021-04-02 | 广州极飞科技有限公司 | 障碍物聚类方法、装置、电子设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110909671B (zh) * | 2019-11-21 | 2020-09-29 | 大连理工大学 | 一种融合概率和高度信息的栅格地图障碍物检测方法 |
-
2021
- 2021-12-28 CN CN202111629314.4A patent/CN114357099B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104303193A (zh) * | 2011-12-28 | 2015-01-21 | 派尔高公司 | 基于聚类的目标分类 |
CN107064955A (zh) * | 2017-04-19 | 2017-08-18 | 北京汽车集团有限公司 | 障碍物聚类方法及装置 |
CN107273532A (zh) * | 2017-06-28 | 2017-10-20 | 济南大学 | 一种基于密度和扩展网格的数据流聚类方法 |
CN108256577A (zh) * | 2018-01-18 | 2018-07-06 | 东南大学 | 一种基于多线激光雷达的障碍物聚类方法 |
CN112053105A (zh) * | 2019-06-05 | 2020-12-08 | 北京京东振世信息技术有限公司 | 划分服务区域的方法和装置 |
CN111275099A (zh) * | 2020-01-17 | 2020-06-12 | 湖北工业大学 | 一种基于网格粒度计算的聚类方法及聚类系统 |
CN112597937A (zh) * | 2020-12-29 | 2021-04-02 | 广州极飞科技有限公司 | 障碍物聚类方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
适应不同距离的三维激光雷达数据处理方法;江浩斌;羊杰;孙军;朱剑;高列;;重庆理工大学学报(自然科学)(第08期) * |
Also Published As
Publication number | Publication date |
---|---|
CN114357099A (zh) | 2022-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Agamennoni et al. | Robust inference of principal road paths for intelligent transportation systems | |
Bíl et al. | ROCA–An ArcGIS toolbox for road alignment identification and horizontal curve radii computation | |
Hussain et al. | A hybrid modelling framework of machine learning and extreme value theory for crash risk estimation using traffic conflicts | |
CN114357099B (zh) | 一种聚类方法、聚类系统和存储介质 | |
WO2022226831A1 (zh) | 未定义类别障碍物的检测方法、装置和计算机设备 | |
Dziubenko et al. | Algorithm for solving optimal sensor devices placement problem in areas with natural obstacles | |
CN115201884B (zh) | 一种环境监测用的空气辐射测量方法及系统 | |
Wei et al. | Linear building pattern recognition in topographical maps combining convex polygon decomposition | |
CN113436223B (zh) | 点云数据的分割方法、装置、计算机设备和存储介质 | |
Ozdemir et al. | A novel algorithm for regularization of building footprints using raw LiDAR point clouds | |
CN114037912A (zh) | 遥感图像的变化检测方法、装置及计算机可读存储介质 | |
CN112269848A (zh) | 一种众包轨迹数据融合方法及装置 | |
CN117575494A (zh) | 多目标redd项目区域的聚合方法、系统、终端及介质 | |
CN116484244A (zh) | 基于聚类模型的自动驾驶事故发生机制分析方法 | |
CN111540202A (zh) | 一种相似卡口确定方法、装置、电子设备及可读存储介质 | |
CN114139099B (zh) | 基于轨迹密度匀化和层次分割的道路交叉口信息提取方法 | |
CN115982592A (zh) | 轨迹相似度计算方法、轨迹相似度计算装置以及存储介质 | |
CN111291276A (zh) | 一种基于局部方向中心性度量的聚类方法 | |
CN113761292A (zh) | 对象识别方法、装置、计算机设备和存储介质 | |
CN117351368B (zh) | 自然村边界的获取方法、装置、电子设备及存储介质 | |
CN117152973B (zh) | 基于etc门架数据的高速公路实时流量监测方法及系统 | |
CN114299043B (zh) | 点云质量评估方法、装置、电子设备和存储介质 | |
CN112529038B (zh) | 一种主板物料的识别方法、装置及存储介质 | |
CN114491307B (zh) | 一种设备聚合方法及装置 | |
CN117935456A (zh) | 越界检测的方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |