CN116628531A - 众包地图道路对象要素聚类方法、系统及存储介质 - Google Patents
众包地图道路对象要素聚类方法、系统及存储介质 Download PDFInfo
- Publication number
- CN116628531A CN116628531A CN202310179510.9A CN202310179510A CN116628531A CN 116628531 A CN116628531 A CN 116628531A CN 202310179510 A CN202310179510 A CN 202310179510A CN 116628531 A CN116628531 A CN 116628531A
- Authority
- CN
- China
- Prior art keywords
- clustering
- list
- area
- road object
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000003860 storage Methods 0.000 title claims abstract description 17
- 230000008569 process Effects 0.000 claims abstract description 4
- 239000007787 solid Substances 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 241000283070 Equus zebra Species 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 abstract description 21
- 230000002159 abnormal effect Effects 0.000 abstract description 10
- 238000009826 distribution Methods 0.000 abstract description 5
- 230000007547 defect Effects 0.000 abstract description 4
- 238000005259 measurement Methods 0.000 abstract description 2
- 230000000694 effects Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Remote Sensing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种众包地图道路对象要素聚类方法、系统及存储介质,根据改进的均值漂移算法,巧妙地将道路对象数据用其质心代表,根据不同类型的道路对象,选取不同的对象几何关系作为聚类的度量条件;根据道路要素数据类型的特点,在聚类过程中考虑了对象的邻域关系,最终得到不同道路要素类型的聚类输出。本方法巧妙地将对象数据转换为其质心作为聚类输入,并根据不同的场景灵活地使用其对象的多几何关系,拥有传统均值漂移算法的效率高、计算量小、不受异常点影响的优点,还加入了对象邻域关系,解决了传统均值漂移算法不适用于复杂数据分布类型的缺点。
Description
技术领域
本发明属于高精度地图技术领域,具体涉及一种众包地图道路对象要素聚类方法、系统及存储介质。
背景技术
在自动驾驶技术的发展过程中,需要借助高精度地图进行定位和规划。高精度地图提供了比传统地图更加精确的道路级别和车道级别的导航信息,能更好的服务于自动驾驶车辆。而基于众包地图的方法收集大量的众包道路的最新数据是为自动驾驶提供与现实世界保持一致性最好的方式。
高精度地图的成图主要包括了车端数据采集和云端数据成图两个方面。云端建图系统主要利用汽车搭载的多传感器回传的数据作为众包源,通过地图学习方式实现地图的实时增量变化。其中聚类是高精度地图生产中地图学习中的一环,其主要目的是将同一类型的多个对象数据聚类成一簇,为地图学习的后续步骤提供有效的结果输出,能够保证众包地图的增量地图数据与地图供应商地图数据可以进行周期性的交互更新。
常见的聚类算法有很多,各自都有一定的优缺点。针对K-means算法来说,K值的选取不好把握,对于不是凸的数据集比较难收敛。如果各隐含类别的数据不平衡,比如各隐含类别的数据量严重失衡,或者各隐含类别的方差不同,则聚类效果不佳。容易陷入局部最优,对噪音和异常点也非常敏感。
针对谱聚类算法来说,选择不同的相似矩阵构建方法会对结果有很大的影响,对参数的选择也比较敏感,其构建完成后还是需要基于K-means进行聚类,且仍具有上述问题。并且数据量较大时,构建相似性矩阵是非常耗费时间的,算法的算力不强。针对DBSCAN聚类算法来说,如果样本集的密度不均匀、聚类间距差相差很大时,聚类质量较差。如果样本集较大时,聚类收敛时间较长。针对传统的均值漂移聚类算法,只采用距离作为聚类判断,无法综合考虑复杂的实际道路环境。并且,对于一些稀疏和密集不显著区分的数据,聚类效果也不好。
目前,均值漂移的聚类算法大多应用于图像类数据,比如,专利文献CN104751185B公开的基于均值漂移遗传聚类的SAR图像变化检测方法,该方法的实现步骤为:(1)导入图像;(2)构造差异图像;(3)均值漂移滤波;(4)遗传模糊聚类;(5)分割差异图像;(6)输出结果。如专利文献CN105718942B公开的基于均值漂移和过采样的高光谱图像不平衡分类方法,该方法首先将高光谱图像的每一个像素点用特征向量表示,用主成分分析降维方法提取第一主成分高光谱图像;利用均值漂移算法得到分割图,对分割图块中的像素点光谱值求和做平均得到局部空间信息;随机选取原高光谱图像数据中的每一类别样本,对样本数少的类别采用SMOTE技术过采样预处理,然后对各个类别样本两两训练支持向量机;对分类超平面上由少数类和多数类训练的支持向量再次过采样;结合空谱信息对测试样本利用混合核支持向量机分类器得到分类图;最后由最大投票方法对分割图和分类图融合得到最终的分类结果。又如专利文献CN111695389A公开的一种车道线聚类方法及装置,该方法包括:获取车道线特征图像,将车道线特征图像中的像素点按照预设规则构成特征点集合;根据预设条件依次从特征点集合中的选取特征点组,并对特征点组进行横向聚类,生成各聚类组;分别计算各聚类组的聚类中心;根据预设车道线保留条件及各聚类中心与已有车道线集合的关系对已有车道线集合中的车道线进行更新,并返回根据预设条件将特征点集合中的特征点组进行横向聚类,生成各聚类组的步骤,直至遍历完特征点集合,得到车道线特征图像的聚类结果。以上方法虽然实现了车道线聚类方法,但其中心思想是通过获取车道线特征图像,从图像的视觉特征去进行聚类,不仅需要提前制定预设规则,同样也并不适用于所有类型的道路要素。因此,针对大量包含不同类型的众包道路对象数据,结合常见聚类算法的不足之处,找到一种聚类算法准确且快速的实现更好的聚类结果,是目前亟待解决的问题。
因此,有必要开发一种众包地图道路对象要素聚类方法、存储介质、设备及车辆。
发明内容
本发明的目的在于提供一种众包地图道路对象要素聚类方法、系统及存储介质,以提高算法的效率,且计算量小、不受异常点影响,能适用于多种数据分布类型的聚类。
第一方面,本发明所述的一种众包地图道路对象要素聚类方法,包括以下步骤:
S1:获取众包地图的道路对象数据,对道路对象要素进行归类,随机选择一种类型的道路对象数据,计算道路对象的质心坐标,并将位于同一类别的道路对象的质心坐标放入一列表type_dblist中;
S2:定义参数:设定初始聚类中心与聚类样本点之间的带宽距离band_width、相交面积与较小面积之比的阈值Inter0、两个质心坐标的距离阈值epsilon、较小面积与较大面积之比的阈值min_max0,以及cluster_id的初始值,其中,cluster_id为聚类类别标签;
S3:当列表type_dblist不为空时,在列表type_dblist中随机选择一个点作为初始的聚类中心,若该聚类中心为无效值,则结束此次循环,并重新选取一个点;否则将该聚类中心的质心坐标放入列表sample_count1,将该聚类中心的原始数据放入列表sample_count2;
S4:以聚类中心为圆心,带宽距离band_width为半径画圆,循环计算位于圆内的点与聚类中心之间的质心距离dis_e、相交面积与较小面积之比Inter、较小面积与较大面积之比min_max,将同时满足dis_e<epsilon,Inter<Inter0,且min_max<min_max0的圆内点的质心坐标和原始数据分别放入列表sample_count1、列表sample_count2中,循环完圆内点后,若列表sample_count1的长度大于预设长度,则根据列表sample_count1内的点计算平均偏移值,得到新的聚类中心;若当前的聚类中心与新的聚类中心之间的距离≥epsilon时,则进入步骤S5;反之,则以新的聚类中心为圆心,重复执行步骤S4;
S5:判断列表sample_count1的长度,若列表sample_count1的长度>预设长度,将聚类结果进行保存,将列表sample_count1、列表sample_count2存放的聚类结果分别对应放入列表groups1、列表groups2中,此时认为同属于第一个簇的样本已全部找到,将cluster_id增加1;若列表sample_count1的长度≤预设长度,则认为是异常点,不作为聚类成果存储进列表groups1、列表groups2中;最后将列表type_dblist与列表sample_count1作差,将作差后的结果作为新的列表type_dblist,循环步骤S3-S5,直到同一类型的所有的样本都聚类完成,并进入步骤S6;
S6:循环列表groups1,获取groups1中第一个簇的质心坐标,与其他任意簇的质心坐标进行欧式距离计算,若距离小于带宽距离band_width,则合并为同一簇,并取较长簇的cluster_id作为新的cluster_id;已经过合并的簇就不再进行下一次合并簇判断,直到列表groups1里面的簇都循环判断完一遍为止;
S7:至此当前道路对象要素的聚类结果已全部输出,再进行不同类型的最外层循环,循环步骤S1-S6,直到所有类型的样本均聚类完成。
可选地,所述步骤S1中,获取众包地图的道路对象数据,对道路对象要素进行归类,具体包括:
S11:采集众包地图道路要素对象数据,经数据清洗、数据标定得到道路对象要素;
S12:将道路对象要素按照预设对象要素分类规则进行归类,得到不同类型的道路对象数据。
可选地,所述步骤S4中,质心距离dis_e的计算方法,具体为:
假设当前的质心坐标点为d维空间中的X(x,x2,…,xi,…,xd),待聚类列表中的样本点为Y=[Y1,Y2,…,Yj,…,Yn],其中,n为样本数量,Yj(y,y2,…,yi…,yd);
则质心距离的计算公式如下:
其中,dis(X,Yj)表示质心距离。
可选地,所述步骤S4中,相交面积与最小面积之比Inter的计算方法为:
假设初始聚类中心对象的面积为area1,待聚类样本对象的面积为area2,两个对象的相交面积为intersection_area;
则两个对象的相交面积与较小面积之比Inter为:
Inter=intersection_area/min(area1,area2)。
可选地,所述步骤S4中,较小面积与较大面积之比min_max的计算方法为:
假设初始聚类中心对象的面积为area1,待聚类样本对象的面积为area2,两个对象的相交面积为intersection_area;
则两个对象的较小面积与较大面积之比min_max为:
min_max=min(area1,area2)/max(area1,area2)。
可选地,所述步骤S4中,计算新的聚类中心的方法如下:
new_center=numerator/denominator
其中,denominator为分母,numerator为分子,new_center为新的聚类中心。
可选地,所述步骤S6中,
假设列表groups1中有簇[C1,C2,…Ck,…,Cm],其中,Ck中存储了属于Ck簇所有样本点的质心坐标[ck1,ck2,…,ckt,…,ckp],计算Ck簇所有样本点的质心坐标平均值的公式如下:
其中,Cd_mean为Ck簇中所有样本点的质心坐标平均值;C为Ck簇中所有样本点的质心坐标的和。
可选地,如果d=2,则Ck簇的平均质心坐标为(x1_mean,x2_mean),如果d=3,则Ck簇的平均质心坐标为(x1_mean,x2_mean,x3_mean),以此类推,其中,d为维度。
可选地,对道路对象要素进行归类,具体为:
将道路对象按照对象的类型和子类型进行分类。
可选地,所述类型包括箭头、车线、地面标志、边界中的至少一种;
其中,箭头的子类型包括右转、直行+左转、直行+右转、左转+右转、左前方、右前方、直行+掉头、左转+掉头、左掉头、右掉头、禁止左转、禁止右转、禁止调头、禁止左转和右转、禁止左转和调头、禁止右转和调头、左转+直行+右转、左转+右转+调头中的至少一种;
车线的子类型包括虚拟线、细虚线段、粗虚线段、单虚线、单实线、双虚线、双实线、左实右虚线、右实左虚线、铺设边缘线、停止线、斑马线、减速带、停车让行线、导流线、停车位标线中的至少一种;
地面标志的子类型包括文字、地面限速中的至少一种;
边界的子类型包括护栏、路沿、栅栏、地理边界、墙体中的至少一种。
第二方面,本发明所述的一种众包地图道路对象要素聚类系统,包括处理器和存储器;其中,所述存储器内存储有计算机可读程序,所述计算机可读程序被处理器调用时,能执行如本发明所述的众包地图道路对象要素聚类方法的步骤。
第三方面,本发明所述的一种存储介质,其内存储有计算机可读程序,所述计算机可读程序被调用时,能执行如本发明所述的众包地图道路对象要素聚类方法的步骤。
本发明具有以下优点:
(1)由于本发明所采用的数据是多边形类型,本发明将复杂的多边形类型转换为质心进行表达,以便后续的聚类。
(2)常规的均值漂移算法一般只将距离作为判断,本发明在此基础上,将多边形对象转换为质心作为突破点,综合考虑质心的距离、相交面积与较小面积对象的比、较小面积与较大面积比等多几何关系实现对象数据的聚类。
(3)本发明改进的均值漂移算法能够很好地解决异常点以及极小簇的影响,对数据类型和数据分布也不敏感,聚类速度较快,能够较好地适用于复杂的道路对象要素数据。
(4)本发明还针对道路对象要素数据的特殊性,在聚类过程进行判断,不仅考虑对象之间的关系,还会扩大聚类对象的范围,综合考虑对象与其邻域对象之间的关系。
综上所述,本发明具有效率高,计算量小,且不受异常点影响的优点,能够适用于多种数据分布类型的聚类。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本实施例的流程图;
图2为本实施例中的不同类型道路对象要素聚类效果图。
具体实施方式
以下将结合附图对本发明进行详细的说明。
如图1所示,本实施例中,一种众包地图道路对象要素聚类方法,包括以下步骤:
S1:获取众包地图的道路对象数据,对道路对象要素进行归类,随机选择一种类型的道路对象数据,计算道路对象的质心坐标,并将位于同一类别的道路对象的质心坐标放入一列表type_dblist中。
所述步骤S1中,获取众包地图的道路对象数据,对道路对象要素进行归类,具体包括:
S11:采集众包地图道路要素对象数据,经数据清洗、数据标定得到道路对象要素;
S12:对道路对象要素进行归类,得到不同类型的道路对象数据。
其中,步骤S12中,将道路对象要素按照对象的类型和子类型进行分类。
其中,所述类型包括箭头、车线、地面标志、边界中的至少一种。其中,箭头的子类型包括右转、直行+左转、直行+右转、左转+右转、左前方、右前方、直行+掉头、左转+掉头、左掉头、右掉头、禁止左转、禁止右转、禁止调头、禁止左转和右转、禁止左转和调头、禁止右转和调头、左转+直行+右转、左转+右转+调头中的至少一种。车线的子类型包括虚拟线、细虚线段、粗虚线段、单虚线、单实线、双虚线、双实线、左实右虚线、右实左虚线、铺设边缘线、停止线、斑马线、减速带、停车让行线、导流线、停车位标线中的至少一种。地面标志的子类型包括文字、地面限速中的至少一种。边界的子类型包括护栏、路沿、栅栏、地理边界、墙体中的至少一种。
S2:定义参数:设定初始聚类中心与聚类样本点之间的带宽距离band_width、相交面积与较小面积之比的阈值Inter0、两个质心坐标的距离阈值epsilon、较小面积与较大面积之比的阈值min_max0,以及聚类类别标签cluster_id的初始值,一般将cluster_id的初始值设置为0。
S3:当列表type_dblist不为空时,在列表type_dblist中随机选择一个点作为初始的聚类中心,若该聚类中心为无效值,则结束此次循环,并重新选取一个点;否则将该聚类中心的质心坐标放入列表sample_count1,将该聚类中心的原始数据放入列表sample_count2。
S4:以聚类中心为圆心,带宽距离band_width为半径画圆,循环计算位于圆内的点与聚类中心之间的质心距离dis_e、相交面积与较小面积之比Inter、较小面积与较大面积之比min_max,将同时满足dis_e<epsilon,Inter<Inter0,且min_max<min_max0的圆内点的质心坐标和原始数据分别放入列表sample_count1、列表sample_count2中,循环完圆内点后,若列表sample_count1的长度大于预设长度,则根据列表sample_count1内的点计算平均偏移值,得到新的聚类中心;若当前的聚类中心与新的聚类中心之间的距离≥epsilon时,则进入步骤S5;反之,则以新的聚类中心为圆心,重复执行步骤S4。
在步骤S4中,质心距离dis_e的计算方法,具体为:
假设当前的质心坐标点为d维空间中的X(x,x2,…,xi,…,xd),i=1,2,...,d,待聚类列表中的样本点为Y=[Y1,Y2,…,Yj,…,Yn],j=1,2,...,n,其中,n为样本数量,Yj(y,y2,…,yi…,yd);
则质心距离的计算公式如下:
其中,dis(X,Yj)表示质心距离。
在步骤S4中,相交面积与最小面积之比Inter的计算方法为:
假设初始聚类中心对象的面积为area1,待聚类样本对象的面积为area2,两个对象的相交面积为intersection_area;
两个对象的相交面积与较小面积之比Inter为:
Inter=intersection_area/min(area1,area2)。
在步骤S4中,较小面积与较大面积之比min_max的计算方法为:
假设初始聚类中心对象的面积为area1,待聚类样本对象的面积为area2,两个对象的相交面积为intersection_area;
两个对象的较小面积与较大面积之比min_max为:
min_max=min(area1,area2)/max(area1,area2)。
在步骤S4中,计算新的聚类中心的方法如下:
为了让低维的不可分数据变成高维可分,本实施例中采用高斯核函数将其映射到高维空间,通过均值漂移公式计算出新的聚类中心点,具体为:
new_center=numerator/denominator
其中,denominator为分母,numerator为分子,new_center为新的聚类中心。
S5:为了排除异常点以及随机选取初始点对聚类效果的影响,本实施例中加入了簇内样本数目的判断,若列表sample_count1的长度>预设长度,将聚类结果进行保存,将列表sample_count1、列表sample_count2存放的聚类结果分别对应放入列表groups1、列表groups2中,此时认为同属于第一个簇的样本已全部找到,将cluster_id增加1;若列表sample_count1的长度≤预设长度,则认为是异常点,进行舍弃处理,不作为聚类成果存储进列表groups1、列表groups2中;最后将列表type_dblist与列表sample_count1作差,将作差后的结果作为新的列表type_dblist,循环步骤S3-S5,直到同一类型的所有的样本都聚类完成,并进入步骤S6。
本实施例中,预设长度一般设置为3,至少3个样本成簇,当然亦可根据实际需求调整预设长度的值。
S6:循环列表groups1,获取groups1中第一个簇的质心坐标,与其他任意簇的质心坐标进行欧式距离计算,若距离小于带宽距离band_width,则合并为同一簇,并取较长簇的cluster_id作为新的cluster_id;已经过合并的簇就不再进行下一次合并簇判断,直到列表groups1里面的簇都循环判断完一遍为止。
在步骤S6中,假设列表groups1中有簇[C1,C2,…Ck,…,Cm],其中,Ck中存储了属于Ck簇所有样本点的质心坐标[ck1,ck2,…,ckt,…,ckp],计算Ck簇所有样本点的质心坐标平均值的公式如下:
其中,Cd_mean为Ck簇中所有样本点的质心坐标平均值;C为Ck簇中所有样本点的质心坐标的和。
如果d=2,则Ck簇的平均质心坐标为(x1_mean,x2_mean),如果d=3,则Ck簇的平均质心坐标为(x1_mean,x2_mean,x3_mean),以此类推,其中,d为维度。
S7:至此当前道路对象要素的聚类结果已全部输出,再进行不同类型的最外层循环,循环步骤S1-S6,直到所有类型的样本均聚类完成。
本方法用于众包地图道路对象要素,通过巧妙地将道路对象要素转换为质心表示,灵活选取其对象的多几何关系组合成新的距离权重,算法效率高,能够很好地解决异常点以及极小簇的影响,通过灵活地选择距离权重,能够较好地适用于复杂的道路对象要素数据。
本实施例中,每一种道路要素都由多个多边形对象组成,单个多边形对象的主要数据标签构成是:类型+子类型+几何经纬度坐标;
本实施例中道路对象几何关系判别因素,包括质心距离、对象相交面积与最小面积之比Inter,以及最小面积与最大面积之比min_max。
如图2所示,为本方法所述的一种众包地图道路对象要素聚类方法的效果图。以箭头、车线两种类型的道路对象要素为例。经过本方法聚类后能够输出很好的聚类效果。
本方法针对道路要素数据的特殊性及现有聚类算法的不足,提供了一种众包地图道路对象要素聚类方法。该方法根据改进的均值漂移算法,巧妙地将道路对象polygon类型数据用其质心代表,根据不同类型的道路对象,选取不同的对象几何关系作为聚类的度量条件。根据道路要素数据类型的特点,在聚类过程中还考虑了对象的邻域关系,最终得到不同道路要素类型的聚类输出。本方法巧妙地将对象数据转换为其质心作为聚类输入,并根据不同的场景灵活地使用其对象的多几何关系,拥有传统均值漂移算法的效率高、计算量小、不受异常点影响的优点,还加入了对象邻域关系,解决了传统均值漂移算法不适用于复杂数据分布类型的缺点。
本实施例中,一种众包地图道路对象要素聚类系统,包括处理器和存储器;其中,所述存储器内存储有计算机可读程序,所述计算机可读程序被处理器调用时,能执行如本实施例中所述的众包地图道路对象要素聚类方法的步骤。
本实施例中,一种存储介质,其内存储有计算机可读程序,所述计算机可读程序被调用时,能执行如本实施例中所述的众包地图道路对象要素聚类方法的步骤。
需要说明的是,本实施例所示的存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(ErasableProgrammable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本实施例中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (12)
1.一种众包地图道路对象要素聚类方法,其特征在于,包括以下步骤:
S1:获取众包地图的道路对象数据,对道路对象要素进行归类,随机选择一种类型的道路对象数据,计算道路对象的质心坐标,并将位于同一类别的道路对象的质心坐标放入一列表type_dblist中;
S2:设定初始聚类中心与聚类样本点之间的带宽距离band_width、相交面积与较小面积之比的阈值Inter0、两个质心坐标的距离阈值epsilon、较小面积与较大面积之比的阈值min_max0,以及聚类类别标签cluster_id的初始值;
S3:当列表type_dblist不为空时,在列表type_dblist中随机选择一个点作为初始的聚类中心,若该聚类中心为无效值,则结束此次循环,并重新选取一个点;否则将该聚类中心的质心坐标和原始数据分别放入列表sample_count1、列表sample_count2;
S4:以聚类中心为圆心,带宽距离band_width为半径画圆,循环计算位于圆内的点与聚类中心之间的质心距离dis_e、相交面积与较小面积之比Inter、较小面积与较大面积之比min_max,将同时满足dis_e<epsilon,Inter<Inter0,且min_max<min_max0的圆内点的质心坐标和原始数据分别放入列表sample_count1、列表sample_count2中,循环完圆内点后,若列表sample_count1的长度>预设长度,则根据列表sample_count1内的点计算平均偏移值,得到新的聚类中心;若当前的聚类中心与新的聚类中心之间的距离≥epsilon时,则进入步骤S5;反之,则以新的聚类中心为圆心,重复执行步骤S4;
S5:若列表sample_count1的长度>预设长度,将列表sample_count1、列表sample_count2存放的聚类结果分别对应放入列表groups1、列表groups2中,将cluster_id增加1;若列表sample_count1的长度≤预设长度,则不作为聚类成果存储进列表groups1、列表groups2中;将列表type_dblist与列表sample_count1作差,将作差后的结果作为新的列表type_dblist,循环步骤S3-S5,直到同一类型的所有的样本都聚类完成;
S6:获取列表groups1中第一个簇的质心坐标,与其他任意簇的质心坐标进行欧式距离计算,若距离小于带宽距离band_width,则合并为同一簇,并取较长簇的cluster_id作为新的cluster_id;循环列表groups1,直到列表groups1中的簇均判断完为止;
S7:循环步骤S1-S6,直到所有类型的样本均聚类完成。
2.根据权利要求1所述的众包地图道路对象要素聚类方法,其特征在于:所述步骤S1中,获取众包地图的道路对象数据,对道路对象要素进行归类,具体包括:
S11:采集众包地图道路要素对象数据,经数据清洗、数据标定得到道路对象要素;
S12:将道路对象要素按照预设对象要素分类规则进行归类,得到不同类型的道路对象数据。
3.根据权利要求1或2所述的众包地图道路对象要素聚类方法,其特征在于:所述步骤S4中,质心距离dis_e的计算方法,具体为:
假设当前的质心坐标点为d维空间中的X(x,x2,...,xi,...,xd),i=1,2,...,d,待聚类列表中的样本点为Y=[Y1,Y2,...,Yj,...,Yn],j=1,2,...,n,其中,n为样本数量,Yj(y,y2,...,yi...,yd);
则质心距离的计算公式如下:
其中,dis(X,Yj)表示质心距离。
4.根据权利要求1或2所述的众包地图道路对象要素聚类方法,其特征在于:所述步骤S4中,相交面积与最小面积之比Inter的计算方法为:
假设初始聚类中心对象的面积为area1,待聚类样本对象的面积为area2,两个对象的相交面积为intersection_area;
两个对象的相交面积与较小面积之比Inter为:
Inter=intersection_area/min(area1,area2)。
5.根据权利要求1或2所述的众包地图道路对象要素聚类方法,其特征在于:所述步骤S4中,较小面积与较大面积之比min_max的计算方法为:
假设初始聚类中心对象的面积为area1,待聚类样本对象的面积为area2,两个对象的相交面积为intersection_area;
两个对象的较小面积与较大面积之比min_max为:
min-max=min(area1,area2)/max(area1,area2)。
6.根据权利要求3所述的众包地图道路对象要素聚类方法,其特征在于:所述步骤S4中,计算新的聚类中心的方法如下:
new_center=numerator/denominator
其中,denominator为分母,numerator为分子,new_center为新的聚类中心。
7.根据权利要求1或2或6所述的众包地图道路对象要素聚类方法,其特征在于:所述步骤S6中,
假设列表groups1中有簇[C1,C2,...Ck,...,Cm],其中,Ck中存储了属于Ck簇所有样本点的质心坐标[ck1,ck2,...,ckt,...,ckp],计算Ck簇所有样本点的质心坐标平均值的公式如下:
其中,Cd_mean为Ck簇中所有样本点的质心坐标平均值;C为Ck簇中所有样本点的质心坐标的和。
8.根据权利要求7所述的众包地图道路对象要素聚类方法,其特征在于:如果d=2,则Ck簇的平均质心坐标为(x1_mean,x2_mean),如果d=3,则Ck簇的平均质心坐标为(x1_mean,x2_mean,x3_mean),以此类推,其中,d为维度。
9.根据权利要求2所述的众包地图道路对象要素聚类方法,其特征在于:对道路对象要素进行归类,具体为:
将道路对象要素按照对象的类型和子类型进行分类。
10.根据权利要求9所述的众包地图道路对象要素聚类方法,其特征在于:所述类型包括箭头、车线、地面标志、边界中的至少一种;
其中,箭头的子类型包括右转、直行+左转、直行+右转、左转+右转、左前方、右前方、直行+掉头、左转+掉头、左掉头、右掉头、禁止左转、禁止右转、禁止调头、禁止左转和右转、禁止左转和调头、禁止右转和调头、左转+直行+右转、左转+右转+调头中的至少一种;
车线的子类型包括虚拟线、细虚线段、粗虚线段、单虚线、单实线、双虚线、双实线、左实右虚线、右实左虚线、铺设边缘线、停止线、斑马线、减速带、停车让行线、导流线、停车位标线中的至少一种;
地面标志的子类型包括文字、地面限速中的至少一种;
边界的子类型包括护栏、路沿、栅栏、地理边界、墙体中的至少一种。
11.一种众包地图道路对象要素聚类系统,其特征在于:包括处理器和存储器;其中,所述存储器内存储有计算机可读程序,所述计算机可读程序被处理器调用时,能执行如权利要求1至10任一所述的众包地图道路对象要素聚类方法的步骤。
12.一种存储介质,其特征在于:其内存储有计算机可读程序,所述计算机可读程序被调用时,能执行如权利要求1至10任一所述的众包地图道路对象要素聚类方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310179510.9A CN116628531A (zh) | 2023-02-28 | 2023-02-28 | 众包地图道路对象要素聚类方法、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310179510.9A CN116628531A (zh) | 2023-02-28 | 2023-02-28 | 众包地图道路对象要素聚类方法、系统及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116628531A true CN116628531A (zh) | 2023-08-22 |
Family
ID=87612255
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310179510.9A Pending CN116628531A (zh) | 2023-02-28 | 2023-02-28 | 众包地图道路对象要素聚类方法、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116628531A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117539971A (zh) * | 2024-01-10 | 2024-02-09 | 深圳市易甲文技术有限公司 | 一种海量地理坐标聚合方法及相关设备 |
-
2023
- 2023-02-28 CN CN202310179510.9A patent/CN116628531A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117539971A (zh) * | 2024-01-10 | 2024-02-09 | 深圳市易甲文技术有限公司 | 一种海量地理坐标聚合方法及相关设备 |
CN117539971B (zh) * | 2024-01-10 | 2024-04-26 | 深圳市易甲文技术有限公司 | 一种海量地理坐标聚合方法及相关设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111091105B (zh) | 基于新的边框回归损失函数的遥感图像目标检测方法 | |
CN110728658A (zh) | 一种基于深度学习的高分辨率遥感影像弱目标检测方法 | |
CN103366602B (zh) | 从数字摄像头图像确定停车场占用情况的方法 | |
CN109871875B (zh) | 一种基于深度学习的建筑物变化检测方法 | |
CN112016605B (zh) | 一种基于边界框角点对齐和边界匹配的目标检测方法 | |
CN109493119B (zh) | 一种基于poi数据的城市商业中心识别方法及系统 | |
CN109635733B (zh) | 基于视觉显著性和队列修正的停车场和车辆目标检测方法 | |
CN113836999A (zh) | 基于探地雷达的隧道施工风险智能识别方法及系统 | |
Zhao et al. | Abnormal trajectory detection based on a sparse subgraph | |
CN111414878B (zh) | 一种关于地块的社会属性分析、图像处理方法及装置 | |
CN106845458A (zh) | 一种基于核超限学习机的快速交通标识检测方法 | |
CN110909656B (zh) | 一种雷达与摄像机融合的行人检测方法和系统 | |
CN116628531A (zh) | 众包地图道路对象要素聚类方法、系统及存储介质 | |
CN113269156B (zh) | 一种基于多尺度特征融合的信号灯检测识别方法及系统 | |
CN113378642B (zh) | 一种对农村违法占地建筑物进行检测的方法 | |
CN112164087B (zh) | 基于边缘约束和分割边界搜索的超像素分割方法及装置 | |
CN112348750B (zh) | 基于阈值融合和邻域投票的sar图像变化检测方法 | |
CN106548195A (zh) | 一种基于改进型hog‑ulbp特征算子的目标检测方法 | |
CN112200248B (zh) | 一种基于dbscan聚类的城市道路环境下的点云语义分割方法、系统及存储介质 | |
CN110765900A (zh) | 一种基于dssd的自动检测违章建筑方法及系统 | |
CN104616302A (zh) | 一种目标实时识别方法 | |
Zhang et al. | Urban vehicle extraction from aerial laser scanning point cloud data | |
Zou et al. | Inertia mutation energy model to extract roads by crowdsourcing trajectories | |
CN114022772B (zh) | 流动摊贩空间分布的预测方法、系统、装置和存储介质 | |
CN117591614A (zh) | 基于多源数据和emd距离的地理区域相似度评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |