CN117953252B - 高速公路资产数据自动化采集方法及系统 - Google Patents
高速公路资产数据自动化采集方法及系统 Download PDFInfo
- Publication number
- CN117953252B CN117953252B CN202410349621.4A CN202410349621A CN117953252B CN 117953252 B CN117953252 B CN 117953252B CN 202410349621 A CN202410349621 A CN 202410349621A CN 117953252 B CN117953252 B CN 117953252B
- Authority
- CN
- China
- Prior art keywords
- image
- segment
- cluster
- center
- current
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 99
- 239000012634 fragment Substances 0.000 claims abstract description 419
- 238000012512 characterization method Methods 0.000 claims description 78
- 238000003491 array Methods 0.000 claims description 47
- 239000011295 pitch Substances 0.000 claims description 30
- 238000013480 data collection Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 9
- 230000004927 fusion Effects 0.000 claims description 9
- 230000007306 turnover Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 abstract description 49
- 238000001514 detection method Methods 0.000 abstract description 12
- 238000011897 real-time detection Methods 0.000 abstract description 2
- 238000004364 calculation method Methods 0.000 description 38
- 238000000926 separation method Methods 0.000 description 36
- 238000012545 processing Methods 0.000 description 29
- 238000004422 calculation algorithm Methods 0.000 description 26
- 239000013598 vector Substances 0.000 description 26
- 238000007621 cluster analysis Methods 0.000 description 15
- 238000004458 analytical method Methods 0.000 description 14
- 238000010606 normalization Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 6
- 238000012544 monitoring process Methods 0.000 description 6
- 238000007792 addition Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010191 image analysis Methods 0.000 description 2
- 238000000691 measurement method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000011425 standardization method Methods 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本申请提供一种高速公路资产数据自动化采集方法及系统,获得新增图像片段集合中的多个新增图像片段时,获取根据多个新增图像片段划簇获得的当下片段聚类中心集合和表征过往划簇结果的过往图像片段聚类中心集合,以及通过过往图像片段聚类中心集合和当下片段聚类中心集合迭代得到目标图像片段簇中心集合,以基于聚类中心的对比和迭代获得最新的划簇结果,防止基于过往划簇获得的多个图像片段簇中的初始片段与新增图像片段进行比较和划簇,使得划簇的速度得到提升。此外,可以杜绝基于过往划簇获得的所有初始片段和新增加的片段的比较,缓解比较过程的数据量和实现流程,增加可疑资产图像片段的检测速度,完成高速公路道路资产高效自动化实时检测。
Description
技术领域
本申请涉及数据处理领域,具体而言,涉及一种高速公路资产数据自动化采集方法及系统。
背景技术
随着高速公路建设的不断发展和完善,对道路资产的维护和管理提出了越来越高的要求。传统的道路维护方法往往依赖于人工巡检和定期检测,不仅效率低下,而且难以保证检测的全面性和及时性。近年来,随着图像处理和机器学习技术的飞速发展,基于图像流的高速公路自动化检测逐渐成为研究热点。在高速公路自动化检测领域,如何实时、准确地从海量的图像流数据中识别出潜在的道路问题或资产异常是一项极具挑战性的任务。传统的图像处理方法往往难以应对复杂多变的道路环境和光照条件,而机器学习技术虽然在一定程度上提高了识别准确率,但仍面临着计算复杂度高、实时性差等问题。
发明内容
本发明的目的在于提供一种高速公路资产数据自动化采集方法及系统。
本申请实施例是这样实现的:
第一方面,本申请实施例提供了一种高速公路资产数据自动化采集方法,所述方法包括:获取对目标高速公路图像流采集到的新增图像片段集合,其中,所述新增图像片段集合中包括从所述目标高速公路图像流采集到的多个新增图像片段,所述新增图像片段中包括目标道路的依据拍摄时序排列的多个道路拍摄图像;获取所述新增图像片段集合对应的当下片段聚类中心集合,以及基于在所述新增图像片段集合之前对所述目标高速公路图像流的过往图像片段集合获取到的过往图像片段聚类中心集合,其中,所述当下片段聚类中心集合用以表征对所述新增图像片段集合中各个新增图像片段的划簇结果,所述过往图像片段聚类中心集合用以表征对所述过往图像片段集合中各个过往图像片段的划簇结果,所述当下片段聚类中心集合中包括的多个当前聚类中心和所述过往图像片段聚类中心集合中包括的多个过往图像片段聚类中心分别用以表征一个图像片段簇;在基于所述当下片段聚类中心集合对所述过往图像片段聚类中心集合迭代得到目标图像片段簇中心集合之后,将所述新增图像片段集合中的每个所述新增图像片段分别与所述目标图像片段簇中心集合中包括的多个目标图像片段簇中心进行计算,获得与每个所述新增图像片段配对的目标片段空间间距;将所述目标片段空间间距大于预设片段空间间距的所述新增图像片段确定为可疑资产图像片段。
可选地,在将所述新增图像片段集合中的每个所述新增图像片段分别与所述目标图像片段簇中心集合中包括的多个目标图像片段簇中心进行计算,获得与每个所述新增图像片段配对的目标片段空间间距之前,还包括:分别获取所述当下片段聚类中心集合中的每一所述当下片段聚类中心,与所述过往图像片段聚类中心集合中的每一所述过往图像片段聚类中心之间的中心间距;在所述过往图像片段聚类中心集合中包括所述中心间距小于聚类中心间距临界值的过往图像片段聚类中心时,将所述当下片段聚类中心对应的当下图像片段簇中的多个所述新增图像片段融入到所述过往图像片段聚类中心对应的过往图像片段簇,获得迭代后的所述过往图像片段簇,其中,所述过往图像片段聚类中心集合中的每一所述过往图像片段聚类中心分别对应于一个所述聚类中心间距临界值;在所述过往图像片段聚类中心集合中不包括所述中心间距小于聚类中心间距临界值的过往图像片段聚类中心时,将所述当下片段聚类中心对应的当下图像片段簇作为所述过往图像片段簇中新增的所述过往图像片段簇;将迭代后的过往图像片段簇集合中的过往图像片段簇分别对应的图像片段簇中心确定为所述目标图像片段簇中心集合中的所述目标图像片段簇中心。
可选地,所述将迭代后的过往图像片段簇集合中的过往图像片段簇分别对应的图像片段簇中心确定为所述目标图像片段簇中心集合中的所述目标图像片段簇中心,包括:在迭代后的所述过往图像片段簇集合中的目标过往图像片段簇中包括多个所述过往图像片段和所述当下图像片段簇中的多个所述新增图像片段时,分别获取所述当下图像片段簇中的多个所述新增图像片段对应的片段表征数组,与所述片段表征数组的翻转数组的数量积,以及基于多个所述新增图像片段分别对应的数量积和确定为与多个所述新增图像片段对应的新增表征结果;根据所述目标过往图像片段簇中包括的所述过往图像片段对应的过往表征结果,和所述新增表征结果确定所述目标过往图像片段簇对应的所述目标图像片段簇中心;在迭代后的所述过往图像片段簇集合中的目标过往图像片段簇中仅包含所述当下图像片段簇中的多个所述当下片段时,分别获取所述当下图像片段簇中的多个所述新增图像片段对应的片段表征数组,与所述片段表征数组的翻转数组的数量积,以及基于多个所述新增图像片段分别对应的数量积和确定为与多个所述新增图像片段对应的当下表征结果;根据所述当下表征结果确定所述目标过往图像片段簇对应的所述目标图像片段簇中心;其中,所述目标过往图像片段簇中的多个片段分别对应的所述片段表征数组与所述目标图像片段簇中心对应的聚类中心数组之间的数组间距的和值不大于对照间距临界值。
可选地,所述将迭代后的过往图像片段簇集合中的过往图像片段簇分别对应的图像片段簇中心确定为所述目标图像片段簇中心集合中的所述目标图像片段簇中心时,还包括:在迭代后的所述过往图像片段簇集合中的目标过往图像片段簇中包括多个所述过往图像片段和所述当下图像片段簇中的多个所述新增图像片段时,获取所述当下图像片段簇中的多个所述新增图像片段分别的片段表征数组分别与所述当下片段聚类中心对应的聚类中心数组的数组间距的数组间距和值;获取所述目标过往图像片段簇对应的所述聚类中心间距临界值,并获取与所述当下片段聚类中心对应的第一影响变量,以及与所述过往图像片段聚类中心对应的第二影响变量;根据所述第一影响变量与所述数组间距和值的第一相乘结果,以及所述第二影响变量与所述聚类中心间距临界值的第二相乘结果确定所述目标图像片段簇中心对应的聚类中心间距临界值;在迭代后的所述过往图像片段簇集合中的目标过往图像片段簇中仅包含所述当下图像片段簇中的多个所述当下片段时,获取所述当下图像片段簇中的多个所述新增图像片段分别的片段表征数组分别与所述当下片段聚类中心对应的聚类中心数组的数组间距的数组间距和值;将所述数组间距和值确定为所述目标图像片段簇中心对应的聚类中心间距临界值。
可选地,所述将所述新增图像片段集合中的每个所述新增图像片段分别与所述目标图像片段簇中心集合中包括的多个目标图像片段簇中心进行计算,获得与每个所述新增图像片段配对的目标片段空间间距,包括:获取与所述目标图像片段簇中心集合中包括的多个所述目标图像片段簇中心分别对应的空间间距影响变量;获取所述新增图像片段集合中的一个所述新增图像片段作为当前新增图像片段,对以下操作进行重复直到游走完当前新增图像片段集合中的每一所述新增图像片段:分别获取所述当前新增图像片段与多个所述目标图像片段簇中心之间的对照片段空间间距;根据多个目标图像片段簇中心分别对应的空间间距影响变量和获取的多个所述对照片段空间间距确定所述当前新增图像片段配对的所述目标片段空间间距。
可选地,所述分别获取所述当前新增图像片段与多个所述目标图像片段簇中心之间的对照片段空间间距,包括:在多个所述目标图像片段簇中心中逐一获取一个所述目标图像片段簇中心作为一个当下片段聚类中心,对以下操作进行重复直到游走完多个所述目标图像片段簇中心:获取与所述当下片段聚类中心配对的当下片段聚类中心子集,所述当下片段聚类中心子集中包括所述当下片段聚类中心和多个对照图像片段簇中心,所述对照图像片段簇中心为分布位置处在所述当下片段聚类中心之前的目标图像片段簇中心;分别获取所述当前新增图像片段对应的片段表征数组与所述当下片段聚类中心子集中的多个图像片段簇中心分别对应的聚类中心数组之间的闵可夫斯基距离;将获取的多个所述闵可夫斯基距离中最小的结果确定为所述当前新增图像片段与所述当下片段聚类中心之间的所述对照片段空间间距。
可选地,所述根据多个目标图像片段簇中心分别对应的空间间距影响变量和获取的多个所述对照片段空间间距确定所述当前新增图像片段配对的所述目标片段空间间距,包括:根据多个目标图像片段簇中心分别对应的空间间距影响变量获取多个所述对照片段空间间距的调节融合值确定所述当前新增图像片段配对的第一片段空间间距;根据每个所述新增图像片段分别对应的所述调节融合值对所述第一片段空间间距进行标准化,获得与当前新增图像片段配对的所述目标片段空间间距。
可选地,所述根据多个目标图像片段簇中心分别对应的空间间距影响变量和获取的多个所述对照片段空间间距确定所述当前新增图像片段配对的所述目标片段空间间距之后,所述方法还包括:逐一获取所述目标图像片段簇中心集合中的一个所述目标图像片段簇中心作为当下片段聚类中心,对以下操作进行重复直到游走完所述目标图像片段簇中心集合中的多个所述目标图像片段簇中心;获取所述当下片段聚类中心对应的聚类中心数组的范数平方;分别获取所述当下片段聚类中心对应的所述聚类中心数组,与所述目标图像片段簇中心集合中的其余所述目标图像片段簇中心对应的所述聚类中心数组之间的数组间距的和值;根据所述范数平方与所述数组间距的和值之间的商确定所述当下片段聚类中心迭代后的所述空间间距影响变量。
可选地,所述根据所述范数平方与所述数组间距的和值之间的商确定所述当下片段聚类中心迭代后的所述空间间距影响变量,包括:在所述当下片段聚类中心对应的图像片段簇中包括了所述新增图像片段集合中的所述新增图像片段时,将所述范数平方和所述数组间距的和值之间的商确定为对照影响变量;获取第一迭代速度变量,所述迭代速度变量的取值范围为[0,1];将所述第一迭代速度变量与所述对照影响变量的相乘结果,以及第二迭代速度变量与所述当下片段聚类中心对应的所述空间间距影响变量的相乘结果的相加值作为所述当下片段聚类中心迭代后的所述空间间距影响变量,其中,所述第二迭代速度变量与所述第一迭代速度变量的和值等于1。
可选地,所述根据所述范数平方与所述数组间距的和值之间的商确定所述当下片段聚类中心迭代后的所述空间间距影响变量,包括:在所述当下片段聚类中心对应的图像片段簇中不包含所述新增图像片段集合中的所述新增图像片段时,将所述范数平方和所述数组间距的和值之间的商确定为对照影响变量,并获取与所述当下片段聚类中心对应的缓释变量,其中,所述缓释变量为对第一采集时刻和第二采集时刻之间的差值进行求倒的结果,所述第一采集时刻为所述新增图像片段集合对应的采集时刻,所述第二采集时刻为所述当下片段聚类中心对应的过往图像片段簇中最末一次添加所述过往图像片段对应的采集时刻;获取第一迭代速度变量,所述迭代速度变量的取值范围为[0,1];将所述第一迭代速度变量、所述缓释变量与所述对照影响变量的相乘结果,以及第二迭代速度变量与所述当下片段聚类中心对应的所述空间间距影响变量的相乘结果的相加值作为所述当下片段聚类中心迭代后的所述空间间距影响变量,其中,所述第二迭代速度变量与所述第一迭代速度变量的和值等于1。
可选地,所述将所述目标片段空间间距大于预设片段空间间距的所述新增图像片段确定为可疑资产图像片段之后,还包括:获取对目标高速公路图像流采集到的与目标采集时刻对应的新增图像片段集合,其中,所述新增图像片段集合中包括采集时刻在所述目标采集时刻指示的目标时刻后的多个新增图像片段;将与目标采集时刻对应的所述新增图像片段集合中所述目标片段空间间距大于所述预设片段空间间距的所述新增图像片段确定为所述可疑资产图像片段。
第二方面,本申请提供一种高速公路资产数据自动化采集系统,包括: 一个或多个处理器;存储器;一个或多个计算机程序;其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个计算机程序被所述处理器执行时,实现如上所述的方法。
本申请的有益效果至少包括:本申请基于获取对目标高速公路图像流采集到的新增图像片段集合,新增图像片段集合中包括从目标高速公路图像流采集到的多个新增图像片段;获取新增图像片段集合对应的当下片段聚类中心集合,以及基于在新增图像片段集合之前对目标高速公路图像流的过往图像片段集合获取到的过往图像片段聚类中心集合,当下片段聚类中心集合用以表征对新增图像片段集合中各个新增图像片段的划簇结果,过往图像片段聚类中心集合用以表征对过往图像片段集合中各个过往图像片段的划簇结果;在基于当下片段聚类中心集合对过往图像片段聚类中心集合迭代得到目标图像片段簇中心集合之后,将新增图像片段集合中的每个新增图像片段分别与目标图像片段簇中心集合中包括的多个目标图像片段簇中心进行计算,获得与每个新增图像片段配对的目标片段空间间距;将目标片段空间间距大于预设片段空间间距的新增图像片段确定为可疑资产图像片段,以完成对高速公路的自动化道路维护检测。
在上述高速公路资产数据自动化采集方法中,获取到新增图像片段集合中的多个新增图像片段时,先获取根据多个新增图像片段划簇获得的当下片段聚类中心集合和表征过往划簇结果的过往图像片段聚类中心集合,以及通过过往图像片段聚类中心集合和当下片段聚类中心集合迭代得到目标图像片段簇中心集合,以基于聚类中心的对比和迭代获得最新的划簇结果,防止基于过往划簇获得的多个图像片段簇中的初始片段与新增图像片段进行比较和划簇,使得划簇的速度得到提升。此外,通过表征最新的划簇结果的目标图像片段簇中心集合与新增图像片段集合中的多个新增图像片段进行计算,以确定得到可疑资产图像片段,杜绝基于过往划簇获得的所有初始片段和新增加的片段的比较,大大缓解比较过程的数据量和实现流程,在增加划簇速度的前提下,增加了可疑资产图像片段的检测速度,完成高速公路道路资产高效自动化实时检测。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1是本申请实施例提供的一种高速公路资产数据自动化采集方法的流程图。
图2是本申请实施例提供的一种高速公路资产数据自动化采集系统的组成示意图。
具体实施方式
下面结合本申请实施例中的附图对本申请实施例进行描述。本申请实施例的实施方式部分使用的术语仅用于对本申请的具体实施例进行解释,而非旨在限定本申请。
本申请实施例中高速公路资产数据自动化采集方法的执行主体为高速公路资产数据自动化采集系统,包括但不限于服务器、个人电脑、笔记本电脑、平板电脑、智能手机等。服务器包括但不限于单个网络服务器、多个网络服务器组成的服务器组或于云计算的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,高速公路资产数据自动化采集系统可单独运行来实现本申请,也可接入网络并通过与网络中的其他高速公路资产数据自动化采集系统的交互操作来实现本申请。其中,高速公路资产数据自动化采集系统所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
本申请实施例提供了一种高速公路资产数据自动化采集方法,如图1所示,该方法包括:
步骤S110:获取对目标高速公路图像流采集到的新增图像片段集合,其中,新增图像片段集合中包括从目标高速公路图像流采集到的多个新增图像片段,新增图像片段中包括目标道路的依据拍摄时序排列的多个道路拍摄图像。
步骤S110中,目标高速公路图像流是指从特定的高速公路监控系统(例如无人机、道路监控等)中持续获取的一系列图像数据,它们以流的形式传输,类似于视频流,但可以是由一系列静态图像组成。这些图像数据通常由沿高速公路分布的摄像头或者无人机捕获,用于实时监控道路状况。例如,无人机沿道路A飞行,每0.1S拍摄一张道路的照片,这些照片通过流的形式发送给后台的数据处理终端(即本申请中的高速公路资产数据自动化采集系统),可以理解,无人机飞行的速度以及拍摄的频率决定了一段高速公路被拍摄的照片的数量和依据对应的照片识别出的结果精度。
新增图像片段集合是指在一定时间段内从目标高速公路图像流中新采集到的一组图像片段。每个图像片段包含多张按时间顺序排列的图像,而集合则是这些片段的汇总。新增图像片段是指从图像流中按照一定规则(如时间顺序)提取并组合成的一组图像。每个片段通常包含固定数量的图像,这些图像共同反映了在特定时间段内高速公路的对应部分的状况。拍摄时序指图像拍摄的顺序。
回到步骤S110的方案,步骤S110的核心在于对连续拍摄的图像进行有序组织和划分,以形成多个图像片段,这些片段将作为后续分析和处理的基础。
具体来说,高速公路资产数据自动化采集系统首先接入目标高速公路的图像流,这是一个持续传输的图像数据序列,可能来源于无人机拍摄、道路监控摄像头或其他图像采集设备。这些图像按照拍摄的时间顺序排列,构成了对高速公路实时状况的视觉记录。
在获取图像流之后,高速公路资产数据自动化采集系统根据预设的片段长度对图像进行切割和组合。片段长度决定了每个图像片段中包含的图像数量。以片段长度为3为例,高速公路资产数据自动化采集系统从图像流中依次提取连续的三张图像,并将它们组合成一个图像片段。这个过程会沿着图像流的时间轴持续推进,生成一系列新增的图像片段。这些新增的图像片段被收集到一个集合中,称为新增图像片段集合。每个新增图像片段都保留了其原始图像的拍摄时序信息,这对于后续分析道路状况的变化和识别异常至关重要。
举例来说,如果目标高速公路图像流总共包括10个连续拍摄的图像,标记为1至10。当设定片段长度为3时,高速公路资产数据自动化采集系统按照拍摄时序依次提取并组合图像,形成如下新增图像片段:123、234、345、456、567、678、789和8910。这些片段构成了一个包含8个新增图像片段的集合。需要注意的是,这里的图像片段并不是简单地对原始图像进行裁剪或缩放,而是保留了原始图像的完整信息,并以一种有序的方式将它们组合在一起。这种组合方式有助于在后续步骤中通过比较和分析不同图像片段之间的差异来识别道路状况的变化和异常。
步骤S120:获取新增图像片段集合对应的当下片段聚类中心集合,以及基于在新增图像片段集合之前对目标高速公路图像流的过往图像片段集合获取到的过往图像片段聚类中心集合。
其中,当下片段聚类中心集合用以表征对新增图像片段集合中各个新增图像片段的划簇结果,过往图像片段聚类中心集合用以表征对过往图像片段集合中各个过往图像片段的划簇结果,当下片段聚类中心集合中包括的多个当前聚类中心和过往图像片段聚类中心集合中包括的多个过往图像片段聚类中心分别用以表征一个图像片段簇。
步骤S120在高速公路资产数据自动化抽取方法中,涉及对图像片段进行聚类分析,并获取相应的聚类中心集合。目的是为了将相似的图像片段归为一类,便于后续对图像片段的异常检测和处理。
具体来说,首先,高速公路资产数据自动化采集系统可以从新增图像片段集合中提取特征,这些特征可以是图像的颜色、纹理、形状等描述子(描述子是用于描述和表征图像内容的一种数学或逻辑表示。它们通常是从图像中提取出来的特征,这些特征可以是颜色、纹理、形状等,用于后续的图像识别、分类、匹配等任务),用于表征图像片段的属性。这些特征将被组织成特征向量或数组的形式,便于后续的计算和处理。接着,高速公路资产数据自动化采集系统利用聚类算法对新增图像片段集合进行聚类分析。聚类算法是一种无监督学习方法,它可以根据图像片段之间的相似度将它们划分为不同的簇(即聚类)。在这个过程中,高速公路资产数据自动化采集系统根据预设的聚类数目或聚类准则,确定新增图像片段集合中的各个图像片段所属的簇。聚类完成后,高速公路资产数据自动化采集系统计算每个簇的中心点,这些中心点称为聚类中心。聚类中心是簇内所有图像片段特征的平均值或中位数等统计量,用于代表该簇的特征。对于新增图像片段集合,高速公路资产数据自动化采集系统生成一个当下片段聚类中心集合,其中包含了每个新增图像片段簇的聚类中心。
此外,高速公路资产数据自动化采集系统还获取过往图像片段聚类中心集合。这个集合是在处理新增图像片段集合之前,对目标高速公路图像流的过往图像片段集合进行聚类分析得到的。过往图像片段聚类中心集合中的每个聚类中心代表了过往图像片段集合中一个图像片段簇的特征。当下片段聚类中心集合和过往图像片段聚类中心集合在后续步骤中将用于对新增图像片段进行异常检测。通过比较新增图像片段与聚类中心的相似度,可以判断该图像片段是否属于正常类别,还是存在异常(如道路问题)。需要注意的是,聚类算法的具体实施方式可以根据实际情况选择,常见的聚类算法包括K-means、DBSCAN、层次聚类等。在实际应用中,可以根据图像片段的特征和聚类需求选择适合的算法。同时,聚类中心的计算和更新方式也可以根据具体的聚类算法来确定。
通过聚类分析获取了新增图像片段集合和过往图像片段集合的聚类中心集合,为后续的异常检测提供了基础数据。
当下片段聚类中心集合是指在当前处理阶段,通过对新增图像片段集合进行聚类分析所得到的聚类中心集合。聚类中心是聚类算法中用于代表一个簇(即一类相似的图像片段)的中心点。每个聚类中心都是根据该簇内所有图像片段的特征计算得出的,通常是特征的平均值或中位数等。例如,假设新增图像片段集合包含10个图像片段,经过聚类分析后形成了3个簇。那么,当下片段聚类中心集合就会包含3个聚类中心,每个聚类中心分别代表这3个簇中图像片段的平均特征。过往图像片段聚类中心集合是指在处理新增图像片段集合之前,通过对目标高速公路图像流的过往图像片段集合进行聚类分析所得到的聚类中心集合。这些聚类中心代表了过往图像片段中不同簇的特征,是历史数据的聚类结果。例如,如果之前已经对100个过往图像片段进行了聚类分析,并形成了5个簇,那么过往图像片段聚类中心集合就会包含这5个簇的聚类中心。这些聚类中心可以用于与新增图像片段进行比较,以识别是否有新的异常或模式出现。
划簇结果是指聚类算法将图像片段划分为不同簇的结果。每个簇包含一组相似的图像片段,而划簇结果就是对这种相似性的组织和表示。划簇结果是聚类分析的重要输出,可以用于后续的分类、异常检测等任务。例如,在聚类分析中,如果算法将10个图像片段划分为3个簇,那么这3个簇就构成了划簇结果。每个簇内的图像片段在某种特征上相似,而不同簇之间的图像片段则具有较大的差异。图像片段簇是指聚类算法中形成的一个包含相似图像片段的集合。每个图像片段簇都是由一组在特征空间上相近的图像片段组成,它们共同代表了某种特定的模式或类别。图像片段簇是聚类分析的基本单位,用于描述和分类图像片段的集合。例如,在高速公路监控场景中,一个图像片段簇可能包含了一系列显示正常交通流的图像片段,而另一个簇则可能包含了一系列显示交通拥堵或事故的图像片段。这些簇是根据图像片段的特征自动形成的,有助于快速识别和响应不同的交通状况。
步骤S130:在基于当下片段聚类中心集合对过往图像片段聚类中心集合迭代得到目标图像片段簇中心集合之后,将新增图像片段集合中的每个新增图像片段分别与目标图像片段簇中心集合中包括的多个目标图像片段簇中心进行计算,获得与每个新增图像片段配对的目标片段空间间距。
需要明确的是,在步骤S130之前,高速公路资产数据自动化采集系统已经完成了对新增图像片段集合的聚类分析,并得到了当下片段聚类中心集合。同时,基于过往图像片段集合的聚类分析,也得到了过往图像片段聚类中心集合。这两个集合分别代表了当前和过往图像片段的聚类特征。接下来,高速公路资产数据自动化采集系统利用当下片段聚类中心集合对过往图像片段聚类中心集合进行迭代更新,得到目标图像片段簇中心集合。这一过程可以理解为将当前和过往的聚类中心进行融合,以形成一个更为全面和准确的目标聚类中心集合。具体的迭代更新方法可以根据实际情况选择,例如可以采用加权平均、最小距离法则等算法。
在得到目标图像片段簇中心集合后,高速公路资产数据自动化采集系统开始处理新增图像片段集合中的每个图像片段。对于每个新增图像片段,将其与目标图像片段簇中心集合中的每个目标图像片段簇中心进行计算,以获得它们之间的空间间距,即片段距离。这个距离可以通过计算图像片段特征向量之间的欧氏距离、余弦相似度等方式得到。
举例来说,假设有一个新增图像片段A,其特征向量可以表示为[0.5, 0.3, 0.2]。同时,目标图像片段簇中心集合中有两个目标图像片段簇中心B和C,它们的特征向量分别为[0.6, 0.2, 0.2]和[0.4, 0.4, 0.2]。高速公路资产数据自动化采集系统分别计算A与B、A与C之间的片段距离。如果采用欧氏距离进行计算,那么A与B的距离就是:
A与C的距离就是:
通过这些距离的计算,高速公路资产数据自动化采集系统可以判断新增图像片段A与目标图像片段簇中心B和C的相似程度,从而为后续的异常检测或分类任务提供依据。
步骤S130主要是通过计算和比较新增图像片段与目标图像片段簇中心之间的距离,来评估它们之间的相似性和差异性。这一步骤的输出结果将为后续的图像片段处理和分析提供重要的参考信息。
在一种实施方案中,步骤S130,在将新增图像片段集合中的每个新增图像片段分别与目标图像片段簇中心集合中包括的多个目标图像片段簇中心进行计算,获得与每个新增图像片段配对的目标片段空间间距之前,方法还可以包括以下步骤:
步骤Sa:分别获取当下片段聚类中心集合中的每一当下片段聚类中心,与过往图像片段聚类中心集合中的每一过往图像片段聚类中心之间的中心间距。
具体而言,步骤Sa中,高速公路资产数据自动化采集系统分别获取当下片段聚类中心集合中的每一个当下片段聚类中心,以及过往图像片段聚类中心集合中的每一个过往图像片段聚类中心,并计算它们之间的中心间距,也被称为特征距离。这个特征距离是通过比较两个聚类中心在特征空间中的位置来计算的,通常可以采用欧氏距离、余弦相似度等方法来衡量。
例如,假设有一个当下片段聚类中心A,其特征向量可以表示为[0.7, 0.2, 0.1],同时有一个过往图像片段聚类中心B,其特征向量表示为[0.6, 0.3, 0.1]。高速公路资产数据自动化采集系统计算A与B之间的特征距离,即计算这两个特征向量之间的差异程度。如果采用欧氏距离作为度量标准,那么A与B之间的特征距离就是:
这个特征距离的计算过程会对当下片段聚类中心集合中的每一个当下片段聚类中心和过往图像片段聚类中心集合中的每一个过往图像片段聚类中心都进行一遍,以得到它们之间的所有中心间距。这些中心间距将用于后续步骤中,判断当下图像片段簇与过往图像片段簇之间的相似性和差异性,从而决定如何进行簇的更新和融合。步骤Sa通过计算和分析当下片段聚类中心与过往图像片段聚类中心之间的特征距离,为后续的图像片段簇的迭代更新提供重要的参考信息。这一步骤的输出结果将直接影响到后续步骤中图像片段簇的处理和分析方式。
步骤Sb:在过往图像片段聚类中心集合中包括中心间距小于聚类中心间距临界值的过往图像片段聚类中心时,将当下片段聚类中心对应的当下图像片段簇中的多个新增图像片段融入到过往图像片段聚类中心对应的过往图像片段簇,获得迭代后的过往图像片段簇,其中,过往图像片段聚类中心集合中的每一过往图像片段聚类中心分别对应于一个聚类中心间距临界值。
步骤Sb涉及对当下图像片段簇与过往图像片段簇的合并与更新。当高速公路资产数据自动化采集系统在执行步骤Sa后,确定了当下片段聚类中心与过往图像片段聚类中心之间的中心间距,步骤Sb将根据这些间距来决定是否将当下的图像片段簇融入到过往的图像片段簇中。具体来说,如果过往图像片段聚类中心集合中存在一个或多个过往图像片段聚类中心,其中心间距小于预设的聚类中心间距临界值,这意味着这些过往图像片段聚类中心与某个当下片段聚类中心非常相似。在这种情况下,高速公路资产数据自动化采集系统将这个当下片段聚类中心对应的当下图像片段簇中的所有新增图像片段添加到与之最相似的过往图像片段聚类中心对应的过往图像片段簇中。
需要注意的是,每一个过往图像片段聚类中心都有一个与之对应的聚类中心间距临界值。这个临界值是根据实际应用场景和数据分布来设定的,它决定了何时将一个当下图像片段簇融入到过往图像片段簇中。不同的过往图像片段聚类中心可能有不同的临界值,这取决于它们在特征空间中的位置和分布情况。
举个例子来说,假设有一个当下图像片段簇A,其聚类中心为a,同时有一个过往图像片段簇B,其聚类中心为b。如果a与b之间的中心间距小于B的聚类中心间距临界值,那么高速公路资产数据自动化采集系统就会将A中的所有新增图像片段融入到B中,形成一个更新后的过往图像片段簇B'。这个B'包含了原来B中的图像片段和A中的所有新增图像片段,并且其聚类中心也会根据新的图像片段信息进行更新。通过步骤Sb,高速公路资产数据自动化采集系统能够有效地利用历史数据和新增数据来更新和优化图像片段簇的结构和内容,为后续的图像分析和处理提供更加准确和全面的信息基础。
步骤Sc:在过往图像片段聚类中心集合中不包括中心间距小于聚类中心间距临界值的过往图像片段聚类中心时,将当下片段聚类中心对应的当下图像片段簇作为过往图像片段簇中新增的过往图像片段簇。
步骤Sc中,对当下图像片段簇与过往图像片段簇之间关系的判断,并根据判断结果来决定是否将当下图像片段簇作为新增的过往图像片段簇。
具体来说,当高速公路资产数据自动化采集系统在执行步骤Sa和Sb之后,如果在过往图像片段聚类中心集合中不存在中心间距小于聚类中心间距临界值的过往图像片段聚类中心时,这意味着当前的当下图像片段簇与所有的过往图像片段簇都有较大的差异,无法将其融入到已有的过往图像片段簇中。在这种情况下,高速公路资产数据自动化采集系统将这个当下片段聚类中心对应的当下图像片段簇作为过往图像片段簇集合中新增的一个过往图像片段簇。这个新增的过往图像片段簇将包含当下图像片段簇中的所有图像片段,并且其聚类中心将与当下片段聚类中心相同。通过新增这个过往图像片段簇,高速公路资产数据自动化采集系统能够保持对新增图像片段信息的跟踪和记录,以便在后续的处理和分析中利用这些信息。
需要注意的是,聚类中心间距临界值决定了何时将当下图像片段簇作为新增的过往图像片段簇。这个临界值可以根据具体的应用场景和数据分布来设定,例如根据实验和经验来确定一个合适的值。如果临界值设定得过大,可能会导致将差异较大的图像片段簇错误地合并在一起;如果临界值设定得过小,则可能会导致新增的图像片段簇过多,增加计算和存储的复杂度。
例如,假设有一个当下图像片段簇C,其聚类中心为c,但是在过往图像片段聚类中心集合中不存在与c中心间距小于聚类中心间距临界值的过往图像片段聚类中心。在这种情况下,高速公路资产数据自动化采集系统将C作为一个新增的过往图像片段簇加入到过往图像片段簇集合中。这样,在后续的处理和分析中,高速公路资产数据自动化采集系统就可以利用C中的图像片段信息来提取高速公路资产的相关特征和数据。步骤Sc确保新增的图像片段信息能够被有效地记录和利用,为后续的图像分析和处理提供全面的数据基础。
步骤Sd:将迭代后的过往图像片段簇集合中的过往图像片段簇分别对应的图像片段簇中心确定为目标图像片段簇中心集合中的目标图像片段簇中心。
步骤Sd涉及到对过往图像片段簇集合的更新和目标图像片段簇中心的确定。在执行完步骤Sb和Sc之后,高速公路资产数据自动化采集系统根据当下图像片段簇与过往图像片段簇之间的相似性和差异性,对过往图像片段簇集合进行迭代更新,形成新的过往图像片段簇集合。步骤Sd的目的就是从这个迭代更新后的过往图像片段簇集合中,提取出每个过往图像片段簇对应的图像片段簇中心,并将这些中心确定为目标图像片段簇中心集合中的目标图像片段簇中心。
具体来说,高速公路资产数据自动化采集系统遍历迭代后的过往图像片段簇集合中的每一个过往图像片段簇,计算其对应的图像片段簇中心。这个图像片段簇中心可以是该簇中所有图像片段特征的平均值、中位数或其他统计量,具体取决于应用场景和数据特性。计算完成后,高速公路资产数据自动化采集系统将这些图像片段簇中心收集起来,形成目标图像片段簇中心集合。目标图像片段簇中心集合是后续处理和分析的重要基础。通过对这些中心的分析和比较,高速公路资产数据自动化采集系统可以识别出不同图像片段簇之间的差异和联系,进而提取出高速公路资产(具体为道路图像)的关键特征和属性。
需要注意的是,目标图像片段簇中心集合的确定是一个动态的过程。随着新增图像片段的不断加入和过往图像片段的不断更新,目标图像片段簇中心集合也会不断发生变化。因此,在实际应用中,需要定期对目标图像片段簇中心集合进行更新和维护,以保持其准确性和时效性。
例如,假设经过步骤Sb和Sc的处理后,迭代后的过往图像片段簇集合中包含了三个过往图像片段簇D1、D2和D3,它们分别对应着不同的高速公路资产类型。高速公路资产数据自动化采集系统分别计算这三个簇的图像片段簇中心d1、d2和d3,并将它们确定为目标图像片段簇中心集合中的目标图像片段簇中心。在后续的处理和分析中,高速公路资产数据自动化采集系统就可以利用这些目标图像片段簇中心来识别和提取高速公路资产的相关特征和数据。例如,可以通过比较不同目标图像片段簇中心之间的差异来区分不同的资产类型;或者可以利用目标图像片段簇中心的位置和分布来评估资产的状态和性能等。
作为一种实施方式,步骤Sd,将迭代后的过往图像片段簇集合中的过往图像片段簇分别对应的图像片段簇中心确定为目标图像片段簇中心集合中的目标图像片段簇中心,具体可以包括:
步骤Sd1:在迭代后的过往图像片段簇集合中的目标过往图像片段簇中包括多个过往图像片段和当下图像片段簇中的多个新增图像片段时,分别获取当下图像片段簇中的多个新增图像片段对应的片段表征数组,与片段表征数组的翻转数组的数量积,以及基于多个新增图像片段分别对应的数量积和确定为与多个新增图像片段对应的新增表征结果;根据目标过往图像片段簇中包括的过往图像片段对应的过往表征结果,和新增表征结果确定目标过往图像片段簇对应的目标图像片段簇中心。
步骤Sd1中,高速公路资产数据自动化采集系统针对当下图像片段簇中的每一个新增图像片段,获取其对应的片段表征数组。这个片段表征数组是一个特征向量,它包含了该图像片段的各种特征信息,如颜色、纹理、形状等。然后,计算这个片段表征数组与其翻转数组(即转置后的数组)的数量积。数量积是一种衡量两个向量相似性的指标,它等于这两个向量对应元素乘积的和。通过计算数量积,高速公路资产数据自动化采集系统可以获取到每个新增图像片段自身的特征信息。接下来,根据多个新增图像片段分别对应的数量积和,确定一个与这些新增图像片段对应的新增表征结果。这个新增表征结果是一个特征值,它综合了所有新增图像片段的特征信息,反映了这些片段的整体特性。
然后,高速公路资产数据自动化采集系统考虑目标过往图像片段簇中已经包含的过往图像片段的信息。它会获取这些过往图像片段对应的过往表征结果,这些过往表征结果也是在之前的处理过程中通过类似的方式计算得到的。最后,结合新增表征结果和过往表征结果,确定目标过往图像片段簇对应的目标图像片段簇中心。这个中心是一个聚类中心数组或聚类中心向量,它代表了该簇中所有图像片段的平均特征或核心特征。通过这个聚类中心数组或向量,高速公路资产数据自动化采集系统可以方便地对后续的图像片段进行分类和识别。需要注意的是,在确定目标图像片段簇中心的过程中,还需要满足一个条件:目标过往图像片段簇中的多个片段分别对应的片段表征数组与目标图像片段簇中心对应的聚类中心数组之间的数组间距的和值不大于对照间距临界值。这个条件保证了确定的聚类中心能够准确地反映该簇中图像片段的特征分布和相似性。
举个例子来说,假设迭代后的过往图像片段簇集合中有一个目标过往图像片段簇E,它包含了3个过往图像片段和2个新增图像片段。高速公路资产数据自动化采集系统首先计算这2个新增图像片段对应的片段表征数组和数量积,然后得到一个新增表征结果e_new。同时,获取这3个过往图像片段对应的过往表征结果e_old1、e_old2和e_old3。最后,结合e_new、e_old1、e_old2和e_old3的信息,确定目标过往图像片段簇E对应的目标图像片段簇中心e_center。在确定e_center的过程中,需要保证E中的所有片段对应的片段表征数组与e_center之间的数组间距的和值不大于一个预设的对照间距临界值。
步骤Sd2:在迭代后的过往图像片段簇集合中的目标过往图像片段簇中仅包含当下图像片段簇中的多个当下片段时,分别获取当下图像片段簇中的多个新增图像片段对应的片段表征数组,与片段表征数组的翻转数组的数量积,以及基于多个新增图像片段分别对应的数量积和确定为与多个新增图像片段对应的当下表征结果;根据当下表征结果确定目标过往图像片段簇对应的目标图像片段簇中心;其中,目标过往图像片段簇中的多个片段分别对应的片段表征数组与目标图像片段簇中心对应的聚类中心数组之间的数组间距的和值不大于对照间距临界值。
在步骤Sd2中,高速公路资产数据自动化采集系统首先处理的是那些完全由新增图像片段构成的目标过往图像片段簇。这些簇中不包含任何过往的图像片段,而是由当前处理的图像片段簇中的新增片段组成。对于这些新增的图像片段,高速公路资产数据自动化采集系统执行以下操作:
获取片段表征数组:对于每个新增的图像片段,提取其特征信息,并将这些信息编码成一个片段表征数组。这个数组通常是一个多维向量,包含了图像片段的各种特征值,如颜色分布、纹理特征、形状特征等。
计算数量积:接下来,计算每个片段表征数组与其自身的翻转数组(例如转置或共轭转置)之间的数量积。数量积在数学上衡量了两个向量的相似度,当它们完全相同时,数量积达到最大值。
确定当下表征结果:高速公路资产数据自动化采集系统基于所有新增图像片段对应的数量积之和来确定一个当下表征结果。这个当下表征结果是一个综合了所有新增片段特征信息的特征值,用于表示这个完全由新增片段组成的簇的整体特性。
确定目标图像片段簇中心:最后,高速公路资产数据自动化采集系统根据这个当下表征结果来确定目标过往图像片段簇的聚类中心。这个聚类中心是一个数组或向量,它代表了该簇中所有图像片段的平均特征或核心特征。在确定聚类中心时,需要满足一个条件:目标过往图像片段簇中的多个片段分别对应的片段表征数组与目标图像片段簇中心对应的聚类中心数组之间的数组间距(通常使用欧几里得距离、余弦相似度等度量方式计算)的和值不大于一个预设的对照间距临界值。这个条件确保了所确定的聚类中心能够准确地反映该簇中图像片段的特征分布和相似性。
例如,假设有一个迭代后的过往图像片段簇集合中的一个簇完全由3个新增的图像片段A、B和C组成。高速公路资产数据自动化采集系统首先提取这3个片段的特征并生成对应的片段表征数组array_A、array_B和array_C。然后计算这些数组与它们自身的翻转数组(或适当的相似性度量)之间的数量积或相似性得分。接着基于这些数量积或得分确定一个当下表征结果来表示这个簇的整体特性。最后根据这个当下表征结果确定该簇的聚类中心center_array,同时确保簇中的片段表征数组与聚类中心数组之间的间距和不超过一个预设的临界值。
在一种实施方式中,本申请实施例在将迭代后的过往图像片段簇集合中的过往图像片段簇分别对应的图像片段簇中心确定为目标图像片段簇中心集合中的目标图像片段簇中心时,还包括对聚类中心间距临界值更新的过程,具体地,可以包括以下步骤:
步骤Sda:在迭代后的过往图像片段簇集合中的目标过往图像片段簇中包括多个过往图像片段和当下图像片段簇中的多个新增图像片段时,获取当下图像片段簇中的多个新增图像片段分别的片段表征数组分别与当下片段聚类中心对应的聚类中心数组的数组间距的数组间距和值。
在步骤Sda中,高速公路资产数据自动化采集系统处理的是迭代后的过往图像片段簇集合中的一个特定目标过往图像片段簇,这个簇包含了多个过往图像片段以及来自当下图像片段簇的多个新增图像片段。这种情况表明该簇既有历史数据又有新加入的数据,因此需要对聚类中心间距临界值进行更新以适应新的数据分布。
首先,高速公路资产数据自动化采集系统获取当下图像片段簇中的每个新增图像片段的片段表征数组。片段表征数组是图像片段特征的具体数值表示,可以是一个多维向量,包含了图像片段的颜色、纹理、形状等特征信息。接着,计算每个新增图像片段的片段表征数组与当下片段聚类中心对应的聚类中心数组之间的数组间距。数组间距是衡量两个数组相似性或差异性的指标,常用的计算方法包括欧几里得距离、余弦相似度等。在这个上下文中,数组间距表示了新增图像片段与当下片段聚类中心在特征空间中的距离。然后,将所有新增图像片段的数组间距相加,得到一个数组间距和值。这个和值反映了新增图像片段整体上与当下片段聚类中心的差异程度。
例如,假设有一个目标过往图像片段簇中包含了3个过往图像片段A、B、C和2个新增图像片段D、E。高速公路资产数据自动化采集系统首先会提取D和E的片段表征数组,并计算它们与当下片段聚类中心的聚类中心数组之间的数组间距。然后将这两个间距相加得到一个数组间距和值。这个值将用于后续步骤中更新聚类中心间距临界值的计算。
步骤Sdb:获取目标过往图像片段簇对应的聚类中心间距临界值,并获取与当下片段聚类中心对应的第一影响变量,以及与过往图像片段聚类中心对应的第二影响变量。
步骤Sdb中,高速公路资产数据自动化采集系统获取目标过往图像片段簇对应的聚类中心间距临界值。这个临界值是在之前的聚类过程中确定的,它代表了簇内图像片段之间在特征空间中的最大允许距离。换句话说,如果某个图像片段与聚类中心的距离超过了这个临界值,那么它可能不属于这个簇,或者这个簇的聚类中心需要更新以更好地反映数据的分布情况。
接着,获取与当下片段聚类中心对应的第一影响变量,这个变量通常是一个权重参数。第一影响变量用于衡量当下片段聚类中心在更新聚类中心间距临界值时的相对重要性。由于当下片段聚类中心代表了最新加入的数据的信息,因此其对应的权重参数可以反映新数据对聚类结果的影响程度。权重参数的取值范围通常在0到1之间,具体数值需要根据实际应用场景和数据特性来确定。同时,还会获取与过往图像片段聚类中心对应的第二影响变量。第二影响变量也是一个权重参数,它用于衡量过往图像片段聚类中心在更新聚类中心间距临界值时的相对重要性。过往图像片段聚类中心代表了历史数据的信息,其对应的权重参数可以反映历史数据对聚类结果的稳定性和持续性的影响。与第一影响变量类似,第二影响变量的取值范围也通常在0到1之间,并且需要根据具体应用场景和数据特性来调整。在获取了这些参数之后,高速公路资产数据自动化采集系统就可以根据它们来更新聚类中心间距临界值。更新过程可能涉及将第一影响变量与当下片段聚类中心的某种度量(如数组间距和值)相乘,以及将第二影响变量与过往图像片段聚类中心的某种度量相乘。然后将这两个乘积相加或进行其他运算来得到新的聚类中心间距临界值。不过,具体的更新公式和运算方式需要根据整个算法的设计和目标来确定。
例如,假设目标过往图像片段簇的聚类中心间距临界值为10,当下片段聚类中心对应的第一影响变量为0.6,过往图像片段聚类中心对应的第二影响变量为0.4。如果当下片段聚类中心与某个新增图像片段的距离为8(这个距离是通过计算片段表征数组之间的相似性或差异性得到的),那么根据第一影响变量,这个距离对聚类中心间距临界值的影响就是8 * 0.6 = 4.8。同样地,如果过往图像片段聚类中心与某个历史图像片段的距离为5,那么根据第二影响变量,这个距离对聚类中心间距临界值的影响就是5 * 0.4 = 2。
步骤Sdc:根据第一影响变量与数组间距和值的第一相乘结果,以及第二影响变量与聚类中心间距临界值的第二相乘结果确定目标图像片段簇中心对应的聚类中心间距临界值。
步骤Sdc中,需要明确的是,第一影响变量是与当下片段聚类中心相关的权重参数,而第二影响变量是与过往图像片段聚类中心相关的权重参数。这两个变量在之前的步骤中已经被获取,并用于衡量不同类型数据(新数据和历史数据)在聚类过程中的相对重要性。
在步骤Sdc中,高速公路资产数据自动化采集系统进行两次相乘运算。第一次是将第一影响变量与数组间距和值相乘。数组间距和值是在步骤Sda中计算得到的,它代表了新增图像片段与当下片段聚类中心在特征空间中的总体距离。通过将这个距离与第一影响变量相乘,可以得到一个新数据对聚类中心间距临界值的影响量。
第二次相乘运算是将第二影响变量与原有的聚类中心间距临界值相乘。原有的聚类中心间距临界值是在之前的聚类过程中确定的,它反映了历史数据在特征空间中的分布情况。通过将这个临界值与第二影响变量相乘,可以得到一个历史数据对聚类中心间距临界值的影响量。
最后,高速公路资产数据自动化采集系统将这两个影响量进行综合考虑,以确定新的聚类中心间距临界值。具体的综合考虑方式可能包括加法、乘法或其他运算,这取决于整个算法的设计和目标。新的聚类中心间距临界值将用于后续的聚类过程中,以判断图像片段是否属于某个簇或是否需要更新簇的聚类中心。
例如,假设第一影响变量为0.7,数组间距和值为10;第二影响变量为0.3,原有的聚类中心间距临界值为15。那么新数据对聚类中心间距临界值的影响量就是0.7 * 10 =7;历史数据对聚类中心间距临界值的影响量就是0.3 * 15 = 4.5。如果将这两个影响量相加来得到新的聚类中心间距临界值,那么结果就是7 + 4.5 = 11.5。这意味着在新的聚类过程中,如果一个图像片段与某个簇的聚类中心的距离超过11.5,那么它可能不属于这个簇。
需要注意的是,这里的相乘和相加运算只是示例性的,实际的运算方式可能因算法设计和目标的不同而有所差异。
步骤Sdd:在迭代后的过往图像片段簇集合中的目标过往图像片段簇中仅包含当下图像片段簇中的多个当下片段时,获取当下图像片段簇中的多个新增图像片段分别的片段表征数组分别与当下片段聚类中心对应的聚类中心数组的数组间距的数组间距和值。
步骤Sdd是处理聚类迭代过程中的一个特定情况,即当迭代后的过往图像片段簇集合中的某个目标过往图像片段簇仅包含来自当下图像片段簇的多个当下片段时,高速公路资产数据自动化采集系统需要进行特定的操作以更新聚类信息。
首先,需要明确的是,在聚类迭代过程中,图像片段会根据其特征被分配到不同的簇中。每个簇都有一个聚类中心,该聚类中心通常是该簇内所有图像片段特征的平均值或中心点。在这个过程中,有可能会出现某个过往图像片段簇在迭代后只包含来自当下图像片段簇的片段的情况。当出现这种情况时,步骤Sdd要求高速公路资产数据自动化采集系统获取当下图像片段簇中的多个新增图像片段的片段表征数组与当下片段聚类中心对应的聚类中心数组之间的数组间距的和值。这里的“片段表征数组”是指用于描述图像片段特征的数组,它可能包含颜色、纹理、形状等多种特征信息;“聚类中心数组”则是指代表聚类中心特征的数组。
具体来说,高速公路资产数据自动化采集系统遍历当下图像片段簇中的所有新增图像片段,对于每个新增图像片段,计算其片段表征数组与当下片段聚类中心的聚类中心数组之间的数组间距。这个数组间距可以通过计算两个数组对应元素之差的绝对值之和、欧氏距离或其他距离度量方式得到。然后,将这些数组间距相加,得到数组间距和值。这个数组间距和值反映了新增图像片段与当下片段聚类中心在特征空间中的总体距离,它可以用于衡量新增图像片段与当下片段聚类中心的相似度或差异度。在后续的聚类过程中,这个数组间距和值可能会被用于更新聚类中心或重新分配图像片段到不同的簇中。
例如,假设当下图像片段簇中有3个新增图像片段A、B、C,它们的片段表征数组分别为[1, 2, 3]、[4, 5, 6]和[7, 8, 9];当下片段聚类中心的聚类中心数组为[2, 4, 6]。那么,高速公路资产数据自动化采集系统分别计算A、B、C与聚类中心的数组间距,比如A与聚类中心的数组间距为|(1-2)| + |(2-4)| + |(3-6)| = 7,同理可得B与聚类中心的数组间距为6,C与聚类中心的数组间距为9。最后,将这些数组间距相加得到数组间距和值为7+6+9=22。
需要注意的是,这里的计算方式只是示例性的,实际的计算方式可能因特征选择、距离度量方式等因素而有所不同。
步骤Sde:将数组间距和值确定为目标图像片段簇中心对应的聚类中心间距临界值。
步骤Sde用于更新和调整聚类中心间距标准,以确保聚类结果的准确性和适应性。具体来说,当高速公路资产数据自动化采集系统完成前面步骤中的数组间距和值的计算后,它会将这个和值直接确定为目标图像片段簇中心对应的新的聚类中心间距临界值。这个临界值在聚类算法中起到了一个阈值的作用,用于判断新的图像片段是否应该被归入到已有的簇中,或者是否应该形成一个新的簇。
例如,假设在前面的步骤中,高速公路资产数据自动化采集系统计算得到了一个数组间距和值为10。那么,在步骤Sde中,高速公路资产数据自动化采集系统将这个值10设置为新的聚类中心间距临界值。这意味着,在后续的聚类过程中,如果一个新的图像片段与已有的簇中心的间距小于或等于10,那么这个新的图像片段就可能被归入到该簇中;否则,它可能会被考虑形成一个新的簇。
需要注意的是,这里的数组间距和值以及聚类中心间距临界值都是根据具体的算法和数据集来确定的,它们在不同的应用场景中可能会有所不同。同时,聚类算法本身也可能包含其他的参数和步骤,这些都需要根据具体的需求和场景来进行调整和优化。此外,还需要强调的是,聚类算法是一种无监督学习方法,它不需要事先对图像片段进行标记或分类。因此,在聚类过程中,高速公路资产数据自动化采集系统需要依靠图像片段的特征和相似性来进行判断和分组。而数组间距和值以及聚类中心间距临界值等参数的设置,则是为了帮助高速公路资产数据自动化采集系统更好地完成这一任务。
在一种实施方式中,步骤S130中,将新增图像片段集合中的每个新增图像片段分别与目标图像片段簇中心集合中包括的多个目标图像片段簇中心进行计算,获得与每个新增图像片段配对的目标片段空间间距,具体可以包括以下步骤:
步骤S131:获取与目标图像片段簇中心集合中包括的多个目标图像片段簇中心分别对应的空间间距影响变量。
步骤S131涉及到获取与目标图像片段簇中心集合中多个目标图像片段簇中心分别对应的空间间距影响变量。在具体实施过程中,高速公路资产数据自动化采集系统首先会访问存储有目标图像片段簇中心集合的数据结构。这个集合中包含了多个目标图像片段簇中心,每个簇中心都代表了图像数据在特征空间中的一个聚集点。随后,高速公路资产数据自动化采集系统检索与这些目标图像片段簇中心相关联的空间间距影响变量。
空间间距影响变量是一个重要的参数,它用于调整不同簇中心在计算空间间距时的影响程度,可以认为是一个权重参数。这个变量可能根据簇中心的性质、重要性或其在特征空间中的分布情况进行设置。例如,在某些情况下,如果某个簇中心代表了图像中一个非常显著或重要的特征,那么与之相关联的空间间距影响变量可能会被设置得较大,以增加该簇中心在计算空间间距时的权重。
例如,假设目标图像片段簇中心集合中包含了三个簇中心A、B和C,它们分别代表了图像中的不同特征。高速公路资产数据自动化采集系统分别检索与这三个簇中心相关联的空间间距影响变量α、β和γ。这些变量可能是根据先验知识、数据统计或机器学习算法自动学习得到的。
在获取了空间间距影响变量之后,高速公路资产数据自动化采集系统就可以利用这些变量和新增图像片段的特征来计算它们与目标图像片段簇中心之间的空间间距。这个空间间距反映了新增图像片段与目标簇中心在特征空间中的相似度或距离,是聚类算法中非常关键的一个度量指标。
需要注意的是,这里的空间间距影响变量和特征空间都是根据具体的图像数据和聚类任务来定义的,它们在不同的应用场景中可能会有所不同。
步骤S132:获取新增图像片段集合中的一个新增图像片段作为当前新增图像片段,对以下操作进行重复直到游走完当前新增图像片段集合中的每一新增图像片段:
步骤S133:分别获取当前新增图像片段与多个目标图像片段簇中心之间的对照片段空间间距;
步骤S134:根据多个目标图像片段簇中心分别对应的空间间距影响变量和获取的多个对照片段空间间距确定当前新增图像片段配对的目标片段空间间距。
高速公路资产数据自动化采集系统逐一选取新增图像片段,并计算它们与目标图像片段簇中心之间的空间间距,以确定这些新增片段在特征空间中的位置及与现有簇的关系。具体来说,从新增图像片段集合中选取一个新增图像片段,将其标记为“当前新增图像片段”。这个当前新增图像片段随后会被用于一系列的计算和比较操作,以确定其与目标图像片段簇中心之间的关系。这些操作会不断重复,直到集合中的每一个新增图像片段都被处理完毕。
紧接着,计算当前新增图像片段与多个目标图像片段簇中心之间的对照片段空间间距。这个空间间距是基于图像片段的特征向量在特征空间中的位置来计算的。特征向量包含了描述图像片段的各种特征信息,如颜色、纹理、形状等。高速公路资产数据自动化采集系统利用这些特征向量来计算当前新增图像片段与每个目标图像片段簇中心之间的距离或相似度。例如,如果特征向量是一个包含颜色直方图信息的数组,高速公路资产数据自动化采集系统可能会使用欧氏距离或余弦相似度等度量方法来计算当前新增图像片段与簇中心之间的距离。这些距离值反映了它们在特征空间中的接近程度或相似度。最后,根据多个目标图像片段簇中心分别对应的空间间距影响变量和获取的多个对照片段空间间距来确定当前新增图像片段配对的目标片段空间间距。空间间距影响变量是一个权重因子,用于调整不同簇中心在计算配对目标片段空间间距时的影响程度。这个权重因子可能基于簇的大小、密度或重要性等因素进行设置。通过综合考虑对照片段空间间距和空间间距影响变量,高速公路资产数据自动化采集系统能够确定当前新增图像片段与各个目标图像片段簇中心之间的相对关系。这个信息对于后续的聚类决策和图像片段的分类至关重要。
在一种实施方式中,步骤S133,分别获取当前新增图像片段与多个目标图像片段簇中心之间的对照片段空间间距,具体可以包括:
步骤S1331:在多个目标图像片段簇中心中逐一获取一个目标图像片段簇中心作为一个当下片段聚类中心,对以下操作进行重复直到游走完多个目标图像片段簇中心:
步骤S1332:获取与当下片段聚类中心配对的当下片段聚类中心子集,当下片段聚类中心子集中包括当下片段聚类中心和多个对照图像片段簇中心,对照图像片段簇中心为分布位置处在当下片段聚类中心之前的目标图像片段簇中心;
步骤S1333:分别获取当前新增图像片段对应的片段表征数组与当下片段聚类中心子集中的多个图像片段簇中心分别对应的聚类中心数组之间的闵可夫斯基距离;
步骤S1334:将获取的多个闵可夫斯基距离中最小的结果确定为当前新增图像片段与当下片段聚类中心之间的对照片段空间间距。
具体来说,高速公路资产数据自动化采集系统在执行步骤S1331时,从已存在的目标图像片段簇中心集合中按顺序或根据某种策略选取一个目标图像片段簇中心,将其标记为“当下片段聚类中心”。这个当下片段聚类中心代表了图像数据在特征空间中的一个特定聚集点,是后续计算和比较操作的基准。
高速公路资产数据自动化采集系统在执行步骤S1332时,根据当前选中的“当下片段聚类中心”来确定哪些目标图像片段簇中心应该被包含在这个子集中。这里的“当下片段聚类中心”是在步骤S1331中从多个目标图像片段簇中心中逐一选取出来的。
子集的构建规则是:除了当下片段聚类中心本身,还要包括那些在空间分布或顺序上位于当下片段聚类中心之前的所有目标图像片段簇中心。这些被包含进来的簇中心被称为“对照图像片段簇中心”。它们之所以被选中,是因为它们在特征空间中的位置或顺序与当下片段聚类中心存在一定的关联或对比性。
例如,假设有五个按某种顺序排列的目标图像片段簇中心:A、B、C、D和E。如果C被选为当下片段聚类中心,那么根据步骤S1332的规则,子集将包括C本身以及位于C之前的所有簇中心,即A和B。因此,构建出的当下片段聚类中心子集就是{A, B, C}。
这个子集在后续的计算中起着重要作用。高速公路资产数据自动化采集系统利用这个子集中的信息来计算当前新增图像片段与各个簇中心之间的距离或相似度,从而确定该新增片段在特征空间中的位置以及与现有簇的关系。
步骤S1333涉及到计算当前新增图像片段与已存在的图像片段簇中心之间的空间距离。这个距离是通过计算它们在特征空间中的位置差异来得到的,具体使用的是闵可夫斯基距离(Minkowski distance)作为度量标准。
首先,需要明确“片段表征数组”和“聚类中心数组”的概念。片段表征数组是当前新增图像片段在特征空间中的表示,它是一个多维数组,包含了描述该图像片段的各种特征值。比如,如果特征是基于颜色和纹理的,那么这个数组就可能包含了颜色直方图、纹理特征向量等信息。聚类中心数组则是已存在的图像片段簇中心在特征空间中的表示,同样是一个多维数组。
举个例子,假设当前新增图像片段的片段表征数组为[0.8, 0.2, 0.5],这可能代表了该片段在红色、绿色和蓝色通道上的某种特征强度。而当下片段聚类中心子集中的一个图像片段簇中心的聚类中心数组为[0.7, 0.3, 0.4]。这两个数组都是三维的,分别对应了三个特征通道。
接下来,高速公路资产数据自动化采集系统计算这两个数组之间的闵可夫斯基距离。闵可夫斯基距离是一个广义的距离度量,它可以通过调整参数来适应不同的距离计算需求。在特殊情况下,它可以退化为欧氏距离或曼哈顿距离。
闵可夫斯基距离的计算公式为:
其中,为闵可夫斯基距离,x和y是两个多维数组(在本例中分别是片段表征数组和聚类中心数组),n是数组的维度(在本例中是特征的数量),p是一个参数(当p=2时,闵可夫斯基距离就变成了欧氏距离;当p=1时,就变成了曼哈顿距离)。
使用上述公式,高速公路资产数据自动化采集系统分别计算当前新增图像片段与当下片段聚类中心子集中每一个图像片段簇中心的距离。这些距离值反映了它们在特征空间中的接近程度或差异程度。最后,这些计算得到的距离值会被用于后续的聚类决策中,比如确定当前新增图像片段应该被归类到哪个已存在的簇中,或者是否需要创建一个新的簇来容纳它。
需要注意的是,上述过程中的计算和决策都是自动进行的,无需人工干预。同时,闵可夫斯基距离的选择也是基于其在数学上的性质和在实际应用中的表现来决定的。它能够灵活地适应不同维度的特征空间,并且对于特征值之间的差异提供了直观的度量方式。
最后,步骤S1334从多个计算出的距离值中选择一个最小的值,作为当前新增图像片段与某个已存在的图像片段簇中心之间的空间间距的度量。这个最小距离值在后续的聚类决策中具有重要的参考意义。首先,回顾一下步骤S1333中计算出的多个闵可夫斯基距离。这些距离值代表了当前新增图像片段在特征空间中与各个已存在的图像片段簇中心之间的差异程度。距离值越小,说明它们在特征空间中的位置越接近,相似度越高。
在步骤S1334中,高速公路资产数据自动化采集系统从这些计算出的距离值中找出最小的一个。这个最小距离值代表了当前新增图像片段与某个已存在的图像片段簇中心之间的最接近程度,也可以理解为它们在特征空间中的最短距离。
例如,假设在步骤S1333中计算出了三个闵可夫斯基距离值,分别是1.5、2.3和0.8。这三个值分别代表了当前新增图像片段与三个已存在的图像片段簇中心在特征空间中的距离。在步骤S1334中,高速公路资产数据自动化采集系统比较这三个值,找出其中的最小值0.8。这个最小值就代表了当前新增图像片段与某个已存在的图像片段簇中心之间的对照片段空间间距。
这个最小距离值在后续的聚类决策中具有重要的参考意义。比如,它可以用来判断当前新增图像片段是否应该被归类到与该簇中心相同的簇中,或者是否需要创建一个新的簇来容纳它。如果最小距离值小于某个预设的阈值,那么可以认为当前新增图像片段与该簇中心在特征空间中的位置非常接近,应该被归类到同一个簇中;反之,则需要考虑创建一个新的簇。
需要注意的是,上述过程中的计算和决策都是自动进行的,无需人工干预。同时,最小距离值的选择也是基于其在数学上的性质和在实际应用中的表现来决定的。它能够直观地反映出两个点在特征空间中的接近程度或差异程度,为后续的聚类决策提供了重要的参考依据。
在一种实施方式中,步骤S134,根据多个目标图像片段簇中心分别对应的空间间距影响变量和获取的多个对照片段空间间距确定当前新增图像片段配对的目标片段空间间距,具体可以包括:
步骤S1341:根据多个目标图像片段簇中心分别对应的空间间距影响变量获取多个对照片段空间间距的调节融合值确定当前新增图像片段配对的第一片段空间间距。
步骤S134用于根据多个因素综合确定当前新增图像片段在特征空间中的位置,即配对的目标片段空间间距。这个间距是后续聚类决策的重要依据。在上述实施方式中,步骤S1341涉及到对多个对照片段空间间距的调节和融合。对照片段空间间距是在步骤S133中计算得到的,代表了当前新增图像片段与各个已存在的图像片段簇中心之间的差异程度。而空间间距影响变量则是对这些间距进行调节的权重因子,它们反映了不同簇中心对当前新增图像片段的影响程度。
具体来说,高速公路资产数据自动化采集系统根据每个目标图像片段簇中心对应的空间间距影响变量,对多个对照片段空间间距进行加权求和,得到的结果即调节融合值。这个过程可以理解为对不同簇中心的影响进行加权平均,以获得一个综合反映当前新增图像片段在特征空间中位置的第一片段空间间距。
例如,假设有三个对照片段空间间距,分别是1.0、2.0和3.0,它们分别对应了三个已存在的图像片段簇中心。同时,这三个簇中心的空间间距影响变量分别是0.3、0.5和0.2。那么,根据步骤S1341,高速公路资产数据自动化采集系统计算出一个加权求和结果,即第一片段空间间距。计算过程如下:
第一片段空间间距D1= 1.0 * 0.3 + 2.0 * 0.5 + 3.0 * 0.2= 0.3 + 1.0 +0.6= 1.9。
1.9就是当前新增图像片段在特征空间中的初步位置估计,它综合考虑了多个已存在的图像片段簇中心的影响。需要注意的是,这里的加权求和只是一种可能的实施方式,实际上还可以根据具体需求选择其他合适的融合方法。
接下来,步骤S1342会对这个初步位置估计进行进一步处理,以获得与当前新增图像片段配对的目标片段空间间距。这个过程涉及到标准化的操作,目的是将第一片段空间间距转换为一个具有统一量纲和取值范围的指标,便于后续的聚类决策。具体的标准化方法可以根据实际需求选择,比如可以采用最大最小值标准化、Z-score标准化等常见方法。
步骤S1342:根据每个新增图像片段分别对应的调节融合值对第一片段空间间距进行标准化,获得与当前新增图像片段配对的目标片段空间间距。
在步骤S1341中,高速公路资产数据自动化采集系统已经根据多个目标图像片段簇中心的空间间距影响变量,通过加权求和等方式计算出了当前新增图像片段的第一片段空间间距。然而,这个初步计算出的空间间距可能受到不同图像片段簇中心的权重影响,以及图像特征本身量纲和取值范围的影响,因此需要进行进一步的标准化处理,以确保其能够在不同图像片段之间进行比较和聚类。
标准化是一种常见的数据处理方法,其目的是将原始数据转换为具有统一量纲和取值范围的数据,从而消除不同特征之间的量纲差异和数量级差异对聚类结果的影响。在步骤S1342中,高速公路资产数据自动化采集系统利用每个新增图像片段分别对应的调节融合值对第一片段空间间距进行标准化处理。
具体来说,高速公路资产数据自动化采集系统可以根据预设的标准化公式或方法,如最小-最大标准化、Z-score标准化等,将第一片段空间间距转换为标准化的目标片段空间间距。例如,采用最小-最大标准化方法时,高速公路资产数据自动化采集系统将第一片段空间间距按照以下公式进行转换:
目标片段空间间距= (第一片段空间间距-最小值) / (最大值-最小值)。
其中,最小值和最大值分别是所有新增图像片段的第一片段空间间距中的最小值和最大值。通过这样的标准化处理,所有新增图像片段的目标片段空间间距都将被映射到[0,1]的范围内,从而方便后续的聚类分析和比较。
需要注意的是,标准化的具体方法和参数可以根据实际应用场景和需求进行调整和优化。此外,在实际应用中,还需要考虑数据异常值、缺失值等情况对标准化处理的影响,并采取相应的措施进行处理。
通过对初步计算出的空间间距进行标准化处理,确保了不同图像片段之间的可比性,为后续的聚类决策提供了准确、可靠的数据基础。
在一种实施方式中,在步骤S134,根据多个目标图像片段簇中心分别对应的空间间距影响变量和获取的多个对照片段空间间距确定当前新增图像片段配对的目标片段空间间距之后,方法还可以包括:
步骤S135:逐一获取目标图像片段簇中心集合中的一个目标图像片段簇中心作为当下片段聚类中心,对以下操作进行重复直到游走完目标图像片段簇中心集合中的多个目标图像片段簇中心。
步骤S136:获取当下片段聚类中心对应的聚类中心数组的范数平方。
步骤S137:分别获取当下片段聚类中心对应的聚类中心数组,与目标图像片段簇中心集合中的其余目标图像片段簇中心对应的聚类中心数组之间的数组间距的和值。
步骤S138:根据范数平方与数组间距的和值之间的商确定当下片段聚类中心迭代后的空间间距影响变量。
步骤S135中,目的是遍历或“游走”完目标图像片段簇中心集合中的每一个目标图像片段簇中心,并对每一个簇中心执行一系列的操作,以更新或计算某些重要的参数,如空间间距影响变量。这个步骤为后续步骤(如S136、S137和S138)的顺利进行奠定了基础。具体来说,高速公路资产数据自动化采集系统逐一从目标图像片段簇中心集合中选取一个目标图像片段簇中心,暂时将其视为“当下片段聚类中心”。然后,它会围绕这个当下片段聚类中心执行一系列的操作,比如计算其对应聚类中心数组的范数平方,计算与其他簇中心的数组间距等。完成这些操作后,更新当下片段聚类中心的空间间距影响变量,这是根据范数平方和数组间距的和值计算得出的。这个过程会不断重复,直到高速公路资产数据自动化采集系统遍历完目标图像片段簇中心集合中的所有簇中心。通过这种方式,每个簇中心的空间间距影响变量都能得到更新,这有助于更准确地反映每个簇中心在特征空间中的位置和影响力。
例如,假设有一个目标图像片段簇中心集合,其中包含三个簇中心A、B和C。在步骤S135中,首先选取A作为当下片段聚类中心,然后计算A对应聚类中心数组的范数平方,以及A与B、C之间的数组间距和值。接着,根据这些值计算出A的空间间距影响变量,并进行更新。然后,继续选取B和C作为当下片段聚类中心,重复上述操作。最终,A、B和C三个簇中心的空间间距影响变量都得到了更新,这为后续的聚类分析提供了更准确的数据基础。需要注意的是,步骤S135中的“游走”过程可以按照一定的顺序或规则进行的。同时,每个簇中心在更新其空间间距影响变量时,所依据的计算方法和参数也可能是不同的,这需要根据具体的聚类算法和应用场景来确定。
范数平方用于衡量向量或数组在特征空间中的长度或大小。在聚类分析中,它常被用来评估聚类中心的重要性和影响力。
具体来说,高速公路资产数据自动化采集系统在执行步骤S136时,首先获取当前被视为“当下片段聚类中心”的目标图像片段簇中心所对应的聚类中心数组。这个聚类中心数组通常是一个多维向量,其每个维度都代表了该簇中心在某一特征上的取值。
接着,计算这个聚类中心数组的范数平方。范数平方的计算方式依赖于所选用的范数类型,常见的有L1范数、L2范数等。以L2范数为例,将聚类中心数组中每个元素的平方值相加,得到的结果就是该数组的范数平方。这个值反映了该簇中心在特征空间中的位置稳定性和其对周围数据点的影响力。
例如,假设有一个聚类中心数组A=[1, 2, 3],高速公路资产数据自动化采集系统计算A的L2范数平方。计算过程如下:
范数平方= 12 + 22 + 32 = 1 + 4 + 9 = 14。
因此,聚类中心数组A的L2范数平方为14。这个值越大,说明该簇中心在特征空间中的位置越稳定,对周围数据点的影响力也越大。
需要注意的是,步骤S136中计算的范数平方将用于后续步骤中更新空间间距影响变量等操作,因此其准确性和计算效率对于整个聚类过程至关重要。同时,不同的范数类型和计算方法可能会得到不同的范数平方值,因此在实际应用中需要根据具体需求和数据特性选择合适的范数类型和计算方法。
在图像处理和机器学习的背景下,数组间距通常用来量化不同数据点或聚类中心在多维特征空间中的相似性或差异性。在步骤S137中,高速公路资产数据自动化采集系统计算当前选定的“当下片段聚类中心”与其他所有目标图像片段簇中心之间的数组间距,并将这些间距值求和,以得到一个总和值。
具体来说,获取当前正在处理的“当下片段聚类中心”所对应的聚类中心数组。这个数组是一个多维向量,包含了该聚类中心在多个特征维度上的取值。接着,遍历目标图像片段簇中心集合中剩余的所有簇中心,并逐一计算它们与当下片段聚类中心之间的数组间距。数组间距的计算可以采用不同的距离度量方法,如欧氏距离、曼哈顿距离等,具体选择哪种方法取决于数据的特性和聚类的需求。
以欧氏距离为例,假设当下片段聚类中心的聚类中心数组为A=[a1, a2, ...,an],而目标图像片段簇中心集合中另一个簇中心的聚类中心数组为B=[b1, b2, ...,bn],那么它们之间的欧氏距离可以通过以下公式计算:
对每一个剩余的簇中心执行上述计算,得到一系列数组间距值。
最后,将这些数组间距值相加,得到一个总和值,即当下片段聚类中心与其他所有簇中心之间的数组间距和值。这个值反映了当下片段聚类中心在特征空间中与其他簇中心的相对位置关系,是后续更新空间间距影响变量等操作的重要依据。
需要注意的是,步骤S137中计算的数组间距和值将直接影响聚类结果的准确性和合理性。因此,在实际应用中,需要根据具体的数据特性和聚类需求选择合适的距离度量方法和参数设置,以确保计算结果的准确性和可靠性。
步骤S138涉及到更新聚类中心的空间间距影响变量。这个变量在聚类分析中非常重要,因为它影响了不同聚类中心之间的相对距离和权重,从而决定了数据点如何被划分到不同的簇中。在步骤S138中,高速公路资产数据自动化采集系统根据之前计算得到的范数平方和数组间距的和值来计算当下片段聚类中心迭代后的空间间距影响变量。具体来说,计算机会将范数平方作为分子,将数组间距的和值作为分母,然后进行相除操作,得到的结果就是更新后的空间间距影响变量。
这个计算过程可以看作是对当下片段聚类中心在特征空间中位置稳定性和影响力的量化评估。范数平方反映了聚类中心自身的稳定性和重要性,而数组间距的和值则体现了该聚类中心与其他聚类中心之间的相对距离和差异。通过计算这两者的商,可以得到一个综合指标,用于衡量当下片段聚类中心在整个聚类过程中的权重和影响力。
例如,假设当下片段聚类中心的范数平方为A,数组间距的和值为B,那么更新后的空间间距影响变量可以通过以下公式计算得到:
空间间距影响变量= A / B。
需要注意的是,这个计算过程中可能会涉及到一些数学运算和数据处理技巧,以确保计算结果的准确性和稳定性。例如,当分母B为0时,需要避免除以0的错误情况,可以通过添加一些小的正数来避免这个问题。
此外,步骤S138中计算得到的空间间距影响变量将用于后续的聚类迭代过程中,以更新聚类中心的位置和权重。通过不断迭代和优化这些参数,可以得到更加准确和合理的聚类结果。
在一种实施方式中,步骤S138,根据范数平方与数组间距的和值之间的商确定当下片段聚类中心迭代后的空间间距影响变量,可以包括:
步骤S1381:在当下片段聚类中心对应的图像片段簇中包括了新增图像片段集合中的新增图像片段时,将范数平方和数组间距的和值之间的商确定为对照影响变量。
步骤S1382:获取第一迭代速度变量,其中,迭代速度变量的取值范围为[0,1]。
步骤S1383:将第一迭代速度变量与对照影响变量的相乘结果,以及第二迭代速度变量与当下片段聚类中心对应的空间间距影响变量的相乘结果的相加值作为当下片段聚类中心迭代后的空间间距影响变量,其中,第二迭代速度变量与第一迭代速度变量的和值等于1。
步骤S1381涉及在特定条件下确定空间间距影响变量的值。在这个步骤中,高速公路资产数据自动化采集系统检查当下片段聚类中心对应的图像片段簇中是否包含了新增图像片段集合中的新增图像片段。如果包含,计算机会执行一个特定的操作来确定迭代后的空间间距影响变量,这个操作是基于范数平方和数组间距和值之间的商来进行的。具体来说,当高速公路资产数据自动化采集系统发现当下片段聚类中心对应的图像片段簇中包含了新增图像片段时,它会计算范数平方(代表聚类中心的稳定性或重要性)和数组间距和值(代表聚类中心与其他聚类中心之间的差异或距离)之间的商。这个商被称为对照影响变量,它反映了新增图像片段对当前聚类中心位置和权重的影响。
例如,假设当下片段聚类中心对应的图像片段簇中确实包含了新增图像片段,其范数平方为100,数组间距和值为50。根据步骤S1381,计算机会计算这两个值的商,即100/50=2,这个值就是对照影响变量。
需要注意的是,对照影响变量并不是最终的空间间距影响变量,它还需要与其他参数(如迭代速度变量)结合使用来计算出最终的空间间距影响变量。在步骤S138的后续步骤中,计算机会使用对照影响变量和迭代速度变量来更新当下片段聚类中心的空间间距影响变量,以便在后续的聚类迭代过程中使用。
此外,关于迭代速度变量的作用,它是用来控制影响变量迭代更新的速度或程度的。在步骤S1382和S1383中,计算机会获取第一迭代速度变量和第二迭代速度变量,并使用它们与对照影响变量和当前空间间距影响变量进行相乘和相加操作,以计算出更新后的空间间距影响变量。这两个迭代速度变量的和值等于1,意味着它们是相互关联的,共同决定了权重系数是如何根据新的信息和旧的信息进行更新的。当第一迭代速度变量较大时,新的信息(如对照影响变量)对更新后的空间间距影响变量的影响会更大;相反,当第二迭代速度变量较大时,旧的信息(如当前的空间间距影响变量)对更新后的空间间距影响变量的影响会更大。这种方法类似于在机器学习中使用的学习率参数,用于控制模型权重更新的速度。
步骤S1382中,高速公路资产数据自动化采集系统获取一个被称为第一迭代速度变量的参数。这个参数是一个取值范围在0到1之间的数值,如前所述,它用于控制影响变量在迭代更新过程中的速度或程度。迭代速度变量可以被视为一个权重系数,决定了新信息和旧信息在更新空间间距影响变量时的相对重要性。当第一迭代速度变量接近1时,新信息(如对照影响变量)对更新结果的影响将更大;而当其接近0时,新信息的影响将减小,旧信息的影响将相对增大。
以具体实例来说明,假设第一迭代速度变量被设置为0.7,这意味着在计算更新后的空间间距影响变量时,新信息的权重将占70%,而旧信息的权重将占剩余的30%。
步骤S1383中,高速公路资产数据自动化采集系统将使用第一迭代速度变量和第二迭代速度变量来计算当下片段聚类中心迭代后的空间间距影响变量。具体计算过程是:将第一迭代速度变量与对照影响变量相乘,得到一个新信息的加权值;同时将第二迭代速度变量与当下片段聚类中心对应的现有空间间距影响变量相乘,得到一个旧信息的加权值;最后将这两个加权值相加,得到更新后的空间间距影响变量。
需要注意的是,第二迭代速度变量与第一迭代速度变量的和必须等于1。这是因为它们共同决定了新信息和旧信息在更新过程中的相对重要性,并且它们的和等于1确保了权重系数的总和不会改变。
继续以上述实例为例,假设对照影响变量为3(根据范数平方和数组间距的和值之间的商计算得出),当下片段聚类中心对应的现有空间间距影响变量为2(根据前一次迭代或初始化设置得出),第一迭代速度变量为0.7。那么第二迭代速度变量就是1-0.7=0.3。接下来,高速公路资产数据自动化采集系统将执行以下计算:
新信息的加权值=0.7*3=2.1。
旧信息的加权值=0.3*2=0.6。
更新后的空间间距影响变量=2.1+0.6=2.7。
因此,经过这一步的计算后,当下片段聚类中心的空间间距影响变量将被更新为2.7。这个新的影响变量将在后续的聚类迭代过程中被用来调整聚类中心的位置和权重,从而影响整个聚类结果的形成。
在一种实施方式中,步骤S138,根据范数平方与数组间距的和值之间的商确定当下片段聚类中心迭代后的空间间距影响变量,可以包括:
步骤S138a:在当下片段聚类中心对应的图像片段簇中不包含新增图像片段集合中的新增图像片段时,将范数平方和数组间距的和值之间的商确定为对照影响变量,并获取与当下片段聚类中心对应的缓释变量,其中,缓释变量为对第一采集时刻和第二采集时刻之间的差值进行求倒的结果,第一采集时刻为新增图像片段集合对应的采集时刻,第二采集时刻为当下片段聚类中心对应的过往图像片段簇中最末一次添加过往图像片段对应的采集时刻。
步骤S138b:获取第一迭代速度变量,迭代速度变量的取值范围为[0,1]。
步骤S138c:将第一迭代速度变量、缓释变量与对照影响变量的相乘结果,以及第二迭代速度变量与当下片段聚类中心对应的空间间距影响变量的相乘结果的相加值作为当下片段聚类中心迭代后的空间间距影响变量,其中,第二迭代速度变量与第一迭代速度变量的和值等于1。
在步骤S138a中,高速公路资产数据自动化采集系统首先检查当下片段聚类中心对应的图像片段簇中是否包含新增图像片段集合中的新增图像片段。如果不包含,计算机会执行一系列操作来确定迭代后的空间间距影响变量。
具体来说,高速公路资产数据自动化采集系统计算范数平方和数组间距和值之间的商,这个商被称为对照影响变量。对照影响变量反映了当下片段聚类中心在不包含新增图像片段时的稳定性和重要性。然而,由于聚类过程是一个动态变化的过程,仅仅依靠对照影响变量可能无法准确反映聚类中心的实时状态。因此,步骤S138a中引入了一个缓释变量来调整影响变量的计算。
缓释变量是一个衰减参数,它是根据第一采集时刻和第二采集时刻之间的差值的倒数来计算的。第一采集时刻是新增图像片段集合对应的采集时刻,而第二采集时刻是当下片段聚类中心对应的过往图像片段簇中最末一次添加过往图像片段对应的采集时刻。通过计算这两个时刻之间的差值的倒数,可以得到一个反映时间间隔长短的缓释变量。当时间间隔较长时,差值的倒数会较小,即缓释变量的值会较小。这意味着旧信息(当下片段聚类中心对应的过往图像片段簇)的影响会随着时间的推移而逐渐减小。相反,当时间间隔较短时,差值的倒数会较大,即缓释变量的值会较大。这意味着旧信息的影响会相对较大。通过这种方式,缓释变量有助于使算法更加适应时间序列数据的动态变化特性。
在确定了对照影响变量和缓释变量之后,高速公路资产数据自动化采集系统可以使用它们来计算当下片段聚类中心迭代后的空间间距影响变量。
步骤S138b中,高速公路资产数据自动化采集系统需要获取一个被称为第一迭代速度变量的参数。这个参数是一个介于0和1之间的数值,用于控制影响变量在迭代更新过程中的速度或程度。迭代速度变量可以被视为一个权重系数,它决定了新信息和旧信息在更新空间间距影响变量时的相对重要性。具体来说,当第一迭代速度变量接近1时,新信息(如对照影响变量与缓释变量的乘积)对更新结果的影响将更大;而当其接近0时,新信息的影响将减小,旧信息的影响将相对增大。
例如,如果第一迭代速度变量被设置为0.8,这意味着在计算更新后的空间间距影响变量时,新信息的权重将占80%,而旧信息的权重将占剩余的20%。这种设置通常用于当算法需要更快地适应新信息时。
步骤S138c中,高速公路资产数据自动化采集系统将使用第一迭代速度变量、缓释变量、对照影响变量以及第二迭代速度变量和当下片段聚类中心对应的现有空间间距影响变量来计算当下片段聚类中心迭代后的空间间距影响变量。具体计算过程是:首先将第一迭代速度变量、缓释变量与对照影响变量相乘,得到一个新信息的加权值;同时将第二迭代速度变量与当下片段聚类中心对应的现有空间间距影响变量相乘,得到一个旧信息的加权值;最后将这两个加权值相加,得到更新后的空间间距影响变量。
需要注意的是,第二迭代速度变量与第一迭代速度变量的和必须等于1。这是因为它们共同决定了新信息和旧信息在更新过程中的相对重要性,并且它们的和等于1确保了权重系数的总和不会改变。
例如,假设对照影响变量为0.5(根据范数平方和数组间距的和值之间的商计算得出),缓释变量为0.6(根据第一采集时刻和第二采集时刻之间的差值的倒数计算得出),当下片段聚类中心对应的现有空间间距影响变量为0.4(根据前一次迭代或初始化设置得出),第一迭代速度变量为0.7。那么第二迭代速度变量就是1-0.7=0.3。
接下来,高速公路资产数据自动化采集系统将执行以下计算:
新信息的加权值=0.7*0.5*0.6=0.21(第一迭代速度变量、缓释变量与对照影响变量的相乘结果)。
旧信息的加权值=0.3*0.4=0.12(第二迭代速度变量与当下片段聚类中心对应的空间间距影响变量的相乘结果)。
更新后的空间间距影响变量=0.21+0.12=0.33。
因此,经过这一步的计算后,当下片段聚类中心的空间间距影响变量将被更新为0.33。这个新的影响变量将在后续的聚类迭代过程中被用来调整聚类中心的位置和权重,从而影响整个聚类结果的形成。同时,由于引入了缓释变量,算法能够更好地适应时间序列数据的动态变化特性,提高聚类的准确性和稳定性。
步骤S140:将目标片段空间间距大于预设片段空间间距的新增图像片段确定为可疑资产图像片段。
步骤S140中,高速公路资产数据自动化采集系统计算每个新增图像片段与已有图像片段之间的空间间距,这一空间间距可以通过多种方式来衡量,比如片段之间的特征欧氏距离。接着将计算出的空间间距与一个预设的片段空间间距阈值进行比较。这个预设阈值是根据实际应用需求和经验设定的,它代表了正常图像片段之间可以接受的最大空间间距。如果某个新增图像片段的空间间距大于这个预设阈值,那么计算机就会将其标记为可疑资产图像片段。
举例来说,假设正在使用计算机视觉系统来监测道路状况,系统定期采集道路图像并进行分析。在某次采集中,系统发现了一个新的图像片段,它显示了一段路面出现了明显的裂缝。当计算机计算这个新增图像片段与最近一次采集的图像片段之间的空间间距时,发现这个间距远大于正常的路面变化所应该产生的间距。这可能是因为裂缝是突然出现的,或者是由于采集设备的位置发生了变化导致的。无论哪种情况,这个新增图像片段都会被标记为可疑资产图像片段,并进一步触发系统的警报或后续处理流程。
在一种实施方式中,步骤S140,将目标片段空间间距大于预设片段空间间距的新增图像片段确定为可疑资产图像片段之后,方法还可以包括:
步骤S150:获取对目标高速公路图像流采集到的与目标采集时刻对应的新增图像片段集合,其中,新增图像片段集合中包括采集时刻在目标采集时刻指示的目标时刻后的多个新增图像片段;
步骤S160:将与目标采集时刻对应的新增图像片段集合中目标片段空间间距大于预设片段空间间距的新增图像片段确定为可疑资产图像片段。
在图像处理和分析的过程中,特别是针对高速公路图像流的实时监控与分析场景中,高速公路资产数据自动化采集系统需要能够快速而准确地识别出潜在的异常或问题。
步骤S140已经介绍了如何将目标片段空间间距大于预设片段空间间距的新增图像片段确定为可疑资产图像片段。这一步骤的核心在于通过比较新增图像片段与已有图像片段之间的空间间距,来识别出那些可能表示道路问题或其他资产异常的可疑片段。
紧接着,步骤S150进一步扩展了这一处理流程。在这一步骤中,高速公路资产数据自动化采集系统获取对目标高速公路图像流在特定采集时刻(即目标采集时刻)之后采集到的新增图像片段集合。这个集合中包含了在目标时刻之后采集到的多个新增图像片段,这些片段可能涵盖了不同的路段、不同的时间点,以及可能的道路状况变化。例如,假设目标采集时刻是下午3点,高速公路资产数据自动化采集系统收集从下午3点之后一段时间内(如接下来的一小时)采集到的所有新增图像片段,形成一个新增图像片段集合。这个集合可能包含了数百甚至数千个图像片段,每个片段都反映了高速公路上某一特定区域的实时状况。
最后,步骤S160对步骤S150中获取的新增图像片段集合进行进一步的分析和处理。与步骤S140类似,计算机会计算集合中每个新增图像片段与已有图像片段之间的空间间距,并将那些空间间距大于预设阈值的新增图像片段标记为可疑资产图像片段。这些可疑片段可能表示了道路上的各种问题,如裂缝、坑洼、障碍物等,需要进一步的关注和处理。
需要注意的是,在整个处理流程中,高速公路资产数据自动化采集系统可能会运用各种复杂的图像处理算法和机器学习模型来优化空间间距的计算和可疑片段的识别。例如,可以使用深度学习模型来提取图像片段中的特征向量,并通过比较这些特征向量之间的相似性来衡量空间间距。同时,还可以利用时间序列分析技术来处理图像流数据,以更好地捕捉道路状况的动态变化。
步骤S140~S160共同构成了一个高效且准确的图像处理和分析流程,能够帮助高速公路资产数据自动化采集系统快速识别出高速公路图像流中的可疑资产图像片段,为后续的监控和管理工作提供有力支持。
本申请实施例还提供了一种高速公路资产数据自动化采集系统,如图2所示,高速公路资产数据自动化采集系统100包括:处理器101和存储器103。其中,处理器101和存储器103相连,如通过总线102相连。可选地,高速公路资产数据自动化采集系统100还可以包括收发器104。需要说明的是,实际应用中收发器104不限于一个,该高速公路资产数据自动化采集系统100的结构并不构成对本申请实施例的限定。
处理器101可以是CPU,通用处理器,GPU,DSP,ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器101也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线102可包括一通路,在上述组件之间传送信息。总线102可以是PCI总线或EISA总线等。总线102可以分为地址总线、数据总线、控制总线等。为便于表示,图2中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器103可以是ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM、CD-ROM或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器103用于存储执行本申请方案的应用程序代码,并由处理器101来控制执行。处理器101用于执行存储器103中存储的应用程序代码,以实现前述任一方法实施例所示的内容。
本申请实施例提供了一种高速公路资产数据自动化采集系统,本申请实施例中的高速公路资产数据自动化采集系统包括:一个或多个处理器;存储器;一个或多个计算机程序,其中一个或多个计算机程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序被处理器执行时,实现上述方法。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,当计算机程序在处理器上运行时,使得处理器可以执行前述方法实施例中相应的内容。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (11)
1.一种高速公路资产数据自动化采集方法,其特征在于,所述方法包括:
获取对目标高速公路图像流采集到的新增图像片段集合,其中,所述新增图像片段集合中包括从所述目标高速公路图像流采集到的多个新增图像片段,所述新增图像片段中包括目标道路的依据拍摄时序排列的多个道路拍摄图像;
获取所述新增图像片段集合对应的当下片段聚类中心集合,以及基于在所述新增图像片段集合之前对所述目标高速公路图像流的过往图像片段集合获取到的过往图像片段聚类中心集合,其中,所述当下片段聚类中心集合用以表征对所述新增图像片段集合中各个新增图像片段的划簇结果,所述过往图像片段聚类中心集合用以表征对所述过往图像片段集合中各个过往图像片段的划簇结果,所述当下片段聚类中心集合中包括的多个当前聚类中心和所述过往图像片段聚类中心集合中包括的多个过往图像片段聚类中心分别用以表征一个图像片段簇;
在基于所述当下片段聚类中心集合对所述过往图像片段聚类中心集合迭代得到目标图像片段簇中心集合之后,将所述新增图像片段集合中的每个所述新增图像片段分别与所述目标图像片段簇中心集合中包括的多个目标图像片段簇中心进行计算,获得与每个所述新增图像片段配对的目标片段空间间距;
将所述目标片段空间间距大于预设片段空间间距的所述新增图像片段确定为可疑资产图像片段;
其中,在将所述新增图像片段集合中的每个所述新增图像片段分别与所述目标图像片段簇中心集合中包括的多个目标图像片段簇中心进行计算,获得与每个所述新增图像片段配对的目标片段空间间距之前,还包括:
分别获取所述当下片段聚类中心集合中的每一所述当下片段聚类中心,与所述过往图像片段聚类中心集合中的每一所述过往图像片段聚类中心之间的中心间距;
在所述过往图像片段聚类中心集合中包括所述中心间距小于聚类中心间距临界值的过往图像片段聚类中心时,将所述当下片段聚类中心对应的当下图像片段簇中的多个所述新增图像片段融入到所述过往图像片段聚类中心对应的过往图像片段簇,获得迭代后的所述过往图像片段簇,其中,所述过往图像片段聚类中心集合中的每一所述过往图像片段聚类中心分别对应于一个所述聚类中心间距临界值;
在所述过往图像片段聚类中心集合中不包括所述中心间距小于聚类中心间距临界值的过往图像片段聚类中心时,将所述当下片段聚类中心对应的当下图像片段簇作为所述过往图像片段簇中新增的所述过往图像片段簇;
将迭代后的过往图像片段簇集合中的过往图像片段簇分别对应的图像片段簇中心确定为所述目标图像片段簇中心集合中的所述目标图像片段簇中心。
2.根据权利要求1所述的方法,其特征在于,所述将迭代后的过往图像片段簇集合中的过往图像片段簇分别对应的图像片段簇中心确定为所述目标图像片段簇中心集合中的所述目标图像片段簇中心,包括:
在迭代后的所述过往图像片段簇集合中的目标过往图像片段簇中包括多个所述过往图像片段和所述当下图像片段簇中的多个所述新增图像片段时,分别获取所述当下图像片段簇中的多个所述新增图像片段对应的片段表征数组,与所述片段表征数组的翻转数组的数量积,以及基于多个所述新增图像片段分别对应的数量积和确定为与多个所述新增图像片段对应的新增表征结果;
根据所述目标过往图像片段簇中包括的所述过往图像片段对应的过往表征结果,和所述新增表征结果确定所述目标过往图像片段簇对应的所述目标图像片段簇中心;
在迭代后的所述过往图像片段簇集合中的目标过往图像片段簇中仅包含所述当下图像片段簇中的多个所述当下片段时,分别获取所述当下图像片段簇中的多个所述新增图像片段对应的片段表征数组,与所述片段表征数组的翻转数组的数量积,以及基于多个所述新增图像片段分别对应的数量积和确定为与多个所述新增图像片段对应的当下表征结果;
根据所述当下表征结果确定所述目标过往图像片段簇对应的所述目标图像片段簇中心;其中,所述目标过往图像片段簇中的多个片段分别对应的所述片段表征数组与所述目标图像片段簇中心对应的聚类中心数组之间的数组间距的和值不大于对照间距临界值。
3.根据权利要求1所述的方法,其特征在于,所述将迭代后的过往图像片段簇集合中的过往图像片段簇分别对应的图像片段簇中心确定为所述目标图像片段簇中心集合中的所述目标图像片段簇中心时,还包括:
在迭代后的所述过往图像片段簇集合中的目标过往图像片段簇中包括多个所述过往图像片段和所述当下图像片段簇中的多个所述新增图像片段时,获取所述当下图像片段簇中的多个所述新增图像片段分别的片段表征数组分别与所述当下片段聚类中心对应的聚类中心数组的数组间距的数组间距和值;
获取所述目标过往图像片段簇对应的所述聚类中心间距临界值,并获取与所述当下片段聚类中心对应的第一影响变量,以及与所述过往图像片段聚类中心对应的第二影响变量;
根据所述第一影响变量与所述数组间距和值的第一相乘结果,以及所述第二影响变量与所述聚类中心间距临界值的第二相乘结果确定所述目标图像片段簇中心对应的聚类中心间距临界值;
在迭代后的所述过往图像片段簇集合中的目标过往图像片段簇中仅包含所述当下图像片段簇中的多个所述当下片段时,获取所述当下图像片段簇中的多个所述新增图像片段分别的片段表征数组分别与所述当下片段聚类中心对应的聚类中心数组的数组间距的数组间距和值;
将所述数组间距和值确定为所述目标图像片段簇中心对应的聚类中心间距临界值。
4.根据权利要求1所述的方法,其特征在于,所述将所述新增图像片段集合中的每个所述新增图像片段分别与所述目标图像片段簇中心集合中包括的多个目标图像片段簇中心进行计算,获得与每个所述新增图像片段配对的目标片段空间间距,包括:
获取与所述目标图像片段簇中心集合中包括的多个所述目标图像片段簇中心分别对应的空间间距影响变量;
获取所述新增图像片段集合中的一个所述新增图像片段作为当前新增图像片段,对以下操作进行重复直到游走完当前新增图像片段集合中的每一所述新增图像片段:
分别获取所述当前新增图像片段与多个所述目标图像片段簇中心之间的对照片段空间间距;
根据多个目标图像片段簇中心分别对应的空间间距影响变量和获取的多个所述对照片段空间间距确定所述当前新增图像片段配对的所述目标片段空间间距。
5.根据权利要求4所述的方法,其特征在于,所述分别获取所述当前新增图像片段与多个所述目标图像片段簇中心之间的对照片段空间间距,包括:
在多个所述目标图像片段簇中心中逐一获取一个所述目标图像片段簇中心作为一个当下片段聚类中心,对以下操作进行重复直到游走完多个所述目标图像片段簇中心:
获取与所述当下片段聚类中心配对的当下片段聚类中心子集,所述当下片段聚类中心子集中包括所述当下片段聚类中心和多个对照图像片段簇中心,所述对照图像片段簇中心为分布位置处在所述当下片段聚类中心之前的目标图像片段簇中心;
分别获取所述当前新增图像片段对应的片段表征数组与所述当下片段聚类中心子集中的多个图像片段簇中心分别对应的聚类中心数组之间的闵可夫斯基距离;
将获取的多个所述闵可夫斯基距离中最小的结果确定为所述当前新增图像片段与所述当下片段聚类中心之间的所述对照片段空间间距。
6.根据权利要求4所述的方法,其特征在于,所述根据多个目标图像片段簇中心分别对应的空间间距影响变量和获取的多个所述对照片段空间间距确定所述当前新增图像片段配对的所述目标片段空间间距,包括:
根据多个目标图像片段簇中心分别对应的空间间距影响变量获取多个所述对照片段空间间距的调节融合值确定所述当前新增图像片段配对的第一片段空间间距;
根据每个所述新增图像片段分别对应的所述调节融合值对所述第一片段空间间距进行标准化,获得与当前新增图像片段配对的所述目标片段空间间距。
7.根据权利要求4所述的方法,其特征在于,所述根据多个目标图像片段簇中心分别对应的空间间距影响变量和获取的多个所述对照片段空间间距确定所述当前新增图像片段配对的所述目标片段空间间距之后,所述方法还包括:
逐一获取所述目标图像片段簇中心集合中的一个所述目标图像片段簇中心作为当下片段聚类中心,对以下操作进行重复直到游走完所述目标图像片段簇中心集合中的多个所述目标图像片段簇中心;
获取所述当下片段聚类中心对应的聚类中心数组的范数平方;
分别获取所述当下片段聚类中心对应的所述聚类中心数组,与所述目标图像片段簇中心集合中的其余所述目标图像片段簇中心对应的所述聚类中心数组之间的数组间距的和值;
根据所述范数平方与所述数组间距的和值之间的商确定所述当下片段聚类中心迭代后的所述空间间距影响变量。
8.根据权利要求7所述的方法,其特征在于,所述根据所述范数平方与所述数组间距的和值之间的商确定所述当下片段聚类中心迭代后的所述空间间距影响变量,包括:
在所述当下片段聚类中心对应的图像片段簇中包括了所述新增图像片段集合中的所述新增图像片段时,将所述范数平方和所述数组间距的和值之间的商确定为对照影响变量;
获取第一迭代速度变量,所述迭代速度变量的取值范围为[0,1];
将所述第一迭代速度变量与所述对照影响变量的相乘结果,以及第二迭代速度变量与所述当下片段聚类中心对应的所述空间间距影响变量的相乘结果的相加值作为所述当下片段聚类中心迭代后的所述空间间距影响变量,其中,所述第二迭代速度变量与所述第一迭代速度变量的和值等于1。
9.根据权利要求7所述的方法,其特征在于,所述根据所述范数平方与所述数组间距的和值之间的商确定所述当下片段聚类中心迭代后的所述空间间距影响变量,包括:
在所述当下片段聚类中心对应的图像片段簇中不包含所述新增图像片段集合中的所述新增图像片段时,将所述范数平方和所述数组间距的和值之间的商确定为对照影响变量,并获取与所述当下片段聚类中心对应的缓释变量,其中,所述缓释变量为对第一采集时刻和第二采集时刻之间的差值进行求倒的结果,所述第一采集时刻为所述新增图像片段集合对应的采集时刻,所述第二采集时刻为所述当下片段聚类中心对应的过往图像片段簇中最末一次添加所述过往图像片段对应的采集时刻;
获取第一迭代速度变量,所述迭代速度变量的取值范围为[0,1];
将所述第一迭代速度变量、所述缓释变量与所述对照影响变量的相乘结果,以及第二迭代速度变量与所述当下片段聚类中心对应的所述空间间距影响变量的相乘结果的相加值作为所述当下片段聚类中心迭代后的所述空间间距影响变量,其中,所述第二迭代速度变量与所述第一迭代速度变量的和值等于1。
10.根据权利要求1至9任意一项中所述的方法,其特征在于,所述将所述目标片段空间间距大于预设片段空间间距的所述新增图像片段确定为可疑资产图像片段之后,还包括:
获取对目标高速公路图像流采集到的与目标采集时刻对应的新增图像片段集合,其中,所述新增图像片段集合中包括采集时刻在所述目标采集时刻指示的目标时刻后的多个新增图像片段;
将与目标采集时刻对应的所述新增图像片段集合中所述目标片段空间间距大于所述预设片段空间间距的所述新增图像片段确定为所述可疑资产图像片段。
11.一种高速公路资产数据自动化采集系统,其特征在于,包括:
一个或多个处理器;
存储器;
一个或多个计算机程序;其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个计算机程序被所述处理器执行时,实现如权利要求1~10任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410349621.4A CN117953252B (zh) | 2024-03-26 | 2024-03-26 | 高速公路资产数据自动化采集方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410349621.4A CN117953252B (zh) | 2024-03-26 | 2024-03-26 | 高速公路资产数据自动化采集方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117953252A CN117953252A (zh) | 2024-04-30 |
CN117953252B true CN117953252B (zh) | 2024-05-31 |
Family
ID=90792433
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410349621.4A Active CN117953252B (zh) | 2024-03-26 | 2024-03-26 | 高速公路资产数据自动化采集方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117953252B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012159320A1 (zh) * | 2011-07-07 | 2012-11-29 | 华为技术有限公司 | 一种大规模图像数据的聚类方法及装置 |
KR101671215B1 (ko) * | 2015-05-27 | 2016-11-01 | 한국기술교육대학교 산학협력단 | 초기 후보군 제외방식을 이용한 고속 영상분할 방법 |
CN108764145A (zh) * | 2018-04-25 | 2018-11-06 | 哈尔滨工程大学 | 一种面向扎龙湿地遥感图像密度峰值聚类方法 |
WO2019137185A1 (zh) * | 2018-01-09 | 2019-07-18 | 美的集团股份有限公司 | 一种图片筛选方法及装置、存储介质、计算机设备 |
CN113516105A (zh) * | 2021-09-07 | 2021-10-19 | 腾讯科技(深圳)有限公司 | 一种车道检测方法、装置及计算机可读存储介质 |
CN116126985A (zh) * | 2022-12-29 | 2023-05-16 | 浙江口碑网络技术有限公司 | 道路生成方法、装置、设备与存储介质 |
CN117152459A (zh) * | 2023-10-30 | 2023-12-01 | 腾讯科技(深圳)有限公司 | 图像检测方法、装置、计算机可读介质及电子设备 |
CN117557569A (zh) * | 2024-01-12 | 2024-02-13 | 吉林交通职业技术学院 | 一种道路路面施工质量检测方法及系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10275683B2 (en) * | 2017-01-19 | 2019-04-30 | Cisco Technology, Inc. | Clustering-based person re-identification |
CN110765941B (zh) * | 2019-10-23 | 2022-04-26 | 北京建筑大学 | 一种基于高分遥感影像的海水污染区域识别方法和设备 |
WO2021098796A1 (zh) * | 2019-11-20 | 2021-05-27 | Oppo广东移动通信有限公司 | 图像处理方法、装置、设备及计算机可读存储介质 |
CN112581763A (zh) * | 2020-12-11 | 2021-03-30 | 北京百度网讯科技有限公司 | 道路事件检测的方法、装置、设备和存储介质 |
-
2024
- 2024-03-26 CN CN202410349621.4A patent/CN117953252B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012159320A1 (zh) * | 2011-07-07 | 2012-11-29 | 华为技术有限公司 | 一种大规模图像数据的聚类方法及装置 |
KR101671215B1 (ko) * | 2015-05-27 | 2016-11-01 | 한국기술교육대학교 산학협력단 | 초기 후보군 제외방식을 이용한 고속 영상분할 방법 |
WO2019137185A1 (zh) * | 2018-01-09 | 2019-07-18 | 美的集团股份有限公司 | 一种图片筛选方法及装置、存储介质、计算机设备 |
CN108764145A (zh) * | 2018-04-25 | 2018-11-06 | 哈尔滨工程大学 | 一种面向扎龙湿地遥感图像密度峰值聚类方法 |
CN113516105A (zh) * | 2021-09-07 | 2021-10-19 | 腾讯科技(深圳)有限公司 | 一种车道检测方法、装置及计算机可读存储介质 |
CN116126985A (zh) * | 2022-12-29 | 2023-05-16 | 浙江口碑网络技术有限公司 | 道路生成方法、装置、设备与存储介质 |
CN117152459A (zh) * | 2023-10-30 | 2023-12-01 | 腾讯科技(深圳)有限公司 | 图像检测方法、装置、计算机可读介质及电子设备 |
CN117557569A (zh) * | 2024-01-12 | 2024-02-13 | 吉林交通职业技术学院 | 一种道路路面施工质量检测方法及系统 |
Non-Patent Citations (1)
Title |
---|
基于改进YOLOv4的公路路面信息识别算法研究;古丽妮尕尔·阿卜来提;《市政技术》;20240205;第42卷(第2期);第45-55页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117953252A (zh) | 2024-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10467526B1 (en) | Artificial intelligence system for image similarity analysis using optimized image pair selection and multi-scale convolutional neural networks | |
WO2021189730A1 (zh) | 检测异常高密子图的方法、装置、设备及存储介质 | |
US10997459B2 (en) | Video content indexing and searching | |
CN112069398A (zh) | 一种基于图网络的信息推送方法及装置 | |
CN111310662B (zh) | 一种基于集成深度网络的火焰检测识别方法及系统 | |
CN106780639B (zh) | 基于显著性特征稀疏嵌入和极限学习机的哈希编码方法 | |
CN109995611B (zh) | 流量分类模型建立及流量分类方法、装置、设备和服务器 | |
CN116662817B (zh) | 物联网设备的资产识别方法及系统 | |
CN113936175A (zh) | 一种识别视频中的事件的方法及系统 | |
CN110795599B (zh) | 基于多尺度图的视频突发事件监测方法及系统 | |
Fan et al. | Adaptive crowd segmentation based on coherent motion detection | |
CN113569657A (zh) | 一种行人重识别方法、装置、设备及存储介质 | |
CN117953252B (zh) | 高速公路资产数据自动化采集方法及系统 | |
US20230274167A1 (en) | Task Learning System and Method, and Related Device | |
US20230386185A1 (en) | Statistical model-based false detection removal algorithm from images | |
CN117152528A (zh) | 绝缘子状态识别方法、装置、设备、存储介质和程序产品 | |
WO2020237501A1 (zh) | 一种多源协同道路车辆监控系统 | |
CN116664867A (zh) | 一种基于多证据融合选取训练样本的特征提取方法及装置 | |
CN111652102A (zh) | 一种输电通道目标物辨识方法及系统 | |
CN110442798A (zh) | 基于网络表示学习的垃圾评论用户群组检测方法 | |
CN114401398B (zh) | 智能视频运维管理系统 | |
CN115100725B (zh) | 目标识别方法、目标识别装置以及计算机存储介质 | |
CN117235559B (zh) | 一种基于边缘计算的物联网数据采集方法及系统 | |
CN110765817A (zh) | 人群计数模型的选择方法、装置、设备及其存储介质 | |
CN112529038B (zh) | 一种主板物料的识别方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |