CN117788798A - 目标检测方法、装置、视觉检测系统及电子设备 - Google Patents
目标检测方法、装置、视觉检测系统及电子设备 Download PDFInfo
- Publication number
- CN117788798A CN117788798A CN202311813646.7A CN202311813646A CN117788798A CN 117788798 A CN117788798 A CN 117788798A CN 202311813646 A CN202311813646 A CN 202311813646A CN 117788798 A CN117788798 A CN 117788798A
- Authority
- CN
- China
- Prior art keywords
- detection
- target
- image
- detected
- detection information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 412
- 230000000007 visual effect Effects 0.000 title abstract description 8
- 238000012216 screening Methods 0.000 claims abstract description 30
- 238000000034 method Methods 0.000 claims abstract description 28
- 238000012545 processing Methods 0.000 claims abstract description 24
- 230000000875 corresponding effect Effects 0.000 claims description 31
- 238000004590 computer program Methods 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 11
- 238000001914 filtration Methods 0.000 claims description 5
- 230000002596 correlated effect Effects 0.000 claims description 4
- 230000005764 inhibitory process Effects 0.000 claims description 4
- 238000011179 visual inspection Methods 0.000 claims description 4
- 230000007547 defect Effects 0.000 description 15
- 230000008569 process Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000004927 fusion Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000007797 corrosion Effects 0.000 description 3
- 238000005260 corrosion Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000005286 illumination Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 230000003190 augmentative effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本申请公开了一种目标检测方法、装置、视觉检测系统及电子设备,属于图像处理技术领域。方法包括:获取待检测图像,待检测图像包括多个检测目标;将待检测图像分别输入至多个目标检测模型,得到多个目标检测模型输出的多个检测目标的检测信息,检测信息包括目标类别和置信度;基于目标类别,将检测信息进行分类;根据置信度,对分类后的检测信息进行筛选,得到待检测图像中多个检测目标的检测结果。该方法通过多个目标检测模型分别对待检测图像进行目标检测,并对每个目标检测模型输出的检测信息进行分类和置信度筛选,快速得到高精度的检测结果,能够覆盖不同类型和复杂度的目标检测任务,提高了目标检测模型的泛化能力和鲁棒性。
Description
技术领域
本申请属于图像处理领域,尤其涉及一种目标检测方法、装置、视觉检测系统及电子设备。
背景技术
随着深度学习技术的迅速发展,目标检测技术在工业领域的应用越来越广泛,尤其是将目标检测技术与实例分割技术相结合。
然而,工业领域的目标检测具有背景复杂、检测目标种类繁多的特点,现有的目标检测技术在检测的精度和速度上有待提高。
发明内容
本申请旨在至少解决现有技术中存在的技术问题之一。为此,本申请提出一种目标检测方法、装置、视觉检测系统及电子设备,提升了复杂场景下目标检测的精度和速度。
第一方面,本申请提供了一种目标检测方法,该方法包括:
获取待检测图像,所述待检测图像包括多个检测目标;
将所述待检测图像分别输入至多个目标检测模型,得到所述多个目标检测模型输出的所述多个检测目标的检测信息,所述检测信息包括目标类别和置信度;
基于所述目标类别,将所述检测信息进行分类;
根据所述置信度,对分类后的所述检测信息进行筛选,得到所述待检测图像中所述多个检测目标的检测结果。
根据本申请的目标检测方法,通过多个目标检测模型分别对待检测图像进行目标检测,并对每个目标检测模型输出的检测信息进行分类和置信度筛选,快速得到高精度的检测结果,能够覆盖不同类型和复杂度的目标检测任务,提高了目标检测模型的泛化能力和鲁棒性。
根据本申请的一个实施例,所述根据所述置信度,对分类后的所述检测信息进行筛选,得到所述待检测图像中所述多个检测目标的检测结果,包括:
根据所述待检测图像中所述多个目标类别的检测难度系数,确定每个所述目标类别对应的置信度阈值;
在每个所述目标类别对应的所述检测信息中,筛选所述置信度不低于所述置信度阈值的检测信息,得到所述检测结果。
根据本申请的一个实施例,所述检测信息还包括目标检测框,所述根据所述置信度,对分类后的所述检测信息进行筛选,得到所述待检测图像中所述多个检测目标的检测结果,包括:
根据筛选后的所述检测信息的所述置信度,确定每个所述目标类别的交并比阈值;
基于所述目标类别和所述筛选后的所述检测信息,通过非极大值抑制对所述交并比大于所述交并比阈值的所述目标检测框进行过滤,生成所述检测结果。
根据本申请的一个实施例,所述目标类别对应的所述交并比阈值与所述筛选后的所述检测信息的所述置信度成正相关。
根据本申请的一个实施例,所述多个目标检测模型是的网络结构不同,所述目标检测模型通过图像样本集训练得到。
第二方面,本申请提供了一种目标检测装置,该装置包括:
获取模块,用于获取待检测图像,所述待检测图像包括多个检测目标;
第一处理模块,用于将所述待检测图像分别输入至多个目标检测模型,得到所述多个目标检测模型输出的所述多个检测目标的检测信息,所述检测信息包括目标类别和置信度;
第二处理模块,用于基于所述目标类别,将所述检测信息进行分类;
第三处理模块,用于根据所述置信度,对分类后的所述检测信息进行筛选,得到所述待检测图像中所述多个检测目标的检测结果。
第三方面,本申请提供了一种视觉检测系统,该系统包括:
图像采集装置,所述图像采集装置用于采集待检测图像;
数据处理装置,所述数据处理装置与所述图像采集装置电连接,所述数据处理装置用于执行如上述第一方面所述的目标检测方法。
第四方面,本申请提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的目标检测方法。
第五方面,本申请提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的目标检测方法。
第六方面,本申请提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的目标检测方法。
第七方面,本申请提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的目标检测方法。
本申请的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本申请实施例提供的目标检测方法的流程示意图之一;
图2是本申请实施例提供的目标检测方法的流程示意图之二;
图3是本申请实施例提供的目标检测方法的流程示意图之三;
图4是本申请实施例提供的目标检测装置的结构示意图;
图5是本申请实施例提供的视觉检测系统的结构示意图;
图6是本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的目标检测方法、目标检测装置、视觉检测系统、电子设备和可读存储介质进行详细地说明。
其中,目标检测方法可应用于终端,具体可由,终端中的硬件或软件执行。
该终端包括但不限于具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话或平板电脑等便携式通信设备。还应当理解的是,在某些实施例中,该终端可以不是便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。
以下各个实施例中,描述了包括显示器和触摸敏感表面的终端。然而,应当理解的是,终端可以包括诸如物理键盘、鼠标和控制杆的一个或多个其它物理用户接口设备。
本申请实施例提供的目标检测方法,该目标检测方法的执行主体可以为电子设备或者电子设备中能够实现该目标检测方法的功能模块或功能实体,本申请实施例提及的电子设备包括但不限于手机、平板电脑、电脑、相机和可穿戴设备等,下面以电子设备作为执行主体为例对本申请实施例提供的目标检测方法进行说明。
如图1所示,该目标检测方法包括:步骤110至步骤140。
步骤110、获取待检测图像,待检测图像包括多个检测目标。
其中,待检测图像可以是图像采集装置或视频监控设备对多个检测目标采集的图像,检测目标是待检测图像上需要被检测的对象。
例如,在缺陷检测场景下,待检测图像是对待检测工件拍摄的图像,检测目标可以是异物、划痕、腐蚀点等缺陷。
再例如,在产品传送场景下,待检测图像是对传送带区域拍摄的图像,检测目标可以是产品的条形码和二维码等。
再例如,在产品周转场景下,待检测图像是对仓库环境采集的图像,检测目标可以是产品和货架。
步骤120、将待检测图像分别输入至多个目标检测模型,得到多个目标检测模型输出的多个检测目标的检测信息,检测信息包括目标类别和置信度。
其中,多个目标检测模型可以为根据多个样本图像以及与样本图像一一对应的样本标签训练得到的,训练每个检测模型的多个样本图像可以是同一批次,也可以是不同批次。
每个样本图像均为同一场景下拍摄的,例如,在缺陷检测场景下拍摄的样本工件的图像。
需要说明的是,本申请的目标检测模型执行的目标检测任务是由样本图像和样本图像携带的样本标签确定的,在后续的实施例中,均以工件的缺陷检测场景为例对本申请的方案进行说明,其不视为对本申请保护范围的限定。
例如,目标类别可以是异物、划痕或腐蚀点等缺陷的分类,检测目标是待检测图像中工件上的异物、划痕或腐蚀点等缺陷。
可以理解的是,不同目标检测模型对复杂场景下不同检测目标的学习能力具有差异,每个目标检测模型对待检测图像中每个目标类别的检测能力不同。
在实际的执行中,将待检测图像分别输入至每个目标检测模型,每个目标检测模型分别对待检测图像进行目标检测,并输出对应的待检测图像中检测目标的目标类别和置信度。
例如,目标检测模型A检测目标类别为划痕的置信度较高,目标检测模型B检测小面积缺陷的置信度较高。
其中,目标检测的置信度是指目标检测模型对检测到的检测目标的信心程度,通常以概率的形式表示。
在目标检测任务中,目标检测模型会对待检测图像中的每个检测目标提供一个置信度,表示目标检测模型认为该检测目标存在的概率。
置信度能够确定目标检测模型对目标检测的准确性,通常来说,置信度越高,表示目标检测模型对输出的检测信息越有信心。
步骤130、基于目标类别,将检测信息进行分类。
在实际的执行中,在得到所有的目标检测模型输出的检测信息之后,对所有目标检测模型输出的检测信息进行汇总,在汇总的结果中,将每个检测目标的检测信息按照目标类别进行分类。
例如,将目标类别为异物的检测信息划分为一类,将目标类别为划痕的检测信息划分为另一类。
步骤140、根据置信度,对分类后的检测信息进行筛选,得到待检测图像中多个检测目标的检测结果。
在实际的执行中,对于某一目标类别对应的所有的检测信息,筛选出置信度较高的一部分检测信息作为这个目标类别对应的检测结果。
例如,对目标类别为异物的检测信息按照置信度由高到低进行排序,将置信度为前40%的检测信息筛选出来,并将筛选出的所有的目标类别对应的检测信息进行汇总,作为检测结果,实现将多个目标检测模型的输出整合成一个综合的输出,输出为检测结果。
根据本申请实施例提供的目标检测方法,通过多个目标检测模型分别对待检测图像进行目标检测,并对每个目标检测模型输出的检测信息进行分类和置信度筛选,快速得到高精度的检测结果,能够覆盖不同类型和复杂度的目标检测任务,提高了目标检测模型的泛化能力和鲁棒性。
在一些实施例中,多个目标检测模型是的网络结构不同,目标检测模型通过图像样本集训练得到。
实例分割多任务学习(Multitask Learning,MTL)面对的场景复杂,一般情况下检测目标大小和位置分布极不均匀,单个的目标检测模型的检测能力有限,因此本申请对多个目标检测模型进行训练。
样本图像集中可以包括多个图像样本,以及与图像样本一一对应的样本标签。
需要说明的是,每个目标检测模型的结构不同,可以是同一体系下不同结构的网络模型,例如单阶段目标检测算法(You Only Look Once,YOLO)体系中,YOLOv5、YOLOv8,或是YOLOv6-nano、RepYOLOv8,也可以是不同体系下不同结构的网络模型,例如稀疏网络(Sparsens)、YOLO、区域卷积神经网络(Region-Convolutional Neural Networks,R-CNN)等,以覆盖对不同检测目标的检测任务类型和复杂度。
例如,微小的缺陷往往难以检测,由于这种缺陷在待检测图像中可能非常小,甚至只有几个像素大小,对于这些微小的缺陷,需要基于高分辨率的图像和高灵敏度的检测算法构建的目标检测模型才能进行有效的检测。
再例如,颜色变化和纹理缺陷通常是由于工件表面的某些区域与其他区域之间的微小差异引起的。这些差异可能不容易被肉眼察觉,并且通常需要复杂的算法构建的目标检测模型来进行检测。
再例如,当工件的某些部分被其他物体或工件遮挡时,就会出现遮挡和重叠问题,目标检测模型需要能够识别和分离不同的物体或工件。
再例如,某些缺陷具有复杂的不规则形状,如裂纹、断边等,这些缺陷往往难以检测,因为它们的形状和大小可能会随着时间和位置的变化而发生变化,不同的目标检测模型对这些缺陷的检测能力不同。
再例如,在实际情况中,工件可能同时存在多种缺陷,这使得缺陷检测任务变得更加困难,在这种情况下,多个目标检测模型能够同时检测和定位多种不同类型的缺陷。
其中,每个目标检测模型在训练的过程中可以使用同一个图像样本集,也可以使用不同的图像样本集。
在实际的执行中,在缺陷检测场景下,使用图像采集装置对多个样本工件进行图像采集,得到多个初始工件图像,并对每个初始工件图像上的检测目标进行标记,得到每个初始工件图像对应的样本标签。
对初始工件图像随机进行旋转、缩放、调整颜色对比度等数据增强,并进行尺寸归一化,得到尺寸大小统一的多个样本图像。
将多个样本图像,以及与多个样本图像一一对应的样本标签的组合,构建图像样本集。
将图像样本集中的样本图像分别输入至多个待训练的目标检测模型进行训练,对每个目标检测模型进行参数调优,完成目标检测模型的训练。
在该实施例中,通过不同的网络结构构建多个目标检测模型,使得多个目标检测模型在目标检测任务中能够覆盖对不同检测目标的检测任务类型和复杂度,使得检测结果更加准确和全面,与单一模型相比,在面对广泛的多分类任务复杂场景时,具有更强大的模型性能。
在一些实施例中,步骤140、根据置信度,对分类后的检测信息进行筛选,得到待检测图像中多个检测目标的检测结果,包括:
根据待检测图像中多个目标类别的检测难度系数,确定每个目标类别对应的置信度阈值;
在每个目标类别对应的检测信息中,筛选置信度不低于置信度阈值的检测信息,得到检测结果。
需要说明的是,不同目标类别的大小特征和识别难易程度不同,需要根据每个目标类别的检测难度系数,对不同的目标类别设置不同的置信度阈值。
检测难度系数可以根据待检测图像中每个目标类别的检测目标的目标尺寸、目标数量、类别多样性、视角和姿态变化、光照和背景复杂性,以及样本图像集中样本标签标注质量等因素综合确定,因此,不同的待检测图像中的目标类别对应不同的检测难度系数,并对应设置不同的置信度阈值,即目标得分阈值(score_thr)。
检测目标在待检测图像中的尺寸大小可以影响检测的难易程度,较小的检测目标在待检测图像中占据的像素较少,特征不够明显,易于被背景干扰或其他目标遮挡,往往更难检测。
待检测图像中检测目标的数量越多,检测任务就越复杂,当检测目标之间存在遮挡、相互重叠或靠近的情况时,目标检测模型需要更好地处理这些复杂情况,以准确地检测出每个检测目标。
目标检测任务的难度还与检测目标的类别多样性有关,如果检测图像中的检测目标属于不同的类别并具有不同的外观特征,目标检测模型需要具备更强的泛化能力和区分能力,以准确地识别和定位每个类别的检测目标。
如果检测目标在待检测图像中具有不同的视角或姿态变化,例如旋转、倾斜等,这也会增加检测任务的难度,目标检测模型需要能够适应不同的检测目标的变化情况,以实现准确的检测。
待检测图像中的光照条件和背景复杂性也会对目标检测任务的难度产生影响,光照变化或者复杂的背景可能导致检测目标与背景融合,使检测目标的边界或特征不明显,从而增加了检测的难度。
样本图像集中样本标签标注质量也会对目标检测任务的难度产生影响,如果标注不准确、模糊或存在误差,目标检测模型在学习过程中可能受到干扰,从而降低了检测的准确性。
在实际的执行中,根据待检测图像中每个目标类别的检测难度系数,对每个目标类别设置对应的置信度阈值,对每个目标类别对应的检测信息进行筛选,将置信度不低于该目标类别的置信度阈值的检测信息筛选出来,对筛选出的所有的目标类别对应的检测信息进行汇总,作为检测结果。
在该实施例中,通过对不同的目标类别设置不同的置信度阈值,从而能够兼顾到检测结果的全面性和准确性。
在一些实施例中,检测信息还包括目标检测框,根据置信度,对分类后的检测信息进行筛选,得到待检测图像中多个检测目标的检测结果,包括:
根据筛选后的检测信息的置信度,确定每个目标类别的交并比阈值;
基于目标类别和筛选后的检测信息,通过非极大值抑制对交并比大于交并比阈值的目标检测框进行过滤,生成检测结果。
可以理解的是,由于筛选出来的检测信息中包含不同的目标检测模型输出的目标检测框,可能会出现同一个检测目标存在多个目标检测框,也可能出现不同的检测目标的目标检测框之间存在部分重叠,因此需要设置交并比阈值(IoU_thr,IoU阈值),并通过执行非极大值抑制(Non-Maximum Suppression,NMS)对同一目标类别的目标检测框计算交并比(Intersection over Union,IoU),对交并比大于交并比阈值的目标检测框进行过滤,去掉冗余的目标检测框,将剩下的目标检测框对应的检测信息进行整合,作为最终的检测结果。
在该实施例中,将筛选后的所有目标检测模型的检测信息,依据不同目标类别的不同置信度,分配不同的交并比阈值,并对目标检测框进行筛选,得到最佳的检测结果。
在一些实施例中,目标类别对应的交并比阈值与筛选后的检测信息的置信度成正相关。
在实际的执行中,依据不同目标类别中置信度分配不同的交并比阈值,筛选后的检测信息的置信度越大,设置的交并比阈值越高,筛选后的检测信息的置信度越小,设置的交并比阈值越低。
在该实施例中,根据各目标类别对应的检测信息的置信度,分别设置不同的交并比阈值,以适应不同任务的重要性。
下面介绍一个具体的实施例。
如图2所示,对于输入的多个初始工件图像,进行如下的数据处理:
对每个初始工件图像上的检测目标进行标记,得到每个初始工件图像对应的样本标签。
对初始工件图像随机进行旋转、缩放、调整颜色对比度等数据增强,并进行尺寸归一化,得到尺寸大小统一的多个样本图像。
将多个样本图像,以及与多个样本图像一一对应的样本标签的组合,构建图像样本集。
将图像样本集中的样本图像分别输入至N个待训练的目标检测模型,对N个目标检测模型进行训练,对每个目标检测模型进行参数调优,完成目标检测模型的训练。
N个目标检测模型可以包括:多任务模型1、多任务模型2、…、多任务模型N。
在N个目标检测模型的应用过程中,将待检测图像分别输入至多任务模型1、多任务模型2、…、多任务模型N,对应地,输出的检测信息包括:预测结果1、预测结果2、…、预测结果N,针对实例分割任务中复杂场景的精确定位和分类的需求,加入多模型融合模块,对预测结果1、预测结果2、…、预测结果N进行汇总和筛选,作为最佳模型输出的检测结果。
其中,多模型融合模块可以是通过脚本实现的,用于高效地融合多个目标检测模型的结果得到最佳模型。
在该实施例中,提供一种创新的深度多任务最佳模型筛选方法,通过训练多个目标检测模型,再整合多个目标检测模型输出的检测信息筛选出最佳模型输出的检测结果来提高深度学习模型的性能,特别适用于多任务学习和迁移学习场景。
如图3所示,在多模型融合模块中,对预测结果1、预测结果2、…、预测结果N进行汇总,将汇总后的预测结果按照目标类别进行分类,得到类别1的检测信息、类别2的检测信息、…、类别N的检测信息,目标类别的种类与目标检测模型的个数不相关。
将每个目标类别的检测信息按照置信度进行排序,并对每个目标类别设置对应的置信度阈值,对于类别1的检测信息,按类别1的置信度阈值进行预测结果的筛选,去掉低于类别1的置信度阈值的检测信息,对于类别2的检测信息,按类别2的置信度阈值进行预测结果的筛选,去掉低于类别2的置信度阈值的检测信息,以此类推,对于类别N的检测信息,按类别N的置信度阈值进行预测结果的筛选,去掉低于类别N的置信度阈值的检测信息,直至每个目标类别的检测信息筛选完成。
对每个目标类别设置对应的IoU阈值,对筛选后的类别1的检测信息,按类别1的IoU阈值进行预测结果筛选,保留符合类别1的IoU阈值的检测信息,对筛选后的类别2的检测信息,按类别2的IoU阈值进行预测结果筛选,保留符合类别2的IoU阈值的检测信息,以此类推,对筛选后的类别N的检测信息,按类别N的IoU阈值进行预测结果筛选,保留符合类别N的IoU阈值的检测信息,直至每个目标类别的检测信息筛选完成,将再次筛选后的检测信息进行合并,得到检测结果并输出。
其中,对不同的目标类别设置不同的置信度阈值和IoU阈值,识别难度大、样本图像数量比较少以及较为复杂的目标类别对应的检测难度系数较高,对应设置的置信度阈值和IoU阈值较低,检测难度系数较低的目标类别,对应设置的置信度阈值和IoU阈值较高。
在该实施例中,通过训练多个相同体系不同结构或不同体系不同结构的目标检测模型,以覆盖不同的任务类型和复杂度,通过将所有目标检测模型的预测结果,依据不同类别不同置信度分配不同的NMS阈值最优权重筛选,得到最佳模型的检测结果,融合阶段经过动态调整各目标检测模型输出的置信度阈值和IoU阈值作为权重,以适应不同任务的重要性,与单一模型相比,在面对广泛的多分类任务复杂场景时,具有更强大的模型性能;通过将多个目标检测模型输出的检测信息进行整合,提高了目标检测模型的泛化能力和鲁棒性,还能够将多个目标检测模型集成为一个模块,能够动态适应不用的目标检测任务需求,提高了应用场景的灵活性。
本申请实施例提供的目标检测方法,执行主体可以为目标检测装置。本申请实施例中以目标检测装置执行目标检测方法为例,说明本申请实施例提供的目标检测装置。
本申请实施例还提供一种目标检测装置。
如图4所示,该目标检测装置包括:获取模块410、第一处理模块420、第二处理模块430和第三处理模块440。
获取模块410,用于获取待检测图像,待检测图像包括多个检测目标;
第一处理模块420,用于将待检测图像分别输入至多个目标检测模型,得到多个目标检测模型输出的多个检测目标的检测信息,检测信息包括目标类别和置信度;
第二处理模块430,用于基于目标类别,将检测信息进行分类;
第三处理模块440,用于根据置信度,对分类后的检测信息进行筛选,得到待检测图像中多个检测目标的检测结果。
根据本申请实施例提供的目标检测装置,通过多个目标检测模型分别对待检测图像进行目标检测,并对每个目标检测模型输出的检测信息进行分类和置信度筛选,快速得到高精度的检测结果,能够覆盖不同类型和复杂度的目标检测任务,提高了目标检测模型的泛化能力和鲁棒性。
在一些实施例中,第三处理模块440,进一步用于:
根据待检测图像中多个目标类别的检测难度系数,确定每个目标类别对应的置信度阈值;
在每个目标类别对应的检测信息中,筛选置信度不低于置信度阈值的检测信息,得到检测结果。
在一些实施例中,检测信息还包括目标检测框,第三处理模块440,还用于:
根据筛选后的检测信息的置信度,确定每个目标类别的交并比阈值;
基于目标类别和筛选后的检测信息,通过非极大值抑制对交并比大于交并比阈值的目标检测框进行过滤,生成检测结果。
在一些实施例中,目标类别对应的交并比阈值与筛选后的检测信息的置信度成正相关。
在一些实施例中,多个目标检测模型是的网络结构不同,目标检测模型通过图像样本集训练得到。
本申请实施例中的目标检测装置可以是电子设备,也可以是电子设备中的部件,例如集成电路或芯片。该电子设备可以是终端,也可以为除终端之外的其他设备。示例性的,电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、移动上网装置(Mobile Internet Device,MID)、增强现实(augmented reality,AR)/虚拟现实(virtualreality,VR)设备、机器人、可穿戴设备、超级移动个人计算机(ultra-mobile personalcomputer,UMPC)、上网本或者个人数字助理(personal digital assistant,PDA)等,还可以为服务器、网络附属存储器(Network Attached Storage,NAS)、个人计算机(personalcomputer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的目标检测装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为iOS操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
本申请实施例提供的目标检测装置能够实现图1至图3的目标检测方法实施例实现的各个过程,为避免重复,这里不再赘述。
在一些实施例中,如图5所示,本申请实施例还提供一种视觉检测系统,包括:
图像采集装置510,图像采集装置510用于采集待检测图像;
数据处理装置520,数据处理装置520与图像采集装置510电连接,数据处理装置520用于实现上述目标检测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,数据处理装置可以为写入该目标检测方法的算法程序的芯片、CPU等装置。
在一些实施例中,如图6所示,本申请实施例还提供一种电子设备600,包括处理器601、存储器602及存储在存储器602上并可在处理器601上运行的计算机程序,该程序被处理器601执行时实现上述目标检测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,本申请实施例中的电子设备包括上述的移动电子设备和非移动电子设备。
本申请实施例还提供一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述目标检测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,处理器为上述实施例中的电子设备中的处理器。可读存储介质,包括计算机可读存储介质,如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。
本申请实施例还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述目标检测方法。
其中,处理器为上述实施例中的电子设备中的处理器。可读存储介质,包括计算机可读存储介质,如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。
本申请实施例另提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现上述目标检测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例的方法。
在本申请的描述中,“多个”的含义是两个或两个以上。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本申请的实施例,本领域的普通技术人员可以理解:在不脱离本申请的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本申请的范围由权利要求及其等同物限定。
Claims (10)
1.一种目标检测方法,其特征在于,包括:
获取待检测图像,所述待检测图像包括多个检测目标;
将所述待检测图像分别输入至多个目标检测模型,得到所述多个目标检测模型输出的所述多个检测目标的检测信息,所述检测信息包括目标类别和置信度;
基于所述目标类别,将所述检测信息进行分类;
根据所述置信度,对分类后的所述检测信息进行筛选,得到所述待检测图像中所述多个检测目标的检测结果。
2.根据权利要求1所述的目标检测方法,其特征在于,所述根据所述置信度,对分类后的所述检测信息进行筛选,得到所述待检测图像中所述多个检测目标的检测结果,包括:
根据所述待检测图像中所述多个目标类别的检测难度系数,确定每个所述目标类别对应的置信度阈值;
在每个所述目标类别对应的所述检测信息中,筛选所述置信度不低于所述置信度阈值的检测信息,得到所述检测结果。
3.根据权利要求1所述的目标检测方法,其特征在于,所述检测信息还包括目标检测框,所述根据所述置信度,对分类后的所述检测信息进行筛选,得到所述待检测图像中所述多个检测目标的检测结果,包括:
根据筛选后的所述检测信息的所述置信度,确定每个所述目标类别的交并比阈值;
基于所述目标类别和所述筛选后的所述检测信息,通过非极大值抑制对所述交并比大于所述交并比阈值的所述目标检测框进行过滤,生成所述检测结果。
4.根据权利要求3所述的目标检测方法,其特征在于,所述目标类别对应的所述交并比阈值与所述筛选后的所述检测信息的所述置信度成正相关。
5.根据权利要求1-4任一项所述的目标检测方法,其特征在于,所述多个目标检测模型是的网络结构不同,所述目标检测模型通过图像样本集训练得到。
6.一种目标检测装置,其特征在于,包括:
获取模块,用于获取待检测图像,所述待检测图像包括多个检测目标;
第一处理模块,用于将所述待检测图像分别输入至多个目标检测模型,得到所述多个目标检测模型输出的所述多个检测目标的检测信息,所述检测信息包括目标类别和置信度;
第二处理模块,用于基于所述目标类别,将所述检测信息进行分类;
第三处理模块,用于根据所述置信度,对分类后的所述检测信息进行筛选,得到所述待检测图像中所述多个检测目标的检测结果。
7.一种视觉检测系统,其特征在于,包括:
图像采集装置,所述图像采集装置用于采集待检测图像;
数据处理装置,所述数据处理装置与所述图像采集装置电连接,所述数据处理装置用于执行权利要求1-5任一项的目标检测方法。
8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-5任一项所述目标检测方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-5任一项所述的目标检测方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-5任一项所述目标检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311813646.7A CN117788798A (zh) | 2023-12-26 | 2023-12-26 | 目标检测方法、装置、视觉检测系统及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311813646.7A CN117788798A (zh) | 2023-12-26 | 2023-12-26 | 目标检测方法、装置、视觉检测系统及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117788798A true CN117788798A (zh) | 2024-03-29 |
Family
ID=90392122
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311813646.7A Pending CN117788798A (zh) | 2023-12-26 | 2023-12-26 | 目标检测方法、装置、视觉检测系统及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117788798A (zh) |
-
2023
- 2023-12-26 CN CN202311813646.7A patent/CN117788798A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110060237B (zh) | 一种故障检测方法、装置、设备及系统 | |
US10902568B2 (en) | System and method for finding lines in an image with a vision system | |
US11699283B2 (en) | System and method for finding and classifying lines in an image with a vision system | |
JP7316731B2 (ja) | ビジョンシステムで画像内のパターンを検出及び分類するためのシステム及び方法 | |
CN110909712B (zh) | 运动目标检测方法、装置、电子设备及存储介质 | |
KR102153962B1 (ko) | 비전 시스템으로 이미지에서 라인을 찾기 위한 시스템 및 방법 | |
CN112734691A (zh) | 一种工业制品缺陷检测方法、装置、终端设备及存储介质 | |
CN111223078B (zh) | 瑕疵等级判定的方法及存储介质 | |
US20240078801A1 (en) | System and method for finding and classifying lines in an image with a vision system | |
CN112767354A (zh) | 基于图像分割的缺陷检测方法、装置、设备及存储介质 | |
CN112668577A (zh) | 大尺度图像中目标物体的检测方法、终端及装置 | |
KR20240058827A (ko) | 비전 시스템을 이용하여 이미지에서 라인들을 찾고 분류하기 위한 시스템 및 방법 | |
CN117788444A (zh) | Smt贴片偏移检测方法、装置及视觉检测系统 | |
CN110866931A (zh) | 图像分割模型训练方法及基于分类的强化图像分割方法 | |
CN117809115A (zh) | Smt贴片错件检测方法、装置及视觉检测系统 | |
CN110689556A (zh) | 跟踪方法、装置及智能设备 | |
Noroozi et al. | Towards Optimal Defect Detection in Assembled Printed Circuit Boards Under Adverse Conditions | |
CN117788798A (zh) | 目标检测方法、装置、视觉检测系统及电子设备 | |
CN115829929A (zh) | 产品表面图像的缺陷检测方法、装置、设备及存储介质 | |
CN114550062A (zh) | 图像中运动对象的确定方法、装置、电子设备和存储介质 | |
Zhong et al. | Detection of oxidation region of flexible integrated circuit substrate based on topology mapping | |
CN109543565B (zh) | 一种数量确定方法及装置 | |
Jang et al. | A defect inspection method for machine vision using defect probability image with deep convolutional neural network | |
CN117746004A (zh) | 工业关键点定位方法、装置及视觉检测系统 | |
CN109670519B (zh) | 图像处理装置和图像处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |