CN117292178A - 目标检测方法、装置、计算机设备及计算机可读存储介质 - Google Patents
目标检测方法、装置、计算机设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN117292178A CN117292178A CN202311178374.8A CN202311178374A CN117292178A CN 117292178 A CN117292178 A CN 117292178A CN 202311178374 A CN202311178374 A CN 202311178374A CN 117292178 A CN117292178 A CN 117292178A
- Authority
- CN
- China
- Prior art keywords
- deep
- features
- target
- feature
- resolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 96
- 238000003860 storage Methods 0.000 title claims abstract description 18
- 230000004927 fusion Effects 0.000 claims abstract description 162
- 238000000034 method Methods 0.000 claims abstract description 34
- 238000004590 computer program Methods 0.000 claims description 23
- 238000005520 cutting process Methods 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 10
- 238000001914 filtration Methods 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 description 16
- 230000004913 activation Effects 0.000 description 14
- 238000012545 processing Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 238000005259 measurement Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000003416 augmentation Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种目标检测方法、装置、计算机设备及计算机可读存储介质。方法包括:确定待检测图像的浅层特征和不同分辨率的多个深层特征;拼接浅层特征与第一目标深层特征得到拼接特征;第一目标深层特征是多个深层特征中与浅层特征的分辨率相匹配的深层特征;将非目标深层特征与对应的多个深层特征中更高分辨率的深层特征进行融合,得到深层融合特征;非目标深层特征是指除第一目标深层特征外的深层特征;对拼接特征、深层融合特征和第二目标深层特征进行进阶融合,得到进阶融合特征;第二目标深层特征是指最低分辨率的非目标深层特征;基于进阶融合特征对待检测图像进行目标检测,得到检测结果。采用本申请,能够提高目标检测的准确性。
Description
技术领域
本申请涉及图像处理技术领域,特别是涉及一种目标检测方法、装置、计算机设备及计算机可读存储介质。
背景技术
随着图像处理技术的发展,出现了目标检测技术,它旨在从图像或视频中准确地检测和定位特定的目标物体。目标检测主要任务是确定目标的类别和位置,通常使用边界框或像素级掩码来表示目标的位置。
传统的目标检测技术在处理小目标时通常表现不佳。这是由于尺寸很小的目标在图像中的特征往往不明显,特征信号弱,容易被干扰,导致难以准确检测。
发明内容
基于此,有必要针对上述技术问题,提供一种目标检测方法、装置、计算机设备、计算机可读存储介质以及计算机程序产品,能够提高目标检测的准确性。
第一方面,本申请提供了一种目标检测方法,包括:
确定待检测图像的浅层特征和不同分辨率的多个深层特征;
拼接浅层特征与第一目标深层特征得到拼接特征;第一目标深层特征是多个深层特征中与浅层特征的分辨率相匹配的深层特征;
将非目标深层特征与对应的多个深层特征中更高分辨率的深层特征进行融合,得到深层融合特征;非目标深层特征是指多个深层特征中除第一目标深层特征外的深层特征;
对拼接特征、深层融合特征和第二目标深层特征进行进阶融合,得到进阶融合特征;第二目标深层特征是指最低分辨率的非目标深层特征;
基于进阶融合特征对待检测图像进行目标检测,得到检测结果。
第二方面,本申请提供了一种目标检测装置,包括:
确定模块,用于确定待检测图像的浅层特征和不同分辨率的多个深层特征;
拼接模块,用于拼接浅层特征与第一目标深层特征得到拼接特征;第一目标深层特征是多个深层特征中与浅层特征的分辨率相匹配的深层特征;
第一融合模块,用于将非目标深层特征与对应的多个深层特征中更高分辨率的深层特征进行融合,得到深层融合特征;非目标深层特征是指多个深层特征中除第一目标深层特征外的深层特征;
第二融合模块,用于对拼接特征、深层融合特征和第二目标深层特征进行进阶融合,得到进阶融合特征;第二目标深层特征是指最低分辨率的非目标深层特征;
检测模块,用于基于进阶融合特征对待检测图像进行目标检测,得到检测结果。
第三方面,本申请提供了一种计算机设备,计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行该计算机程序时实现上述的方法中的步骤。
第四方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的方法中的步骤。
第五方面,本申请提供了一种计算机程序产品,计算机程序产品包括计算机程序,该计算机程序被处理器执行时实现本上述的方法中的步骤。
上述目标检测方法、装置、计算机设备、计算机可读存储介质及计算机程序产品,待检测图像的浅层特征主要关注图像的细节纹理。不同分辨率的深层特征更注重图像的语义信息。由于小目标的语义信息较弱而纹理信息较强,纹理信息相对于语义信息更加直观和显著,因此在小目标的检测中能够起到更重要的作用,拼接浅层特征与分辨率相匹配的第一目标深层特征,得到的拼接特征同时具有丰富的纹理信息和语义信息。较低分辨率的深层特征是较粗糙但尺度更大的语义特征,而较高分辨率的深层特征是更精细但尺度更小的语义特征。将非目标深层特征与对应的多个深层特征中更高分辨率的深层特征进行融合,得到的深层融合特征具备更丰富的语义信息。对拼接特征、深层融合特征和第二目标深层特征进行进阶融合,能够得到具备更丰富的纹理信息和语义信息的进阶融合特征。并且,第二目标深层特征是指最低分辨率的非目标深层特征,对于最低分辨率的非目标深层特征来说,无法与更低分辨率的深层特征形成深层融合特征,因此进阶融合中额外引入最低分辨率的非目标深层特征,能够实现全分辨率的特征融合,提供丰富的全局信息。进而基于进阶融合特征对待检测图像进行目标检测,能够更好地关注待检测图像中的目标,得到更加准确的检测结果,提高了目标检测的准确性。
附图说明
图1为本申请实施例提供的一种目标检测方法的流程示意图;
图2为本申请实施例提供的一种骨干网络的结构示意图;
图3为本申请实施例提供的一种目标检测模型的结构示意图;
图4为本申请实施例提供的一种目标检测装置的结构框图;
图5为本申请实施例提供的一种计算机设备的内部结构图;
图6为本申请实施例提供的另一种计算机设备的内部结构图;
图7为本申请实施例提供的一种计算机可读存储介质的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
如图1所示,本申请实施例提供了一种目标检测方法,以该方法应用于计算机设备为例进行说明。该方法包括以下步骤:
S102、确定待检测图像的浅层特征和不同分辨率的多个深层特征。
在一些实施例中,待检测图像可以但不限于是高曝光图像。可以理解,高曝光图像对于微小且细长目标的成像更加友好。比如,基于高曝光图像可以较好地对毛丝进行成像。
在一些实施例中,计算机设备可以对待检测图像进行初始卷积处理,得到浅层特征。基于浅层特征进行逐步下采样及特征融合处理,得到不同分辨率的多个深层特征。
在一些实施例中,计算机设备可以获取待检测图像的不同分辨率的多个初始深层特征。对每个分辨率的初始深层特征进行卷积处理,得到每个分辨率的深层特征。
在一些实施例中,计算机设备可以通过多个分辨率分别对应的分支网络对待检测图像进行多阶段的特征提取,得到浅层特征和不同分辨率的多个初始深层特征。
在一些实施例中,计算机设备可以对每个分辨率的初始深层特征依次执行卷积操作、归一化操作和激活操作,得到每个分辨率的深层特征。
在一些实施例中,计算机设备可以获取通过最高分辨率对应的分支网络在第一阶段输出的浅层特征。从第二阶段至最后一阶段,在每一阶段中,每一分辨率对应的分支网络的输入包括下采样后的更高分辨率对应的分支网络在上一阶段的输出、以及上采样后的更低分辨率对应的分支网络在上一阶段的输出。获取不同分辨率对应的分支网络在最后一阶段输出的多个初始深层特征。其中,从第一阶段到最后一阶段,对应最浅层至最深层。分支网络对应的分辨率越小,分支网络输出的特征的通道数越大。
在一些实施例中,计算机设备可以将待检测图像输入至骨干网络,获取骨干网络在第一阶段输出的浅层特征,以及在最后一阶段输出的不同分辨率的多个初始深层特征。
在一些实施例中,骨干网络可以但不限于是轻量级的高分辨率网络(High-Resolution Network-small)。如图2所示,提供了骨干网络的结构示意图。骨干网络包括四个分支网络,四个分支网络分别对应四个不同的分辨率。待检测图像输入至骨干网络后,获取最高分辨率对应的分支网络在第一阶段输出的浅层特征O0,获取基于四个分支网络在第四阶段输出的不同分辨率的四个初始深层特征O1、O2、O3、O4。
在一些实施例中,待检测图像存在细长目标。细长目标的语义信息较弱而纹理信息较强,结合浅层特征能够获取更加精细的纹理信息,使得对细长目标的检测更加准确。
在一些实施例中,细长目标可以是毛丝等丝状或毛状目标。比如,待检测图像中呈现了工件,而在工件的生产中不可避免地会附着毛丝,通过本申请实施例提供的方法,能够准确地检测出工件上的毛丝。
在一些实施例中,计算机设备可以包括终端和服务器中的至少一种。可以理解,本申请实施例提供的方法可以应用于终端或服务器,也可以应用于包括终端和服务器的系统,通过终端和服务器的交互实现。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备及便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
S104、拼接浅层特征与第一目标深层特征得到拼接特征;第一目标深层特征是多个深层特征中与浅层特征的分辨率相匹配的深层特征。
在一些实施例中,计算机设备可以将最高分辨率的浅层特征和最高分辨率的深层特征进行拼接,得到最高分辨率的拼接特征。
在一些实施例中,第一目标深层特征对应的分辨率不低于浅层特征对应的分辨率。计算机设备可以将上采样后的浅层特征与更高分辨率的第一目标深层特征进行拼接,以得到更高分辨率的拼接特征。或者直接将浅层特征与同分辨率的第一目标深层特征进行拼接,得到该分辨率的拼接特征。
可以理解,浅层特征主要包含低级的图像信息,如纹理信息,而更高分辨率的深层特征则包含了更高级的语义信息。通过拼接这两者,可以充分利用图像的低级细节纹理和高级语义信息,帮助更好地理解目标。然而,浅层特征与更低分辨率的深层特征拼接的效果可能相对较差,因为低分辨率的深层特征缺少细节信息,可能会对特征拼接引入较多的噪声和模糊化信息,从而降低准确性。并且,在将浅层特征与所有分辨率的深层特征进行拼接时,这种全尺度的特征拼接可能会引入大量冗余信息,增加计算复杂度,并且可能会对目标的细节和上下文信息进行过度平滑处理,导致不够精确和准确的结果。
在一些实施例中,计算机设备可以将浅层特征与第一目标深层特征初步拼接得到初始拼接特征,对初始拼接特征进行卷积处理,得到拼接特征。可以理解,初步拼接是将浅层特征与第一目标深层特征简单地拼接在一起,经过卷积处理后得到特征通道数与深层特征相同的拼接特征。
在一些实施例中,计算机设备可以对初始拼接特征依次执行卷积操作、归一化操作和激活操作,得到拼接特征。
S106、将非目标深层特征与对应的多个深层特征中更高分辨率的深层特征进行融合,得到深层融合特征;非目标深层特征是指多个深层特征中除第一目标深层特征外的深层特征。
其中,非目标深层特征对应的多个深层特征中更高分辨率的深层特征,是指分辨率比非目标深层特征对应的分辨率更高的深层特征。
在一些实施例中,计算机设备可以对每一分辨率的非目标深层特征进行上采样处理,将上采样后的每一分辨率的非目标深层特征与对应的多个深层特征中更高分辨率的深层特征进行融合,以得到更高分辨率的深层融合特征。可以理解,最低分辨率的非目标深层特征无法与更低分辨率的深层特征形成最低分辨率的深层融合特征。上述的更高分辨率的深层融合特征中不包括最低分辨率的深层融合特征。后续需要在进阶融合中引入最低分辨率的非目标深层特征,以达到全分辨率的特征融合的目的。
在一些实施例中,计算机设备可以将每一分辨率的非目标深层特征与每一分辨率的上一分辨率的深层特征进行融合,以得到每一分辨率的上一分辨率的深层融合特征。
在一些实施例中,计算机设备可以将每一分辨率的非目标深层特征与每一分辨率的上一分辨率的非目标深层特征进行融合,以得到每一分辨率的上一分辨率的深层融合特征。
在一些实施例中,计算机设备可以对每一分辨率的非目标深层特征进行上采样处理,将上采样后的每一分辨率的非目标深层特征与每一分辨率的上一分辨率的非目标深层特征进行叠加,以得到每一分辨率的上一分辨率的深层融合特征。
在一些实施例中,计算机设备可以对每一分辨率的非目标深层特征依次执行卷积操作、归一化操作、激活操作和上采样操作后,得到上采样后的每一分辨率的非目标深层特征。
在一些实施例中,计算机设备可以对上采样后的每一分辨率的非目标深层特征与每一分辨率的上一分辨率的非目标深层特征执行点对点相加操作,以得到每一分辨率的上一分辨率的深层融合特征。
S108、对拼接特征、深层融合特征和第二目标深层特征进行进阶融合,得到进阶融合特征;第二目标深层特征是指最低分辨率的非目标深层特征。
在一些实施例中,计算机设备可以将每一分辨率的深层融合特征与每一分辨率的上一分辨率的拼接特征进行融合,得到每一分辨率的上一分辨率的拼接融合特征。将不同分辨率的各拼接融合特征、不同分辨率的各深层融合特征和第二目标深层特征进行融合,得到进阶融合特征。
在一些实施例中,不同分辨率的多个初始深层特征分别经过卷积处理后,得到的多个深层特征的特征通道数相同。比如,多个深层特征的特征通道数均为64。
在一些实施例中,计算机设备可以将不同分辨率的各拼接融合特征、不同分辨率的各深层融合特征和第二目标深层特征进行通道拼接,得到进阶融合特征。比如,一个拼接特征和三个深层特征的特征通道数均为64时,进阶融合特征的通道数为256。
在一些实施例中,计算机设备可以对拼接融合特征、不同分辨率的多个深层融合特征和第二目标深层特征进行上采样处理,使得上采样后的拼接融合特征、任意上采样后的深层融合特征和上采样后的第二目标深层特征对应同一分辨率。比如,拼接融合特征、多个深层融合特征和第二目标深层特征均可上采样至最高分辨率。
在一些实施例中,计算机设备可以对拼接融合特征依次执行卷积操作、归一化操作、激活操作和上采样操作后,得到上采样后的拼接融合特征。对每个深层融合特征分别依次执行卷积操作、归一化操作、激活操作和上采样操作后,得到多个上采样后的深层融合特征。对第二目标深层特征依次执行卷积操作、归一化操作、激活操作和上采样操作后,得到上采样后的第二目标深层特征。
在一些实施例中,计算机设备可以将上采样后的拼接融合特征、多个上采样后的深层融合特征和上采样后的第二目标深层特征进行通道拼接,得到进阶融合特征。
S110、基于进阶融合特征对待检测图像进行目标检测,得到检测结果。
在一些实施例中,计算机设备可以对进阶融合特征进行卷积处理,得到检测结果。检测结果用于表征待检测图像中的目标。
在一些实施例中,计算机设备可以对进阶融合特征依次执行卷积操作和上采样操作,使得卷积操作后的特征被上采样至待检测图像的尺寸,得到检测结果。
可见,在本申请实施例中,待检测图像的浅层特征主要关注图像的细节纹理。不同分辨率的深层特征更注重图像的语义信息。由于小目标的语义信息较弱而纹理信息较强,纹理信息相对于语义信息更加直观和显著,因此在小目标的检测中能够起到更重要的作用,拼接浅层特征与分辨率相匹配的第一目标深层特征,得到的拼接特征同时具有丰富的纹理信息和语义信息。较低分辨率的深层特征是较粗糙但尺度更大的语义特征,而较高分辨率的深层特征是更精细但尺度更小的语义特征。将非目标深层特征与对应的多个深层特征中更高分辨率的深层特征进行融合,得到的深层融合特征具备更丰富的语义信息。对拼接特征、深层融合特征和第二目标深层特征进行进阶融合,能够得到具备更丰富的纹理信息和语义信息的进阶融合特征。并且,第二目标深层特征是指最低分辨率的非目标深层特征,对于最低分辨率的非目标深层特征来说,无法与更低分辨率的深层特征形成深层融合特征,因此进阶融合中额外引入最低分辨率的非目标深层特征,能够实现全分辨率的特征融合,提供丰富的全局信息。进而基于进阶融合特征对待检测图像进行目标检测,能够更好地关注待检测图像中的目标,得到更加准确的检测结果,提高了目标检测的准确性。
在一些实施例中,将非目标深层特征与对应的多个深层特征中更高分辨率的深层特征进行融合,得到深层融合特征,包括:
将最低分辨率的非目标深层特征与最低分辨率的上一分辨率的非目标深层特征进行融合,得到最低分辨率的上一分辨率的深层融合特征;
从最低分辨率的上一分辨率起,依次将每一分辨率的深层融合特征与每一分辨率的上一分辨率的非目标深层特征进行融合,确定每一分辨率的上一分辨率的深层融合特征,得到不同分辨率的多个深层融合特征。
其中,最低分辨率的上一分辨率是指倒数第二低的分辨率。
在一些实施例中,计算机设备可以对最低分辨率的非目标深层特征进行上采样处理,将上采样后的最低分辨率的非目标深层特征与最低分辨率的上一分辨率的非目标深层特征进行叠加,得到最低分辨率的上一分辨率的深层融合特征。其中,上采样处理可以包括依次执行的卷积操作、归一化操作、激活操作和上采样操作。
在一些实施例中,计算机设备可以从最低分辨率的上一分辨率起,依次对每一分辨率的深层融合特征进行上采样处理,将上采样后的每一分辨率的深层融合特征与每一分辨率的上一分辨率的非目标深层特征进行叠加,确定每一分辨率的上一分辨率的深层融合特征。
可见,在本实施例中,通过将最低分辨率的非目标深层特征与最低分辨率的上一分辨率的非目标深层特征进行融合,得到最低分辨率的上一分辨率的深层融合特征;从最低分辨率的上一分辨率起,依次将每一分辨率的深层融合特征与每一分辨率的上一分辨率的非目标深层特征进行融合,能够确定出语义信息更加丰富的每一分辨率的上一分辨率的深层融合特征。
在一些实施例中,第一目标深层特征是多个深层特征中最高分辨率的深层特征;
对拼接特征、深层融合特征和第二目标深层特征进行进阶融合,得到进阶融合特征,包括:
将最高分辨率的拼接特征与最高分辨率的下一分辨率的深层融合特征进行融合,得到最高分辨率的拼接融合特征;
将最高分辨率的拼接融合特征、不同分辨率的多个深层融合特征和第二目标深层特征进行融合,得到进阶融合特征。
在一些实施例中,拼接特征对应的分辨率为最高分辨率。不同分辨率的多个深层融合特征为从最低分辨率的上一分辨率至最高分辨率的下一分辨率的深层融合特征。拼接特征对应的分辨率更高,且与深层融合特征对应的分辨率不存在交集。
在一些实施例中,计算机设备可以对最高分辨率的下一分辨率的深层融合特征进行上采样处理,将最高分辨率的拼接特征与上采样后的最高分辨率的下一分辨率的深层融合特征进行叠加,得到最高分辨率的拼接融合特征。
在一些实施例中,计算机设备可以对最高分辨率的拼接融合特征、不同分辨率的多个深层融合特征、以及第二目标深层特征分别进行上采样处理,将上采样后的拼接融合特征、多个上采样后的深层融合特征、以及上采样后的第二目标深层特征进行通道拼接,得到进阶融合特征。
可见,在本实施例中,通过将最高分辨率的拼接特征与最高分辨率的下一分辨率的深层融合特征进行融合,得到最高分辨率的拼接融合特征;将最高分辨率的拼接融合特征、不同分辨率的多个深层融合特征、以及第二目标深层特征进行融合,能够得到包括更丰富的纹理信息和语义信息进阶融合特征,基于进阶融合特征预测细长目标时更不容易出现预测的目标断裂的现象,提高目标检测的准确性。
在一些实施例中,检测结果是将待检测图像输入至目标检测模型得到的输出;目标检测模型的训练步骤,包括:
获取具有目标区域的原始图像;
根据第一预设概率对原始图像中的目标区域进行图像裁切,得到第一样本图像;
根据第二预设概率对原始图像进行随机裁切,得到第二样本图像;
基于第一样本图像和第二样本图像对待训练的目标检测模型进行训练,以得到训练完毕的目标检测模型。
在一些实施例中,原始图像是指实际场景下收集的具有毛丝这类异物缺陷的图像。原始图像中的毛丝区域使用折线段进行标注,并绘制出包括预设宽度的折线段区域的标签掩膜。预设宽度不小于毛丝区域的宽度,比如,毛丝粗细小于4像素,位于1-3像素,预设宽度可以为4像素。
在一些实施例中,第一预设概率大于第二预设概率。计算机设备可以以第一预设概率将原始图像中的目标区域作为中心进行图像裁切,得到第一样本图像。并以第二预设概率对原始图像随机区域进行裁切,得到第二样本图像。比如,第一预设概率可以是90%,第二预设概率可以是10%。
在一些实施中,计算机设备可以根据第三预设概率对第一样本图像和第二样本图像进行空间增广或颜色增广等中的至少一种处理,得到训练样本图像。空间增广可以包括随机旋转或随机翻转等中的至少一种。颜色增广可以包括随机亮度、随机对比度、随机饱和度、随机伽马变换或随机色温等中的至少一种。
在一些实施例中,计算机设备可以以第三预设概率对第一样本图像和第二样本图像进行空间增广后再进行颜色增广,得到训练样本图像。
在一些实施例中,目标检测模型包括骨干网络和预测头。目标检测模型可以但不限于是语义分割模型。
在一些实施例中,计算机设备可以将训练样本图像输入至待训练的目标检测模型,得到目标检测模型输出的预测结果;基于预测结果与标签掩膜之间的差异计算损失值;基于损失值进行梯度反向传播训练目标检测模型。
在一些实施例中,计算机设备可以基于预测结果与标签掩膜确定焦点损失(FocalLoss)和戴斯损失(Dice Loss);对焦点损失和戴斯损失进行加权求和得到损失值。比如,焦点损失和戴斯损失的加权比例可以是20:1。
在一些实施例中,计算机设备可以使用自适应学习率的优化器(Adam优化器,Adaptive Moment Estimation优化器),以及使用余弦函数下降策略动态调整学习率,对目标检测模型进行训练。其中,最大学习率可以设置为1e-3。
在一些实施例中,如图3所示,提供了目标检测模型的结构示意图。预测头的输入为骨干网络针对待检测图像输出的浅层特征O0、第一分辨率的初始深层特征O1、第二分辨率的初始深层特征O2、第三分辨率的初始深层特征O3及第四分辨率的初始深层特征O4。O0与O1对应的分辨率相同,均为最高分辨率。预测头用于基于浅层特征和不同分辨率的多个深层特征进行目标检测。
预测头将O0与O1初步拼接得到初始拼接特征。通过1*1卷积+归一化+激活的处理流程对初始拼接特征进行卷积处理,得到64通道的拼接特征。其中,归一化可以但不限于是批归一化(Batch Normalization)。激活可以是基于修正线性单元(Rectified LinearUnit,ReLU)实现的。
预测头分别对O2、O3和O4执行1*1卷积+归一化+激活,得到64通道的第二分辨率的深层特征、第三分辨率的深层特征和第四分辨率的深层特征。
预测头对第四分辨率的深层特征执行1*1卷积+归一化+激活+2倍上采样后与第三分辨率的深层特征进行点对点相加,得到第三分辨率的深层融合特征。
预测头对第三分辨率的深层融合特征执行1*1卷积+归一化+激活+2倍上采样后与第二分辨率的深层特征进行点对点相加,得到第二分辨率的深层融合特征。
预测头对第二分辨率的深层融合特征执行1*1卷积+归一化+激活+2倍上采样后与第一分辨率的拼接特征进行点对点相加,得到第一分辨率的拼接融合特征。
预测头分别对第一分辨率的拼接融合特征、第二分辨率的深层融合特征、第三分辨率的深层融合特征和第四分辨率的深层特征执行1*1卷积+归一化+激活和上采样操作后,得到上采样后的拼接融合特征、多个上采样后的深层融合特征和上采样后的第四分辨率的深层特征。将上采样后的拼接融合特征、多个上采样后的深层融合特征和上采样后的第四分辨率的深层特征进行通道拼接,得到256通道的进阶融合特征。
预测头对进阶融合特征执行1*1卷积+上采样,得到二值化图像。可以理解,二值化图像就是预测掩膜,用于指示待检测图像中的目标。
可见,在本实施例中,通过根据第一预设概率对原始图像中的目标区域进行图像裁切,得到第一样本图像;根据第二预设概率对原始图像进行随机裁切,得到第二样本图像;基于第一样本图像和第二样本图像对待训练的目标检测模型进行训练,以得到训练完毕的目标检测模型,能够保证目标检测模型更加关注目标区域,增加检出能力。
在一些实施例中,检测结果包括二值化图像,二值化图像用于指示待检测图像中的目标;方法还包括:
对二值化图像进行骨架化处理,得到骨架图像;
对骨架图像进行滤波,确定目标的骨架上任意斜向的斜向像素点;
根据目标的骨架上的斜向像素点和非斜向像素点分别对应的长度,确定目标在真实场景中的长度。
在一些实施例中,待检测图像可以是工件图像。计算机设备可以获取高曝光成像的工件图像。通过目标检测模型对工件图像进行目标检测,输出二值化图像。二值化图像中工件上毛丝所在区域值为1,背景非毛丝区域值为0。
在一些实施例中,计算机设备可以通过包括两个卷积核的滤波器对骨架图像进行滤波,得到两个滤波结果。两个卷积核分别用于滤出两个不同斜向上的像素点。每个滤波结果都是和骨架图像尺寸相同的二值化图像,用于指示相应斜向上的斜向像素点。其中,两个卷积核分别是[1 0;0 1]和[0 1;1 0]。
在一些实施例中,计算机设备可以根据斜向像素点的数量和斜向像素点对应的长度、以及非斜向像素点的数量和非斜向像素点对应的长度,确定目标在真实场景中的长度。
可见,在本实施例中,本申请实施例提供的目标检测方法对尺寸小和形态细长的目标有很强的检出能力,获取到的二值化图像更加准确。通过对二值化图像进行骨架化处理,得到骨架图像;对骨架图像进行滤波,确定目标的骨架上任意斜向的斜向像素点;根据目标的骨架上的斜向像素点和非斜向像素点分别对应的长度,能够准确地确定出目标在真实场景中的长度。
在一些实施例中,根据目标的骨架上的斜向像素点和非斜向像素点分别对应的长度,确定目标在真实场景中的长度,包括:
确定目标的骨架上的斜向像素点对应的权重;权重是根据斜向像素点对应的长度与非斜向像素点对应的长度之间的差异确定的;
根据权重对斜向像素点的数量进行加权,得到加权结果;
对目标的骨架上的像素点总数和加权结果进行叠加,得到叠加结果;
根据叠加结果对非斜向像素点对应的长度进行加权,得到目标在真实场景中的长度。
在一些实施例中,像素被视为一个正方形,斜向像素点对应的长度为非斜向像素点对应的长度的√2倍,则斜向像素点对应的权重为√2-1。
在一些实施例中,计算机设备可以使用权重对斜向像素点的数量进行加权,得到加权结果。对目标的骨架上的像素点总数、加权结果和偏置参数进行求和计算,得到叠加结果。叠加结果用于表征目标的骨架的像素长度。如公式(1)为叠加结果的计算公式。
K<sub>i</sub>=Sum(S<sub>i</sub>)+(√2-1)(Sum(F<sub>1</sub>(S<sub>i</sub>))+Sum(F<sub>2</sub>(S<sub>i</sub>)))+b(1)
其中,K<sub>i</sub>表征第i个目标的骨架对应的叠加结果。Sum(S<sub>i</sub>)表征第i个目标的骨架上的像素点总数。F<sub>1</sub>(S<sub>i</sub>)代表对第i个目标的骨架的第1个滤波结果。F<sub>2</sub>(S<sub>i</sub>)代表对第i个目标的骨架的第2个滤波结果。b代表偏置参数。可以理解,由于毛丝存在粗细,骨架长度难以很好描述毛丝实际的像素长度,通常需要增加一个大于0的偏置参数b才能很好地描述毛丝的像素长度。b一般可以取2像素。
在一些实施例中,计算机设备可以使用叠加结果对非斜向像素点对应的长度进行加权,得到目标在真实场景中的长度。比如,1像素=a毫米,对于第i个目标,其估计的长度为L<sub>i</sub>=a*K<sub>i</sub>。
可见,在本实施例中,确定斜向像素点对应的权重;权重是根据斜向像素点对应的长度与非斜向像素点对应的长度之间的差异确定的;根据权重对斜向像素点的数量进行加权,得到加权结果;对目标的骨架上的像素点总数和加权结果进行叠加,得到叠加结果;根据叠加结果对非斜向像素点对应的长度进行加权,得到目标在真实场景中的长度,充分考虑到斜向上的像素与水平或竖直方向上的像素之间的差异,能够准确的对目标进行长度测量。
在一些实施例中,对二值化图像进行骨架化处理,得到骨架图像,包括:
对二值化图像进行连通域分析,得到连通域;
根据连通域的外接轮廓从二值化图像中切分出二值子图;
对二值子图进行骨架化处理,得到骨架图像。
在一些实施例中,每个连通域代表待检测图像对应位置的毛丝实例。
在一些实施例中,计算机设备可以使用每个连通域的外接矩形对二值化图像进行切图,得到二值子图。每个二值子图中包括一个连通域。
可见,在本实施例中,对二值化图像进行连通域分析,得到连通域;根据连通域的外接轮廓从二值化图像中切分出二值子图;对二值子图进行骨架化处理,得到骨架图像,能够针对性的对每个连通域进行骨架化,相较于对整个二值化图像进行骨架化,能够节约计算资源。
在一些实施例中,计算机设备可以对骨架图像进行卷积计算,得到骨架长度。将骨架长度作为毛丝长度的测量值。
在一些实施例中,计算机设备可以从骨架图像中确定骨架的周长,将周长的一半作为毛丝的像素长度。根据毛丝的像素长度和像素点对应的长度,确定毛丝长度的测量值。
在一些实施例中,计算机设备可以通过正交骨架法从骨架图像中确定毛丝的骨架宽度。根据毛丝的骨架宽度和像素点对应的长度,确定毛丝宽度的测量值。
应该理解的是,虽然如上述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种目标检测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个目标检测装置实施例中的具体限定可以参见上文中对于目标检测方法的限定,在此不再赘述。
如图4所示,本申请实施例提供了一种目标检测装置400,包括:
确定模块402,用于确定待检测图像的浅层特征和不同分辨率的多个深层特征;
拼接模块404,用于拼接浅层特征与第一目标深层特征得到拼接特征;第一目标深层特征是多个深层特征中与浅层特征的分辨率相匹配的深层特征;
第一融合模块406,用于将非目标深层特征与对应的多个深层特征中更高分辨率的深层特征进行融合,得到深层融合特征;非目标深层特征是指多个深层特征中除第一目标深层特征外的深层特征;
第二融合模块408,用于对拼接特征、深层融合特征和第二目标深层特征进行进阶融合,得到进阶融合特征;第二目标深层特征是指最低分辨率的非目标深层特征;
检测模块410,用于基于进阶融合特征对待检测图像进行目标检测,得到检测结果。
在一些实施例中,在将非目标深层特征与对应的多个深层特征中更高分辨率的深层特征进行融合,得到深层融合特征方面,第一融合模块406具体用于:
将最低分辨率的非目标深层特征与最低分辨率的上一分辨率的非目标深层特征进行融合,得到最低分辨率的上一分辨率的深层融合特征;
从最低分辨率的上一分辨率起,依次将每一分辨率的深层融合特征与每一分辨率的上一分辨率的非目标深层特征进行融合,确定每一分辨率的上一分辨率的深层融合特征,得到不同分辨率的多个深层融合特征。
在一些实施例中,第一目标深层特征是多个深层特征中最高分辨率的深层特征;
在对拼接特征、深层融合特征和第二目标深层特征进行进阶融合,得到进阶融合特征方面,第二融合模块408具体用于:
将最高分辨率的拼接特征与最高分辨率的下一分辨率的深层融合特征进行融合,得到最高分辨率的拼接融合特征;
将最高分辨率的拼接融合特征、不同分辨率的多个深层融合特征和第二目标深层特征进行融合,得到进阶融合特征。
在一些实施例中,检测结果是将待检测图像输入至目标检测模型得到的输出;检测模块410还用于:
获取具有目标区域的原始图像;
根据第一预设概率对原始图像中的目标区域进行图像裁切,得到第一样本图像;
根据第二预设概率对原始图像进行随机裁切,得到第二样本图像;
基于第一样本图像和第二样本图像对待训练的目标检测模型进行训练,以得到训练完毕的目标检测模型。
在一些实施例中,检测结果包括二值化图像,二值化图像用于指示待检测图像中的目标;检测模块410还用于:
对二值化图像进行骨架化处理,得到骨架图像;
对骨架图像进行滤波,确定目标的骨架上任意斜向的斜向像素点;
根据目标的骨架上的斜向像素点和非斜向像素点分别对应的长度,确定目标在真实场景中的长度。
在一些实施例中,在根据目标的骨架上的斜向像素点和非斜向像素点分别对应的长度,确定目标在真实场景中的长度方面,检测模块410具体用于:
确定目标的骨架上的斜向像素点对应的权重;权重是根据斜向像素点对应的长度与非斜向像素点对应的长度之间的差异确定的;
根据权重对斜向像素点的数量进行加权,得到加权结果;
对目标的骨架上的像素点总数和加权结果进行叠加,得到叠加结果;
根据叠加结果对非斜向像素点对应的长度进行加权,得到目标在真实场景中的长度。
在一些实施例中,在对二值化图像进行骨架化处理,得到骨架图像方面,检测模块410具体用于:
对二值化图像进行连通域分析,得到连通域;
根据连通域的外接轮廓从二值化图像中切分出二值子图;
对二值子图进行骨架化处理,得到骨架图像。
上述目标检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以以硬件形式内嵌于或独立于计算机设备中的处理器,也可以以软件形式存储于计算机设备中的存储器,以便于处理器调用执行以上各个模块对应的操作。
在一些实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)及通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储待检测图像。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现上述的目标检测方法中的步骤。
在一些实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图6所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元及输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现上述的目标检测方法中的步骤。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏;该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图5或图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一些实施例中,提供了一种计算机设备,该计算机设备包括存储器和处理器,存储器存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一些实施例中,如图7所示提供了一种计算机可读存储介质的内部结构图,计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一些实施例中,提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(FerroelectricRandom Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(StaticRandom Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种目标检测方法,其特征在于,包括:
确定待检测图像的浅层特征和不同分辨率的多个深层特征;
拼接所述浅层特征与第一目标深层特征得到拼接特征;所述第一目标深层特征是所述多个深层特征中与所述浅层特征的分辨率相匹配的深层特征;
将非目标深层特征与对应的所述多个深层特征中更高分辨率的深层特征进行融合,得到深层融合特征;所述非目标深层特征是指所述多个深层特征中除所述第一目标深层特征外的深层特征;
对所述拼接特征、所述深层融合特征和第二目标深层特征进行进阶融合,得到进阶融合特征;所述第二目标深层特征是指最低分辨率的非目标深层特征;
基于所述进阶融合特征对所述待检测图像进行目标检测,得到检测结果。
2.根据权利要求1所述的方法,其特征在于,所述将非目标深层特征与对应的所述多个深层特征中更高分辨率的深层特征进行融合,得到深层融合特征,包括:
将最低分辨率的非目标深层特征与所述最低分辨率的上一分辨率的非目标深层特征进行融合,得到所述最低分辨率的上一分辨率的深层融合特征;
从所述最低分辨率的上一分辨率起,依次将每一分辨率的深层融合特征与所述每一分辨率的上一分辨率的非目标深层特征进行融合,确定所述每一分辨率的上一分辨率的深层融合特征,得到不同分辨率的多个深层融合特征。
3.根据权利要求2所述的方法,其特征在于,所述第一目标深层特征是所述多个深层特征中最高分辨率的深层特征;
所述对所述拼接特征、所述深层融合特征和第二目标深层特征进行进阶融合,得到进阶融合特征,包括:
将所述最高分辨率的所述拼接特征与所述最高分辨率的下一分辨率的深层融合特征进行融合,得到所述最高分辨率的拼接融合特征;
将所述最高分辨率的拼接融合特征、不同分辨率的多个深层融合特征和第二目标深层特征进行融合,得到进阶融合特征。
4.根据权利要求1所述的方法,其特征在于,所述检测结果是将所述待检测图像输入至目标检测模型得到的输出;所述目标检测模型的训练步骤包括:
获取具有目标区域的原始图像;
根据第一预设概率对所述原始图像中的所述目标区域进行图像裁切,得到第一样本图像;
根据第二预设概率对所述原始图像进行随机裁切,得到第二样本图像;
基于所述第一样本图像和所述第二样本图像对待训练的目标检测模型进行训练,以得到训练完毕的目标检测模型。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述检测结果包括二值化图像,所述二值化图像用于指示所述待检测图像中的目标;所述方法还包括:
对所述二值化图像进行骨架化处理,得到骨架图像;
对所述骨架图像进行滤波,确定所述目标的骨架上任意斜向的斜向像素点;
根据所述目标的骨架上的斜向像素点和非斜向像素点分别对应的长度,确定所述目标在真实场景中的长度。
6.根据权利要求5所述的方法,其特征在于,所述根据所述目标的骨架上的斜向像素点和非斜向像素点分别对应的长度,确定所述目标在真实场景中的长度,包括:
确定所述目标的骨架上的斜向像素点对应的权重;所述权重是根据所述斜向像素点对应的长度与所述非斜向像素点对应的长度之间的差异确定的;
根据所述权重对所述斜向像素点的数量进行加权,得到加权结果;
对所述目标的骨架上的像素点总数和所述加权结果进行叠加,得到叠加结果;
根据所述叠加结果对所述非斜向像素点对应的长度进行加权,得到所述目标在真实场景中的长度。
7.根据权利要求5所述的方法,其特征在于,所述对所述二值化图像进行骨架化处理,得到骨架图像,包括:
对所述二值化图像进行连通域分析,得到连通域;
根据所述连通域的外接轮廓从所述二值化图像中切分出二值子图;
对所述二值子图进行骨架化处理,得到骨架图像。
8.一种目标检测装置,其特征在于,包括:
确定模块,用于确定待检测图像的浅层特征和不同分辨率的多个深层特征;
拼接模块,用于拼接所述浅层特征与第一目标深层特征得到拼接特征;所述第一目标深层特征是所述多个深层特征中与所述浅层特征的分辨率相匹配的深层特征;
第一融合模块,用于将非目标深层特征与对应的所述多个深层特征中更高分辨率的深层特征进行融合,得到深层融合特征;所述非目标深层特征是指所述多个深层特征中除所述第一目标深层特征外的深层特征;
第二融合模块,用于对所述拼接特征、所述深层融合特征和第二目标深层特征进行进阶融合,得到进阶融合特征;所述第二目标深层特征是指最低分辨率的非目标深层特征;
检测模块,用于基于所述进阶融合特征对所述待检测图像进行目标检测,得到检测结果。
9.一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311178374.8A CN117292178A (zh) | 2023-09-13 | 2023-09-13 | 目标检测方法、装置、计算机设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311178374.8A CN117292178A (zh) | 2023-09-13 | 2023-09-13 | 目标检测方法、装置、计算机设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117292178A true CN117292178A (zh) | 2023-12-26 |
Family
ID=89240068
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311178374.8A Pending CN117292178A (zh) | 2023-09-13 | 2023-09-13 | 目标检测方法、装置、计算机设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117292178A (zh) |
-
2023
- 2023-09-13 CN CN202311178374.8A patent/CN117292178A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109508681B (zh) | 生成人体关键点检测模型的方法和装置 | |
CN111080628B (zh) | 图像篡改检测方法、装置、计算机设备和存储介质 | |
Du et al. | Fully convolutional measurement network for compressive sensing image reconstruction | |
CN111163265A (zh) | 图像处理方法、装置、移动终端及计算机存储介质 | |
CN110599455A (zh) | 显示屏缺陷检测网络模型、方法、装置、电子设备及存储介质 | |
CN114529462A (zh) | 一种基于改进YOLO V3-Tiny的毫米波图像目标检测方法及系统 | |
CN116596935B (zh) | 形变检测方法、装置、计算机设备及计算机可读存储介质 | |
CN112686314A (zh) | 基于远距离拍摄场景的目标检测方法、装置及存储介质 | |
Qiu et al. | Blind 360-degree image quality assessment via saliency-guided convolution neural network | |
US20230019751A1 (en) | Method and apparatus for light estimation | |
CN117292178A (zh) | 目标检测方法、装置、计算机设备及计算机可读存储介质 | |
CN116071279A (zh) | 图像处理方法、装置、计算机设备和存储介质 | |
CN115049572A (zh) | 图像处理方法、装置、电子设备和计算机可读存储介质 | |
CN114463764A (zh) | 表格线检测方法、装置、计算机设备和存储介质 | |
CN116883770A (zh) | 深度估计模型的训练方法、装置、电子设备及存储介质 | |
Ke et al. | Scale-aware dimension-wise attention network for small ship instance segmentation in synthetic aperture radar images | |
CN113628148A (zh) | 红外图像降噪方法和装置 | |
CN112990213A (zh) | 一种基于深度学习的数字万用表字符识别系统和方法 | |
Jia et al. | Learning Rich Information for Quad Bayer Remosaicing and Denoising | |
CN111914861A (zh) | 目标检测方法和装置 | |
CN117876669A (zh) | 目标检测方法、装置、计算机设备和存储介质 | |
CN115861520B (zh) | 高光检测方法、装置、计算机设备和存储介质 | |
CN116229130A (zh) | 模糊图像的类型识别方法、装置、计算机设备和存储介质 | |
CN116152233B (zh) | 图像处理方法、智能终端及存储介质 | |
Xiang et al. | Gated contiguous memory U-Net for single image dehazing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |