CN116091389A - 基于分类模型的图像检测方法、电子设备及介质 - Google Patents
基于分类模型的图像检测方法、电子设备及介质 Download PDFInfo
- Publication number
- CN116091389A CN116091389A CN202210816429.2A CN202210816429A CN116091389A CN 116091389 A CN116091389 A CN 116091389A CN 202210816429 A CN202210816429 A CN 202210816429A CN 116091389 A CN116091389 A CN 116091389A
- Authority
- CN
- China
- Prior art keywords
- sample
- classification model
- layer
- tensor
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013145 classification model Methods 0.000 title claims abstract description 88
- 238000001514 detection method Methods 0.000 title claims abstract description 37
- 238000012937 correction Methods 0.000 claims abstract description 107
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 37
- 238000012549 training Methods 0.000 claims abstract description 27
- 239000013598 vector Substances 0.000 claims description 25
- 238000000034 method Methods 0.000 claims description 20
- 238000011176 pooling Methods 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 18
- 238000010606 normalization Methods 0.000 claims description 17
- 230000004913 activation Effects 0.000 claims description 11
- 230000003044 adaptive effect Effects 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 9
- 238000000638 solvent extraction Methods 0.000 claims description 9
- 230000004044 response Effects 0.000 claims description 8
- 238000012935 Averaging Methods 0.000 claims description 6
- 230000006835 compression Effects 0.000 claims description 6
- 238000007906 compression Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 6
- 230000003213 activating effect Effects 0.000 claims description 4
- 238000004891 communication Methods 0.000 claims description 2
- 239000010410 layer Substances 0.000 description 108
- 238000005286 illumination Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 5
- 230000007547 defect Effects 0.000 description 4
- 239000000306 component Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000003702 image correction Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000452 restraining effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/80—Geometric correction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
- G06V10/763—Non-hierarchical techniques, e.g. based on statistics of modelling distributions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于分类模型的图像检测方法、电子设备及介质,包括:获取待测电机磁瓦的样本图集,根据样本图集对分类模型进行训练;将获取到的目标灰度图输入训练后的分类模型进行类别检测,得到目标灰度图的类别标签;对分类模型的训练包括:将样本图集输入分类模型,对样本图集中的样本灰度图进行图层划分,得到样本灰度图的张量信息;对张量信息进行特征提取,得到样本灰度图的特征信息;根据预设伽马校正值以及预设分层伽马校正算法对张量信息进行校正,得到校正结果;根据校正结果以及样本标签训练分类模型。本发明实施例中,能够通过分类模型对电机磁瓦的图片进行光源校正,提升模型的分类性与鲁棒性。
Description
技术领域
本发明涉及电机检测技术领域,尤其涉及一种基于分类模型的图像检测方法、电子设备及介质。
背景技术
电机磁瓦是永磁体中的用在永磁电机上的瓦状磁铁,是电机的核心部件,因此在电机磁瓦制作的过程中,对电机磁瓦的质量检测变得尤为重要,尤其要避免电机磁瓦表面出现裂痕、刮痕、缝隙等情况出现,这对图像检测算法提出了较高的要求,在使用传统图像处理算法对电机磁瓦的照片进行检测的过程中,由于电机磁瓦本身复杂的背景会使得传统图像难以进行特征提取,并且还可能存在光照不平衡的现象,导致同一被测物体在不同的位置会与光源点形成不同的偏移量,进而使得同一图像在不同光照下存在不同的纹理特征,最终造成对电机磁瓦进行特征提取的模型的分类性能下降以及鲁棒性减弱。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一,提供一种基于分类模型的图像检测方法以及电子设备,能够通过分类模型对电机磁瓦的图片进行光源校正,从而实现对电机磁瓦图片的准确分类,提升模型的分类性与鲁棒性。
第一方面,本发明提供一种基于分类模型的图像检测方法,包括:
获取待测电机磁瓦的样本图集,所述样本图集包括多张有携带样本标签的样本灰度图,其中,所述样本标签用于表征所述样本灰度图的类型;
根据所述样本图集对所述分类模型进行训练;
将获取到的目标灰度图输入训练后的所述分类模型进行类别检测,得到所述目标灰度图的类别标签;
其中,对所述分类模型的训练包括:
将所述样本图集输入所述分类模型,使得所述分类模型对所述样本图集中的所述样本灰度图进行图层划分,得到所述样本灰度图的张量信息;
对所述张量信息进行特征提取,得到所述样本灰度图的特征信息;
根据预设伽马校正值以及预设分层伽马校正算法对所述张量信息进行校正,得到校正结果;
根据所述校正结果以及所述样本标签训练所述分类模型。
上述基于分类模型的图像检测方法至少具有以下有益效果:获取待测电机磁瓦的样本图集,根据样本图集中的样本灰度图以及样本标签输入分类模型进行训练,将样本图集输入分类模型进行图层划分,得到样本灰度图的张量信息,并对张量信息进行特征提取,得到样本灰度图的特征信息,最后,根据预设伽马校正值以及预设分层伽马校正算法对张量信息进行校正,实现对电机磁瓦的图片进行光源校正,避免因光源不平衡带来的影响,根据校正结果以及样本标签对分类模型进行训练,从而提高分类模型的对灰度图的分类性与鲁棒性,将获取到的目标灰度图输入训练后的分类模型进行类别检测,得到目标灰度图的类别标签,实现对电机磁瓦图片的准确分类。
根据本发明的一些实施例,所述分类模型包括图层划分模块、局部自适应校正网络和EfficientNetV2网络,其中,所述图层划分模块包括多个图层通道;所述将所述样本图集输入所述分类模型,使得所述分类模型对所述样本图集中的所述样本灰度图进行图层划分,得到所述样本灰度图的张量信息,包括:
将所述样本灰度图的图片张量输入所述图层划分模块,使得所述图层划分模块基于预设聚类算法对所述图片张量进行图像聚类,得到多个所述图层;
根据所述图层通道对所述图层进行叠加,输出所述张量信息。
根据本发明的一些实施例,根据预设伽马校正值以及预设分层伽马校正算法对所述张量信息进行校正,得到校正结果,包括:
根据所述特征信息得到特征图片;
对所述特征图片进行特征处理,得到所述特征图片的张量特征;
对所述张量特征通过激活函数激活得到所述预设伽马校正值;
根据所述伽马校正值以及所述预设分层伽马校正算法对所述张量信息和所述张量特征进行校正,得到所述校正结果。
根据本发明的一些实施例,所述局部自适应校正网络包括滤波层、平均池化层、分层卷积层和全局平均池化层;所述对所述特征图片进行特征处理,得到所述特征图片的张量特征,包括:
将所述特征图片输入至所述滤波层进行响应归一化,得到归一结果;
将所述归一结果输入所述平均池化层进行压缩,得到所述特征图片的压缩信息;
将所述图层输入所述分层卷积层,使得所述分层卷积层根据所述压缩信息对所述图层进行特征提取,得到各个所述图层的特征信息;
将所述特征信息输入所述全局平均池化层,得到多个所述张量特征。
根据本发明的一些实施例,所述根据所述校正结果以及所述样本标签训练所述分类模型,包括:
将所述校正结果以及所述样本标签输入所述分类模型中的所述EfficientNetV2网络进行训练。
根据本发明的一些实施例,还包括:
将所述样本灰度图输入所述局部自适应校正网络进行亮度提取,输出所述样本灰度图的亮度向量。
根据本发明的一些实施例,所述预设分层伽马校正算法由如下步骤得到:
将所述样本灰度图输入所述图层划分模块进行图层划分,并根据图层划分后的所述张量信息得到指数关系;
根据所述指数关系、获取到的所述样本灰度图的尺寸信息以及所述亮度向量进行计算,得到向量关系;
根据预设拟合函数对所述向量关系进行约束;
根据约束后的所述向量关系以及所述图层得到拟合参数;
根据所述图层的索引以及所述拟合参数进行计算,得到伽马向量;
将所述伽马向量以及所述张量信息输入所述指数关系,得到所述预设分层伽马校正算法。
第二方面,本发明实施例提供了一种电子设备,所述电子设备包括存储器、处理器、存储在所述存储器上并可在所述处理器上运行的程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线,所述程序被所述处理器执行时实现如第一方面所述的基于分类模型的图像检测方法的步骤。
第三方面,本发明实施例提供一种存储介质,所述存储介质为计算机可读存储介质,用于计算机可读存储,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现第一方面所述的基于分类模型的图像检测方法的步骤。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1是本发明一实施例提供的分类模型的结构示意图;
图2是本申请实施例提供的基于分类模型的图像检测方法的一个可选的流程图;
图3是本申请实施例提供的训练分类模型的一个可选的流程图;
图4是图3中的步骤S201的具体方法流程图;
图5是图3中的步骤S204的具体方法流程图;
图6是图5中的步骤S402的具体方法流程图;
图7是图3中的步骤S205的具体方法流程图;
图8是本申请实施例提供的计算预设分层伽马校正算法的一个可选的流程图;
图9为本发明一个具体示例提供的分类模型的结构示例图;
图10是本发明一个实施例提供的电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,若干的含义是一个或者多个,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
在本发明的描述中,如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
本发明的描述中,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
下面结合附图,对本发明实施例作进一步阐述。
参考图1,图1是本发明一实施例提供的分类模型的结构示意图;
在一些实施例中,分类模型100包括图层划分模块200、局部自适应校正网络300和EfficientNetV2网络400,其中,局部自适应校正网络包括滤波层、平均池化层、分层卷积层和全局平均池化层,图层划分模块200包括多个图层通道以及图层划分器。
在一些实施例中,首先,将电机磁瓦的样本灰度图的图片张量输入至图层划分模块200进行图层划分,图层划分模块200通过K均值聚类算法进行图像聚类,分为多个类别,每个类别输出一个单独的图层,通过图层通道的叠加,输出固定格式的张量信息,其次,将张量信息输入至局部自适应校正网络300进行特征提取,局部自适应校正网络300首先通过卷积核对张量信息进行卷积操作,提取低级特征,得到样本灰度图的特征信息,之后,根据特征信息得到对应的大小的特征图片,通过滤波层中的滤波器进行响应归一化,按照图层通道进行归一化,得到归一结果,然后通过预设步长的平均池化对特征图片进行压缩,得到特征图片的压缩信息,进一步的,通过分层卷积层中的分层卷积提取各个图层的特征,再通过全局平均池化层得到多个张量特征,根据预设激活函数激活得到伽马校正值,其中,每个图层都有预设伽马校正值,最后,根据预设伽马校正值以及预设分层伽马校正算法对张量信息以及张量特征进行校正,完成图像校正,输出校正结果。
在一些实施例中,在图层划分模块200输出校正结果之后,EfficientNetV2网络400根据校正结果对样本灰度图进行分类,得到样本灰度图的样本标签,从而完成对电机磁瓦的图像的检测,提高对电机磁瓦图像检测的准确性。
本领域技术人员可以理解的是,图1中示出的分类模型100并不构成对本发明实施例的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
基于上述分类模型100的结构,下面提出本发明的基于分类模型的图像检测方法的各个实施例。
参考图2,图2是本申请实施例提供的基于分类模型的图像检测方法的一个可选的流程图,图2中的方法可以包括但不限于包括步骤S101至步骤S103。
步骤S101:获取待测电机磁瓦的样本图集,样本图集包括多张有携带样本标签的样本灰度图;
需要说明的是,样本标签用于表征样本灰度图的类型。
可以理解的是,样本图集中的样本灰度图包括电机磁瓦表面在标准状态下和光照不平衡状态下的灰度图,并且根据电机磁瓦的不同状态得到不同的样本标签。
步骤S102:根据样本图集对分类模型进行训练;
步骤S103:将获取到的目标灰度图输入训练后的分类模型进行类别检测,得到目标灰度图的类别标签。
在一些实施例中,获取待测电机磁瓦的样本图集,根据样本图集中的样本灰度图以及样本标签对分类模型进行训练,从而提高分类模型的对灰度图的分类性与鲁棒性,再将获取到的目标灰度图输入分类模型进行类别检测,得到目标灰度图的类别标签,实现对电机磁瓦图片的准确分类。
参考图3,图3是本申请实施例提供的训练分类模型的一个可选的流程图,图3中的方法可以包括但不限于包括步骤S201至步骤S204。
需要说明的是,图层划分模块包括多个图层通道。
步骤S201:将样本图集输入分类模型,使得分类模型对样本图集中的样本灰度图进行图层划分,得到样本灰度图的张量信息;
步骤S202:对张量信息进行特征提取,得到样本灰度图的特征信息;
在一些实施例中,将张量信息通过卷积核进行卷积操作,从而提取张量信息的低级特征,得到样本灰度图的特征信息。
步骤S203:根据预设伽马校正值以及预设分层伽马校正算法对张量信息进行校正,得到校正结果;
步骤S204:根据校正结果以及样本标签训练分类模型。
在一些实施例中,将样本图集输入分类模型进行图层划分,得到样本灰度图的张量信息,并对张量信息进行特征提取,得到样本灰度图的特征信息,最后,根据预设伽马校正值以及预设分层伽马校正算法对张量信息进行校正,得到校正结果,实现通过分类模型对电机磁瓦的图片进行光源校正,避免因光源不平衡带来的影响,根据校正结果以及样本标签对分类模型进行训练,提高分类模型的分类性能。
参考图4,图4是图3中的步骤S201的流程图,在一些实施例中,步骤S201可以包括但不限于包括步骤S301至步骤S302:
步骤S301:将样本灰度图的图片张量输入图层划分模块,使得图层划分模块基于预设聚类算法对图片张量进行图像聚类,得到多个图层;
步骤S302:根据图层通道对图层进行叠加,输出张量信息。
在一些实施例中,将样本灰度图的图片张量输入图层划分模块进行图层划分,图层划分模块基于预设聚类算法对图片张量进行图像聚类处理,从而得到多个图层,之后根据图层通道的个数对各个图层进行叠加,输出张量信息,便于后续对样本灰度图进行局部校正。
需要说明的是,样本灰度图的图片张量为样本灰度图的张量格式,例如,张量格式为N*128*128*1、N*64*64*2或者N*128*64*1等,其中N为批量大小,128*128、64*64以及128*64为样本灰度图的长和宽,1和2为图层通道的个数,预设聚类算法为KMeans聚类算法,将样本灰度图的图片张量通过KMeans聚类算法进行计算,假设聚类核心数为8,则得到8个类别,每个类别输出一个单独的图层,通过图层通道进行叠加,输出张量信息。
参考图5,图5是图3中的步骤S204的流程图,在一些实施例中,步骤S204可以包括但不限于包括步骤S401至步骤S404:
步骤S401:根据特征信息得到特征图片;
步骤S402:对特征图片进行特征处理,得到特征图片的张量特征;
步骤S403:对张量特征通过激活函数激活得到预设伽马校正值;
步骤S404:根据伽马校正值以及预设分层伽马校正算法对张量信息和张量特征进行校正,得到校正结果。
需要说明的是,预设激活函数可以为S型生长曲线函数(也称Sigmoid激活函数)、tanh函数或者ReLU激活函数(Rect ified Linear Un its,修正线性单元),本实施例中为Sigmoid激活函数。
在一些实施例中,首先将张量信息通过卷积核进行卷积操作,从而提取张量信息的低级特征,得到样本灰度图的特征信息,从而根据特征信息得到特征图片,之后再对特征图片进行平均池化处理,得到特征图片的张量特征,最后根据预设激活函数,即Sigmoid激活函数得到伽马校正值,再基于预设分层伽马校正算法以及伽马校正值完成对样本灰度图的校正,得到校正结果,提高对样本灰度图校正的准确性。
参考图6,图6是图5中的步骤S402的流程图,在一些实施例中,步骤S402可以包括但不限于包括步骤S501至步骤S504:
需要说明的是,局部自适应校正网络包括滤波层、平均池化层、分层卷积层和全局平均池化层。
步骤S501:将特征图片输入至滤波层进行响应归一化,得到归一结果;
需要说明的是,对特征图片进行响应归一化的过程中,要使特征图片按照图层通道进行归一化,得到最终的归一结果。
步骤S502:将归一结果输入平均池化层进行压缩,得到特征图片的压缩信息;
步骤S503:将图层输入分层卷积层,使得分层卷积层根据压缩信息对图层进行特征提取,得到各个图层的特征信息;
步骤S504:将特征信息输入全局平均池化层,得到多个张量特征。
在一些实施例中,首先将特征图片输入至滤波层中的滤波器进行响应归一化,得到归一结果,之后再将图层输入分层卷积层提取各个图层的特征,得到各个图层的特征信息,最后将特征信息输入全局平均池化层,得到多个张量特征,便于对预设伽马校正值的计算。
需要说明的是,将特征图片输入至滤波层中的滤波器进行响应归一化可以特征图片的像素值范围进行压缩,压缩至[0,1]区间。
参考图7,图7是图3中的步骤S205的流程图,在一些实施例中,步骤S205可以包括但不限于包括步骤S601:
步骤S601:将校正结果以及样本标签输入分类模型中的EfficientNetV2网络进行训练。
在一些实施例中,将校正结果以及样本标签输入分类模型中的EfficientNetV2网络进行分类,得到分类结果,从而确定各个样本灰度图与样本标签的对应关系,提高分类模型的分类性能与鲁棒性。
在一些实施例中,基于分类模型的图像检测方法还包括将样本灰度图输入局部自适应校正网络进行亮度提取,输出样本灰度图的亮度向量,便于反应图层的整体亮度。
需要说明的是,当以图层灰度均值为底时能更好的反应图层的整体亮度,因此将样本灰度图输入局部自适应校正网络,使得局部自适应校正网络基于局部自适应校正网络对样本灰度图的图像亮度进行提取,得到亮度向量。
参考图8,图8是本申请实施例提供的计算预设分层伽马校正算法的一个可选的流程图,图8中的方法可以包括但不限于包括步骤S701至步骤S706。
步骤S701:将样本灰度图输入图层划分模块进行图层划分,并根据图层划分后的张量信息得到指数关系;
步骤S702:根据指数关系、获取到的样本灰度图的尺寸信息以及亮度向量进行计算,得到向量关系;
步骤S703:根据预设拟合函数对向量关系进行约束;
步骤S704:根据约束后的向量关系以及图层得到拟合参数;
步骤S705:根据图层的索引以及拟合参数进行计算,得到伽马向量;
步骤S706:将伽马向量以及张量信息输入指数关系,得到预设分层伽马校正算法。
在一些实施例中,预设分层伽马校正算法具体流程与推导如下:
机器视觉与人眼类似,对亮度较为敏感,因此对于光照不平衡的问题,此处引入伽马校正以弥补光线变化带来的不良影响。伽马校正是对输入图像的灰度值进行非线性的调整,使得输出的灰度图值与输入图像灰度值呈指数关系,公式为:
f(I)=Iγ (1)
由于通过图层划分器对图像进行分层,因此,则式(1)可推广为式(2):
当以图层灰度均值为底时能更好的反应图层的整体亮度,因此将式(2)推广为式(3),其中W和H为输入图像的宽和长,αi为上述局部自适应伽马校正网络对图像亮度提取的输出向量的第i维:
由于γ由卷积神经网络训练得出,容易导致γ向量内各个值的差异较大,使得输出图像容易出现割裂的效果,因此提出使用最小二乘法对γ进行约束。一般采用多项式拟合函数为式(4):
hθ(x)=θ0+θ1·x+…+θn·xn (4)
因为要求γ内连续元素的梯度一致,所以对式(4)求导可得式(5),可得hθ(x)取至θ1。
则将式(3)及图层数K代入式(6)可得拟合参数θ0与θ1,此时新的γ值可由式(7)获得,其中i为对应图层的索引。通过将式(7)获得的伽马向量与输出图像张量信息F代入式(2),组成预设分层伽马校正算法,至此完成图像的局部伽马校正:
γi=θ0+θ1·i (7)
为了更加清楚的说明基于分类模型的图像检测方法的流程,下面以具体的示例进行说明。
示例一:
参考图9,图9为本发明一个具体示例提供的分类模型的结构示例图;
步骤1、构建EfficientNet-LAGC模型。
该模型由图层划分器、局部自适应伽马校正网络和EfficientNetV2构成,原始图像张量T(样本灰度图的图片张量)作为模型输入,通过图层划分器将其按照KMeans聚类算法划分为8个图层,紧接着通过局部自适应伽马校正网络进行光照校正。最后通过将其送入EfficientNetV2网络完成缺陷分类。
图层划分器输入为输入张量T,该张量格式为N×128×128×1,其中N为批量大小。128×128为长宽,1为通道数。将其通过KMeans算法进行图像聚类,聚类核心数为8,即将其分为8个类别,每个类别输出一个单独的图层,通过通道叠加,使其输出一个格式为N×128×128×8的张量F。
局部自适应伽马校正网络将输入F首先通过卷积核个数为8的卷积操作,提取低级特征,输出特征图大小为128×128×8,然后通过滤波器响应归一化,使其按照通道进行归一化。然后通过步长为2的平均池化,将特征图的长宽尺寸压缩为64×64×8,然后通过分层卷积提取各层的特征,紧接着通过全局平均池化后得到尺寸为1×8的张量,将其通过Sigmoid激活后得到伽马校正值α,分别代表每个图层的伽马校正值。最后将α与输入张量F共同送入分层伽马校正算法,完成图像校正,输出尺寸为128×128×1。
步骤2、获取电机磁瓦分类训练样本集,该电机磁瓦分类训练样本集的每个训练样本包括电机磁瓦表面在标准状态下和光照不平衡条件下的灰度图和对应的类别标签。
步骤3、利用电机磁瓦分类训练样本集对步骤1所构建的分类模型进行训练,得到训练好的分类模型。
步骤4、采集待检测电机磁瓦的电机磁瓦表面灰度图,并将该电机磁瓦表面灰度图送入到步骤3所训练好的分类模型中,经模型推理输出待检测电机磁瓦表面灰度图的的类别标签。
为了验证本发明对光照不平衡的电机磁瓦缺陷图像分类的有效性,设计了如下实验:采用中国科学院自动化院公开的电机磁瓦缺陷集进行三折交叉验证测试,每折分为训练集和测试集,分别对模型进行训练并在测试集上验证其稀疏分类准确率,三折交叉验证结果取均值,结果如下表1所示。从表1可以看出,本发明提出的基于EfficientNet-LAGC方法,在标准条件下,稀疏分类准确率为96.93%,在光照不平衡条件下,稀疏分类准确率为97.44%,在分类准确度上优于原版EfficientNetV2网络,且通过EfficientNet-LAGC与其余模型对比可得本方法具有更强的分类能力。
表1各模型在标准条件下以及光照不平衡条件下对图片分类的准确率
标准条件(%) | 光照不平衡条件(%) | |
MobileNetV2 | 86.46 | 41.77 |
MobileNetV3 | 98.71 | 54.17 |
ResNet | 94.90 | 47.08 |
BiT | 66.42 | 41.04 |
DenseNet201 | 98.20 | 45.67 |
RegNet | 98.21 | 41.57 |
Xception | 92.86 | 56.53 |
InceptionV3 | 94.89 | 40.28 |
NASNetLarge | 92.54 | 42.54 |
EfficientNet-LAGC | 96.93 | 97.44 |
EfficientNetV2 | 98.71 | 48.50 |
考虑到样本存在样本平衡现象,提出使用Recall(召回率)、Precision(精确率)和AUC(Area under Curve,曲线下的面积)进行深入验证,结果如表2所示。从表2可知,本发明所提出模型在标准条件下取得的Recall和Precision分别为0.958和0.782,表现较为优异。而在光照不平衡条件下,这两个值进一步提升到了0.964和0.787,远优于其余模型。而在标准条件下的AUC值为0.997,仅比最高的MobileNetV3低0.001,而在光照不平衡数据下,AUC为0.998,远优于其余模型。说明本研究所提出的方法在光照不平衡条件下有较为优异的表现,EfficientNet-LAGC模型能有效地减弱光照敏感性,适合部署于实际应用场景。
表2各模型的召回率、精确率和曲线下的面积的数值对比
请参阅图10,图10示意了另一实施例的电子设备的硬件结构,电子设备包括:
具体地,该电子设备包括:一个或多个处理器和存储器,图10中以一个处理器及存储器为例。处理器和存储器可以通过总线或者其他方式连接,图10中以通过总线连接为例。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序,如上述本发明实施例中的基于分类模型的图像检测方法。处理器通过运行存储在存储器中的非暂态软件程序以及程序,从而实现上述本发明实施例中的基于分类模型的图像检测方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储执行上述本发明实施例中的基于分类模型的图像检测方法所需的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该网络数据处理装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
此外,本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行程序,该计算机可执行程序被一个或多个控制处理器执行,例如,被图10中的一个处理器执行,可使得上述一个或多个处理器执行上述本发明实施例中的基于分类模型的图像检测方法。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
应当理解,在本申请中,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
此外,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上参照附图说明了本申请实施例的优选实施例,并非因此局限本申请实施例的权利范围。本领域技术人员不脱离本申请实施例的范围和实质内所作的任何修改、等同替换和改进,均应在本申请实施例的权利范围之内。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
上面结合附图对本发明实施例作了详细说明,但是本发明不限于上述实施例,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下,作出各种变化。
Claims (9)
1.一种基于分类模型的图像检测方法,其特征在于,包括:
获取待测电机磁瓦的样本图集,所述样本图集包括多张有携带样本标签的样本灰度图,其中,所述样本标签用于表征所述样本灰度图的类型;
根据所述样本图集对所述分类模型进行训练;
将获取到的目标灰度图输入训练后的所述分类模型进行类别检测,得到所述目标灰度图的类别标签;
其中,对所述分类模型的训练包括:
将所述样本图集输入所述分类模型,使得所述分类模型对所述样本图集中的所述样本灰度图进行图层划分,得到所述样本灰度图的张量信息;
对所述张量信息进行特征提取,得到所述样本灰度图的特征信息;
根据预设伽马校正值以及预设分层伽马校正算法对所述张量信息进行校正,得到校正结果;
根据所述校正结果以及所述样本标签训练所述分类模型。
2.根据权利要求1所述的基于分类模型的图像检测方法,其特征在于,所述分类模型包括图层划分模块、局部自适应校正网络和EfficientNetV2网络,其中,所述图层划分模块包括多个图层通道;所述将所述样本图集输入所述分类模型,使得所述分类模型对所述样本图集中的所述样本灰度图进行图层划分,得到所述样本灰度图的张量信息,包括:
将所述样本灰度图的图片张量输入所述图层划分模块,使得所述图层划分模块基于预设聚类算法对所述图片张量进行图像聚类,得到多个所述图层;
根据所述图层通道对所述图层进行叠加,输出所述张量信息。
3.根据权利要求2所述的基于分类模型的图像检测方法,其特征在于,所述根据预设伽马校正值以及预设分层伽马校正算法对所述张量信息进行校正,得到校正结果,包括:
根据所述特征信息得到特征图片;
对所述特征图片进行特征处理,得到所述特征图片的张量特征;
对所述张量特征通过激活函数激活得到所述预设伽马校正值;
根据所述预设伽马校正值以及所述预设分层伽马校正算法对所述张量信息和所述张量特征进行校正,得到所述校正结果。
4.根据权利要求3所述的基于分类模型的图像检测方法,其特征在于,所述局部自适应校正网络包括滤波层、平均池化层、分层卷积层和全局平均池化层;所述对所述特征图片进行特征处理,得到所述特征图片的张量特征,包括:
将所述特征图片输入至所述滤波层进行响应归一化,得到归一结果;
将所述归一结果输入所述平均池化层进行压缩,得到所述特征图片的压缩信息;
将所述图层输入所述分层卷积层,使得所述分层卷积层根据所述压缩信息对所述图层进行特征提取,得到各个所述图层的特征信息;
将所述特征信息输入所述全局平均池化层,得到多个所述张量特征。
5.根据权利要求2所述的基于分类模型的图像检测方法,其特征在于,所述根据所述校正结果以及所述样本标签训练所述分类模型,包括:
将所述校正结果以及所述样本标签输入所述分类模型中的所述EfficientNetV2网络进行训练。
6.根据权利要求3所述的基于分类模型的图像检测方法,其特征在于,还包括:
将所述样本灰度图输入所述局部自适应校正网络进行亮度提取,输出所述样本灰度图的亮度向量。
7.根据权利要求6所述的基于分类模型的图像检测方法,其特征在于,所述预设分层伽马校正算法由如下步骤得到:
将所述样本灰度图输入所述图层划分模块进行图层划分,并根据图层划分后的所述张量信息得到指数关系;
根据所述指数关系、获取到的所述样本灰度图的尺寸信息以及所述亮度向量进行计算,得到向量关系;
根据预设拟合函数对所述向量关系进行约束;
根据约束后的所述向量关系以及所述图层得到拟合参数;
根据所述图层的索引以及所述拟合参数进行计算,得到伽马向量;
将所述伽马向量以及所述张量信息输入所述指数关系,得到所述预设分层伽马校正算法。
8.一种电子设备,其特征在于,所述电子设备包括存储器、处理器、存储在所述存储器上并可在所述处理器上运行的程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线,所述程序被所述处理器执行时实现如权利要求1至7任一项所述的基于分类模型的图像检测方法的步骤。
9.一种存储介质,所述存储介质为计算机可读存储介质,用于计算机可读存储,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现权利要求1至7中任一项所述的基于分类模型的图像检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210816429.2A CN116091389A (zh) | 2022-07-12 | 2022-07-12 | 基于分类模型的图像检测方法、电子设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210816429.2A CN116091389A (zh) | 2022-07-12 | 2022-07-12 | 基于分类模型的图像检测方法、电子设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116091389A true CN116091389A (zh) | 2023-05-09 |
Family
ID=86185516
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210816429.2A Pending CN116091389A (zh) | 2022-07-12 | 2022-07-12 | 基于分类模型的图像检测方法、电子设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116091389A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117272124A (zh) * | 2023-11-23 | 2023-12-22 | 湖南苏科智能科技有限公司 | 一种基于能级的化学品分类方法、系统、设备及存储介质 |
-
2022
- 2022-07-12 CN CN202210816429.2A patent/CN116091389A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117272124A (zh) * | 2023-11-23 | 2023-12-22 | 湖南苏科智能科技有限公司 | 一种基于能级的化学品分类方法、系统、设备及存储介质 |
CN117272124B (zh) * | 2023-11-23 | 2024-03-12 | 湖南苏科智能科技有限公司 | 一种基于能级的化学品分类方法、系统、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110163300B (zh) | 一种图像分类方法、装置、电子设备及存储介质 | |
CN111932544A (zh) | 篡改图像检测方法、装置及计算机可读存储介质 | |
CN112614125B (zh) | 手机玻璃缺陷检测方法、装置、计算机设备及存储介质 | |
CN111257341A (zh) | 基于多尺度特征与堆叠式全卷积网络的水下建筑物裂缝检测方法 | |
CN112465909B (zh) | 基于卷积神经网络的类激活映射目标定位方法及系统 | |
CN114419029B (zh) | 表面缺陷检测模型的训练方法、表面缺陷检测方法及装置 | |
CN113870254B (zh) | 目标对象的检测方法、装置、电子设备及存储介质 | |
CN111539456B (zh) | 一种目标识别方法及设备 | |
CN111179270A (zh) | 基于注意力机制的图像共分割方法和装置 | |
CN116091389A (zh) | 基于分类模型的图像检测方法、电子设备及介质 | |
CN116152209A (zh) | 一种耳机罩缺陷检测方法、装置、设备及存储介质 | |
CN115147418A (zh) | 缺陷检测模型的压缩训练方法和装置 | |
CN112488983A (zh) | 缺陷识别网络的获得方法、缺陷识别方法和等级确定方法 | |
CN114219402A (zh) | 物流托盘码放识别方法、装置、设备及存储介质 | |
CN116542980B (zh) | 缺陷检测方法、装置、计算机设备、存储介质和程序产品 | |
CN113793326A (zh) | 一种基于图像的疾病识别方法和装置 | |
CN113506293A (zh) | 一种图像处理方法、装置、设备及存储介质 | |
CN117173145A (zh) | 电力设备表面缺陷的检测方法、装置、设备及存储介质 | |
CN110210314B (zh) | 人脸检测方法、装置、计算机设备及存储介质 | |
CN115147348B (zh) | 基于改进的YOLOv3的轮胎缺陷检测方法及系统 | |
CN111127494A (zh) | 基于图像处理的高速公路货车限重识别方法 | |
CN116645719A (zh) | 一种瞳孔和虹膜定位方法、装置、电子设备及存储介质 | |
CN115861259A (zh) | 一种基于模板匹配的引线框架表面缺陷检测方法及装置 | |
CN115512202A (zh) | 基于度量学习的小样本目标检测方法、系统和存储介质 | |
CN112001388B (zh) | 一种基于YOLOv3改进模型的用于检测PCB中圆形目标的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |