CN116486151A - 图像分类模型训练方法、图像分类方法、设备及存储介质 - Google Patents
图像分类模型训练方法、图像分类方法、设备及存储介质 Download PDFInfo
- Publication number
- CN116486151A CN116486151A CN202310438255.5A CN202310438255A CN116486151A CN 116486151 A CN116486151 A CN 116486151A CN 202310438255 A CN202310438255 A CN 202310438255A CN 116486151 A CN116486151 A CN 116486151A
- Authority
- CN
- China
- Prior art keywords
- sample
- classification model
- image classification
- disturbance
- original image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013145 classification model Methods 0.000 title claims abstract description 126
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000012549 training Methods 0.000 title claims abstract description 47
- 238000012545 processing Methods 0.000 claims description 62
- 238000010606 normalization Methods 0.000 claims description 28
- 238000004590 computer program Methods 0.000 claims description 21
- 238000004422 calculation algorithm Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 9
- 230000008485 antagonism Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 28
- 230000001154 acute effect Effects 0.000 description 10
- 210000004698 lymphocyte Anatomy 0.000 description 10
- 230000008859 change Effects 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000010845 search algorithm Methods 0.000 description 4
- 210000004027 cell Anatomy 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000003042 antagnostic effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000011423 initialization method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000003061 neural cell Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种图像分类模型训练方法、图像分类方法、设备及存储介质,所述方法通过对原始图像样本增加扰动,得到对抗样本,并根据原始图像样本和对抗样本对图像分类模型进行对抗训练,使得图像分类模型能够学习到更多的特征,提高了图像分类模型抵抗恶意攻击的能力,从而提高了图像分类模型分类识别的准确性。相应地,本申请还提供一种图像分类方法、终端设备和计算机可读存储介质。
Description
技术领域
本申请属于数据处理技术领域,尤其涉及一种图像分类模型训练方法、图像分类方法、终端设备及存储介质。
背景技术
随着计算机技术的发展,基于大规模数据训练得到的图像分类模型,能够对图像进行分类,例如在医学领域中,可以通过机器学习或深度学习的方法对急性淋巴细胞图像处理,得到急性淋巴细胞分类结果。
然而,基于传统的机器学习或深度学习算法训练得到的图像分类模型,通常是采用干净的图像数据来训练模型,而在现实世界的环境中,图像分类模型输入的数据很难保证都是干净数据,往往夹杂着噪音数据或者被添加了微小的扰动,导致模型预测错误。
因此,基于传统的机器学习或深度学习算法训练得到的图像分类模型,模型的鲁棒性差,导致模型预测结果不精准。
发明内容
本申请的目的在于提供一种图像分类模型训练方法、图像分类方法、终端设备及存储介质,旨在解决采用传统的机器学习算法或者深度学习算法训练图像分类模型导致模型精度低的问题。
本申请实施例的第一方面提供了一种图像分类模型训练方法,包括:
获取原始图像样本,并对所述原始图像样本进行扰动处理,得到对抗样本;
将所述原始图像样本和所述对抗样本输入到预先构建的图像分类模型中进行训练,得到训练后的图像分类模型。
根据原始图像样本和对抗样本对图像分类模型进行对抗训练,由于对抗样本是对原始图像样本增加扰动后得到的,因此训练后的图像分类模型能够学习到更多的特征,提高了图像分类模型抵抗恶意攻击的能力,从而提高了图像分类模型分类识别的准确性。
在第一方面的一种实现方式中,所述对所述原始图像样本进行扰动处理,得到对抗样本,包括:
对所述原始图像样本进行像素级扰动处理和空间级扰动处理,得到对抗样本;其中,所述像素级扰动处理包括对所述原始图像样本中像素点的颜色值调整操作;所述空间级扰动处理包括对所述原始图像样本中像素点的平移和/或旋转操作。
通过对所述原始图像样本添加像素级扰动信息和空间级扰动信息,使得图像分类模型不仅能学习到像素级变化信息,还能学习到平移和旋转等空间变化信息,提高了图像分类模型抵抗不同类型扰动的鲁棒性。
在第一方面的一种实现方式中,所述对所述原始图像样本进行像素级扰动处理和空间级扰动处理,得到对抗样本,包括:
将所述原始图像样本输入所述图像分类模型,由所述图像分类模型对所述原始图像样本进行像素级扰动处理和空间级扰动处理,得到所述对抗样本。
在第一方面的一种实现方式中,所述将所述原始图像样本输入所述图像分类模型,由所述图像分类模型对所述原始图像样本进行像素级扰动处理和空间级扰动处理,得到所述对抗样本,包括:
在所述图像分类模型中采用预设的对抗样本生成算法生成所述原始图像样本的像素扰动信息,并对所述原始图像样本添加所述像素扰动信息,得到像素级扰动样本;
初始化空间扰动量,并在所述图像分类模型对所述空间扰动量进行修正,得到空间扰动量目标值;
对所述像素级扰动样本添加所述空间扰动量目标值,得到对抗样本。
在第一方面的一种实现方式中,所述在所述图像分类模型对所述空间扰动量进行修正,得到空间扰动量目标值,包括:
在所述图像分类模型中采用超参数搜索算法对所述空间扰动量的最优值进行搜索,以确定所述空间扰动量目标值。
在第一方面的一种实现方式中,所述图像分类模型的网络层包括批标准化层;所述批标准化层包括干净批标准化模块和对抗批标准化模块;
所述批标准化层,用于通过所述干净批标准化模块对其他网络层输出的原始图像样本类型数据进行归一化处理,以及通过所述对抗批标准化模块对其他网络层输出的对抗样本类型数据进行归一化处理。
通过在图像分类模型的批标准化层中分别处理原始图像样本类型数据和对抗样本类型数据,能提高图像分类模型对原始图像样本识别的准确率。
本申请实施例的第二方面提供了一种图像分类方法,包括:
将待分类的图像输入到图像分类模型中进行分类,得到分类结果;
其中,所述图像分类模型为利用如上述第一方面提供的所述图像分类模型训练方法训练得到的图像分类模型。
本申请实施例第三方面提供了一种终端设备,包括:
对抗生成模块,用于获取原始图像样本,并对所述原始图像样本进行扰动处理,得到对抗样本;
训练模块,用于将所述原始图像样本和所述对抗样本输入到预先构建的图像分类模型中进行训练,得到训练后的图像分类模型。
本申请实施例第四方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面提供的所述图像分类模型训练方法,或者,所述处理器执行所述计算机程序时实现如上述第二方面提供的所述图像分类方法。
本申请实施例第五方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面提供的所述图像分类模型训练方法,或者,所述计算机程序被处理器执行时实现如上述第二方面提供的所述图像分类方法。
可以理解的是,上述第二方面、第三方面、第四方面和第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
图1是本申请第一实施例提供的图像分类模型训练方法的流程示意图;
图2是本申请一实施例提供的图像分类模型的部分网络层的结构示意图;
图3是本申请一实施例提供的图像分类模型训练装置的结构框图;
图4是本申请一实施例提供的终端设备的结构框图。
具体实施方式
为了使本申请所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在本申请实施例中,流程的执行主体可以为终端设备。该终端设备包括但不限于:服务器、计算机、智能手机以及平板电脑等能够执行本申请提供的图像分类模型训练方法和/或图像分类方法的设备。
下面对本申请出现的相关技术名词进行解释:
扰动处理:指在原始图像中添加一些人眼无法察觉的扰动信息(或者噪音)。
对抗样本:指在原始样本添加一些人眼无法察觉的微小扰动得到的,并且使得模型推理时做出错误推理的样本。在本申请中,将对原始样本扰动处理后,即添加了扰动信息的样本称为对抗样本。
参见图1,图1示出了本申请第一实施例提供的图像分类模型训练方法的流程示意图。本申请第一实施例提供的图像分类模型训练方法,包括:
S11,获取原始图像样本,并对所述原始图像样本进行扰动处理,得到对抗样本。
在本实施例中,所述原始图像样本为包含分类检测对象的图像,如在医学细胞图像分类领域中,所述原始图像样本可以为打上标签的急性淋巴细胞图像或者打上标签的神经细胞图像,该标签为细胞分类结果的一个标签。终端设备可以从本地存储的数据库中获取多个所述原始图像样本,或者从云数据库中获取多个所述原始图像样本,或者响应于用户实时输入的样本录入指令,接收用户上传的所述原始图像样本。终端设备可以在获取到多个所述原始图像样本后,对所有所述原始图像样本进行扰动处理,得到多个对抗样本;或者,终端设备可以从获取到的多个所述原始图像样本中抽取出预设数量的原始图像样本,并对抽取出的该批原始图像样本进行扰动处理,得到多个对抗样本。
在一种可能的实现方式中,终端设备可以通过随机生成一个扰动值,该扰动值为改变所述原始图像样本的特征信息的一个扰动信息,例如该扰动值可以为改变所述原始图像样本的颜色特征的扰动量,并将随机生成的扰动值添加到所述原始图像样本的目标扰动像素点上,得到所述对抗样本,该目标扰动像素点为被选中添加扰动信息的像素点。例如,终端设备可以将随机生成的颜色信息扰动值(1,1,1)添加到所述原始图像样本中每一像素点上,以使得所述原始图像样本中每一像素点的RGB颜色值由初始的(r0,g0,b0)变成(r0+1,g0+1,b0+1),进而得到所述对抗样本;其中,r0,g0,b0分别为RGB模式中红、绿、蓝三个通道的颜色取值。或者,终端设备可以通过获取预设的扰动值添加到所述原始图像样本的目标扰动像素点上得到所述对抗样本。或者,终端设备可以通过机器学习领域中常用的诸如标准初始化、高斯初始化等参数初始化方法初始化得到扰动值,并将得到的扰动值添加到所述原始图像样本的目标扰动像素点上,从而生成对抗样本。
在一种可能的实现方式中,上述步骤S11中对所述原始图像样本进行扰动处理,得到对抗样本,包括:
对所述原始图像样本进行像素级扰动处理和空间级扰动处理,得到对抗样本;其中,所述像素级扰动处理包括对所述原始图像样本中像素点的颜色值调整操作;所述空间级扰动处理包括对所述原始图像样本像素点的平移和/或旋转操作。
在一种可能的实现方式中,终端设备可以随机生成或者获取预先设置的像素扰动值和空间扰动值,并将像素扰动值和空间扰动值添加到所述原始图像样本的目标扰动像素点上,得到所述对抗样本。例如,终端设备可以随机生成一个像素级扰动值(Δr,Δg,Δb)添加到所述原始图像样本的每一个像素点上,以改变所述原始图像样本的像素点的颜色信息,其中,(Δr,Δg,Δb)分别为所述原始图像样本中像素点以RGB模式显示色彩时,像素点在红、绿、蓝三个通道的颜色变化量;并随机生成一个空间扰动值(Δu,Δv,α)添加到所述原始图像样本的每一个像素点上,以改变所述原始图像样本的空间信息。其中,Δu,Δv,α分别为所述原始图像样本中像素点的X轴方向上的变化量、Y轴方向上的变化量和旋转角度。
在本实施例中,所述对抗样本包含了像素级和空间级两种不同类型的扰动信息,使得所述图像分类模型不仅能学习到像素级扰动特征信息,还能学习到空间级扰动特征信息,从而使得所述图像分类模型能适应不同类型的扰动,提高了图像分类模型的鲁棒性。
在另一种可能的实现方式中,终端设备可以将所述原始图像样本输入所述图像分类模型,由所述图像分类模型对所述原始图像样本进行像素级扰动处理和空间级扰动处理,得到所述对抗样本。
在具体实施时,终端设备可以对所述原始图像样本添加像素级扰动量和空间级扰动量,然后将修改后的样本输入到所述图像分类模型中,并采用梯度上升法(即令模型的损失函数最大化)搜索像素级扰动量的最优值和空间级扰动量的最优值,从而得到像素级扰动量的最优值和空间级扰动量的最优值,进而将像素级扰动量的最优值和空间级扰动量的最优值添加到所述原始图像样本中,得到所述对抗样本。
在一种示例中,像素级扰动量的最优值和空间级扰动量的最优值的搜索可以分为两步进行,第一步是先对所述原始图像样本添加像素级扰动量,并将添加了像素级扰动量的样本输入到所述图像分类模型中,以在模型中对像素级扰动量的最优值进行搜索,以由像素级扰动量的最优值得到像素级扰动样本;第二步是将初始化生成的空间级扰动量添加到像素级扰动样本上,并将添加了空间级扰动量的像素级扰动样本输入到所述图像分类模型中,并使得模型的损失函数最大化以搜索得到空间级扰动量的最优值,从而将空间级扰动量的最优值添加到像素级扰动样本上,得到最终的对抗样本。
在本实施例中,通过在所述图像分类模型中对所述原始图像样本进行像素级扰动和空间级扰动处理,使得所述图像分类模型能够更好地学习像素级扰动特征信息和空间级扰动特征信息,提高了所述图像分类模型面对扰动的鲁棒性。
在一种可能的实现方式中,上述将所述原始图像样本输入所述图像分类模型,由所述图像分类模型对所述原始图像样本进行像素级扰动处理和空间级扰动处理,得到所述对抗样本,包括:
在所述图像分类模型中采用预设的对抗样本生成算法生成所述原始图像样本的像素扰动信息,并对所述原始图像样本添加所述像素扰动信息,得到像素级扰动样本;
初始化空间扰动量,并在所述图像分类模型对所述空间扰动量进行修正,得到空间扰动量目标值;其中,所述空间扰动量包括平移参数和/或旋转参数;
对所述像素级扰动样本添加所述空间扰动量目标值,得到对抗样本。
示例性的,终端设备可以采用投影梯度下降法(PGD,Projected GradientDescent)、快速梯度下降法(FGSM,Fast Gradient Sign Method)或其他对抗样本生成算法获得所述原始图像样本的像素扰动信息,本申请不对此进行限定。
在一种可能的实现方式中,所述在所述图像分类模型对所述空间扰动量进行修正,得到空间扰动量目标值,包括:
在所述图像分类模型中采用超参数搜索算法对所述空间扰动量的最优值进行搜索,以确定所述空间扰动量目标值。
在一种示例中,所述超参数搜索算法采用贝叶斯搜索算法,则终端设备在所述图像分类模型中对所述空间扰动量进行修正的一种实现方式为:
(1)首先定义目标函数,目标函数的目的是找到超参数e的取值,使得f(e)最小。因此,目标函数可以表示为下面公式:
其中,其中,ebest为超参数的最优值,X'为对抗样本,X1为像素级扰动样本,通过给像素级扰动样本添加空间扰动量(Δu,Δv,α)获得对抗样本,Δu,Δv,α分别为像素级扰动样本上的每一像素点在X轴方向上平移的变化量、在Y轴方向上平移的变化量和旋转角度。
(2)初始化n个样本采样点。
(3)通过高斯过程对目标函数的先验分布进行初始化。高斯过程由均值函数和协方差函数来定义,公式如下所示。
f(e)~GP(m(e),k(e,e')),
其中,m(e)为均值函数,k(e,e')为协方差函数,e'为下一个样本采样点。
均值函数的计算公式为:
m(e)=E[f(e)],
协方差函数的计算公式为:
k(e,e')=E[(f(e)-m(e))(f(e'-m(e'))],
其中,E()为期望函数。
(4)在当前已有采样样本点中的最优值处进行采样,并通过采集函数选择下一个样本点。在本示例中,将期望改进(Expected Improvement,EI)作为采集函数,选择下一个样本点。通常使用贝叶斯定理和高斯过程模型来计算期望改进,其公式如下所示:
EI(e')=E[maxf(e')-f(e*),0],
其中,E()为期望函数,f(e)'为在下一个样本采样点e'上的目标函数值,f(e*)为在当前已有采样样本点中的最优值,EI(e')为样本采样点e'处所能带来的期望提升。如果下一个样本采样点e'可以得到比当前最优解更好的函数值,则EI值将为正数,也就是求期望改进函数的极值以得到下一个采样点,如下公式所示:
e'=arg maxEIn(e),
(5)更新后验分布:获得下一个样本采样点之后,在目标函数f中评估该样本采样点e',获得结果f(e)',并根据本次评估值f(e)'来更新后验分布。
(6)重复步骤(4)和步骤(5),直到达到预设的最大迭代次数,得到空间扰动量的最优值。
在本实施例中,通过贝叶斯搜索算法对空间扰动量进行搜索,能有效提高搜索的效率。
在其他的实现方式中,所述超参数搜索算法可以采用网格搜索、随机搜索或基于梯度优化搜索中的任一种,本申请不对此进行限定。
S12,将所述原始图像样本和所述对抗样本输入到预先构建的图像分类模型中进行训练,得到训练后的图像分类模型。
在具体实施时,所述原始图像样本和所述对抗样本在所述图像分类模型中训练时,通过最小化损失函数以找到图像分类模型的参数θ,训练过程中最小化损失函数如下:
其中,E()为期望函数,D()为数据集,L为损失函数,X为原始图像样本,fθ()为模型的输出,y为原始图像样本X的标签,∈为像素级扰动量,A∈(X)为在原始图像样本上所添加的像素级扰动函数,(α,Δu,Δv)为空间扰动量,T(A∈(X),α,Δu,Δv)为在像素级扰动样本上所添加的空间级扰动函数。
在一些实施例中,所述图像分类模型可以采用基于EfficientNet的神经网络、卷积神经网络或递归神经网络等其他类型的网络结构,本申请不对此进行限定。
在一种可能的实现方式中,所述图像分类模型的网络层包括批标准化层;所述批标准化层包括干净批标准化模块和对抗批标准化模块;
所述批标准化层,用于通过所述干净批标准化模块对其他网络层输出的原始图像样本类型数据进行归一化处理,以及通过所述对抗批标准化模块对其他网络层输出的对抗样本类型数据进行归一化处理。
在本实施例中,所述图像分类模型设置有批标准化层(Batch Normalization,BN),批标准化层用于将输入的数据标准化为0或1,具有缓解梯度消失的作用。
在一种示例中,参见图2,图2示出了本申请一实施例给出的图像分类模型的部分网络层的结构图。在该示例中,批标准化层被设置在Conv卷积层和ReLU卷积层之间。终端设备将原始图像样本xclean和对抗样本xadv输入到Conv卷积层处理后,分别获得原始样本xclean的第一卷积结果和对抗样本xadv的第二卷积结果,并通过批标准化层中的所述干净批标准化模块处理原始样本xclean的第一卷积结果,以及通过所述对抗批标准化模块处理对抗样本xadv的第二卷积结果,最后将批标准化层对原始图像样本类型数据和对抗样本类型数据的处理结果输入到ReLU卷积层进行处理。
可以理解的,机器学习模型的网络层包括但不限于卷积层、激活函数层、池化层、批标准化层和全连接层。本申请实施例所描述的所述图像分类模型可以根据实际情况设置模型所需的网络层、各个网络层的层数以及各网络层间的连接关系,因此,对于批标准化层在模型中的网络位置以及与其他网络层之间的连接方式不限于图2所示出的方式。
在本实施例中,通过在所述图像分类模型的所述批标准化层中设置对原始图像样本类型数据进行归一化处理的干净批标准化模块,以及对对抗样本类型数据进行归一化处理的对抗批标准化模块,能提高模型对原始图像样本识别的准确率。
相应地,本申请一实施例还提供了一种图像分类方法,包括:
将待分类的图像输入到图像分类模型中进行分类,得到分类结果;
其中,所述图像分类模型为利用上述实施例提供的所述的图像分类模型训练方法训练得到的图像分类模型。
示例性的,本实施例的图像分类方法可以应用于急性淋巴细胞分类场景中,在该应用场景中,终端设备可以获取包含有急性淋巴细胞的图像样本集,其中,图像样本集中的每一原始样本包含有对应细胞类别的真实标签。终端设备在获取到原始样本后,对原始样本进行扰动处理,扰动处理的方式可以是对原始样本中的目标扰动像素点的颜色特征信息的变换和/或像素点空间位置的变换。终端设备通过对原始样本扰动处理后,获得对抗样本,并根据原始的图像样本和生成的对抗样本训练预先构建的急性淋巴细胞分类模型,得到训练后的急性淋巴细胞分类模型,并利用训练后的急性淋巴细胞分类模型对急性淋巴细胞图像进行分类,得到急性淋巴细胞分类结果。
对应于上文实施例所述的方法,图3示出了本申请一实施例提供的图像分类模型训练装置的结构示意图,为了便于说明,仅示出了与本申请实施例相关的部分。本实施例提供的图像分类模型训练装置,包括对抗生成模块31和训练模块32。
所述对抗生成模块31,用于获取原始图像样本,并对所述原始图像样本进行扰动处理,得到对抗样本。
所述训练模块32,用于将所述原始图像样本和所述对抗样本输入到预先构建的图像分类模型中进行训练,得到训练后的图像分类模型。
在一种可能的实现方式中,所述对抗生成模块31对所述原始图像样本进行扰动处理,得到对抗样本,包括:
对所述原始图像样本进行像素级扰动处理和空间级扰动处理,得到对抗样本;其中,所述像素级扰动处理包括对所述原始图像样本中像素点的颜色值调整操作;所述空间级扰动处理包括对所述原始图像样本中像素点的平移和/或旋转操作。
在一种可能的实现方式中,所述对抗生成模块31对所述原始图像样本进行扰动处理,得到对抗样本,包括:
将所述原始图像样本输入所述图像分类模型,由所述图像分类模型对所述原始图像样本进行像素级扰动处理和空间级扰动处理,得到所述对抗样本。
在一种可能的实现方式中,所述对抗生成模块31将所述原始图像样本输入所述图像分类模型,由所述图像分类模型对所述原始图像样本进行像素级扰动处理和空间级扰动处理,得到所述对抗样本,包括:
在所述图像分类模型中采用预设的对抗样本生成算法生成所述原始图像样本的像素扰动信息,并对所述原始图像样本添加所述像素扰动信息,得到像素级扰动样本;
初始化空间扰动量,并在所述图像分类模型对所述空间扰动量进行修正,得到空间扰动量目标值;其中,所述空间扰动量包括平移参数和/或旋转参数;
对所述像素级扰动样本添加所述空间扰动量目标值,得到对抗样本。
在一种可能的实现方式中,所述对抗生成模块31在所述图像分类模型对所述空间扰动量进行修正,具体包括:
空间扰动量在所述图像分类模型中采用超参数搜索算法对所述空间扰动量的最优值进行搜索,以确定所述空间扰动量目标值空间扰动量。
在一种可能的实现方式中,所述图像分类模型的网络层包括批标准化层;所述批标准化层包括干净批标准化模块和对抗批标准化模块;
所述批标准化层,用于通过所述干净批标准化模块对其他网络层输出的原始图像样本类型数据进行归一化处理,以及通过所述对抗批标准化模块对其他网络层输出的对抗样本类型数据进行归一化处理。
相应地,本申请一实施例还提供一种图像分类装置,包括分类模块,所述分类模块用于将待分类的图像输入到图像分类模型中进行分类,得到分类结果;其中,所述图像分类模型为利用上述实施例提供的图像分类模型训练方法训练得到的图像分类模型。
需要说明的是,上述装置之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
相应地,图4示出了本申请一实施例提供的终端设备的结构示意图。如图4所示,该实施例的终端设备包括:至少一个处理器40(图4中仅示出一个)处理器、存储器41以及存储在所述存储器41中并可在所述至少一个处理器40上运行的计算机程序42,所述处理器40执行所述计算机程序42时实现上述任意一个方法实施例中的步骤。
所述终端设备4可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备,该终端设备可包括,但不仅限于,处理器40、存储器41。本领域技术人员可以理解,图4仅仅是终端设备4的举例,并不构成对终端设备4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备等。
所称处理器40可以是中央处理单元(Central Processing Unit,CPU),该处理器40还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器41在一些实施例中可以是所述终端设备4的内部存储单元,例如终端设备4的硬盘或内存。所述存储器41在另一些实施例中也可以是所述终端设备4的外部存储设备,例如所述终端设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器41还可以既包括所述终端设备4的内部存储单元也包括外部存储设备。所述存储器41用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述实施例提供的图像分类模型训练方法的步骤,或者图像分类方法的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccessMemory)、电载波信号、电信信号以及软件分发介质。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种图像分类模型训练方法,其特征在于,包括:
获取原始图像样本,并对所述原始图像样本进行扰动处理,得到对抗样本;
将所述原始图像样本和所述对抗样本输入到预先构建的图像分类模型中进行训练,得到训练后的图像分类模型。
2.如权利要求1所述的图像分类模型训练方法,其特征在于,所述对所述原始图像样本进行扰动处理,得到对抗样本,包括:
对所述原始图像样本进行像素级扰动处理和空间级扰动处理,得到所述对抗样本;其中,所述像素级扰动处理包括对所述原始图像样本中像素点的颜色值调整操作;所述空间级扰动处理包括对所述原始图像样本中像素点的平移和/或旋转操作。
3.如权利要求2所述的图像分类模型训练方法,其特征在于,所述对所述原始图像样本进行像素级扰动处理和空间级扰动处理,得到对抗样本,包括:
将所述原始图像样本输入所述图像分类模型,由所述图像分类模型对所述原始图像样本进行像素级扰动处理和空间级扰动处理,得到所述对抗样本。
4.如权利要求3所述的图像分类模型训练方法,其特征在于,所述将所述原始图像样本输入所述图像分类模型,由所述图像分类模型对所述原始图像样本进行像素级扰动处理和空间级扰动处理,得到所述对抗样本,包括:
在所述图像分类模型中采用预设的对抗样本生成算法生成所述原始图像样本的像素扰动信息,并对所述原始图像样本添加所述像素扰动信息,得到像素级扰动样本;
初始化空间扰动量,并在所述图像分类模型对所述空间扰动量进行修正,得到空间扰动量目标值;
对所述像素级扰动样本添加所述空间扰动量目标值,得到所述对抗样本。
5.如权利要求4所述的图像分类模型训练方法,其特征在于,所述在所述图像分类模型对所述空间扰动量进行修正,得到空间扰动量目标值,包括:
在所述图像分类模型中采用超参数搜索算法对所述空间扰动量的最优值进行搜索,以确定所述空间扰动量目标值。
6.如权利要求1至5任一项所述的图像分类模型训练方法,其特征在于,所述图像分类模型的网络层包括批标准化层;所述批标准化层包括干净批标准化模块和对抗批标准化模块;
所述批标准化层,用于通过所述干净批标准化模块对其他网络层输出的原始图像样本类型数据进行归一化处理,以及通过所述对抗批标准化模块对其他网络层输出的对抗样本类型数据进行归一化处理。
7.一种图像分类方法,其特征在于,包括:将待分类的图像输入到图像分类模型中进行分类,得到分类结果;
其中,所述图像分类模型为利用如权利要求1至6任一项所述的图像分类模型训练方法训练得到的图像分类模型。
8.一种终端设备,其特征在于,包括:
对抗生成模块,用于获取原始图像样本,并对所述原始图像样本进行扰动处理,得到对抗样本;
训练模块,用于将所述原始图像样本和所述对抗样本输入到预先构建的图像分类模型中进行训练,得到训练后的图像分类模型。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述计算机程序时实现如权利要求1至6任一项所述的图像分类模型训练方法,或者,所述处理器执行所述计算机程序时实现如权利要求7所述的图像分类方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的图像分类模型训练方法,或者,所述计算机程序被处理器执行时实现如权利要求7所述的图像分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310438255.5A CN116486151A (zh) | 2023-04-14 | 2023-04-14 | 图像分类模型训练方法、图像分类方法、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310438255.5A CN116486151A (zh) | 2023-04-14 | 2023-04-14 | 图像分类模型训练方法、图像分类方法、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116486151A true CN116486151A (zh) | 2023-07-25 |
Family
ID=87220845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310438255.5A Pending CN116486151A (zh) | 2023-04-14 | 2023-04-14 | 图像分类模型训练方法、图像分类方法、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116486151A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117934819A (zh) * | 2024-03-20 | 2024-04-26 | 中铁第六勘察设计院集团有限公司 | 一种轨道缺陷检测系统鲁棒性提升方法 |
-
2023
- 2023-04-14 CN CN202310438255.5A patent/CN116486151A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117934819A (zh) * | 2024-03-20 | 2024-04-26 | 中铁第六勘察设计院集团有限公司 | 一种轨道缺陷检测系统鲁棒性提升方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10984272B1 (en) | Defense against adversarial attacks on neural networks | |
CN111310775A (zh) | 数据训练方法、装置、终端设备及计算机可读存储介质 | |
CN111507993A (zh) | 一种基于生成对抗网络的图像分割方法、装置及存储介质 | |
CN108229673B (zh) | 卷积神经网络的处理方法、装置和电子设备 | |
CN110751037A (zh) | 车身颜色识别的方法及终端设备 | |
CN110675334A (zh) | 一种图像增强方法及装置 | |
CN110969046B (zh) | 人脸识别方法、设备及计算机可读存储介质 | |
US10573040B2 (en) | Image modification using detected symmetry | |
CN113066002A (zh) | 对抗样本的生成方法、神经网络的训练方法、装置及设备 | |
CN105095835A (zh) | 行人检测方法及系统 | |
CN114155365A (zh) | 模型训练方法、图像处理方法及相关装置 | |
WO2021010342A1 (ja) | 行動認識装置、行動認識方法、及び行動認識プログラム | |
CN116486151A (zh) | 图像分类模型训练方法、图像分类方法、设备及存储介质 | |
CN113920382B (zh) | 基于类一致性结构化学习的跨域图像分类方法和相关装置 | |
Costa et al. | How Deep Learning Sees the World: A Survey on Adversarial Attacks & Defenses | |
CN114444565A (zh) | 一种图像篡改检测方法、终端设备及存储介质 | |
KR101700030B1 (ko) | 사전 정보를 이용한 영상 물체 탐색 방법 및 이를 수행하는 장치 | |
CN113191189A (zh) | 人脸活体检测方法、终端设备及计算机可读存储介质 | |
CN112364916A (zh) | 基于迁移学习的图像分类方法、相关设备及存储介质 | |
CN116167912A (zh) | 对抗样本生成方法、抗攻击检测方法、装置及电子设备 | |
CN116433704A (zh) | 一种基于中心点的细胞核分割方法及相关设备 | |
CN113837998A (zh) | 一种基于深度学习的图片自动调整对齐的方法及装置 | |
Ying et al. | Simulation of computer image recognition technology based on image feature extraction | |
CN112381810A (zh) | 一种肺炎图像识别方法、装置及计算设备 | |
CN109286798B (zh) | 一种投影屏幕的边框位置识别方法、系统及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |