CN112149738B

CN112149738B - 一种用于改善图像识别模型领域变换现象的方法

Info

Publication number: CN112149738B
Application number: CN202011018379.0A
Authority: CN
Inventors: 谭志; 刘兴业
Original assignee: Beijing University of Civil Engineering and Architecture
Current assignee: Beijing University of Civil Engineering and Architecture
Priority date: 2020-09-24
Filing date: 2020-09-24
Publication date: 2021-04-27
Anticipated expiration: 2040-09-24
Also published as: CN112149738A

Abstract

本发明提供的一种用于改善图像识别模型领域变换现象的方法，运用了遗传算法，通过为每个属性赋予一个权重值，在对属性的搜索过程中不断更新属性的权重值。根据属性的权重值计算每个属性被搜索的概率，权重值越小的属性的被搜索概率也就越大，反之被搜索的概率越小。根据每个属性的被搜索概率对属性进行搜索，可以控制搜索的方向，从而避免某些属性被搜索次数过多或者被搜索次数过少。通过将Equal函数和Sum函数结合运用，完成对属性组合的筛选，改善了计算的复杂过程。在整个过程中使用基于Leaky Relu激活函数构造的具有3个卷积层的卷积神经网络，避免了模型训练过程中会出现小于0的神经元无法更新参数的现象达到了充分提取图像特征的目的。

Description

一种用于改善图像识别模型领域变换现象的方法

技术领域

本发明涉及计算机视觉技术领域，尤其涉及一种用于改善图像识别模型领域变换现象的方法。

背景技术

图像识别，是指利用计算机对图像进行各种处理、分析和理解，是人工智能的一个重要领域。计算机完成对图像的识别主要是依据图像的主要特征，例如数字“6”中有一个“圈”，数字“8”中有两个“圈”等。然而针对不同领域的图像，往往具有不同的主要特征，例如图像的尺寸、通道数、背景颜色等特征都会对图像识别模型产生。但是计算机在识别过程中，不能做到像人的眼睛一样对图像做出自主辩证的判断，无法直接排除一些不必要图像特征的影响并直接找到图像的主要特征从而完成对图像的识别。因此通过训练一个可以跨域识别的图像识别模型对于图像识别领域尤为重要。

但是在研究和实验中，可处理的训练数据通常是针对某个特定的领域制作的，因此训练的模型是针对该特定领域的。在应用中，模型必须处理来其他领域的数据时，该模型的识别准确性会明显降低，得的预测结果会有很大的偏差，这个问题通常被称为“领域变换”现象。例如用每张图像大小为28×28且为单通道的MNIST数据集训练手写数字识别模型，当模型达到令人满意的识别水平(识别的准确率达到99％及以上)时，用该模型识别每张图像大小为32×32且为三通道的SVHN数据集(街景门牌号码数据集)，得到的识别准确性会明显降低。虽然两个数据集都是用于训练数字识别模型的，但是两个数据集属于不同的领域(MNIST数据集为手写数字数据集，SVHN数据集为街景门牌号码数据集)，图像特性之间存在较大的差异，计算机不能像人一样对两个数据集辩证的识别，因此无法直接判断出相应的差异并准确的“读”出图像中的数字。

为了解决上述问题，Volpi and V.Murino《Addressing Model Vulnerablity toDistributional Shifts Over Image Transformation Sets[C]//Proceedings of theIEEE International Conference on Computer Vision》Seoul,Korea(South):IEEE，2019:p 7979-7988提出了一种组合优化的方式，处理给定模型中图像空间中较易受影响的区域，并将随机搜索算法与遗传算法相结合从而改善通过初始领域训练的模型，使得模型识别其他领域图像的准确性有了显著的提高。该方案的缺点是：

1、在构造属性组合的过程中采用简单的随机搜索方法，不能确保对所有的属性进行均衡搜索，影响遗传算法种群中个体的分布情况。

2、只采用3个属性作为一个属性组合，导致种群中个体过于简单，从而影响了整个遗传算法实现的效果。

3、在筛选待优化属性组合的过程中采用计算模型准确率的方式使计算变得复杂。

4、整个过程中构造的卷积神经网络模型不够完善，会导致对图像的特征提取不够充分。

发明内容

本发明的实施例提供了一种用于改善图像识别模型领域变换现象的方法，用于解决现有技术中存在的问题。

为了实现上述目的，本发明采取了如下技术方案。

一种用于改善图像识别模型领域变换现象的方法，包括：

S1从数据集的图像属性中获得第一属性组合；

S2选取数据集的多个图像，根据第一属性组合改变该多个图像的属性，获得与该第一属性组合相对应的第一过程图像；

S3将第一过程图像输入到卷积神经网络模型，获得第一过程图像的识别准确性；

S4重复执行步骤S1多次，获得多个第一属性组合，构成种群；令每个第一属性组合相对应的第一过程图像的识别准确性的倒数作为每个第一属性组合的适应度；

S5基于适应度，从种群中选取两个第一属性组合，并进行交叉和突变处理，获得第二属性组合；

S6通过该第二属性组合改变图像的属性，获得与第二属性组合相对应的第二过程图像；

S7将第二过程图像输入到卷积神经网络模型，获得图像的预测值，结合图像的真实值，计算获得第二属性组合的判断结果；

S8将判断结果与预设的筛选阈值进行比较，获得待优化的第三属性组合；

S9重复执行步骤S5至S8，获得多个第三属性组合；

S10将数据集分成多个批次的子集，并随机抽取一个第三属性组合，用于改变子集的图像的属性，获得与某个批次的子集相对应的第三过程图像；

S11将第三过程图像输入到卷积神经网络模型进行处理；

S12重复执行步骤S10和S11多次；

S13重复执行步骤S1至S12多次，获得卷积神经网络模型的参数。

优选地，步骤S1包括：

S11通过式

计算数据集中每个图像属性的被搜索概率；

S12基于每个图像属性的被搜索概率，以较高的被搜索概率随机搜索每个图像属性对应权重值较小的图像属性，以较低的被搜索概率随机搜索每个图像属性对应权重值较大的图像属性；

S13重复执行子步骤S12多次，获得第一属性组合。

优选地，步骤S3包括：

S31通过Leaky Relu激活函数构造具有3个卷积层的卷积神经网络模型；

S32将第一过程图像输入到该卷积神经网络模型，获得第一过程图像的识别准确性。

优选地，步骤S4包括：

S41重复执行步骤S1多次，获得多个第一属性组合，构成算式

Pop＝{T₁,T₂......T_P} (2)，式中，Pop为种群，T为第一属性组合；

S42令每个第一属性组合相对应的第一过程图像的识别准确性的倒数作为每个第一属性组合的适应度，构成算式

式中Fit为第一属性组合的适应度，ACCT为第一过程图像的识别准确性。

优选地，步骤S5包括：

S51基于适应度，通过式

从种群中选取两个第一属性组合；式中，Sel为从种群中选取的第一属性组合；

S52通过式

对该两个第一属性组合进行交叉处理，获得新个体；

S53以突变率η对新个体进行突变处理，获得第二属性组合。

优选地，步骤S7包括：

S71将第二过程图像输入到子步骤S31中构建的卷积神经网络模型，用Adam优化算法训练优化该卷积神经网络模型，获得第一训练结果；

S72基于该第一训练结果，结合图像的真实值，根据式

判断第一训练结果与该真实值是否相等；

S73通过式

对式(6)的返回值进行求和，获得判断结果。

优选地，步骤S8包括：

S81设步骤S71每次获得第一训练结果的总个数为预设阈值；

S82将判断结果与预设阈值进行比较，筛选出小于预设阈值的判断结果，获得第三属性组合。

优选地，步骤S11包括：

将第三过程图像输入到子步骤S31中构造的卷积神经网络模型，通过Adam优化算法训练该卷积神经网络模型，获得第二训练结果。

由上述本发明的实施例提供的技术方案可以看出，本发明提供的一种用于改善图像识别模型领域变换现象的方法，运用了遗传算法，通过为每个属性赋予一个权重值，在对属性的搜索过程中不断更新属性的权重值。根据属性的权重值计算每个属性被搜索的概率，权重值越小的属性的被搜索概率也就越大，反之被搜索的概率越小。根据每个属性的被搜索概率对属性进行搜索，可以控制搜索的方向，从而避免某些属性被搜索次数过多或者被搜索次数过少。通过本方法构成的属性组合使得种群中个体的分布比较均衡。通过增加属性组合中包含属性的个数，增加了遗传算法种群中个体的复杂度。通过将Equal函数和Sum函数结合运用，完成对属性组合的筛选，改善了计算的复杂过程。在整个过程中使用基于Leaky Relu激活函数构造的具有3个卷积层的卷积神经网络，避免了模型训练过程中会出现小于0的神经元无法更新参数的现象达到了充分提取图像特征的目的。

本发明附加的方面和优点将在下面的描述中部分给出，这些将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的一种用于改善图像识别模型领域变换现象的方法的处理流程图；

图2为本发明提供的一种用于改善图像识别模型领域变换现象的方法中卷积神经网络模型的结构示意图；

图3为本发明提供的一种用于改善图像识别模型领域变换现象的方法的一种优选实施例的流程图；

图4为应用本发明提供的方法进行数据处理并与现有技术相比较的示意图。

具体实施方式

下面详细描述本发明的实施方式，所述实施方式的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样定义，不会用理想化或过于正式的含义来解释。

为便于对本发明实施例的理解，下面将结合附图以几个具体实施例为例做进一步的解释说明，且各个实施例并不构成对本发明实施例的限定。

参见图1，本发明提供一种用于改善图像识别模型领域变换现象的方法，包括：

S1从数据集的图像属性中获得第一属性组合；

S9重复执行步骤S5至S8，获得多个第三属性组合；

S11将第三过程图像输入到卷积神经网络模型进行处理；

S12重复执行步骤S10和S11多次；

S13重复执行步骤S1至S12多次，获得卷积神经网络模型的所有内部参数。获得了该参数，完成卷积神经网络模型的构建，用于图像识别处理。

在本发明提供的实施例中，用于改善图像识别模型领域变换现象的方法，其特点是运用了遗传算法。进一步的，步骤S1具体包括如下子步骤：

S11通过式

计算数据集中每个图像属性的被搜索概率P_ssn1,P_ssn2.....P_ssn211；

S12基于每个图像属性的被搜索概率P_ssn1,P_ssn2.....P_ssn211，以较高的被搜索概率随机搜索每个图像属性对应权重值较小的图像属性，以较低的被搜索概率随机搜索每个图像属性对应权重值较大的图像属性；

S13重复执行子步骤S12多次(例如可以是5次)，选取多个(5个)图像属性获得第一属性组合T。

当构造了第一属性组合T之后，需要计算按照属性组合的形式改变图像后(属性组合中有哪些属性就改变图像的哪些属性)识别模型对改变了属性组合后的图像的识别准确性。则每个属性组合对应一个识别准确性，设为ACCT。并且为了解决神经网络对图像特征提取不够充分的缺点，提出采用Leaky Relu激活函数构造具有3个卷积层的卷积神经网络(如图2所示)，避免了模型训练过程中会出现小于0的神经元无法更新参数的现象，实现对图像特征提取更加充分。

进一步的，步骤S3包括：

S32将第一过程图像输入到该卷积神经网络模型，获得第一过程图像的识别准确性ACCT。

进一步的，步骤S4包括：

S41重复执行步骤S1多次，获得多个第一属性组合，构成算式

S42令每个第一属性组合T相对应的第一过程图像的识别准确性ACCT的倒数作为每个第一属性组合的适应度，构成算式

进一步的，步骤S5具体包括：

S51根据第一属性组合的适应度从种群Pop中选取属性组合并且每次选择两个第一属性组合，假设它们分别是Sel1和Sel2，它们的具体形式为：

S52选择某个位置上的任何元素作为交叉点。例如，如果第i个元素是交叉点，则Sel1中从i到n的元素与Sel2中从i到n的元素互换。他们通过Crossover后的形式是：

进行了交叉处理之后，将产生两个新的个体Cro1和Cro2；

S53图像属性组合经过交叉后，每个第一属性组合中的每个元素都会以突变率η进行突变(随机更改为另一个图像属性)，并将突变后的两个第一属性组合定义为第二属性组合，其分别为Mut1和Mut2。

进一步的，步骤S7包括：

S71将第二过程图像输入到子步骤S31中构建的卷积神经网络模型，用Adam优化算法训练优化该卷积神经网络模型，获得第一训练结果，即第二过程图像的预测值；

S72随后基于该第一训练结果，结合图像的真实值，利用Equal函数判断预测值y^*与真实值y是否相等，若预测值等于真实值则函数的返回值为1，反之为0；Equal函数式为

其中，

为对第i的目标的预测值，y_i为第i个目标的真实值，δ_i为Equal函数的返回值，D_N为每次预测目标的个数；

S73然后用Sum函数对δ进行求和。Sum函数式为

其中，S为Sum函数的返回值。

进一步的，步骤S8包括：

S81为了使模型的预测效果达到最优，本发明将D_N(每次预测目标的总个数)设定为判断方法的阀值，将使得Sum函数返回值小于D_N时对应的对象提取出来。

S82若Sum函数的返回值等于D_N，则表明基于选取的对象对目标元素预测的效果最好；若Sum函数的返回值等于0，则说明预测效果最差；若Sum函数的返回值介于0到N之间，则表明预测效果一般；将判断结果与预设阈值进行比较，筛选出小于预设阈值的判断结果，获得第三属性组合，设定为待优化的属性组合。

更进一步的，将重复执行步骤S5至S8，获得多个第三属性组合；将数据集分成多个批次的子集，并随机抽取一个第三属性组合，用于改变子集的图像的属性，获得与某个批次的子集相对应的第三过程图像；将第三过程图像输入到子步骤S31中构造的卷积神经网络模型，通过Adam优化算法训练该卷积神经网络模型，获得第二训练结果；重复执行步骤S10和S11多次；重复执行步骤S1至S12多次，获得并输出卷积神经网络模型学习到的图像的权重。

本发明还提供一个实施例，用于示例性地显示具体执行本发明提供的方法的过程，如图3所示：

第一步，准备训练模型所用的数据集和图像的属性，本发明选用的训练集为MNIST数据集，选用211个图像属性。

第二步，首先根据算式(1)计算每个属性的被搜索概率P_ssn1,P_ssn2.....P_ssn211。最后根据每个属性的对应的被搜索概率P_ssn1,P_ssn2......P_ssn211,在所有的图像属性内，以较高的被搜索概率随机搜索对应权重值小的属性，以较低的被搜索概率随机搜索权重值大的属性。通过循环5次，选取五个属性组成一个属性组合T。

第三步，选用数据集中一部分图像，总个数为D_N，根据属性组合改变这一部分图像的属性，即属性组合中包含哪些属性就改变这一部分图像的哪些属性。

第四步，将第三步中改变属性后的图像输入到神经网路模型(如图2所示)中，得到模型识别改变一组属性后的图像的准确性ACCT，并且可以得到每个属性组合T都对应一个ACCT。

第五步，循环10次第二步，得到10个T构成算式(2)，即遗传算法中的种群Pop。并且令每个T对应的ACCT的倒数，作为T的适应度，从而可以得到算式(3)Fit。

第六步，根据Fit从Pop中选取属性组合。每次可以得到两个形式如算式(4)的图像属性组合，假设它们是Sel1和Sel2。

第七步，根据算式(5)对第六步得到的两个属性组合Sel1和Sel2进行交叉处理，得到Cor1和Cor2。

第八步，以突变率η对第七步得到的Cor1和Cor2进行突变(随机更改为另一个图像属性),突变后将得到两个新的属性组合，将他们定义为Mut1和Mut2。

第九步，用第八步得到的Mut1和Mut2分别改变部分图像的属性，即Mut1和Mut2中有哪些属性就改变图像的哪些属性。

第十步，将第九步改变属性后的图像输入到采用Leaky Relu激活函数构造具有3个卷积层的卷积神经网络(如图2所示)，用Adam优化算法训练优化模型，通过梯度下降的方进行训练，并得到训练结果。

第十一步，根据第十步的训练结果的预测值，结合真实值，计算出属性组合的判断结果。先根据算式(6)用Equal函数判断预测值与真实值是否相等，再根据算式(7)用Sum函数对Equa函数的返回值进行求和。

第十二步，将判断结果与筛选阀值进行比较。若Sum函数的返回值等于D_N，则表明基于选取的对象对目标元素预测的效果最好。若Sum函数的返回值等于0，则说明预测效果最差。若Sum函数的返回值介于0到D_N之间，则表明预测效果一般。

第十三步，筛选出没有达到筛选阀值时对应的属性组合，将其定为待优化属性组合。为了使模型的预测效果达到最优，本发明将D_N(每次预测目标的总个数)设定为判断方法的阀值，将使得Sum函数返回值小于D_N时对应的对象提取出来。

第十四步，循环5次第六步到第十三步，实现1次遗传算法，得到经过一次遗传算法后的待优化属性组合。

第十五步，循环10次第十四步，即执行10次遗传算法，得到一系列待优化的属性组合。

第十六步，从第十五步得到的一系列待优化组合中随机挑取一个待优化属性组合。

第十七步，将数据集分成若干批次，根据循环过程运用每个批次图像，根据第十六步选取的待优化属性组合改变一个批次图像的属性，即待优化属性组合中包含哪些属性就改变这一批次图像的哪些属性。

第十八步，将第十七步改变属性后的图像输入到采用Leaky Relu激活函数构造具有3个卷积层的卷积神经网络(如图2所示)，使用Adam优化算法训练优化模型，通过梯度下降的方法训练模型。

第十九步，循环第十六步到第十八步，共循环10000次。

第二十步，循环第二步到第十九步，共循环100次。

第二十一步，输出训练后的卷积神经网络模型的参数。

本发明提供的方法，在构造遗传算法中种群的过程中，通过为每个属性赋予一个权重值，在对属性的搜索过程中不断更新属性的权重值。根据属性的权重值计算每个属性被搜索的概率，权重值越小的属性的被搜索概率也就越大，反之被搜索的概率越小。根据每个属性的被搜索概率对属性进行搜索，可以控制搜索的方向，从而避免某些属性被搜索次数过多或者被搜索次数过少。通过此方法构成的属性组合使得种群中个体的分布比较均衡。通过增加属性组合中包含属性的个数，增加了遗传算法种群中个体的复杂度。通过将Equal函数和Sum函数结合运用，完成对属性组合的筛选，改善了计算的复杂过程。在整个过程中使用基于Leaky Relu激活函数构造的具有3个卷积层的卷积神经网络，避免了模型训练过程中会出现小于0的神经元无法更新参数的现象达到了充分提取图像特征的目的。本发明明显提高了图像识别模型的可移植性能，实验结果如图4所示。图中，a曲线为Volpi等人提出的识别模型经过初始领域数据集(MNIST数据集)训练后的准确性，b曲线为Volpi等人提出的识别模型经过其他领域数据集(SVHN数据集)测试后的准确性；c曲线为本发明构造的识别模型经过初始领域数据集(MNIST数据集)训练后的准确性，d曲线为本发明构造的识别模型经过其他领域数据集(SVHN数据集)测试后的准确性。通过图4可以看出虽然Volpi等人提出的识别模型和本发明构造的识别模型在初始领域数据集上训练后的准确性达到了相同的且令人满意的状态(接近100％)。但是b、d两条曲线总体显示的结果表明，本发明构造的识别模型在其他领域数据集上的准确性明显高于Volpi等人提出的识别模型。可证明本发明所训练的模型已经达到了预期改善图像识别模型“领域变换”现象的效果。

综上所述，本发明提供的一种用于改善图像识别模型领域变换现象的方法，运用了遗传算法，通过为每个属性赋予一个权重值，在对属性的搜索过程中不断更新属性的权重值。根据属性的权重值计算每个属性被搜索的概率，权重值越小的属性的被搜索概率也就越大，反之被搜索的概率越小。根据每个属性的被搜索概率对属性进行搜索，可以控制搜索的方向，从而避免某些属性被搜索次数过多或者被搜索次数过少。通过本方法构成的属性组合使得种群中个体的分布比较均衡。通过增加属性组合中包含属性的个数，增加了遗传算法种群中个体的复杂度。通过将Equal函数和Sum函数结合运用，完成对属性组合的筛选，改善了计算的复杂过程。在整个过程中使用基于Leaky Relu激活函数构造的具有3个卷积层的卷积神经网络，避免了模型训练过程中会出现小于0的神经元无法更新参数的现象达到了充分提取图像特征的目的。

本领域普通技术人员可以理解：附图只是一个实施例的示意图，附图中的模块或流程并不一定是实施本发明所必须的。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置或系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。