CN113887636A

CN113887636A - 基于遗传算法的可选择数据增强方法及系统

Info

Publication number: CN113887636A
Application number: CN202111175442.6A
Authority: CN
Inventors: 魏骁勇; 马跃; 张栩禄; 杨震群
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2021-10-09
Filing date: 2021-10-09
Publication date: 2022-01-04
Anticipated expiration: 2041-10-09
Also published as: CN113887636B

Abstract

本发明提供了一种基于遗传算法的可选择数据增强方法及系统，属于深度学习和图像识别领域，解决现有技术对于特定领域，所增强的数据训练集很容易产生错误，容易影响模型训练的结果，从而造成模型识别准确率变低的问题。主要方案包括：1)获取数据集；2)搭建一个图像分类网络模型和两个选择神经网络；3)基于训练集并行训练初始种群中的各图像分类网络模型并更新两个选择神经网络；4)通过验证集得到各图像分类网络模型的准确率；5)若准确率满足条件，输出两个选择神经网络的结果，否则转到步骤6；6)基于遗传算法和两个选择神经网络输出的选择概率构建新种群，将新种群替换步骤3中的种群，替换后再转到步骤3；本发明用于可选择数据增强。

Description

基于遗传算法的可选择数据增强方法及系统

技术领域

一种基于遗传算法的可选择数据增强方法及系统，用于可选择数据增强，属于深度学习和图像识别领域。

背景技术

图像识别是深度学习算法的一个重要应用，它利用计算对图像进行处理、分析和理解，以达到识别图像中的目标和对象的目的。图像的识别过程主要分为四步：图像采集、图像预处理、特征提取、图像识别。图像识别问题的数学本质属于模式空间到类别空间的映射问题。图像识别是人工智能的一个重要领域，目前利用深度学习的方法，构建网络模型进行图像识别是极其热门的方向，神经网络模型要得到满意的识别准确率，需要大量的参数，许许多多的神经网络参数都是数以百万计，要使得这些参数进行正确拟合需要大量的数据进行训练，而我们往往难以获得足够数量的数据。因此可以通过数据增强的方法不仅可以扩大训练数据集的规模，而且可以提高模型的泛化能力，降低模型对训练集的依赖性。

对于特定领域的数据集选择合适的数据增强方式至关重要，如手写数字如果对训练数据旋转180°，就有可能把6和9颠倒错乱。所以数据增强方式的选择，及其增强参数的选择都有可能影响模型的最终训练结果。

综上所述，通过数据增强方法扩大训练数据集存在如下技术问题：

1.对于特定领域，所增强的数据训练集很容易产生错误，容易影响模型训练的结果，从而造成模型识别准确率变低；

2.若基于经验或者随机搜索等方法选择数据增强方法，对网络模型完全训练来评估所选数据增强方法，往往需要花费大量时间进行多次尝试才能选择较为合适的数据增强方法。

发明内容

针对上述研究的问题，本发明的目的在于提供一种基于遗传算法的可选择数据增强方法及系统，解决现有技术对于特定领域，所增强的数据训练集很容易产生错误，容易影响模型训练的结果，从而造成模型识别准确率变低的问题。

为了达到上述目的，本发明采用如下技术方案：

一种基于遗传算法的可选择数据增强方法，包括：

步骤1：获取数据集，包括训练集和验证集；

步骤2：搭建一个图像分类网络模型和两个选择神经网络，两个选择神经网络输出各数据增强方式及其参数的候选值的选择概率以供图像分类网络模型训练前进行选择、生成初始种群和得到初始种群归一化后的整体概率，其中，初始种群由多个图像分类网络模型组成，初始种群大小自定义，各数据增强方式包括图像翻转、旋转、平移、错切、亮度调整和对比度调整，数据增强方式的参数包括翻转的翻转概率、旋转的旋转角度、平移的范围大小、错切的角度、亮度的调整幅度和对比度的调整幅度；

步骤3：基于训练集并行训练初始种群中各图像分类网络模型，并基于训练过程中各分类网络模型的输出训练两个选择神经网络；

步骤4：训练集中的图像全部输入各图像分类网络模型后，使用验证集验证训练后的各图像分类网络模型，得到各图像分类网络模型的准确率；

步骤5：若各图像分类网络模型的准确率满足给定条件，得到训练好的图像分类网络模型和两个选择神经网络，同时得到两个选择神经网络的输出结果，即得到各数据增强方式及各数据增强方式的参数的候选值的选择概率，否则转到步骤6；

步骤6：基于遗传算法和两个选择神经网络输出的选择概率构建新种群，基于新种群转到步骤3再次进行训练。

进一步，所述步骤2中的图像分类网络模型为主流网络模型；

两个选择神经网络为选择神经网络A和选择神经网络B，都为单层神经网络结构，输入为人为设定的固定值，且输入维度要小于输出维度；

选择神经网络A的输出维度为候选的数据增强方式的个数，选择神经网络A的输出为各数据增强方式的选择概率，其中，数据增强方式的个数基于经验进行选择；

选择神经网络B的输出维度为候选的数据增强方式的个数乘以各数据增强方式的参数的候选个数，选择神经网络B的输出为各数据增强方式的参数的每个候选值对应的选择概率；

基于两个选择神经网络生成图像分类网络模型种群，即生成初始种群：初始种群由多个图像分类网络模型组成，而初始种群中每个图像分类网络模型的数据增强方式及其参数的候选值由两个选择神经网络随机选择生成，初始种群中每个图像分类网络模型选择两种数据增强方式，具体为：选择神经网络A的输出为各数据增强方式的选择概率，其中，初始的选择神经网络A的选择概率都为1/M，所有数据增强方式的选择概率相加为1，所以所选择的两种数据增强的选择概率为r_i1＝r_i2＝1/M，i表示初始种群中各图像分类网络模型的编号；随机生成(0，1)之间的浮点数，将选择神经网络A输出的各数据增强方式的选择概率依次相加，相加之和首次大于随机浮点数时，此时最后做加法的选择概率对应的数据增强方式即为选择到的第一种数据增强方式，第二数据增强方式按照同样的方式进行选择，若选择结果和第一种相同，则重新选择，若重复选择10次结果皆与第一种相同，则第二种数据增强方式默认选择下一个选择概率对应的数据增强方式；

选择神经网络B的输出为各数据增强方式的参数的候选值的选择概率，初始都为1/N，选择数据增强方式的参数的候选值的选择概率的方式与选择神经网络A选择数据增强方式的方式相同；

基于图像分类模型选择的两种数据增强方式及参数的候选值得到初始种群中各图像分类网络模型的整体概率，处理后得到归一化后的概率w_i；具体为：随机选择的两种数据增强方式对应选择神经网络A的选择概率分别为r_i1，r_i2，各数据增强方式的参数对应选择神经网络B的选择概率分别为p_i11，p_i21，则图像分类网络模型所选的数据增强方式的整体概率为r_i1×r_i2×p_i11×p_i21，基于上述方式，再基于初始种群中的各图像分类网络模型的两种数据增强方式及参数的候选值的选择概率进行归一化处理，得到各图像分类网络模型对应的归一化后的整体概率w_i，即指权重w_i。

进一步，所述步骤3的具体步骤为：

图像分类网络模型训练过程中，将各图像分类网络模型的输出乘对应的权重w_i加权求和作为新预测值；基于新预测值进行最小化损失函数处理，反向传播可求得两个选择神经网络的权值的梯度，再通过梯度下降更新两个选择神经网络，新预测值的具体公式如下：

其中，h_i(x)是各图像分类网络模型的输出，x表示各图像分类网络模型的输入，H(x)为加权求和后的新预测值，n为初始种群的大小，i表示初始种群中各图像分类网络模型的编号，w_i为各图像分类网络模型归一化后得到的整体概率，1>w_i>0，

进一步，所述步骤4中使用验证集验证训练后的图像分类网络模型，得到图像分类网络模型的准确率的公式如下：

其中，x_j表示图像分类网络模型的输入，y_j表示x_j对应的标签，f(x_j)表示x_j的预测结果，f表示图像分类网络模型，D表示验证集，m表示验证集样本总数，j表示验证集中的样本的序号，acc(f；D)表示图像分类网络模型f在验证集D上的识别准确率，I(a)为指示函数，取值如下:

进一步，所述步骤6的具体步骤为：

将经过步骤3训练后的初始种群中的各图像分类网络模型按照准确率从高到低的顺序进行排序；

排序后，排名后20％的图像分类网络模型从排名前20％的图像分类网络模型中随机选择一个复制其权值，并依据更新后的选择神经网络A的选择概率选择两种不同的数据增强方式，同时依据更新后的选择神经网络B的选择概率选择对应新选择的两种数据增强方式对应的参数的候选值；

20％复制了网络权值并重新选择了数据增强方式及其参数的候选值的图像分类网络模型和前未作变动的80％的图像分类网络模型作为新种群，替换步骤3中的种群，替换后再转到步骤3。

一种基于遗传算法的可选择数据增强系统，包括：

数据采集模块：获取数据集，包括训练集和验证集；

模型搭建模块：搭建一个图像分类网络模型和两个选择神经网络，两个选择神经网络输出各数据增强方式及其参数的候选值的选择概率以供图像分类网络模型训练前进行选择、生成初始种群和得到初始种群归一化后的整体概率，其中，初始种群由多个图像分类网络模型组成，初始种群大小自定义，各数据增强方式包括图像翻转、旋转、平移、错切、亮度调整和对比度调整，数据增强方式的参数包括翻转的翻转概率、旋转的旋转角度、平移的范围大小、错切的角度、亮度的调整幅度和对比度的调整幅度；

模型训练模块：基于训练集并行训练初始种群中各图像分类网络模型，并基于训练过程中各分类网络模型的输出训练两个选择神经网络；

模型验证模块：训练集中的图像全部输入各图像分类网络模型后，使用验证集验证训练后的各图像分类网络模型，得到各图像分类网络模型的准确率；

判断模块：若各图像分类网络模型的准确率满足给定条件，得到训练好的图像分类网络模型和两个选择神经网络，同时得到两个选择神经网络的输出结果，即得到各数据增强方式及各数据增强方式的参数的候选值的选择概率，否则转到更新模块；

更新模块：基于遗传算法和两个选择神经网络输出的选择概率构建新种群，基于新种群转到模型训练模块再次进行训练。

进一步，所述模型搭建模块中的图像分类网络模型为主流网络模型；

进一步，所述模型训练模块的具体实现步骤为：

进一步，所述模型验证模块中使用验证集验证训练后的图像分类网络模型，得到图像分类网络模型的准确率的公式如下：

进一步，所述更新模块的具体实现步骤为：

将经过模型训练模块训练后的初始种群中的各图像分类网络模型按照准确率从高到低的顺序进行排序；

20％复制了网络权值并重新选择了数据增强方式及其参数的候选值的图像分类网络模型和前未作变动的80％的图像分类网络模型作为新种群，替换模型训练模块中的种群，替换后再转到模型训练模块。

本发明同现有技术相比，其有益效果表现在：

一、本发明为选择合适的数据增强方式及参数的候选值构建了选择神经网络A和B，并基于遗传算法，分别为数据增强方式及其参数的候选值生成选择概率，在图像分类网络模型的训练过程中同时训练选择神经网络A和B，这样可以在训练中动态优化数据增强方式及参数，用户可基于选择神经网络A和B最终的训练结果选择合适的数据增强方式及参数的候选值，并且可以应用到此数据集的其他训练任务中，以提高训练结果。

二、本发明中的种群中的各图像分类网络模型可并行训练，因此整体训练过程不会花费更多额外时间，且能够交互相互之间的结果，种群中图像分类网络模型每进行一轮训练对比相互之间的性能表现，表现较差的图像分类网络模型可共享表现优秀的图像分类网络模型的权值参数，保留表现优秀的图像分类网络模型，并将各图像分类网络模型的输出通过加权求和的方式进一步优化选择神经网络，相对基于经验或者随机搜索等方法，能够更快的搜索到更加优秀的数据增强方法。

附图说明

图1为本发明算法流程图；

图2为步骤3前向传播示意图；

具体实施方式

下面将结合附图及具体实施方式对本发明作进一步的描述。

本发明实施提出了一种基于遗传算法的可选择数据增强方法，能够为特定数据集生成其合适的数据增强方式和数据增强参数，从而提高模型的泛化能力。

本发明主要流程包括：1)获取数据集；2)搭建一个图像分类网络模型和两个选择神经网络并生成初始种群；3)基于训练集并行训练初始种群中的各图像分类网络模型并更新两个选择神经网络；4)通过验证集得到各图像分类网络模型的准确率；5)若准确率满足条件，运行结束，输出两个选择神经网络的结果(输出结果为数据增强方式及参数的候选值的选择概率，用户可基于此结果选择数据增强方法用于此数据集其他训练任务，可提高其训练结果)，否则转到步骤6；6)基于遗传算法和两个选择神经网络输出的选择概率构建新种群，将新种群替换步骤3中的种群，替换后再转到步骤3；具体实现步骤如下：

一、获取数据集

网络上有多种公开的数据集，用户也可以使用自己的数据集。本发明采用公开的Cifar-10数据集作为示范，它包含60000张32X32的RGB彩色图片，总共10个分类。其中训练集有50000张，测试集有10000张。将原训练集按照9：1的比例划分为新的训练集和验证集，训练集用于神经网络模型的训练，验证集用于验证图像分类网络模型在某个训练阶段的准确率，测试集可用于测试模型的最终实验效果。

二、搭建一个图像分类网络模型和两个选择神经网络，并生成初始种群

准备一个图像分类网络模型，以及2个选择神经网络(A,B)。图像分类网络模型可采用多种主流模型。选择神经网络结构为单层神经网络，选择神经网络的输入可为人为设定固定值，且输入维度要小于输出维度。选择神经网络A的输出维度为候选的数据增强方式个数，如图像旋转、色彩变幻、裁剪等，网络输出经softmax函数生成对应数据增强方式的选择概率。选择神经网络B的输出维度为候选数据增强方式个数乘以各数据增强方式的参数的候选个数，本发明为每个数据增强方式的参数取5个候选值，如图像旋转的角度的候选值[30°，60°，90°，120°，150°]，即选择神经网络B输出维度为候选的数据增强方式个数乘以5。选择神经网络B的每5个输出进行一次softmax，以此对应每个数据增强方式的5个参数的选择概率。选择神经网络A和B的权值初始化为1，以保证输出的各初始选择概率相等。

搭建一个图像分类网络模型和两个选择神经网络(A，B)，图像分类网络模型可采用主流网络模型，如ResNet-18，选择神经网络采用单层神经网络结构，选择神经网络的输入可为人为设定固定值，且输入维度要小于输出维度。图像分类网络模型用于针对数据集进行训练以产生正确分类结果，选择神经网络输出各数据增强方式及其参数的候选值的选择概率以供分类网络模型训练前进行选择。

选择神经网络A的输出维度为候选数据增强方式个数，数据增强可选择常用的增强方式，如图像翻转、旋转、平移、错切、亮度调整和对比度调整等，用户可基于经验进行选择。选择神经网络A的输出经softmax函数生成对应数据增强方式的选择概率。

选择神经网络B的输出维度为候选数据增强方式个数乘以各数据增强方式的参数的候选个数，如翻转的参数可为翻转概率，取候选值为[0，0.25，0.5，0.75，1.0]，旋转的参数为旋转角度，取候选值为[30°，60°，90°，120°，150°]。选择神经网络B的每5个输出进行一次softmax，以此对应每个数据增强方式的参数的5个候选值的选择概率。

选择神经网络A和选择神经网络B的权值初始化都为1，若有10种数据增强方式，则选择神经网络A输出维度为10，输出的初始的选择概率为[r₀,r₁,…,r₉]，均为1/10，若每种数据增强方式有5个候选值，则选择神经网络B输出维度为10ⅹ5＝50，输出的每种数据增强方式的参数的候选值的初始选择概率为[p₀₀,p₀₁,p₀₂,p₀₃,p₀₄,p₁₀,p₁₁,…,p₉₀,p₉₁,p₉₂,p₉₃,p₉₄]，均为1/5，序号0数据增强方式的选择概率对应为r₀，其参数的候选值的选择概率对应为[p₀₀,p₀₁,p₀₂,p₀₃,p₀₄]。选择神经网络A和选择神经网络B更新后，输出的选择概率也会更新。

生成图像分类网络模型种群，即初始种群，初始种群中每个图像分类网络模型选择两种数据增强方式，数据增强方式及参数按照选择神经网络的选择概率随机选择生成，假设分类模型model_i所选的两种数据增强方式对应选择神经网络A的选择概率分别为r_i1，r_i2，若为初始种群，则r_i1＝r_i2＝1/10，而其数据增强方式的参数对应选择神经网络B的选择概率分别为p_i11，p_i21，若为初始种群，则p_i11＝p_i21＝1/5，则在下一步求归一化的整体概率过程中令model_i所选的数据增强整体概率为r_i1×r_i2×p_i11×p_i21，再对整个初始种群中各图像分类网络模型的此整体概率进行归一化处理，得归一化后的值为w_i。

初始种群中每个图像分类网络模型选择两种数据增强方式，具体为：选择神经网络A的输出为各数据增强方式的选择概率，其中，初始的选择神经网络A的选择概率都为1/M，所有数据增强方式的选择概率相加为1，所以所选择的两种数据增强的选择概率为r_i1＝r_i2＝1/M，i表示初始种群中各图像分类网络模型的编号；随机生成(0，1)之间的浮点数，将选择神经网络A输出的各数据增强方式的选择概率依次相加，相加之和首次大于随机浮点数时，此时最后做加法的选择概率对应的数据增强方式即为选择到的第一种数据增强方式，第二数据增强方式按照同样的方式进行选择(即重新随机生成(0，1)之间的浮点数，将选择神经网络A输出的各数据增强方式的选择概率依次相加，相加之和首次大于随机浮点数时，此时最后做加法的选择概率对应的数据增强方式即为选择到的第二种数据增强方式)，若选择结果和第一种相同，则重新选择，若重复选择10次结果皆与第一种相同，则第二种数据增强方式默认选择下一个选择概率对应的数据增强方式；

三、基于训练集并行训练初始种群中的各图像分类网络模型并更新两个选择神经网络

图像分类网络模型训练过程中，将各图像分类网络模型的输出乘对应的权重w_i加权求和作为新预测值；基于新预测值进行最小化损失函数处理，反向传播可求得两个选择神经网络的权值的梯度，再通过梯度下降更新两个选择神经网络。新预测值的具体公式如下：

其中，h_i(x)是各图像分类网络模型的输出，H(x)为加权求和后的新预测值，n为初始种群的大小，i表示初始种群中各图像分类网络模型的编号，w_i为各图像分类网络模型归一化后得到的整体概率，1>w_i>0，

四、通过验证集得到各图像分类网络模型的准确率

训练集中的图片完全输入神经网络，即训练一个epoch周期后，此时使用验证集作为神经网络输入，计算各个网络模型的图像识别准确率，公式如下：

五、判断各图像分类网络模型的准确率是否满足条件

根据准确率的设定值，判断初始种群中所有图像分类网络模型的准确率是否达到设定值，若所有模型均已满足条件，则可以输出选择神经网络的结果，可以得到各数据增强方式及其参数的选择概率。若不满足条件，则转到步骤六。

六、构建新种群，重复训练过程

按照步骤4得到的准确率，经过步骤三训练后的初始种群中的各图像分类网络模型按照准确率从高到低的顺序进行排序，排名后，排名后20％的分类模型从排名前20％的图像分类网络模型中选择一个并复制其网络模型权值，并依照更新后的选择神经网络A的新选择概率[r₀,r₁,…,r₉]选择两种不同的数据增强方式(两种数据增强方式不重复)，再依照更新后的选择神经网络B的新选择概率[p₀₀,p₀₁,p₀₂,p₀₃,p₀₄,p₁₀,p₁₁,…,p₉₀,p₉₁,p₉₂,p₉₃,p₉₄]，从中选择这两种数据增强方式对应的参数。将这些复制了网络权值并重新选择了数据增强方式及其参数20％图像分类网络模型和未作变动的80％图像分类网络模型作为新种群，替换步骤三中的种群，替换后再转到步骤三进行训练。

以上仅是本发明众多具体应用范围中的代表性实施例，对本发明的保护范围不构成任何限制。凡采用变换或是等效替换而形成的技术方案，均落在本发明权利保护范围之内。