CN112561881B

CN112561881B - 基于评价模型的红外图像自适应数据增强方法

Info

Publication number: CN112561881B
Application number: CN202011489331.8A
Authority: CN
Inventors: 张典; 白俊奇; 徐勇; 鉴福升; 刘羽; 石林; 朱伟; 郝晶晶
Original assignee: Nanjing Laisi Electronic Equipment Co ltd
Current assignee: Nanjing Laisi Electronic Equipment Co ltd
Priority date: 2020-12-16
Filing date: 2020-12-16
Publication date: 2023-09-05
Anticipated expiration: 2040-12-16
Also published as: CN112561881A

Abstract

本发明公开了一种基于评价模型的红外图像自适应数据增强方法，方法包括：建立和训练目标检测模型，并根据模型准确度计算得到基准评价值；建立数据增强评价模型；依次对红外图像样本进行前景背景分离、根据调整变量值后的样本增强方法处理前景图像、背景与前景叠加、将叠加图像填入阵列得到红外图像增强样本；将红外图像增强样本输入目标检测模型，并计算新评价值；以样本增强方法的变量和新评价值作为输入数据增强评价模型进行训练；判断输出是否满预设条件，满足结束迭代，不满足继续迭代；将待增强红外图像按最优值对应方法进行处理，得到增强后图像。采用本发明增强后的图像进行目标检测，可以防止训练过拟合。

Description

基于评价模型的红外图像自适应数据增强方法

技术领域

本发明涉及图像处理技术，尤其涉及一种基于评价模型的红外图像自适应数据增强方法。

背景技术

在实际模型训练时，经常会遇到数据不足的情况，当遇到一个任务时，目前的数据只有几百，而现有最先进的神经网络都是使用成千上万的数据集，这些网络通常需要大量数据才能避免过度拟合，成功的模型数以百万计的参数除了对模型的优化措施外，更加关注模型相关的数据，模型参数数量与数据集数量是呈正比的，现实存在无法有效获得大量符合要去的数据集，数据增强是防止神经网络模型训练过拟合的重要手段，对于小样本数据在深度学习中训练难的问题。

发明内容

发明目的：本发明为解决图像数据量小、种类单一、使得神经网络模型训练易过拟合的问题，提出一种基于评价模型的红外图像自适应数据增强方法，该方法计算复杂度低且易于工程上实现。

技术方案：本发明所述的基于评价模型的红外图像自适应数据增强方法包括：

(1)将若干已知检测目标的红外图像样本划分为训练集和测试集，采用训练集训练yolov4网络，并将训练好的yolov4网络作为目标检测模型，再使用测试集测试目标检测模型，根据模型的准确度计算得到评价值，作为基准评价值；

(2)建立以样本增强方法的变量为输入、以数据增强评价值为输出的BP神经网络作为数据增强评价模型；

(3)获取一个红外图像样本，并采用分水岭算法从红外图像样本中提取前景图像和背景图像；

(4)基于上次样本增强方法的变量值采用控制变量法调整变量值，并根据调整变量值后的样本增强方法处理前景图像，得到增强后的前景图像，其中，样本增强方法的变量的初始值为0向量；

(5)计算背景图像与步骤(4)得到的前景图像的分辨率差异，根据分辨率差异以预设比例进行随机叠加，生成叠加图像；

(6)随机生成多尺度随机阵列，将叠加图像随机填入阵列中进行拼接，得到红外图像增强样本；

(7)将红外图像增强样本输入目标检测模型，并根据目标检测模的输出的准确度计算得到一个新的评价值；

(8)以步骤(4)调整后的样本增强方法的变量和步骤(7)得到的新的评价值作为一个训练样本，输入数据增强评价模型进行训练，通过BP反向传播方法调整数据增强评价模型参数；

(9)判断调整后数据增强评价模型的损失L＝||y_eva-y||²是否小于预设阈值，y_eva为数据增强评价模型实际输出的评价值，y表示基准评价值，如果小于则停止迭代，将此时样本增强方法的变量作为最终样本增强方法变量最优值，并执行步骤(10)，如果不小于则返回执行步骤(3)～(8)；

(10)将待增强红外图像按照样本增强方法变量最优值对应的增强方法进行处理，得到数据增强后的图像。

进一步的，步骤(1)具体包括：

(1-1)获取若干已知检测目标的红外图像样本，划分为训练集和测试集；

(1-2)采用训练集训练yolov4网络，将训练好的yolov4网络作为目标检测模型；

(1-3)使用测试集测试目标检测模型，根据测试的准确度按照下式计算得到基准评价值：

式中，PJ为基准评价值，Q_R为模型的准确度与召回率曲线的面积，AP()表示求平均值，q表示每个准确度值乘以召回率变化情况的积分。

进一步的，步骤(2)具体包括：

建立以样本增强方法的变量为输入的BP神经网络y_eva＝w·x+b，作为数据增强评价模型，BP神经网络中以relu6做为激活函数，y_eva为数据增强评价模型的评价值，w、b为模型参数，w为多层感知机权重，b为偏移量，x为样本增强方法的变量所形成的向量，具体为红外图像加噪、空间变换、信息檫除和变换四种样本增强方法的变量所形成的向量。

进一步的，步骤(3)具体包括：

(3-1)获取一个红外图像样本，通过开运算对待增强红外图像进行去噪；

(3-2)对去噪后的图像进行腐蚀操作；

(3-3)使用距离变换函数对腐蚀操作后的图像进行变换；

(3-4)使用分水岭算法对距离变换后的图像进行分割，并将分割过细的区域进行合并，从而提取出前景图像和背景图像；其中，合并时每个因分水岭算法产生的集水盆C的合并规则为：

式中，B为集水盆C的边界点集合，T为阈值。

进一步的，步骤(4)具体包括：

(4-1)设置样本增强方法的变量所形成的向量为x＝{(a_i，b_i,λ,μ,σ),(r,d,δx,δy),(α,θ),(γ)}，其中，(a_i，b_i,λ,μ,σ)为样本增强方法中加噪的变量、(r,d,δx,δy)为空间变换的变量、(α,θ)是信息檫除的变量，(γ)是变换的变量；基于控制变量法逐一调整样本增强方法的变量值，其中，所有变量的初始值为0，每次调整样本增强方法变量时，通过设定随机标签的方式冻结其他变量确保只修改单一变量，并在该变量的值域范围内随机生成变量值；

(4-2)根据调整变量值后的样本增强方法处理前景图像，得到增强后的前景图像，其中，根据调整变量值后的样本增强方法处理前景图像具体包括：

(4-2-1)加噪：采用n_i＝a_i×I_i+b_i生成非均匀性噪声，其中，n_i表示针对前景图像的第i个像素I_i生成的非均匀噪声，a_i表示像素增益因子，b_i表示偏移因子；以泊松参数λ生成泊松噪声；以μ为噪声期望以σ为噪声均方差生成高斯白噪声；采用以上三种噪声中任意一种添加到前景图像中，生成带有噪声的前景图像；

(4-2-2)空间变换：生成一个和带有噪声的前景图像相同分辨率的遮盖mask，并将该遮盖mask对带有噪声的前景图像进行信息檫除，得到信息檫除后的前景图像，其中，檫除时使用参数(r,d,δx,δy)确定遮盖mask的分布，r是相邻两块擦除区域单元的距离，d是一个擦除区域单元的长度，通过d＝random(dmin,dmax)获取，dmin、dmax为通过图像分辨率确定的长度最大值和最小值，δx和δy是第一个完整的擦除区域单元与图像边界之间的起始距离，且δx,δy＝random(0,d-1)；

(4-2-3)信息檫除：对于信息檫除后的前景图像进行空间变换，具体为依次进行裁剪、翻转和旋转，具体方式为：

裁剪：C(D)为裁剪后的图像，D为信息檫除后的前景图像，G为背景图像，D.x、D.y分别表示D的宽和高，G.x、G.y分别表示G的宽和高；

翻转：以翻转角度ɑ对图像进行翻转；

旋转：将图像分块后乘以旋转矩阵进行图像旋转，θ表示旋转角度；

(4-2-4)变换：对于空间变换后的前景图像进行自适应计算，自适应计算通过使用Gamma变换公式实现，式中，A表示常数，V_in表示空间转换后的前景图像，γ表示Gamma指数；

对于自适应计算后的前景图像按照下式进行Laplace变换：

式中，F(S)表示Laplace变换后的前景图像，即增强后的前景图像。

进一步的，步骤(5)具体包括：

(5-1)计算背景图像与步骤(4)得到的前景图像的分辨率差异，所述分辨率差异为背景图像分辨率和前景图像分辨率的比值；

(5-2)当分辨率差异大于0.7时或小于0.3时，调整分辨率差异为预设比例，如果位于(0.3-0.7)范围内，则直接将步骤(4)得到的前景图像和背景图像以预设比例进行随机叠加，得到叠加图像；叠加时对于擦除部分使用背景图像覆盖，并使用交并比限制图像叠加位置，式中，Z表示背景图像中的前景图像所在区域，E表示前景图像，在IOU值大于0.1时，此区域禁止叠加，所述预设比例为(0.3-0.7)中随机数。

进一步的，步骤(6)具体包括：

(6-1)随机生成尺度分别为2、4、6的随机阵列；

(6-2)将叠加图像分别划分为2、4、6份，并填入对应的随机阵列中，并按照下列(c1,u,c2,v)拼接参数进行拼接，得到红外图像增强样本：

式中，c1为非零时表示进行竖直拼接，为零时表示不进行竖直拼接，u表示竖直拼接比例，c2为非零时表示进行横向拼接，为零时表示不进行竖直拼接，v表达横向拼接比例，r1、r2分别表示(0.3-0.7)中的一个随机数。

有益效果：本发明与现有技术相比，其显著优点是：本发明通过原始样本训练目标检测网络模型，得到标准评价值；创新地建立以红外图像噪声、空间变换、信息丢弃等样本增强方法的变量为输入参数的BP神经网络作为数据增强评价模型，提高了数据增强的质量；创新地利用分水岭算法提取红外图像的前景和背景信息，提高了提取前景数据的效率；创新地基于控制变量法调整样本增强方法系列变量，得到处理后的前景图像，减少未知量对误差的影响；创新地根据前景图像与背景图像的分辨率差异，以特定比例进行随机叠加，计算前景目标与背景图像叠加目标的交并比选择叠加区域，生成叠加图像，提高了目标特征描述的鲁棒性；创新地将叠加图像嵌入到随机阵列中进行拼接，得到增强样本集，增加了训练过程一批样本的数量，同时使网络模型对小目标有良好的敏感度；创新地利用增强样本集训练的网络模型进行验证，根据输出评价值与基准评价值的差异，更新基准评价值，并调整评价模型参数；经过多次迭代，得到数据增强的最终结果。本发明在使用通用的检测神经网络进行训练测试，在使用了本发明使用的增强方法后，充分验证了本发明的有效性。

附图说明

图1是本发明提供的基于评价模型的红外图像自适应数据增强方法的流程示意示意图；

图2是本发明的效果图。

具体实施方式

本发明提供了一种基于评价模型的红外图像自适应数据增强方法，如图1所示，包括如下步骤：

(1)将若干已知检测目标的红外图像样本划分为训练集和测试集，采用训练集训练yolov4网络，并将训练好的yolov4网络作为目标检测模型，再使用测试集测试目标检测模型，根据模型的准确度计算得到评价值，作为基准评价值。

该步骤具体包括：

(2)建立以样本增强方法的变量为输入、以数据增强评价值为输出的BP神经网络作为数据增强评价模型。

其中，BP神经网络为y_eva＝w·x+b，作为数据增强评价模型，BP神经网络中以relu6做为激活函数，y_eva为数据增强评价模型的评价值，w、b为模型参数，w为多层感知机权重，b为偏移量，x为样本增强方法的变量所形成的向量，具体为红外图像加噪、空间变换、信息檫除和变换四种样本增强方法的变量所形成的向量。

(3)获取一个红外图像样本，并采用分水岭算法从红外图像样本中提取前景图像和背景图像。

该步骤具体包括：

(3-2)对去噪后的图像进行腐蚀操作；

(3-3)使用距离变换函数对腐蚀操作后的图像进行变换；

(3-4)使用分水岭算法对距离变换后的图像进行分割，并将分割过细的区域进行合并，以避免图像分割过细，减少无效区域。从而提取出前景图像和背景图像；其中，合并时每个因分水岭算法产生的集水盆C的合并规则为：

式中，B为集水盆C的边界点集合，T为阈值。

(4)基于上次样本增强方法的变量值采用控制变量法调整变量值，并根据调整变量值后的样本增强方法处理前景图像，得到增强后的前景图像，其中，样本增强方法的变量的初始值为0向量。

该步骤具体包括：

翻转：以翻转角度ɑ对图像进行翻转；

(4-2-4)变换：对于空间变换后的前景图像进行自适应计算，自适应计算通过使用Gamma变换公式实现，式中，A表示常数，V_in表示空间转换后的前景图像，γ表示Gamma指数；将灰度过高或者灰度过低的图片进行修正，增强对比度。变换公式就是对图像上每一个像素值做乘积运算，γ>1时，对图像的灰度分布直方图具有拉伸作用(使灰度向高灰度值延展)，而γ<1，对图像的灰度分布直方图具有收缩作用(是使灰度向低灰度值方向靠拢)；

对于自适应计算后的前景图像按照下式进行Laplace变换，产生描述灰度突变的图像：

(5)计算背景图像与步骤(4)得到的前景图像的分辨率差异，根据分辨率差异以预设比例进行随机叠加，生成叠加图像。

步骤(5)具体包括：

(6)随机生成多尺度随机阵列，将叠加图像随机填入阵列中进行拼接，得到红外图像增强样本。

该步骤具体包括：

(6-1)随机生成尺度分别为2、4、6的随机阵列；

(7)将红外图像增强样本输入目标检测模型，并根据目标检测模的输出的准确度计算得到一个新的评价值。

(8)以步骤(4)调整后的样本增强方法的变量和步骤(7)得到的新的评价值作为一个训练样本，输入数据增强评价模型进行训练，通过BP反向传播方法调整数据增强评价模型参数。

(9)判断调整后数据增强评价模型的损失L＝||y_eva-y||²是否小于预设阈值，y_eva为数据增强评价模型实际输出的评价值，y表示基准评价值，如果小于则停止迭代，将此时样本增强方法的变量作为最终样本增强方法变量最优值，并执行步骤(10)，如果不小于则返回执行步骤(3)～(8)。

采用本实施例进行数据增强，效果如图2所示，可以看出，图像得到了增强。

以上所揭露的仅为本发明一种较佳实施例而已，不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种基于评价模型的红外图像自适应数据增强方法，其特征在于包括：

2.根据权利要求1所述的基于评价模型的红外图像自适应数据增强方法，其特征在于：步骤(1)具体包括：

3.根据权利要求1所述的基于评价模型的红外图像自适应数据增强方法，其特征在于：步骤(2)具体包括：

4.根据权利要求1所述的基于评价模型的红外图像自适应数据增强方法，其特征在于：步骤(3)具体包括：

(3-2)对去噪后的图像进行腐蚀操作；

(3-3)使用距离变换函数对腐蚀操作后的图像进行变换；

式中，B为集水盆C的边界点集合，T为阈值。

5.根据权利要求3所述的基于评价模型的红外图像自适应数据增强方法，其特征在于：步骤(4)具体包括：

翻转：以翻转角度ɑ对图像进行翻转；

对于自适应计算后的前景图像按照下式进行Laplace变换：

6.根据权利要求1所述的基于评价模型的红外图像自适应数据增强方法，其特征在于：步骤(5)具体包括：

7.根据权利要求1所述的基于评价模型的红外图像自适应数据增强方法，其特征在于：步骤(6)具体包括：

(6-1)随机生成尺度分别为2、4、6的随机阵列；