CN109214470B

CN109214470B - 一种基于编码网络微调的图像能见度检测方法

Info

Publication number: CN109214470B
Application number: CN201811249423.1A
Authority: CN
Inventors: 李骞; 唐绍恩; 马强
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2018-10-25
Filing date: 2018-10-25
Publication date: 2020-11-03
Anticipated expiration: 2038-10-25
Also published as: CN109214470A

Abstract

本发明公开了一种基于编码网络微调的图像能见度检测方法，包括：训练能见度检测模型：对训练集图像划分区域，并通过修改后的网络编码，提取各子区域图像特征向量，利用各子区域图像特征向量和能见度标注值训练支持向量回归机，并估计子区域能见度值，通过微调后的网络对各子区域图像重新编码，利用新的各子区域图像特征向量和能见度标注值重新训练支持向量回归机，得到新的能见度与特征向量的回归模型。测试能见度检测模型：对测试图像划分区域，利用微调后的深度神经网络进行编码，提取各子区域图像特征向量，利用子区域图像特征和重新训练的回归模型计算子区域能见度估计值，按权重融合各子区域能见度估计值，得到整幅图像能见度检测值。

Description

一种基于编码网络微调的图像能见度检测方法

技术领域

本发明属于大气探测中地面气象观测技术领域，尤其涉及一种基于编码网络微调的图像能见度检测方法。

背景技术

能见度是指在当时天气下，正常人能从背景中识别出目标物的最大距离，是反映大气透明程度的一个重要指标。目前能见度测量方法主要包括目测法、器测法和基于图像视频的测量方法等。目测法观测值受观测人员主观经验、视力情况和目标物选取影响较大。器测法主要利用透射式能见度仪或散射式能见度仪进行测量，然而检测仪器均以采样空间数据代表大气全程范围的能见度，检测精度易受采样空间的大气质量影响，且普遍比较昂贵，难以满足能见度检测的实际应用需求。

基于图像视频的能见度检测方法主要分为模型驱动和数据驱动两类。模型驱动法结合能见度定义，通过分析光传播过程中大气衰减对图像成像的影响，建立光在大气中传播的物理模型，估计模型中参数，以此反推能见度。模型驱动法的估计精度与物理模型定义、参数设置紧密相关，然而大气中影响光传播的悬浮粒子种类较多，且粒子分布不均匀，因此光传播物理模型通常难以准确定义。数据驱动法主要根据低能见度天气对图像造成的模糊和退化效果，从图像或视频中提取有效的视觉特征，并通过累积的历史数据训练特征与能见度的关系模型，以计算能见度。现有数据驱动法提取一种或多种明确的图像特征进行能见度估计，然而明确的图像特征不能完全表征图像所有的潜在信息，导致图像信息利用不充分，无法进一步提高检测精度。

发明内容

发明目的：本发明所要解决的技术问题是针对现有基于图像的能见度检测方法对图像信息利用不充分，鲁棒性差，提出了一种基于编码网络微调的能见度检测模型，实现利用摄像机对能见度的检测，包括以下步骤：

步骤1，训练能见度检测模型：输入训练集图像，对训练集中每幅图像进行子区域图像划分；利用全局池化层替换预训练网络DIQaM-NR(无参考图像质量评估领域的深度神经网络)末端的池化层，利用替换修改后的网络对各子区域图像编码，提取各子区域图像对应的N(此处取值为512)维特征向量；利用各子区域图像特征向量和能见度标注值训练支持向量回归机，并估计子区域能见度值；根据支持向量误差分析计算各子区域融合权重，并按权重融合子区域能见度估计值，得到整幅图像能见度估计值；结合估计结果对深度神经网络进行微调；通过微调后的网络对各子区域图像重新编码，利用新的各子区域图像特征向量和能见度标注值重新训练支持向量回归机，得到新的能见度与特征向量的回归模型；

步骤2，测试能见度检测模型：输入测试图像，对测试图像进行子区域图像划分；利用微调后的深度神经网络进行编码，提取各子区域图像对应的N维特征向量；将各子区域图像特征向量代入步骤1最后训练的新回归模型，得到各子区域能见度估计值；计算各子区域融合权重，按权重融合各子区域能见度估计值，输出整幅图像能见度检测值。

步骤1包括以下步骤：

步骤1-1，输入训练集图像，对训练集中每幅图像进行子区域图像划分：将训练集中每幅图像划分为RegionNum个子区域，每个子区域分辨率为224×224，

其中，ImageWidth表示训练集图像的宽度，ImageHeight表示训练集图像的高度，

表示向上取整；子区域Region_(i,j)的左上角像素横坐标

和纵坐标

分别为：

i、j分别表示子区域Region_(i,j)在图像子区域集合中的行数和列数，

表示向下取整；子区域Region_(i,j)的右上角像素横坐标

和纵坐标

分别为

子区域Region_(i,j)的左下角像素横坐标

和纵坐标

分别为

子区域Region_(i,j)的右下角像素横坐标

和纵坐标

分别为

步骤1-2，深度神经网络编码：利用全局池化层替换DIQaM-NR网络最后的最大池化层，将替换后的网络称为FE-V网络，其中全局池化层将采样区域视为整幅特征图，采样方式为取均值，依次将训练集各子区域图像输入FE-V网络，提取全局池化层输出的N维特征向量，得到训练集图像子区域特征向量集合

其中，

表示第i幅图像的第j个子区域特征向量，RegionNum表示划分的子区域数量，ImageNum表示训练集图像数量，i取值范围为1～ImageNum，j取值范围为1～RegionNum；

步骤1-3，训练支持向量回归机：利用子区域图像特征向量和对应能见度标注值训练支持向量回归机，并将各子区域图像特征向量输入训练后的支持向量回归机，得到各子区域能见度估计值；

步骤1-4，权重融合：根据支持向量误差分析计算各子区域融合权重，并按权重融合子区域能见度估计值，得到整幅图像能见度估计值；

步骤1-5，深度神经网络微调：根据训练集图像对应的能见度估计值对深度神经网络的高层卷积模块进行微调，利用微调后的网络对各子区域图像重新编码；

步骤1-6，重新训练支持向量回归机：利用新的各子区域图像特征向量和能见度标注值重新训练支持向量回归机，得到新的能见度与特征向量的回归模型。

步骤1-3包括以下步骤：

步骤1-3-1：构建样本集：将一幅子区域图像经步骤1-2提取的特征向量

作为样本特征

对应区域的能见度标注值y_i作为样本目标值，构成一组样本

设定训练集样本图像数量为ImageNum，则子区域图像数量为ImageNum×RegionNum，即共有ImageNum×RegionNum组训练样本，将训练样本集记为

表示训练样本集中第i组训练样本；n为训练样本数量，数值上等于子区域图像总数，即n＝ImageNum×RegionNum；

步骤1-3-2：建立回归模型：利用样本集数据训练支持向量回归机，得到能见度回归模型，即能见度检测模型；

步骤1-3-3：参数寻优：通过网络搜索和交叉验证，寻找回归模型的最佳参数，得到回归模型

步骤1-3-4：训练集图像子区域能见度值估计：将训练集图像子区域特征向量集合FT中元素依次输入回归模型

得到训练集图像子区域能见度估计值集合

其中，

表示第i幅图像的第j个子区域能见度估计值。

步骤1-3-2包括以下步骤：

步骤1-3-2-1：建立如下优化目标和约束条件：

其中，s.t.表示约束条件，ω为超平面权重系数列向量，ω^T表示其转置，ε为回归函数误差限值，C为惩罚因子，ξ_i和

分别为松弛变量上界和松弛变量下界，

是将训练样本映射到高维线性空间的非线性函数，b是超平面的常系数；

步骤1-3-2-2，对偶变换求解：引入Lagrange函数，对步骤1-3-2-1建立的优化目标和约束条件作对偶变换求解，变换后等价形式为：

其中，α_i和

为Lagrange乘子，

为核函数，γ为核函数参数，j取值范围为1～n；

步骤1-3-2-3：确定含参非线性方程：求解步骤1-3-2-2的等价形式，得到Lagrange乘子最优解向量为

其中α_i和

表示第i组训练样本对应的一组对偶Lagrange乘子，则有：

其中，SV表示支持向量，即满足|y_i-f(x_i)|＝ε的

N_SV为支持向量的数量，

表示待测图像的子区域特征向量，故非线性方程f(x)为：

步骤1-3-3包括以下步骤：

步骤1-3-3-1：网络搜索：设定参数ε的取值区间为[ε_min,ε_max]、C的取值区间为[C_min,C_max]、核函数参数γ的取值区间为[γ_min,γ_max]，设定参数ε的步长为εstep、C的步长为Cstep、核函数参数γ的步长为γstep，顺序算出对应各参数的组合(ε_min+u_ε×εstep,C_min+u_C×Cstep,γ_min+u_γ×γstep)，其中u_ε、u_C和u_γ为正整数，且ε_min+u_ε×εstep≤ε_max,C_min+u_C×Cstep≤C_max,γ_min+u_γ×γstep≤γ_max，对每一种组合进行交叉验证，逐一比较各种组合的均方误差并择优，从而确定该区间内最优参数组合[ε^*,C^*,γ^*]，ε^*为参数ε的最优选择，C^*为参数C的最优选择，γ^*为核函数参数γ的最优选择；

步骤1-3-3-2：确定最终回归模型：将步骤1-3-3-1得到的最优参数组合[ε^*,C^*,γ^*]代入步骤1-3-2-3，确定最终回归模型

即得到了能见度检测模型。

步骤1-3-3-1中所述对每一种组合进行交叉验证，具体包括：

对于一组给定的参数组合：

[ε_min+u_ε×εstep,C_min+u_C×Cstep,γ_min+u_γ×γstep]，

其中u_ε、u_C和u_γ为正整数，将训练样本集S进行随机等分为v份，将其中的v-1份作为训练样本，余下的1份作为测试图像，共得到v组交叉验证所用的训练样本及相应的测试图像，将训练样本作为支持向量回归机的输入，建立回归模型，并用对应的测试图像校验拟合效果，依次轮换进行，得到v个表征拟合效果的均方误差MSE，选取最小的均方误差作为本参数组合的均方误差MSE_i，MSE表达式如下所示：

其中，t是每组测试图像的样本个数，

y_i ^*是模型输出能见度值。

步骤1-4包括以下步骤：

步骤1-4-1，预测方差计算：将训练集中第i幅图像的第j个子区域的预测分布方差和预测拟合方差之和作为对应的预测方差

表达式如下所示：

其中，

表示第i幅图像的第j个子区域的预测分布方差，

表示该区域的预测拟合方差；

步骤1-4-2，融合权重表示：将训练集中第i幅图像的第j个子区域的融合权重

表示为归一化的预测方差倒数，即：

其中，

表示训练集中第i幅图像的第j个子区域的预测方差，RegionNum表示划分的子区域数量，p为子区域序号，取值为[1,2,…,RegionNum]；

步骤1-4-3，子区域能见度估计值融合：将训练集中第i幅图像的各子区域能见度估计值按对应权重融合，得到整幅图像能见度估计值，融合公式如下：

其中，

表示第i幅图像的第j个子区域的能见度估计值，

为该子区域融合权重，RegionNum表示划分的子区域数量；

步骤1-4-4：训练集图像能见度估计：依次按权重融合训练集中每幅图像的子区域能见度估计值，得到训练集图像的能见度估计值集合VF＝[vf₁,…,vf_ImageNum]。

步骤1-4-1包括以下步骤：

步骤1-4-1-1：预测分布方差计算：第i幅图像的第j个子区域的预测分布方差

由数据联合分布的不确定性产生，通过训练集数据和待测数据的协方差矩阵计算得到，计算公式如下：

其中，

表示训练集所有图像的第j个子区域特征向量与其能见度标注值构成的集合，

表示第i幅图像的第j个子区域的特征向量与能见度估计值构成的样本点，K_(l,l)为l点的自协方差，K_(Z,l)为集合Z与l点的协方差矩阵，

为K_(Z,l)的转置，

为集合Z的协方差矩阵逆矩阵；

步骤1-4-1-2：预测拟合方差计算：第i幅图像的第j个子区域的预测拟合方差

是由训练集数据中固有噪声导致的拟合误差，可由训练该子区域支持向量回归机得到的惩罚因子C^j和误差限值ε^j计算，即：

其中，惩罚因子C^j和误差限值ε^j可由步骤1-3得到。

步骤1-5包括以下步骤：

步骤1-5-1，深度神经网络微调：将DIQaM-NR网络的参数值作为所有子区域FE-V网络参数的初始值，冻结底层卷积模块和池化层参数，继承DIQaM-NR网络的底层特征提取能力，采用反向传播和梯度下降算法对网络高层卷积模块进行训练，按照预设的学习率和迭代次数从后向前更新各子区域对应FE-V网络的高层卷积模块参数，得到各子区域对应微调后的FE-V网络；

步骤1-5-2，利用微调后的FE-V网络重新编码：依次将训练集各子区域图像输入对应微调后的FE-V网络，提取全局池化层输出的N维特征向量，得到新的子区域特征向量集合

其中，

表示第i幅图像的第j个子区域的新特征向量。

步骤2包括以下步骤：

步骤2-1，测试图像区域划分：将测试图像按照步骤1-1所述方式进行子区域划分；

步骤2-2，深度神经网络编码：依次将各子区域图像输入对应微调后的FE-V网络，提取全局池化层输出的N维特征向量，作为该子区域图像特征向量fd^j；

步骤2-3，回归预测：依次将各子区域特征向量输入步骤1-6训练得到的回归模型，得到子区域能见度估计值序列；

步骤2-4，权重融合：根据步骤1-4所述的方式按权重融合子区域能见度估计值，得到整幅图像能见度检测值。

为充分利用图像潜在信息，将深度卷积神经网络引入能见度检测中。由大规模数据集训练的卷积神经网络，可以提取到相对于明确图像特征更具表征能力的抽象特征。然而，在能见度检测方面难以构建样本分布均衡且样本标注值精确的大规模数据集。这主要是因为：一方面恶劣天气出现频次较低，导致低能见度样本数量较少；另一方面，能见度标注易受观测员主观因素影响，标注精度难以保证,且标注工作量较大。因此，本发明将迁移学习引入能见度检测。迁移学习是运用已有知识对不同但相关领域问题进行求解的一种新兴机器学习方法，迁移已有的知识解决目标领域中仅有少量有标签样本数据的学习问题。无参考图像质量评估领域的深度神经网络可以提取图像的不同层次抽象特征，这些特征能捕捉图像模糊和人类视觉的关系，可有效反映图像的模糊和退化程度，考虑到基于数据驱动的能见度检测原理也是根据低能见度天气对图像造成的模糊和退化效果，训练图像特征与能见度的关系模型，在特征提取层面与基于深度神经网络的无参考图像质量评估相似，本发明将无参考图像质量评估领域的深度神经网络DIQaM-NR迁移到能见度检测当中。同时，为克服不同领域样本差异，构建更适用于能见度检测的特征提取网络，本发明对DIQaM-NR网络进行修改，并利用能见度数据集对其部分模块进行微调。

在模型训练阶段，对训练集图像划分区域；利用全局池化层替换预训练网络DIQaM-NR末端的池化层，利用修改后的网络对各子区域图像编码，提取各子区域图像对应的512维特征向量；利用各子区域图像特征向量和能见度标注值训练支持向量回归机，并估计子区域能见度值；根据支持向量误差分析计算各子区域融合权重，并按权重融合子区域能见度估计值，得到整幅图像能见度估计值；结合估计结果对深度神经网络进行微调；通过微调后的网络对各子区域图像重新编码，利用新的各子区域图像特征向量和能见度标注值重新训练支持向量回归机，得到新的能见度与特征向量的回归模型；

在模型检测阶段，对测试图像划分区域；利用微调后的深度神经网络进行编码，提取各子区域图像对应的512维特征向量；将各子区域图像特征向量代入步骤1最后训练的新回归模型，得到各子区域能见度估计值；计算各子区域融合权重，按权重融合各子区域能见度估计值，输出整幅图像能见度检测值。

有益效果：基于迁移学习，利用预训练的深度神经网络提取子区域图像特征，构建图像特征和能见度的回归模型，融合不同子区域能见度估计结果，并结合检测结果对深度神经网络进行微调，有效提高了能见度检测的精度，同时降低了模型训练样本数量要求。

具体而言本发明与已有方法相比有以下优点：1.图像信息利用率高，本发明利用深度神经网络提取512维抽象特征，并结合检测结果对网络进行微调，与已有方法提取明确的人工特征相比，能够充分利用图像潜在信息，提取不同层次的图像特征；2鲁棒性高，按权重融合一幅图像不同区域能见度估计值，降低因环境遮挡、镜面反射等因素导致的局部估计误差。

附图说明

下面结合附图和具体实施方式对本发明做更进一步的具体说明，本发明的上述或其他方面的优点将会变得更加清楚。

图1为本发明流程图。

图2为深度神经网络编码图。

图3为单一子区域微调示意图。

图4为示例图像检测结果。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

如图1所示，本发明包括以下步骤：

步骤1，训练能见度检测模型：输入训练集图像，对训练集中每幅图像进行子区域图像划分；利用全局池化层替换预训练网络DIQaM-NR(无参考图像质量评估领域的深度神经网络)末端的池化层，利用修改后的网络对各子区域图像编码，提取各子区域图像对应的512维特征向量；利用各子区域图像特征向量和能见度标注值训练支持向量回归机，并估计子区域能见度值；根据支持向量误差分析计算各子区域融合权重，并按权重融合子区域能见度估计值，得到整幅图像能见度估计值；结合估计结果对深度神经网络进行微调；通过微调后的网络对各子区域图像重新编码，利用新的各子区域图像特征向量和能见度标注值重新训练支持向量回归机，得到新的能见度与特征向量的回归模型；

本发明步骤1包括以下步骤：

步骤1-1，图像区域划分：将每一幅训练集图像划分为RegionNum个子区域，每个子区域分辨率为224×224，

表示向上取整；子区域Region_(i,j)的左上角像素横纵坐标分别为

表示向下取整；子区域Region_(i，j)的右上角像素横纵坐标分别为

子区域Region_(i,j)的左下角像素横纵坐标分别为

子区域Region_(i,j)的右下角像素横纵坐标分别为

步骤1-2，深度神经网络编码：利用全局池化层替换DIQaM-NR网络最后的最大池化层，全局池化层将采样区域视为整幅特征图，采样方式为取均值，将替换后的网络称为FE-V网络，其结构如图2所示，网络共有10个卷积层、4个最大池化层和1个全局池化层，最大池化窗口为2×2，卷积滤波器大小均为3×3，激活函数为线性整流函数RELU，填充方式为零填充，输入为224×224的RGB图像，输出为512维特征向量，网络参数初始值见引用文献：BosseS,Maniry D,Müller K R,et al.Deep neural networks for no-reference and full-reference image quality assessment[J].arXiv preprint arXiv:1612.01697,2016，依次将训练集各子区域图像输入FE-V网络，提取全局池化层输出的512维特征向量，得到训练集图像子区域特征向量集合

其中，

表示第i幅图像的第j个子区域特征向量，RegionNum表示划分的子区域数量，ImageNum表示训练集图像数量；

步骤1-3，支持向量回归机训练：利用子区域图像特征向量和对应能见度标注值训练支持向量回归机，并将各子区域图像特征向量输入训练后的支持向量回归机，得到各子区域能见度估计值；

本发明步骤1-3包括以下步骤：

步骤1-3-1，样本集构建：将一幅子区域图像经步骤1-3提取的特征向量v_i作为样本特征

对应区域的能见度标注值y_i作为样本目标值，构成一组样本

设定训练集样本图像数量为ImageNum，则子区域图像数量为ImageNum×RegionNum即共有ImageNum×RegionNum组训练样本，将训练样本集记为

n为样本数量，数值上等于子区域图像总数，即n＝ImageNum×RegionNum；

步骤1-3-2，回归模型建立：利用样本集数据训练支持向量回归机，得到能见度回归模型；

步骤1-3-3，参数寻优：通过网络搜索和交叉验证，寻找回归模型的最佳参数；

得到训练集图像子区域能见度估计值集合

其中，

表示第i幅图像的第j个子区域能见度估计值，RegionNum表示划分的子区域数量，ImageNum表示训练集图像数量。

本发明步骤1-3-2包括以下步骤：

步骤1-3-2-1，建立优化目标和约束条件：为求解回归模型，根据支持向量回归机原理，建立如下优化目标和约束条件：

其中，s.t.表示约束条件，ω为超平面权重系数列向量，ω^T表示其转置，ε为回归函数误差限值，C为惩罚因子，其值越大表示对训练误差大于ε的样本惩罚越大，ξ_i和

分别为松弛变量上界和松弛变量下界，

是将训练样本映射到高维线性空间的非线性函数，

是样本特征向量，y_i为样本的能见度标注值，b是超平面的常系数；

步骤1-3-2-2，对偶变换求解：步骤1-3-2-1建立的优化目标不可微，直接求解不可行，可通过引入Lagrange函数，作对偶变换求解，变换后等价形式为：

其中，α_i和

为Lagrange乘子，

为核函数，γ为核函数参数，j取值范围为1～n；

步骤1-3-2-3，含参非线性方程确定：求解步骤1-3-2-2的等价形式，得到Lagrange乘子最优解向量为

其中α_i和

表示第i组训练样本对应的一组对偶Lagrange乘子最优解，则有：

其中，SV表示支持向量，即满足|y_i-f(x_i)|＝ε的

N_sV为支持向量的数量，

表示待测图像的子区域特征向量，故非线性方程为：

本发明步骤1-3-3包括以下步骤：

支持向量回归机的参数选取对检测精度影响较大，不同问题必须确定不同的相关参数才能建立对应的回归模型，需要确定的参数有回归函数误差限值ε，惩罚因子C和核函数参数γ，本发明采用网络搜索和交叉验证确定三个参数值：

步骤1-3-3-1，网络搜索：设定参数的取值区间[ε_min,ε_max]、[C_min,C_max]和[γ_min,γ_max]，设定相应步长εstep、Cstep和γstep，由计算机顺序算出对应各参数的组合(ε_min+u_ε×εstep,C_min+u_C×Cstep,γ_min+u_γ×γstep)，其中u_ε、u_C和u_γ为正整数，且ε_min+u_ε×εstep≤ε_max,C_min+u_C×Cstep≤C_max,γ_min+u_γ×γstep≤γ_max，对每一种组合进行交叉验证，逐一比较各种组合的均方误差并择优，从而确定该区间内最优参数组合[ε^*,C^*,γ^*]，本发明设定参数区间ε∈[0,500]、C∈[2^-4,2⁴]、γ∈[10^-3,10^-1]，相应步长εstep＝50、Cstep＝2和γstep＝1.1×10^-2；

步骤1-3-3-2，最终回归模型确定：将步骤1-3-3-1得到的最优参数组合[ε^*,C^*,γ^*]代入步骤1-3-2-3，确定最终回归模型

步骤1-3-3-1中所述对每一种组合进行交叉验证，具体包括：对于一组给定的参数组合[ε_min+u_ε×εstep,C_min+u_C×Cstep,γ_min+u_γ×γstep]，

其中m、n和q为正整数，将训练样本集S进行随机等分为v份，将其中的v-1份作为训练样本，余下的1份作为测试图像，共得到v组交叉验证所用的训练样本及相应的测试图像，将训练样本作为支持向量回归机的输入，建立回归模型，并用对应的测试图像校验拟合效果，依次轮换进行，得到v个表征拟合效果的均方误差MSE，选取最小的均方误差作为本参数组合的均方误差MSE_i，MSE表达式如下所示：

其中，t是每组测试图像的样本个数，

本发明将v设置为5，y_i ^*是模型输出能见度值，y_i是样本点能见度标注值。

本发明步骤1-4包括以下步骤：

表达式如下所示：

其中，

表示第i幅图像的第j个子区域的预测分布方差，

表示该区域的预测拟合方差；

表示为归一化的预测方差倒数，即：

其中，

表示该区域的预测方差，RegionNum表示划分的子区域数量，p为子区域序号，取值为[1,2,…,RegionNum]；

其中，

表示第i幅图像的第j个子区域的能见度估计值，

为该子区域融合权重，RegionNum表示划分的子区域数量；

本发明步骤1-4-1包括以下步骤：

其中，

为K_(Z,l)的转置，

为集合Z的协方差矩阵逆矩阵；

其中，惩罚因子C^j和误差限值ε^j可由步骤1-3得到。

本发明步骤1-5包括以下步骤：

步骤1-5-1，深度神经网络微调：将DIQaM-NR网络的参数值作为所有子区域FE-V网络参数的初始值，冻结底层卷积模块和池化层参数，继承DIQaM-NR网络的底层特征提取能力，采用反向传播和梯度下降算法对网络高层卷积模块进行训练，设置学习率为0.0001、迭代次数为100，从后向前更新各子区域对应FE-V网络的高层卷积模块参数，得到各子区域对应微调后的FE-V网络，单一子区域微调方式如图3所示；

步骤1-5-2，利用微调后网络重新编码：依次将训练集各子区域图像输入对应微调后的FE-V网络，提取全局池化层输出的N维特征向量，得到新的子区域特征向量集合

其中，

表示第i幅图像的第j个子区域的新特征向量。

本发明步骤2包括以下步骤：

步骤2-1，测试图像区域划分：按照步骤1-1所述方法，将测试图像划分子区域；

步骤2-2，深度神经网络编码：依次将各子区域图像输入对应微调后的FE-V网络网络，提取全局池化层输出的512维特征向量，作为该子区域图像特征向量fd^j；

步骤2-3，回归预测：依次将各子区域特征向量输入步骤1-6训练得到的回归模型，计算子区域能见度估计值序列；

实施例

本实施例中，采集12幅彩色样本图像，其分辨率均为640×480，按照具体实施方式的步骤1-1将每幅图像划分为9个子区域；然后，将各子区域图像输入微调后的DIQaM-NR网络进行编码，提取图像特征；接下来，将各子区域图像特征输入本发明训练的回归模型，输出每幅图像各子区域能见度估计值；最后，按权重融合同一幅图像的9个子区域能见度估计值，得到每幅图像的能见度检测值，样本图像、能见度标注值和对应检测值如图4所示。

本发明提供了一种基于编码网络微调的图像能见度检测方法，具体实现该技术方案的方法和途径很多，以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。

Claims

1.一种基于编码网络微调的图像能见度检测方法，其特征在于，包括以下步骤：

步骤1，训练能见度检测模型：输入训练集图像，对训练集中每幅图像进行子区域图像划分；利用全局池化层替换预训练网络DIQaM-NR末端的池化层，利用替换修改后的网络对各子区域图像编码，提取各子区域图像对应的N维特征向量；利用各子区域图像特征向量和能见度标注值训练支持向量回归机，并估计子区域能见度值；根据支持向量误差分析计算各子区域融合权重，并按权重融合子区域能见度估计值，得到整幅图像能见度估计值；结合估计结果对深度神经网络进行微调；通过微调后的网络对各子区域图像重新编码，利用新的各子区域图像特征向量和能见度标注值重新训练支持向量回归机，得到新的能见度与特征向量的回归模型；

步骤2，测试能见度检测模型：输入测试图像，对测试图像进行子区域图像划分；利用微调后的深度神经网络进行编码，提取各子区域图像对应的N维特征向量；将各子区域图像特征向量代入步骤1最后训练的新回归模型，得到各子区域能见度估计值；计算各子区域融合权重，按权重融合各子区域能见度估计值，输出整幅图像能见度检测值；

步骤1包括以下步骤：

表示向上取整；子区域Region_(i,j)的左上角像素横坐标

和纵坐标

分别为：

表示向下取整；子区域Region_(i,j)的右上角像素横坐标

和纵坐标

分别为

子区域Region_(i,j)的左下角像素横坐标

和纵坐标

分别为

子区域Region_(i,j)的右下角像素横坐标

和纵坐标

分别为

步骤1-2，深度神经网络编码：利用全局池化层替换DIQaM-NR网络最后的最大池化层，将替换后的网络称为FE-V网络，其中全局池化层将采样区域视为整幅特征图，采样方式为取均值，依次将训练集各子区域图像输入FE-V网络，提取全局池化层输出的N维特征向量，得到训练集图像子区域特征向量集合FT：

其中，

步骤1-6，重新训练支持向量回归机：利用新的各子区域图像特征向量和能见度标注值重新训练支持向量回归机，得到新的能见度与特征向量的回归模型；

步骤1-3包括以下步骤：

作为样本特征

对应区域的能见度标注值y_i作为样本目标值，构成一组样本

得到训练集图像子区域能见度估计值集合

其中，

表示第i幅图像的第j个子区域能见度估计值；

步骤1-3-2包括以下步骤：

步骤1-3-2-1：建立如下优化目标和约束条件：

分别为松弛变量上界和松弛变量下界，

其中，α_i和

为Lagrange乘子，

为核函数，γ为核函数参数，j取值范围为1～n；

步骤1-3-2-3，确定含参非线性方程：求解步骤1-3-2-2的等价形式，得到Lagrange乘子最优解向量

其中α_i和

表示第i组训练样本对应的一组对偶Lagrange乘子，则有：

其中，SV表示支持向量，即满足|y_i-f(x_i)|＝ε的

N_SV为支持向量的数量，

表示待测图像的子区域特征向量，故非线性方程

为：

步骤1-3-3包括以下步骤：

步骤1-3-3-1，网络搜索：设定参数ε的取值区间为[ε_min,ε_max]、C的取值区间为[C_min,C_max]、核函数参数γ的取值区间为[γ_min,γ_max]，设定参数ε的步长为εstep、C的步长为Cstep、核函数参数γ的步长为γstep，顺序算出对应各参数的组合(ε_min+u_ε×εstep,C_min+u_c×Cstep,γ_min+u_γ×γstep)，其中u_ε、u_C和u_γ为正整数，且ε_min+u_ε×εstep≤ε_max,C_min+u_C×Cstep≤C_max,γ_min+u_γ×γstep≤γ_max，对每一种组合进行交叉验证，逐一比较各种组合的均方误差并择优，从而确定该区间内最优参数组合[ε^*,C^*,γ^*]，ε^*为参数ε的最优选择，C^*为参数C的最优选择，γ^*为核函数参数γ的最优选择；

步骤1-3-3-2，确定最终回归模型：将步骤1-3-3-1得到的最优参数组合[ε^*,C^*,γ^*]代入步骤1-3-2-3，确定最终回归模型