CN115456917A

CN115456917A - 有益于目标准确检测的图像增强方法、装置、设备及介质

Info

Publication number: CN115456917A
Application number: CN202211410441.XA
Authority: CN
Inventors: 任鹏; 王浩; 陈勇; 吴天乐; 单亦先; 孙士新; 郝亮; 张珅; 陈刚; 潘龙
Original assignee: Qingdao Zhongshida Science And Technology Education Group Co ltd; Qingdao Zhongshida Technology Entrepreneurship Co ltd; China University of Petroleum East China
Current assignee: Qingdao Zhongshida Science And Technology Education Group Co ltd; Qingdao Zhongshida Technology Entrepreneurship Co ltd; China University of Petroleum East China
Priority date: 2022-11-11
Filing date: 2022-11-11
Publication date: 2022-12-09
Anticipated expiration: 2042-11-11
Also published as: CN115456917B

Abstract

本申请公开了一种有益于目标准确检测的图像增强方法、装置、设备及介质，应用于图像处理技术领域。其中，方法包括预先训练包括特征提取器、决策代理网络和动作要素集的图像增强模型；图像增强模型以输入的原始样本图像的图像特征向量作为状态要素，以原始样本图像和通过决策代理网络输出的最优图像操作序列处理后的样本增强图像间的目标检测精度增量作为奖励要素，对决策代理网络进行训练。调用特征提取器提取目标图像特征，并将其输入至决策代理网络，得到目标操作序列；按照目标操作序列，对待检测原始图像依次进行相应的图像操作，得到用于进行目标检测的增强图像，从而可以通过提升视觉质量，有效提高目标检测的精准度。

Description

有益于目标准确检测的图像增强方法、装置、设备及介质

技术领域

本申请涉及图像处理技术领域，特别是涉及一种有益于目标准确检测的图像增强方法、装置、电子设备及可读存储介质。

背景技术

目标检测技术与图像增强技术为计算机视觉领域中两大极具特色的前沿技术。通用的目标检测方法目的是利用图像中的周边方框对指定的目标进行定位，在常规图像中已经取得了优异的性能。但是，在一些特殊场景图像中会存在细节模糊、低对比度、低光照、颜色偏差和噪声等问题，其严重限制了目标检测方法的精度。通用的图像增强方法是基于人类的视觉感知来提升图像的质量，使其更符合人类的美学范畴。在实际应用中，目标检测与图像增强这两项任务互不关联，且以提高视觉质量为目标的图像增强方法不一定有助于提高目标检测方法的性能，两者之间没有有效的关联技术。

鉴于此，如何通过提升视觉质量，来提高目标检测的精准度，是所属领域技术人员需要解决的技术问题。

发明内容

本申请提供了一种有益于目标准确检测的图像增强方法、装置、电子设备及可读存储介质，可以通过提升视觉质量，有效提高目标检测的精准度。

为解决上述技术问题，本发明实施例提供以下技术方案：

本发明实施例一方面提供了一种有益于目标准确检测的图像增强方法，包括：

预先训练包括特征提取器、决策代理网络和动作要素集的图像增强模型；

调用所述特征提取器提取待检测原始图像的目标图像特征，将所述目标图像特征输入至所述决策代理网络，得到目标操作序列；

按照所述目标操作序列，对所述待检测原始图像依次进行相应的图像操作，得到目标增强图像；

调用目标检测器对所述目标增强图像进行目标检测；

其中，所述特征提取器为所述目标检测器的目标网络结构；所述动作要素集包括多种预设的图像处理操作；所述决策代理网络用于从所述动作要素集中确定最优图像操作序列；所述图像增强模型以输入的原始样本图像的图像特征向量作为状态要素，以所述原始样本图像和通过所述最优图像操作序列处理后的样本增强图像的目标检测得分增量作为奖励要素对所述决策代理网络进行训练。

可选的，所述目标检测器为YOLOv5s，所述特征提取器包括YOLOv5s的主干部分和颈部部分；

所述主干部分通过BottlencekCSP网络提取图像特征，并通过空间金字塔池化层提取与融合不同尺度的图像特征；相应的，所述状态要素为多种尺寸的图像特征向量的拼接结果；

所述颈部部分采用路径聚合网络作为来自不同骨干层对不同目标检测器级别的参数聚合。

可选的，所述决策代理网络包括依次连接的第一卷积层、第二卷积层、第一全连接层、第二全连接层、第三全连接层和第四全连接层；

所述第一卷积层、所述第二卷积层、所述第一全连接层、所述第二全连接层、所述第三全连接层和所述第四全连接层均连接相应的批归一化层和相应的激活层。

可选的，所述训练包括特征提取器、决策代理网络和动作要素集的图像增强模型之前，还包括：

响应动作要素集构建指令，生成包括修图动作子集、手动白平衡动作子集、自动白平衡动作子集、直方图动作子集、Retinex动作子集、模糊动作子集、非线性变换动作子集、噪声添加动作子集、暗通道先验操作、浮雕操作、锐化操作、主成分分析操作以及无动作选项的动作要素集；

其中，所述无动作选项作为终止指示信号。

可选的，所述修图动作子集包括调高对比度、调高亮度、调高颜色饱和度、调低对比度、调低亮度及调低颜色饱和度；

所述手动白平衡动作子集包括调高红色分量、调高蓝色分量、调高绿色分量、调低红色分量、调低蓝色分量及调低绿色分量；

所述自动白平衡动作子集包括灰色世界白平衡、完美反射白平衡、动态阈值白平衡、平均白平衡与色差检测白平衡；

所述直方图动作子集包括直方图均衡化、自适应直方图均衡化、对比度限制自适应直方图均衡化与对比度拉伸；

所述Retinex动作子集包括单尺度Retinex、多尺度Retinex、多尺度颜色恢复Retinex、自动多尺度颜色恢复Retinex与多尺度色度保存Retinex；

所述模糊动作子集包括平均模糊、运动模糊、中值模糊、玻璃模糊、双边模糊与高斯模糊；

所述非线性变换动作子集包括Gamma校正、对数函数处理操作、Logit函数处理操作与Sigmoid函数处理操作；

所述噪声添加动作子集包括添加ISO噪声、添加高斯噪声与添加乘法噪声。

可选的，所述以所述原始样本图像和通过所述最优图像操作序列处理后的样本增强图像的目标检测得分增量作为奖励要素对所述决策代理网络进行训练，包括：

分别获取每一次训练迭代过程中所述原始样本图像和所述样本增强图像进行目标检测的检测平均精度，以作为评价目标检测结果的得分；

调用奖励计算关系式，确定当前迭代的奖励要素，所述奖励计算关系式为：

；

式中，r _t为第t次迭代的奖励要素，β为平衡系数，C _t+1为所述样本增强图像在第t次迭代的检测平均精度，C _t为所述原始样本图像在第t次迭代的检测平均精度。

可选的，所述调用所述特征提取器提取待检测原始图像的目标图像特征，包括：

获取待检测原始图像的红色通道、绿色通道和蓝色通道的像素值；

对各像素值进行归一化处理，并将归一化处理后的像素值输入至所述特征提取器中，得到所述待检测原始图像的目标图像特征。

本发明实施例另一方面提供了一种有益于目标准确检测的图像增强装置，包括：

模型预训练模块，用于训练包括特征提取器、决策代理网络和动作要素集的图像增强模型；其中，所述特征提取器为目标检测器的目标网络结构；所述动作要素集包括多种预设的图像处理操作；所述决策代理网络用于从所述动作要素集中确定最优图像操作序列；所述图像增强模型以输入的原始样本图像的图像特征向量作为状态要素，以所述原始样本图像和通过所述最优图像操作序列处理后的样本增强图像之间的目标检测精度增量作为奖励要素对所述决策代理网络进行训练；

动作确定模块，用于调用所述特征提取器提取待检测原始图像的目标图像特征，将所述目标图像特征输入至所述决策代理网络，得到目标操作序列；

图像优化模块，用于按照所述目标操作序列，对所述待检测原始图像依次进行相应的图像操作，得到目标增强图像；

目标检测模块，用于调用所述目标检测器对所述目标增强图像进行目标检测。

本发明实施例还提供了一种电子设备，包括处理器，所述处理器用于执行存储器中存储的计算机程序时实现如前任一项所述有益于目标准确检测的图像增强方法的步骤。

本发明实施例最后还提供了一种可读存储介质，所述可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如前任一项所述有益于目标准确检测的图像增强方法的步骤。

本申请提供的技术方案的优点在于，在进行目标检测之前，先对需要进行目标检测的待检测原始图像进行图像预处理操作，具体是根据当前待检测原始图像的图像特征通过图像增强模型为其匹配能够达到给定目标检测最佳性能的一系列图像操作序列，使待检测原始图像按顺序处理成给定目标检测器最佳性能的形式，可保证了最终的目标增强图像可以获得最优的目标检测结果，从而实现了通过提升视觉质量，有效提高目标检测的精准度。

此外，本发明实施例还针对有益于目标准确检测的图像增强方法提供了相应的实现装置、电子设备及可读存储介质，进一步使得所述方法更具有实用性，所述装置、电子设备及可读存储介质具有相应的优点。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本申请。

附图说明

为了更清楚的说明本发明实施例或相关技术的技术方案，下面将对实施例或相关技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种有益于目标准确检测的图像增强方法的流程示意图；

图2为本发明实施例提供的一个示例性应用场景的图像增强模型的训练框架示意图；

图3为本发明实施例提供的一个示例性应用场景的有益于目标准确检测的图像增强方法的框架示意图；

图4为本发明实施例提供的有益于目标准确检测的图像增强装置的一种具体实施方式结构图；

图5为本发明实施例提供的电子设备的一种具体实施方式结构图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面结合附图和具体实施方式对本发明作进一步的详细说明。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等是用于区别不同的对象，而不是用于描述特定的顺序。此外术语“包括”和“具有”以及二者的任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可包括没有列出的步骤或单元。下面详细的说明本申请的各种非限制性实施方式。

首先参见图1，图1为本发明实施例提供的一种有益于目标准确检测的图像增强方法的流程示意图，本发明实施例可包括以下内容：

S101：预先训练包括特征提取器、决策代理网络和动作要素集的图像增强模型。

在本实施例中，图像增强模型用于对需要进行目标检测的图像也即本实施例的待检测原始图像进行图像预处理，使得处理后所得的图像也即本实施例的目标增强图像的图像质量相比原始的待检测原始图像得到优化，更有利于得到高精度的目标检测结果。其中，图像增强模型的特征提取器是用于提取输入图像的图像特征，为了保证最终处理所得的图像与目标检测性能最匹配，本实施例的特征提取器直接来源于目标检测器的部分网络结构。可以理解的是，目标检测器包括特征提取功能，本实施例的图像增强模型所采用的特征提取器可直接采用目标检测器中可以实现特征提取功能的部分网络结构，本实施例称其为目标网络结构。此处的输入图像是指利用图像增强模型进行处理的图像，包括原始样本图像和待检测原始图像，所提取的图像特征作为图像增强模型的状态要素。动作要素集包括多种预设的图像处理操作，所谓的图像处理操作是指对图像也即原始样本图像和待检测原始图像进行图像增强处理的一些操作，例如亮度调整、饱和度调整、色温偏差调整、全局或局部对比度调整、图像平滑操作等，所属领域技术人员可根据实际需求对动作要素集所包括的图像操作类型进行选择，当然该动作要素集也是可扩展的，用户可根据实际需求灵活调整所包含的图像操作类型。决策代理网络用于从动作要素集中确定最优图像操作序列，最优图像操作序列也即用于对输入图像进行的一系列图像操作的集合，按照最优图像操作序列对图像包括原始样本图像以及待检测原始图像依次进行相应的图像操作，处理后的所得图像即为用于输入目标检测器或者是进行目标检测的最终图像。图像增强模型的训练过程即为对决策代理网络的训练，本实施例的图像增强模型以输入的原始样本图像的图像特征向量作为状态要素，以原始样本图像和通过最优图像操作序列处理后的样本增强图像的目标检测得分增量作为奖励要素对决策代理网络进行训练。在此基础上，所属领域技术人员可采用任何一种机器学习方法所示的模型训练方法对决策代理网络进行迭代训练，直至得到满足条件如到达指定迭代次数或者是好的收敛效果的决策代理网络。

S102：调用特征提取器提取待检测原始图像的目标图像特征，将目标图像特征输入至决策代理网络，得到目标操作序列。

为了便于区别，且不引起歧义，本实施例的待检测原始图像对应的图像特征称为目标图像特征，待检测原始图像对应的最优图像操作序列称为目标操作序列。在本实施例中，获取需要进行目标检测的待检测原始图像，为了便于后续特征提取，可获取该待检测原始图像的红色通道、绿色通道和蓝色通道的像素值；对各像素值进行归一化处理，并将归一化处理后的像素值输入至特征提取器中，得到待检测原始图像的目标图像特征，目标操作序列为与目标图像特征相匹配的一组有顺序的图像操作。

S103：按照目标操作序列，对待检测原始图像依次进行相应的图像操作，得到目标增强图像。

为了便于区别，且不引起歧义，本实施例调用图像增强模型对待检测原始图像进行处理后所得的增强图像称为目标增强图像，相比待检测原始图像，目标增强图像是视觉质量优化后图像，且其是与目标检测器的最优检测性能最匹配的图像形式。

S104：调用目标检测器对目标增强图像进行目标检测。

本实施例可直接将目标增强图像直接输入至目标检测器中进行目标检测，由于目标增强图像是与目标检测器的最优检测性能最匹配的图像形式，所以最终得到的检测结果便是最优的，从而有效提升目标检测的精准度。

在本发明实施例提供的技术方案中，在进行目标检测之前，先对需要进行目标检测的待检测原始图像进行图像预处理操作，具体是根据当前待检测原始图像的图像特征通过图像增强模型为其匹配能够达到给定目标检测最佳性能的一系列图像操作序列，使待检测原始图像按顺序处理成给定目标检测器最佳性能的形式，可保证了最终的目标增强图像可以获得最优的目标检测结果，从而实现了通过提升视觉质量，有效提高目标检测的精准度。

在上述实施例中，对于图像增强模型的结构并不做限定，本实施例中还给出图像增强模型的一种可选的结构，可包括下述内容：

若目标检测器为YOLOv5s，则图像增强模型的特征提取器可包括YOLOv5s的主干部分和颈部部分；主干部分通过BottlencekCSP网络提取图像特征，并通过空间金字塔池化层提取与融合不同尺度的图像特征；相应的，状态要素为多种尺寸的图像特征向量的拼接结果；颈部部分采用路径聚合网络作为来自不同骨干层对不同目标检测器级别的参数聚合。

在本实施例中，利用YOLOv5s的主干和颈部作为特征提取器，提取当前待检测原始图像的高维特征。具体的，通过BottlencekCSP网络提取待检测原始图像的特征，通过空间金字塔池化层（SPP）提取与融合不同尺度的特征，在特征提取过程中，可采用路径聚合网络（PANET）作为来自不同骨干层对不同检测器级别的参数聚合。最终可获得多种尺寸如40×40×128、20×20×256与10×10×512的特征向量，将多种尺寸的特征向量进行拼接即为最终的目标图像特征，也即图像增强模型的状态要素。当然，对于训练过程来说，特征提取器用于提取各样本原始图像的图像特征作为图像增强模型的状态要素。

作为一种可选的实施方式，决策代理网络可包括依次连接的第一卷积层、第二卷积层、第一全连接层、第二全连接层、第三全连接层和第四全连接层；第一卷积层、第二卷积层、第一全连接层、第二全连接层、第三全连接层和第四全连接层均连接相应的批归一化层和相应的激活层。

本实施例的决策代理网络由两层卷积层和四层全连接层构成，每一层都填加了批归一化层和激活层。决策代理网络输出选择的图像操作，该图像操作在原始样本图像上执行，得到样本增强图像，通过样本增强图像和原始样本图像的目标检测精度计算奖励，根据奖励训练决策代理网络，得到具有提高目标检测精度的决策代理网络，如何便可使原始图像被顺序处理成给定目标检测器达到最佳整体性能的形式。

上述实施例对动作要素集所包含的动作要素并未进行限定，为了得到更优视觉质量的图像，本实施例还给出了动作要素集的一种可选的实现方式，可包括下述内容：

在本实施例中，动作要素集构建指令为用户通过人机交互组件下发至计算设备中，计算设备响应用户基于现有的基本图像增强技术所选择的动作内容生成最终的动作要素集。其中，无动作选项作为终止指示信号，用于表示所有其他动作对提高目标检测结果均有负面影响。修图动作子集包括调高对比度、调高亮度、调高颜色饱和度、调低对比度、调低亮度及调低颜色饱和度；手动白平衡动作子集包括调高红色分量、调高蓝色分量、调高绿色分量、调低红色分量、调低蓝色分量及调低绿色分量；自动白平衡动作子集包括灰色世界白平衡、完美反射白平衡、动态阈值白平衡、平均白平衡与色差检测白平衡；直方图动作子集包括直方图均衡化、自适应直方图均衡化、对比度限制自适应直方图均衡化与对比度拉伸；Retinex动作子集包括单尺度Retinex、多尺度Retinex、多尺度颜色恢复Retinex、自动多尺度颜色恢复Retinex与多尺度色度保存Retinex；模糊动作子集包括平均模糊、运动模糊、中值模糊、玻璃模糊、双边模糊与高斯模糊；非线性变换动作子集包括Gamma校正、对数函数处理操作、Logit函数处理操作与Sigmoid函数处理操作；噪声添加动作子集包括添加ISO噪声、添加高斯噪声与添加乘法噪声。在实际应用中，该动作要素集可包含9个大类，共集成58个动作，以及一个作为终止指示信号的无动作选项。第一类为商业修图软件内置的6种动作，即分别为对比度、亮度和颜色饱和度的高低调整。第二类为手动白平衡的6种动作，即分别对红色、蓝色、绿色3种颜色分量的高低调整。第三类为旨在自适应校准色温偏差的5种自动白平衡动作，即灰色世界白平衡、完美反射白平衡、动态阈值白平衡、平均白平衡与色差检测白平衡。第四类为旨在调整全局或局部对比度的4种直方图动作，即直方图均衡化（HE）、自适应直方图均衡化（AHE）、对比度限制自适应直方图均衡化（CLAHE）与对比度拉伸。第五类为旨在平衡动态范围压缩、边缘增强与颜色恒定的5种Retinex动作，即单尺度Retinex（SSR），多尺度Retinex（MSR），多尺度颜色恢复Retinex（MSRCR），自动多尺度颜色恢复Retinex（AMSRCR）与多尺度色度保存Retinex（MSRCP）。第六类为旨在降低噪声，平滑图像的6种模糊动作，即平均模糊、运动模糊、中值模糊、玻璃模糊、双边模糊与高斯模糊。第七类为旨在增加图像变换多样性的19种非线性变换动作，即Gamma校正、对数函数、Logit函数与Sigmoid函数。第八类为旨在增加样本数量，提高模型泛化能力的3种添加噪声动作，即ISO噪声、高斯噪声与乘法噪声。第九类为暗通道先验（DCP）、浮雕（Emboss）、锐化（Sharpen）与主成分分析（Fancy PCA）4种动作。

在图像增强模型训练过程中，使用目标检测得分增量作为奖励，增量是指当前图像也即原始样本图像的目标检测得分与增强图像也即样本增强图像的目标检测得分差值。上述实施例对奖励要素的计算方式并不做任何限定，本实施例还给出一种可选的实施方式，可包括：

在本实施例中，将检测平均精度（mAP）作为评价目标检测结果的得分。使用采用的IoU∈[0.5：0.05：0.95]的mAP平均值作为第t步也即第t次迭代过程的得分C _t。定义当前图像I _t与增强图像I _t+1进行目标检测的得分为C _t与C _t+1，得分最大值和最小值分别为1和0。C _t与C _t+1增量的最大值和最小值分别为1和-1。相应的，在实际应用过程中，可分别获取每一次训练迭代过程中原始样本图像和样本增强图像进行目标检测的检测平均精度，以作为评价目标检测结果的得分；调用奖励计算关系式，确定当前迭代的奖励要素，奖励计算关系式可表述为：

；

式中，r _t为第t次迭代的奖励要素，β为平衡系数，通常设置β=10。 C _t+1为样本增强图像在第t次迭代的检测平均精度，C _t为原始样本图像在第t次迭代的检测平均精度。

为了使所述领域技术人员更加清楚明白本申请技术方案，本申请结合图2和图3给出了实际应用中的一种可选的实现方式，可包括下述内容：

获取当前图像的红色通道，绿色通道，以及蓝色通道的像素值，并对像素值进行归一化处理。

构建有益于目标准确检测的图像增强技术的图像增强模型所需的状态要素。

构建有益于目标准确检测的图像增强技术的图像增强模型所需的动作要素。本实施例根据现有的基本图像增强技术建立一个可扩展的动作集合。该集合包含9个大类，共集成58个动作，以及一个作为终止指示信号的无动作选项。第一类为商业修图软件内置的6种动作，即分别为对比度、亮度和颜色饱和度的高低调整。第二类为手动白平衡的6种动作，即分别对红色、蓝色、绿色3种颜色分量的高低调整。第三类为旨在自适应校准色温偏差的5种自动白平衡动作，即灰色世界白平衡、完美反射白平衡、动态阈值白平衡、平均白平衡与色差检测白平衡。第四类为旨在调整全局或局部对比度的4种直方图动作，即直方图均衡化（HE）、自适应直方图均衡化（AHE）、对比度限制自适应直方图均衡化（CLAHE）与对比度拉伸。第五类为旨在平衡动态范围压缩、边缘增强与颜色恒定的5种Retinex动作，即单尺度Retinex（SSR），多尺度Retinex（MSR），多尺度颜色恢复Retinex（MSRCR），自动多尺度颜色恢复Retinex（AMSRCR）与多尺度色度保存Retinex（MSRCP）。第六类为旨在降低噪声，平滑图像的6种模糊动作，即平均模糊、运动模糊、中值模糊、玻璃模糊、双边模糊与高斯模糊。第七类为旨在增加图像变换多样性的19种非线性变换动作，即Gamma校正、对数函数、Logit函数与Sigmoid函数。第八类为旨在增加样本数量，提高模型泛化能力的3种添加噪声动作，即ISO噪声、高斯噪声与乘法噪声。第九类为暗通道先验（DCP）、浮雕（Emboss）、锐化（Sharpen）与主成分分析（Fancy PCA）4种动作。最后，无动作选项表示所有其他动作对提高目标检测结果均有负面影响。将集合59种动作选项的集合作为有益于目标准确检测的图像增强技术的强化学习框架所需的动作要素。

使用目标检测得分增量作为奖励，构建有益于目标准确检测的图像增强技术的图像增强模型所需的奖励要素。其中，增量是指当前图像的目标检测得分与增强图像的目标检测得分差值。

对于图像增强模型的训练，本实施例以图2所示的图片作为训练过程中所使用的一个原始样本图像，将该样本图像输入到强化学习框架中，获取该样本图像的特征向量作为状态s，将状态s输入到由两层卷积层和四层全连接层构成的决策代理网络，每一层都填加了批归一化层和激活层。决策代理网络输出选择的图像增强方法作为动作a，动作a在当前图像上执行，得到对应的增强图像，通过增强图像和当前图像的目标检测精度计算奖励，根据奖励训练决策代理网络，得到具有提高目标检测精度的决策代理网络。

对于实际使用模型的过程，本实施例以图3所示的图片作为待检测图像，将该图像输入到图像增强模型中，获取该图像的特征向量作为状态s，将状态s输入到具有计算最优动作序列的决策代理网络中，使该图像被顺序处理成给定目标检测器达到最佳整体性能的形式。

需要说明的是，本申请中各步骤之间没有严格的先后执行顺序，只要符合逻辑上的顺序，则这些步骤可以同时执行，也可按照某种预设顺序执行，图1-图3只是一种示意方式，并不代表只能是这样的执行顺序。

本发明实施例还针对有益于目标准确检测的图像增强方法提供了相应的装置，进一步使得方法更具有实用性。其中，装置可从功能模块的角度和硬件的角度分别说明。下面对本发明实施例提供的有益于目标准确检测的图像增强装置进行介绍，下文描述的有益于目标准确检测的图像增强装置与上文描述的有益于目标准确检测的图像增强方法可相互对应参照。

基于功能模块的角度，参见图4，图4为本发明实施例提供的有益于目标准确检测的图像增强装置在一种具体实施方式下的结构图，该装置可包括：

模型预训练模块401，用于训练包括特征提取器、决策代理网络和动作要素集的图像增强模型；其中，目标检测器的目标网络结构；动作要素集包括多种预设的图像处理操作；决策代理网络用于从动作要素集中确定最优图像操作序列；图像增强模型以输入的原始样本图像的图像特征向量作为状态要素，以原始样本图像和通过最优图像操作序列处理后的样本增强图像之间的目标检测精度增量作为奖励要素对决策代理网络进行训练；

动作确定模块402，用于调用特征提取器提取待检测原始图像的目标图像特征，将目标图像特征输入至决策代理网络，得到目标操作序列；

图像优化模块403，用于按照目标操作序列，对待检测原始图像依次进行相应的图像操作，得到目标增强图像；

目标检测模块404，用于调用目标检测器对所述目标增强图像进行目标检测。

可选的，在本实施例的一些实施方式中，上述特征提取器可包括YOLOv5s的主干部分和颈部部分；主干部分通过BottlencekCSP网络提取图像特征，并通过空间金字塔池化层提取与融合不同尺度的图像特征；相应的，状态要素为多种尺寸的图像特征向量的拼接结果；颈部部分采用路径聚合网络作为来自不同骨干层对不同目标检测器级别的参数聚合。

在本实施例的另一些实施方式中，上述决策代理网络可包括依次连接的第一卷积层、第二卷积层、第一全连接层、第二全连接层、第三全连接层和第四全连接层；

第一卷积层、第二卷积层、第一全连接层、第二全连接层、第三全连接层和第四全连接层均连接相应的批归一化层和相应的激活层。

在本实施例的再一些实施方式中，上述模型预训练模块401还可用于：响应动作要素集构建指令，生成包括修图动作子集、手动白平衡动作子集、自动白平衡动作子集、直方图动作子集、Retinex动作子集、模糊动作子集、非线性变换动作子集、噪声添加动作子集、暗通道先验操作、浮雕操作、锐化操作、主成分分析操作以及无动作选项的动作要素集；其中，无动作选项作为终止指示信号。

作为上述实施例的一种可选的实施方式，上述修图动作子集包括调高对比度、调高亮度、调高颜色饱和度、调低对比度、调低亮度及调低颜色饱和度；

上述手动白平衡动作子集包括调高红色分量、调高蓝色分量、调高绿色分量、调低红色分量、调低蓝色分量及调低绿色分量；

上述自动白平衡动作子集包括灰色世界白平衡、完美反射白平衡、动态阈值白平衡、平均白平衡与色差检测白平衡；

上述直方图动作子集包括直方图均衡化、自适应直方图均衡化、对比度限制自适应直方图均衡化与对比度拉伸；

上述Retinex动作子集包括单尺度Retinex、多尺度Retinex、多尺度颜色恢复Retinex、自动多尺度颜色恢复Retinex与多尺度色度保存Retinex；

上述模糊动作子集包括平均模糊、运动模糊、中值模糊、玻璃模糊、双边模糊与高斯模糊；

上述非线性变换动作子集包括Gamma校正、对数函数处理操作、Logit函数处理操作与Sigmoid函数处理操作；

上述噪声添加动作子集包括添加ISO噪声、添加高斯噪声与添加乘法噪声。

可选的，在本实施例的另一些实施方式中，上述模型预训练模块401还可进一步用于：

分别获取每一次训练迭代过程中原始样本图像和样本增强图像进行目标检测的检测平均精度，以作为评价目标检测结果的得分；

调用奖励计算关系式，确定当前迭代的奖励要素，奖励计算关系式为：

；

可选的，在本实施例的再一些实施方式中，上述动作确定模块402还可用于：获取待检测原始图像的红色通道、绿色通道和蓝色通道的像素值；对各像素值进行归一化处理，并将归一化处理后的像素值输入至特征提取器中，得到待检测原始图像的目标图像特征。

本发明实施例所述有益于目标准确检测的图像增强装置的各功能模块的功能可根据上述方法实施例中的方法具体实现，其具体实现过程可以参照上述方法实施例的相关描述，此处不再赘述。

由上可知，本发明实施例可以通过提升视觉质量，有效提高目标检测的精准度。

上文中提到的有益于目标准确检测的图像增强装置是从功能模块的角度描述，进一步的，本申请还提供一种电子设备，是从硬件角度描述。图5为本申请实施例提供的电子设备在一种实施方式下的结构示意图。如图5所示，该电子设备包括存储器50，用于存储计算机程序；处理器51，用于执行计算机程序时实现如上述任一实施例提到的有益于目标准确检测的图像增强方法的步骤。

其中，处理器51可以包括一个或多个处理核心，比如4核心处理器、8核心处理器，处理器51还可为控制器、微控制器、微处理器或其他数据处理芯片等。处理器51可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable GateArray，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器51也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central Processing Unit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器51可以集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器51还可以包括AI(ArtificialIntelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器50可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器50还可包括高速随机存取存储器以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。存储器50在一些实施例中可以是电子设备的内部存储单元，例如服务器的硬盘。存储器50在另一些实施例中也可以是电子设备的外部存储设备，例如服务器上配备的插接式硬盘，智能存储卡（Smart Media Card，SMC），安全数字（SecureDigital，SD）卡，闪存卡（Flash Card）等。进一步地，存储器50还可以既包括电子设备的内部存储单元也包括外部存储设备。存储器50不仅可以用于存储安装于电子设备的应用软件及各类数据，例如：执行有益于目标准确检测的图像增强方法过程中的程序的代码等，还可以用于暂时地存储已经输出或者将要输出的数据。本实施例中，存储器50至少用于存储以下计算机程序501，其中，该计算机程序被处理器51加载并执行之后，能够实现前述任一实施例公开的有益于目标准确检测的图像增强方法的相关步骤。另外，存储器50所存储的资源还可以包括操作系统502和数据503等，存储方式可以是短暂存储或者永久存储。其中，操作系统502可以包括Windows、Unix、Linux等。数据503可以包括但不限于有益于目标准确检测的图像增强结果对应的数据等。

在一些实施例中，上述电子设备还可包括有显示屏52、输入输出接口53、通信接口54或者称为网络接口、电源55以及通信总线56。其中，显示屏52、输入输出接口53比如键盘（Keyboard）属于用户接口，可选的用户接口还可以包括标准的有线接口、无线接口等。可选地，在一些实施例中，显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED（Organic Light-Emitting Diode，有机发光二极管）触摸器等。显示器也可以适当的称为显示屏或显示单元，用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。通信接口54可选的可以包括有线接口和/或无线接口，如WI-FI接口、蓝牙接口等，通常用于在电子设备与其他电子设备之间建立通信连接。通信总线56可以是外设部件互连标准(peripheral component interconnect，简称PCI)总线或扩展工业标准结构(extendedindustry standard architecture，简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示，图5中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

本领域技术人员可以理解，图5中示出的结构并不构成对该电子设备的限定，可以包括比图示更多或更少的组件，例如还可包括实现各类功能的传感器57。

本发明实施例所述电子设备的各功能模块的功能可根据上述方法实施例中的方法具体实现，其具体实现过程可以参照上述方法实施例的相关描述，此处不再赘述。

可以理解的是，如果上述实施例中的有益于目标准确检测的图像增强方法以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（Read-Only Memory，ROM）、随机存取存储器（Random AccessMemory，RAM）、电可擦除可编程ROM、寄存器、硬盘、多媒体卡、卡型存储器（例如SD或DX存储器等）、磁性存储器、可移动磁盘、CD-ROM、磁碟或者光盘等各种可以存储程序代码的介质。

基于此，本发明实施例还提供了一种可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时如上任意一实施例所述有益于目标准确检测的图像增强方法的步骤。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似部分互相参见即可。对于实施例公开的硬件包括装置及电子设备而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

以上对本申请所提供的一种有益于目标准确检测的图像增强方法、装置、电子设备及可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以对本申请进行若干改进和修饰，这些改进和修饰也落入本申请权利要求的保护范围内。

Claims

1.一种有益于目标准确检测的图像增强方法，其特征在于，包括：

调用目标检测器对所述目标增强图像进行目标检测；

其中，所述特征提取器为所述目标检测器的目标网络结构；所述动作要素集包括多种预设的图像处理操作；所述决策代理网络用于从所述动作要素集中确定最优图像操作序列；所述图像增强模型以输入的原始样本图像的图像特征向量作为状态要素，以所述原始样本图像和通过所述最优图像操作序列处理后的样本增强图像的目标检测得分增量作为奖励要素，对所述决策代理网络进行训练。

2.根据权利要求1所述的有益于目标准确检测的图像增强方法，其特征在于，所述目标检测器为YOLOv5s，所述特征提取器包括YOLOv5s的主干部分和颈部部分；

所述颈部部分采用路径聚合网络作为来自不同骨干层对不同标检测器级别的参数聚合。

3.根据权利要求1所述的有益于目标准确检测的图像增强方法，其特征在于，所述决策代理网络包括依次连接的第一卷积层、第二卷积层、第一全连接层、第二全连接层、第三全连接层和第四全连接层；

4.根据权利要求1所述的有益于目标准确检测的图像增强方法，其特征在于，所述训练包括特征提取器、决策代理网络和动作要素集的图像增强模型之前，还包括：

其中，所述无动作选项作为终止指示信号。

5.根据权利要求4所述的有益于目标准确检测的图像增强方法，其特征在于，所述修图动作子集包括调高对比度、调高亮度、调高颜色饱和度、调低对比度、调低亮度及调低颜色饱和度；

6.根据权利要求1至5任意一项所述的有益于目标准确检测的图像增强方法，其特征在于，所述以所述原始样本图像和通过所述最优图像操作序列处理后的样本增强图像的目标检测得分增量作为奖励要素对所述决策代理网络进行训练，包括：

；

7.根据权利要求6所述的有益于目标准确检测的图像增强方法，其特征在于，所述调用所述特征提取器提取待检测原始图像的目标图像特征，包括：

8.一种有益于目标准确检测的图像增强装置，其特征在于，包括：

9.一种电子设备，其特征在于，包括处理器和存储器，所述处理器用于执行所述存储器中存储的计算机程序时实现如权利要求1至7任一项所述有益于目标准确检测的图像增强方法的步骤。

10.一种可读存储介质，其特征在于，所述可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述有益于目标准确检测的图像增强方法的步骤。