WO2024153156A1

WO2024153156A1 - 一种图像处理方法、装置、设备和介质

Info

Publication number: WO2024153156A1
Application number: PCT/CN2024/072880
Authority: WO
Inventors: 刘泉凯; 卢伍平; 李骏; 陈虹宇; 高媛; 陈振鑫
Original assignee: 浙江华感科技有限公司
Priority date: 2023-01-17
Filing date: 2024-01-17
Publication date: 2024-07-25
Also published as: CN116051378A

Abstract

本发明公开了一种图像处理方法、装置、设备和介质，由于本发明中获取待处理的目标图像，基于预先训练完成的混合注意力超分辨网络模型的卷积层，对输入的目标图像进行卷积处理得到浅层特征图，通过模型中的设定数量的串联的注意力残差层，将浅层特征图顺序经过每个注意力残差层进行感知处理，由于设定数量的串联的注意力残差层构造出更深的网络，使得模型更加关注图像中的细节区域，更深的网络能准确地提取细节特征的深层特征图，深层特征图与浅层特征图的对应行列的像素点的像素值相加后输入到上采样层中，得到输出的细节增强后的高分辨率图像，从而解决了热成像图像中模糊细节区域的特征提取不准确的问题。

Description

一种图像处理方法、装置、设备和介质

交叉引用

本申请要求对2023年1月17日提交的申请号为202310090705.6的中国申请的优先权，全部内容通过引用的方式并入本申请。

技术领域

本发明涉及图像处理技术领域，尤其涉及一种图像处理方法、装置、设备和介质。

背景技术

热成像图像由于受硬件以及成本限制因素，热成像图像通常分辨率较低，细节不够突出，通过超分辨率重建可以提升图像的分辨率和质量，可以缓解分辨率低和细节不突出的问题。

但是由于热成像图像相比可见光图像的细节较模糊，难以区分细节区域和平缓区域，并且当目标与周围环境的温度差别较大时，细节区域的特征提取会更加不准确，热成像图像在经过超分辨率网络模型进行超分辨率重建后，细节区域会出现黑白边现象。

因此，如何解决热成像图像中模糊细节区域的特征提取不准确导致的超分辨率重建后的黑白边现象就成为亟待解决的技术问题。

发明内容

本发明提供了一种图像处理方法、装置、设备和介质，用以解决现有技术中热成像图像中模糊细节区域的特征提取不准确导致的超分辨率重建后的黑白边现象的问题。

本发明提供了一种图像处理方法，所述方法包括：

获取待处理的目标图像，基于预先训练完成的混合注意力超分辨网络模型的卷积层，对输入的所述目标图像进行卷积处理得到浅层特征图；

基于所述混合注意力超分辨网络模型中设定数量的串联的注意力残差层，将所述浅层特征图顺序经过每个注意力残差层进行感知处理，得到最后一个注意力残差层输出的深层特征图，基于所述混合注意力超分辨网络模型的目标残差相加处理层，将所述浅层特征图与所述深层特征图的对应行列的像素点的像素值相加，得到处理后的目标特征图；基于所述混合注意力超分辨网络模型中的上采样层，将所述目标特征图输入到所述上采样层，得到输出的细节增强后的高分辨率图像。

进一步地，所述基于所述混合注意力超分辨网络模型中设定数量的串联的注意力残差层，将所述浅层特征图顺序经过每个注意力残差层进行感知处理，得到最后一个注意力残差层输出的深层特征图包括：

针对所述混合注意力超分辨网络模型中的每个注意力残差层，若该注意力残差层为首个注意力残差层，则将所述浅层特征图作为第一输入特征图输入该注意力残差层，若该注意力残差层非为首个注意力残差层，则将上一注意力残差层的输出特征图作为该注意力残差层的第一输入特征图；基于该注意力残差层的注意力层对第一输入特征图进行感知处理，得到感知处理后注意力层输出的目标注意力特征图，基于该注意力残差层的残差相加处理层，将所述目标注意力特征图以及所述第一输入特征图的对应行列的像素点的像素值相加，得到该注意力残差层的输出特征图，直到得到最后一个注意力残差层输出的深层特征图。

进一步地，所述基于该注意力残差层的注意力层对第一输入特征图进行感知处理，得到感知处理后注意力层输出的目标注意力特征图包括：

基于该注意力残差层的注意力层的处理单元，根据所述第一输入特征图中每个像素点的像素值、以及所述注意力层中预先保存的局部二值模式LBP采样函数，将所述每个像素点的像素值输入所述LBP采样函数得到输出的LBP特征值矩阵并保存在所述注意力层中；

将所述第一输入特征图输入所述注意力层的第一感知机单元进行感知处理得到基于亮度的注意力特征图，将所述LBP特征值矩阵经过所述注意力层的第二感知机单元进行感知处理得到基于梯度的注意力特征图，将两个注意力特征图输入所述注意力层的融合层单元进行融合处理得到融合后的注意力特征图，基于所述注意力层的点乘处理单元，将所述融合后的注意力特征图与所述第一输入特征图进行点乘处理得到输出的目标注意力特征图。

进一步地，每个注意力残差层还包括第一卷积层、第一激活层、第二卷积层和第二激活层，所述基于该注意力残差层的注意力层对第一输入特征图进行感知处理，得到感知处理后注意力层输出的目标注意力特征图之前，所述方法还包括：

将所述第一输入特征图输入该注意力残差层的第一卷积层进行卷积处理、经过第一激活层进行激活处理、经过第二卷积层进行卷积处理，经过第二激活层进行激活处理得到第二输入特征图，并将所述第二输入特征图输入该注意力残差层的注意力层进行后续处理。

相应地，本发明提供了一种图像处理装置，所述装置包括：

获取模块，用于获取待处理的目标图像；

处理模块，用于基于预先训练完成的混合注意力超分辨网络模型的卷积层，对输入的所述目标图像进行卷积处理得到浅层特征图；基于所述混合注意力超分辨网络模型中设定数量的串联的注意力残差层，将所述浅层特征图顺序经过每个注意力残差层进行感知处理，得到最后一个注意力残差层输出的深层特征图，基于所述混合注意力超分辨网络模型的目标残差相加处理层，将所述浅层特征图与所述深层特征图的对应行列的像素点的像素值相加，得到处理后的目标特征图；基于所述混合注意力超分辨网络模型中的上采样层，将所述目标特征图输入到所述上采样层，得到输出的细节增强后的高分辨率图像。

进一步地，所述处理模块，具体用于针对所述混合注意力超分辨网络模型中的每个注意力残差层，若该注意力残差层为首个注意力残差层，则将所述浅层特征图作为第一输入特征图输入该注意力残差层，若该注意力残差层非为首个注意力残差层，则将上一注意力残差层的输出特征图作为该注意力残差层的第一输入特征图；基于该注意力残差层的注意力层对第一输入特征图进行感知处理，得到感知处理后注意力层输出的目标注意力特征图，基于该注意力残差层的残差相加处理层，将所述目标注意力特征图以及所述第一输入特征图的对应行列的像素点的像素值相加，得到该注意力残差层的输出特征图，直到得到最后一个注意力残差层输出的深层特征图。

进一步地，所述处理模块，具体用于基于该注意力残差层的注意力层的处理单元，根据所述第一输入特征图中每个像素点的像素值、以及所述注意力层中预先保存的局部二值模式LBP采样函数，将所述每个像素点的像素值输入所述LBP采样函数得到输出的LBP特征值矩阵并保存在所述注意力层中；将所述第一输入特征图输入所述注意力层的第一感知机单元进行感知处理得到基于亮度的注意力特征图，将所述LBP特征值矩阵经过所述注意力层的第二感知机单元进行感知处理得到基于梯度的注意力特征图，将两个注意力特征图输入所述注意力层的融合层单元进行融合处理得到融合后的注意力特征图，基于所述注意力层的点乘处理单元，将所述融合后的注意力特征图与所述第一输入特征图进行点乘处理得到输出的目标注意力特征图。

进一步地，每个注意力残差层还包括第一卷积层、第一激活层、第二卷积层和第二激活层，所述处理模块，具体用于将所述第一输入特征图输入该注意力残差层的第一卷积层进行卷积处理、经过第一激活层进行激活处理、经过第二卷积层进行卷积处理，经过第二激活层进行激活处理得到第二输入特征图，并将所述第二输入特征图输入该注意力残差层的注意力层进行后续处理。

相应地，本发明提供了一种电子设备，包括：处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

所述存储器中存储有计算机程序，当所述程序被所述处理器执行时，使得所述处理器执行时实现上述图像处理方法中任一所述方法的步骤。

相应地，本发明提供了一种计算机可读存储介质，其存储有计算机程序，所述计算机程序被处理器执行时实现上述图像处理方法中任一所述方法的步骤。

本发明提供了一种图像处理方法、装置、设备和介质，由于本发明中获取待处理的目标图像，基于预先训练完成的混合注意力超分辨网络模型的卷积层，对输入的目标图像进行卷积处理得到浅层特征图，通过模型中的设定数量的串联的注意力残差层，将浅层特征图顺序经过每个注意力残差层进行感知处理，由于设定数量的串联的注意力残差层构造出更深的网络，使得模型更加关注图像中的细节区域，更深的网络能准确地提取细节特征的深层特征图，深层特征图与浅层特征图的对应行列的像素点的像素值相加后输入到上采样层中，得到输出的细节增强后的高分辨率图像，从而解决了热成像图像中模糊细节区域的特征提取不准确的问题。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种图像处理方法的过程示意图；

图2为本发明实施例提供的一种图像处理的过程示意图；

图3为本发明实施例提供的一种混合注意力神经网络模型的注意力层对第一输入特征图进行感知处理的过程示意图；

图4为本发明实施例提供的一种注意力残差层提取输出特征图的过程示意图；

图5为本发明实施例提供的一种图像处理装置的结构示意图；

图6为本发明实施例提供的一种电子设备结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

为了解决热成像图像中模糊细节区域的特征提取不准确导致的超分辨率重建后的黑白边现象的问题，本发明实施例提供了一种图像处理方法、装置、设备和介质。

实施例1：

图1为本发明实施例提供的一种图像处理方法的过程示意图，该过程包括以下步骤：

S101：获取待处理的目标图像，基于预先训练完成的混合注意力超分辨网络模型的卷积层，对输入的所述目标图像进行卷积处理得到浅层特征图。

为了解决热成像图像中模糊细节区域的特征提取不准确导致的超分辨率重建后的黑白边现象的问题，本发明实施例提供的一种图像处理方法应用于电子设备，该电子设备可以是主机、平板电脑、智能手机等智能终端设备，也可以是服务器，其中该服务器可以是本地服务器，也可以是云端服务器，本发明实施例对此不做限制。

该电子设备获取待处理的目标图像，目标图像是指需要处理的图像。其中该目标图像可以是热成像图像，也可以是存在模糊细节区域的低分辨图像，例如红外图像、可见光图像等。电子设备可以通过多种方式获取待处理的目标图像，例如，该电子设备具体可以是接收与该电子设备连接的电子设备(如，热成像仪)发送的目标图像，也可以是获取该电子设备自身保存的目标图像。

为了提取到目标图像的浅层特征图，该电子设备保存有预先训练完成的混合注意力超分辨网络模型，该混合注意力超分辨率网络模型是用于实现低分辨率图像的超分辨率重建，其中模型的损失函数为L＝MSE(lr，hr)，L表示损失函数值，lr表示低分辨率图像，hr表示高分辨率图像，MSE为均方误差；基于该混合注意力超分辨率网络模型的卷积层，对目标图像进行卷积处理得到目标图像的浅层特征图。在一些实施例中，混合注意力超分辨网络模型用于基于注意力机制对图像进行超分辨率重建。注意力机制是人工神经网络中一种模仿认知注意力的技术。注意力机制可以增强神经网络输入数据中某些部分的权重，同时减弱其他部分的权重，以此将网络的关注点聚焦于数据中最重要的一小部分。注意力机制可以通过在模型结构中加入attention函数或引入其他实现注意力机制的结构等方式实现。在一些实施例中，混合注意力超分辨网络模型的输入可以包括目标图像，混合注意力超分辨网络模型的输出可以包括细节增强后的高分辨率图像。

S102：基于所述混合注意力超分辨网络模型中设定数量的串联的注意力残差层，将所述浅层特征图顺序经过每个注意力残差层进行感知处理，得到最后一个注意力残差层输出的深层特征图，基于所述混合注意力超分辨网络模型的目标残差相加处理层，将所述浅层特征图与所述深层特征图的对应行列的像素点的像素值相加，得到处理后的目标特征图；基于所述混合注意力超分辨网络模型中的上采样层，将所述目标特征图输入到所述上采样层，得到输出的细节增强后的高分辨率图像。

在一些实施例中，混合注意力超分辨网络模型的结构如下：混合注意力超分辨网络模型包括卷积层、注意力残差层、目标残差相加处理层以及上采样层，卷积层的输出作为注意力残差层的输入，卷积层的输出以及注意力残差层的输出作为目标残差相加处理层的输入，目标残差相加处理层的输出作为上采样层的输入，上采样层的输出作为混合注意力超分辨网络模型最终的输出。

卷积层用于对目标图像提取浅层特征，得到浅层特征图。卷积层的输入包括目标图像，卷积层的输出包括浅层特征图，卷积层的模型类型可以是卷积神经网络Convolutional Neural Network(CNN)等。

注意力残差层用于对目标图像提取深层特征。注意力残差层的输入包括第一输入特征图，第一输入特征图可以是卷积层输出的浅层特征图或前一个注意力残差层输出的输出特征图，注意力残差层的输出包括输出特征图，最后一个注意力残差层输出的输出特征图可以叫做深层特征图，注意力残差层的模型类型可以是残差注意力网络Residual Attention Network(RAN)等。

在一些实施例中，基于所述混合注意力超分辨网络模型中设定数量的串联的注意力残差层，将所述浅层特征图顺序经过每个注意力残差层进行感知处理，得到最后一个注意力残差层输出的深层特征图包括：针对混合注意力超分辨网络模型中的每个注意力残差层，若该注意力残差层为首个注意力残差层，则将卷积层输出的浅层特征图作为该注意力残差层的第一输入特征图，输入该注意力残差层；若该注意力残差层为非首个注意力残差层，则将前一个注意力残差层输出的输出特征图作为该注意力残差层的第一输入特征图，输入该注意力残差层。

目标残差相加处理层用于将输入的至少两个图像的对应行列的像素点的像素值进行处理得到目标特征图。在一些实施例中，目标残差相加处理层将输入的至少两个图像的对应行列的像素点的像素值进行相加。目标残差相加处理层的输入包括浅层特征图和深层特征图，目标残差相加处理层的输出包括目标特征图，目标残差相加处理层的模型类型可以是残差神经网络Residual Neural Network(ResNet)等。

上采样层用于提升图像的分辨率。上采样层的输入包括目标特征图，上采样层的输出包括细节增强后的高分辨率图像，上采样层的模型类型可以是全卷积网络Fully Convolutional Networks(FCN)、图像分割卷积网络U-Net:Convolutional Networks for Biomedical Image Segmentation(U-Net)等。

在一些实施例中，可以基于大量带有标识的训练样本训练混合注意力超分辨网络模型。具体的，将带有标识的训练样本输入混合注意力超分辨网络模型，通过训练更新混合注意力超分辨网络模型的参数。

在一些实施例中，训练样本可以是样本目标图像。在一些实施例中，标识可以是样本目标图像对应的实际细节增强后的高分辨率图像。在一些实施例中，标识的获取方式可以是人工通过插值算法、图像重建等图像超分辨率技术得到的；插值算法可以是邻近插值、双线性插值和双立方插值等；图像重建可以是小波变换等。在一些实施例中，卷积层、注意力残差层、目标残差相加处理层以及上采样层可以联合训练获取。可以基于大量带有训练标签的训练样本训练初始卷积层、初始注意力残差层、初始目标残差相加处理层以及初始上采样层；具体的，将样本目标图像输入初始卷积层得到样本浅层特征图；将样本浅层特征图输入初始注意力残差层得到样本深层特征图；将样本浅层特征图和样本深层特征图输入初始目标残差相加处理层得到样本目标特征图；将样本目标特征图输入初始上采样层得到样本目标图像对应的细节增强后的高分辨率图像，基于样本目标图像及其对应的细节增强后的高分辨率图像构建损失函数，基于损失函数同时更新初始卷积层、初始注意力残差层、初始目标残差相加处理层以及初始上采样层的参数，直到训练满足预设条件，获取训练好的卷积层、注意力残差层、目标残差相加处理层以及上采样层。其中，预设条件可以是损失函数小于阈值、收敛，或训练周期达到阈值。在一些实施例中，可以基于训练样本，通过各种方法进行训练。例如，可以基于梯度下降法进行训练。

在一些实施例中，训练过程中，模型的损失函数为L＝MSE(lr，hr)，其中，L表示损失函数值，lr表示样本目标图像(为低分辨率图像)，hr表示样本目标图像对应的细节增强后的高分辨率图像，MSE为均方误差。

为了提取到目标图像的深层特征图，该混合注意力超分辨率网络模型中在卷积层之后包括设定数量的串联的注意力残差层，其中设定数量可以是60、64、62、65等数值，较佳的，设定数量为64。

该电子设备将卷积层输出的浅层特征图输入首个注意力残差层，顺序经过每个注意力残差层进行感知处理，将上一注意力残差层的输出特征图作为下一注意力残差层的输入特征图，得到最后一个注意力残差层输出的深层特征图。

图2为本发明实施例提供的一种图像处理的过程示意图，如图2所示，将目标图像(为低分辨率图像)输入到混合注意力神经网络模型的卷积层，并将卷积层输出的浅层特征图输入到首个注意力残差层，经过n个(n可以取60、64、62、65等数值，较佳的，n可以取64)注意力残差层的感知处理，得到最后一个注意力残差层输出的深层特征图，将深层特征图和浅层特征图输入到目标残差相加处理层，得到目标残差相加处理层输出的目标特征图并输入到上采样层，得到上采样层输出的高分辨率图像。

基于混合注意力超分辨率网络模型的目标残差相加处理层，将浅层特征图与深层特征图输入到目标残差相加处理层，根据浅层特征图与深层特征图中每个对应行列的像素点的像素值，将对应行列的像素点的像素值相加，得到残差相加处理后的目标特征图，基于混合注意力超分辨率网络模型的上采样层，将目标特征图输入到上采样层中，对目标图像进行上采样处理，得到上采样层输出的细节增强后的高分辨率图像。

由于在本发明实施例中，获取待处理的目标图像，基于预先训练完成的混合注意力超分辨网络模型的卷积层，对输入的目标图像进行卷积处理得到浅层特征图，通过模型中的设定数量的串联的注意力残差层，将浅层特征图顺序经过每个注意力残差层进行感知处理，由于设定数量的串联的注意力残差层构造出更深的网络，使得模型更加关注图像中的细节区域，更深的网络能准确地提取细节特征的深层特征图，深层特征图与浅层特征图的对应行列的像素点的像素值相加后输入到上采样层中，得到输出的细节增强后的高分辨率图像，从而解决了热成像图像中模糊细节区域的特征提取不准确的问题。

实施例2：

在一些实施例中，混合注意力超分辨网络模型可以包括设定数量的串联的注意力残差层，串连是指前一个注意力残差层的输出作为后一个注意力残差层的输入。

示例性的，设定数量(即前述的n值)可以为64，则混合注意力超分辨网络模型包括64个串联的注意力残差层，记为注意力残差层1、注意力残差层2、…、注意力残差层64，其中，卷积层输出的浅层特征图输入到注意力残差层1(即首个注意力残差层)，注意力残差层1的输出作为注意力残差层2的输入，…，注意力残差层63的输入作为注意力残差层64的输出，注意力残差层64的输出为深层特征图。

为了得到深层特征图，在上述实施例的基础上，在本发明实施例中，所述基于所述混合注意力超分辨网络模型中设定数量的串联的注意力残差层，将所述浅层特征图顺序经过每个注意力残差层进行感知处理，得到最后一个注意力残差层输出的深层特征图包括：

针对混合注意力超分辨网络模型的每个注意力残差层，若该注意力残差层为首个注意力残差层，则将卷积层输出的浅层特征图作为第一输入特征图输入该注意力残差层；若该注意力残差层非为首个注意力残差层，则获取该注意力残差层的上一注意力残差层输出的输出特征图，将输出特征图作为该注意力残差层的第一输入特征图。

该注意力残差层包括注意力层和残差相加处理层，将第一输入特征图输入到该注意力残差层的注意力层，基于注意力层对第一输入特征图进行感知处理，得到注意力层进行感知处理后输出的目标注意力特征图，将目标注意力特征图和第一输入特征图输入到该注意力残差层的残差相加处理层，根据输入该注意力残差层的残差相加处理层中的目标注意力特征图和第一输入特征图，确定目标注意力特征图和第一输入特征图中每个位置的像素点的像素值，将目标注意力特征图和第一输入特征图中对应行列的像素点的像素值相加，得到该注意力残差输出的输出特征图，若该注意力残差层非为最后一个注意力残差层，则将输出特征图作为下一注意力残差层的输入特征图，若该注意力残差层为最后一个注意力残差层，则将输出特征图作为最后一个注意力残差层输出的深层特征图。

在一些实施例中，注意力残差层包括注意力层和残差相加处理层。注意力层用于对第一输入特征图进行处理得到目标注意力特征图。残差相加处理层用于对输入的第一输入特征图和目标注意力特征图的对应行列的像素点的像素值进行相加得到输出特征图。注意力层的模型类型可以是Transformer模型等，残差相加处理层的模型类型可以是残差神经网络ResNet等。

在一些实施例中，注意力残差层可以分为首个注意力残差层和非首个注意力残差层。首个注意力残差层是指第一个对浅层特征图进行处理的注意力残差层，非首个注意力残差层是指除了首个注意力残差层外的其余注意力残差层。

首个注意力残差层的注意力层的输入包括浅层特征图(也称作当前注意力残差层的第一输入特征图)，首个注意力残差层的注意力层的输出包括首个注意力残差层的目标注意力特征图。首个注意力残差层的残差相加处理层的输入包括浅层特征图和首个注意力残差层的目标注意力特征图，首个注意力残差层的残差相加处理层的输出包括首个注意力残差层的输出特征图。

非首个注意力残差层的注意力层的输入包括上一注意力残差层输出的输出特征图(也称作当前注意力残差层的第一输入特征图)，非首个注意力残差层的注意力层的输出包括当前注意力残差层的目标注意力特征图。非首个注意力残差层的残差相加处理层的输入包括当前注意力残差层的目标注意力特征图和上一注意力残差层输出的输出特征图(也称作当前注意力残差层的第一输入特征图)，非首个注意力残差层的残差相加处理层的输出包括当前注意力残差层的输出特征图。

在一些实施例中，最后一个注意力残差层输出的输出特征图可以作为深层特征图输入目标残差相加处理层中，其中，最后一个注意力残差层是指其得到的输出特征图要进入目标残差相加处理层进一步处理的注意力残差层。

本说明书一些实施例中，通过在混合注意力超分辨网络模型中设置多个串联的注意力残差层，实现了在卷积层提取的浅层特征图的基础上结合每个注意力残差层处理得到的结果对目标图像进一步提取深层特征，使得模型可以更加关注目标图像中的细节部分，从而能够准确地提取细节特征，通过残差结果构造出更深的网络，有效提取深层特征，最终提高模型对目标图像细节的增强效果。

实施例3：

为了得到目标注意力特征图，在上述各实施例的基础上，在本发明实施例中，所述基于该注意力残差层的注意力层对第一输入特征图进行感知处理，得到感知处理后注意力层输出的目标注意力特征图包括：

基于该注意力残差层的注意力层的处理单元，根据所述第一输入特征图中每个像素点的像素值、以及所述注意力层中预先保存的局部二值模式(Local Binary Pattern，LBP)采样函数，将所述每个像素点的像素值输入所述LBP采样函数得到输出的LBP特征值矩阵并保存在所述注意力层中；

为了得到目标注意力特征图，在将第一输入特征图输入到该注意力残差层的注意力层后，首先将第一输入特征图输入到注意力层的处理单元，根据第一输入特征图中每个像素点的像素值、以及预先保存的LBP采样函数，将每个像素点的像素值输入到LBP采样函数中，得到每个像素点对应的LBP特征值，根据每个像素点对应的LBP特征值、以及每个像素点在第一输入特征图中所在行列，将每个像素点对应的LBP特征值作为LBP特征值矩阵中对应行列的元素点的元素值，从而得到LBP特征值矩阵并保存在注意力层中。

将第一输入特征图输入到注意力层的第一感知机单元，对第一输入特征图进行感知处理得到基于亮度的注意力特征图；将LBP特征值矩阵输入到注意力层的第二感知机单元，对LBP特征值矩阵进行感知处理得到基于梯度的注意力特征图，其中第一感知机单元和第二感知机单元是多层的且相互独立的。

将基于亮度的注意力特征图和基于梯度的注意力特征图输入到注意力层的融合层单元，对基于亮度的注意力特征图和基于梯度的注意力特征图进行融合处理，得到融合后的注意力特征图，将融合后的注意力特征图与第一输入特征图输入到注意力层的点乘处理单元，对融合后的注意力特征图与第一输入特征图进行点乘处理，即根据融合后的注意力特征图和第一输入特征图中每个位置的像素点的像素值，将融合后的注意力特征图中每一行列的像素点的像素值与第一输入特征图中对应行列的像素点的像素值相乘，得到目标注意力特征图中每一行列的像素点的像素值。

在一些实施例中，注意力层包括处理单元、第一感知机单元、第二感知机单元、融合层单元以及点乘处理单元。

处理单元用于对第一输入特征图提取特征值得到LBP特征值矩阵。处理单元的输入包括第一输入特征图，处理单元的输出包括LBP特征值矩阵。在一些实施例中，处理单元可以包括预先保存的LBP采样函数构成，LBP采样函数接收第一输入特征图中每个像素点的像素值作为输入，并输出第一输入特征图中每个像素点对应的LBP特征值，处理单元根据第一输入特征图中每个像素点对应的LBP特征值、以及第一输入特征图中每个像素点在第一输入特征图中所在行列，将第一输入特征图中每个像素点对应的LBP特征值作为LBP特征值矩阵中对应行列的元素点的元素值，从而得到LBP特征值矩阵。在一些实施例中，LBP采样函数可以选用多种模式，比如原始LBP特征、圆形LBP特征、等价模式等。

第一感知机单元用于对第一输入特征图提取基于亮度的注意力特征图。第一感知机单元的输入包括第一输入特征图，第一感知机单元的输出包括基于亮度的注意力特征图。第一感知机单元的模型类型可以是自注意力网络Non-local Networks(NLNet)等。

第二感知机单元用于对第一输入特征图提取基于梯度的注意力特征图。第二感知机单元的输入包括LBP特征值矩阵，第二感知机单元的输出包括基于梯度的注意力特征图。第二感知机单元的模型类型可以是梯度加权类激活映射Gradient-weighted Class Activation Mapping(Grad-CAM)等。

在一些实施例中，第一感知机单元和第二感知机单元是多层的且相互独立的。

融合层单元用于对基于亮度的注意力特征图和基于梯度的注意力特征图进行融合。融合层单元的输入包括基于亮度的注意力特征图和基于梯度的注意力特征图，融合层单元的输出包括融合后的注意力特征图。融合层单元的模型类型可以是Transformer模型等。

点乘处理单元用于对融合后的注意力特征图与第一输入特征图进行点乘处理，即根据融合后的注意力特征图和第一输入特征图中每个位置的像素点的像素值，将融合后的注意力特征图中每一行列的像素点的像素值与第一输入特征图中对应行列的像素点的像素值相乘，得到目标注意力特征图中每一行列的像素点的像素值。点乘处理单元的输入包括第一输入特征图和融合后的注意力特征图，点乘处理单元的输出包括目标注意力特征图。

本说明书一些实施例中，通过将第一输入特征图中每个像素点的像素值输入LBP采样函数得到输出的LBP特征值矩阵并保存在注意力层中；然后将第一输入特征图输入注意力层的第一感知机单元进行感知处理得到基于亮度的注意力特征图，将LBP特征值矩阵经过注意力层的第二感知机单元进行感知处理得到基于梯度的注意力特征图，然后将基于亮度的注意力特征图和基于梯度的注意力特征图进行融合处理，提取目标注意力特征图时同时考虑了亮度和梯度，使得目标注意力特征图提取的特征信息更加准确全面。

图3为本发明实施例提供的一种混合注意力神经网络模型的注意力层对第一输入特征图进行感知处理的过程示意图，如图3所示，将第一输入特征图经过第一多层感知机后输入到融合层，将第一输入特征图经过确定单元后得到LBP特征值矩阵，将LBP特征值矩阵经过第二多层感知机后输入到融合层，将融合层输出的融合特征图与第一输入特征图进行点乘处理得到输出的目标注意力特征图。

作为一种可能的实施方式，在本发明实施例中，还可以是该电子设备在获取到目标图像后，根据目标图像以及预先保存的LBP采样函数得到输出的LBP特征值矩阵并保存在每个注意力残差层的注意力层中。

下面通过一个具体的实施例对本发明的注意力层对第一输入特征图进行感知处理的过程进行说明，根据目标图像I以及LBP采样函数F_s，将目标图像的每个像素点的像素值输入到处理单元中的LBP采样函数，整合后得到LBP特征值矩阵Fea_Lbp，其中Fea_Lbp＝F_s(I)；将输入的第一输入特征图和LBP特征值矩阵分别输入两个独立的多层感知机(即第一感知机单元以及第二感知机单元)，经过多层感知机处理后输出基于亮度的注意力特征图Att_Luma和基于梯度的注意力特征图Att_Lbp，其中Att_Luma＝MLP_Luma(Fea_Luma)，Att_Lbp＝MLP_Lbpa(Fea_Lbp)，MLP_Luma和MLP_Lbpa分别表示两个独立的感知机，Fea_Luma表示第一输入特征图。

将两个注意力特征图在融合层进行融合，得到融合后的注意力特征图Att_Final，其中Att_Final＝F_Fus(Att_Lbp+Att_Luma)，其中F_Fus表示融合层；将融合后的注意力特征图与第一输入特征图进行点乘处理，得到添加注意力特征图的目标注意力特征图

实施例4：

为了提高特征提取的准确度，在上述各实施例的基础上，在本发明实施例中，每个注意力残差层还包括第一卷积层、第一激活层、第二卷积层和第二激活层，所述基于该注意力残差层的注意力层对第一输入特征图进行感知处理，得到感知处理后注意力层输出的目标注意力特征图之前，所述方法还包括：

为了提高特征提取的准确度，每个注意力残差层还可以包括第一卷积层、第一激活层、第二卷积层和第二激活层，在将第一输入特征图输入到该注意力残差层之后，将第一输入特征图经过第一卷积层进行卷积处理，将卷积处理后的第一输入特征图输入到第一激活层进行激活处理，将激活处理后的第一输入特征图输入到第二卷积层进行卷积处理，再将经过第二卷积层卷积处理后的第一输入特征图输入到第二激活层进行激活处理，得到第二激活层输出的第二输入特征图。

将第二输入特征图输入到该注意力残差层的注意力层进行感知处理，得到感知处理后注意力层输出的目标注意力特征图，基于该注意力残差层的残差相加处理层，将目标注意力特征图以及第一输入特征图的对应行列的像素点的像素值相加，得到该注意力残差层的输出特征图。

第一卷积层用于对第一输入特征图进行卷积处理。第一卷积层的输入包括第一输入特征图，第一卷积层的输出包括第一卷积特征图。第一卷积层的模型类型可以是卷积神经网络CNN等。

第一激活层用于对第一卷积特征图进行激活处理。第一激活层的输入包括第一卷积特征图，第一激活层的输出包括第一激活特征图。第一激活层可以通过各种激活函数实现，比如Sigmoid激活函数、双曲正切激活函数、ReLU激活函数等。

第二卷积层用于对第一激活特征图进行卷积处理。第二卷积层的输入包括第一激活特征图，第二卷积层的输出包括第二卷积特征图。第二卷积层的模型类型可以是卷积神经网络CNN等。

第二激活层用于对第二卷积特征图进行激活处理。第二激活层的输入包括第二卷积特征图，第二激活层的输出包括第二输入特征图。第二激活层可以通过各种激活函数实现，比如Sigmoid激活函数、双曲正切激活函数、ReLU激活函数等。

本说明书一些实施例中，通过将第一输入特征图经过两次卷积层和激活层的组合后提取的第二输入特征图输送到注意力层计算并添加注意力，通过添加注意力，使得目标注意力特征图和输出特征图可以更加关注图像中的细节从而提升对细节增强的能力。

图4为本发明实施例提供的一种注意力残差层提取输出特征图的过程示意图，如图4所示，将第一输入特征图经过卷积层、激活层、卷积层、激活层后得到第二输入特征图，将第二输入特征图输入到注意力层后得到目标注意力特征图，将目标注意力特征图和第一输入特征图进行残差相加处理，得到输出特征图。

实施例5：

图5为本发明实施例提供的一种图像处理装置的结构示意图，如图5所示，该装置包括：

获取模块501，用于获取待处理的目标图像；

处理模块502，用于基于预先训练完成的混合注意力超分辨网络模型的卷积层，对输入的所述目标图像进行卷积处理得到浅层特征图；基于所述混合注意力超分辨网络模型中设定数量的串联的注意力残差层，将所述浅层特征图顺序经过每个注意力残差层进行感知处理，得到最后一个注意力残差层输出的深层特征图，基于所述混合注意力超分辨网络模型的目标残差相加处理层，将所述浅层特征图与所述深层特征图的对应行列的像素点的像素值相加，得到处理后的目标特征图；基于所述混合注意力超分辨网络模型中的上采样层，将所述目标特征图输入到所述上采样层，得到输出的细节增强后的高分辨率图像。

进一步地，所述处理模块502，具体用于针对所述混合注意力超分辨网络模型中的每个注意力残差层，若该注意力残差层为首个注意力残差层，则将所述浅层特征图作为第一输入特征图输入该注意力残差层，若该注意力残差层非为首个注意力残差层，则将上一注意力残差层的输出特征图作为该注意力残差层的第一输入特征图；基于该注意力残差层的注意力层对第一输入特征图进行感知处理，得到感知处理后注意力层输出的目标注意力特征图，基于该注意力残差层的残差相加处理层，将所述目标注意力特征图以及所述第一输入特征图的对应行列的像素点的像素值相加，得到该注意力残差层的输出特征图，直到得到最后一个注意力残差层输出的深层特征图。

进一步地，所述处理模块502，具体用于基于该注意力残差层的注意力层的处理单元，根据所述第一输入特征图中每个像素点的像素值、以及所述注意力层中预先保存的局部二值模式LBP采样函数，将所述每个像素点的像素值输入所述LBP采样函数得到输出的LBP特征值矩阵并保存在所述注意力层中；将所述第一输入特征图输入所述注意力层的第一感知机单元进行感知处理得到基于亮度的注意力特征图，将所述LBP特征值矩阵经过所述注意力层的第二感知机单元进行感知处理得到基于梯度的注意力特征图，将两个注意力特征图输入所述注意力层的融合层单元进行融合处理得到融合后的注意力特征图，基于所述注意力层的点乘处理单元，将所述融合后的注意力特征图与所述第一输入特征图进行点乘处理得到输出的目标注意力特征图。

进一步地，每个注意力残差层还包括第一卷积层、第一激活层、第二卷积层和第二激活层，所述处理模块502，具体用于将所述第一输入特征图输入该注意力残差层的第一卷积层进行卷积处理、经过第一激活层进行激活处理、经过第二卷积层进行卷积处理，经过第二激活层进行激活处理得到第二输入特征图，并将所述第二输入特征图输入该注意力残差层的注意力层进行后续处理。

实施例6：

图6为本发明实施例提供的一种电子设备结构示意图，在上述各实施例的基础上，本申请还提供了一种电子设备，如图6所示，包括：处理器601、通信接口602、存储器603和通信总线604，其中，处理器601，通信接口602，存储器603通过通信总线604完成相互间的通信。

所述存储器603中存储有计算机程序，当所述程序被所述处理器601执行时，使得所述处理器601执行如下步骤：

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral Component Interconnect，PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture， EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口602用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选地，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述处理器可以是通用处理器，包括中央处理器、网络处理器(Network Processor，NP)等；还可以是数字指令处理器(Digital Signal Processing，DSP)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。

实施例7：

在上述各实施例的基础上，本申请还提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有可由处理器执行的计算机程序，当所述程序在所述处理器上运行时，使得所述处理器执行时实现如下步骤：

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

一种图像处理方法，其特征在于，所述方法包括：

获取待处理的目标图像，基于预先训练完成的混合注意力超分辨网络模型的卷积层，对输入的所述目标图像进行卷积处理得到浅层特征图；

基于所述混合注意力超分辨网络模型中设定数量的串联的注意力残差层，将所述浅层特征图顺序经过每个注意力残差层进行感知处理，得到最后一个注意力残差层输出的深层特征图，基于所述混合注意力超分辨网络模型的目标残差相加处理层，将所述浅层特征图与所述深层特征图的对应行列的像素点的像素值相加，得到处理后的目标特征图；基于所述混合注意力超分辨网络模型中的上采样层，将所述目标特征图输入到所述上采样层，得到输出的细节增强后的高分辨率图像。
根据权利要求1所述的方法，其特征在于，所述基于所述混合注意力超分辨网络模型中设定数量的串联的注意力残差层，将所述浅层特征图顺序经过每个注意力残差层进行感知处理，得到最后一个注意力残差层输出的深层特征图包括：

针对所述混合注意力超分辨网络模型中的每个注意力残差层，若该注意力残差层为首个注意力残差层，则将所述浅层特征图作为第一输入特征图输入该注意力残差层，若该注意力残差层非为首个注意力残差层，则将上一注意力残差层的输出特征图作为该注意力残差层的第一输入特征图；基于该注意力残差层的注意力层对第一输入特征图进行感知处理，得到感知处理后注意力层输出的目标注意力特征图，基于该注意力残差层的残差相加处理层，将所述目标注意力特征图以及所述第一输入特征图的对应行列的像素点的像素值相加，得到该注意力残差层的输出特征图，直到得到最后一个注意力残差层输出的深层特征图。
根据权利要求2所述的方法，其特征在于，所述基于该注意力残差层的注意力层对第一输入特征图进行感知处理，得到感知处理后注意力层输出的目标注意力特征图包括：

基于该注意力残差层的注意力层的处理单元，根据所述第一输入特征图中每个像素点的像素值、以及所述注意力层中预先保存的局部二值模式LBP采样函数，将所述每个像素点的像素值输入所述LBP采样函数得到输出的LBP特征值矩阵并保存在所述注意力层中；

将所述第一输入特征图输入所述注意力层的第一感知机单元进行感知处理得到基于亮度的注意力特征图，将所述LBP特征值矩阵经过所述注意力层的第二感知机单元进行感知处理得到基于梯度的注意力特征图，将两个注意力特征图输入所述注意力层的融合层单元进行融合处理得到融合后的注意力特征图，基于所述注意力层的点乘处理单元，将所述融合后的注意力特征图与所述第一输入特征图进行点乘处理得到输出的目标注意力特征图。
根据权利要求2所述的方法，其特征在于，每个注意力残差层还包括第一卷积层、第一激活层、第二卷积层和第二激活层，所述基于该注意力残差层的注意力层对第一输入特征图进行感知处理，得到感知处理后注意力层输出的目标注意力特征图之前，所述方法还包括：

将所述第一输入特征图输入该注意力残差层的第一卷积层进行卷积处理、经过第一激活层进行激活处理、经过第二卷积层进行卷积处理，经过第二激活层进行激活处理得到第二输入特征图，并将所述第二输入特征图输入该注意力残差层的注意力层进行后续处理。
一种图像处理装置，其特征在于，所述装置包括：

获取模块，用于获取待处理的目标图像；

处理模块，用于基于预先训练完成的混合注意力超分辨网络模型的卷积层，对输入的所述目标图像进行卷积处理得到浅层特征图；基于所述混合注意力超分辨网络模型中设定数量的串联的注意力残差层，将所述浅层特征图顺序经过每个注意力残差层进行感知处理，得到最后一个注意力残差层输出的深层特征图，基于所述混合注意力超分辨网络模型的目标残差相加处理层，将所述浅层特征图与所述深层特征图的对应行列的像素点的像素值相加，得到处理后的目标特征图；基于所述混合注意力超分辨网络模型中的上采样层，将所述目标特征图输入到所述上采样层，得到输出的细节增强后的高分辨率图像。
根据权利要求5所述的装置，其特征在于，所述处理模块，具体用于针对所述混合注意力超分辨网络模型中的每个注意力残差层，若该注意力残差层为首个注意力残差层，则将所述浅层特征图作为第一输入特征图输入该注意力残差层，若该注意力残差层非为首个注意力残差层，则将上一注意力残差层的输出特征图作为该注意力残差层的第一输入特征图；基于该注意力残差层的注意力层对第一输入特征图进行感知处理，得到感知处理后注意力层输出的目标注意力特征图，基于该注意力残差层的残差相加处理层，将所述目标注意力特征图以及所述第一输入特征图的对应行列的像素点的像素值相加，得到该注意力残差层的输出特征图，直到得到最后一个注意力残差层输出的深层特征图。
根据权利要求6所述的装置，其特征在于，所述处理模块，具体用于基于该注意力残差层的注意力层的处理单元，根据所述第一输入特征图中每个像素点的像素值、以及所述注意力层中预先保存的局部二值模式LBP采样函数，将所述每个像素点的像素值输入所述LBP采样函数得到输出的LBP特征值矩阵并保存在所述注意力层中；将所述第一输入特征图输入所述注意力层的第一感知机单元进行感知处理得到基于亮度的注意力特征图，将所述LBP特征值矩阵经过所述注意力层的第二感知机单元进行感知处理得到基于梯度的注意力特征图，将两个注意力特征图输入所述注意力层的融合层单元进行融合处理得到融合后的注意力特征图，基于所述注意力层的点乘处理单元，将所述融合后的注意力特征图与所述第一输入特征图进行点乘处理得到输出的目标注意力特征图。
根据权利要求6所述的装置，其特征在于，每个注意力残差层还包括第一卷积层、第一激活层、第二卷积层和第二激活层，所述处理模块，具体用于将所述第一输入特征图输入该注意力残差层的第一卷积层进行卷积处理、经过第一激活层进行激活处理、经过第二卷积层进行卷积处理，经过第二激活层进行激活处理得到第二输入特征图，并将所述第二输入特征图输入该注意力残差层的注意力层进行后续处理。
一种电子设备，其特征在于，包括：处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

所述存储器中存储有计算机程序，当所述程序被所述处理器执行时，使得所述处理器执行权利要求1-4任一项所述图像处理方法的步骤。
一种计算机可读存储介质，其特征在于，其存储有可由处理器执行的计算机程序，当所述程序在所述处理器上运行时，使得所述处理器执行权利要求1-4任一项所述图像处理方法的步骤。