CN113592736A

CN113592736A - 一种基于融合注意力机制的半监督图像去模糊方法

Info

Publication number: CN113592736A
Application number: CN202110851387.1A
Authority: CN
Inventors: 张笑钦; 曹少丽; 徐曰旺; 王涛
Original assignee: Wenzhou University
Current assignee: Wenzhou University
Priority date: 2021-07-27
Filing date: 2021-07-27
Publication date: 2021-11-02
Anticipated expiration: 2041-07-27
Also published as: CN113592736B

Abstract

本发明提供了一种基于融合注意力机制的半监督图像去模糊方法，包括：步骤Step1:获取图像训练数据集，并将所述图像训练数据集划分为两个训练子集；步骤Step2:构建基于全监督和无监督的图像模糊还原模型，所述图像模糊还原模型包括全监督网络和无监督网络；步骤Step3:将所述一个子集输入待训练的全监督网络进行学习，将所述另一子集输入待训练的无监督网络；步骤Step4:利用上述网络中的注意力机制筛选图像特征，对网络提取的特征信息分配相应的权重，获取重要的图像信息，并对所述重要的图像信息进行特征融合，得到最终的清晰图像，本发明通过将注意力机制和神经网络相结合，搭建针对运动模糊图像复原的网络模型，实现了对模糊图像有效、精准的复原。

Description

一种基于融合注意力机制的半监督图像去模糊方法

技术领域

本发明涉及计算机视觉图像复原技术领域，具体涉及到一种基于融合注意力机制的半监督图像去模糊方法。

背景技术

图像是人类视觉的基础，包含大量信息元素，是人们获取交流信息的重要途径。近几年来，在图像的获取过程中，由于物体运动、相机抖动等原因，可能会存在细节丢失，导致图像不能正确传递信息，影响图像的质量，进而影响图像后续的分析识别工作，例如目标识别、目标跟踪等。在日常生活中，随着智能手机、相机等摄影设备的普及，图像成为人们记录生活、传递信息的重要方式。而人们在拍摄时难以保持设备的稳定，容易导致图像产生运动模糊，影响图像质量。而在公共安全领域，图像模糊还原也占据十分重要的地位，例如电子眼抓拍违规车辆、公共区域的监控等等。图像模糊还原对于实时性要求高的行业也十分重要，例如在生产检测过程中，采用实时性较高的去模糊算法可以在物体运动时采集图像进行处理，大大提高物体生产线效率。因此，在图像模糊还原中，算法的效率和场景的应用十分重要，它已然成为近几年来计算机视觉和图像处理等领域的一个研究重点，不仅具有重要的理论意义，而且在实际应用中也有迫切需求。

随着深度学习和卷积神经网络的发展，为图像去模糊的研究和发展提供了新的思路和方向。越来越多的去模糊算法被提出，但是效果好的算法普遍存在时间复杂度高的问题，提高算法的运行效率是未来工作的一大重点。另外，训练神经网络所采用的模糊数据集对还原的结果有着直接的影响，但是目前开源的模糊数据集种类、数量都较少，算法很难推广到真实场景的图像去模糊。因此这也是迫切需要解决的问题。

综上所述，提供一种能够处理由运动产生的图像模糊，且还原效果好，计算成本低，且能有效地提高还原效率的基于融合注意力机制的半监督图像去模糊方法，是本领域技术人员急需解决的问题。

发明内容

本方案针对上文提到的问题和需求，提出一种基于融合注意力机制的半监督图像去模糊方法，其由于采取了如下技术方案而能够解决上述技术问题。

为实现上述目的，本发明提供如下技术方案：一种基于融合注意力机制的半监督图像去模糊方法，包括以下步骤：步骤Step1: 获取图像训练数据集，并将所述图像训练数据集划分为两个训练子集，所述两个训练子集中一个子集包括多个图像对，每个图像对由模糊图像及其对应的清晰图像组成，另一子集包括多个模糊图像；

步骤Step2:构建基于全监督和无监督的图像模糊还原模型，所述图像模糊还原模型包括全监督网络和无监督网络；

步骤Step3:将所述一个子集输入待训练的全监督网络进行学习，根据全监督网络生成器的输出结果及对应的Ground-truth清晰图像，由判别器鉴定图像为真或假的概率，将所述另一子集输入待训练的无监督网络，根据无监督网络的输出结果生成去模糊后图像。

步骤Step4:利用上述网络中的注意力机制筛选图像特征，对网络提取的特征信息分配相应的权重，获取重要的图像信息，并对所述重要的图像信息进行特征融合，得到最终的清晰图像。

进一步地，所述全监督网络包括第一生成器和判别器，所述第一生成器包括第一编码器-解码器网络，所述判别器包括二分类器，将所述一个子集中的模糊图像输入所述第一生成器生成去模糊图像，并将所述去模糊图像与对应清晰图像输入所述判别器，判断图像为真或图像为假的概率。

更进一步地，所述无监督网络包括第二生成器，所述第二生成器包括第二编码器-解码器网络，所述第二编码器-解码器网络与所述第一编码器-解码器网络结构相同，将所述另一子集中的模糊图像输入所述第二生成器生成去模糊后的图像，根据损失函数计算损失，并利用反向传播更新网络参数，优化网络。

更进一步地，图像去模糊过程包括：a.将模糊输入图像X_in分割成四个不重叠的图像块，将所述四个不重叠的图像块通过编码器层得到的四个特征映射进行两两特征连接，记为X_{encoder_1}，将X_{encoder_1}输入解码器层得到两个特征映射X_{decoder_1}，将X_{decoder_1}进行特征连接生成图像X_{out_1}；b.然后将模糊输入图像X_in分割成两个不重叠的图像块，并将所述两个不重叠的图像块和所述图像X_{out_1}进行相加后输入编码器层，得到两个特征映射，将所述两个特征映射和所述特征 X_{encoder_1}进行特征相加和特征连接，获得特征映射X_{encoder_2}；将X_{encoder_2}输入解码器层生成去模糊图X_{out_2}；c.将模糊输入图像X_in和所述去模糊图像X_{out_2}进行相加后输入编码器层后，将编码器层的输出结果和所述特征映射X_{encoder_2}相加后输入解码器层，最终生成清晰图像 X_{out_3}。

更进一步地，所述第一编码器-解码器网络包括编码器层和对应的解码器层；

所述编码器层包括卷积层和残差块，输入图像的大小经过裁剪之后，长和宽分别是8的倍数，编码器层首先由步长为1，填充为 3的7×7卷积处理，获取更多的图像全局特征，并且利用残差块提取更精细的模糊图像细节；然后设置一个5×5的卷积处理，进行下采样后通过残差块处理特征；最后进行一个3×3卷积操作和残差块，得到图像的不同图像块之间的特征，进行连接处理后，进入解码器层；

所述解码器层有三个尺度与编码器一一对应，前两个尺度是由残差块和转置卷积层组成，最后一个是由残差块和卷积层组成，前两个转置卷积层后添加一个非线性ReLU层作为激活函数，最后一个卷积层跟着Tanh函数作为激活函数，其中，利用残差块提取图像特征进行恢复，两次步长为2、卷积核4×4为的转置卷积进行上采样操作，恢复图像尺寸。

更进一步地，所述编码器层和所述解码器层之间设置有跳跃连接结构，跳跃连接结构使所述编码器层中的每个尺度残差块与所述解码器层中的残差块一一对应。

更进一步地，所述残差块的注意力机制包括通道注意力机制和空间注意力机制，输入特征图x_in，通过通道注意力机制，获取不同通道重要的特征，对图像重要的特征进行提取；输入特征图x_in，通过空间注意力机制，对图像不同位置的特征进行提取，加强对图像细节信息的提取；然后将通道注意力和空间注意力得到的特征进行融合，生成特征图x_out。

更进一步地，所述通过通道注意力机制，获取不同通道重要的特征包括：输入特征图x_in，分别采用全局最大池化和全局平均池化，输出图像两个不同的特征；将两个的特征分别通过1×1卷积和ReLU 激活函数，最后所生成的特征按通道进行相加，生成特征图x_{add_c}；将特征图x_{add_c}通过1×1卷积和sigmoid激活函数将特征映射到(0,1) 区间，得到每个通道的权重值w_c；将输入的特征图x_in和通道权重w_c进行像素级相乘，生成输出x_out_{_c}。

更进一步地，通过空间注意力机制，对图像不同位置的特征进行提取包括：输入特征图x_in，通过1×1卷积之后沿着通道维度分别采用最大池化和平均池化，得到两个特征并将其进行通道合并生成 x_{cat_s}；将x_{cat_s}通过1×1卷积操作压缩通道，并使用sigmoid激活函数，生成空间注意力图，即像素权重w_s；将输入的特征图x_in和像素权重w_s进行像素级相乘，即为输出x_{out_s}，将x_{out_c}和x_{out_s}进行特征融合得到 x_out。

从上述的技术方案可以看出，本发明的有益效果是：与现有技术相比，本发明通过基于无监督网络和有监督网络的两个分支学习仿真生成数据和真实数据之间的关系，进而推广到真实场景的图像去模糊；该方法应用多图像块层次结构做为基础模型，避免了网络深度级联带来的计算负担，提高了学习效率和处理速度；网络的生成器利用残差块和注意力模块的结合，能够很好地解决深度神经网络的退化问题，使得信息前后的传播更加顺畅，加快模型的收敛速度；同时利用注意力机制，对图像有效的特征进行筛选，加强对重点特征的关注，增强网络的表达能力。

除了上面所描述的目的、特征和优点之外，下文中将结合附图对实施本发明的最优实施例进行更详尽的描述，以便能容易地理解本发明的特征和优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下文将对本发明实施例或现有技术描述中所需要使用的附图作简单地介绍，其中，附图仅仅用于展示本发明的一些实施例，而非将本发明的全部实施例限制于此。

图1为本发明一种基于融合注意力机制的半监督图像去模糊方法的具体步骤示意图。

图2为本实施例中图像模糊还原模型的网络结构示意图.

图3为本发明中通道注意力机制的结构示意图。

图4为本发明中空间注意力机制的结构示意图。

图5为本发明中注意力机制的结构示意图。

图6为本发明中残差块的结构示意图。

具体实施方式

为了使得本发明的技术方案的目的、技术方案和优点更加清楚，下文中将结合本发明具体实施例的附图，对本发明实施例的技术方案进行清楚、完整地描述。附图中相同的附图标记代表相同的部件。需要说明的是，所描述的实施例是本发明的一部分实施例，而不是全部的实施例。基于所描述的本发明的实施例，本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请的主要目的是利用融合注意力机制的半监督图像去模糊算法推广到真实场景的图像运动模糊还原。具体包括利用通道注意力和空间注意力增强网络提取有效信息，削弱无用信息，提高网络的表达能力，实现对运动图像的高效、精准复原，本申请中的模型能够较好地处理由运动产生的图像模糊，得到高质量的清晰复原图，如图1至图6所示，该方法包括：步骤Step1:获取图像训练数据集，并将所述图像训练数据集划分为两个训练子集，所述两个训练子集中一个子集包括多个图像对，每个图像对由模糊图像及其对应的清晰图像组成，另一子集包括多个模糊图像；

步骤Step2:构建基于全监督和无监督的图像模糊还原模型，所述图像模糊还原模型包括全监督网络和无监督网络。

具体地，所述全监督网络包括第一生成器和判别器，所述第一生成器包括第一编码器-解码器网络，所述判别器包括二分类器，将所述一个子集中的模糊图像输入所述第一生成器生成去模糊图像，并将所述去模糊图像与对应清晰图像输入所述判别器，判断图像为真或图像为假的概率。

所述无监督网络包括第二生成器，所述第二生成器包括第二编码器-解码器网络，所述第二编码器-解码器网络与所述第一编码器-解码器网络结构相同，将所述另一子集中的模糊图像输入所述第二生成器生成去模糊后的图像，根据损失函数计算损失，并利用反向传播更新网络参数，优化网络。

在本实施例中，全监督网络利用生成式对抗网络，通过生成器和判别器，通过训练全监督网络的生成器能够生成更加真实的图像，让判别器识别不了这是“假”的图像；而判别器尽可能识别输入图像的真假，以此使得生成器能够不断优化。而所述的全监督分支和无监督分支的网络结构，除了全监督分支多了一个判别器之外，其他结构都是一样的，故利用权重共享同时优化无监督网络。

如图2所示，全监督网络和无监督网络这两个分支均采用多图像块层次结构(multi-patch hierarchy architecture)进行图像去模糊处理，一共包括三个级别：包括第一级别(stage_1)、第二级别(stage_2)和第三级别(stage_3)，具体地为，第一级别：a.将模糊输入图像X_in分割成四个不重叠的图像块(patch)，将所述四个不重叠的图像块通过编码器层得到的四个特征映射进行两两特征连接(concatenation)，记为X_{encoder_1}，将X_{encoder_1}输入解码器层得到两个特征映射X_{decoder_1}，将X_{decoder_1}进行特征连接(concatenation)生成图像X_{out_1}；第二级别：b.然后将模糊输入图像X_in分割成两个不重叠的图像块，并将所述两个不重叠的图像块和所述图像X_{out_1}进行相加(addition)后输入编码器层，得到两个特征映射，将所述两个特征映射和所述特征X_{encoder_1}进行特征相加(addition)和特征连接(concatenation)，获得特征映射X_{encoder_2}；将X_{encoder_2}输入解码器层生成去模糊图X_{out_2}；第三级别：c.将模糊输入图像X_in和所述去模糊图像X_{out_2}进行相加 (addition)后输入编码器层后，将编码器层的输出结果和所述特征映射X_{encoder_2}相加(addition)后输入解码器层，最终生成清晰图像X_{out_3}。无监督网络的去模糊过程与全监督网络的去模糊过程相同。对应分支的每个级别都是由编码器-解码器构成。

在本实施例中，所述第一编码器-解码器网络包括编码器层和对应的解码器层；所述编码器层包括卷积层和残差块，输入图像的大小经过裁剪之后，长和宽分别是8的倍数，编码器层首先由步长为1，填充为3的7×7卷积处理，获取更多的图像全局特征，并且利用残差块提取更精细的模糊图像细节；然后设置一个5×5的卷积处理，进行下采样后通过残差块处理特征；最后进行一个3×3卷积操作和残差块，得到图像的不同图像块之间的特征，进行连接处理后，进入解码器层；所述解码器层有三个尺度与编码器一一对应，前两个尺度是由残差块和转置卷积层组成，最后一个是由残差块和卷积层组成，前两个转置卷积层后添加一个非线性ReLU层作为激活函数，最后一个卷积层跟着Tanh函数作为激活函数，其中，利用残差块提取图像特征进行恢复，两次步长为2、卷积核4×4为的转置卷积进行上采样操作，恢复图像尺寸。

在本实施例中，为利用编码器所提取的特征，将信息流传递给解码器，所述的编码器-解码器体系具有跳跃连接结构，所述编码器层和所述解码器层之间设置有跳跃连接结构，跳跃连接结构使所述编码器层中的每个尺度残差块与所述解码器层中的残差块一一对应，该结构同时有助于梯度的反向传播，加快训练过程。

步骤Step4:利用上述网络中的注意力机制筛选图像特征，对网络提取的特征信息分配相应的权重，获取重要的图像信息，并对所述重要的图像信息进行特征融合，得到最终的清晰图像。注意力机制能够获取图像任务中需要重点关注的目标领域，得到注意力焦点，而后对这一区域投入更多的注意力，以获取更多所需要关注的目标细节信息，抑制其他无用信息。

具体地，如图5所示，所述注意力机制包括通道注意力机制和空间注意力机制，输入特征图x_in，通过通道注意力机制，获取不同通道重要的特征，对图像重要的特征进行提取；输入特征图x_in，通过空间注意力机制，对图像不同位置的特征进行提取，加强对图像细节信息的提取；然后将通道注意力和空间注意力得到的特征进行融合，生成特征图x_out。其中，输入特征图x_in是残差块中输入input 经过第一个卷积层+ReLU层之后得到的特征图。

所述通过通道注意力机制，获取不同通道重要的特征包括：输入特征图x_in，分别采用全局最大池化和全局平均池化，输出图像两个不同的特征；将两个的特征分别通过1×1卷积和ReLU激活函数，最后所生成的特征按通道进行相加，生成特征图x_{add_c}；将特征图x_{add_c}通过1×1卷积和sigmoid激活函数将特征映射到(0,1)区间，得到每个通道的权重值w_c；将输入的特征图x_in和通道权重w_c进行像素级相乘，生成输出x_{out_c}。

如图3所示，在本实施例中，将输入的特征图x_in∈R^C×H×W(其中 C、H、W分别表示通道数、高度和宽度)分别采用全局最大池化 (Global Max Pooling,GMP)和全局平均池化(Global Average Pooling,GAP),得到图像两个不同的特征，分别表示为x_{max_c}∈R^C×1×1和x_{average_c}∈R^C×1×1；将两个特征x_{max_c}∈R^C×1×1和x_{average_c}∈R^C×1×1分别经过一层1×1 卷积层和ReLU激活函数，得到两个新的特征，将其进行像素级相加(addition)，生成特征图x_{add_c}∈R^C ^×1×1；将特征图x_{add_c}∈R^C×1×1通过1×1 卷积和sigmoid激活函数将特征映射到(0，1)区间，得到每个通道的权重值w_c；将输入的特征图x_in∈R^C×H×W和通道权重系数w_c相乘，生成特征图x_{out_c}∈R^C×H×W

通过空间注意力机制，对图像不同位置的特征进行提取包括：输入特征图x_in，通过1×1卷积之后沿着通道维度分别采用最大池化和平均池化，得到两个特征并将其进行通道合并生成x_{cat_s}；将x_{cat_s}通过1×1卷积操作压缩通道，并使用sigmoid激活函数，生成空间注意力图，即像素权重w_s；将输入的特征图x_in和像素权重w_s进行像素级相乘，即为输出x_{out_s}，将x_{out_c}和x_out_{_s}进行特征融合得到x_out。

如图4所示，在本实施例中，将输入的特征图x_in∈R^C×H×W通过 1×1卷积处理之后沿着通道维度分别采用最大池化(Max Pooling)和平均池化(Average Pooling)，得到两个特征图x_{max_s}∈R^1×H×W和 x_{mean_s}∈R^1×H×W；将两个特征图x_{max_s}∈R^1×H×W和x_{mean_s}∈R^1×H×W在通道维度上拼接，生成特征x_{cat_s}∈R^2×H×W。利用1×1卷积对x_{cat_s}∈R^2×H×W进行通道压缩，压缩后的特征图为x_{cat_s}∈R^1×H×W；将x_{cat_s}∈R^1×H×W通过sigmoid激活函数，生成空间注意力图，即像素权重w_s；将输入特征图x_in∈R^C×H×W和权重系数w_s相乘，生成特征图x_{out_s}∈R^C×H×W。最后将通道注意和空间注意生成的特征图x_{out_c}∈R^C×H×W、x_{out_s}∈R^C×H×W进行融合操作，生成特征x_out∈R^C ^×H×W。如图6所示，在本模型中，残差块是由一个卷积层 (包含一层ReLU激活函数)、注意力模块和一个卷积构成。首先输入特征图为Y_in∈R^C×H×W,经过一层卷积和ReLU激活函数后输出特征；随后特征进入注意力模块和卷积层，生成的特征图Y_{out_att}∈R^C×H×W；最后将Y_in∈R^C×H×W和Y_{out_att}∈R^C×H×W通过恒等映射即为残差块的输出特征 Y_out∈R^C×H×W。

在本实施例中，实验数据集采用GoPro数据集，一共由2103 对模糊和清晰图像训练数据和1111对测试数据组成，拍摄于各种场景，包含主要的前景物体运动和相机运动。

在本方法中，全监督分支损失函数功能如下：

均方误差(Mean Squared Error,MSE)损失：计算网络输出的复原图像与Ground-truth清晰图像之间的差异，使得网络生成的图像在内容上尽量接近Ground-truth清晰图像；

MSE损失函数表达式如下：

其中N表示样本个数，y_i表示Ground-truth清晰图像，

表示复原图像。

感知损失(Perceptual Loss)：比较网络的输出图像和 Ground-truth图像之间的语义差异，使得网络生成的图像更加符合人类视觉上真实的复原图像；

感知损失函数表达式如下:

其中

表示预训练的神经网络，j表示网络的第j层，y_i和

分别表示Ground-truth清晰图像和复原图像。

对抗损失(Adversarial Loss)：使得生成器和判别器达到平衡，网络能够生成视觉上更加清晰且逼真的图像。

对抗损失函数表达式如下：

其中

是二分类判别器，G(y)表示生成器产生的“假”图像，

表示对应图像对中的Ground-truth清晰图像。

无监督分支

仅使用真实模糊图像训练，利用传统先验约束转化为无标签损失函数，以训练网络的无监督分支，更新参数；

总变分损失(Total Variation loss)：用来去除生成图像中的伪影，保留结构信息和边界；

总变分损失函数表达式如下：

其中x_i，j表示图像素第(i，j)位置。

应当说明的是，本发明所述的实施方式仅仅是实现本发明的优选方式，对属于本发明整体构思，而仅仅是显而易见的改动，均应属于本发明的保护范围之内。

Claims

1.一种基于融合注意力机制的半监督图像去模糊方法，其特征在于，包括以下步骤：

步骤Step1:获取图像训练数据集，并将所述图像训练数据集划分为两个训练子集，所述两个训练子集中一个子集包括多个图像对，每个图像对由模糊图像及其对应的清晰图像组成，另一子集包括多个模糊图像；

步骤Step3:将所述一个子集输入待训练的全监督网络进行学习，根据全监督网络生成器的输出结果及对应的Ground-truth清晰图像，由判别器鉴定图像为真或假的概率，将所述另一子集输入待训练的无监督网络，根据无监督网络的输出结果生成去模糊后图像；

2.如权利要求1所述的基于融合注意力机制的半监督图像去模糊方法，其特征在于，所述全监督网络包括第一生成器和判别器，所述第一生成器包括第一编码器-解码器网络，所述判别器包括二分类器，将所述一个子集中的模糊图像输入所述第一生成器生成去模糊图像，并将所述去模糊图像与对应清晰图像输入所述判别器，判断图像为真或图像为假的概率。

3.如权利要求2所述的基于融合注意力机制的半监督图像去模糊方法，其特征在于，所述无监督网络包括第二生成器，所述第二生成器包括第二编码器-解码器网络，所述第二编码器-解码器网络与所述第一编码器-解码器网络结构相同，将所述另一子集中的模糊图像输入所述第二生成器生成去模糊后的图像，根据损失函数计算损失，并利用反向传播更新网络参数，优化网络。

4.如权利要求3所述的基于融合注意力机制的半监督图像去模糊方法，其特征在于，图像去模糊过程包括：a.将模糊输入图像X_in分割成四个不重叠的图像块，将所述四个不重叠的图像块通过编码器层得到的四个特征映射进行两两特征连接，记为X_{encoder_1}，将X_{encoder_1}输入解码器层得到两个特征映射X_{decoder_1}，将X_{decoder_1}进行特征连接生成图像X_{out_1}；b.然后将模糊输入图像X_in分割成两个不重叠的图像块，并将所述两个不重叠的图像块和所述图像X_{out_1}进行相加后输入编码器层，得到两个特征映射，将所述两个特征映射和所述特征X_{encoder_1}进行特征相加和特征连接，获得特征映射X_{encoder_2}，将X_{encoder_2}输入解码器层生成去模糊图X_{out_2}；c.将模糊输入图像X_in和所述去模糊图像X_{out_2}进行相加后输入编码器层后，将编码器层的输出结果和所述特征映射X_{encoder_2}相加后输入解码器层，最终生成清晰图像X_{out_3}。

5.如权利要求4所述的基于融合注意力机制的半监督图像去模糊方法，其特征在于，所述第一编码器-解码器网络包括编码器层和对应的解码器层；

所述编码器层包括卷积层和残差块，输入图像的大小经过裁剪之后，长和宽分别是8的倍数，编码器层首先由步长为1，填充为3的7×7卷积处理，获取更多的图像全局特征，并且利用残差块提取更精细的模糊图像细节；然后设置一个5×5的卷积处理，进行下采样后通过残差块处理特征；最后进行一个3×3卷积操作和残差块，得到图像的不同图像块之间的特征，进行连接处理后，进入解码器层；

6.如权利要求5所述的基于融合注意力机制的半监督图像去模糊方法，其特征在于，所述编码器层和所述解码器层之间设置有跳跃连接结构，跳跃连接结构使所述编码器层中的每个尺度残差块与所述解码器层中的残差块一一对应。

7.如权利要求6所述的基于融合注意力机制的半监督图像去模糊方法，其特征在于，所述残差块的注意力机制包括通道注意力机制和空间注意力机制，输入特征图x_in，通过通道注意力机制，获取不同通道重要的特征，对图像重要的特征进行提取；输入特征图x_in，通过空间注意力机制，对图像不同位置的特征进行提取，加强对图像细节信息的提取；然后将通道注意力和空间注意力得到的特征进行融合，生成特征图x_out。

8.如权利要求7所述的基于融合注意力机制的半监督图像去模糊方法，其特征在于，所述通过通道注意力机制，获取不同通道重要的特征包括：输入特征图x_in，分别采用全局最大池化和全局平均池化，输出图像两个不同的特征；将两个的特征分别通过1×1卷积和ReLU激活函数，最后所生成的特征按通道进行相加，生成特征图x_{add_c}；将特征图x_{add_c}通过1×1卷积和sigmoid激活函数将特征映射到(0,1)区间，得到每个通道的权重值w_c；将输入的特征图x_in和通道权重w_c进行像素级相乘，生成输出x_{out_c}。

9.如权利要求7所述的基于融合注意力机制的半监督图像去模糊方法，其特征在于，所述通过空间注意力机制，对图像不同位置的特征进行提取包括：输入特征图x_in，通过1×1卷积之后沿着通道维度分别采用最大池化和平均池化，得到两个特征并将其进行通道合并生成x_{cat_s}；将x_{cat_s}通过1×1卷积操作压缩通道，并使用sigmoid激活函数，生成空间注意力图，即像素权重w_s；将输入的特征图x_in和像素权重w_s进行像素级相乘，即为输出x_{out_s}，将x_{out_c}和x_{out_s}进行特征融合得到x_out。