WO2023082162A1

WO2023082162A1 - 图像处理方法和装置

Info

Publication number: WO2023082162A1
Application number: PCT/CN2021/130201
Authority: WO
Inventors: 林永兵; 张培科; 马莎; 万蕾
Original assignee: 华为技术有限公司
Priority date: 2021-11-12
Filing date: 2021-11-12
Publication date: 2023-05-19

Abstract

本申请实施例提供了一种图像处理的方法，该方法包括：获取重建图像和重建图像的标准图像，重建图像为根据第一图像重建得到的图像，第一图像为标准图像经过压缩得到的图像；将重建图像和标准图像输入单层卷积神经网络，以得到重建图像的特征图和标准图像的特征图，单层卷积神经网络为预训练模型的第一层卷积层，预训练模型为预先训练好的卷积神经网络；获取重建图像的特征图相对于标准图像的特征图的失真度。本申请实施例的图像处理的方法，用于获取重建图像和原始图像的失真度，以评价重建图像的质量，从而指导优化编码器和/或解码器。

Description

图像处理方法和装置

技术领域

本申请实施例涉及图像处理领域，并且更具体地，涉及一种图像处理方法和装置。

背景技术

摄像头具有分辨率高、非接触、使用方便、成本低廉等特点，在环境感知领域具有广泛应用。例如在自动驾驶领域，越来越多的摄像头安装到车辆上，以实现无盲点覆盖和机器视觉的人工智能(artificial intelligence，AI)车辆。随着摄像头分辨率、帧率和采样深度的不断提高，摄像头输出的视频对传输带宽需求越来越大，为了缓解传输网络的压力，图1示出了一种现有的解决方案的示意性框图，如图1所示，摄像头输出的贝叶尔原始(bayer raw)图像或视频往往具有较高的精度，对传输带宽的要求较高，例如对于帧率为30fps、采样深度为16bitdepth、分辨率为4K的超高清(ultra high definition，UHD)视频，其带宽需求高达4Gbps(4K*2K*30*16)，因此为了缓解传输网络的压力，在将贝叶尔原始图像或视频传输给移动数据计算平台(mobile data center，MDC)之前，需要对图像或视频进行压缩处理，同时需要对图像或视频进行图像信号处理(image signal processing，ISP)，以此来降低带宽需求，以便无需升级现有的网络带宽即可开展高清视频的业务。为了满足现有的带宽需求，需要对摄像头输出的贝叶尔原始图像或视频进行较高压缩率的压缩，这往往会采用有损图像或视频的压缩技术，因此不可避免地会导致图像或视频质量损伤，同时ISP处理也会导致图像或视频的信息受损。经过编码器压缩处理和ISP处理得到的RGB图像被传输到MDC中进行图像重建，图像重建由解码器进行，重建的图像的质量好坏对于后续的任务例如目标检测和语义分割等任务中具有关键意义，因此解码器重建得到的图像具有较高质量则尤为重要。然而，由于经过压缩处理和ISP处理得到的RGB图像有损伤，重建图像质量无法保障，因此亟需一种方法来确定重建图像与原图像的失真度，从而评价重建图像的质量，并根据评价结果对解码器进行优化，以保证解码器在实际应用中输出的重建图像具有较高质量。

发明内容

本申请实施例提供一种图像处理的方法，用于获取重建图像和原始图像的失真度以评价重建图像的质量，从而指导优化编码器和/或解码器。

第一方面，提供了一种图像处理的方法，该方法包括：获取重建图像和重建图像的标准图像，重建图像为根据第一图像重建得到的图像，第一图像为标准图像经过压缩得到的图像；将重建图像和标准图像输入单层卷积神经网络，以得到重建图像的特征图和标准图像的特征图，单层卷积神经网络的参数来自于预训练模型的第一层卷积层的参数，预训练模型为预先训练好的卷积神经网络；获取重建图像的特征图相对于标准图像的特征图的失真度。

本申请实施例中，由于预训练模型本是针对机器任务训练，因此使用来自预训练模型的单层卷积神经网络提取图像特征，可以更好地适配机器视觉任务；初始卷积层往往提取图像的底层通用特征，本申请实施例的单层卷积神经网络为预训练模型的第一层卷积层，使用该单层卷积神经网络提取的图像特征也为底层通用特征，针对底层通用特征优化得到的编码解码器可以适配多种任务场景，提高多任务泛化能力；另外相较于现有技术中使用完整的神经网络对图像进行处理，本申请实施例中使用单层卷积神经网络只需进行单层卷积计算，降低了计算复杂度，同时降低了对于硬件的算力要求。

结合第一方面，在第一方面的某些实现方式中，单层卷积神经网络包括多个卷积核，重建图像的第一特征图和标准图像的第一特征图具有第一权重，重建图像的第一特征图和标准图像的第一特征图由第一卷积核获取，重建图像的第二特征图和标准图像的第二特征图具有第二权重，重建图像的第一特征图和标准图像的第二特征图由第二卷积核获取，第一卷积核和第二卷积核属于多个卷积核。

本申请实施例为不同的特征图分配不同的权重从而达到不同的效果，例如，对于有关细节特征的特征图可以适当增大权重，以增加细节效果的重要程度，如此不论对于人眼视觉感受还是对于机器视觉任务的后续执行都具有有益效果。

结合第一方面，在第一方面的某些实现方式中，权重由归一化参数确定，归一化参数为预训练模型的归一化参数。

用于加权的加权系数可以由人为确定，也可以根据归一化参数确定。

结合第一方面，在第一方面的某些实现方式中，获取重建图像的特征图相对于标准图像的特征图的失真度，包括：根据如下公式计算重建图像的特征图相对于标准图像的特征图的失真度：

wfMSE为重建图像的特征图相对于标准图像的特征图的失真度，x为标准图像，y为重建图像，f()为卷积操作，i为第i个卷积核，w为权重系数，C为重建图像的特征图通道数或标准图像的特征图通道数，H为标准图像或重建图像的高度，W为标准图像或重建图像的宽度。

上述方法基于现有的计算方法MSE，对图像进行单层卷积操作，计算简单，计算量小；卷积核参数和权重参数来自于面向机器任务的预训练模型，基于此对编码解码器优化，使得输出的重建图像更加适配机器视觉任务；对不同特征图分配不同权重，加权系数可自由调整，对于细节相关的特征图可以增大权重，以增强图像细节纹理特征。

结合第一方面，在第一方面的某些实现方式中，w＝1，或

或

γ _i为预训练模型的缩放系数，σ _i为预训练模型的归一化系数。

由于预训练模型是针对机器视觉任务训练的，因此当权重系数来自于预训练模型而非人工设计时，可以确保据此优化的编码器和/或解码器在面向同样的机器视觉任务时具有更好的效果。

结合第一方面，在第一方面的某些实现方式中，方法还包括：根据如下公式计算重建图像的特征图相对于标准图像的特征图的失真度：

wfSSIM为重建图像的特征图相对于标准图像的特征图的失真度，μ为均值，σ为协方差，C ₁为常数，C ₂为常数。

本申请实施例还可以基于其他指标例如图像间结构相似性的计算方法来获取重建图像的失真度。基于结构形似性计算，因为使用了均值和方差等统计量，更容易避免噪声(例如振铃噪声)的影响，从而获得更加稳定的效果，在语义分割等机器任务中可以有效提高精度。

wfMSSSIM为重建图像的特征图相对于标准图像的特征图的失真度，C ₃为常数。

基于结构相似性SSIM的计算方法还可以具有其他的变形，例如基于多尺度结构相似性MSSSIM的计算方法。相比于SSIM的计算方法在保留抗噪能力的同时进一步增强图像细节，由此优化得到的编码解码器输出的重建图像具有更高质量，对于后续的目标检测等机器任务具有重要意义。

结合第一方面，在第一方面的某些实现方式中，单层卷积神经网络包括多个卷积核，第一卷积核用于获取重建图像的第一特征和标准图像的第一特征，第一卷积核的系数具有第一权重，第二卷积核用于获取重建图像的第二特征和标准图像的第二特征，第二卷积核的系数具有第二权重，第一卷积核和第二卷积核属于多个卷积核。

这种方法使用加权后的卷积核分别对重建图像和标准图像进行特征提取，使得特征图无需再分别加权，可以节省计算量。此外，一般来说，卷积核的系数远少于图像的像素(图像像素与具体分辨率有关)，对卷积核系数进行加权的计算量也远少于对特征图进行加权的计算量，特别是在图像分辨率较高的时候。

结合第一方面，在第一方面的某些实现方式中，获取重建图像的特征图相对于标准图像的特征图的失真度，包括：根据如下公式计算重建图像的特征图的失真度：

wfMSE为重建图像的特征图的失真度，x为标准图像，y为重建图像，g _i()＝w _i×f _i()＝fw _i()，f()为卷积操作，i为第i个卷积核，w为权重系数，C为重建图像的特征图通道数或标准图像的特征图通道数，H为标准图像或重建图像的高度，W为标准图像或重建图像的宽度。

该方法为上一种MSE方法的快速实现方式，上一种方法是对标准图像和重建图像分别卷积操作后再求残差，如此对于一个卷积核来说需要做两次卷积操作，而该方法是先求残差再对残差进行卷积，如此对于一个卷积核来说只需做一次卷积操作，可以节省计算量。

结合第一方面，在第一方面的某些实现方式中，方法还包括：根据重建图像的特征图相对于标准图像的特征图的失真度评价重建图像的质量，以获取评价结果；根据评价结果优化编码器和/或解码器，编码器和/或解码器用于输出重建图像。

在编码器和/或解码器的训练过程中，自然希望编码器和/或解码器输出的重建图像尽可能接近标准图像，而重建图像的失真度即表示重建图像与标准图像之间的差异，所以可以根据失真度来更新编码器和/或解码器的参数，使得输出的重建图像的失真度尽量小，以达到优化编码器和/或解码器的目的。

结合第一方面，在第一方面的某些实现方式中，重建图像的特征图和标准图像的特征图为全分辨率图像。

本申请实施例使用的单层卷积神经网络不包括池化层，卷积层也不执行对重建图像和标准图像的下采样操作。不进行下采样的操作，则不会对图像进行压缩，如此可以输出全分辨率的图像，基于对全分辨率图像的评价结果对编码解码器进行优化，可以保证优化后的编码解码器输出的重建图像的质量，对人眼视觉更加友好。

第二方面，提供了一种图像处理的装置，该装置包括：获取单元，用于获取重建图像和重建图像的标准图像，重建图像为根据第一图像重建得到的图像，第一图像为所述标准图像经过压缩得到的图像；处理单元，用于将重建图像和标准图像输入单层卷积神经网络，以得到重建图像的特征图和标准图像的特征图，单层卷积神经网络的参数来自于预训练模型的第一层卷积层的参数，预训练模型为预先训练好的卷积神经网络；处理单元还用于获取重建图像的特征图相对于标准图像的特征图的失真度。

结合第二方面，在第二方面的某些实现方式中，单层卷积神经网络包括多个卷积核，重建图像的第一特征图和标准图像的第一特征图具有第一权重，重建图像的第一特征图和标准图像的第一特征图由第一卷积核获取，重建图像的第二特征图和标准图像的第二特征图具有第二权重，重建图像的第一特征图和标准图像的第二特征图由第二卷积核获取，第一卷积核和第二卷积核属于多个卷积核。

结合第二方面，在第二方面的某些实现方式中，权重由归一化参数确定，归一化参数为预训练模型的归一化参数。

结合第二方面，在第二方面的某些实现方式中，处理单元具体用于：根据如下公式计算重建图像的特征图相对于标准图像的特征图的失真度：

结合第二方面，在第二方面的某些实现方式中，w＝1，或

或

结合第二方面，在第二方面的某些实现方式中，处理单元还用于：根据如下公式计算重建图像的特征图相对于标准图像的特征图的失真度：

结合第二方面，在第二方面的某些实现方式中，单层卷积神经网络包括多个卷积核，第一卷积核用于获取重建图像的第一特征和标准图像的第一特征，第一卷积核的系数具有第一权重，第二卷积核用于获取重建图像的第二特征和标准图像的第二特征，第二卷积核的系数具有第二权重，第一卷积核和第二卷积核属于多个卷积核。

结合第二方面，在第二方面的某些实现方式中，处理单元具体用于：根据如下公式计算重建图像的特征图的失真度：

结合第二方面，在第二方面的某些实现方式中，处理单元还用于：根据重建图像的特征图相对于标准图像的特征图的失真度评价重建图像的质量，以获取评价结果；根据评价结果优化编码器和/或解码器，编码器和/或解码器用于输出重建图像。

结合第二方面，在第二方面的某些实现方式中，重建图像的特征图和标准图像的特征图为全分辨率图像。

第三方面，提供了一种计算机可读介质，其特征在于，计算机可读介质存储用于设备执行的程序代码，该程序代码包括用于执行上述第一方面的任一种实现方式的方法。

第四方面，提供了一种芯片，芯片包括处理器与数据接口，处理器通过数据接口读取存储器上存储的指令，执行上述第一方面的任一种实现方式的方法。

附图说明

图1是本申请实施例的对摄像头输出图像进行压缩传输的示意性框图；

图2是本申请实施例的摄像头获取的图像用于多种任务的示意性框图；

图3是本申请实施例的卷积神经网络的示意性结构图；

图4是本申请实施例的图像处理方法的示意性流程图；

图5是本申请实施例的对标准图像和重建图像的卷积操作的示意图；

图6是本申请实施例的获取重建图像的失真度的过程的示意图；

图7是本申请实施例的图像处理方法在编码器和/或解码器的优化中的应用场景示意图；

图8是本申请实施例的图像处理的装置的示意性框图；

图9是本申请实施例的图像处理装置900的结构示意图。

具体实施方式

下面将结合附图，对本申请实施例中的技术方案进行描述。

图2示出了本申请实施例的摄像头获取的图像用于多种任务的示意性框图，以自动驾驶场景为例，安装在车辆上的摄像头传感器获取的车辆周围的图像经过编码器压缩处理或ISP处理后得到RGB图像，RGB图像的精度远低于摄像头输出的原始图像的精度，由此可以降低网络传输的带宽需求。RGB图像经过编码解码器(encoder and decoder，CODEC)的处理(包括对原始图像的压缩和重建)得到重建图像，重建图像用于目标检测、语义分割和红绿灯、车道线的检测等任务。显然，重建图像的质量对于目标检测、语义分割和红绿灯、车道线的检测等任务的执行效果具有重要意义，例如，如果重建图像的质量较差，则在目标检测任务中难以对目标识别准确，可能给自动驾驶带来巨大危险，因此需要保证CODEC输出的重建图像具有较高质量。进而需要一种方法，用于确定CODEC输出的重建图像与原始图像之间的失真度，从而评价重建图像的质量，根据评价结果由此可以对CODEC进行优化，以使优化后的CODEC可以输出具有较高质量的重建图像。

从某种程度上来说，上述目标检测、语义分割和红绿灯、车道线的检测等任务可以称为机器视觉任务，即重建图像是直接由机器系统进行处理，因此重建图像主要满足可以被机器系统快速识别和检测的需求。针对上述机器视觉任务的需求，现有技术提出了多种面向机器视觉的评价指标，用于评价重建图像的质量，包括图像分类评价指标Top-1Acc、目标检测评价指标mAP、语义分割评价指标mIoU和车道线检测评价指标Acc等。使用上述评价指标针对相应的单个机器视觉任务对CODEC进行优化可以取得较好的效果，但如此优化后的CODEC会与相应的单个机器视觉任务耦合，而无法适配多种任务场景，例如，使用图像分类评价指标Top-1Acc对CODEC进行优化，优化后的CODEC输出的重建图像对于图像分类任务具有较好的效果，但对于目标检测、语义分割和车道线检测等任务依然效果较差，无法做到任务泛化的评价。除了上述面向机器视觉的评价指标，现有技术中还包括面向人眼视觉的评价指标，包括峰值信噪比(peak signal noise ratio，PSNR)、多尺度结构相似度(multiscale structural similarity index，MSSSIM)、学习感知图块相似度(learned perceptual image patch similarity，LPIPS)等评价指标，根据面向人眼视觉的评价指标优化的CODEC所输出的重建图像可以更加符合人眼主观感受，例如将重建图像直接显示在车辆内部的显示屏上以供驾驶员观看，因此重建图像需要具有更高的清晰度以及便于人眼观看等特点。然而实际上，人眼的复杂性难以用一个评价指标来满足，而现有的面向人眼视觉的评价指标均有其各自的不足，以LPIPS为例，使用LPIPS评价指标评价重建图像质量时需要计算网络的全部卷积层，计算复杂度高；此外由于网络涉及池化和下采样，评价过程中导致图像信息丢失，并且评价过程中仅使用了低分辨率的特征图，难以做出准确的评价结果，而不准确的评价结果也难以保证CODEC的优化结果，因此难以保证重建图像的质量。

由于摄像头获取的图像主要用于机器系统执行相关的任务，例如在自动驾驶场景中，摄像头传感器获取的图像主要用于目标检测、语义分割和红绿灯、车道线的检测等任务，以实现对车辆周围的环境的感知，因此评价重建图像的质量的方法首先应当面对机器视觉；同时，为了满足多种机器视觉任务的应用场景，评价重建图像的质量的方法应当与具体任务解耦合；此外，在某些情况下需要兼顾人眼视觉，例如摄像头传感器获取的图像也需要显示在车内显示屏上供驾驶员观看等。

因此，本申请实施例提出一种图像处理方法，用于获取重建图像和原始图像的失真度，以评价重建图像的质量，从而指导优化CODEC。本申请实施例的图像处理方法，面向机器视觉任务，可以满足多种任务的需求，同时兼顾人眼视觉。

为了更好地理解本申请实施例的方案，下面先对本申请实施例可能涉及到的卷积神经网络(convolutional neuron network，CNN)做简单介绍。

图3示出了本申请实施例的卷积神经网络的示意性结构图，CNN300可以包括输入层310，卷积层/池化层320(其中池化层为可选的)，以及全连接层(fully connected layer)330。下面对这些层的相关内容做详细介绍。

卷积层/池化层320：

卷积层：

如图3所示卷积层/池化层320可以包括如示例321-326层，举例来说：在一种实现中，321层为卷积层，322层为池化层，323层为卷积层，324层为池化层，325为卷积层，326为池化层；在另一种实现方式中，321、322为卷积层，323为池化层，324、325为卷积层，326为池化层。即卷积层的输出可以作为随后的池化层的输入，也可以作为另一个卷积层的输入以继续进行卷积操作。

下面将以卷积层321为例，介绍一层卷积层的内部工作原理。

卷积层321可以包括很多个卷积算子，卷积算子也称为卷积核，其在图像处理中的作用相当于一个从输入图像矩阵中提取特定信息的过滤器，卷积算子本质上可以是一个权重矩阵，这个权重矩阵通常被预先定义，在对图像进行卷积操作的过程中，权重矩阵通常在输入图像上沿着水平方向一个像素接着一个像素(或两个像素接着两个像素……这取决于步长stride的取值)的进行处理，从而完成从图像中提取特定特征的工作。该权重矩阵的大小应该与图像的大小相关，需要注意的是，权重矩阵的纵深维度(depth dimension)和输入图像的纵深维度是相同的，在进行卷积运算的过程中，权重矩阵会延伸到输入图像的整个深度。因此，和一个单一的权重矩阵进行卷积会产生一个单一纵深维度的卷积化输出，但是大多数情况下不使用单一权重矩阵，而是应用多个尺寸(行×列)相同的权重矩阵，即多个同型矩阵。每个权重矩阵的输出被堆叠起来形成卷积图像的纵深维度，这里的维度可以理解为由上面所述的“多个”来决定。不同的权重矩阵可以用来提取图像中不同的特征，例如一个权重矩阵用来提取图像边缘信息，另一个权重矩阵用来提取图像的特定颜色，又一个权重矩阵用来对图像中不需要的噪点进行模糊化等。该多个权重矩阵尺寸(行×列)相同，经过该多个尺寸相同的权重矩阵提取后的卷积特征图的尺寸也相同，再将提取到的多个尺寸相同的卷积特征图合并形成卷积运算的输出。

这些权重矩阵中的权重值在实际应用中需要经过大量的训练得到，通过训练得到的权重值形成的各个权重矩阵可以用来从输入图像中提取信息，从而使得卷积神经网络300进行正确的预测。

当卷积神经网络300有多个卷积层的时候，初始的卷积层(例如321)往往提取较多的一般特征，该一般特征也可以称之为底层通用特征或低级别的特征；随着卷积神经网络300深度的加深，越往后的卷积层(例如326)提取到的特征越来越复杂，比如高级别的语义之类的特征。

池化层：

由于常常需要减少训练参数的数量，因此卷积层之后常常需要周期性的引入池化层，在如图3中320所示例的321-326各层，可以是一层卷积层后面跟一层池化层，也可以是多层卷积层后面接一层或多层池化层。在图像处理过程中，池化层的唯一目的就是减少图像的空间大小。池化层可以包括平均池化算子和/或最大池化算子，以用于对输入图像进行采样得到较小尺寸的图像。平均池化算子可以在特定范围内对图像中的像素值进行计算产生平均值作为平均池化的结果。最大池化算子可以在特定范围内取该范围内值最大的像素作为最大池化的结果。另外，就像卷积层中用权重矩阵的大小应该与图像尺寸相关一样，池化层中的运算符也应该与图像的大小相关。通过池化层处理后输出的图像尺寸可以小于输入池化层的图像的尺寸，池化层输出的图像中每个像素点表示输入池化层的图像的对应子区域的平均值或最大值。

应当说明的是，除了上述池化层可以实现对图像进行压缩，卷积层本身也可以实现对图像进行压缩。例如，当卷积核对图像进行卷积操作时，如果其步长大于1，即可实现对图像的压缩，这种对图像的压缩称为下采样。

全连接层330：

在经过卷积层/池化层320的处理后，卷积神经网络300还不足以输出所需要的输出信息。因为如前所述，卷积层/池化层320只会提取特征，并减少输入图像带来的参数。然而为了生成最终的输出信息(所需要的类信息或其他相关信息)，卷积神经网络300需要利用全连接层330来生成一个或者一组所需要的类的数量的输出。因此，在全连接层 330中可以包括多层隐含层(如图3所示的331、332至33n)以及输出层340，该多层隐含层中所包含的参数可以根据具体的任务类型的相关训练数据进行预先训练得到，例如该任务类型可以包括图像识别，图像分类，图像超分辨率重建等等。

在全连接层330中的多层隐含层之后，也就是整个卷积神经网络300的最后层为输出层340，该输出层340具有类似分类交叉熵的损失函数，具体用于计算预测误差，一旦整个卷积神经网络300的前向传播(如图3由310至340方向的传播为前向传播)完成，反向传播(如图3由340至310方向的传播为反向传播)就会开始更新前面提到的各层的权重值以及偏差，以减少卷积神经网络300的损失，及卷积神经网络300通过输出层输出的结果和理想结果之间的误差。

需要说明的是，如图3所示的卷积神经网络300仅作为一种卷积神经网络的示例，在具体的应用中，卷积神经网络还可以以其他网络模型的形式存在。

现有技术在获取重建图像和原始图像失真度时，使用图3所示的卷积神经网络对重建图像和原始图像进行处理，由于对图像处理过程中存在池化操作和下采样操作，使得处理后的图像信息丢失，得到的特征图分辨率较低，获取的重建图像和原始图像的失真度并不准确，由此对于重建图像质量的评价结果也并不准确。根据不准确的评价结果对CODEC进行优化，使得优化结果不佳，CODEC输出的重建图像可能具有瑕疵。此外，使用图3所示的全部卷积层对图像进行处理，计算复杂度较高。

图4示出了本申请实施例的图像处理方法的示意性流程图，使用图4所示的图像处理方法可以获取重建图像和原始图像的失真度，以评价重建图像的质量，从而指导优化编码器、解码器和ISP图像处理算法等。具体的应用场景包括辅助/自动驾驶车辆对摄像头获取的图像进行处理或平安城市系统/视频监控系统对摄像头获取的图像进行处理等场景。图4的方法包括步骤401至步骤403，以下分别进行介绍。

S401，获取重建图像和重建图像的标准图像，重建图像为根据第一图像重建得到的图像，第一图像为标准图像经过压缩得到的图像。

图4所示的图像处理方法可以应用于编码解码器的训练过程，在一种可能的训练方式中，需要获取标准图像和标准图像对应的压缩图像，该标准图像和其对应的压缩图像可以来自于ImageNet、Kitti、coco、Cityscapes等任何训练集，然后将压缩图像输入编码解码器，编码解码器输出重建图像，该重建图像与前述压缩图像和标准图像相对应。重建图像与标准图像的失真度决定了编码解码器的优化方向，一般来说，希望编码解码器输出的重建图像可以尽量接近标准图像，因此需要获取重建图像与标准图像的失真度。

S402，将重建图像和标准图像输入单层卷积神经网络，以得到重建图像的特征图和标准图像的特征图，单层卷积神经网络的参数来自于预训练模型的第一层卷积层的参数，预训练模型为预先训练好的卷积神经网络。

获取重建图像与标准图像的失真度首先需要获取重建图像与标准图像的特征图，本申请实施例使用卷积神经网络对重建图像与标准图像进行特征提取。与现有技术使用完整的神经网络不同的是，本申请实施例使用单层神经网络进行特征提取，该单层卷积神经网络的参数来自于预训练模型的第一层卷积层的参数，包括卷积核的参数和归一化参数，预训练模型即为预先训练好的卷积神经网络模型，例如在大规模训练集ImageNet上训练的Resnet、alexnet、vggnet、regnet等分类模型。单层卷积神经网络包括多个卷积核，不同卷积核用于提取不同的特征，每个卷积核都具有明确的物理意义，例如第一个卷积核用于提取快速变化的纹理细节，第二个卷积核用于提取图像边缘特征及颜色信息等。本申请实施例中，由于预训练模型本是针对机器任务训练，因此使用参数来自预训练模型的单层卷积神经网络提取图像特征，可以更好地适配机器视觉任务；根据上述对于图3的描述可知，初始卷积层往往提取图像的底层通用特征，本申请实施例的单层卷积神经网络为预训练模型的第一层卷积层，使用该单层卷积神经网络提取的图像特征也为底层通用特征，针对底层通用特征优化得到的编码解码器可以适配多种任务场景，提高多任务泛化能力；另外相较于现有技术中使用完整的神经网络对图像进行处理，本申请实施例中使用单层卷积神经网络只需进行单层卷积计算，降低了计算复杂度，同时降低了对于硬件的算力要求。

此外，本申请实施例使用的单层卷积神经网络不包括池化层，卷积层也不执行对重建图像和标准图像的下采样操作。不进行下采样的操作，则不会对图像进行压缩，如此可以输出全分辨率的图像，基于对全分辨率图像的评价结果对编码解码器进行优化，可以保证优化后的编码解码器输出的重建图像的质量，对人眼视觉更加友好。

在一种可能的实现方式中，第一卷积核用于提取第一特征，以获取重建图像的第一特征图和标准图像的第一特征图，第二卷积核用于提取第二特征，以获取重建图像的第二特征图和标准图像的第二特征图。本申请实施例分别第一特征图和第二特征图加权，使得第一特征图具有第一权重，第二特征图具有第二权重，为不同的特征图分配不同的权重从而达到不同的效果，例如，对于有关细节特征的特征图可以适当增大权重，以增加细节效果的重要程度，如此不论对于人眼视觉感受还是对于机器视觉任务的后续执行都具有有益效果。

在另一种可能的实现方式中，可以直接分别对第一卷积核的系数和第二卷积核的系数进行加权，使得第一卷积核的系数具有第三权重，第二卷积核的系数具有第四权重。加权后的卷积核分别对重建图像和标准图像进行特征提取，使得特征图无需再分别加权，可以节省计算量。此外，一般来说，卷积核的系数远少于图像的像素(图像像素与具体分辨率有关)，对卷积核系数进行加权的计算量也远少于对特征图进行加权的计算量，特别是在图像分辨率较高的时候。

在另一种可能的实现方式中，也可以结合具体的应用场景，既对卷积核系数进行加权，又对特征图进行加权。

用于加权的加权系数可以由人为确定，也可以根据归一化参数确定，其中归一化参数来自于预训练模型的归一化参数。

S403，获取重建图像的特征图相对于标准图像的特征图的失真度。

获取重建图像的特征图相对于标准图像的特征图的失真度的算法可以基于现有的评价指标的算法，例如MSE或MSSSIM等评价指标的算法。结合上述描述，以下给出四种获取重建图像的特征图相对于标准图像的特征图的失真度的计算方法，但应理解，以下四种方法只是对获取重建图像的特征图相对于标准图像的特征图的失真度的计算方法的举例，并不构成对本申请的限定，除了以下四种方法，本申请实施例还可以使用其他可能的计算方法。

方法一：可以根据如下公式计算重建图像的特征图相对于标准图像的特征图的失真度：

其中wfMSE为重建图像的特征图相对于标准图像的特征图的失真度，x为标准图像，y为重建图像，f()为卷积操作，i为第i个卷积核，w为权重系数，C为重建图像的特征图通道数或标准图像的特征图通道数，H为标准图像或重建图像的高度，W为标准图像或重建图像的宽度。

其中，卷积核参数和权重系数均来自预训练模型，卷积核参数包括64个7*7卷积核，权重系数具体可以是人为设定或来自于预训练模型的归一化参数，归一化参数包括缩放系数γ _i和归一化系数σ _i。

具体的，对标准图像和重建图像的卷积操作如图5所示，使用64个7*7卷积核对标准图像x进行特征提取，以得到标准图像的特征图f(x)，第i个卷积核提取特征得到的特征图为f _i(x)；使用64个7*7卷积核对重建图像y进行特征提取，以得到重建图像的特征图f(y)，第i个卷积核提取特征得到的特征图为f _i(y)。stride＝1表示不对图像进行下采样，由此可以保持图像具有较高的分辨率，有助于恢复重建图像的更多细节。

当权重系数来自于预训练模型的归一化参数时，其取值具体可以是w＝1，或

或

w的不同取值对应不同的增强效果，对与细节有关的特征图增大权重，可以实现细节增强效果。

上述方法一基于现有的计算方法MSE，对图像进行单层卷积操作，计算简单，计算量小；卷积核参数和权重参数来自于面向机器任务的预训练模型，基于此对编码解码器优化，使得输出的重建图像更加适配机器视觉任务；对不同特征图分配不同权重，加权系数可自由调整，对于细节相关的特征图可以增大权重，以增强图像细节纹理特征。

方法二：针对上述方法一，本申请实施例提出一种基于方法一的快速实现方式，具体可以根据如下公式计算重建图像的特征图相对于标准图像的特征图的失真度：

其中wfMSE为重建图像的特征图相对于标准图像的特征图的失真度，x为标准图像，y为重建图像，g _i()＝w _i×f _i()＝fw _i()，f()为卷积操作，i为第i个卷积核，w为权重系数，C为重建图像的特征图通道数或标准图像的特征图通道数，H为标准图像或重建图像的高度，W为标准图像或重建图像的宽度。

方法一中是对标准图像和重建图像分别卷积操作后再求残差，如此对于一个卷积核来说需要做两次卷积操作，而方法二是先求残差再对残差进行卷积，如此对于一个卷积核来说只需做一次卷积操作，可以节省计算量。

方法一中是对特征图进行加权，而方法二是对卷积核系数进行加权，得到新的卷积核 g _i()＝w _i×f _i()＝fw _i()，由于卷积核只有7*7个系数，与图像分辨率无关，而图像有W×H个像素(一般来说远大于7*7)，且图像分辨率越高，像素越高，因此对卷积核系数进行加权相较于对特征图进行加权可以节省计算量，特别是对于高分辨率图像。

根据方法二获取重建图像的失真度的过程如图6所示，首先编码解码器输出标准图像x对应的重建图像y，然后计算标准图像和重建图像之间的残差z＝x-y，再使用加权后的卷积核g _i()对残差进行卷积操作，得到卷积结果

最后计算卷积结果

的方差，即为wfMSE。

方法三：方法一和方法二中使用MSE计算方法来获取重建图像的失真度，为基于图像之间像素失真度的计算方法，本申请实施例还可以基于其他指标例如图像间结构相似性(tructure similarity index，SSSIM)的计算方法来获取重建图像的失真度。

其中wfSSIM为所述重建图像相对于标准图像的失真度，μ为均值，σ为协方差，C ₁为常数，C ₂为常数。

方法三为基于结构相似性指标计算重建图像相对于标准图像的失真度，对卷积后的特征图进行SSIM计算，并对计算结果进行加权求平均即可得到wfSSIM。相对于方法一和方法二基于像素计算，方法三基于结构形似性计算，因为使用了均值和方差等统计量，更容易避免噪声(例如振铃噪声)的影响，从而获得更加稳定的效果，在语义分割等机器任务中可以有效提高精度。

方法四：方法三中的基于结构相似性SSIM的计算方法还可以具有其他的变形，例如基于多尺度结构相似性MSSSIM的计算方法。

其中wfMSSSIM为重建图像的特征图相对于标准图像的特征图的失真度，C ₃为常数。α _M、β _j、γ _j的取值为：

β ₁＝γ ₁＝0.0448

β ₂＝γ ₂＝0.2856

β ₃＝γ ₃＝0.3001

β ₄＝γ ₄＝0.2363

α ₅＝β ₅＝γ ₅＝0.1333

方法四中基于多尺度度量图像间的结构形似性，相比于方法三在保留抗噪能力的同时进一步增强图像细节，由此优化得到的编码解码器输出的重建图像具有更高质量，对于后续的目标检测等机器任务具有重要意义。

根据上述描述可以获取重建图像的特征图相对于标准图像的特征图的失真度，在获取到失真度之后，本申请实施例的方法还包括，根据失真度评价重建图像的质量，得到评价结果；然后根据评价结果对编码器和/或解码器进行优化，其中编码器和/或解码器是用于输出重建图像的。例如，在编码器和/或解码器的训练过程中，自然希望编码器和/或解码器输出的重建图像尽可能接近标准图像，而重建图像的失真度即表示重建图像与标准图像之间的失真度，所以可以根据失真度来更新编码器和/或解码器的参数，使得输出的重建图像的失真度尽量小，以达到优化编码器和/或解码器的目的。

图7示出了本申请实施例的图像处理方法在编码器和/或解码器的优化中的应用场景示意图。如图7中的(a)图所示，使用本申请实施例的图像处理方法可以对编码器和解码器分别进行优化，或者当编码器和解码器为一体设计时，可以对编码解码器进行优化。由于本申请实施例的图像处理方法使用的单层卷积神经网络来自现有的预训练模型，而非人工设计，因此可以兼容现有的AI模型；此外单层卷积神经网络为预训练模型的第一层卷积层，提取图像的底层通用特征，使得优化得到的编码器和解码器可以同时适配多种机器视觉任务，如图7(a)中的目标检测任务、语义分割任务和红绿灯、车道线检测任务等。如图7中的(b)图所示，使用本申请实施例的图像处理方法可以对编码器和解码器进行优化，之后固定编码器，对解码器使用现有的面向机器视觉任务的评价指标联合具体的机器视觉任务联合优化，如此优化得到的编码器可以适配多种机器视觉任务，提高任务泛化能力，而解码器与具体的机器视觉任务结合，可以使得输出的重建图像更加符合具体的机器视觉任务的应用场景。此外，如图7中的(c)图所示，使用本申请实施例的图像处理方法可以对编码器和解码器进行优化，然后固定编码器，再使用现有的面向机器视觉任务的评价指标联合具体的机器视觉任务对解码器的主干网络进行优化，而不对head网络进行优化，其中主干网络是用来做特征提取的网络，为解码器的一部分网络，head网络是根据主干网络提取的特征进一步作出预测，也为解码器的一部分网络，如此在解码器的训练过程中可以使用自监督学习，而无需标签数据，因为在head网络作出预测的过程中需要标签数据。

此外，还可以使用本申请实施例的图像处理方法对ISP处理方法的优化进行指导，ISP处理包括去马赛克、颜色变换、白平衡、去噪、色调映射、gamma校正等一系列步骤，由于缺乏面向机器视觉的图像质量评价指标，一般需要进行ISP与具体任务联合的端到端的方式进行调参，即以具体任务的输出精度来指导ISP调参，而具体任务需要用到标签数据，使得这种调参应用方式受限制。而本申请实施例的图像处理方法由于与具体任务解耦，可以直接指导ISP调参而无需执行具体任务，简化了ISP调参过程。

下面表1示出了根据本申请实施例提出的图像处理方法和现有技术的方法对编码器和/或解码器进行优化，优化后的编码器和/或解码器输出的重建图像在机器视觉任务和人眼视觉中的效果排名。

表1

	目标检测排名	语义分割排名	人眼视觉排名	综合排名
wfMSSSIM	2	2	2	1
wfMSE-w1	1	4	1	2
wfMSE-w0	3	3	3	3
MSSSIM	4	1	4	4
MSE	5	6	5	5
DISTS	6	5	6	6

其中wfMSE-w0表示不进行加权，wfMSE-w1表示加权系数为

由表1中可以看出，根据本申请实施例的图像处理方法优化的编码器和/或解码器相比于现有技术，无论在机器视觉任务的处理还是面向人眼视觉中都具有更好的效果。

上文结合附图对本申请实施例的图像处理方法进行了详细的介绍，下面结合附图对本申请实施例的图像处理的装置进行描述。应理解，下文中介绍的图像处理的装置能够执行本申请实施例的图像处理方法的各个步骤，下面在介绍本申请实施例的图像处理的装置适当省略重复的描述。

图8为本申请实施例的图像处理的装置的示意性框图，该图像处理的装置可以是终端，也可以是终端内部的芯片，如图8所示，包括获取单元801，处理单元802，以下进行简要介绍。

获取单元801，用于获取重建图像和重建图像的标准图像。

处理单元802，用于将重建图像和标准图像输入单层卷积神经网络，以得到重建图像的特征图和标准图像的特征图，单层卷积神经网络为预训练模型的第一层卷积层。

处理单元802还用于获取重建图像的特征图相对于标准图像的特征图的失真度。

在某些实现方式中，单层卷积神经网络包括多个卷积核，重建图像的第一特征图和标准图像的第一特征图具有第一权重，第一特征图由第一卷积核获取，重建图像的第二特征图和标准图像的第二特征图具有第二权重，第二特征图由第二卷积核获取，第一卷积核和第二卷积核属于多个卷积核。

在某些实现方式中，权重由归一化参数确定，归一化参数为预训练模型的归一化参数。

在某些实现方式中，处理单元802具体用于：根据如下公式计算重建图像的特征图相对于标准图像的特征图的失真度：

在某些实现方式中，w＝1，或

或

在某些实现方式中，处理单元802还用于：根据如下公式计算重建图像的特征图相对于标准图像的特征图的失真度：

在某些实现方式中，单层卷积神经网络包括多个卷积核，第一卷积核用于获取重建图像的第一特征和标准图像的第一特征，第一卷积核的系数具有第一权重，第二卷积核用于获取重建图像的第二特征和标准图像的第二特征，第二卷积核的系数具有第二权重，第一卷积核和第二卷积核属于多个卷积核。

在某些实现方式中，处理单元802具体用于：根据如下公式计算重建图像的特征图的失真度：

在某些实现方式中，处理单元802还用于：根据重建图像的特征图相对于标准图像的特征图的失真度评价重建图像的质量，以获取评价结果；根据评价结果优化编码器和/或解码器，编码器和/或解码器用于输出重建图像。

在某些实现方式中，单层卷积神经网络对重建图像和标准图像不执行池化操作和下采样操作。

应理解，图8所示的图像处理的装置可以用于实现上述图像处理方法400，其中获取单元801用于实现步骤401，处理单元802用于实现步骤402和步骤403，图8所示的图像处理装置还可以用于实现图5至图7所述的图像处理方法，具体步骤可以参照上述对于图5至图7的描述，为了简洁，本申请实施例在此不再赘述。

应理解的是，本申请实施例中的图像处理装置800可以由软件实现，例如，具有上述功能的计算机程序或指令来实现，相应计算机程序或指令可以存储在终端内部的存储器中，通过处理器读取该存储器内部的相应计算机程序或指令来实现上述功能。或者，本申请实施例中的图像处理装置800还可以由硬件来实现。其中处理单元802为处理器(如NPU、GPU、系统芯片中的处理器)，获取单元801为数据接口。或者，本申请实施例中的图像处理装置800还可以由处理器和软件单元的结合实现。具体地，获取单元801可以为处理器的接口电路，或者，编码器和/或解码器等。例如，编码器和/或解码器将输出的重建图像发送给处理器接口电路。

图9是本申请实施例的图像处理装置900的结构示意图。图9所示的装置900包括存储器901、处理器902、通信接口903以及总线904。其中，存储器901、处理器902、通信接口903通过总线904实现彼此之间的通信连接。

应理解，图8中的获取单元801可以相当于装置900中的通信接口903，处理单元1002和处理单元802可以相当于装置900中的处理器902。下面对装置900中的各个单元和单元进行详细的介绍。

存储器901可以是只读存储器(read only memory，ROM)，静态存储设备，动态存储设备或者随机存取存储器(random access memory，RAM)。存储器901可以存储程序，当存储器901中存储的程序被处理器902执行时，处理器902用于执行本申请实施例的图像处理方法的各个步骤。

具体地，处理器902可用于执行图4所示的方法中的步骤402、步骤403。另外，处理器902还可以执行图5至图7所示的过程。

当处理器902执行步骤402、步骤403，处理器902可以通过通信接口903从获取编码器和/或解码器输出的重建图像和其对应的标准图像，并对获取的重建图像和其对应的标准图像进行处理。

处理器902可以采用通用的中央处理器(central processing unit，CPU)，微处理器，应用专用集成电路(application specific integrated circuit，ASIC)，图形处理器(graphics processing unit，GPU)或者一个或多个集成电路，用于执行相关程序，以实现本申请实施例的图像处理方法。

处理器902还可以是一种集成电路芯片，具有信号的处理能力。在实现过程中，本申请的方法的各个步骤可以通过处理器902中的硬件的集成逻辑电路或者软件形式的指令完成。

上述处理器902还可以是通用处理器、数字信号处理器(digital signal processing，DSP)、专用集成电路(ASIC)、现成可编程门阵列(field programmable gate array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器901，处理器902读取存储器901中的信息，结合其硬件完成装置中包括的单元所需执行的功能，或者执行本申请方法实施例的图像处理方法。

通信接口903使用例如但不限于收发器一类的收发装置，来实现装置900与其他设备或通信网络之间的通信。例如，可以通过通信接口903获取重建图像和其对应的标准图像。

总线904可包括在装置900各个部件(例如，存储器901、处理器902、通信接口903)之间传送信息的通路。

本申请实施例还提供了一种计算机可读介质，计算机可读介质存储有程序代码，当计算机程序代码在计算机上运行时，使得计算机执行上述图4至图7所述的方法。

本申请实施例还提供了一种芯片，包括：至少一个处理器和存储器，至少一个处理器与存储器耦合，用于读取并执行存储器中的指令，以执行上述图4至图7所述的方法。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种图像处理的方法，其特征在于，包括：

获取重建图像和所述重建图像的标准图像，所述重建图像为根据第一图像重建得到的图像，所述第一图像为所述标准图像经过压缩得到的图像；

将所述重建图像和所述标准图像输入单层卷积神经网络，以得到所述重建图像的特征图和所述标准图像的特征图，所述单层卷积神经网络的参数来自于预训练模型的第一层卷积层的参数，所述预训练模型为预先训练好的卷积神经网络；

获取所述重建图像的特征图相对于所述标准图像的特征图的失真度。
如权利要求1所述的方法，其特征在于，所述单层卷积神经网络包括多个卷积核，所述重建图像的第一特征图和所述标准图像的第一特征图具有第一权重，所述重建图像的第一特征图和所述标准图像的第一特征图由第一卷积核获取，所述重建图像的第二特征图和所述标准图像的第二特征图具有第二权重，所述重建图像的第二特征图和所述标准图像的第二特征图由第二卷积核获取，所述第一卷积核和所述第二卷积核属于所述多个卷积核。
如权利要求2所述的方法，其特征在于，所述权重由归一化参数确定，所述归一化参数为所述预训练模型的归一化参数。
如权利要求1至3中任一项所述的方法，其特征在于，所述获取所述重建图像的特征图相对于所述标准图像的特征图的失真度，包括：

根据如下公式计算所述重建图像的特征图相对于所述标准图像的特征图的失真度：

所述wfMSE为所述重建图像的特征图相对于所述标准图像的特征图的失真度，所述x为所述标准图像，所述y为所述重建图像，所述f()为卷积操作，所述i为第i个卷积核，所述w为权重系数，所述C为所述重建图像的特征图通道数或所述标准图像的特征图通道数，所述H为所述标准图像或所述重建图像的高度，所述W为所述标准图像或所述重建图像的宽度。
如权利要求4所述的方法，其特征在于，所述w＝1，或所述
或所述
所述γ _i为所述预训练模型的缩放系数，所述σ _i为所述预训练模型的归一化系数。
如权利要求1至5中任一项所述的方法，其特征在于，所述方法还包括：

根据如下公式计算所述重建图像的特征图相对于所述标准图像的特征图的失真度：

所述wfSSIM为所述重建图像的特征图相对于所述标准图像的特征图的失真度，所述μ为均值，所述σ为协方差，所述C ₁为常数，所述C ₂为常数。
如权利要求1至6中任一项所述的方法，其特征在于，所述方法还包括：

根据如下公式计算所述重建图像的特征图相对于所述标准图像的特征图的失真度：

所述wfMSSSIM为所述重建图像的特征图相对于所述标准图像的特征图的失真度，所述C ₃为常数。
如权利要求1至7中任一项所述的方法，其特征在于，所述单层卷积神经网络包括多个卷积核，第一卷积核用于获取所述重建图像的第一特征和所述标准图像的第一特征，所述第一卷积核的系数具有第一权重，第二卷积核用于获取所述重建图像的第二特征和所述标准图像的第二特征，所述第二卷积核的系数具有第二权重，所述第一卷积核和所述第二卷积核属于所述多个卷积核。
如权利要求8所述的方法，其特征在于，所述获取所述重建图像的特征图相对于所述标准图像的特征图的失真度，包括：

根据如下公式计算所述重建图像的特征图的失真度：

所述wfMSE为所述重建图像的特征图的失真度，所述x为所述标准图像，所述y为所述重建图像，所述g _i()＝w _i×f _i()＝fw _i()，所述f()为卷积操作，所述i为第i个卷积核，所述w为权重系数，所述C为所述重建图像的特征图通道数或所述标准图像的特征图通道数，所述H为所述标准图像或所述重建图像的高度，所述W为所述标准图像或所述重建图像的宽度。
如权利要求1至9中任一项所述的方法，其特征在于，所述方法还包括：

根据所述重建图像的特征图相对于所述标准图像的特征图的失真度评价所述重建图像的质量，以获取评价结果；

根据所述评价结果优化编码器和/或解码器，所述编码器和/或解码器用于输出所述重建图像。
如权利要求1至10中任一项所述的方法，其特征在于，所述重建图像的特征图和所述标准图像的特征图为全分辨率图像。
一种图像处理的装置，其特征在于，包括：

获取单元，用于获取重建图像和所述重建图像的标准图像，所述重建图像为根据第一图像重建得到的图像，所述第一图像为所述标准图像经过压缩得到的图像；

处理单元，用于将所述重建图像和所述标准图像输入单层卷积神经网络，以得到所述重建图像的特征图和所述标准图像的特征图，所述单层卷积神经网络的参数来自于预训练模型的第一层卷积层的参数，所述预训练模型为预先训练好的卷积神经网络；

所述处理单元还用于获取所述重建图像的特征图相对于所述标准图像的特征图的失真度。
如权利要求12所述的装置，其特征在于，所述单层卷积神经网络包括多个卷积核，所述重建图像的第一特征图和所述标准图像的第一特征图具有第一权重，所述重建图像的第一特征图和所述标准图像的第一特征图由第一卷积核获取，所述重建图像的第二特征图和所述标准图像的第二特征图具有第二权重，所述重建图像的第一特征图和所述标准图像的第二特征图由第二卷积核获取，所述第一卷积核和所述第二卷积核属于所述多个卷积核。
如权利要求13所述的装置，其特征在于，所述权重由归一化参数确定，所述归一化参数为所述预训练模型的归一化参数。
如权利要求12至14中任一项所述的装置，其特征在于，所述处理单元具体用于：

根据如下公式计算所述重建图像的特征图相对于所述标准图像的特征图的失真度：

所述wfMSE为所述重建图像的特征图相对于所述标准图像的特征图的失真度，所述x为所述标准图像，所述y为所述重建图像，所述f()为卷积操作，所述i为第i个卷积核，所述w为权重系数，所述C为所述重建图像的特征图通道数或所述标准图像的特征图通道数，所述H为所述标准图像或所述重建图像的高度，所述W为所述标准图像或所述重建图像的宽度。
如权利要求15所述的装置，其特征在于，所述w＝1，或所述
或所述
所述γ _i为所述预训练模型的缩放系数，所述σ _i为所述预训练模型的归一化系数。
如权利要求12至16中任一项所述的装置，其特征在于，所述处理单元还用于：

根据如下公式计算所述重建图像的特征图相对于所述标准图像的特征图的失真度：

所述wfSSIM为所述重建图像的特征图相对于所述标准图像的特征图的失真度，所述μ为均值，所述σ为协方差，所述C ₁为常数，所述C ₂为常数。
如权利要求12至17中任一项所述的装置，其特征在于，所述处理单元还用于：

根据如下公式计算所述重建图像的特征图相对于所述标准图像的特征图的失真度：

所述wfMSSSIM为所述重建图像的特征图相对于所述标准图像的特征图的失真度，所述C ₃为常数。
如权利要求12至18中任一项所述的装置，其特征在于，所述单层卷积神经网络包括多个卷积核，第一卷积核用于获取所述重建图像的第一特征和所述标准图像的第一特征，所述第一卷积核的系数具有第一权重，第二卷积核用于获取所述重建图像的第二特征和所述标准图像的第二特征，所述第二卷积核的系数具有第二权重，所述第一卷积核和所述第二卷积核属于所述多个卷积核。
如权利要求19所述的装置，其特征在于，所述处理单元具体用于：

根据如下公式计算所述重建图像的特征图的失真度：

所述wfMSE为所述重建图像的特征图的失真度，所述x为所述标准图像，所述y为所述重建图像，所述g _i()＝w _i×f _i()＝fw _i()，所述f()为卷积操作，所述i为第i个卷积核，所述w为权重系数，所述C为所述重建图像的特征图通道数或所述标准图像的特征图通道数，所述H为所述标准图像或所述重建图像的高度，所述W为所述标准图像或所述重建图像的宽度。
如权利要求12至20中任一项所述的装置，其特征在于，所述处理单元还用于：

根据所述重建图像的特征图相对于所述标准图像的特征图的失真度评价所述重建图像的质量，以获取评价结果；

根据所述评价结果优化编码器和/或解码器，所述编码器和/或解码器用于输出所述重建图像。
如权利要求12至21中任一项所述的装置，其特征在于，所述重建图像的特征图和所述标准图像的特征图为全分辨率图像。
一种计算机可读介质，其特征在于，所述计算机可读介质存储用于设备执行的程序代码，该程序代码包括用于执行如权利要求1至11所述的方法。
一种芯片，所述芯片包括处理器与数据接口，所述处理器通过所述数据接口读取存储器上存储的指令，执行如权利要求1至11所述的方法。