WO2022242713A1

WO2022242713A1 - 一种图像对齐方法及装置

Info

Publication number: WO2022242713A1
Application number: PCT/CN2022/093799
Authority: WO
Inventors: 董航
Original assignee: 北京字跳网络技术有限公司
Priority date: 2021-05-21
Filing date: 2022-05-19
Publication date: 2022-11-24
Also published as: CN115393405A

Abstract

一种图像对齐方法及装置，涉及图像处理技术领域。该方法包括：获取包括目标图像中的像素点对应的特征点的目标特征和包括参考图像中的像素点对应的特征点的参考特征；根据目标特征和参考特征，获取相似度特征（S102）；相似度特征包括：目标特征中的各个特征点与对应的相关特征点的相似度；根据相似度特征、目标特征以及偏移量预测卷积层，获取目标特征和参考特征的偏移量（S103）；根据偏移量和可形变卷积层，将参考特征与目标特征对齐（S104）。上述方法用于解决相关技术中预测偏移量时缺乏初值，进而导致可形变卷积层的对齐结果会与对齐结果真值相差较大的问题。

Description

一种图像对齐方法及装置

相关申请的交叉引用

本申请是以申请号为202110557632.8，申请日为2021年5月21日的中国申请为基础，并主张其优先权，该中国申请的公开内容在此作为整体引入本申请中。

技术领域

本公开涉及图像处理技术领域，尤其涉及一种图像对齐方法及装置。

背景技术

图像对齐是指：确定参考图像和目标图像之间的变化参数，并根据变化参数将目标图像变形为与参考图像同样的空间布局的过程。图像对齐广泛应用于视频修复、图像融合、图像拼接、目标识别等领域。例如：在视频修复时，通过将相邻的图像帧对齐，可以有效利用相邻图像帧之间的信息获取图像帧的更多细节信息，从而得到清晰且细节更加丰富的视频。

传统的图像对齐方法为：计算目标图像和参考图像之间的光流(Optical Flow)场，并将光流场作为目标图像与参考图像的稠密配准关系，最后通过反向网格形变(Back-warping)的方式将目标图像对齐到参考图像。

发明内容

本公开实施例提供技术方案如下：

第一方面，本公开的实施例提供了一种图像对齐方法，包括：

获取目标特征和参考特征；所述目标特征包括目标图像中的像素点对应的特征点，所述参考特征包括参考图像中的像素点对应的特征点；

根据所述目标特征和所述参考特征，获取相似度特征；所述相似度特征包括：所述目标特征中的各个特征点与对应的相关特征点的相似度，所述目标特征中的特征点对应的相关特征点包括：所述参考特征中像素坐标与所述目标特征中的特征点的像素坐标相同和相邻的特征点；

根据所述相似度特征、所述目标特征以及偏移量预测卷积层，获取所述目标特征和所述参考特征的偏移量；

根据所述偏移量和可形变卷积层，将所述参考图像与所述目标图像对齐。

作为本公开实施例一种可选的实施方式，所述目标特征中的第一特征点对应的相关特征点包括：第二特征点以及所述第二特征点的第一预设值的邻域内的特征点；

其中，所述第二特征点为所述参考特征中像素坐标与所述第一特征点的像素坐标相同的特征点。

作为本公开实施例一种可选的实施方式，所述根据所述目标特征和所述参考特征，获取相似度特征，包括：

确定所述目标特征中的第三特征点对应的第一空间域，所述第一空间域为所述第三特征点和所述第三特征点的第二预设值的邻域内的特征点形成的空间域；

确定所述参考特征中的第四特征点对应的第二空间域，所述第二空间域为所述第四特征点和所述第四特征点的第二预设值的邻域内的特征点形成的空间域；所述第四特征点为所述第三特征对应的相关特征点；

计算各个特征组中的特征点的外积，获取各个特征组的外积；所述特征组包括属于所述第一空间域的特征点以及属于所述第二空间域的特征点，且所述属于所述第一空间域的特征点在所述第一空间域中的位置与所述属于所述第二空间域的特征点在所述第二空间域中的位置相同；

对各个特征组的外积求和，获取所述第三特征点与所述第四特征点的相似度。

作为本公开实施例一种可选的实施方式，所述目标特征为对所述目标图像中的像素点进行特征提取获取的特征，所述参考特征为对所述参考图像中的像素点进行特征提取获取的特征；

或者；

所述目标特征为对所述目标图像中的像素点进行特征提取并以预设降采样率对提取的提取进行降采样得到的特征；所述参考特征为对所述参考图像中的像素点进行特征提取并以所述预设降采样率对提取的提取进行降采样得到的特征。

作为本公开实施例一种可选的实施方式，所述根据所述相似度特征、所述目标特征以及偏移量预测卷积层，获取所述目标特征和所述参考特征的偏移量，包括：

将所述相似度特征与所述目标特征在通道的维度上串联，获取偏移量预测特征；

将所述偏移量预测特征输入所述偏移量预测卷积层；

获取所述偏移量预测卷积层的输出作为所述目标特征和所述参考特征的偏移量。

作为本公开实施例一种可选的实施方式，所述目标特征包括多个空间尺度的子目标特征，所述参考特征包括多个空间尺度的子参考特征，所述相似度特征多个空间尺度的子相似度特征；

所述据所述相似度特征、所述目标特征以及偏移量预测卷积层，获取所述目标特征和所述参考特征的偏移量，包括：

根据所述多个空间尺度的子相似度特征、所述多个空间尺度的子目标特征以及所述多个空间尺度的对应的偏移量预测卷积层，获取所述多个空间尺度的子目标特征和子参考特征的子偏移量。

作为本公开实施例一种可选的实施方式，所述根据所述偏移量和可形变卷积层，将所述参考图像与所述目标图像对齐，包括：

将所述参考特征输入所述可形变卷积层，并通过所述偏移量控制所述可形变卷积层的卷积核的形状；

获取所述可形变卷积层的输出作为所述参考特征与所述目标特征的对齐结果；

根据所述参考特征与所述目标特征的对齐结果，将所述参考图像与所述目标图像对齐。

作为本公开实施例一种可选的实施方式，所述目标特征包括多个空间尺度的子目标特征，所述参考特征包括多个空间尺度的子参考特征，所述偏移量包括多个空间尺度的子偏移量；

所述根据所述偏移量和可形变卷积层，将所述参考图像与所述目标图像对齐，包括：

根据所述多个空间尺度的子偏移量和所述多个空间尺度的对应的可形变卷积层，获取所述多个空间尺度的子目标特征和子参考特征的对齐结果；

根据所述多个空间尺度的子目标特征和子参考特征的对齐结果，将所述参考图像与所述目标图像对齐。

作为本公开实施例一种可选的实施方式，所述参考图像为待修复视频的第n个图像帧，所述参考图像为所述待修复视频的第n+1个图像帧；n为正整数。

第二方面，本公开实施例提供一种图像对齐装置，包括：

特征获取单元，用于获取目标特征和参考特征；所述目标特征包括目标图像中的像素点对应的特征点，所述参考特征包括参考图像中的像素点对应的特征点；

相似度获取单元，用于根据所述目标特征和所述参考特征，获取相似度特征；所述相似度特征包括：所述目标特征中的各个特征点与对应的相关特征点的相似度，所述目标特征中的特征点对应的相关特征点包括：所述参考特征中像素坐标与所述目标特征中的特征点的像素坐标相同和相邻的特征点；

偏移量获取单元，用于根据所述相似度特征、所述目标特征以及偏移量预测卷积层，获取所述目标特征和所述参考特征的偏移量；

处理单元，用于根据所述偏移量和可形变卷积层，将所述参考图像与所述目标图像对齐。

作为本公开实施例一种可选的实施方式，所述相似度获取单元，具体用于确定所述目标特征中的第三特征点对应的第一空间域，所述第一空间域为所述第三特征点和所述第三特征点的第二预设值的邻域内的特征点形成的空间域；确定所述参考特征中的第四特征点对应的第二空间域，所述第二空间域为所述第四特征点和所述第四特征点的第二预设值的邻域内的特征点形成的空间域；所述第四特征点为所述第三特征对应的相关特征点；计算各个特征组中的特征点的外积，获取各个特征组的外积；所述特征组包括属于所述第一空间域的特征点以及属于所述第二空间域的特征点，且所述属于所述第一空间域的特征点在所述第一空间域中的位置与所述属于所述第二空间域的特征点在所述第二空间域中的位置相同；对各个特征组的外积求和，获取所述第三特征点与所述第四特征点的相似度。

或者；

作为本公开实施例一种可选的实施方式，所述偏移量获取单元，具体用于将所述相似度特征与所述目标特征在通道的维度上串联，获取偏移量预测特征；将所述偏移量预测特征输入所述偏移量预测卷积层；获取所述偏移量预测卷积层的输出作为所述目标特征和所述参考特征的偏移量。

所述偏移量获取单元，具体用于根据所述多个空间尺度的子相似度特征、所述多个空间尺度的子目标特征以及所述多个空间尺度的对应的偏移量预测卷积层，获取所述多个空间尺度的子目标特征和子参考特征的子偏移量。

作为本公开实施例一种可选的实施方式，所述处理单元，具体用于将所述参考特征输入所述可形变卷积层，并通过所述偏移量控制所述可形变卷积层的卷积核的形状；

获取所述可形变卷积层的输出作为所述参考特征与所述目标特征的对齐结果。

所述处理单元，具体用于根据所述多个空间尺度的子偏移量和所述多个空间尺度的对应的可形变卷积层，获取所述多个空间尺度的子目标特征和子参考特征的对齐结果；根据所述多个空间尺度的子目标特征和子参考特征的对齐结果，将所述参考图像与所述目标图像对齐。

第三方面，本公开实施例提供一种电子设备，包括：存储器和处理器，所述存储器用于存储计算机程序；所述处理器用于在调用计算机程序时，使得所述电子设备实现第一方面或第一方面任一种可选的实施方式所述的图像对齐方法。

第四方面，本公开实施例提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，当所述计算机程序被计算设备执行时，使得所述计算设备实现第一方面或第一方面任一种可选的实施方式所述的图像对齐方法。

第五方面，本公开实施例提供一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得所述计算机实现第一方面或第一方面任一种可选的实施方式所述的图像对齐方法。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

为了更清楚地说明本公开实施例或相关技术中的技术方案，下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本公开实施例提供的图像对齐方法的步骤流程图；

图2为本公开实施例提供的特征点对应的相关特征点的示意图之一；

图3为本公开实施例提供的特征点对应的相关特征点的示意图之二；

图4为本公开实施例提供的特征点对应的第一空间域的示意图；

图5为本公开实施例提供的特征点对应的第二空间域的示意图；

图6为本公开实施例提供的图像对齐方法的流程示意图之一；

图7为本公开实施例提供的图像对齐方法的流程示意图之二；

图8为本公开实施例提供的图像对齐方法的流程示意图之三；

图9为本公开实施例提供的图形处理装置的示意图；

图10为本公开实施例提供的电子设备的硬件结构示意图。

具体实施方式

为了能够更清楚地理解本公开的上述特征和优点，下面将对本公开的方案进行进一步描述。需要说明的是，在不冲突的情况下，本公开的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本公开，但本公开还可以采用其他不同于在此描述的方式来实施；显然，说明书中的实施例只是本公开的一部分实施例，而不是全部的实施例。

在本公开实施例中，“示例性的”或者“例如”等词用于表示作例子、例证或说明。本公开实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言，使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。此外，在本公开实施例的描述中，除非另有说明，“多个”的含义是指两个或两个以上。

传统的基于光流的图像对齐方式虽然也可以实现图像对齐，但计算光流场时的计算量非常大，因此效率较低。为了改善图像对齐效率低的问题，相关技术中提出了一种基于特征的图像对齐方式，具体包括：获取参考图像的参考特征和目标图像的目标特征，然后根据参考特征和目标特征预测偏移量，再通过偏移量控制基于可形变卷积层将参考特征与目标特征对齐，获取最终的对齐结果。相比于基于光流的图像对齐方式，上述基于特征的图像对齐方式无需计算光流场，因此更为高效，且可以实现直接对图像特征的进行对齐，然而由于根据参考特征和目标特征预测偏移量时缺乏初值，因此在参考图像和目标图像的图像质量较差时，可形变卷积层的对齐结果会与对齐结果真值相差较大。

有鉴于此，本公开提供了一种图像对齐方法及装置，用于解决相关技术中预测偏移量时缺乏初值，进而导致可形变卷积层的对齐结果会与对齐结果真值相差较大的问题。

本公开实施例的总的发明构思为：由于在实际应用过程中，可形变卷积层在输入图像存在较为严重的降质过程(模糊、有雾、噪声)时，可形变卷积层的对齐结果非常不稳定，很容易出现梯度爆炸现象。而不稳定的根源在于训练初期，由于偏移量初始值的不确定性，使得初期预测的偏移量与实际的真值相差较大。因此，为了稳定这个训练过程，本公开实施例中将光流网络中的相关性层引入，并将相关性层得到目标特征和参考特征的相似度特征作为偏移量的引导。由于相似度特征与光流的具有较为密切的关系，通过相似度特征引导，可以改善初期预测的偏移量与实际的真值相差较大的问题。

本公开实施例提供了一种图像对齐方法，参照图1所示，该图像对齐方法包括如下步骤：

S101、获取目标特征和参考特征。

其中，所述目标特征包括目标图像中的像素点对应的特征点；所述参考特征包括参考图像中的像素点对应的特征点。

可选的，所述目标特征和所述参考特征可以为视频中的相邻图像帧。即，所述参考图像为待修复视频的第n个图像帧，所述参考图像为所述待修复视频的第n+1个图像帧，n为正整数。

S102、根据所述目标特征和所述参考特征，获取相似度特征。

其中，所述相似度特征包括：所述目标特征中的各个特征点与对应的相关特征点的相似度，所述目标特征中的特征点对应的相关特征点包括：所述参考特征中像素坐标与所述目标特征中的特征点的像素坐标相同和相邻的特征点。

具体的，本公开实施例中特征点的像素坐标是指特征点对应的像素点在所属图像中的像素坐标。

例如：参考图像中像素坐标为(1，1)的像素点I ₁₁对应的特征点为F _a11，则特征点F _a11的像素坐标为(1，1)。

再例如：目标图像中像素坐标为(2，3)的像素点I ₂₃对应的特征点为F _b23，则特征点F _b23的像素坐标为(2，3)。

需要说明的是，本公开实施例中的像素坐标与像素坐标是指两个像素同属于一个预设定的坐标范围，并限定于两个像素坐标之间不包含其它像素坐标。

设：第一预设值为d，则第一特征点对应的相关特征点，包括：所述参考特征中像素坐标与所述第一特征点的像素坐标相同的第二特征点，以及第二特征点的d*d的邻域内的特征点。

示例性的，d可以为9。即，第一特征点对应的相关特征点，包括：所述参考特征中像素坐标与所述第一特征点的像素坐标相同的第二特征点，以及第二特征点的9*9的邻域内的特征点

示例性的，参照图2所示，图2中以目标图像和参考图像的分辨率均为6*6、第一预设值为3为例，对目标特征中的特征点对应的相关特征点的进行说明。如图2所示，目标特征21中的特征点Fa33的像素坐标为(3，3)，参考特征22中像素坐标为(3，3)的特征点为Fb33，因此，当第一特征点为Fa33时，第二特征点为Fb33，第二特征点Fb33的3*3的邻域内的特征点包括：Fb22、Fb23、Fb24、Fb32、Fb34、Fb42、Fb43、Fb44，因此目标特征21中的特征点Fa33对应的相关特征点包括参考特征中的9个特征点，该9个特征点分别为：Fb22、Fb23、Fb24、Fb32、Fb33、Fb34、Fb42、Fb43、Fb44。

示例性的，参照图3所示，图3中仍以目标图像和参考图像的分辨率均为6*6、第一预设值为3为例，对目标特征中的特征点对应的相关特征点的进行说明。如图3所示，目标特征31中的特征点Fa46的像素坐标为(4，6)，参考特征32中像素坐标为(4，6)的特征点为Fb46，因此，当第一特征点为Fa46时，第二特征点为Fb46，第二特征点Fb46的3*3的邻域内的特征点包括：Fb35、Fb36、Fb45、Fb55、Fb56，因此目标特征21中的特征点Fa46对应的相关特征点包括参考特征中的6个特征点，该6个特征点分别为：Fb35、Fb36、Fb45、Fb46、Fb55、Fb56。

根据上述相同方式，逐一将目标特征中的每一个特征点(Fa11、Fa12、Fa13……Fa65、Fa66)作为第一特征点，则可以确定目标特征中的每一个特征点对应的相关特征点。

上述实施例中将参考特征中像素坐标与所述第一特征点的像素坐标相同的第二特征点以及所述第二特征点的第一预设值的邻域内的特征点确定为第一特征点对应的相关特征点，相比于仅将第二特征点确定为第一特征点对应的相关特征点，上述实施例可以在获取相似度特征时，增大相似度特征的感受野，进而参考图像与目标图像的偏移量真值较大时，获取的相似度特征不准确。

进一步的，上步骤S102中根据所述目标特征和所述参考特征，获取相似度特征，包括如下步骤a至步骤d。

步骤a、确定所述目标特征中的第三特征点对应的第一空间域。

其中，所述第一空间域为所述第三特征点和所述第三特征点的第二预设值的邻域内的特征点形成的空间域；所述第三特征点为所述目标特征中的任一特征点。

设：第二预设值为k，则第一空间域为第三特征点和所述第三特征点的k*k的邻域内的特征点形成的空间域。

示例性的，参照图4所示，图4中以目标图像和参考图像的分辨率均为6*6、第二预设值为3为例，对目标特征中的特征点对应的第一空间域进行说明。如图4所示，目标特征41中的特征点Fa33的3*3 的邻域内的像素点包括：Fa22、Fa23、Fa24、Fa32、Fa34、Fa42、Fa43、Fa44，因此特征点Fa33对应的第一空间域为Fa22、Fa23、Fa24、Fa32、Fa33、Fa34、Fa42、Fa43、Fa44组成的空间域400。

步骤b、确定所述参考特征中的第四特征点对应的第二空间域。

其中，所述第二空间域为所述第四特征点和所述第四特征点的第二预设值的邻域内的特征点形成的空间域；所述第四特征点为所述第三特征对应的相关特征点。

同样，设：第二预设值为k，则第二空间域为第四特征点和所述第四特征点的k*k的邻域内的特征点形成的空间域。

示例性的，参照图5所示，图5中以目标图像和参考图像的分辨率均为6*6、第二预设值为3为例，对参考特征中的特征点对应的第二空间域进行说明。如图5所示，参考特征52中的图4所示的目标特征41中的特征点Fa33对应的相关特征点Fa22的3*3的邻域内的像素点包括：Fb11、Fb12、Fb13、Fb21、Fb23、Fb31、Fb32、Fb33，因此特征点Fb22对应的第二空间域为Fb11、Fb12、Fb13、Fb21、Fb22、Fb23、Fb31、Fb32、Fb33组成的空间500。

步骤c、计算各个特征组中的特征点的外积，获取各个特征组的外积。

其中，所述特征组包括属于所述第一空间域的特征点以及属于所述第二空间域的特征点，且所述属于所述第一空间域的特征点在所述第一空间域中的位置与所述属于所述第二空间域的特征点在所述第二空间域中的位置相同。

本公开实施例中的外积是指两个特征向量的向量积。例如:特征

与特征

的外积可以表示为：

承上图4、图5所示，在各自所属空间域中位置相同的特征点包括：Fa22与Fb11、Fa23与Fb12、Fa24与Fb13、Fa32与Fb21、Fa33与Fb22、Fa34与Fb23、Fa42与Fb31、Fa43与Fb32、Fa44与Fb33，因此计算特征组(Fa22，Fb11)、特征组(Fa23，Fb12)、特征组(Fa24，Fb13)、 (Fa32，Fb21)、特征组(Fa33，Fb22)、特征组(Fa34，Fb23)、特征组(Fa42，Fb31)、特征组(Fa43，Fb32)、特征组(Fa44，Fb33)的外积，得到Fa22×Fb11、Fa23×Fb12、Fa24×Fb13、Fa32×Fb21、Fa33×Fb22、Fa34×Fb23、Fa42×Fb31、Fa43×Fb32、Fa44×Fb33。

步骤d、对各个特征组的外积求和，获取所述第三特征点与所述第四特征点的相似度。

承上示例所述，特征组的外积包括：Fa22×Fb11、Fa23×Fb12、Fa24×Fb13、Fa32×Fb21、Fa33×Fb22、Fa34×Fb23、Fa42×Fb31、Fa43×Fb32、Fa44×Fb33，因此所述第三特征点Fa33与所述第四特征点Fb22的相似度为：Fa22×Fb11+Fa23×Fb12+Fa24×Fb13+Fa32×Fb21+Fa33×Fb22+Fa34×Fb23+Fa42×Fb31+Fa43×Fb32+Fa44×Fb33。

即，对于目标特征中的特征点x ₁和参考特征中与特征点x ₁的相关的特征点x ₂，x ₁与x ₂的相似度可以通过如下公式计算获取：

c(x ₁,x ₂)＝∑[f ₁(x ₁+o)×f ₂(x ₂+o)]；

o∈[-1/2k,1/2k]×[-1/2k,1/2k]。

其中，c(x ₁,x ₂)为特征点x ₁和x ₂的相似度，k为常数，f ₁(x ₁+o)表示以x ₁以及x ₁的k*k邻域内的特征点，f ₂(x ₂+o)表示以x ₂以及x ₂的k*k邻域内的特征点。

基于上述相同方法，逐一将第三特征点的对应的其它相关特征点作为第四特征点，则可以获取第三特征点与对应的相关特征点的相似度，再逐一将目标特征中的每一个特征点(Fa11、Fa12、Fa13……Fa65、Fa66)作为第三特征点，则获取目标特征中各个特征点与对应的相关特征点的相似度，进而获取所述相似度特征。

上述实施例在计算第三特征点与第四特征点的相似度时，首先确定第三特征点对应的第一空间域和第四特征点对应的第二空间域，然后计算各个特征组中的特征点的外积，获取各个特征组的外积，最后对各个特征组的外积求和，并将求和结果作为第三特征点第四特征点的相似度。相比于直接计算第三特征点第四特征点的外积，并将第三特征点与第四特征点的外积作为第三特征点与第四特征点的相似度，上述实施例可以增大获取相似度的维度，进而提升相似度特征获取时的鲁棒性。

S103、根据所述相似度特征、所述目标特征以及偏移量预测卷积层，获取所述目标特征和所述参考特征的偏移量。

可选的，上述步骤S103的一种实现方式包括如下步骤1至步骤3：

步骤1、将所述相似度特征与所述目标特征在通道的维度上串联，获取偏移量预测特征。

本公开实施例中特征的通道(channel)数是指特征所包含的特征图(feature map)的数量，特征的一个通道即为基于某一维度对特征进行特征提取所得到的特征图，因此特征的通道即为特定意义上的特征图。将相似度特征与所述目标特征在通道的维度上串联，获取偏移量预测特征即为：将相似度特征的特征图依次串联与目标特征的特征图之后，从而获得依次包括目标特征的所有特征图以及相似度特征的所有特征图的偏移量预测特征。

步骤2、将所述偏移量预测特征输入所述偏移量预测卷积层。

步骤3、获取所述偏移量预测卷积层的输出作为所述目标特征和所述参考特征的偏移量。

S104、根据所述偏移量和可形变卷积层，将所述参考图像与所述目标图像对齐。

可选的，上述步骤S104的一种实现方式包括如下步骤Ⅰ至步骤Ⅲ：

步骤Ⅰ、将所述参考特征输入所述可形变卷积层，并通过所述偏移量控制所述可形变卷积层的卷积核的形状。

步骤Ⅱ、获取所述可形变卷积层的输出作为所述参考特征与所述目标特征的对齐结果。

步骤Ⅲ、所述参考特征与所述目标特征的对齐结果，将所述参考图像与所述目标图像对齐。

综上所述，将参考特征表示为F1、目标特征表示为F2、相似度特征表示为Fc、偏移量预测特征表示为Ft、偏移量表示为Off、对齐结果表示为Fa、获取相似度特征的模块称为相关性层、获取偏移量预测特征的模块表示为串接层，则上述实施例提供的图像对齐方法的流程如6所示：

首先，将参考特征F1和目标特征F2输入相关性层61，并获取相关性层61的输出作为相似度特征Fc。

其次，将相似度特征Fc和目标特征F2输入串接层62，并获取串接层62的输出作为偏移量预测特征Ft。

再次，将偏移量预测特征Ft输入偏移量预测卷积层63，并获取偏移量预测卷积层63的输出作为偏移量Off。

最后，将偏移量Off和目标特征F2输入可形变卷积层64，并获取可形变卷积层64的输出作为对齐结果Fa。

进一步的，设：参考特征F1和目标特征F2的特征维度为C×H×W，则相似度特征Fc的特征维度为(d*d)×H×W，偏移量预测特征Ft的特征维度为(d*d+C)×H×W；其中，d为第一预设值。

本公开实施例提供的图像对齐方法首先获取包括目标图像中的像素点对应的特征点的目标特征和包括参考图像中的像素点对应的特征点的参考特征，然后根据所述目标特征和所述参考特征获取包括所述目标特征中的各个特征点与对应的相关特征点的相似度的特征，再根据所述相似度特征、所述目标特征以及偏移量预测卷积层，获取所述目标特征和所述参考特征的偏移量，最后根据所述偏移量和可形变卷积层，将所述参考图像与所述目标图像对齐。由于目标特征中的各个特征点与对应的相关特征点的相似度与目标图像和参考图像之间的光流场具有很强的相关性，因此将相似度特征作为偏移量的引导，可以更加准确的预测所述目标特征和所述参考特征的偏移量，进而解决可形变卷积层的对齐结果会与对齐结果真值相差较大的问题。

作为本公开实施例一种可选的实施方式，所述目标特征为对所述目标图像中的像素点进行特征提取获取的特征，所述参考特征为对所述参考图像中的像素点进行特征提取获取的特征。

即，将从目标图像和参考图像中提取的图像分别作为目标特征和参考特征。

作为本公开实施例一种可选的实施方式，所述目标特征为对所述目标图像中的像素点进行特征提取并以预设降采样率对提取的提取进行降采样得到的特征；所述参考特征为对所述参考图像中的像素点进行特征提取并以所述预设降采样率对提取的提取进行降采样得到的特征。

示例性的，预设降采样率可以为1/16。

即，将从目标图像中提取的特征降采样为原特征的1/16作为目标特征，将从参考图像中提取的特征降采样为原特征的1/16作为参考特征。

上述实施例中，在将第一预设值设置的较大的情况下，偏移量预测卷积层可以获取足够大的感受野，但同时也会增大计算相似度特征的计算量，进而影响图像对齐效率。为了解决上述问题，上述实施例以中预设降采样率对从目标图像中提取的特征和从目标图像中提取的特征进行降采样，因此可以在保证具有足够大的感受野的同时，改善相似度特征的计算量过大，进而改善影响图像对齐效率。

此外，由于在以预设降采样率对所述目标特征和所述参考特征进行降采样并获取相似度特征后，需要将所述相似度特征与所述目标特征在通道的维度上串联获取偏移量预测特征，而在通道的维度上串联的特征的维度需要相同，因此还需要将相似度特征升采样为与目标特征维度相同的特征。即，参照图7所示，图6所示的流程基础上，本公开实施例提供的图像对齐方法还包括：对所述目标特征F2和所述参考特征F1进行降采样操作(图7以向下箭头示出)，以及对相似度特征进行升采样操作(图7以向上箭头示出)。

在进一步的，本公开实施例中还可以采用级联金字塔式架构，从多个不同的空间尺度对目标特征和参考特征进行渐进式对齐。

即，所述目标特征包括多个空间尺度的子目标特征，所述参考特征包括多个空间尺度的子参考特征，所述相似度特征多个空间尺度的子相似度特征，上述步骤S103(根据所述相似度特征、所述目标特征以及偏移量预测卷积层，获取所述目标特征和所述参考特征的偏移量)，包括：

由于上述实施例从多个空间尺度渐进式获取所述参考图像的特征与所述目标图像的特征之间偏移量，因此上述实施例可以更加准确的获取所述参考图像的特征与所述目标图像的特征之间偏移量。

所述目标特征包括多个空间尺度的子目标特征，所述参考特征包括多个空间尺度的子参考特征，所述偏移量包括多个空间尺度的子偏移量，上述步骤S104(根据所述偏移量和可形变卷积层，将所述参考图像与所述目标图像对齐)，包括：

由于上述实施例从多个空间尺度渐进式将所述参考图像与所述目标图像对齐，因此上实施例可以提升所述参考图像与所述目标图像的对齐结果的准确性。

可选的，根据所述偏移量和可形变卷积层，将所述参考图像与所述目标图像对齐，包括：

根据第n级空间尺度的子偏移量和第n-1级空间尺度的子偏移量，获取所述第n级空间尺度的目标偏移量；

根据所述第n级空间尺度的目标偏移量和所述第n级空间尺度对应的可形变卷积层，获取所述第n级空间尺度的对齐结果；

根据所述第n级空间尺度的对齐结果和所述第n-1级空间尺度的目标对齐结果，获取所述第n级空间尺度的目标对齐结果；

根据将第1级空间尺度的目标对齐结果获取所述参考图像与所述目标图像对齐的对齐结果；

其中，所述第n-1级空间尺度小于所述第n级空间尺度。

参照图8所示，图8中以采用3级级联金字塔式架构，从不同空间尺度对目标特征和参考特征进行渐进式对齐为例示出。

首先，从第1级、第2级以及第3级对应的空间尺度下获取子参考特征F1_1、F1_2、F1_3，子目标特征F2_1、F2_2以及F2_3。

然后，从第3级空间尺度开始，通过上述实施例提供的图像对齐方法，获取子参考特征F1_1和子目标特征F2_1的子偏移量Off_3及对其结果Fa_3，由于第3级空间尺度不包含上一级空间尺度，因此子偏移量Off_3直接作用于第3级空间尺度对应可形变卷积层，且第3级空间尺度的对齐结果与其目标结果相同。

其次，通过上述实施例提供的图像对齐方法，获取第2级空间尺度的子参考特征F1_2和子目标特征F2_2的子偏移量Off_2，并根据子偏移量Off_3和子偏移量Off_2生成第2级空间尺度的目标偏移量，再将第2级空间尺度的目标偏移量输入第2级空间尺度的可形变卷积层，获取第2级的对齐结果Fa_2，结合对齐结果Fa_2和第3级空间尺度的目标对其结果Fa_3，获取第2级空间尺度的目标对其结果。

最后，通过上述实施例提供的图像对齐方法，获取第1级空间尺度的子参考特征F1_1和子目标特征F2_1的子偏移量Off_1，并根据子偏移量Off_2和子偏移量Off_1生成第1级空间尺度的目标偏移量，再将第1级空间尺度的目标偏移量输入第1级空间尺度的可形变卷积层，获取第1级的对齐结果Fa_1，结合对齐结果Fa_1和第2级空间尺度的目标对其结，获取第1级空间尺度的目标对其结果(最终的对其结果)。

需要说明的是，图8中从3个不同空间尺度对目标特征和参考特征进行渐进式对齐为例示出，但本公开实施例并不限定与此，在上述实施例的基础上，还可以从其它数据量个不同空间尺度对目标特征和参考特征进行渐进式对齐。例如：从2个不同空间尺度对目标特征和参考特征进行渐进式对齐、从5个不同空间尺度对目标特征和参考特征进行渐进式对齐等，本公开实施例对此不做限定。

基于同一发明构思，作为对上述方法的实现，本公开实施例还提供了一种图像对齐装置，该装置实施例与前述方法实施例对应，为便于阅读，本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述，但应当明确，本实施例中的图像对齐装置能够对应实现前述方法实施例中的全部内容。

本公开实施例提供了一种图像对齐装置，图9为该图像对齐装置的结构示意图，如图9所示，该图像对齐装置900包括：

特征获取单元91，用于获取目标特征和参考特征；所述目标特征包括目标图像中的像素点对应的特征点，所述参考特征包括参考图像中的像素点对应的特征点；

相似度获取单元92，用于根据所述目标特征和所述参考特征，获取相似度特征；所述相似度特征包括：所述目标特征中的各个特征点与对应的相关特征点的相似度，所述目标特征中的特征点对应的相关特征点包括：所述参考特征中像素坐标与所述目标特征中的特征点的像素坐标相同和相邻的特征点；

偏移量获取单元93，用于根据所述相似度特征、所述目标特征以及偏移量预测卷积层，获取所述目标特征和所述参考特征的偏移量；

处理单元94，用于根据所述偏移量和可形变卷积层，将所述参考图像与所述目标图像对齐。

作为本公开实施例一种可选的实施方式，所述相似度获取单元92，具体用于确定所述目标特征中的第三特征点对应的第一空间域，所述第一空间域为所述第三特征点和所述第三特征点的第二预设值的邻域内的特征点形成的空间域；确定所述参考特征中的第四特征点对应的第二空间域，所述第二空间域为所述第四特征点和所述第四特征点的第二预设值的邻域内的特征点形成的空间域；所述第四特征点为所述第三特征对应的相关特征点；计算各个特征组中的特征点的外积，获取各个特征组的外积；所述特征组包括属于所述第一空间域的特征点以及属于所述第二空间域的特征点，且所述属于所述第一空间域的特征点在所述第一空间域中的位置与所述属于所述第二空间域的特征点在所述第二空间域中的位置相同；对各个特征组的外积求和，获取所述第三特征点与所述第四特征点的相似度。

或者；

作为本公开实施例一种可选的实施方式，所述偏移量获取单元93，具体用于将所述相似度特征与所述目标特征在通道的维度上串联，获取偏移量预测特征；将所述偏移量预测特征输入所述偏移量预测卷积层；获取所述偏移量预测卷积层的输出作为所述目标特征和所述参考特征的偏移量。

所述偏移量获取单元93，具体用于根据所述多个空间尺度的子相似度特征、所述多个空间尺度的子目标特征以及所述多个空间尺度的对应的偏移量预测卷积层，获取所述多个空间尺度的子目标特征和子参考特征的子偏移量。

作为本公开实施例一种可选的实施方式，所述处理单元94，具体用于将所述参考特征输入所述可形变卷积层，并通过所述偏移量控制所述可形变卷积层的卷积核的形状；

所述处理单元94，具体用于根据所述多个空间尺度的子偏移量和所述多个空间尺度的对应的可形变卷积层，获取所述多个空间尺度的子目标特征和子参考特征的对齐结果；根据所述多个空间尺度的子目标特征和子参考特征的对齐结果，将所述参考图像与所述目标图像对齐。

本实施例提供的图像对齐装置可以执行上述方法实施例提供的图像对齐方法，其实现原理与技术效果类似，此处不再赘述。

基于同一发明构思，本公开实施例还提供了一种电子设备。图10为本公开实施例提供的电子设备的结构示意图，如图10所示，本实施例提供的电子设备包括：存储器101和处理器102，所述存储器101用于存储计算机程序；所述处理器102用于在调用计算机程序时执行上述实施例提供的图像对齐方法。

本公开实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，当计算机程序被处理器执行时，使得所述计算设备实现上述实施例提供的图像对齐方法。

本公开实施例还提供一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得所述计算机实现述实施例提供的图像对齐方法。

本领域技术人员应明白，本公开的实施例可提供为方法、系统、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质上实施的计算机程序产品的形式。

处理器可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动存储介质。存储介质可以由任何方法或技术来实现信息存储，信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。根据本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

最后应说明的是：以上各实施例仅用以说明本公开的技术方案，而非对其限制；尽管参照前述各实施例对本公开进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本公开各实施例技术方案的范围。

Claims

一种图像对齐方法，包括：

获取目标特征和参考特征；所述目标特征包括所述目标图像中的像素点对应的特征点，所述参考特征包括参考图像中的像素点对应的特征点；

根据所述目标特征和所述参考特征，获取相似度特征；所述相似度特征包括：所述目标特征中的各个特征点与对应的相关特征点的相似度，所述目标特征中的特征点对应的相关特征点包括：所述参考特征中像素坐标与所述目标特征中的特征点的像素坐标相同和相邻的特征点；

根据所述相似度特征、所述目标特征以及偏移量预测卷积层，获取所述目标特征和所述参考特征的偏移量；以及

根据所述偏移量和可形变卷积层，将所述参考图像与所述目标图像对齐。
根据权利要求1所述的方法，其中所述目标特征中的第一特征点对应的相关特征点包括：第二特征点以及所述第二特征点的第一预设值的邻域内的特征点；并且

其中，所述第二特征点为所述参考特征中像素坐标与所述第一特征点的像素坐标相同的特征点。
根据权利要求1所述的方法，其中所述根据所述目标特征和所述参考特征，获取相似度特征，包括：

确定所述目标特征中的第三特征点对应的第一空间域，所述第一空间域为所述第三特征点和所述第三特征点的第二预设值的邻域内的特征点形成的空间域；

确定所述参考特征中的第四特征点对应的第二空间域，所述第二空间域为所述第四特征点和所述第四特征点的所述第二预设值的邻域内的特征点形成的空间域；所述第四特征点为所述第三特征对应的相关特征点；

计算各个特征组中的特征点的外积，获取各个特征组的外积；所述特征组包括属于所述第一空间域的特征点以及属于所述第二空间域的特征点，且所述属于所述第一空间域的特征点在所述第一空间域中的位置与所述属于所述第二空间域的特征点在所述第二空间域中的位置相同；以及

对各个特征组的外积求和，获取所述第三特征点与所述第四特征点的相似度。
根据权利要求1所述的方法，其中，

所述目标特征为对所述目标图像中的像素点进行特征提取获取的特征，所述参考特征为对所述参考图像中的像素点进行特征提取获取的特征；

或者；

所述目标特征为对所述目标图像中的像素点进行特征提取并以预设降采样率对提取的提取进行降采样得到的特征；所述参考特征为对所述参考图像中的像素点进行特征提取并以所述预设降采样率对提取的提取进行降采样得到的特征。
根据权利要求1-4任一项所述的方法，其中所述根据所述相似度特征、所述目标特征以及偏移量预测卷积层，获取所述目标特征和所述参考特征的偏移量，包括：

将所述相似度特征与所述目标特征在通道的维度上串联，获取偏移量预测特征；

将所述偏移量预测特征输入所述偏移量预测卷积层；以及

获取所述偏移量预测卷积层的输出作为所述目标特征和所述参考特征的偏移量。
根据权利要求1-4任一项所述的方法，其中所述目标特征包括多个空间尺度的子目标特征，所述参考特征包括多个空间尺度的子参考特征，所述相似度特征多个空间尺度的子相似度特征；

所述据所述相似度特征、所述目标特征以及偏移量预测卷积层，获取所述目标特征和所述参考特征的偏移量，包括：

根据所述多个空间尺度的子相似度特征、所述多个空间尺度的子目标特征以及所述多个空间尺度的对应的偏移量预测卷积层，获取所述多个空间尺度的子目标特征和子参考特征的子偏移量。
根据权利要求1-4任一项所述的方法，其中所述根据所述偏移量和可形变卷积层，将所述参考图像与所述目标图像对齐，包括：

将所述参考特征输入所述可形变卷积层，并通过所述偏移量控制所述可形变卷积层的卷积核的形状；

获取所述可形变卷积层的输出作为所述参考特征与所述目标特征的对齐结果；以及

根据所述参考特征与所述目标特征的对齐结果，将所述参考图像与所述目标图像对齐。
根据权利要求1-4任一项所述的方法，其中所述目标特征包括多个空间尺度的子目标特征，所述参考特征包括多个空间尺度的子参考特征，所述偏移量包括多个空间尺度的子偏移量；

所述根据所述偏移量和可形变卷积层，将所述参考图像与所述目标图像对齐，包括：

根据所述多个空间尺度的子偏移量和所述多个空间尺度的对应的可形变卷积层，获取所述多个空间尺度的子目标特征和子参考特征的对齐结果；以及

根据所述多个空间尺度的子目标特征和子参考特征的对齐结果，将所述参考图像与所述目标图像对齐。
根据权利要求1-4任一项所述的方法，其中所述参考图像为待修复视频的第n个图像帧，所述参考图像为所述待修复视频的第n+1个图像帧；n为正整数。
一种图像对齐装置，包括：

特征获取单元，被配置为获取目标特征和参考特征；所述目标特征包括目标图像中的像素点对应的特征点，所述参考特征包括参考图像中的像素点对应的特征点；

相似度获取单元，被配置为根据所述目标特征和所述参考特征，获取相似度特征；所述相似度特征包括：所述目标特征中的各个特征点与对应的相关特征点的相似度，所述目标特征中的特征点对应的相关特征点包括：所述参考特征中像素坐标与所述目标特征中的特征点的像素坐标相同和相邻的特征点；

偏移量获取单元，被配置为根据所述相似度特征、所述目标特征以及偏移量预测卷积层，获取所述目标特征和所述参考特征的偏移量；以及

处理单元，被配置为根据所述偏移量和可形变卷积层，将所述参考图像与所述目标图像对齐。
一种电子设备，包括：存储器和处理器，所述存储器被配置为存储计算机程序；所述处理器被配置为在调用计算机程序时，使得所述电子设备实现权利要求1-9任一项所述的图像对齐方法。
一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，当所述计算机程序被计算设备执行时，使得所述计算设备实现权利要求1-9任一项所述的图像对齐方法。
一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得所述计算机实现权利要求1-9任一项所述的图像对齐方法。