CN111488779B

CN111488779B - 视频图像超分辨率重建方法、装置、服务器及存储介质

Info

Publication number: CN111488779B
Application number: CN201910657317.5A
Authority: CN
Inventors: 史方; 郭宏; 王标; 黄梓琪
Original assignee: Changxin Intelligent Control Network Technology Co ltd
Current assignee: Changxin Intelligent Control Network Technology Co ltd
Priority date: 2019-07-19
Filing date: 2019-07-19
Publication date: 2024-02-13
Anticipated expiration: 2039-07-19
Also published as: CN111488779A

Abstract

本发明适用于计算机技术领域，提出一种视频图像超分辨率重建方法，包括：从视频流中提取至少两个连续的目标图像帧，目标图像帧包含有待识别人脸的图像信息；跟踪待识别人脸的图像信息，获取目标图像帧中的人脸序列；计算待识别人脸的目标人脸特征点热力图；采用人脸图像重建模型对人脸序列以及目标人脸特征点热力图进行人脸图像重建，得到超分辨率人脸图像。由于待识别人脸特征点热力图包含有有效的人脸特征，因此采用预先训练完成的人脸图像重建模型对人脸序列以及目标人脸特征点热力图进行人脸图像重建，能够准确地还原出视频中的人脸细节，提高人脸图像重建的精度。本发明还提出一种视频图像超分辨率重建装置、服务器及存储介质。

Description

视频图像超分辨率重建方法、装置、服务器及存储介质

技术领域

本发明属于计算机技术领域，尤其涉及一种视频图像超分辨率重建方法、装置、服务器及存储介质。

背景技术

在监控安防应用中，经常需要从视频监控得到的图像中查找一些特殊身份的人，而由于行人与摄像头之间的距离较远以及摄像头分辨率有限等原因往往无法直接准确识别出视频监控图像中的行人。人脸作为图像中经常被关注的敏感区域，对特定身份的人的识别起到至关重要的作用，但是从视频监控中获取的低分辨率人脸图像包含信息量比较少，同时伴随着姿态、表情、光照等因素使得提取有效的人脸特征较为困难，增加了人脸图像重建的难度。因此，如何准确地还原出视频中的人脸细节，提高人脸图像重建的精度，得到超分辨率的人脸图像是亟待解决的问题。

发明内容

有鉴于此，本发明实施例提供了一种视频图像超分辨率重建方法、装置、服务器及存储介质，以解决现有技术中无法准确地还原出视频中的人脸细节的问题，提高人脸图像重建的精度。

本发明实施例的第一方面提供了一种视频图像超分辨率重建方法，包括：

从视频流中提取至少两个连续的目标图像帧，所述目标图像帧包含有待识别人脸的图像信息；

跟踪所述待识别人脸，获取所述连续的目标图像帧中的人脸序列；

计算所述待识别人脸的目标人脸特征点热力图；

采用预先训练完成的人脸图像重建模型对所述人脸序列以及所述目标人脸特征点热力图进行人脸图像重建，得到超分辨率人脸图像。

可选地，在所述根据预先训练完成的人脸图像重建模型对所述人脸序列进行人脸图像重建，得到超分辨率人脸图像之前，包括：

从预先确定的视频流中获取2n+1帧的第一分辨率人脸图像；

对所述2n+1帧的第一分辨率人脸图像进行下采样处理，得到2n+1帧的第二分辨率人脸图像，所述第一分辨率高于所述第二分辨率；

从所述2n+1帧的第一分辨率人脸图像中获取第n帧第一分辨率人脸图像，基于所述第n帧第一分辨率人脸图像和所述2n+1帧的第二分辨率人脸图像生成人脸特征对；

将所述人脸特征对输入预先建立的对抗神经网络模型进行训练，得到生成网络输出的生成人脸图像，所述生成人脸图像的分辨率与所述第n帧第一分辨率人脸图像的分辨率相同，所述对抗神经网络模型包括生成网络和识别网络；

分别计算所述生成人脸图像的人脸特征点热力图和所述第n帧第一分辨率人脸图像的人脸特征点热力图；

基于所述生成人脸图像的人脸特征点热力图、所述第n帧第一分辨率人脸图像的人脸特征点热力图以及所述人脸特征对训练所述对抗神经网络模型，得到训练完成的所述人脸图像重建模型。

可选地，所述分别计算生成人脸图像的人脸特征点热力图和所述第n帧第一分辨率人脸图像的人脸特征点热力图，包括：

检测所述生成人脸图像中的第一人脸关键特征点以及检测所述第n帧第一分辨率人脸图像中的第二人脸关键特征点；

计算所述第一人脸关键特征点分别在所述生成人脸图像中的第一概率分布，以及计算所述第二人脸关键特征点分别在所述第n帧第一分辨率人脸图像中的第二概率分布；

基于所述第一概率分布形成第一概率分布图，所述第一概率分布图为所述生成人脸图像的人脸特征点热力图；

基于所述第二概率分布形成第二概率分布图，所述第二概率分布图为所述第n帧第一分辨率人脸图像的人脸特征点热力图。

可选地，所述人脸图像重建模型为：

G′_loss＝G_loss+α·l_geatmap+β·l_p

其中，G′_loss为所述人脸图像重建模型的损失函数，G_loss为生成网络的损失函数，α，β为常数项，l_heatmap为由所述生成人脸图像的人脸特征点热力图与所述第n帧第一分辨率人脸图像的人脸特征点热力图决定的损失函数，l_p为由所述生成人脸图像的人脸关键特征点与所述第n帧第一分辨率人脸图像的人脸关键特征点决定的感知损失函数。

可选地，所述由所述生成人脸图像的人脸特征点热力图与所述第n帧第一分辨率人脸图像的人脸特征点热力图决定的损失函数l_heatmap表示为：

其中，为所述生成人脸图像G(X)中坐标位置为(i,j)的第n个第一关键特征点的热力图，/>为所述第n帧第一分辨率人脸图像中坐标位置为(i,j)的第n个第二关键特征点对应的热力图。

可选地，所述由所述生成人脸图像的人脸关键特征点与所述第n帧第一分辨率人脸图像的人脸关键特征点决定的感知损失函数l_p表示为：

其中，len表示所述生成人脸图像的人脸关键特征点和所述第n帧第一分辨率人脸图像的人脸关键特征点的维度，T_i表示所述生成人脸图像的人脸特征中的第i个特征点，P_i表示所述第n帧第一分辨率人脸图像的人脸特征中的第i个特征点。

本发明实施例的第二方面提供了一种视频图像超分辨率重建装置，包括：

提取模块，用于从视频流中提取至少两个连续的目标图像帧，所述目标图像帧包含有待识别人脸的图像信息；

第一获取模块，用于跟踪所述待识别人脸，获取所述连续的目标图像帧中的人脸序列；

计算模块，用于计算所述待识别人脸的待识别人脸特征点热力图；

重建模块，用于采用预先训练完成的人脸图像重建模型对所述人脸序列进行人脸图像重建，得到超分辨率人脸图像。

可选地，还包括：

第二获取模块，用于从预先确定的视频流中获取2n+1帧的第一分辨率人脸图像；

采样处理模块，用于对所述2n+1帧的第一分辨率人脸图像进行下采样处理，得到2n+1帧的第二分辨率人脸图像，所述第一分辨率高于所述第二分辨率；

第三获取模块，用于从所述2n+1帧的第一分辨率人脸图像中获取第n帧第一分辨率人脸图像，基于所述第n帧第一分辨率人脸图像和所述2n+1帧的第二分辨率人脸图像生成人脸特征对；

第一训练模块，用于将所述人脸特征对输入预先建立的对抗神经网络模型进行训练，得到生成网络输出的生成人脸，所述生成人脸的分辨率与所述第n帧第一分辨率人脸图像的分辨率相同，所述对抗神经网络模型包括生成网络和识别网络；

计算模块，用于分别计算所述生成人脸图像的人脸特征点热力图和所述第n帧第一分辨率人脸图像的人脸特征点热力图；

第二训练模块，用于基于所述生成人脸图像的人脸特征点热力图、所述第n帧第一分辨率人脸图像的人脸特征点热力图以及所述人脸特征对训练所述对抗神经网络模型，得到训练完成的所述人脸图像重建模型。

本发明实施例的第三方面提供了一种服务器，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上任一实施例所述视频图像超分辨率重建方法的步骤。

本发明实施例的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如上任一实施例所述视频图像超分辨率重建方法。

本发明实施例与现有技术相比存在的有益效果是：首先从目标图像帧中获取待识别人脸的人脸序列，以及计算所述待识别人脸的目标人脸特征点热力图；然后根据预先训练完成的人脸图像重建模型对所述人脸序列以及所述目标人脸特征点热力图进行人脸图像重建。由于待识别人脸特征点热力图包含有有效的人脸特征，因此采用预先训练完成的人脸图像重建模型对人脸序列以及目标人脸特征点热力图进行人脸图像重建，能够准确地还原出视频中的人脸细节，提高人脸图像重建的精度。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明第一实施例提供的视频图像超分辨率重建方法的实现流程；

图2是本发明第二实施例提供的视频图像超分辨率重建方法的实现流程；

图3是图2中S205的具体实施流程；

图4是本发明提供的视频图像超分辨率重建装置的装置示意图；

图5是本发明提供的服务器的示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本发明实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本发明的描述。

为了说明本发明所述的技术方案，下面通过具体实施例来进行说明。如图1所示，是本发明第一实施例提供的视频图像超分辨率重建方法的实现流程，本实施例的执行主体为服务器。详述如下：

S101，从视频流中提取至少两个连续的目标图像帧，所述目标图像帧包含有待识别人脸的图像信息。

目标视频流是从视频监控图像中获取的包含有人脸图像的关键图像帧。该关键图像帧为包含有完整的人脸图像信息的图像帧，例如常见的动态图像组标准格式(MPEG，Moving Pictures Experts Group)格式的监控视频中的I帧就保存有完成的人脸图像信息，这是由于在MPEG格式中I帧不使用运动补偿，故保存有完整的人脸图像信息。可以将MPEG格式的监控视频中的I帧作为所述目标图像帧。而对于一些比较大的视频，如画面组(Group of Pictures，GOP)，也可以选用I帧和P帧作为所述目标图像帧，在此不做具体限制。在本实施例中，所述目标图像帧包含有完整的待识别人脸的图像信息。所述待识别人脸的图像信息可以允许有一定程度的遮挡，如佩戴墨镜或者口罩等，但是不能完全遮挡。

S102，跟踪所述待识别人脸，获取所述连续的目标图像帧中的人脸序列。

可以理解地，在视频图像中，包含的人脸可以是一个人脸或多个人脸，因此，需要跟踪目标图像帧中的待识别人脸的图像信息，获取所述待识别人脸对应的完整的人脸序列。具体地，在本实施例中，获取的人脸序列在时间上是连续的，由所述目标图像帧中待识别人脸的图像组成。

S103，计算所述待识别人脸的待识别人脸特征点热力图。

具体地，可以通过预设的人脸关键点检测算法对待识别人脸的图像进行人脸关键点定位，其中，人脸关键点包括嘴部、眼睛、鼻子等，得到待识别人脸的关键特征点，所述预设的人脸检测算法包括但不限于如人脸关键点检测算法(Multi-task CascadedConvolutional Networks，MTCNN)；在得到待识别人脸的关键特征点之后，计算所述待识别人脸的关键特征点在所述待识别人脸中的概率分布，基于所述概率分布形成概率分布图，所述概率分布图为所述待识别人脸特征点热力图。

S104，采用预先训练完成的人脸图像重建模型对所述人脸序列以及所述目标人脸特征点热力图进行人脸图像重建，得到超分辨率人脸图像。

所述预先训练完成的人脸图像重建模型为在常见的对抗神经网络模型中加入了人脸特征点标定网络，其中，人脸特征点标定网络为在所述对抗神经网络模型中加入第一人脸特征点热力图和第二人脸特征点热力图并进行训练之后得到的网络，所述人脸特征点标定网络可以对人脸特征点热力图中的有效人脸特征进行标定，所述对抗神经网络对所述人脸特征点标定网络标定的有效人脸特征进行识别，完成图像重建。因此，能够更有效地根据图像的多帧信息还原图片的细节信息，提高低质量人脸小图识别率。

由上述实施例可知，本发明提出的视频图像超分辨率重建方法，通过从目标图像帧中获取待识别人脸的人脸序列，以及计算所述待识别人脸的目标人脸特征点热力图；获得有效的人脸特征，然后根据预先训练完成的人脸图像重建模型对所述人脸序列以及所述目标人脸特征点热力图进行人脸图像重建。能够准确地还原出视频中的人脸细节，提高人脸图像重建的精度。

具体地，如图2所示，是本发明第二实施例提供的视频图像超分辨率重建方法的实现流程。由图2可知，本实施例与图1所示实施例相比，S207与S101的具体实施过程相同，S208与S102的具体实施过程相同，S209与S103的具体实施过程相同，S210与S104的具体实施过程相同，不同点在于，S201～S206，S207～S210与上一实施例中的S101～S104相同，S207～S210具体请参阅上一实施例中S101～S104的相关描述，此处不赘述。S201～S206在S210之前执行即可。具体地，S201-S206的实施过程如下：

S201，从预先确定的视频流中获取2n+1帧的第一分辨率人脸图像。

预先确定的视频流可以为不同监控设备的监控视频，所述监控视频包含有高清视频以及模糊视频，且视频的录制在时间上具有连续性。在本实施例中，获取2n+1帧的第一分辨率人脸图像，所述第一分辨率人脸图像为高清人脸图像。

S202，对所述2n+1帧的第一分辨率人脸图像进行下采样处理，得到2n+1帧的第二分辨率人脸图像，所述第一分辨率高于所述第二分辨率。

具体地，采用预设的图像下采样算法，如双线性插值算法，快速模糊算(fastBlur)，高斯模糊算法(Gaussian blur)以及各种压缩算法对所述2n+1帧的第一分辨率人脸图像进行下采样处理，在本实施例中，将2n+1帧的第一分辨率人脸图像进行下采样处理缩小2-8倍，得到2n+1帧的第二分辨率人脸图像。由上面的下采样处理过程可知，所述第一分辨率高于所述第二分辨率。

S203，从所述2n+1帧的第一分辨率人脸图像中获取第n帧第一分辨率人脸图像，基于所述第n帧第一分辨率人脸图像和所述2n+1帧的第二分辨率人脸图像生成人脸特征对。

具体地，所述第n帧第一分辨率人脸图像为高清晰的人脸图像；人脸特征对由所述第n帧第一分辨率人脸图像和一帧第二分辨率人脸图像组成。

S204，将所述人脸特征对输入预先建立的对抗神经网络模型进行训练，得到生成网络输出的生成人脸图像，所述生成人脸图像的分辨率与所述第n帧第一分辨率人脸图像的分辨率相同，所述对抗神经网络模型包括生成网络和识别网络；

可选地，所述预先建立的对抗神经网络的生成网络包括但不限于GAN网络、WGAN网络、BEGAN网络或者DCGAN网络。

具体地，将所述第n帧第一分辨率人脸图像输入预设的人脸特征提取网络，获取所述人脸特征提取网络输出的人脸特征。其中，人脸特征提取网络包括但不限于，Vgg、InsightFace、SphereFace和DeepID等。

基于所述2n+1帧的第二分辨率的人脸图像生成第二分辨率的人脸序列，将所述第二分辨率的人脸序列输入所述生成网络中，进行训练，得到所述生成网络输出的生成人脸图像。具体地，所述生成人脸图像与所述第n帧第一分辨率人脸图像的分变率相同。

S205，分别计算所述生成人脸图像的人脸特征点热力图和所述第n帧第一分辨率人脸图像的人脸特征点热力图。

具体地，如图3所示，是图2中S205的具体实施流程。由图3可知，S205，包括：

S2051，检测所述生成人脸图像中的第一人脸关键特征点以及检测所述第n帧第一分辨率人脸图像中的第二人脸关键特征点。

具体地，根据预设的人脸关键点检测算法，如人脸关键点检测算法(Multi-taskCascaded Convolutional Networks，MTCNN)检测所述生成人脸图像中的第一人脸关键特征点以及所述第n帧第一分辨率人脸图像中的第二人脸关键特征点。所述第一人脸关键特征点和所述第二人脸关键特征点均为可显示人脸特征的点，例如鼻子、眼睛、下巴、额头等的位置点。

S2052，计算所述第一人脸关键特征点在所述生成人脸图像中的第一概率分布，以及计算所述第二人脸关键特征点在所述第n帧第一分辨率人脸图像中的第二概率分布。

具体地，预设所述生成人脸图像在预设坐标系中的位置信息；根据所述生成人脸图像在预设坐标系中的位置信息确定第一高斯概率分布函数的σ₁，σ₁为所述第一高斯概率分布函数的宽度参数，影响第一高斯概率分布函数的作用范围；根据所述生成人脸图像在预设坐标系中的位置信息以及σ₁构造第一高斯概率分布函数；所述第一高斯概率分布公式为所述第一人脸关键特征点的高斯概率分布函数，其可以表示为：

其中，(x₁,y₁)为第一人脸关键特征点在所述生成人脸图像中的位置坐标根据所述第一高斯概率分布函数可以确定第一概率分布。

预设所述第n帧第一分辨率人脸图像在预设坐标系中的位置信息；根据所述第n帧第一分辨率人脸图像在预设坐标系中的位置信息确定第二高斯概率分布函数的σ₂，σ₂为所述第二高斯概率分布函数的宽度参数，影响第二高斯概率分布函数的作用范围；根据所述第n帧第一分辨率人脸图像在预设坐标系中的位置信息以及σ₂构造第二高斯概率分布函数；所述第二高斯概率分布公式为所述第二人脸关键特征点的高斯概率分布函数，其可以表示为：

其中，(x₂,y₂)为第二人脸关键特征点在所述第n帧第一分辨率人脸图像中的位置坐标；根据所述第二高斯概率分布函数可以确定第二概率分布。

S2053，基于所述第一概率分布形成第一概率分布图，所述第一概率分布图为所述生成人脸图像的人脸特征点热力图。

将所述第一概率分布进行归一化处理之后，映射到预设的第一灰度图像，得到第一概率分布图。

S2054，基于所述第二概率分布形成第二概率分布图，所述第二概率分布图为所述第n帧第一分辨率人脸图像的人脸特征点热力图。

将所述第二概率分布进行归一化处理之后，映射到预设的第二灰度图像，得到所述第二概率分布图。

所述第一灰度图像与所述第二灰度图像相同。

S206，基于所述生成人脸图像的人脸特征点热力图、所述第n帧第一分辨率人脸图像的人脸特征点热力图以及所述人脸特征对训练所述对抗神经网络模型，得到训练完成的所述人脸图像重建模型。

具体地，当生成网络输出的生成人脸图像的分辨率与所述第n帧第一分辨率人脸图像的分辨率相同时，生成网络的第一损失函数对应的失真值低于预设的失真阈值，加入生成人脸图像的人脸特征点热力图和第n帧第一分辨率人脸图像的人脸特征点热力图，进行训练，可以优化神经网络，能够有效根据多帧信息还原图片的细节信息，提高人脸重建的准确率。

具体地，所述人脸图像重建模型为：

G′_loss＝G_loss+α·l_heatmap+β·l_p

其中，G′_loss为所述人脸图像重建模型的损失函数，G_loss为生成网络的损失函数，α，β为常数项，l_heatmap为由生成人脸图像的人脸特征点热力图与第n帧第一分辨率的人脸图像的人脸特征点热力图决定的损失函数，l_p为由第一人脸关键特征点与第二人脸关键特征点决定的感知损失函数。

具体地，所述由所述生成人脸图像的人脸特征点热力图与所述第n帧第一分辨率的人脸图像的人脸特征点热力图决定的损失函数l_heatmap表示为：

其中，为所述生成人脸图像中坐标位置为(i,j)的第n个关键特征点的热力图，/>为所述第n帧第一分辨率人脸图像中坐标位置为(i,j)的第n个关键特征点对应的热力图。

具体地，所述所述由所述生成人脸图像的人脸关键特征点与所述第n帧第一分辨率人脸图像的人脸关键特征点决定的感知损失函数l_p表示为：

其中，len表示所述生成人脸图像的人脸关键特征点和所述第n帧第一分辨率人脸图像的人脸关键特征点的维度，T_i表示所述生成人脸图像的人脸关键特征点中的第i个特征点，P_i表示所述第n帧第一分辨率人脸图像的人脸关键特征点中的第i个特征点。

通过上述分析可知，本发明提出的视频图像超分辨率重建方法，通过从目标图像帧中获取待识别人脸的人脸序列，以及计算所述待识别人脸的目标人脸特征点热力图；然后在训练人脸图像重建模型的过程中，当对抗神经网络的生成网络的损失函数的失真值低于预设的失真阈值时，加入第一人脸特征点热力图和第二人脸特征点热力图，对神经网络进行优化，使得训练完成的人脸图像重建模型能够准确地还原出视频中的人脸细节，提高人脸图像重建的精度。

图4是本发明提供的视频图像超分辨率重建装置的装置示意图。如图4所示，该实施例的视频图像超分辨率重建装置4包括：提取模块410、第一获取模块420、计算模块430以及重建模块440。其中，

提取模块410，用于从视频流中提取至少两个连续的目标图像帧，所述目标图像帧包含有待识别人脸的图像信息；

第一获取模块420，用于跟踪所述待识别人脸，获取所述连续的目标图像帧中的人脸序列；

第一计算模块430，用于计算所述待识别人脸的目标人脸特征点热力图；

重建模块440，用于采用预先训练完成的人脸图像重建模型对所述人脸序列以及所述目标人脸特征点热力图进行人脸图像重建，得到超分辨率人脸图像。

可选地，还包括：

第二计算模块，用于分别计算所述生成人脸图像的人脸特征点热力图和所述第n帧第一分辨率人脸图像的人脸特征点热力图；

可选地，第二计算模块，包括：

检测单元，用于检测所述可识别的人脸图像中的第一人脸关键特征点以及检测所述第一分辨率人脸图像序列中的第二人脸关键特征点；

第二计算单元，用于计算所述第一人脸关键特征点分别在所述可识别的人脸图像中的第一概率分布，以及计算所述第二人脸关键特征点分别在所述第一分辨率人脸图像序列中的第二概率分布；

第一形成单元，用于基于所述第一概率分布形成第一概率分布图，所述第一概率分布图为所述第一人脸特征点热力图；

第二形成单元，用于基于所述第二概率分布形成第二概率分布图，所述第二概率分布图为所述第二人脸特征点热力图。

可选地，所述人脸图像重建模型为：

G′_loss＝G_loss+α·l_heatmap+β·l_p

其中，G′_loss为所述人脸图像重建模型的损失函数，G_loss为生成网络的损失函数，α，β为常数项，l_heatmap为由所述第一人脸特征点热力图与所述第二人脸特征点热力图决定的损失函数，l_p为由所述第一人脸关键特征点与所述第二人脸关键特征点决定的感知损失函数。

可选地，所述由所述第一人脸特征点热力图与所述第二人脸特征点热力图决定的损失函数l_heatmap表示为：

其中，为所述可识别的人脸图像G(X)中坐标位置为(i,j)的第n个第一关键特征点的热力图，/>为所述第一分辨率人脸图像序列帧中坐标位置为(i,j)的第n个第二关键特征点对应的热力图。

可选地，所述由所述第一人脸关键特征点与所述第二人脸关键特征点决定的感知损失函数l_p表示为：

其中，len表示第一人脸关键特征点和第二人脸关键特征点的维度，T_i表示所述第一人脸关键特征点中的第i个特征点，P_i表示所述第二人脸关键特征点中的第i个特征点。

图5是本发明提供的服务器的示意图。如图5所示，该实施例的服务器5包括：处理器50、存储器51以及存储在所述存储器51中并可在所述处理器50上运行的计算机程序52，例如视频图像超分辨率重建程序。所述处理器50执行所述计算机程序52时实现上述各个视频图像超分辨率重建方法实施例中的步骤，例如图1所示的步骤101至104。或者，所述处理器50执行所述计算机程序52时实现上述样本取样设备实施例中各模块/单元的功能，例如图4所示模块410至440的功能。

示例性的，所述计算机程序52可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器51中，并由所述处理器50执行，以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序52在所述服务器5中的执行过程。例如，所述计算机程序52可以被分割成提取模块、获取模块、计算模块、重建模块(虚拟装置中的模块)，各模块具体功能如下：

提取模块，用于从目标视频流中提取连续的目标图像帧，所述目标图像帧包含有待识别人脸；

第一计算模块，用于计算所述待识别人脸的待识别人脸特征点热力图；

重建模块，用于根据预先训练完成的人脸图像重建模型对所述人脸序列进行人脸图像重建，得到超分辨率人脸图像。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本发明所提供的实施例中，应该理解到，所揭露的装置/终端设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/终端设备实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个通信单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种视频图像超分辨率重建方法，其特征在于，包括：

计算所述待识别人脸的目标人脸特征点热力图；

采用预先训练完成的人脸图像重建模型对所述人脸序列以及所述目标人脸特征点热力图进行人脸图像重建，得到超分辨率人脸图像；

在所述采用预先训练完成的人脸图像重建模型对所述人脸序列以及所述目标人脸特征点热力图进行人脸图像重建，得到超分辨率人脸图像之前，包括：

从预先确定的视频流中获取2n+1帧的第一分辨率人脸图像；

基于所述生成人脸图像的人脸特征点热力图、所述第n帧第一分辨率人脸图像的人脸特征点热力图以及所述人脸特征对训练所述对抗神经网络模型，得到训练完成的所述人脸图像重建模型；

所述分别计算所述生成人脸图像的人脸特征点热力图和所述第n帧第一分辨率人脸图像的人脸特征点热力图，包括：

2.如权利要求1所述的视频图像超分辨率重建方法，其特征在于，所述人脸图像重建模型为：

G′_loss ＝G_loss +α·l_heatmap +β·l p

其中，G′_loss 为所述人脸图像重建模型的损失函数，G_loss 为生成网络的损失函数，α，β为常数项，l_heatmap 为由所述生成人脸图像的人脸特征点热力图与所述第n帧第一分辨率人脸图像的人脸特征点热力图决定的损失函数，l p 为由所述生成人脸图像的人脸关键特征点与所述第n帧第一分辨率人脸图像的人脸关键特征点决定的感知损失函数。

3.如权利要求2所述的视频图像超分辨率重建方法，其特征在于，所述由所述生成人脸图像的人脸特征点热力图与所述第n帧第一分辨率人脸图像的人脸特征点热力图决定的损失函数l_heatmap表示为：

4.如权利要求2所述的视频图像超分辨率重建方法，其特征在于，所述由所述生成人脸图像的人脸关键特征点与所述第n帧第一分辨率人脸图像的人脸关键特征点决定的感知损失函数l_p 表示为：

5.一种视频图像超分辨率重建装置，其特征在于，包括：

重建模块，用于采用预先训练完成的人脸图像重建模型对所述人脸序列进行人脸图像重建，得到超分辨率人脸图像；

还包括：

第二训练模块，用于基于所述生成人脸图像的人脸特征点热力图、所述第n帧第一分辨率人脸图像的人脸特征点热力图以及所述人脸特征对训练所述对抗神经网络模型，得到训练完成的所述人脸图像重建模型；

其中所述分别计算所述生成人脸图像的人脸特征点热力图和所述第n帧第一分辨率人脸图像的人脸特征点热力图，包括：

6.一种服务器，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述视频图像超分辨率重建方法的步骤。

7.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至4任一项所述视频图像超分辨率重建方法的步骤。