CN110415172B - 一种面向混合分辨率码流中人脸区域的超分辨率重建方法 - Google Patents
一种面向混合分辨率码流中人脸区域的超分辨率重建方法 Download PDFInfo
- Publication number
- CN110415172B CN110415172B CN201910618147.XA CN201910618147A CN110415172B CN 110415172 B CN110415172 B CN 110415172B CN 201910618147 A CN201910618147 A CN 201910618147A CN 110415172 B CN110415172 B CN 110415172B
- Authority
- CN
- China
- Prior art keywords
- resolution
- face
- image
- frame
- low
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000008569 process Effects 0.000 claims abstract description 18
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 14
- 230000014759 maintenance of location Effects 0.000 claims abstract description 10
- 238000012549 training Methods 0.000 claims abstract description 9
- 238000012360 testing method Methods 0.000 claims abstract description 5
- 239000013598 vector Substances 0.000 claims description 12
- 230000004913 activation Effects 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 2
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种面向混合分辨率码流中人脸区域的超分辨率重建方法,包括基于视频编码的码流信息的高分辨率参考人脸生成,根据I帧中高分辨率人脸区域生成P帧低分辨率人脸区域的高清参考图像;基于人脸特征保持约束的卷积神经网络构建;基于人脸特征保持约束的卷积神经网络训练与测试,并使用训练好的网络实现低分辨率人脸图像的超分辨率重建。本发明基于视频编码的码流信息构建高分辨率参考图像,以高分辨率参考图像与超分辨率重建高清人脸图像之间人脸特征相似性为约束,指导低分辨率人脸图像的超分辨率重建过程,充分利用高分辨率图像中人脸特征信息,人脸特征保持完好,可显著提升解码后人脸区域的可识别性。
Description
技术领域
本发明涉及图像处理技术领域,具体涉及一种面向混合分辨率码流中人脸区域的超分辨率重建方法。
背景技术
近年来,随着“平安城市”建设的不断推进,我国的监控摄像机总数已经超过了3000万,这些摄像机每日产生海量监控视频,即使采集的监控视频通常已经过视频编码器,如x264编码过,其数据量仍然很大,为数据中心的存储能力提出了巨大挑战。
为了进一步降低监控视频的数据量,监控视频变分辨率编码方法被提出。该方法采用分层编码思想,首先对视频整体下采样编码,作为第一层低分辨率视频码流;其次对I帧进行人脸区域检测,提取人脸图像,保持原有分辨率编码,作为第二层高分辨率人脸图像码流。该方法可以在大幅降低码率的同时,保证I帧中人脸区域的质量。然而,P帧中人脸区域分辨率降低,在视频播放时存在明显的视觉跳变。因此,需要研究人脸区域超分辨率重建方法,提升P帧中低分辨率人脸的分辨率。
在现有的超分辨率重建技术中,与变分辨率编码最为契合的是基于参考的超分辨率重建方法。这一类方法使用与待超分辨率重建图像相似视角的高分辨率图像作为参考,指导低分辨率图像的超分辨率重建过程。通过卷积神经网络提取并融合参考图像与低分辨率图像特征,再经过特征解码获得最终超分辨率重建后的高清图像。
然而,本申请发明人在实施本发明的过程中,发现现有技术的方法,至少存在如下技术问题:
第一,现有的方法需要通过特征匹配将高清参考图像与待超分辨率重建图像配准,从而利用高分辨率参考图像中的信息。由于待超分辨率重建图像分辨率较低,其图像特征与对应的高分辨率图像特征存在一定差异,且特征匹配在噪声干扰的情况下鲁棒性较差,导致配准过程存在误差,超分辨率重建图像精度降低。第二,现有的方法较为普适,并未针对人脸特征保持的需求进行设计,超分辨率重建图像虽然包含细节信息,但关键的人脸特征可能丢失,导致人脸区域图像质量降低,影响人脸区域的可识别性。
发明内容
有鉴于此,本发明提供了一种面向混合分辨率码流中人脸区域的超分辨率重建方法,用以解决或者至少部分解决现有技术中的方法存在的超分辨率重建图像精度不高、可识别性不够的技术问题。
本发明提供了一种面向混合分辨率码流中人脸区域的超分辨率重建方法,包括:
步骤S1:根据I帧中高分辨率人脸区域生成P帧低分辨率人脸区域的高清参考图像;
步骤S2:构建基于人脸特征保持约束的卷积神经网络,包括:设计双流卷积神经网络,用以提取高分辨率参考图像与P帧低分辨率人脸图像特征,融合分辨率参考图像的特征和P帧低分辨率人脸图像特征,并解码得到P帧高分辨率人脸图像;
步骤S3:对卷积神经网络模型进行训练与测试,获得训练好的网络模型;
步骤S4:将待超分辨率重建的低分辨率人脸图像与步骤S1中生成的高分辨率参考图像输入训练好的网络模型,输出高分辨率人脸图像。
在一种实施方式中,步骤S1具体包括:
步骤S1.1:对低分辨率视频码流进行解码,提取出低分辨率视频帧、人脸区域位置信息、视频帧宏块划分信息以及每个图像宏块的运动矢量信息;
步骤S1.2:根据人脸区域位置信息以及视频帧宏块划分信息提取人脸区域图像宏块;
步骤S1.3:对于P帧中每一个人脸区域图像宏块,根据对应的运动矢量信息在I帧中查找出对应的低分辨率参考图像宏块;
步骤S1.4:对高分辨率人脸图像码流进行解码,得到I帧中人脸区域的高分辨率图像;
步骤S1.5:根据I帧中人脸区域低分辨率图像宏块与高分辨率图像宏块的对应关系,查找出P帧中人脸区域图像宏块的高分辨率参考图像宏块;
步骤S1.6:将步骤S1.5中得到的所有高分辨率参考图像宏块拼接成P帧人脸区域的高分辨率参考图像。
在一种实施方式中,步骤S2具体包括:
步骤S2.1:构建低分辨率人脸图像特征编码器分支,其中,该分支用于提取低分辨率人脸图像特征,包含6个卷积层与1个全连接层;
步骤S2.2:构建高分辨率参考图像特征编码器分支,其中,该分支用于提取高分辨率参考图像特征,包含6个卷积层与1个全连接层;
步骤S2.3:设置用以对低分辨率人脸图像的特征与高分辨率参考图像特征进行融合的全连接层;
步骤S2.4:构建融合特征解码器,用以对融合后特征进行解码,生成高分辨率人脸图像,其中,融合特征解码器包含2个全连接层与6个反卷积层。
在一种实施方式中,步骤S3具体包括:
步骤S3.1:样本预处理,对于低分辨率人脸图像样本,统一缩放至40×40大小,对于高分辨率参考图像样本,统一缩放至160×160大小;
步骤S3.2:构建人脸特征保持约束与损失函数,设置网络初始参数,对网络模型进行训练,并使用反向传播算法更新网络参数。
在一种实施方式中,步骤S1.3中搜索低分辨率参考宏块的过程通过使用运动矢量进行位移实现,参考宏块在参考帧中的像素坐标表示为:
(xref,yref)=(xcur+u,ycur+v) (1)
其中,(xref,yref)为参考宏块在参考帧中的坐标,(xcur,ycur)为当前宏块在当前帧中的坐标,(u,v)为当前宏块的运动矢量。
在一种实施方式中,步骤S2.1与步骤S2.2中,对于卷积层,每一层输入与输出的关系表示为:
yout=ρ(xin*ω+b)↓ (2)
其中,xin与yout分别为该层的输入与输出信号,ω为卷积核,b为偏置,ρ(·)为激活函数,↓表示最大池化过程。
在一种实施方式中,步骤S2中涉及的所有全连接层都包含4096个神经元。
在一种实施方式中,步骤S3.2中,采用高清参考图像与网络输出的高清人脸图像的人脸特征点的相似度作为先验约束,损失函数表示为:
L=||IFH-IoH||2+μ·||F(IFH)-F(IOH)||2 (3)
其中,IFH为网络输出的高清人脸图像,IOH为与其对应的高清人脸图像样本,F(·)为图像的人脸特征点,损失函数的第一项为重建误差项;第二项为先验约束项,用以约束网络输出高清人脸图像与高清参考图像具有相似的人脸特征信息;μ为平衡系数,用以调节第一项与第二项对于结果的影响。
本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:
本发明提供的一种面向混合分辨率码流中人脸区域的超分辨率重建方法,首先,根据I帧中高分辨率人脸区域生成P帧低分辨率人脸区域的高清参考图像;然后,构建基于人脸特征保持约束的卷积神经网络,接着,对卷积神经网络模型进行训练与测试,获得训练好的网络模型;再将待超分辨率重建的低分辨率人脸图像与生成的高分辨率参考图像输入训练好的网络模型,输出高分辨率人脸图像。
与现有技术相比较,本发明基于视频编码码流信息构建高分辨率参考图像,以高分辨率参考图像与超分辨率重建高清人脸图像之间人脸特征相似性为约束,用以指导低分辨率人脸图像的超分辨率重建过程。相比于现有的基于参考的超分辨率重建方法,本发明可保持人脸特征,保障解码后人脸区域的可识别性,可以广泛应用于社区监控、智慧城市建设等方面。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种面向混合分辨率码流中人脸区域的超分辨率重建方法的流程示意图。
具体实施方式
本发明的目的在于针对现有技术中的方法存在的超分辨率重建图像精度不高、可识别性不够的技术问题,提供的一种面向混合分辨率码流中人脸区域的超分辨率重建方法,用于提高混合分辨率码流解码后P帧中人脸区域的分辨率,提升人脸图像的清晰度和可识别性。
为达到上述目的,本发明的主要构思如下:
充分利用视频编码码流中包含的信息,根据I帧中高、低分辨率人脸图像间的关系以及I帧与P帧中低分辨率人脸图像监的关系,合成P帧中人脸区域的高分辨率参考图像,将其用于P帧中低分辨率人脸超分辨率过程;同时构建人脸特征保持约束,指导低分辨率人脸图像超分辨率重建过程,为P帧低分辨率人脸提供丰富的人脸特征信息,提升P帧人脸超分辨率重建后的图像质量和保真度,提高其可识别性。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本实施例提供了一种面向混合分辨率码流中人脸区域的超分辨率重建方法,请参见图1,该方法包括:
步骤S1:根据I帧中高分辨率人脸区域生成P帧低分辨率人脸区域的高清参考图像。
具体来说,步骤S1是根据获取的视频编码的码流信息,生成高分辨率参考人脸区域。I帧为帧内编码帧,P帧为帧间预测编码帧。
在一种实施方式中,步骤S1具体包括:
步骤S1.1:对低分辨率视频码流进行解码,提取出低分辨率视频帧、人脸区域位置信息、视频帧宏块划分信息以及每个图像宏块的运动矢量信息;
步骤S1.2:根据人脸区域位置信息以及视频帧宏块划分信息提取人脸区域图像宏块;
步骤S1.3:对于P帧中每一个人脸区域图像宏块,根据对应的运动矢量信息在I帧中查找出对应的低分辨率参考图像宏块;
步骤S1.4:对高分辨率人脸图像码流进行解码,得到I帧中人脸区域的高分辨率图像;
步骤S1.5:根据I帧中人脸区域低分辨率图像宏块与高分辨率图像宏块的对应关系,查找出P帧中人脸区域图像宏块的高分辨率参考图像宏块;
步骤S1.6:将步骤S1.5中得到的所有高分辨率参考图像宏块拼接成P帧人脸区域的高分辨率参考图像。
需要说明的是,上述步骤为与I帧相邻的P帧中低分辨率人脸区域的高分辨率参考图像生成方法,后续P帧中低分辨率人脸区域则采用经过超分辨率重建的前一个P帧生成高分辨率人脸参考图像。
其中,步骤S1.3中搜索低分辨率参考宏块的过程通过使用运动矢量进行位移实现,参考宏块在参考帧中的像素坐标表示为:
(xref,yref)=(xcur+u,ycur+v) (1)
其中,(xref,yref)为参考宏块在参考帧中的坐标,(xcur,ycur)为当前宏块在当前帧中的坐标,(u,v)为当前宏块的运动矢量。
步骤S2:构建基于人脸特征保持约束的卷积神经网络,包括:设计双流卷积神经网络,用以提取高分辨率参考图像与P帧低分辨率人脸图像特征,融合分辨率参考图像的特征和P帧低分辨率人脸图像特征,并解码得到P帧高分辨率人脸图像。
具体来说,步骤S2是构建基于人脸特征保持约束的卷积神经网络,用于指导低分辨率人脸图像超分辨率重建过程,为P帧低分辨率人脸提供丰富的人脸特征信息,提升P帧人脸超分辨率重建后的图像质量和保真度,提高其可识别性。
在一种实施方式中,步骤S2具体包括:
步骤S2.1:构建低分辨率人脸图像特征编码器分支,其中,该分支用于提取低分辨率人脸图像特征,包含6个卷积层与1个全连接层;
步骤S2.2:构建高分辨率参考图像特征编码器分支,其中,该分支用于提取高分辨率参考图像特征,包含6个卷积层与1个全连接层;
步骤S2.3:设置用以对低分辨率人脸图像的特征与高分辨率参考图像特征进行融合的全连接层;
步骤S2.4:构建融合特征解码器,用以对融合后特征进行解码,生成高分辨率人脸图像,其中,融合特征解码器包含2个全连接层与6个反卷积层。
具体来说,本发明针对混合分辨率码流,分别设置用于提取低分辨率人脸图像特征的低分辨率人脸图像特征编码器分支、用于提取高分辨率参考图像特征的高分辨率参考图像特征编码器分支,然后设置一个全连接层对二者的特征进行融合,最后设置一个融合特征解码器,从而可以生成高分辨率人脸图像。
其中,步骤S2.1与步骤S2.2中,对于卷积层,每一层输入与输出的关系表示为:
yout=ρ(xin*ω+b)↓ (2)
其中,xin与yout分别为该层的输入与输出信号,ω为卷积核,b为偏置,ρ(·)为激活函数,↓表示最大池化过程。
并且,步骤S2中涉及的所有全连接层都包含4096个神经元。
步骤S3:对卷积神经网络模型进行训练与测试,获得训练好的网络模型。
在具体实施时,采用大量样本训练网络模型,并使用训练好的网络实现低分辨率人脸图像的超分辨率重建。
在一种实施方式中,步骤S3具体包括:
步骤S3.1:样本预处理,对于低分辨率人脸图像样本,统一缩放至40×40大小,对于高分辨率参考图像样本,统一缩放至160×160大小;
步骤S3.2:构建人脸特征保持约束与损失函数,设置网络初始参数,对网络模型进行训练,并使用反向传播算法更新网络参数。
具体来说,首先对采集的样本进行预处理,即缩放至设置的大小。然后通过构建人脸特征保持约束与损失函数和初始参数,对网络模型进行训练,直到损失函数收敛。此外,还采用反向传播算法更新网络参数,从而使得模型的效果更佳。
其中,步骤S3.2中,采用高清参考图像与网络输出的高清人脸图像的人脸特征点的相似度作为先验约束,损失函数表示为:
L=||IFH-IOH||2+μ·||F(IFH)-F(IOH)||2 (3)
其中,IFH为网络输出的高清人脸图像,IOH为与其对应的高清人脸图像样本,F(·)为图像的人脸特征点,损失函数的第一项为重建误差项,用以使得网络输出高清人脸图像应与真实高清人脸图像尽可能相似;第二项为先验约束项,用以约束网络输出高清人脸图像与高清参考图像具有相似的人脸特征信息;μ为平衡系数,用以调节第一项与第二项对于结果的影响。
具体来说,由于高分辨率参考图像具有较为完整的人脸特征,本发明中深度神经网络的作用是将这些人脸特征传递给网络输出的高清人脸图像,因此,本发明使用高清参考图像与网络输出的高清人脸图像的人脸特征点的相似度作为先验约束。具体实现时,本发明采用OpenCV检测并提取人脸特征点。
步骤S4:将待超分辨率重建的低分辨率人脸图像与步骤S1中生成的高分辨率参考图像输入训练好的网络模型,输出高分辨率人脸图像。
具体来说,通过前述步骤已经构建好网络模型,并经过训练和测试,得到了训练好的网络模型。那么,在具体应用过程中,则可以将将待超分辨率重建的低分辨率人脸图像与生成的高分辨率参考图像输入训练好的网络模型,从而得到高分辨率人脸图像,实现超分辨率重建。
本发明基于视频编码码流信息构建高分辨率参考图像,以高分辨率参考图像与超分辨率重建高清人脸图像之间人脸特征相似性为约束,指导低分辨率人脸图像的超分辨率重建过程,充分利用高分辨率图像中人脸特征信息,人脸特征保持完好,可显著提升解码后人脸区域的可识别性。
具体实施时,可采用软件方式实现以上流程的自动运行。通过采用以上流程进行实验可知,现有的基于参考的超分辨率方法依赖特征匹配,且未充分考虑人脸的特性,导致超分辨率重建图像中人脸关键信息的缺失。本发明基于视频编码的码流信息构建高分辨率参考图像,以高分辨率参考图像与超分辨率重建高清人脸图像之间人脸特征相似性为约束,指导低分辨率人脸图像的超分辨率重建过程,充分利用高分辨率图像中人脸特征信息,人脸特征保持完好,可显著提升解码后人脸区域的可识别性。
基于本发明执行步骤1~4所得的结果,如表1所示,相较于现有的基于参考的超分辨率重建方法,其PSNR提升1.32dB,人脸识别准确率提升9.85%。
表1
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (8)
1.一种面向混合分辨率码流中人脸区域的超分辨率重建方法,其特征在于,包括:
步骤S1:根据I帧中高分辨率人脸区域生成P帧低分辨率人脸区域的高清参考图像,具体为:根据I帧中高、低分辨率人脸图像间的关系以及I帧与P帧中低分辨率人脸图像间的关系,生成P帧低分辨率人脸区域的高清参考图像;
步骤S2:构建基于人脸特征保持约束的卷积神经网络,包括:设计双流卷积神经网络,用以提取高分辨率参考图像与P帧低分辨率人脸图像特征,融合分辨率参考图像的特征和P帧低分辨率人脸图像特征,并解码得到P帧高分辨率人脸图像,其中,以高分辨率参考图像与超分辨率重建高清人脸图像之间人脸特征相似性为约束,用以指导低分辨率人脸图像的超分辨率重建过程;
步骤S3:对卷积神经网络模型进行训练与测试,获得训练好的网络模型;
步骤S4:将待超分辨率重建的低分辨率人脸图像与步骤S1中生成的高分辨率参考图像输入训练好的网络模型,输出高分辨率人脸图像。
2.如权利要求1所述的方法,其特征在于,步骤S1具体包括:
步骤S1.1:对低分辨率视频码流进行解码,提取出低分辨率视频帧、人脸区域位置信息、视频帧宏块划分信息以及每个图像宏块的运动矢量信息;
步骤S1.2:根据人脸区域位置信息以及视频帧宏块划分信息提取人脸区域图像宏块;
步骤S1.3:对于P帧中每一个人脸区域图像宏块,根据对应的运动矢量信息在I帧中查找出对应的低分辨率参考图像宏块;
步骤S1.4:对高分辨率人脸图像码流进行解码,得到I帧中人脸区域的高分辨率图像;
步骤S1.5:根据I帧中人脸区域低分辨率图像宏块与高分辨率图像宏块的对应关系,查找出P帧中人脸区域图像宏块的高分辨率参考图像宏块;
步骤S1.6:将步骤S1.5中得到的所有高分辨率参考图像宏块拼接成P帧人脸区域的高分辨率参考图像。
3.如权利要求1所述的方法,其特征在于,步骤S2具体包括:
步骤S2.1:构建低分辨率人脸图像特征编码器分支,其中,该分支用于提取低分辨率人脸图像特征,包含6个卷积层与1个全连接层;
步骤S2.2:构建高分辨率参考图像特征编码器分支,其中,该分支用于提取高分辨率参考图像特征,包含6个卷积层与1个全连接层;
步骤S2.3:设置用以对低分辨率人脸图像的特征与高分辨率参考图像特征进行融合的全连接层;
步骤S2.4:构建融合特征解码器,用以对融合后特征进行解码,生成高分辨率人脸图像,其中,融合特征解码器包含2个全连接层与6个反卷积层。
4.如权利要求1所述的方法,其特征在于,步骤S3具体包括:
步骤S3.1:样本预处理,对于低分辨率人脸图像样本,统一缩放至40×40大小,对于高分辨率参考图像样本,统一缩放至160×160大小;
步骤S3.2:构建人脸特征保持约束与损失函数,设置网络初始参数,对网络模型进行训练,并使用反向传播算法更新网络参数。
5.如权利要求2所述的方法,其特征在于,步骤S1.3中搜索低分辨率参考宏块的过程通过使用运动矢量进行位移实现,参考宏块在参考帧中的像素坐标表示为:
(xref,yref)=(xcur+u,ycur+v) (1)
其中,(xref,yref)为参考宏块在参考帧中的坐标,(xcur,ycur)为当前宏块在当前帧中的坐标,(u,v)为当前宏块的运动矢量。
6.如权利要求3所述的方法,其特征在于,步骤S2.1与步骤S2.2中,对于卷积层,每一层输入与输出的关系表示为:
yout=ρ(xin*ω+b)↓ (2)
其中,xin与yout分别为该层的输入与输出信号,ω为卷积核,b为偏置,ρ(·)为激活函数,↓表示最大池化过程。
7.如权利要求1所述的方法,其特征在于,步骤S2中涉及的所有全连接层都包含4096个神经元。
8.如权利要求4所述的方法,其特征在于,步骤S3.2中,采用高清参考图像与网络输出的高清人脸图像的人脸特征点的相似度作为先验约束,损失函数表示为:
L=‖IFH-IOH‖2+μ·‖F(IFH)-F(IOH)‖2 (3)
其中,IFH为网络输出的高清人脸图像,IOH为与其对应的高清人脸图像样本,F(·)为图像的人脸特征点,损失函数的第一项为重建误差项;第二项为先验约束项,用以约束网络输出高清人脸图像;μ为平衡系数,用以调节第一项与第二项对于结果的影响。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910618147.XA CN110415172B (zh) | 2019-07-10 | 2019-07-10 | 一种面向混合分辨率码流中人脸区域的超分辨率重建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910618147.XA CN110415172B (zh) | 2019-07-10 | 2019-07-10 | 一种面向混合分辨率码流中人脸区域的超分辨率重建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110415172A CN110415172A (zh) | 2019-11-05 |
CN110415172B true CN110415172B (zh) | 2023-03-17 |
Family
ID=68360817
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910618147.XA Active CN110415172B (zh) | 2019-07-10 | 2019-07-10 | 一种面向混合分辨率码流中人脸区域的超分辨率重建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110415172B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110889895B (zh) * | 2019-11-11 | 2023-01-03 | 南昌大学 | 一种融合单帧重建网络的人脸视频超分辨率重建方法 |
CN111080521A (zh) * | 2019-12-12 | 2020-04-28 | 天津中科智能识别产业技术研究院有限公司 | 一种基于结构先验的人脸图像超分辨率方法 |
CN112016542A (zh) * | 2020-05-08 | 2020-12-01 | 珠海欧比特宇航科技股份有限公司 | 城市积涝智能检测方法及系统 |
CN113747099B (zh) * | 2020-05-29 | 2022-12-06 | 华为技术有限公司 | 视频传输方法和设备 |
WO2022036556A1 (zh) * | 2020-08-18 | 2022-02-24 | 香港中文大学(深圳) | 图像处理方法和装置、计算机设备及存储介质 |
CN112581370A (zh) * | 2020-12-28 | 2021-03-30 | 苏州科达科技股份有限公司 | 人脸图像的超分辨率重建模型的训练及重建方法 |
CN113033616B (zh) * | 2021-03-02 | 2022-12-02 | 北京大学 | 高质量视频重建方法、装置、设备及存储介质 |
CN112967188B (zh) * | 2021-03-04 | 2024-04-02 | 中国科学技术大学 | 结合结构化语义码流的空间自适应图像超分辨重建方法 |
CN112950478B (zh) * | 2021-03-18 | 2022-07-19 | 武汉工程大学 | 基于双重身份属性约束的人脸超分辨率方法及系统 |
CN114238692A (zh) * | 2022-02-23 | 2022-03-25 | 北京嘉沐安科技有限公司 | 一种面向网络直播的视频大数据精准检索方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109102462A (zh) * | 2018-08-01 | 2018-12-28 | 中国计量大学 | 一种基于深度学习的视频超分辨率重建方法 |
CN109543548A (zh) * | 2018-10-26 | 2019-03-29 | 桂林电子科技大学 | 一种人脸识别方法、装置及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009087641A2 (en) * | 2008-01-10 | 2009-07-16 | Ramot At Tel-Aviv University Ltd. | System and method for real-time super-resolution |
CN109949255B (zh) * | 2017-12-20 | 2023-07-28 | 华为技术有限公司 | 图像重建方法及设备 |
-
2019
- 2019-07-10 CN CN201910618147.XA patent/CN110415172B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109102462A (zh) * | 2018-08-01 | 2018-12-28 | 中国计量大学 | 一种基于深度学习的视频超分辨率重建方法 |
CN109543548A (zh) * | 2018-10-26 | 2019-03-29 | 桂林电子科技大学 | 一种人脸识别方法、装置及存储介质 |
Non-Patent Citations (2)
Title |
---|
《On_Bayesian_Adaptive_Video_Super_Resolution》;LIU Ce;《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》;20140228;第356-360页 * |
超分辨率重建算法综述;李欣等;《电视技术》;20160917(第09期);第6-14页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110415172A (zh) | 2019-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110415172B (zh) | 一种面向混合分辨率码流中人脸区域的超分辨率重建方法 | |
CN112102212B (zh) | 一种视频修复方法、装置、设备及存储介质 | |
CN113379601A (zh) | 基于降质变分自编码器的真实世界图像超分辨方法及系统 | |
CN110062232A (zh) | 一种基于超分辨率的视频压缩方法及系统 | |
Liu et al. | End-to-end neural video coding using a compound spatiotemporal representation | |
CN115131675A (zh) | 一种基于参考影像纹理迁移的遥感影像压缩方法及系统 | |
CN116233445B (zh) | 视频的编解码处理方法、装置、计算机设备和存储介质 | |
CN115393396B (zh) | 一种基于掩码预训练的无人机目标跟踪方法 | |
He et al. | A video compression framework using an overfitted restoration neural network | |
CN115552905A (zh) | 用于图像和视频编码的基于全局跳过连接的cnn滤波器 | |
Kim et al. | End-to-end learnable multi-scale feature compression for vcm | |
CN116542889A (zh) | 一种拥有稳定视点的全景视频增强方法 | |
CN116156202A (zh) | 一种实现视频错误隐藏的方法、系统、终端及介质 | |
CN118488202A (zh) | 图像压缩的处理方法、装置、电子设备及存储介质 | |
Fleig et al. | Edge-aware autoencoder design for real-time mixture-of-experts image compression | |
CN117097853A (zh) | 一种基于深度学习的实时抠像方法及系统 | |
Li et al. | Fine-grained adversarial image inpainting with super resolution | |
WO2023225808A1 (en) | Learned image compress ion and decompression using long and short attention module | |
CN110111257A (zh) | 一种基于特征通道自适应加权的超分辨图像重建方法 | |
Xie et al. | Just noticeable visual redundancy forecasting: a deep multimodal-driven approach | |
CN115147317A (zh) | 一种基于卷积神经网络的点云颜色质量增强方法及系统 | |
CN112261415B (zh) | 基于过拟合卷积自编码网络的图像压缩编码方法 | |
CN106709873A (zh) | 一种基于三次样条插值和迭代更新的超分辨率方法 | |
CN112468826A (zh) | 一种基于多层gan的vvc环路滤波方法及系统 | |
Kim et al. | Image coding based on selective super-resolution network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |