CN114549327A - 视频超分辨率方法、装置、电子设备、存储介质 - Google Patents
视频超分辨率方法、装置、电子设备、存储介质 Download PDFInfo
- Publication number
- CN114549327A CN114549327A CN202210270777.4A CN202210270777A CN114549327A CN 114549327 A CN114549327 A CN 114549327A CN 202210270777 A CN202210270777 A CN 202210270777A CN 114549327 A CN114549327 A CN 114549327A
- Authority
- CN
- China
- Prior art keywords
- feature
- hidden layer
- pixel
- video
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000012545 processing Methods 0.000 claims abstract description 64
- 238000004590 computer program Methods 0.000 claims abstract description 8
- 230000004913 activation Effects 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 20
- 238000013527 convolutional neural network Methods 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 description 12
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 7
- 238000000605 extraction Methods 0.000 description 7
- 238000001914 filtration Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 125000004122 cyclic group Chemical group 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 241000282326 Felis catus Species 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000008707 rearrangement Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本公开关于一种视频超分辨率方法、装置、电子设备、存储介质和计算机程序产品,所述方法包括:获取当前帧图像对应的隐藏层特征,隐藏层特征为视频超分辨率网络中的隐藏层网络处理当前帧图像而输出的特征,提取当前帧图像在视频中的下一帧图像所对应的图像特征,确定隐藏层特征与图像特征间的特征相似度,特征相似度用于表征相同像素位置在隐藏层特征与图像特征中所对应的特征间的相似程度,根据特征相似度调整隐藏层特征,得到调整后隐藏层特征,调整后隐藏层特征用于供视频超分辨率网络对视频进行超分辨率处理。采用本方法能够抑制相邻帧间的无关信息,以及关注相关信息,有助于网络充分利用视频中多帧的时序信息完成视频处理任务。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种视频超分辨率方法、装置、电子设备、存储介质和计算机程序产品。
背景技术
在采用卷积神经网络对视频进行超分辨率处理过程中,需要利用视频中各帧间的时序信息,通过传输不同时刻的特征,神经网络可以建立特征在时序上的长距离依赖,为最后的任务目标提供帮助。由于循环卷积神经网络会将上一时刻的特征作为下一时刻的输入,当相邻两个时刻之间的信息关联程度小时,上一时刻的特征对下一时刻无借鉴意义,甚至会成为噪声影响下一时刻的处理结果。
因此,相关技术中存在视频超分辨率处理效果较差的问题。
发明内容
本公开提供一种视频超分辨率方法、装置、电子设备、存储介质和计算机程序产品,以至少解决相关技术中存在视频超分辨率处理效果较差的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种视频超分辨率方法,包括:
获取当前帧图像对应的隐藏层特征;所述隐藏层特征为视频超分辨率网络中的隐藏层网络处理所述当前帧图像而输出的特征;所述视频超分辨率网络为对所述当前帧图像所属的视频进行超分辨率处理的卷积神经网络;
提取所述当前帧图像在所述视频中的下一帧图像所对应的图像特征,确定所述隐藏层特征与所述图像特征间的特征相似度;所述特征相似度用于表征相同像素位置在所述隐藏层特征与所述图像特征中所对应的特征间的相似程度;
根据所述特征相似度调整所述隐藏层特征,得到调整后隐藏层特征;所述调整后隐藏层特征用于供所述视频超分辨率网络对所述视频进行超分辨率处理。
在一种可能实现方式中,所述确定所述隐藏层特征与所述图像特征间的特征相似度,包括:
获取所述图像特征中各像素点对应的像素特征;
根据各所述像素点对应的像素特征,在所述隐藏层特征中确定各所述像素点对应的待比对特征;
根据所述像素特征和所述待比对特征,确定各所述像素点对应的相似度比对结果;
将各所述像素点对应的相似度比对结果作为所述特征相似度。
在一种可能实现方式中,所述图像特征具有多个特征平面,所述获取所述图像特征中各像素点对应的像素特征,包括:
将所述图像特征中的任意一个像素点,作为目标像素点;
获取所述目标像素点在所述图像特征的各特征平面所对应的像素子特征;
对各所述像素子特征进行重排,得到所述目标像素点对应的像素特征。
在一种可能实现方式中,所述隐藏层特征具有多个特征平面,所述根据各所述像素点对应的像素特征,在所述隐藏层特征中确定各所述像素点对应的待比对特征,包括:
确定所述隐藏层特征中的参照像素点;所述参照像素点的像素位置与所述目标像素点的像素位置相同;
根据所述像素特征中像素子特征的数量和所述参照像素点的像素位置,在所述隐藏层特征的各特征平面中确定待比对区域特征;
将所述待比对区域特征,作为所述目标像素点对应的待比对特征。
在一种可能实现方式中,所述根据所述像素特征和所述待比对特征,确定各所述像素点对应的相似度比对结果,包括:
将各所述像素点的像素特征作为卷积核;
采用所述卷积核对各所述像素点对应的待比对特征进行卷积运算,得到卷积值,作为各所述像素点对应的相似度比对结果。
在一种可能实现方式中,所述根据所述特征相似度调整所述隐藏层特征,得到调整后隐藏层特征,包括:
将所述特征相似度输入至预设的激活函数,得到针对所述隐藏层特征的特征调整权重;所述特征调整权重对应的值与所述特征相似度呈正相关关系;
采用所述特征调整权重对所述隐藏层特征进行加权处理,得到所述调整后隐藏层特征。
在一种可能实现方式中,所述提取所述当前帧图像在所述视频中的下一帧图像所对应的图像特征,包括:
获取所述当前帧图像在所述视频中的下一帧图像;
将所述下一帧图像输入至预设的图像特征提取网络,得到所述下一帧图像对应的图像特征。
根据本公开实施例的第二方面,提供一种视频超分辨率装置,包括:
特征获取单元,被配置为执行获取当前帧图像对应的隐藏层特征;所述隐藏层特征为视频超分辨率网络中的隐藏层网络处理所述当前帧图像而输出的特征;所述视频超分辨率网络为对所述当前帧图像所属的视频进行超分辨率处理的卷积神经网络;
相似度确定单元,被配置为执行提取所述当前帧图像在所述视频中的下一帧图像所对应的图像特征,确定所述隐藏层特征与所述图像特征间的特征相似度;所述特征相似度用于表征相同像素位置在所述隐藏层特征与所述图像特征中所对应的特征间的相似程度;
特征调整单元,被配置为执行根据所述特征相似度调整所述隐藏层特征,得到调整后隐藏层特征;所述调整后隐藏层特征用于供所述视频超分辨率网络对所述视频进行超分辨率处理。
在一种可能实现方式中,所述相似度确定单元,具体被配置为执行获取所述图像特征中各像素点对应的像素特征;根据各所述像素点对应的像素特征,在所述隐藏层特征中确定各所述像素点对应的待比对特征;根据所述像素特征和所述待比对特征,确定各所述像素点对应的相似度比对结果;将各所述像素点对应的相似度比对结果作为所述特征相似度。
在一种可能实现方式中,所述图像特征具有多个特征平面,所述相似度确定单元,具体被配置为执行将所述图像特征中的任意一个像素点,作为目标像素点;获取所述目标像素点在所述图像特征的各特征平面所对应的像素子特征;对各所述像素子特征进行重排,得到所述目标像素点对应的像素特征。
在一种可能实现方式中,所述隐藏层特征具有多个特征平面,所述相似度确定单元,具体被配置为执行确定所述隐藏层特征中的参照像素点;所述参照像素点的像素位置与所述目标像素点的像素位置相同;根据所述像素特征中像素子特征的数量和所述参照像素点的像素位置,在所述隐藏层特征的各特征平面中确定待比对区域特征;将所述待比对区域特征,作为所述目标像素点对应的待比对特征。
在一种可能实现方式中,所述相似度确定单元,具体被配置为执行将各所述像素点的像素特征作为卷积核;采用所述卷积核对各所述像素点对应的待比对特征进行卷积运算,得到卷积值,作为各所述像素点对应的相似度比对结果。
在一种可能实现方式中,所述特征调整单元,具体被配置为执行将所述特征相似度输入至预设的激活函数,得到针对所述隐藏层特征的特征调整权重;所述特征调整权重对应的值与所述特征相似度呈正相关关系;采用所述特征调整权重对所述隐藏层特征进行加权处理,得到所述调整后隐藏层特征。
在一种可能实现方式中,所述相似度确定单元,具体被配置为执行获取所述当前帧图像在所述视频中的下一帧图像;将所述下一帧图像输入至预设的图像特征提取网络,得到所述下一帧图像对应的图像特征。
根据本公开实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如上述任一项所述的视频超分辨率方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如上述任一项所述的视频超分辨率方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,所述计算机程序产品中包括指令,所述指令被电子设备的处理器执行时,使得所述电子设备能够执行如上述任一项所述的视频超分辨率方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
本公开的方案,通过获取当前帧图像对应的隐藏层特征,隐藏层特征为视频超分辨率网络中的隐藏层网络处理当前帧图像而输出的特征,视频超分辨率网络为对当前帧图像所属的视频进行超分辨率处理的卷积神经网络,然后提取当前帧图像在视频中的下一帧图像所对应的图像特征,确定隐藏层特征与图像特征间的特征相似度,特征相似度用于表征相同像素位置在隐藏层特征与图像特征中所对应的特征间的相似程度,进而根据特征相似度调整隐藏层特征,得到调整后隐藏层特征,调整后隐藏层特征用于供视频超分辨率网络对视频进行超分辨率处理。如此,可以基于当前帧图像和下一帧图像进行特征间对比得到的特征相似度,调整当前帧图像对应的隐藏层特征,从而能够抑制当前帧与下一帧之间的无关信息,以及关注当前帧与下一帧之间的相关信息,有助于网络充分利用视频中多帧的时序信息完成视频处理任务,提升了视频超分辨率效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种视频超分辨率方法的流程图。
图2是根据一示例性实施例示出的一种对比特征相似度处理流程的示意图。
图3a是根据一示例性实施例示出的一种视频处理效果的示意图。
图3b是根据一示例性实施例示出的另一种视频处理效果的示意图。
图4是根据一示例性实施例示出的另一种视频超分辨率方法的流程图。
图5是根据一示例性实施例示出的一种视频超分辨率装置的框图。
图6是根据一示例性实施例示出的一种电子设备的框图。
图7是根据一示例性实施例示出的另一种电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。
还需要说明的是,本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
图1是根据一示例性实施例示出的一种视频超分辨率方法的流程图,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务端,还可以应用于包括终端和服务端的系统,并通过终端和服务端的交互实现。本实施例中,该方法包括以下步骤。
在步骤S110中,获取当前帧图像对应的隐藏层特征;
其中,隐藏层特征可以为视频超分辨率网络中的隐藏层网络处理当前帧图像而输出的特征,该视频超分辨率网络可以为对当前帧图像所属的视频进行超分辨率处理的卷积神经网络。
作为一示例,可以采用循环卷积网络(即视频超分辨率网络)进行视频超分辨率任务,以视频中的当前帧图像为例,可以分别输入当前帧图像、上一帧图像、上一帧隐藏层特征,以及上一帧图像对应的超分辨率结果,并将所输入的对象在特征维度进行拼接,然后可以将拼接特征输入至视频超分辨率网络中的隐藏层网络进行处理,进而隐藏层网络可以输出当前帧图像对应的隐藏层特征。
在实际应用中,通过视频超分辨率网络中的隐藏层网络对当前帧图像处理后,可以获取隐藏层网络所输出的当前帧图像对应的隐藏层特征,以进一步采用该隐藏层特征与下一帧图像所对应的图像特征进行相似度对比。
具体地,可以通过构建基于特征相似度对比的动态滤波器,对获取到的当前帧图像对应的隐藏层特征进行滤波处理,得到滤波后的隐藏层特征,如滤波后的隐藏层特征矩阵,作为调整后隐藏层特征。
在一示例中,将基于当前帧图像得到的拼接特征输入至视频超分辨率网络中的隐藏层网络后,可以通过n-1个大小为3x3的卷积层和激活函数ReLU(Rectified LinearUnits,修正线性单元)进行处理,然后可以在第n层时分成两个分支,一个支路可以采用3x3的卷积层和激活函数ReLU生成隐藏层特征,另一个支路可以采用3x3的卷积层生成超分辨率特征,所生成的隐藏层特征可以作为下一个帧图像处理时的输入,超分辨率特征可以经过4倍的像素重排得到超分辨率结果,可以看出,第t时刻图像对应的隐藏层特征是由第1至t-1时刻对应的隐藏层特征所累积得到,从而可以利用隐藏层特征建立长距离的时序依赖。
在又一示例中,由于隐藏层特征累积机制存在缺点,其会将上一时刻的隐藏层特征毫无保留的传递给下一个时刻,若当视频的某相邻帧间突然发生较大运动或者场景切换时,上一时刻图像内容相对于下一时刻图像内容发生了剧烈改变,在此情况下,上一时刻图像对应的隐藏层特征对下一时刻图像没有借鉴意义,甚至是一种噪声,如场景为上一时刻图像中是一只猫,下一时刻图像中是一辆车,那么猫的纹理和细节特征与车的关联性低,若将猫的特征与车的图像拼接在一起输入网络,对车的特征提取无借鉴意义,则需要对相邻帧间的无关信息进行抑制,以及关注相邻帧间的相关信息,同时,针对视频超分辨率任务,为了尽量保证图像原有的特征,需要在对图像的特征不进行较大压缩的情况下进行处理。
在步骤S120中,提取当前帧图像在视频中的下一帧图像所对应的图像特征,确定隐藏层特征与图像特征间的特征相似度;特征相似度用于表征相同像素位置在隐藏层特征与图像特征中所对应的特征间的相似程度;
在具体实现中,可以针对当前帧图像在视频中的下一帧图像,通过获取下一帧图像进行特征提取,可以得到下一帧图像所对应的图像特征,进而可以采用隐藏层特征与图像特征进行相似度对比,通过对比相同像素位置在隐藏层特征与图像特征中所对应的特征间的相似程度,可以确定隐藏层特征与图像特征间的特征相似度。
例如,如图2所示,输入图像(即下一帧图像)的尺寸可以为HxWx3,可以采用一个大小为3x3的卷积层和激活函数(如图2中激活函数1)对输入图像提取特征,得到如立方体所示的图像特征,其大小为HxWxK2,K为超参数,其可以用于表征动态滤波的滤波半径大小;通过将提取出的图像特征和当前帧图像对应的隐藏层特征(其大小为HxWxC)进行相似度对比,可以得到相似性矩阵(即特征相似度)。
在一个可选实施例中,考虑性能和速度的平衡性,超参数K的取值可以选用较小的值,如超参数K可以采用K=3,以达到较好的运算效率和精度,更大的K值可能会降低运算效率;超参数K的取值还可以根据不同的应用场景进行调整。
在步骤S130中,根据特征相似度调整隐藏层特征,得到调整后隐藏层特征;调整后隐藏层特征用于供视频超分辨率网络对视频进行超分辨率处理。
在得到特征相似度后,可以根据该特征相似度调整隐藏层特征,得到调整后隐藏层特征,以供视频超分辨率网络基于调整后隐藏层特征对视频进行超分辨率处理,如可以将调整后隐藏层特征作为待输入隐藏层特征,以在隐藏层网络处理下一帧图像时输入至隐藏层网络。
在一示例中,如图2所示,相似性矩阵对应的数值可以表征当前帧图像对应的隐藏层特征与下一帧图像所对应的图像特征之间的关联性大小,通过对相似性矩阵施加Sigmoid激活函数(如图2中激活函数2),可以将激活函数输出结果与当前帧图像对应的隐藏层特征相乘,进而可以得到滤波后的隐藏层特征矩阵(即调整后隐藏层特征)。
在又一示例中,如图2所示的基于特征相似度对比的动态滤波器可以作为一个插入形模块,如针对视频超分辨率任务的隐藏层自适应模块,其可以插入在任意循环卷积神经网络的隐藏层特征输入处,以起到对特征的过滤作用,通过抑制当前帧与下一帧之间的无关信息,以及关注当前帧与下一帧之间的相关信息,该模块可以大幅度帮助网络充分利用视频中多帧的时序信息,如图3a和3b所示,其最后一列为本实施例处理结果,可以看出在纹理的恢复上取得了较好的视频超分辨率结果,如在楼房的重建上产生了更多的纹理细节,以及在树的重建上也产生了更丰富的纹理,从而通过将模块便捷的插入任意循环卷积算法网络,能够帮助算法网络获得更好的性能。
在一个可选实施例中,本实施例方法也可以用于视频分类处理任务,如通过获取当前帧图像对应的隐藏层特征,隐藏层特征为视频分类处理网络中的隐藏层网络处理当前帧图像而输出的特征,视频分类处理网络为对当前帧图像所属的视频进行分类处理的卷积神经网络,然后提取当前帧图像在视频中的下一帧图像所对应的图像特征,确定隐藏层特征与图像特征间的特征相似度,特征相似度用于表征相同像素位置在隐藏层特征与图像特征中所对应的特征间的相似程度,进而根据特征相似度调整隐藏层特征,得到调整后隐藏层特征,调整后隐藏层特征用于供视频分类处理网络对视频进行分类处理;还可以用于其它基于循环卷积神经网络的视频处理任务,在本实施例中不作具体限制。
上述视频超分辨率方法中,通过获取当前帧图像对应的隐藏层特征,隐藏层特征为视频超分辨率网络中的隐藏层网络处理当前帧图像而输出的特征,视频超分辨率网络为对当前帧图像所属的视频进行超分辨率处理的卷积神经网络,然后提取当前帧图像在视频中的下一帧图像所对应的图像特征,确定隐藏层特征与图像特征间的特征相似度,特征相似度用于表征相同像素位置在隐藏层特征与图像特征中所对应的特征间的相似程度,进而根据特征相似度调整隐藏层特征,得到调整后隐藏层特征,调整后隐藏层特征用于供视频超分辨率网络对视频进行超分辨率处理。如此,可以基于当前帧图像和下一帧图像进行特征间对比得到的特征相似度,调整当前帧图像对应的隐藏层特征,从而能够抑制当前帧与下一帧之间的无关信息,以及关注当前帧与下一帧之间的相关信息,有助于网络充分利用视频中多帧的时序信息完成视频处理任务,提升了视频超分辨率效果。
在一示例性实施例中,确定隐藏层特征与图像特征间的特征相似度,包括:获取图像特征中各像素点对应的像素特征;根据各像素点对应的像素特征,在隐藏层特征中确定各像素点对应的待比对特征;根据像素特征和待比对特征,确定各像素点对应的相似度比对结果;将各像素点对应的相似度比对结果作为特征相似度。
在实际应用中,如图2所示,可以获取图像特征中各像素点对应的像素特征,然后可以针对每个像素点对应的像素特征,如像素点A得到的1x1xK2,其可以通过空间重排得到KxKx1的特征,在隐藏层特征中确定每个像素点对应的待比对特征,如可以根据重排后KxKx1的特征,以及隐藏层特征中像素点A对应的像素点A’位置,在隐藏层特征HxWxC中得到对应的待比对特征,进而可以根据像素特征和待比对特征确定各像素点对应的相似度比对结果,如相似性矩阵中像素点A的相似度比对结果,并将各像素点对应的相似度比对结果作为特征相似度,如相似性矩阵;从而能够通过对比相同像素位置在隐藏层特征与图像特征中所对应的特征间的相似程度,得到隐藏层特征与图像特征间的特征相似度。
本实施例的技术方案,通过获取图像特征中各像素点对应的像素特征,然后根据各像素点对应的像素特征,在隐藏层特征中确定各像素点对应的待比对特征,进而根据像素特征和待比对特征,确定各像素点对应的相似度比对结果,将各像素点对应的相似度比对结果作为特征相似度,可以将图像特征拆解为各像素点对应的特征以进行相似度对比,能够在获取视频中相邻帧间特征相似度的同时保证图像原有特征,提升了视频超分辨率效果。
在一示例性实施例中,图像特征可以具有多个特征平面,获取图像特征中各像素点对应的像素特征,包括:将图像特征中的任意一个像素点,作为目标像素点;获取目标像素点在图像特征的各特征平面所对应的像素子特征;对各像素子特征进行重排,得到目标像素点对应的像素特征。
在具体实现中,如图2所示,可以选择图像特征中HxW特征平面上的任意一个像素点,作为目标像素点,如像素点A,由于图像特征为立方体的特征,可以获取像素点A在HxWxK2中各特征平面所对应的像素子特征,如像素点A的维度可以为1x1xK2,进而可以对各像素子特征进行空间重排,得到目标像素点对应的像素特征,如KxKx1的特征,该特征可以为像素点A的动态滤波核。
本实施例的技术方案,通过将图像特征中的任意一个像素点,作为目标像素点,然后获取目标像素点在图像特征的各特征平面所对应的像素子特征,进而对各像素子特征进行重排,得到目标像素点对应的像素特征,能够针对图像特征进行拆解,以得到各像素点对应的像素特征,为后续处理提供了数据支持。
在一示例性实施例中,隐藏层特征可以具有多个特征平面,根据各像素点对应的像素特征,在隐藏层特征中确定各像素点对应的待比对特征,包括:确定隐藏层特征中的参照像素点;参照像素点的像素位置与目标像素点的像素位置相同;根据像素特征中像素子特征的数量和参照像素点的像素位置,在隐藏层特征的各特征平面中确定待比对区域特征;将待比对区域特征,作为目标像素点对应的待比对特征。
在一示例中,如图2所示,可以针对图像特征中像素点A(即目标像素点),在隐藏层特征中确定与像素点A像素位置相同的像素点A’(即参照像素点),然后可以基于像素点A的动态滤波核和像素点A’位置,在隐藏层特征HxWxC中得到对应的待比对特征,如由于隐藏层特征HxWxC具有C个特征平面,像素点A点的动态滤波核针对隐藏层特征中每个特征平面都是共享的,则针对隐藏层特征中的像素点A’也可以产生C个值(即待比对区域特征)。
本实施例的技术方案,通过确定隐藏层特征中的参照像素点,然后根据像素特征中像素子特征的数量和参照像素点的像素位置,在隐藏层特征的各特征平面中确定待比对区域特征,进而将待比对区域特征作为目标像素点对应的待比对特征,能够基于图像特征拆解得到的像素特征,在隐藏层特征中确定对应的待比对特征,为后续处理提供了数据支持。
在一示例性实施例中,根据像素特征和待比对特征,确定各像素点对应的相似度比对结果,包括:将各像素点的像素特征作为卷积核;采用卷积核对各像素点对应的待比对特征进行卷积运算,得到卷积值,作为各像素点对应的相似度比对结果。
在一示例中,如图2所示,以图像特征中像素点A为例,可以将像素点A的动态滤波核(即卷积核)与隐藏层特征中相同位置的像素点A’进行卷积,进而可以将卷积运算得到的卷积值对应记录在相似性矩阵中,该卷积值可以表征相同像素位置在隐藏层特征与图像特征中所对应的特征间的相似程度,如相似度大小,从而通过将图像特征中所有像素点的动态滤波核作用到隐藏层特征的对应像素位置后,可以得到相似性矩阵。
本实施例的技术方案,通过将各像素点的像素特征作为卷积核,进而采用卷积核对各像素点对应的待比对特征进行卷积运算,得到卷积值,作为各像素点对应的相似度比对结果,能够准确得到特征间相似度比对结果,有助于进一步抑制无关信息,以及关注相关信息。
在一示例性实施例中,根据特征相似度调整隐藏层特征,得到调整后隐藏层特征,包括:将特征相似度输入至预设的激活函数,得到针对隐藏层特征的特征调整权重;特征调整权重对应的值与特征相似度呈正相关关系;采用特征调整权重对隐藏层特征进行加权处理,得到调整后隐藏层特征。
在得到特征相似度后,为了起到抑制无关信息和关注相关信息的作用,可以对特征相似度中数值小的值(即表征相似度小)进一步缩小、数值大的值(即表征相似度大)进一步扩大,通过对相似性矩阵施加Sigmoid激活函数(如图2中激活函数2),可以将激活函数输出结果(即特征调整权重)与当前帧图像对应的隐藏层特征相乘,进而可以得到滤波后的隐藏层特征矩阵(即调整后隐藏层特征)。
在一示例中,通过将下一帧图像提取出的图像特征拆解为多个动态滤波核,然后将该动态滤波核与当前帧图像对应的隐藏层特征进行相似度对比,并可以利用激活函数抑制相似度小的值,以及强化相似度大的值,进而可以将其作用在当前帧图像对应的隐藏层特征上进行滤波,得到滤波后的隐藏层特征矩阵。
本实施例的技术方案,通过将特征相似度输入至预设的激活函数,得到针对隐藏层特征的特征调整权重,进而采用特征调整权重对隐藏层特征进行加权处理,得到调整后隐藏层特征,能够抑制当前帧与下一帧之间的无关信息,以及关注当前帧与下一帧之间的相关信息,有助于网络充分利用视频中多帧的时序信息完成视频处理任务。
在一示例性实施例中,提取当前帧图像在视频中的下一帧图像所对应的图像特征,包括:获取当前帧图像在视频中的下一帧图像;将下一帧图像输入至预设的图像特征提取网络,得到下一帧图像对应的图像特征。
在具体实现中,如图2所示,下一帧图像的尺寸可以为HxWx3,可以采用一个大小为3x3的卷积层和激活函数(如图2中激活函数1)对下一帧图像提取特征,得到如立方体所示的图像特征,其大小为HxWxK2,K为超参数,其可以用于表征动态滤波的滤波半径大小。
本实施例的技术方案,通过获取当前帧图像在视频中的下一帧图像,可以将下一帧图像输入至预设的图像特征提取网络,得到下一帧图像对应的图像特征,能够对下一帧图像提取得到图像特征,为后续处理提供了数据支持。
图4是根据一示例性实施例示出的另一种视频超分辨率方法的流程图,如图4所示,该方法用于终端等计算机设备中,包括以下步骤。
在步骤S410中,获取当前帧图像对应的隐藏层特征;隐藏层特征为视频超分辨率网络中的隐藏层网络处理当前帧图像而输出的特征。在步骤S420中,提取当前帧图像在视频中的下一帧图像所对应的图像特征。在步骤S430中,获取图像特征中各像素点对应的像素特征。在步骤S440中,根据各像素点对应的像素特征,在隐藏层特征中确定各像素点对应的待比对特征。在步骤S450中,根据像素特征和待比对特征,确定各像素点对应的相似度比对结果,并将各像素点对应的相似度比对结果作为特征相似度。在步骤S460中,将特征相似度输入至预设的激活函数,得到针对隐藏层特征的特征调整权重;特征调整权重对应的值与特征相似度呈正相关关系。在步骤S470中,采用特征调整权重对隐藏层特征进行加权处理,得到调整后隐藏层特征;调整后隐藏层特征用于供视频超分辨率网络对视频进行超分辨率处理。需要说明的是,上述步骤的具体限定可以参见上文对一种视频超分辨率方法的具体限定,在此不再赘述。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
可以理解的是,本说明书中上述方法的各个实施例之间相同/相似的部分可互相参见,每个实施例重点说明的是与其他实施例的不同之处,相关之处参见其他方法实施例的说明即可。
基于同样的发明构思,本公开实施例还提供了一种用于实现上述所涉及的视频超分辨率方法的视频超分辨率装置。
图5是根据一示例性实施例示出的一种视频超分辨率装置框图。参照图5,该装置包括:
特征获取单元501,被配置为执行获取当前帧图像对应的隐藏层特征;所述隐藏层特征为视频超分辨率网络中的隐藏层网络处理所述当前帧图像而输出的特征;所述视频超分辨率网络为对所述当前帧图像所属的视频进行超分辨率处理的卷积神经网络;
相似度确定单元502,被配置为执行提取所述当前帧图像在所述视频中的下一帧图像所对应的图像特征,确定所述隐藏层特征与所述图像特征间的特征相似度;所述特征相似度用于表征相同像素位置在所述隐藏层特征与所述图像特征中所对应的特征间的相似程度;
特征调整单元503,被配置为执行根据所述特征相似度调整所述隐藏层特征,得到调整后隐藏层特征;所述调整后隐藏层特征用于供所述视频超分辨率网络对所述视频进行超分辨率处理。
在一种可能实现方式中,所述相似度确定单元502,具体被配置为执行获取所述图像特征中各像素点对应的像素特征;根据各所述像素点对应的像素特征,在所述隐藏层特征中确定各所述像素点对应的待比对特征;根据所述像素特征和所述待比对特征,确定各所述像素点对应的相似度比对结果;将各所述像素点对应的相似度比对结果作为所述特征相似度。
在一种可能实现方式中,所述图像特征具有多个特征平面,所述相似度确定单元502,具体被配置为执行将所述图像特征中的任意一个像素点,作为目标像素点;获取所述目标像素点在所述图像特征的各特征平面所对应的像素子特征;对各所述像素子特征进行重排,得到所述目标像素点对应的像素特征。
在一种可能实现方式中,所述隐藏层特征具有多个特征平面,所述相似度确定单元502,具体被配置为执行确定所述隐藏层特征中的参照像素点;所述参照像素点的像素位置与所述目标像素点的像素位置相同;根据所述像素特征中像素子特征的数量和所述参照像素点的像素位置,在所述隐藏层特征的各特征平面中确定待比对区域特征;将所述待比对区域特征,作为所述目标像素点对应的待比对特征。
在一种可能实现方式中,所述相似度确定单元502,具体被配置为执行将各所述像素点的像素特征作为卷积核;采用所述卷积核对各所述像素点对应的待比对特征进行卷积运算,得到卷积值,作为各所述像素点对应的相似度比对结果。
在一种可能实现方式中,所述特征调整单元503,具体被配置为执行将所述特征相似度输入至预设的激活函数,得到针对所述隐藏层特征的特征调整权重;所述特征调整权重对应的值与所述特征相似度呈正相关关系;采用所述特征调整权重对所述隐藏层特征进行加权处理,得到所述调整后隐藏层特征。
在一种可能实现方式中,所述相似度确定单元502,具体被配置为执行获取所述当前帧图像在所述视频中的下一帧图像;将所述下一帧图像输入至预设的图像特征提取网络,得到所述下一帧图像对应的图像特征。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
上述视频超分辨率装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
图6是根据一示例性实施例示出的一种用于实现一种视频超分辨率方法的电子设备600的框图。例如,电子设备600可以是移动电话、计算机、数字广播终端、消息收发设备、游戏控制台、平板设备、医疗设备、健身设备、个人数字助理等。
参照图6,电子设备600可以包括以下一个或多个组件:处理组件602、存储器604、电源组件606、多媒体组件608、音频组件610、输入/输出(I/O)的接口612、传感器组件614以及通信组件616。
处理组件602通常控制电子设备600的整体操作,诸如与显示、电话呼叫、数据通信、相机操作和记录操作相关联的操作。处理组件602可以包括一个或多个处理器620来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件602可以包括一个或多个模块,便于处理组件602和其他组件之间的交互。例如,处理组件602可以包括多媒体模块,以方便多媒体组件608和处理组件602之间的交互。
存储器604被配置为存储各种类型的数据以支持在电子设备600的操作。这些数据的示例包括用于在电子设备600上操作的任何应用程序或方法的指令、联系人数据、电话簿数据、消息、图片、视频等。存储器604可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM)、电可擦除可编程只读存储器(EEPROM)、可擦除可编程只读存储器(EPROM)、可编程只读存储器(PROM)、只读存储器(ROM)、磁存储器、快闪存储器、磁盘、光盘或石墨烯存储器。
电源组件606为电子设备600的各种组件提供电力。电源组件606可以包括电源管理系统,一个或多个电源,及其他与为电子设备600生成、管理和分配电力相关联的组件。
多媒体组件608包括在所述电子设备600和用户之间的提供输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件608包括前置摄像头和/或后置摄像头。当电子设备600处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件610被配置为输出和/或输入音频信号。例如,音频组件610包括麦克风(MIC),当电子设备600处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器604或经由通信组件616发送。在一些实施例中,音频组件610还包括扬声器,用于输出音频信号。
I/O接口612为处理组件602和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件614包括一个或多个传感器,用于为电子设备600提供各个方面的状态评估。例如,传感器组件614可以检测到电子设备600的打开/关闭状态,组件的相对定位,例如所述组件为电子设备600的显示器和小键盘,传感器组件614还可以检测电子设备600或电子设备600组件的位置改变,用户与电子设备600接触的存在或不存在,设备600方位或加速/减速和电子设备600的温度变化。传感器组件614可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件614还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件614还可以包括加速度传感器、陀螺仪传感器、磁传感器、压力传感器或温度传感器。
通信组件616被配置为便于电子设备600和其他设备之间有线或无线方式的通信。电子设备600可以接入基于通信标准的无线网络,如WiFi,运营商网络(如2G、3G、4G或5G),或它们的组合。在一个示例性实施例中,通信组件616经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件616还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备600可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器604,上述指令可由电子设备600的处理器620执行以完成上述方法。例如,计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供一种计算机程序产品,所述计算机程序产品中包括指令,上述指令可由电子设备600的处理器620执行以完成上述方法。
图7是根据一示例性实施例示出的一种用于实现另一种视频超分辨率方法方法的电子设备700的框图。例如,电子设备700可以为服务器。参照图7,电子设备700包括处理组件720,其进一步包括一个或多个处理器,以及由存储器722所代表的存储器资源,用于存储可由处理组件720的执行的指令,例如应用程序。存储器722中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件720被配置为执行指令,以执行上述方法。
电子设备700还可以包括:电源组件724被配置为执行电子设备700的电源管理,有线或无线网络接口726被配置为将电子设备700连接到网络,和输入输出(I/O)接口728。电子设备700可以操作基于存储在存储器722的操作系统,例如Windows Server,Mac OS X,Unix,Linux,FreeBSD或类似。
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器722,上述指令可由电子设备700的处理器执行以完成上述方法。存储介质可以是计算机可读存储介质,例如,所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供一种计算机程序产品,所述计算机程序产品中包括指令,上述指令可由电子设备700的处理器执行以完成上述方法。
需要说明的,上述的装置、电子设备、计算机可读存储介质、计算机程序产品等根据方法实施例的描述还可以包括其他的实施方式,具体的实现方式可以参照相关方法实施例的描述,在此不作一一赘述。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (10)
1.一种视频超分辨率方法,其特征在于,所述方法包括:
获取当前帧图像对应的隐藏层特征;所述隐藏层特征为视频超分辨率网络中的隐藏层网络处理所述当前帧图像而输出的特征;所述视频超分辨率网络为对所述当前帧图像所属的视频进行超分辨率处理的卷积神经网络;
提取所述当前帧图像在所述视频中的下一帧图像所对应的图像特征,确定所述隐藏层特征与所述图像特征间的特征相似度;所述特征相似度用于表征相同像素位置在所述隐藏层特征与所述图像特征中所对应的特征间的相似程度;
根据所述特征相似度调整所述隐藏层特征,得到调整后隐藏层特征;所述调整后隐藏层特征用于供所述视频超分辨率网络对所述视频进行超分辨率处理。
2.根据权利要求1所述的方法,其特征在于,所述确定所述隐藏层特征与所述图像特征间的特征相似度,包括:
获取所述图像特征中各像素点对应的像素特征;
根据各所述像素点对应的像素特征,在所述隐藏层特征中确定各所述像素点对应的待比对特征;
根据所述像素特征和所述待比对特征,确定各所述像素点对应的相似度比对结果;
将各所述像素点对应的相似度比对结果作为所述特征相似度。
3.根据权利要求2所述的方法,其特征在于,所述图像特征具有多个特征平面,所述获取所述图像特征中各像素点对应的像素特征,包括:
将所述图像特征中的任意一个像素点,作为目标像素点;
获取所述目标像素点在所述图像特征的各特征平面所对应的像素子特征;
对各所述像素子特征进行重排,得到所述目标像素点对应的像素特征。
4.根据权利要求3所述的方法,其特征在于,所述隐藏层特征具有多个特征平面,所述根据各所述像素点对应的像素特征,在所述隐藏层特征中确定各所述像素点对应的待比对特征,包括:
确定所述隐藏层特征中的参照像素点;所述参照像素点的像素位置与所述目标像素点的像素位置相同;
根据所述像素特征中像素子特征的数量和所述参照像素点的像素位置,在所述隐藏层特征的各特征平面中确定待比对区域特征;
将所述待比对区域特征,作为所述目标像素点对应的待比对特征。
5.根据权利要求2所述的方法,其特征在于,所述根据所述像素特征和所述待比对特征,确定各所述像素点对应的相似度比对结果,包括:
将各所述像素点的像素特征作为卷积核;
采用所述卷积核对各所述像素点对应的待比对特征进行卷积运算,得到卷积值,作为各所述像素点对应的相似度比对结果。
6.根据权利要求1所述的方法,其特征在于,所述根据所述特征相似度调整所述隐藏层特征,得到调整后隐藏层特征,包括:
将所述特征相似度输入至预设的激活函数,得到针对所述隐藏层特征的特征调整权重;所述特征调整权重对应的值与所述特征相似度呈正相关关系;
采用所述特征调整权重对所述隐藏层特征进行加权处理,得到所述调整后隐藏层特征。
7.一种视频超分辨率装置,其特征在于,所述装置包括:
特征获取单元,被配置为执行获取当前帧图像对应的隐藏层特征;所述隐藏层特征为视频超分辨率网络中的隐藏层网络处理所述当前帧图像而输出的特征;所述视频超分辨率网络为对所述当前帧图像所属的视频进行超分辨率处理的卷积神经网络;
相似度确定单元,被配置为执行提取所述当前帧图像在所述视频中的下一帧图像所对应的图像特征,确定所述隐藏层特征与所述图像特征间的特征相似度;所述特征相似度用于表征相同像素位置在所述隐藏层特征与所述图像特征中所对应的特征间的相似程度;
特征调整单元,被配置为执行根据所述特征相似度调整所述隐藏层特征,得到调整后隐藏层特征;所述调整后隐藏层特征用于供所述视频超分辨率网络对所述视频进行超分辨率处理。
8.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至6中任一项所述的视频超分辨率方法。
9.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至6中任一项所述的视频超分辨率方法。
10.一种计算机程序产品,所述计算机程序产品中包括指令,其特征在于,所述指令被电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至6任一项所述的视频超分辨率方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210270777.4A CN114549327B (zh) | 2022-03-18 | 2022-03-18 | 视频超分辨率方法、装置、电子设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210270777.4A CN114549327B (zh) | 2022-03-18 | 2022-03-18 | 视频超分辨率方法、装置、电子设备、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114549327A true CN114549327A (zh) | 2022-05-27 |
CN114549327B CN114549327B (zh) | 2024-11-01 |
Family
ID=81664263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210270777.4A Active CN114549327B (zh) | 2022-03-18 | 2022-03-18 | 视频超分辨率方法、装置、电子设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114549327B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116453028A (zh) * | 2023-06-13 | 2023-07-18 | 荣耀终端有限公司 | 视频处理方法、存储介质及电子设备 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110070511A (zh) * | 2019-04-30 | 2019-07-30 | 北京市商汤科技开发有限公司 | 图像处理方法和装置、电子设备及存储介质 |
CN110622502A (zh) * | 2017-05-17 | 2019-12-27 | 三星电子株式会社 | 用于活动图像的超分辨率处理方法及其图像处理装置 |
CN111368656A (zh) * | 2020-02-21 | 2020-07-03 | 华为技术有限公司 | 一种视频内容描述方法和视频内容描述装置 |
CN111414922A (zh) * | 2019-01-07 | 2020-07-14 | 阿里巴巴集团控股有限公司 | 特征提取方法、图像处理方法、模型训练方法及装置 |
US20210090217A1 (en) * | 2019-09-23 | 2021-03-25 | Tencent America LLC | Video coding for machine (vcm) based system and method for video super resolution (sr) |
CN113610031A (zh) * | 2021-08-14 | 2021-11-05 | 北京达佳互联信息技术有限公司 | 视频处理方法和视频处理装置 |
CN113837942A (zh) * | 2021-09-26 | 2021-12-24 | 平安科技(深圳)有限公司 | 基于srgan的超分辨率图像生成方法、装置、设备及存储介质 |
CN113989118A (zh) * | 2021-10-29 | 2022-01-28 | 北京达佳互联信息技术有限公司 | 视频处理方法和视频处理装置 |
CN116957936A (zh) * | 2023-07-27 | 2023-10-27 | 中国工商银行股份有限公司 | 视频超分辨率的方法、装置、电子设备及存储介质 |
-
2022
- 2022-03-18 CN CN202210270777.4A patent/CN114549327B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110622502A (zh) * | 2017-05-17 | 2019-12-27 | 三星电子株式会社 | 用于活动图像的超分辨率处理方法及其图像处理装置 |
CN111414922A (zh) * | 2019-01-07 | 2020-07-14 | 阿里巴巴集团控股有限公司 | 特征提取方法、图像处理方法、模型训练方法及装置 |
CN110070511A (zh) * | 2019-04-30 | 2019-07-30 | 北京市商汤科技开发有限公司 | 图像处理方法和装置、电子设备及存储介质 |
US20210090217A1 (en) * | 2019-09-23 | 2021-03-25 | Tencent America LLC | Video coding for machine (vcm) based system and method for video super resolution (sr) |
CN111368656A (zh) * | 2020-02-21 | 2020-07-03 | 华为技术有限公司 | 一种视频内容描述方法和视频内容描述装置 |
CN113610031A (zh) * | 2021-08-14 | 2021-11-05 | 北京达佳互联信息技术有限公司 | 视频处理方法和视频处理装置 |
CN113837942A (zh) * | 2021-09-26 | 2021-12-24 | 平安科技(深圳)有限公司 | 基于srgan的超分辨率图像生成方法、装置、设备及存储介质 |
CN113989118A (zh) * | 2021-10-29 | 2022-01-28 | 北京达佳互联信息技术有限公司 | 视频处理方法和视频处理装置 |
CN116957936A (zh) * | 2023-07-27 | 2023-10-27 | 中国工商银行股份有限公司 | 视频超分辨率的方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
邓焱文: "基于深度学习的超分辨率重建在人脸识别中的应用", 《中国优秀硕士学位论文全文数据库信息科技辑》, 15 July 2020 (2020-07-15) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116453028A (zh) * | 2023-06-13 | 2023-07-18 | 荣耀终端有限公司 | 视频处理方法、存储介质及电子设备 |
CN116453028B (zh) * | 2023-06-13 | 2024-04-26 | 荣耀终端有限公司 | 视频处理方法、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN114549327B (zh) | 2024-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109360261B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN106358087B (zh) | 表情包生成方法及装置 | |
CN111340731B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN107967459B (zh) | 卷积处理方法、装置及存储介质 | |
CN105631803B (zh) | 滤镜处理的方法和装置 | |
CN110677734B (zh) | 视频合成方法、装置、电子设备及存储介质 | |
CN107025441B (zh) | 肤色检测方法及装置 | |
CN111523346B (zh) | 图像识别方法及装置、电子设备和存储介质 | |
US20220222831A1 (en) | Method for processing images and electronic device therefor | |
CN109034106B (zh) | 人脸数据清洗方法及装置 | |
CN112188091B (zh) | 人脸信息识别方法、装置、电子设备及存储介质 | |
CN113099297A (zh) | 卡点视频的生成方法、装置、电子设备及存储介质 | |
US20220392253A1 (en) | Method for processing images, electronic device, and storage medium | |
CN108804684B (zh) | 一种数据处理方法和装置 | |
CN114549327B (zh) | 视频超分辨率方法、装置、电子设备、存储介质 | |
US11600300B2 (en) | Method and device for generating dynamic image | |
CN110148424B (zh) | 语音处理方法、装置、电子设备及存储介质 | |
CN110019965A (zh) | 表情图像的推荐方法、装置、电子设备及存储介质 | |
CN116866729A (zh) | 拍摄方法、装置及介质 | |
CN110751223B (zh) | 一种图像匹配方法、装置、电子设备及存储介质 | |
CN114189719A (zh) | 视频信息提取方法、装置、电子设备及存储介质 | |
CN107609599B (zh) | 特征识别方法及装置 | |
CN113761275A (zh) | 视频预览动图生成方法、装置、设备及可读存储介质 | |
CN113204443A (zh) | 基于联邦学习框架的数据处理方法、设备、介质及产品 | |
CN112866612A (zh) | 插帧方法、装置、终端及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |