CN113556442B - 视频去噪方法、装置、电子设备及计算机可读存储介质 - Google Patents
视频去噪方法、装置、电子设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN113556442B CN113556442B CN202010329941.5A CN202010329941A CN113556442B CN 113556442 B CN113556442 B CN 113556442B CN 202010329941 A CN202010329941 A CN 202010329941A CN 113556442 B CN113556442 B CN 113556442B
- Authority
- CN
- China
- Prior art keywords
- frame
- current frame
- denoising
- video
- reference frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000012545 processing Methods 0.000 claims abstract description 27
- 238000001914 filtration Methods 0.000 claims description 62
- 238000004422 calculation algorithm Methods 0.000 claims description 22
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 13
- 238000013135 deep learning Methods 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 11
- 230000002123 temporal effect Effects 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 10
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 7
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
- H04N5/21—Circuitry for suppressing or minimising disturbance, e.g. moiré or halo
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20024—Filtering details
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
Abstract
本发明提供了一种视频去噪方法、装置、电子设备及计算机可读存储介质,涉及图像处理技术领域,该方法包括:获取视频序列中待去噪的当前帧对应的多个第一参考帧;根据每个第一参考帧与当前帧之间的相似性大小,从多个第一参考帧中选取第二参考帧;根据第二参考帧对当前帧进行去噪处理,得到当前帧的去噪结果。这样根据与当前帧之间的相似性大小筛选第二参考帧,在对当前帧进行去噪处理时能够从第二参考帧获取到更丰富的噪声信息,从而提高了视频去噪效果。
Description
技术领域
本发明涉及图像处理技术领域,尤其是涉及一种视频去噪方法、装置、电子设备及计算机可读存储介质。
背景技术
随着深度学习技术的发展,基于深度学习的图像处理技术越来越多的被应用到实际任务当中。目前对视频进行去噪处理时通常采用基于单帧图像去噪模型的视频去噪方法。
一般地,基于单帧图像去噪模型的视频去噪方法,通常是逐帧对视频进行处理,每次模型的输入是一帧需要去噪的图像,模型只能利用该帧空间上的噪声信息进行去噪,然后输出去噪后的图像。然而这种视频去噪方法的去噪效果不够理想。
发明内容
本发明的目的在于提供一种视频去噪方法、装置、电子设备及计算机可读存储介质,以提高视频去噪效果。
本发明实施例提供了一种视频去噪方法,包括:
获取视频序列中待去噪的当前帧对应的多个第一参考帧;
根据每个所述第一参考帧与所述当前帧之间的相似性大小,从多个所述第一参考帧中选取第二参考帧;
根据所述第二参考帧对所述当前帧进行去噪处理,得到所述当前帧的去噪结果。
进一步地,获取视频序列中待去噪的当前帧对应的多个第一参考帧的步骤,包括:
根据所述当前帧在所述视频序列中的位置和预设时序长度范围,从所述视频序列中获取所述当前帧对应的多个第一参考帧。
进一步地,根据所述当前帧在所述视频序列中的位置和预设时序长度范围,从所述视频序列中获取所述当前帧对应的多个第一参考帧的步骤,包括:
按照所述预设时序长度范围,从所述当前帧在所述视频序列中的位置开始向后和/或向前选取所述视频序列中连续的多个视频帧,并将选取出的所述多个视频帧作为所述当前帧对应的多个第一参考帧。
进一步地,根据每个所述第一参考帧与所述当前帧之间的相似性大小,从多个所述第一参考帧中选取第二参考帧的步骤,包括:
按照预设的相似度值计算方法,分别计算每个所述第一参考帧与所述当前帧的相似度值;
将各个所述相似度值中数值较小的预设数量个相似度值对应的第一参考帧确定为第二参考帧。
进一步地,所述方法还包括:
当所述第一参考帧的数量小于所述预设数量时,根据各个所述第一参考帧中与所述当前帧在时序上的距离最远的第一参考帧,构造新的第一参考帧,使得构造后的第一参考帧的总数量等于所述预设数量;
将构造后的各个第一参考帧确定为第二参考帧。
进一步地,根据所述第二参考帧对所述当前帧进行去噪处理,得到所述当前帧的去噪结果的步骤,包括:
按照时序顺序对所述第二参考帧和所述当前帧进行排列,得到输入序列;
将所述输入序列输入预设的时域滤波模型,得到所述时域滤波模型输出的所述当前帧的去噪结果;其中,所述时域滤波模型包括基于深度学习的去噪算法模型,基于小波变换或中值滤波的去噪算法模型,或者结合运动估计和运动补偿的去噪算法模型。
进一步地,所述时域滤波模型包括基于深度学习的去噪算法模型;在将所述输入序列输入预设的时域滤波模型,得到所述时域滤波模型输出的所述当前帧的去噪结果之前,所述方法还包括:
获取原始视频样本;
对所述原始视频样本进行加噪处理,得到待处理样本;
对所述待处理样本中的每个待去噪帧均进行以下处理:从所述待处理样本中获取所述待去噪帧对应的多个第三参考帧;根据每个所述第三参考帧与所述待去噪帧之间的相似性大小,从多个所述第三参考帧中选取第四参考帧;
根据所述原始视频样本以及由所述待处理样本中的每个待去噪帧和每个所述待去噪帧对应的第四参考帧组成的输入样本集,对待训练的时域滤波模型进行训练,得到训练完成的时域滤波模型。
本发明实施例还提供了一种视频去噪装置,包括:
获取模块,用于获取视频序列中待去噪的当前帧对应的多个第一参考帧;
选取模块,用于根据每个所述第一参考帧与所述当前帧之间的相似性大小,从多个所述第一参考帧中选取第二参考帧;
处理模块,用于根据所述第二参考帧对所述当前帧进行去噪处理,得到所述当前帧的去噪结果。
本发明实施例还提供了一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的视频去噪方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述的视频去噪方法。
本发明实施例提供的视频去噪方法、装置、电子设备及计算机可读存储介质中,该方法包括:获取视频序列中待去噪的当前帧对应的多个第一参考帧;根据每个第一参考帧与当前帧之间的相似性大小,从多个第一参考帧中选取第二参考帧;根据第二参考帧对当前帧进行去噪处理,得到当前帧的去噪结果。这样根据与当前帧之间的相似性大小筛选第二参考帧,在对当前帧进行去噪处理时能够从第二参考帧获取到更丰富的噪声信息,从而提高了视频去噪效果。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种视频去噪方法的流程示意图;
图2为本发明实施例提供的另一种视频去噪方法的流程示意图;
图3为本发明实施例提供的一种时域滤波模型的训练流程示意图;
图4为本发明实施例提供的一种视频去噪装置的结构示意图;
图5为本发明实施例提供的另一种视频去噪装置的结构示意图;
图6为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
视频时域去噪也可称为视频时域滤波,它是区别于单帧图像去噪的一种时序上的视频去噪方法。对于基于时域去噪模型的视频时域去噪方法,时域去噪模型的输入通常是多帧图像,包括需要去噪的当前帧和当前帧对应的参考帧,时域去噪模型利用当前帧空间上的噪声信息和参考帧时序(即时域)上的噪声信息,对当前帧进行去噪处理,时域去噪模型最后输出当前帧去噪后的结果。因此,相比于基于单帧图像去噪模型的视频去噪方法,视频时域去噪方法在去噪过程中不仅可以获取当前帧空间上的信息,还能获取到参考帧的噪声信息,这些噪声信息可以帮助时域去噪模型对当前帧进行去噪,从而获得更好的去噪效果。
对于上述视频时域去噪方法,相关技术在选取参考帧时,通常是选取与当前帧前后紧邻的多帧,也即参考帧通常是当前帧在时序上的相邻帧。但是通常,视频时序上的相邻帧具有很大的相似性(特别在视频动作变化较少的情况下),当前帧与参考帧在噪声信息上的差别较小,因此当前帧从参考帧上获取的有用信息(即参考帧中区别于当前帧自身的噪声信息)较少。这样,时域去噪模型在时域上得到的噪声信息就较少,因而限制了视频时域去噪方法相比于基于单帧图像去噪模型的视频去噪方法的优势。基于此,本发明实施例提供的一种视频去噪方法、装置、电子设备及计算机可读存储介质,在一定时序内,选择相似性较小的帧作为当前帧的参考帧,该参考帧能够为当前帧的去噪提供更多的有用信息,也即提高了参考帧的有效性,从而提高了视频去噪精度和视频去噪效果。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种视频去噪方法进行详细介绍。
本发明实施例提供了一种视频去噪方法,该方法可以由具有图像处理能力的电子设备执行,该电子设备可以但不限于为以下中的任一种:台式电脑、笔记本电脑、平板电脑、车载电脑和智能手机等。
参见图1所示的一种视频去噪方法的流程示意图,该方法主要包括以下步骤S102~步骤S106:
步骤S102,获取视频序列中待去噪的当前帧对应的多个第一参考帧。
本实施例中,可以先从视频序列中选取一定时序长度范围内的帧作为第一参考帧,以便后续从第一参考帧中筛选出带有较多有用信息(即区别于当前帧自身的噪声信息的信息)的有效参考帧。基于此,上述步骤S102可以通过如下过程实现:根据当前帧在视频序列中的位置和预设时序长度范围,从视频序列中获取当前帧对应的多个第一参考帧。
上述预设时序长度范围可以根据实际需求设置,这里不做限定。预设时序长度范围可以参考帧buffer(缓冲区)大小的形式表征,若参考帧buffer大小记为N,则表示从视频序列中获取N个第一参考帧。
在获取第一参考帧时,可以选取视频序列中当前帧的后向连续多帧(即参考后向帧),也可以选取视频序列中当前帧的前向连续多帧(即参考前向帧),还可以同时选取视频序列中当前帧的后向连续多帧和前向连续多帧(即同时参考后向帧和前向帧),其中,后向指时序上已经出现的,前向指时序上还未出现的。基于此,在一种可能的实现方式中,可以按照预设时序长度范围,从当前帧在视频序列中的位置开始向后和/或向前选取视频序列中连续的多个视频帧,并将选取出的多个视频帧作为当前帧对应的多个第一参考帧。
其中,向后选取出的视频帧指与当前帧相比,时序上已经出现的视频帧;向前选取出的视频帧指与当前帧相比,时序上还未出现的视频帧。通常按照时序上的先后顺序对视频序列中的各个视频帧进行去噪处理,在此情况下,向后选取出的视频帧也指已经进行去噪处理的视频帧,向前选取出的视频帧也指还未进行去噪处理的视频帧。
步骤S104,根据每个第一参考帧与当前帧之间的相似性大小,从多个第一参考帧中选取第二参考帧。
由于相似性越小的视频帧携带的有用信息越多,因此可以先计算每个第一参考帧与当前帧之间的相似性大小,然后选取出相似性较小的多个第一参考帧作为第二参考帧。评价相似性大小的指标可以根据实际需求选取,例如可以PSNR(Peak Signal to NoiseRatio,峰值信噪比)、SSIM(structural similarity,结构相似性)或Pearson相关系数等来表征相似性大小;其中,PSNR的取值范围是20至50,SSIM的取值范围是0至1,Pearson相关系数的取值范围是-1至+1,三者均是数值越大,相似性越高。
基于此,在一种可能的实现方式中,上述步骤S104可以通过如下过程实现:按照预设的相似度值计算方法,分别计算每个第一参考帧与当前帧的相似度值;其中,相似度值计算方法包括PSNR计算方法、SSIM计算方法或Pearson相关系数计算方法;将各个相似度值中数值较小的预设数量个相似度值对应的第一参考帧确定为第二参考帧。
上述预设数量可以根据实际需求设置,且参考帧buffer大小大于预设数量;即若参考帧buffer大小记为N,预设数量记为M,则N>M。
步骤S106,根据第二参考帧对当前帧进行去噪处理,得到当前帧的去噪结果。
通过上述步骤S102和步骤S104选取出第二参考帧后,可以将当前帧与第二参考帧组成一个输入序列后输入时域滤波模型,通过时域滤波模型的计算,得到时域滤波模型输出的当前帧的去噪结果。时域滤波模型可以是预先训练好的深度学习模型,也可以是传统的去噪算法,本发明实施例对时域滤波模型的模型结构不做限定。其中,传统的去噪算法可以是基于小波变换或中值滤波等传统算子的去噪算法,也可以是结合运动估计和运动补偿的基于传统算子的去噪算法。
基于此,可选地,上述步骤S106可以通过如下过程实现:按照时序顺序对第二参考帧和当前帧进行排列,得到输入序列;将输入序列输入预设的时域滤波模型,得到时域滤波模型输出的当前帧的去噪结果;其中,时域滤波模型包括基于深度学习的去噪算法模型,基于小波变换或中值滤波的去噪算法模型,或者结合运动估计和运动补偿的去噪算法模型。若预设数量记为M,则有M个第二参考帧,输入序列为(M+1)帧图片。
可选地,上述基于深度学习的去噪算法模型可以采用基于深度学习的去噪算法,如EDVR(Video Restoration with Enhanced Deformable Convolutional Networks,基于增强的可变形卷积网络的视频修复)算法、VNLNet(Non-Local Video Denoising by CNN,基于卷积神经网络的非局部视频去噪)算法、ViDeNN(Deep Blind Video Denoising,基于深度学习的视频盲去噪)算法等。
需要说明的是,参考帧buffer大小N和实际确定的第二参考帧的数量(即预设数量)M,两者是在时域滤波模型处理之前确定好的。对于参考帧buffer大小N,可以针对视频内容选择不同的参考帧buffer大小,参考帧buffer大小在时域滤波模型的实际处理过程中是可以进行修改的,也即在时域滤波模型建立好之后参考帧buffer大小是可以进行修改的。而第二参考帧的数量M是在建立时域滤波模型时就已确定好了的,时域滤波模型的输入是(M+1)帧图片,表示时域滤波模型需要M个第二参考帧,修改M的大小,时域滤波模型也需要发生相应的改变。
重复上述步骤S102~步骤S106,直至视频序列中的所有帧处理完毕。
本发明实施例提供的视频去噪方法,在对当前帧进行去噪处理时,根据与当前帧之间的相似性大小筛选第二参考帧,因而能够从第二参考帧获取到更丰富的噪声信息,从而提高了视频去噪效果。
实际处理过程中,上述第一参考帧的数量可能会小于上述预设数量。例如,预设数量记为M,按照时序对视频序列中的各个视频帧进行编号,即第一帧的序号记为1,第n帧的序号记为n,则对于参考后向帧来说,序号小于M+1的当前帧对应的第一参考帧的数量会小于M,即第一参考帧的数量可能会小于所需的第二参考帧的数量(即上述预设数量)。针对这种情况,在一种可能的实现方式中,可以通过如下过程确定第二参考帧:根据各个第一参考帧中与当前帧在时序上的距离最远的第一参考帧,构造新的第一参考帧,使得构造后的第一参考帧的总数量等于预设数量;将构造后的各个第一参考帧确定为第二参考帧。
具体实现时,可以将各个第一参考帧中与当前帧在时序上的距离最远的第一参考帧进行重复,来构造新的第一参考帧。对于参考后向帧来说,只重复序号为1的第一帧,重复的数量为:M-(当前帧的序号-1);对于参考前向帧来说,只重复最后一帧,重复的数量为:M-(最后一帧的序号-当前帧的序号);对于同时参考后向帧和前向帧来说,哪个方向(前向或后向)的第一参考帧不足,则按照相应方向的处理方法来处理。例如,M为10,最后一帧的序号为50,若参考后向帧且当前帧的序号为6,则将第一帧重复5次;若参考前向帧且当前帧的序号为42,则将最后一帧重复2次;若参考前向5帧、后向5帧,且当前帧的序号为4,则后向帧不足,应将第一帧重复2次。
具体实现时,不失一般性地,以参考后向帧为例,若按照时序对视频序列中的各个视频帧进行编号,即第一帧的序号记为1,第n帧的序号记为n,且参考帧buffer大小记为N,预设数量记为M,则对于序号小于N+1的当前帧,可以按照如下步骤确定第二参考帧:
1、当当前帧的序号小于M+1时,表示该当前帧向后已存在的第一参考帧数量不足,则将与当前帧最远的第一参考帧进行重复,直至第一参考帧的数量为M。比如:当M=3,在对第三帧进行处理时,由于向后只有2帧进行参考,因此需要将第一帧重复一次,从而构造出{第一帧;第一帧;第二帧}这样一个第二参考帧的输入序列。
2、当当前帧的序号大于或等于M+1,且小于N+1时,表示该当前帧向后已经存在至少M帧,但数量少于参考帧buffer大小,此时对已经存在的所有后向帧(其数量小于N),使用上述步骤S104的方法,从中选择相似性较小的M帧作为第二参考帧。
需要说明的是,对于视频序列前部分(即参考后向帧时,序号小于N+1的部分视频帧)的处理方法不唯一,本实施例只是用一种可能的实现方式进行说明以使整个视频去噪流程得到完整描述。在其他实施例中,也可以采用其他的处理方法,比如:序号小于M+1的所有帧都不进行滤波(即去噪)处理;序号大于或等于M+1、且小于N+1的帧都直接选择最相邻的M帧进行参考等。
为了便于理解,本实施例提供了一种应用前述视频去噪方法的具体示例,不失一般性地,该示例中只参考后向帧,参考帧buffer大小记为N,上述预设数量记为M。参见图2所示的另一种视频去噪方法的流程示意图,该方法主要包括以下步骤S202~步骤S208:
步骤S202,从视频序列中的当前帧开始向后选取N帧图片。
上述N帧图片即为N个第一参考帧。
步骤S204,分别计算当前帧与上述N帧图片之间的相似性大小。
步骤S206,从上述N帧图片中选择相似性较小的M帧图片,并将M帧图片与当前帧组成M+1帧的图片输入序列,其中,该图片输入序列中的M+1帧图片保持时序顺序排列。
上述M帧图片即为M个第二参考帧。
步骤S208,将上述图片输入序列输入时域滤波模型,得到时域滤波模型输出的当前帧的去噪结果。
重复上述步骤S202~步骤S208,直至视频序列中的所有帧处理完毕。
需要说明的是,上述步骤S202~步骤S208中未详细描述的步骤可以参见前述实施例的相应内容,这里不再赘述。
本发明实施例中,在对当前帧进行去噪处理时,舍弃了现有技术中的以相邻帧作为参考帧,而是通过相似性判断选择与当前帧时间间隔更长、距离更远的帧进行噪声估计,即先选取一定时序长度范围内的帧,并从中选择与当前帧相似性较小的若干帧作为参考帧,然后将当前帧与这些参考帧作为时域滤波模型输入,通过时域滤波模型的计算,得到时域滤波模型输出的当前帧去噪后的结果。由于选取出的参考帧能够为当前帧的去噪提供更丰富的噪声信息,因此提高了时域滤波模型的精度,提高了视频去噪效果。
当上述时域滤波模型采用基于深度学习的去噪算法模型时,需要先对时域滤波模型进行训练,本发明实施例还提供了一种时域滤波模型的训练过程。参见图3所示的一种时域滤波模型的训练流程示意图,该时域滤波模型的训练流程主要包括如下步骤S302~步骤S308:
步骤S302,获取原始视频样本。
可以获取多个不含噪声或者噪声较小的视频序列,将每个视频序列作为一个原始视频样本来构建训练样本集。
步骤S304,对上述原始视频样本进行加噪处理,得到待处理样本。
可以在原始视频样本的每个视频帧上加入压缩噪声和/或高斯噪声等,从而得到待处理样本。
步骤S306,对待处理样本中的每个待去噪帧均进行以下处理:从待处理样本中获取待去噪帧对应的多个第三参考帧;根据每个第三参考帧与待去噪帧之间的相似性大小,从多个第三参考帧中选取第四参考帧。
其中,第三参考帧的获取方式与应用训练完成的时域滤波模型时第一参考帧的获取方式相对应。例如,若第三参考帧采用参考后向帧的方式来获取,则第一参考帧也采用参考后向帧的方式来获取;又如,若第三参考帧采用参考前向帧的方式来获取,则第一参考帧也采用参考前向帧的方式来获取;还如,若第三参考帧采用同时参考后向帧和前向帧的方式来获取,则第一参考帧也采用同时参考后向帧和前向帧的方式来获取。
步骤S308,根据原始视频样本以及由待处理样本中的每个待去噪帧和每个待去噪帧对应的第四参考帧组成的输入样本集,对待训练的时域滤波模型进行训练,得到训练完成的时域滤波模型。
待处理样本中的一个待去噪帧和该待去噪帧对应的第四参考帧可以组成一个输入序列,输入样本集由待处理样本中的各个待去噪帧对应的输入序列构成。输入样本集作为时域滤波模型的输入,通过对比时域滤波模型的输出与原始视频样本中对应的原始视频帧,来不断调整时域滤波模型的参数,从而得到训练完成的时域滤波模型。
需要说明的是,上述步骤S302~步骤S308中未详细描述的步骤可以参见前述实施例的相应内容,这里不再赘述。
还需要说明的是,上述时域滤波模型可以直接在该视频去噪方法所应用的电子设备上完成训练过程,也可以在其他设备上训练完成后部署在该电子设备上。
对应于上述的视频去噪方法,本发明实施例还提供了一种视频去噪装置,参见图4所示的一种视频去噪装置的结构示意图,该装置包括:
获取模块42,用于获取视频序列中待去噪的当前帧对应的多个第一参考帧;
选取模块44,用于根据每个第一参考帧与当前帧之间的相似性大小,从多个第一参考帧中选取第二参考帧;
处理模块46,用于根据第二参考帧对当前帧进行去噪处理,得到当前帧的去噪结果。
本发明实施例提供的视频去噪装置,在对当前帧进行去噪处理时,根据与当前帧之间的相似性大小筛选第二参考帧,因而能够从第二参考帧获取到更丰富的噪声信息,从而提高了视频去噪效果。
可选地,上述获取模块42具体用于:根据当前帧在视频序列中的位置和预设时序长度范围,从视频序列中获取当前帧对应的多个第一参考帧。
进一步,上述获取模块42还用于:按照预设时序长度范围,从当前帧在视频序列中的位置开始向后和/或向前选取视频序列中连续的多个视频帧,并将选取出的多个视频帧作为当前帧对应的多个第一参考帧。
可选地,上述选取模块44具体用于:按照预设的相似度值计算方法,分别计算每个第一参考帧与当前帧的相似度值;其中,相似度值计算方法包括PSNR计算方法、SSIM计算方法或Pearson相关系数计算方法;将各个相似度值中数值较小的预设数量个相似度值对应的第一参考帧确定为第二参考帧。
可选地,上述选取模块44还用于:当第一参考帧的数量小于预设数量时,根据各个第一参考帧中与当前帧在时序上的距离最远的第一参考帧,构造新的第一参考帧,使得构造后的第一参考帧的总数量等于预设数量;将构造后的各个第一参考帧确定为第二参考帧。
可选地,上述处理模块46具体用于:按照时序顺序对第二参考帧和当前帧进行排列,得到输入序列;将输入序列输入预设的时域滤波模型,得到时域滤波模型输出的当前帧的去噪结果;其中,时域滤波模型包括基于深度学习的去噪算法模型,基于小波变换或中值滤波的去噪算法模型,或者结合运动估计和运动补偿的去噪算法模型。
可选地,上述时域滤波模型包括基于深度学习的去噪算法模型;参见图5所示的另一种视频去噪装置的结构示意图,在图4的基础上,该装置还包括训练模块52,训练模块52用于:获取原始视频样本;对原始视频样本进行加噪处理,得到待处理样本;对待处理样本中的每个待去噪帧均进行以下处理:从待处理样本中获取待去噪帧对应的多个第三参考帧;根据每个第三参考帧与待去噪帧之间的相似性大小,从多个第三参考帧中选取第四参考帧;根据原始视频样本以及由待处理样本中的每个待去噪帧和每个待去噪帧对应的第四参考帧组成的输入样本集,对待训练的时域滤波模型进行训练,得到训练完成的时域滤波模型。
本实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
参见图6,本发明实施例还提供一种电子设备100,包括:处理器60,存储器61,总线62和通信接口63,所述处理器60、通信接口63和存储器61通过总线62连接;处理器60用于执行存储器61中存储的可执行模块,例如计算机程序。
其中,存储器61可能包含随机存取存储器(Random Access Memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory,简称NVM),例如至少一个磁盘存储器。通过至少一个通信接口63(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线62可以是工业标准体系结构(Industry Standard Architecture,简称ISA)总线、外设部件互连标准(Peripheral Component Interconnect,简称PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture,简称EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器61用于存储程序,所述处理器60在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器60中,或者由处理器60实现。
处理器60可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器60中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器60可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器61,处理器60读取存储器61中的信息,结合其硬件完成上述方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行前面方法实施例中所述的视频去噪方法。该计算机可读存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
在这里示出和描述的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制,因此,示例性实施例的其他示例可以具有不同的值。
附图中的流程图和框图显示了根据本发明的多个实施例的方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种视频去噪方法,其特征在于,包括:
获取视频序列中待去噪的当前帧对应的多个第一参考帧;
根据每个所述第一参考帧与所述当前帧之间的相似性大小,从多个所述第一参考帧中选取第二参考帧,所述第二参考帧为相似性较小的预设数量个所述第一参考帧;
根据所述第二参考帧对所述当前帧进行去噪处理,得到所述当前帧的去噪结果。
2.根据权利要求1所述的方法,其特征在于,获取视频序列中待去噪的当前帧对应的多个第一参考帧的步骤,包括:
根据所述当前帧在所述视频序列中的位置和预设时序长度范围,从所述视频序列中获取所述当前帧对应的多个第一参考帧。
3.根据权利要求2所述的方法,其特征在于,根据所述当前帧在所述视频序列中的位置和预设时序长度范围,从所述视频序列中获取所述当前帧对应的多个第一参考帧的步骤,包括:
按照所述预设时序长度范围,从所述当前帧在所述视频序列中的位置开始向后和/或向前选取所述视频序列中连续的多个视频帧,并将选取出的所述多个视频帧作为所述当前帧对应的多个第一参考帧。
4.根据权利要求1所述的方法,其特征在于,根据每个所述第一参考帧与所述当前帧之间的相似性大小,从多个所述第一参考帧中选取第二参考帧的步骤,包括:
按照预设的相似度值计算方法,分别计算每个所述第一参考帧与所述当前帧的相似度值;
将各个所述相似度值中数值较小的预设数量个相似度值对应的第一参考帧确定为第二参考帧。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
当所述第一参考帧的数量小于所述预设数量时,根据各个所述第一参考帧中与所述当前帧在时序上的距离最远的第一参考帧,构造新的第一参考帧,使得构造后的第一参考帧的总数量等于所述预设数量;
将构造后的各个第一参考帧确定为第二参考帧。
6.根据权利要求1所述的方法,其特征在于,根据所述第二参考帧对所述当前帧进行去噪处理,得到所述当前帧的去噪结果的步骤,包括:
按照时序顺序对所述第二参考帧和所述当前帧进行排列,得到输入序列;
将所述输入序列输入预设的时域滤波模型,得到所述时域滤波模型输出的所述当前帧的去噪结果;其中,所述时域滤波模型包括基于深度学习的去噪算法模型,基于小波变换或中值滤波的去噪算法模型,或者结合运动估计和运动补偿的去噪算法模型。
7.根据权利要求6所述的方法,其特征在于,所述时域滤波模型包括基于深度学习的去噪算法模型;在将所述输入序列输入预设的时域滤波模型,得到所述时域滤波模型输出的所述当前帧的去噪结果之前,所述方法还包括:
获取原始视频样本;
对所述原始视频样本进行加噪处理,得到待处理样本;
对所述待处理样本中的每个待去噪帧均进行以下处理:从所述待处理样本中获取所述待去噪帧对应的多个第三参考帧;根据每个所述第三参考帧与所述待去噪帧之间的相似性大小,从多个所述第三参考帧中选取第四参考帧;
根据所述原始视频样本以及由所述待处理样本中的每个待去噪帧和每个所述待去噪帧对应的第四参考帧组成的输入样本集,对待训练的时域滤波模型进行训练,得到训练完成的时域滤波模型。
8.一种视频去噪装置,其特征在于,包括:
获取模块,用于获取视频序列中待去噪的当前帧对应的多个第一参考帧;
选取模块,用于根据每个所述第一参考帧与所述当前帧之间的相似性大小,从多个所述第一参考帧中选取第二参考帧,所述第二参考帧为相似性较小的预设数量个所述第一参考帧;
处理模块,用于根据所述第二参考帧对所述当前帧进行去噪处理,得到所述当前帧的去噪结果。
9.一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010329941.5A CN113556442B (zh) | 2020-04-23 | 2020-04-23 | 视频去噪方法、装置、电子设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010329941.5A CN113556442B (zh) | 2020-04-23 | 2020-04-23 | 视频去噪方法、装置、电子设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113556442A CN113556442A (zh) | 2021-10-26 |
CN113556442B true CN113556442B (zh) | 2023-03-24 |
Family
ID=78129501
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010329941.5A Active CN113556442B (zh) | 2020-04-23 | 2020-04-23 | 视频去噪方法、装置、电子设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113556442B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116362956A (zh) * | 2021-12-24 | 2023-06-30 | 北京字跳网络技术有限公司 | 视频纹理迁移方法、装置、电子设备及存储介质 |
CN114078126B (zh) * | 2022-01-19 | 2022-04-26 | 江苏金恒信息科技股份有限公司 | 一种基于机器学习的废钢评级方法及装置 |
CN114898175B (zh) * | 2022-04-29 | 2023-03-28 | 北京九章云极科技有限公司 | 目标检测方法、装置及相关设备 |
CN115243044A (zh) * | 2022-07-27 | 2022-10-25 | 中国科学技术大学 | 参考帧选择方法及装置、设备、存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103761746A (zh) * | 2013-12-25 | 2014-04-30 | 浙江慧谷信息技术有限公司 | 基于感兴趣区域相似性特征和根据极值选取参考帧的周期行为的检测方法 |
US9311690B2 (en) * | 2014-03-11 | 2016-04-12 | Adobe Systems Incorporated | Video denoising using optical flow |
US10448014B2 (en) * | 2017-05-23 | 2019-10-15 | Intel Corporation | Content adaptive motion compensated temporal filtering for denoising of noisy video for efficient coding |
CN110163827B (zh) * | 2019-05-28 | 2023-01-10 | 腾讯科技(深圳)有限公司 | 图像去噪模型的训练方法、图像去噪方法、装置及介质 |
-
2020
- 2020-04-23 CN CN202010329941.5A patent/CN113556442B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113556442A (zh) | 2021-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113556442B (zh) | 视频去噪方法、装置、电子设备及计算机可读存储介质 | |
CN108022212B (zh) | 高分辨率图片生成方法、生成装置及存储介质 | |
US9916531B1 (en) | Accumulator constrained quantization of convolutional neural networks | |
JP7086235B2 (ja) | ビデオ処理方法、装置及びコンピュータ記憶媒体 | |
TWI770432B (zh) | 圖像復原方法、電子設備、儲存介質 | |
CN113132723B (zh) | 一种图像压缩方法及装置 | |
CN110457524B (zh) | 模型生成方法、视频分类方法及装置 | |
CN112749666B (zh) | 一种动作识别模型的训练及动作识别方法与相关装置 | |
CN110830808A (zh) | 一种视频帧重构方法、装置及终端设备 | |
CN113538281B (zh) | 图像去噪方法、装置、计算机设备和存储介质 | |
CN111144375A (zh) | 基于特征编码的异常行为检测方法、装置及电子设备 | |
CN108564546B (zh) | 模型训练方法、装置及拍照终端 | |
CN111415371B (zh) | 一种稀疏光流确定方法和装置 | |
CN110782398B (zh) | 图像处理方法、生成式对抗网络系统和电子设备 | |
CN114037621A (zh) | 三维轨迹平滑处理方法、装置、设备及存储介质 | |
CN112801882B (zh) | 图像处理方法及装置、存储介质和电子设备 | |
CN111083479A (zh) | 一种视频帧预测方法、装置及终端设备 | |
CN116934573A (zh) | 数据读写方法、存储介质及电子设备 | |
CN115209150B (zh) | 一种视频编码参数获取方法、装置及电子设备 | |
CN111083494A (zh) | 一种视频编码方法、装置及终端设备 | |
CN112801883A (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
CN113542780B (zh) | 一种网络直播视频的压缩伪影去除方法及装置 | |
CN109255771B (zh) | 图像滤波方法及装置 | |
CN115620017A (zh) | 图像的特征提取方法、装置、设备及存储介质 | |
CN115021759A (zh) | 一种基于二值最小二乘法的二值稀疏信号恢复方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |