CN113225568B - 一种视频压缩感知低延迟帧间重构的迭代渐进假设预测方法 - Google Patents

一种视频压缩感知低延迟帧间重构的迭代渐进假设预测方法 Download PDF

Info

Publication number
CN113225568B
CN113225568B CN202110488122.XA CN202110488122A CN113225568B CN 113225568 B CN113225568 B CN 113225568B CN 202110488122 A CN202110488122 A CN 202110488122A CN 113225568 B CN113225568 B CN 113225568B
Authority
CN
China
Prior art keywords
frame
hypothesis
slice
reconstruction
iterative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN202110488122.XA
Other languages
English (en)
Other versions
CN113225568A (zh
Inventor
刘明瑞
刘浩
黄震
胡敏
廖荣生
魏国林
袁文野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202110488122.XA priority Critical patent/CN113225568B/zh
Publication of CN113225568A publication Critical patent/CN113225568A/zh
Application granted granted Critical
Publication of CN113225568B publication Critical patent/CN113225568B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/557Motion estimation characterised by stopping computation or iteration based on certain criteria, e.g. error magnitude being too large or early exit

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

对于视频压缩感知的低延迟帧间重构,现有方法都是通过对前向关键帧或前一个非关键帧的多假设预测构建残差稀疏模型。然而,这些方法不能在逐次逼近每个非关键帧的过程中动态地利用空‑时相关性。为了充分利用视频帧之间的相关性进行帧间重构,本发明提出了一种迭代渐进假设预测方法,在多假设预测中引入了迭代递减先验,从双参考帧中动态地挑选假设片进行非关键帧的重构。所提方法交替地执行先验引导的片匹配和残差稀疏建模求解,通过由粗到细的假设片选择机制,可以获得更高的预测精度。相比其他低延迟帧间重构方法,所提方法在复杂度约束下进一步提高了各个非关键帧的恢复质量。

Description

一种视频压缩感知低延迟帧间重构的迭代渐进假设预测方法
技术领域
本发明属于视频处理与通信领域,特别是涉及视频压缩感知的帧间重构技术。
背景技术
视频压缩感知系统采用测量端的单帧观测和重建端的帧间重构。视频码流通常由若干图像组(GOP)组成,每GOP由一个关键帧和后面的一些非关键帧组成。由于残差通常比原始信号具有更大的稀疏性,视频压缩感知的片匹配重构方法通过稀疏化当前片与其假设片之间的残差进行重构。多假设预测是目前获取残差的主流技术,在重建端通过片匹配进行运动估计和补偿,即将相邻帧作为参考帧,从参考帧中选取假设片作为当前片的一个预测。测量端生成周期性的关键帧,并且关键帧采用比非关键帧更高的采样率,由此获得恢复质量更好的参考帧。
在完成每帧的帧内重构后,重建端对每个GOP执行帧间重构,低延迟意味着参考帧只能是前向关键帧或前一个非关键帧,没有后向帧被作为参考帧。现有的片匹配重构方法采用基于多假设预测的稀疏残差法来恢复视频信号,但在进行运动估计时,对不同采样率下参考帧的选取方式较为单一,同时从参考帧中挑选假设片的数量也较为固定,难以适应内容时变的视频信号。因此,对于视频压缩感知的低延迟帧间重构,有待提出更加高效的片匹配重构机制。因此在低延迟约束下,本发明提出了一种基于单帧观测的视频压缩感知帧间重构方法。
发明内容
本发明所要解决的技术问题是:视频压缩感知的测量端执行每帧单独观测,重建端按时序接收码流后如何在低延迟约束下提升帧间重构的质量。
本发明解决其技术问题所采用的技术方案是提出一种迭代渐进假设预测方法,所提方法包含以下两个并行运作的环节:
(1)前向关键帧和前一个非关键帧作为双参考帧,在当前帧的第n次迭代中(1≤n≤Nmax),当前片
Figure BDA0003049718110000017
是当前帧中第k个片的上一次迭代估计(1≤k≤Kmax),当前片
Figure BDA0003049718110000012
从双参考帧中选择最相似的In个假设片(1≤In≤I1),其中I1是第1次迭代中的假设片数量。当前片的残差R(xk)是其原始值xk与其假设片组合的差值:
Figure BDA0003049718110000016
式中
Figure BDA0003049718110000014
是当前片的第i个假设片(1≤i≤In),
Figure BDA0003049718110000015
是影响预测精度的假设的权重,采用下式更新:
Figure BDA0003049718110000021
其中MSE(·)是均方误差算子。双树离散小波变换(DDWT)被进一步用来执行变换域的残差稀疏建模与求解。
(2)在先验引导的片匹配过程中,两个片之间的相似度由均方误差来描述。迭代递减先验选用两种暂态函数之一来确定第n次迭代中的假设片数量In。第一种阶梯暂态函数表示为:
Figure BDA0003049718110000022
其中[·]表示取在1到I1范围内的最近整数。根据慢、快、慢的暂态规律,第二种准sigmoid暂态函数表示为:
Figure BDA0003049718110000023
Figure BDA0003049718110000024
根据当前片
Figure BDA0003049718110000025
与其假设片之间的均方误差,片匹配在双参考帧中选择均方误差较小的In个假设片。
有益效果
视频压缩感知的低延迟帧间重构是基于前向关键帧或前一个非关键帧的多假设预测。为了进一步提高各个非关键帧的恢复质量,本发明提出了一种迭代渐进假设预测方法,逐步地利用当前片与其双参考帧之间空-时相关性。所提方法为帧间多假设预测的逐次逼近提供了迭代递减先验,并交替地执行先验引导的片匹配和残差稀疏建模求解。所提方法考虑了帧间变化的空-时稀疏特征,减少了含噪假设片的干扰,通过动态的多假设片匹配提升了低延迟视频压缩感知的恢复质量。
附图说明
图1是低延迟帧间重构的示意图;
图2是下降先验假设的两种暂态函数。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本实施例选取标准视频Foreman的前16帧作为测试序列,每个GOP包含8帧,各GOP的首帧为关键帧,即第1帧、第9帧为关键帧,其余帧为非关键帧。为了控制复杂度,测量端执行单帧观测,关键帧采样率高于非关键帧采样率。在低延迟帧间重构之前,各帧根据其测量值独立地执行某一帧内重构算法。在完成每帧的帧内重构后,重建端对每个GOP执行帧间重构,低延迟意味着参考帧只能是前向关键帧或前一个非关键帧,没有后向帧被作为参考帧。图1给出了低延迟帧间重构的示意图,其中关键帧采样率(Sk)和非关键帧采样率(Sn)共同影响恢复质量。在GOP中,关键帧可以用作剩余非关键帧的参考帧;由于帧间变化,时域距离最近的前一个非关键帧也是潜在的参考帧。在帧间重构过程中,
Figure BDA0003049718110000031
表示当前帧的上一次迭代估计。
Figure BDA0003049718110000032
以重叠方式划分为Kmax个片,当前片
Figure BDA00030497181100000316
表示其中第k个片(1≤k≤Kmax),该划分过程表示为:
Figure BDA0003049718110000034
其中Ek是以重叠方式从
Figure BDA00030497181100000315
获取当前片
Figure BDA0003049718110000036
的运算符,这种像素域假设片的构造方法缓解了非重叠块造成的块效应。为了平衡恢复质量和计算复杂度,迭代渐进假设预测方法为多假设预测提供了一个迭代递减先验。该方法交替执行先验引导的片匹配和残差稀疏模型求解,以进一步提高每个非关键帧的恢复质量。通过引入由粗到细的假设片选择机制,逐次逼近可获得更高的帧间多假设预测精度。n表示当前帧在帧间重构期间的迭代次数,其中Nmax表示最大迭代次数,即1≤n≤Nmax。In表示当前帧第n次迭代时可用的假设片数量,其中I1是第1次迭代时的假设片数量,即1≤In≤I1。需要注意的是,时域相关性通常远大于空域相关性,两个片之间的相似度采用它们的均方误差来描述:
Figure BDA0003049718110000037
其中
Figure BDA0003049718110000038
表示参考帧中的第i个假设片,1≤i≤In,s2表示片大小。片匹配的搜索窗以
Figure BDA0003049718110000039
所在的位置为中心。在前向关键帧和前一个非关键帧的双参考过程中,当前片需要找到与其时域相关的假设片。在当前帧的第n次迭代中,当前片将从其参考帧中选择最相似的In个假设片。对于当前片,xk表示与其上一次迭代估计中第k个片
Figure BDA00030497181100000310
所对应的原始值,第k个片的残差R(xk)由其原始值xk与其假设片的线性组合之间的差来计算。然后,In个假设片可以构建残差稀疏模型:
Figure BDA00030497181100000311
式中,
Figure BDA00030497181100000312
是影响预测精度的假设的权重,
Figure BDA00030497181100000313
Figure BDA00030497181100000314
的第i个假设片。在当前帧的第n次迭代中,当前片需要选择In个假设片。如果In太小,由于缺乏相似样本,会影响模型的稳定性;如果In过大,则会选择一些有噪声的假设片,从而降低稀疏平稳性。一个大的In值也会导致很高的计算复杂度,所以需要引入一个动态变化的In来平衡这些因素。
对于In个假设片,与当前片更相似的假设片应赋予更大的权重,而差异较大的假设片应赋予更小的权重。因此,当前片的权重与均方误差成反比,可用指数比值表示这些权重。由于在重建过程中无法获得原始值xk,因此在加权过程中使用了当前的迭代估计
Figure BDA00030497181100000411
权重
Figure BDA0003049718110000042
的更新如下:
Figure BDA0003049718110000043
其中MSE(·)是均方误差算子,
Figure BDA0003049718110000044
与采样率和帧间变化有关。双树离散小波变换(DDWT)被用来执行变换域的稀疏残差。残差R(xk)的DDWT系数是残差系数RΨ(xk),表示如下:
Figure BDA0003049718110000045
式中,Ψ表示DDWT,ΨT表示其转置,
Figure BDA0003049718110000046
由于DDWT域中零系数概率的差别很大,加权稀疏残差可以增加零系数概率。加权残差系数F(xk)可以表示为:
F(xk)=WkRΨ(xk) (6)
其中,Wk是如下所示的对角线权重矩阵:
Figure BDA0003049718110000047
Figure BDA0003049718110000048
表示残差系数的权重,每个权重反映了相应系数为零的概率。通过对加权残差系数F(xk)进行稀疏化,该最小化问题可表示为:
Figure BDA0003049718110000049
其中
Figure BDA00030497181100000412
是当前帧的估计,式(7)的l1范数最小化问题采用分裂Bregman迭代(SBI)算法求解。
帧间多假设预测的关键问题是在迭代重建过程中如何从一个关键帧和一个非关键帧中选择假设片。为了获得好的假设片,现有的帧间多假设预测方法忽略了相邻迭代结果之间的变化。在多假设预测中,假设片数量是不固定的。在GOP中,通过动态地确定每个参考帧中的假设片数量,可以进一步提高非关键帧的恢复质量。当前片需要估计与其时域相关的假设片,其中前向关键帧和前一个非关键帧被视为其参考帧。在当前帧的第n次迭代中,当前片将选择In个假设片。在片匹配中,一个片是当前帧中第k个片的上一次迭代估计(1≤k≤Kmax),另一个片是参考帧中第i个假设片(1≤i≤In),两个片之间的相似度由其均方误差来描述。
在迭代重建过程中,当前非关键帧的恢复质量不断提高。如果假设片数量是固定的,那么在迭代结束时,最后一个候选和当前片之间的相似度会降低。如果最后一个候选帧被用作更新当前帧的有用信息,则帧间的恢复质量可能会降低。为了解决上述问题,本发明设计了迭代递减先验。由于当前帧在迭代开始时含有大量的噪声,其细节信息不明显,而且片匹配也不太准确,因此可以选择更多的候选帧。随着迭代次数的增加,当前帧的恢复质量将得到提高,当前帧中的细节信息将越来越多,具有当前片的最优候选将越来越少,假设片数量也将减少。最优的In通常随着视频内容的动态统计特性而变化,但仍有可能给出次优解。为了从两个参考帧中选择最优候选,所提方法对假设片数量设计了迭代递减先验,在迭代过程中假设片数量逐渐减少。迭代递减先验选用两种暂态函数之一来确定第n次迭代中的假设片数量In,第一种阶梯暂态函数表示为:
Figure BDA0003049718110000051
其中[·]表示取在1≤In≤I1范围内的最近整数。在信息科学中,准sigmoid函数具有单增长和反函数单增长的性质。准sigmoid函数的理论基础是:前半部分的缓慢变化保证了启动的稳定性,后半部分的缓慢变化保证了搜索的稳定性。根据慢、快、慢的暂态规律,第二种准sigmoid暂态函数表示为:
Figure BDA0003049718110000052
根据准sigmoid暂态函数,In可以从I1减小到1。在帧间重构过程中,根据当前片与假设片之间的均方误差,在当前帧的第n次迭代中选择最优的In个假设片。图2给出了下降先验假设的两种暂态函数。当水平轴的迭代次数n由1变为Nmax时,纵轴的In值也由Imax变为1,通过迭代执行多假设预测过程,并且对于当前帧逐渐获得更高的预测精度。所提方法通过将改进的残差稀疏建模和先验引导的片匹配集成到式(7)中,通过SBI算法求解该l1范数最小化问题,从而完成帧间重构。所提方法通过更加精细的自适应片匹配机制,在复杂度约束下有效提升了测试序列的恢复质量。至此,所提方法完成Foreman测试序列的重构,非关键帧的恢复质量得以提升。

Claims (1)

1.一种视频压缩感知低延迟帧间重构的迭代渐进假设预测方法,包括两个并行运作的环节,其特征在于,环节(1)采用前向关键帧和前一个非关键帧作为双参考帧,在当前帧的第n次迭代中(1≤n≤Nmax),当前片
Figure FDA0003767426250000011
是当前帧中第k个片的上一次迭代估计(1≤k≤Kmax),
Figure FDA0003767426250000012
从双参考帧中选择最相似的In个假设片(1≤In≤I1),其中I1是第1次迭代中的假设片数量;当前片的残差R(xk)是其原始值xk与其假设片组合的差值:
Figure FDA0003767426250000013
式中
Figure FDA0003767426250000014
是当前片的第i个假设片(1≤i≤In),权重
Figure FDA0003767426250000015
采用下式更新:
Figure FDA0003767426250000016
其中MSE(·)是均方误差算子;环节(2)针对当前帧的第n次迭代,当前片
Figure FDA0003767426250000017
根据以下任一种暂态函数选择In个假设片:阶梯暂态函数
Figure FDA0003767426250000018
其中[·]表示取在1到I1范围内的最近整数;准sigmoid暂态函数
Figure FDA0003767426250000019
通过分裂Bregman迭代算法求解残差R(xk)的l1范数最小化,得到当前帧第k个片的第n次迭代估计,所有Kmax片的估计组成当前帧的第n次迭代估计,进而在执行Nmax次迭代之后完成帧间重构。
CN202110488122.XA 2021-04-30 2021-04-30 一种视频压缩感知低延迟帧间重构的迭代渐进假设预测方法 Expired - Fee Related CN113225568B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110488122.XA CN113225568B (zh) 2021-04-30 2021-04-30 一种视频压缩感知低延迟帧间重构的迭代渐进假设预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110488122.XA CN113225568B (zh) 2021-04-30 2021-04-30 一种视频压缩感知低延迟帧间重构的迭代渐进假设预测方法

Publications (2)

Publication Number Publication Date
CN113225568A CN113225568A (zh) 2021-08-06
CN113225568B true CN113225568B (zh) 2022-09-13

Family

ID=77090902

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110488122.XA Expired - Fee Related CN113225568B (zh) 2021-04-30 2021-04-30 一种视频压缩感知低延迟帧间重构的迭代渐进假设预测方法

Country Status (1)

Country Link
CN (1) CN113225568B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115941966B (zh) * 2022-12-30 2023-08-22 深圳大学 一种视频压缩方法及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106888024A (zh) * 2017-01-06 2017-06-23 南京邮电大学 一种基于双向最佳匹配的分布式视频压缩感知重构方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101557514B (zh) * 2008-04-11 2011-02-09 华为技术有限公司 一种帧间预测编解码方法、装置及系统
CN110290389B (zh) * 2019-07-11 2022-12-06 东华大学 基于长短期参考帧挑选假设匹配块视频压缩感知重构方法
CN110505479B (zh) * 2019-08-09 2023-06-16 东华大学 时延约束下逐帧相同测量率的视频压缩感知重构方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106888024A (zh) * 2017-01-06 2017-06-23 南京邮电大学 一种基于双向最佳匹配的分布式视频压缩感知重构方法

Also Published As

Publication number Publication date
CN113225568A (zh) 2021-08-06

Similar Documents

Publication Publication Date Title
CN109064507B (zh) 一种用于视频预测的多运动流深度卷积网络模型方法
CN101494780B (zh) 进行视频处理的装置与视频处理方法
CN106888024B (zh) 一种基于双向最佳匹配的分布式视频压缩感知重构方法
CN104822063B (zh) 一种基于字典学习残差重建的压缩感知视频重建方法
US8503522B2 (en) Video encoding/decoding apparatus and adaptive overlapped block motion compensation method and apparatus employing adaptive weights therefor
US5717463A (en) Method and system for estimating motion within a video sequence
KR101291869B1 (ko) 공간 및 시간 처리를 이용하는 비디오 시퀀스에서의 노이즈 및/또는 플리커 감소
CN106688232A (zh) 基于模型的视频编码的感知优化
US20070064804A1 (en) Adaptive motion estimation for temporal prediction filter over irregular motion vector samples
US20020196854A1 (en) Fast video encoder using adaptive hierarchical video processing in a down-sampled domain
CN1157080A (zh) 用于编码视频图像的装置和方法
EP1938617A2 (en) Mode selection techniques for multimedia coding
EP1732329A1 (en) Method and apparatus for coding moving images
KR20090003300A (ko) 모션 추정 검색 범위 및 확장된 모션 벡터 범위의 동적 선택 방법, 및 인코더
CN101090502A (zh) 预测质量可控的快速运动估值方法
US8326068B1 (en) Method and apparatus for modeling quantization matrices for image/video encoding
CN113225568B (zh) 一种视频压缩感知低延迟帧间重构的迭代渐进假设预测方法
CN110290389B (zh) 基于长短期参考帧挑选假设匹配块视频压缩感知重构方法
Chen et al. Distributed compressed video sensing based on key frame secondary reconstruction
US8831089B1 (en) Method and apparatus for selecting optimal video encoding parameter configurations
JP2009509411A (ja) ビデオ圧縮における適応的動きベクトルサンプリングのための多段リンク方法
CN109934882B (zh) 基于动态挑选多假设匹配块的视频压缩感知重构方法
Zheng et al. An improved distributed compressed video sensing scheme in reconstruction algorithm
CN114651270A (zh) 通过时间可变形卷积进行深度环路滤波
KR101192060B1 (ko) 블록 세트의 코딩을 위한 모션 벡터를 선택하는 방법 및장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220913

CF01 Termination of patent right due to non-payment of annual fee