CN113225568B - 一种视频压缩感知低延迟帧间重构的迭代渐进假设预测方法 - Google Patents
一种视频压缩感知低延迟帧间重构的迭代渐进假设预测方法 Download PDFInfo
- Publication number
- CN113225568B CN113225568B CN202110488122.XA CN202110488122A CN113225568B CN 113225568 B CN113225568 B CN 113225568B CN 202110488122 A CN202110488122 A CN 202110488122A CN 113225568 B CN113225568 B CN 113225568B
- Authority
- CN
- China
- Prior art keywords
- frame
- hypothesis
- slice
- reconstruction
- iterative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000000750 progressive effect Effects 0.000 title claims abstract description 7
- 230000001052 transient effect Effects 0.000 claims description 14
- 230000006870 function Effects 0.000 claims description 11
- 230000009977 dual effect Effects 0.000 claims description 2
- 238000011084 recovery Methods 0.000 abstract description 13
- 230000007246 mechanism Effects 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 9
- 238000005070 sampling Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003467 diminishing effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/557—Motion estimation characterised by stopping computation or iteration based on certain criteria, e.g. error magnitude being too large or early exit
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
对于视频压缩感知的低延迟帧间重构,现有方法都是通过对前向关键帧或前一个非关键帧的多假设预测构建残差稀疏模型。然而,这些方法不能在逐次逼近每个非关键帧的过程中动态地利用空‑时相关性。为了充分利用视频帧之间的相关性进行帧间重构,本发明提出了一种迭代渐进假设预测方法,在多假设预测中引入了迭代递减先验,从双参考帧中动态地挑选假设片进行非关键帧的重构。所提方法交替地执行先验引导的片匹配和残差稀疏建模求解,通过由粗到细的假设片选择机制,可以获得更高的预测精度。相比其他低延迟帧间重构方法,所提方法在复杂度约束下进一步提高了各个非关键帧的恢复质量。
Description
技术领域
本发明属于视频处理与通信领域,特别是涉及视频压缩感知的帧间重构技术。
背景技术
视频压缩感知系统采用测量端的单帧观测和重建端的帧间重构。视频码流通常由若干图像组(GOP)组成,每GOP由一个关键帧和后面的一些非关键帧组成。由于残差通常比原始信号具有更大的稀疏性,视频压缩感知的片匹配重构方法通过稀疏化当前片与其假设片之间的残差进行重构。多假设预测是目前获取残差的主流技术,在重建端通过片匹配进行运动估计和补偿,即将相邻帧作为参考帧,从参考帧中选取假设片作为当前片的一个预测。测量端生成周期性的关键帧,并且关键帧采用比非关键帧更高的采样率,由此获得恢复质量更好的参考帧。
在完成每帧的帧内重构后,重建端对每个GOP执行帧间重构,低延迟意味着参考帧只能是前向关键帧或前一个非关键帧,没有后向帧被作为参考帧。现有的片匹配重构方法采用基于多假设预测的稀疏残差法来恢复视频信号,但在进行运动估计时,对不同采样率下参考帧的选取方式较为单一,同时从参考帧中挑选假设片的数量也较为固定,难以适应内容时变的视频信号。因此,对于视频压缩感知的低延迟帧间重构,有待提出更加高效的片匹配重构机制。因此在低延迟约束下,本发明提出了一种基于单帧观测的视频压缩感知帧间重构方法。
发明内容
本发明所要解决的技术问题是:视频压缩感知的测量端执行每帧单独观测,重建端按时序接收码流后如何在低延迟约束下提升帧间重构的质量。
本发明解决其技术问题所采用的技术方案是提出一种迭代渐进假设预测方法,所提方法包含以下两个并行运作的环节:
(1)前向关键帧和前一个非关键帧作为双参考帧,在当前帧的第n次迭代中(1≤n≤Nmax),当前片是当前帧中第k个片的上一次迭代估计(1≤k≤Kmax),当前片从双参考帧中选择最相似的In个假设片(1≤In≤I1),其中I1是第1次迭代中的假设片数量。当前片的残差R(xk)是其原始值xk与其假设片组合的差值:式中是当前片的第i个假设片(1≤i≤In),是影响预测精度的假设的权重,采用下式更新:其中MSE(·)是均方误差算子。双树离散小波变换(DDWT)被进一步用来执行变换域的残差稀疏建模与求解。
(2)在先验引导的片匹配过程中,两个片之间的相似度由均方误差来描述。迭代递减先验选用两种暂态函数之一来确定第n次迭代中的假设片数量In。第一种阶梯暂态函数表示为:其中[·]表示取在1到I1范围内的最近整数。根据慢、快、慢的暂态规律,第二种准sigmoid暂态函数表示为: 根据当前片与其假设片之间的均方误差,片匹配在双参考帧中选择均方误差较小的In个假设片。
有益效果
视频压缩感知的低延迟帧间重构是基于前向关键帧或前一个非关键帧的多假设预测。为了进一步提高各个非关键帧的恢复质量,本发明提出了一种迭代渐进假设预测方法,逐步地利用当前片与其双参考帧之间空-时相关性。所提方法为帧间多假设预测的逐次逼近提供了迭代递减先验,并交替地执行先验引导的片匹配和残差稀疏建模求解。所提方法考虑了帧间变化的空-时稀疏特征,减少了含噪假设片的干扰,通过动态的多假设片匹配提升了低延迟视频压缩感知的恢复质量。
附图说明
图1是低延迟帧间重构的示意图;
图2是下降先验假设的两种暂态函数。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本实施例选取标准视频Foreman的前16帧作为测试序列,每个GOP包含8帧,各GOP的首帧为关键帧,即第1帧、第9帧为关键帧,其余帧为非关键帧。为了控制复杂度,测量端执行单帧观测,关键帧采样率高于非关键帧采样率。在低延迟帧间重构之前,各帧根据其测量值独立地执行某一帧内重构算法。在完成每帧的帧内重构后,重建端对每个GOP执行帧间重构,低延迟意味着参考帧只能是前向关键帧或前一个非关键帧,没有后向帧被作为参考帧。图1给出了低延迟帧间重构的示意图,其中关键帧采样率(Sk)和非关键帧采样率(Sn)共同影响恢复质量。在GOP中,关键帧可以用作剩余非关键帧的参考帧;由于帧间变化,时域距离最近的前一个非关键帧也是潜在的参考帧。在帧间重构过程中,表示当前帧的上一次迭代估计。以重叠方式划分为Kmax个片,当前片表示其中第k个片(1≤k≤Kmax),该划分过程表示为:
其中Ek是以重叠方式从获取当前片的运算符,这种像素域假设片的构造方法缓解了非重叠块造成的块效应。为了平衡恢复质量和计算复杂度,迭代渐进假设预测方法为多假设预测提供了一个迭代递减先验。该方法交替执行先验引导的片匹配和残差稀疏模型求解,以进一步提高每个非关键帧的恢复质量。通过引入由粗到细的假设片选择机制,逐次逼近可获得更高的帧间多假设预测精度。n表示当前帧在帧间重构期间的迭代次数,其中Nmax表示最大迭代次数,即1≤n≤Nmax。In表示当前帧第n次迭代时可用的假设片数量,其中I1是第1次迭代时的假设片数量,即1≤In≤I1。需要注意的是,时域相关性通常远大于空域相关性,两个片之间的相似度采用它们的均方误差来描述:
其中表示参考帧中的第i个假设片,1≤i≤In,s2表示片大小。片匹配的搜索窗以所在的位置为中心。在前向关键帧和前一个非关键帧的双参考过程中,当前片需要找到与其时域相关的假设片。在当前帧的第n次迭代中,当前片将从其参考帧中选择最相似的In个假设片。对于当前片,xk表示与其上一次迭代估计中第k个片所对应的原始值,第k个片的残差R(xk)由其原始值xk与其假设片的线性组合之间的差来计算。然后,In个假设片可以构建残差稀疏模型:
式中,是影响预测精度的假设的权重,是的第i个假设片。在当前帧的第n次迭代中,当前片需要选择In个假设片。如果In太小,由于缺乏相似样本,会影响模型的稳定性;如果In过大,则会选择一些有噪声的假设片,从而降低稀疏平稳性。一个大的In值也会导致很高的计算复杂度,所以需要引入一个动态变化的In来平衡这些因素。
对于In个假设片,与当前片更相似的假设片应赋予更大的权重,而差异较大的假设片应赋予更小的权重。因此,当前片的权重与均方误差成反比,可用指数比值表示这些权重。由于在重建过程中无法获得原始值xk,因此在加权过程中使用了当前的迭代估计权重的更新如下:
F(xk)=WkRΨ(xk) (6)
其中,Wk是如下所示的对角线权重矩阵:
帧间多假设预测的关键问题是在迭代重建过程中如何从一个关键帧和一个非关键帧中选择假设片。为了获得好的假设片,现有的帧间多假设预测方法忽略了相邻迭代结果之间的变化。在多假设预测中,假设片数量是不固定的。在GOP中,通过动态地确定每个参考帧中的假设片数量,可以进一步提高非关键帧的恢复质量。当前片需要估计与其时域相关的假设片,其中前向关键帧和前一个非关键帧被视为其参考帧。在当前帧的第n次迭代中,当前片将选择In个假设片。在片匹配中,一个片是当前帧中第k个片的上一次迭代估计(1≤k≤Kmax),另一个片是参考帧中第i个假设片(1≤i≤In),两个片之间的相似度由其均方误差来描述。
在迭代重建过程中,当前非关键帧的恢复质量不断提高。如果假设片数量是固定的,那么在迭代结束时,最后一个候选和当前片之间的相似度会降低。如果最后一个候选帧被用作更新当前帧的有用信息,则帧间的恢复质量可能会降低。为了解决上述问题,本发明设计了迭代递减先验。由于当前帧在迭代开始时含有大量的噪声,其细节信息不明显,而且片匹配也不太准确,因此可以选择更多的候选帧。随着迭代次数的增加,当前帧的恢复质量将得到提高,当前帧中的细节信息将越来越多,具有当前片的最优候选将越来越少,假设片数量也将减少。最优的In通常随着视频内容的动态统计特性而变化,但仍有可能给出次优解。为了从两个参考帧中选择最优候选,所提方法对假设片数量设计了迭代递减先验,在迭代过程中假设片数量逐渐减少。迭代递减先验选用两种暂态函数之一来确定第n次迭代中的假设片数量In,第一种阶梯暂态函数表示为:
其中[·]表示取在1≤In≤I1范围内的最近整数。在信息科学中,准sigmoid函数具有单增长和反函数单增长的性质。准sigmoid函数的理论基础是:前半部分的缓慢变化保证了启动的稳定性,后半部分的缓慢变化保证了搜索的稳定性。根据慢、快、慢的暂态规律,第二种准sigmoid暂态函数表示为:
根据准sigmoid暂态函数,In可以从I1减小到1。在帧间重构过程中,根据当前片与假设片之间的均方误差,在当前帧的第n次迭代中选择最优的In个假设片。图2给出了下降先验假设的两种暂态函数。当水平轴的迭代次数n由1变为Nmax时,纵轴的In值也由Imax变为1,通过迭代执行多假设预测过程,并且对于当前帧逐渐获得更高的预测精度。所提方法通过将改进的残差稀疏建模和先验引导的片匹配集成到式(7)中,通过SBI算法求解该l1范数最小化问题,从而完成帧间重构。所提方法通过更加精细的自适应片匹配机制,在复杂度约束下有效提升了测试序列的恢复质量。至此,所提方法完成Foreman测试序列的重构,非关键帧的恢复质量得以提升。
Claims (1)
1.一种视频压缩感知低延迟帧间重构的迭代渐进假设预测方法,包括两个并行运作的环节,其特征在于,环节(1)采用前向关键帧和前一个非关键帧作为双参考帧,在当前帧的第n次迭代中(1≤n≤Nmax),当前片是当前帧中第k个片的上一次迭代估计(1≤k≤Kmax),从双参考帧中选择最相似的In个假设片(1≤In≤I1),其中I1是第1次迭代中的假设片数量;当前片的残差R(xk)是其原始值xk与其假设片组合的差值:式中是当前片的第i个假设片(1≤i≤In),权重采用下式更新:其中MSE(·)是均方误差算子;环节(2)针对当前帧的第n次迭代,当前片根据以下任一种暂态函数选择In个假设片:阶梯暂态函数其中[·]表示取在1到I1范围内的最近整数;准sigmoid暂态函数通过分裂Bregman迭代算法求解残差R(xk)的l1范数最小化,得到当前帧第k个片的第n次迭代估计,所有Kmax片的估计组成当前帧的第n次迭代估计,进而在执行Nmax次迭代之后完成帧间重构。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110488122.XA CN113225568B (zh) | 2021-04-30 | 2021-04-30 | 一种视频压缩感知低延迟帧间重构的迭代渐进假设预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110488122.XA CN113225568B (zh) | 2021-04-30 | 2021-04-30 | 一种视频压缩感知低延迟帧间重构的迭代渐进假设预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113225568A CN113225568A (zh) | 2021-08-06 |
CN113225568B true CN113225568B (zh) | 2022-09-13 |
Family
ID=77090902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110488122.XA Expired - Fee Related CN113225568B (zh) | 2021-04-30 | 2021-04-30 | 一种视频压缩感知低延迟帧间重构的迭代渐进假设预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113225568B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115941966B (zh) * | 2022-12-30 | 2023-08-22 | 深圳大学 | 一种视频压缩方法及电子设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106888024A (zh) * | 2017-01-06 | 2017-06-23 | 南京邮电大学 | 一种基于双向最佳匹配的分布式视频压缩感知重构方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101557514B (zh) * | 2008-04-11 | 2011-02-09 | 华为技术有限公司 | 一种帧间预测编解码方法、装置及系统 |
CN110290389B (zh) * | 2019-07-11 | 2022-12-06 | 东华大学 | 基于长短期参考帧挑选假设匹配块视频压缩感知重构方法 |
CN110505479B (zh) * | 2019-08-09 | 2023-06-16 | 东华大学 | 时延约束下逐帧相同测量率的视频压缩感知重构方法 |
-
2021
- 2021-04-30 CN CN202110488122.XA patent/CN113225568B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106888024A (zh) * | 2017-01-06 | 2017-06-23 | 南京邮电大学 | 一种基于双向最佳匹配的分布式视频压缩感知重构方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113225568A (zh) | 2021-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109064507B (zh) | 一种用于视频预测的多运动流深度卷积网络模型方法 | |
CN101494780B (zh) | 进行视频处理的装置与视频处理方法 | |
CN106888024B (zh) | 一种基于双向最佳匹配的分布式视频压缩感知重构方法 | |
CN104822063B (zh) | 一种基于字典学习残差重建的压缩感知视频重建方法 | |
US8503522B2 (en) | Video encoding/decoding apparatus and adaptive overlapped block motion compensation method and apparatus employing adaptive weights therefor | |
US5717463A (en) | Method and system for estimating motion within a video sequence | |
KR101291869B1 (ko) | 공간 및 시간 처리를 이용하는 비디오 시퀀스에서의 노이즈 및/또는 플리커 감소 | |
CN106688232A (zh) | 基于模型的视频编码的感知优化 | |
US20070064804A1 (en) | Adaptive motion estimation for temporal prediction filter over irregular motion vector samples | |
US20020196854A1 (en) | Fast video encoder using adaptive hierarchical video processing in a down-sampled domain | |
CN1157080A (zh) | 用于编码视频图像的装置和方法 | |
EP1938617A2 (en) | Mode selection techniques for multimedia coding | |
EP1732329A1 (en) | Method and apparatus for coding moving images | |
KR20090003300A (ko) | 모션 추정 검색 범위 및 확장된 모션 벡터 범위의 동적 선택 방법, 및 인코더 | |
CN101090502A (zh) | 预测质量可控的快速运动估值方法 | |
US8326068B1 (en) | Method and apparatus for modeling quantization matrices for image/video encoding | |
CN113225568B (zh) | 一种视频压缩感知低延迟帧间重构的迭代渐进假设预测方法 | |
CN110290389B (zh) | 基于长短期参考帧挑选假设匹配块视频压缩感知重构方法 | |
Chen et al. | Distributed compressed video sensing based on key frame secondary reconstruction | |
US8831089B1 (en) | Method and apparatus for selecting optimal video encoding parameter configurations | |
JP2009509411A (ja) | ビデオ圧縮における適応的動きベクトルサンプリングのための多段リンク方法 | |
CN109934882B (zh) | 基于动态挑选多假设匹配块的视频压缩感知重构方法 | |
Zheng et al. | An improved distributed compressed video sensing scheme in reconstruction algorithm | |
CN114651270A (zh) | 通过时间可变形卷积进行深度环路滤波 | |
KR101192060B1 (ko) | 블록 세트의 코딩을 위한 모션 벡터를 선택하는 방법 및장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220913 |
|
CF01 | Termination of patent right due to non-payment of annual fee |