CN113099227B - 一种联合优化码率分配和率失真性能的视频编码方法 - Google Patents

一种联合优化码率分配和率失真性能的视频编码方法 Download PDF

Info

Publication number
CN113099227B
CN113099227B CN202110269496.2A CN202110269496A CN113099227B CN 113099227 B CN113099227 B CN 113099227B CN 202110269496 A CN202110269496 A CN 202110269496A CN 113099227 B CN113099227 B CN 113099227B
Authority
CN
China
Prior art keywords
distortion
ssim
structural similarity
formula
rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110269496.2A
Other languages
English (en)
Other versions
CN113099227A (zh
Inventor
牟轩沁
李杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN202110269496.2A priority Critical patent/CN113099227B/zh
Publication of CN113099227A publication Critical patent/CN113099227A/zh
Application granted granted Critical
Publication of CN113099227B publication Critical patent/CN113099227B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种联合优化码率分配和率失真性能的视频编码方法,本发明依据结构相似度的计算公式,对图像块的结构相似度失真进行从像素到图像子块再到图像块进行逐步简化计算,理论推导得出结构相似度失真和均方误差失真的理论关系模型。一方面,通过该理论关系模型,可构建基于结构相似度失真的R‑D‑λ联合关系,求解得到基于结构相似度失真的R‑D模型参数,从而实现对码率分配问题的求解。另一方面,该理论关系模型使得高复杂度的基于结构相似度失真的率失真优化可以通过低复杂度的基于均方误差失真的率失真优化进行。且率失真优化所采用的码率与失真的权衡因子由码率分配的求解所确定,实现了码率分配和率失真性能的联合优化。

Description

一种联合优化码率分配和率失真性能的视频编码方法
技术领域
本发明属于视频编码优化技术领域,具体涉及一种联合优化码率分配和率失真性能的视频编码方法。
背景技术
当前视频直播、视频点播和视频聊天等众多视频应用在人们日常生活中日益普及。面对视频传输和存储所带来的高昂成本,如何在有限的编码码率下获得更高的视频质量是视频编码领域的重要研究问题。
这一问题的解决主要依靠两个重要技术。第一个是研究如何将有限的编码比特数分配给各个编码单元使得编码后的失真最小,即码率分配问题。具体的,以编码一个视频帧为例,给定编码总比特数为Rc,分配给该视频帧中第k个编码单元的比特为Rk,对应产生的失真为Dk。一般设Dk是以Rk为自变量的连续可导凸函数,即Dk=Dk(Rk)。则码率分配问题可以表述为如下有约束的最优化问题:
Figure GDA0003657425590000011
第二个技术是在对一个具体编码单元的编码过程中,权衡编码码率和编码失真的关系,从大量候选编码模式选择出具有率失真表现最优的编码模式,即率失真优化。该问题的解决需首先确定率失真代价函数。以第k个编码单元为例,其率失真代价函数可表述为:
Dk(mode)+λ·Rk(mode) (22)
式中Dk(mode)与Rk(mode)分别为编码模式mode所产生的实际失真与比特数,通过实际编码过程产生。因此,率失真优化问题的核心在于确定两者的权衡因子λ。
在上述两个问题的求解中,传统方法使用原始视频帧和编码后的重建视频帧像素之间的均方误差失真(Mean Squared Error,MSE)作为Dk的度量。这一方案的优点是码率分配问题和率失真优化问题在拉格朗日优化方法下是严格统一的。具体的,公式(1)等价于求解如下无约束最优化问题:
Figure GDA0003657425590000021
对比公式(2)与公式(3)可以发现,比特分配问题取得最优解时,每个编码单元的率失真性能亦取得最优。因此,基于均方误差失真的比特分配问题与率失真优化问题都归一到优化问题(3)的求解。
然而,均方误差失真与人类对失真的主观感知并不一致。即均方误差失真最小时人类的主观感知失真并非最小。为解决这一问题,很多考虑到了人类视觉特性的失真指标被采纳到视频编码的优化中。这其中最典型的是Z.Wang等人提出的结构相似度(Structural SIMilarity,SSIM)指标(Z.Wang,A.C.Bovik,H.R.Sheikh,E.P.Simoncelliet al.,“Image quality assessment:from error visibility to structuralsimilarity,”IEEE transactions on Image Processing,vol.13,no.4,pp.600–612,2004.)。该指标计算了原始图像与失真图像的局部亮度、对比度、结构差异,从而获得与人类感知更一致的质量评价表现。因此,结构相似度被广泛用于视频编码的失真度量。
但在结构相似度用于视频编码优化时存在一个难题。结构相似度的计算复杂度高,如果在率失真优化中直接使用结构相似度作为失真度量,则需要对大量编码模式计算基于结构相似度的率失真代价,时间成本高,难以用于实际应用。因此很多研究将结构相似度用于比特分配问题(公式(1))中的Dk度量,而率失真优化问题(公式(2))中的Dk度量仍使用传统基于均方误差的失真。具体的,如T.-S.Ou等人的研究(T.-S.Ou,Y.-H.Huang,andH.H.Chen,“SSIM-based perceptual rate control for video coding,”IEEETransactions on Circuits and Systems for Video Technology,vol.21,no.5,pp.682–691,May 2011.)、Gao等人的研究(W.Gao,S.Kwong,Y.Zhou,and H.Yuan,“SSIM-based gametheory approach for rate-distortion optimized intra frame CTU-level bitallocation,”IEEE Transactions on Multimedia,vol.18,no.6,pp.988–999,Jun2016.)、以及Zhou等人的研究(M.Zhou,X.Wei,S.Wang,S.Kwong,C.-K.Fong,P.Wong,W.Yuen,and W.Gao,“SSIM-based global optimization for CTU-level rate controlin HEVC,”IEEE Transactions on Multimedia,2019.)均仅构建基于结构相似度的R-D关系模型,求解最优化比特分配,而未能对基于结构相似度的率失真优化进行求解。这一问题导致均方误差率失真代价最小的编码模式被选择,此时基于结构相似度的率失真性能并不是最优的。
为解决这一问题,很多研究提出构建结构相似度失真DSSIM到均方误差失真DMSE的关系模型,使得在基于结构相似度的率失真优化过程中,可以使用复杂度更低的基于均方误差的率失真代价进行模式选择优化。现有的DSSIM-DMSE模型主要包括两个。一个为Yeo等人(C.Yeo,H.L.Tan,and Y.H.Tan,“On rate distortion optimization using SSIM,”IEEETransactions on Circuits and Systems for Video Technology,vol.23,no.7,pp.1170–1181,Jul 2013.)提出使用1/SSIM作为结构相似度失真度量,相应的DSSIM-DMSE模型如下:
Figure GDA0003657425590000031
式中,
Figure GDA0003657425590000032
为原始图像块的方差,C2是防止除以0的常数。第二个模型为Wang等人(S.Wang,A.Rehman,Z.Wang,S.Ma,and W.Gao,“Perceptual video coding based onSSIM-inspired divisive normalization,”IEEE Transactions on Image Processing,vol.22,no.4,pp.1418–1429,2013.)提出的DCT域模型。该模型可表述为:
Figure GDA0003657425590000033
式中,S为与图像块DCT系数相关的参数,具体计算为:
Figure GDA0003657425590000041
式中,Xt(i)和Yt(i)分别是原始图像块和重建图像块第t个子块的第i个DCT系数。这两个模型被广泛用于基于结构相似度的率失真优化的研究中。然而,这两个模型的精确度都不高。此外,基于这两个模型的大量研究都只研究了率失真优化问题,而未能构建基于结构相似度失真的R-D模型,因此基于结构相似度的比特分配问题未被得到解决。
因此,现有的研究普遍存在的问题是码率分配问题和率失真优化问题未能实现在结构相似度失真度量下的统一。一个例外是Li和Mou(Li,Yang,and Xuanqin Mou."SSIM-Based CTU-Level Joint Optimal Bit Allocation and Rate DistortionOptimization."arXiv preprint arXiv:2004.13369(2020).)通过实验发现一种基于哈达玛变换的DSSIM-DMSE线性模型,并用于实现码率分配问题和率失真优化问题的联合优化求解。但该研究的问题在于所提出的线性模型缺乏理论依据,精度不高。
发明内容
本发明的目的在于克服上述不足,提供一种联合优化码率分配和率失真性能的视频编码方法,通过高精确度的结构相似度失真和均方误差失真的线性关系模型,实现码率分配和率失真性能基于结构相似度的联合优化,以在相同编码码率下取得更优的视频质量。
为了达到上述目的,本发明包括以下步骤:
S1,在视频编码过程中,根据结构相似度,计算图像块的失真程度;
S2,建立结构相似度失真与均方误差失真的关系模型;
S3,根据结构相似度失真与均方误差失真的关系模型,实现码率分配和率失真性能的联合优化。
S2中,结构相似度失真与均方误差失真的关系模型为:
Figure GDA0003657425590000051
式中,DSSIM为图像块的基于结构相似度的失真,DMSE则为传统均方误差失真,ρt为图像块中第i个子块均方误差与量化步长之间的线性斜率,Wi为图像块第i个像素处的与局部图像内容相关的权重。
Wi的计算方法如下:
Figure GDA0003657425590000052
式中,L为常数,ωl代表尺寸为11×11的高斯滤波器,l=1,2,…L,
Figure GDA0003657425590000053
Figure GDA0003657425590000054
分别为原始视频帧与编码后重建视频帧的局部方差。
S3的具体方法如下:
S31,基于结构相似度失真与均方误差失真的关系模型DSSIM-DMSE,对图像块构建基于DSSIM的联合R-D-λ关系,求解得到基于DSSIM的R-D模型参数,进而求解码率分配的最优解;
S32、基于构相似度失真与均方误差失真的关系模型DSSIM-DMSE,将高复杂度的基于DSSIM的率失真优化映射为低复杂度的基于DMSE的率失真优化。
S31中,构建的基于DSSIM的R-D关系为包含两个未知模型参数的连续可导凸函数,基于DSSIM的拉格朗日乘子等于DSSIM对于编码比特R的负导数,据此可构建仅包含两个未知参数的基于DSSIM的联合R-D-λ关系;
编码结束后得到实际的编码失真DSSIM和编码比特R,通过结构相似度失真与均方误差失真的关系模型DSSIM-DMSE推导得到与实际编码结果相对应的基于DSSIM的拉格朗日乘子,联合R-D-λ关系中的仅两个的模型参数未知,得到唯一求解。
基于DSSIM的联合R-D-λ关系的具体计算方法如下:
将包含两个未知模型参数的R-DSSIM模型用符号f表示,则基于DSSIM的联合R-D-λ关系表示如下:
Figure GDA0003657425590000061
式中,α和β是两个未知的R-D模型参数,λSSIM为基于结构相似度的拉格朗日乘子。
λSSIM的具体计算方法如下:
λSSIM是不参与实际编码过程的未知参数,通过导数链式法则将其映射到实际参与编码过程的拉格朗日乘子λMSE
Figure GDA0003657425590000062
将结构相似度失真与均方误差失真的关系模型DSSIM-DMSE型代入到映射中,计算得出λSSIM
α和β的具体计算方法如下:
在基于DSSIM的联合R-D-λ关系中,DSSIM与R为编码后可获得的实际编码失真和编码比特,则基于DSSIM的联合R-D-λ关系为仅包含两个未知参数α和β的方程组,α和β可被唯一求解。
S32中的具体计算方法如下:
通过结构相似度失真与均方误差失真的关系模型DSSIM-DMSE,将基于DSSIM的率失真代价映射为基于DMSE的率失真代价,且率失真代价中的拉格朗日乘子由码率分配的最优解以及结构相似度失真与均方误差失真的关系模型DSSIM-DMSE确定。
与现有技术相比,本发明依据结构相似度的计算公式,对图像块的结构相似度失真进行从像素到图像子块再到图像块进行逐步简化计算,理论推导得出结构相似度失真和均方误差失真的理论关系模型。一方面,通过该理论关系模型,可构建基于结构相似度失真的R-D-λ联合关系,求解得到基于结构相似度失真的R-D模型参数,从而实现对码率分配问题的求解。另一方面,该理论关系模型使得高复杂度的基于结构相似度失真的率失真优化可以通过低复杂度的基于均方误差失真的率失真优化进行。且率失真优化所采用的码率与失真的权衡因子由码率分配的求解所确定,实现了码率分配和率失真性能的联合优化。
具体实施方式
下面对本发明做进一步说明。
本发明涉及一种视频编码优化方案。一个具体实施例为:基于结构相似度SSIM计算一个图像帧中每个最大编码单元(Largest Coding Unit,LCU)的失真程度;使用该失真在视频编码中代替传统基于均方误差失真,在高效视频编码(High Efficiency VideoCoding,HEVC)的编码端进行LCU级的码率分配和率失真性能的联合优化。具体包括以下步骤:
步骤1、基于SSIM计算一个图像帧中每个LCU的失真程度。
具体的,SSIM对比了原始图像和失真图像在亮度、对比度和结构三个方面的相似程度。具体的,使用x指代原始图像,使用y指代失真图像,SSIM的计算公式为:
Figure GDA0003657425590000071
其中,i指代一个图像帧中的第i个像素,C1和C2是防止除以0的常数,μ、σ2和σxy分别是均值、方差和协方差,三者通过以下公式计算:
Figure GDA0003657425590000081
其中,L=121,ωl(l=1,2,…L)代表11×11的高斯滤波器。
SSIM是一个取值范围从0到1的图像质量评价指标,数值越大质量越高。因此,一个LCU基于SSIM的失真指标通过下式计算:
Figure GDA0003657425590000082
式中,M为此LCU的像素数量,i∈unit指示位于此LCU中的所有像素。
步骤2、基于公式推导构建结构相似度失真和均方误差失真之间的关系模型。
具体的,首先假设原始图像和失真图像的
Figure GDA0003657425590000083
从而可以将SSIM的计算简化如下:
Figure GDA0003657425590000084
将公式(28)代入到公式(10)中,可得如下SSIM的计算公式:
Figure GDA0003657425590000085
式中使用
Figure GDA0003657425590000086
指示像素之间的平方误差,Wi指示与每个像素周围图像内容相关的权重,即:
Figure GDA0003657425590000087
将公式(11)代入公式(9),一个LCU基于结构相似度的失真可以计算为:
Figure GDA0003657425590000091
式中Wi中的方差是按照公式(8)在图像一个局部区域内通过高斯加权计算得出,又进一步在公式(12)中被高斯模糊滤波。因此Wi在一个小区域内的值是相近的。因此,可以使用一个子块的Wi的均值作为子块所有像素权重的估计,即公式(13)可以进一步简化为:
Figure GDA0003657425590000092
式中,blkt指代一个LCU中的第t个子块,本实施例中所采用的子块尺寸为4×4。
根据已有研究(H.Wang and S.Kwong,“Rate-distortion optimization of ratecontrol for H.264 with adaptive initial quantization parameterdetermination,”IEEE Transactions on Circuits and Systems for VideoTechnology,vol.18,no.1,pp.140–144,2008.),一个图像块的均方误差失真与量化步长成线性关系。在本实例中,该关系可表述为:
Figure GDA0003657425590000093
式中,ρt为线性参数,Qt是子块blkt所采用的量化步长。
根据公式(15),一个LCU的均方误差失真可以计算为:
Figure GDA0003657425590000094
另一方面,将公式(15)代入到公式(14)中,此LCU的结构相似度失真可计算为:
Figure GDA0003657425590000095
由于一个LCU中各个子块的量化步长一般是一致的,因此依据公式(16)和公式(17)可得到如下DSSIM-DMSE关系:
Figure GDA0003657425590000101
式中使用Θ指代
Figure GDA0003657425590000102
至此,推导得出DSSIM与DMSE的理论关系模型。
在公式(18)中,ρt与图像内容相关。由于前后编码帧的图像内容是相似的,本实施例使用前一编码帧相同位置LCU的编码结果
Figure GDA0003657425590000103
作为当前LCU的ρt的估计值。为了补偿此估计值所带来的误差,本实施例使用最小二乘法在时域相邻LCU之间进行参数回归。具体的,该参数回归方法表述为:
DSSIM=θ·Θ·DMSE+η (39)
式中,θ和η为通过最小二乘法随编码过程在时域相邻LCU之间更新的线性模型参数。
步骤3、基于步骤2所述DSSIM-DMSE线性关系模型,构建基于结构相似度失真的R-D模型,求解基于结构相似度失真的最优化码率分配。
具体的,本实施例使用幂函数模型为每个CTU构建基于结构相似度失真的R-D模型。该模型可被表述为:
DSSIM=α·Rβ (40)
式中,α和β为待计算的模型参数。
由于拉格朗日乘子λ等于失真相对于码率的负导数,依据公式(14)可以得到如下基于结构相似度的R-λ关系:
λSSIM=-αβ·Rβ-1 (41)
对公式(19)使用导数链式法则,则可得到如下基于结构相似度的拉格朗日乘子λSSIM和基于均方误差的拉格朗日乘子λMSE的关系:
λSSIM=θ·Θ·λMSE. (42)
根据公式(20)、(21)、(22)可得到如下基于结构相似度失真的R-D-λ联合关系:
Figure GDA0003657425590000111
在此联合关系中,在一个LCU编码结束后,R和DSSIM为已知的编码结果,λMSE为已知的编码过程实际使用的拉格朗日乘子,因此仅有α和β两个未知数。故可通过如下公式计算得到其唯一解:
Figure GDA0003657425590000112
计算得到的基于结构相似度的R-D模型参数将作为下一编码帧相同位置LCU的模型参数的估计,同时使用拉格朗日乘子法求解最优化码率分配问题。具体的,一帧中所有LCU的模型参数α和β已知时,根据公式(21)可反推出如下R-λSSIM关系:
Figure GDA0003657425590000113
基于公式(25)可计算出所有LCU在给定λSSIM时所对应的比特。根据拉格朗日乘子法,比特分配问题的最优解要求一帧中所有图像块具有相同的λSSIM。因此,利用公式(25),本实施例通过二分法搜索满足比特约束时所对应的最优λSSIM
步骤3、基于步骤2所述DSSIM-DMSE线性关系模型,进行基于结构相似度失真的率失真优化。
具体的,将公式(19)代入到公式(2)中,基于结构相似度的率失真代价的最小化问题可进一步等价于:
Figure GDA0003657425590000121
式中m指代编码模式。
根据公式(26),在基于结构相似度失真的率失真优化中,无需为大量候选编码模式计算具有高复杂度的结构相似度失真。只需按照传统编码方法,为候选编码模式计算具有低复杂度的基于均方误差失真的率失真代价;同时,在该率失真代价中使用一个与结构相似度失真相关的新的拉格朗日乘子。具体的,这一新的拉格朗日乘子为:
Figure GDA0003657425590000122
式中,λSSIM为基于结构相似度的拉格朗日乘子。该乘子即为基于结构相似度失真的码率分配问题求解所得到的最优拉格朗日乘子。
步骤6、在步骤5所述方法进行率失真优化编码后,开始对下一编码帧进行编码。
具体为,重复步骤4所述方法得到当前编码帧所有LCU的R-DSSIM模型参数作为下一帧相同位置LCU模型参数的估计,重复步骤4所述的拉格朗日乘子法计算得出基于结构相似度的比特分配问题的最优的λSSIM;重复步骤5所述的基于结构相似度的率失真优化。

Claims (1)

1.一种联合优化码率分配和率失真性能的视频编码方法,其特征在于,包括以下步骤:
S1,在视频编码过程中,基于SSIM计算一个图像帧中每个LCU的失真程度;
SSIM对比了原始图像和失真图像在亮度、对比度和结构三个方面的相似程度,使用x指代原始图像,使用y指代失真图像,SSIM的计算公式为:
Figure FDA0003726828540000011
其中,i指代一个图像帧中的第i个像素,C1和C2是防止除以0的常数,μ、σ2和σxy分别是均值、方差和协方差,三者通过以下公式计算:
Figure FDA0003726828540000012
其中,L=121,ωl(l=1,2,…L)代表11×11的高斯滤波器;
SSIM是一个取值范围从0到1的图像质量评价指标,数值越大质量越高,因此,一个LCU基于SSIM的失真指标通过下式计算:
Figure FDA0003726828540000013
式中,M为此LCU的像素数量,i∈unit指示位于此LCU中的所有像素;
S2、基于公式推导构建结构相似度失真和均方误差失真之间的关系模型;
具体的,首先假设原始图像和失真图像的
Figure FDA0003726828540000015
从而可以将SSIM的计算简化如下:
Figure FDA0003726828540000014
将公式(2)代入到公式(4)中,可得如下SSIM的计算公式:
Figure FDA0003726828540000021
式中使用
Figure FDA0003726828540000022
指示像素之间的平方误差,Wi指示与每个像素周围图像内容相关的权重,即:
Figure FDA0003726828540000023
将公式(5)代入公式(3),一个LCU基于结构相似度的失真可以计算为:
Figure FDA0003726828540000024
式中Wi中的方差是按照公式(2)在图像一个局部区域内通过高斯加权计算得出,又进一步在公式(6)中被高斯模糊滤波,因此Wi在一个小区域内的值是相近的,因此,可以使用一个子块的Wi的均值作为子块所有像素权重的估计,即公式(7)可以进一步简化为:
Figure FDA0003726828540000025
式中,blkt指代一个LCU中的第t个子块,本实施例中所采用的子块尺寸为4×4;
一个图像块的均方误差失真与量化步长成线性关系,该关系可表述为:
Figure FDA0003726828540000026
式中,ρt为线性参数,Qt是子块blkt所采用的量化步长;
根据公式(9),一个LCU的均方误差失真可以计算为:
Figure FDA0003726828540000027
另一方面,将公式(9)代入到公式(8)中,此LCU的结构相似度失真可计算为:
Figure FDA0003726828540000031
由于一个LCU中各个子块的量化步长一般是一致的,因此依据公式(10)和公式(11)可得到如下DSSIM-DMSE关系:
Figure FDA0003726828540000032
式中使用Θ指代
Figure FDA0003726828540000033
至此,推导得出DSSIM与DMSE的理论关系模型;
S3,基于DSSIM-DMSE线性关系模型,构建基于结构相似度失真的R-D模型,求解基于结构相似度失真的最优化码率分配;
使用幂函数模型为每个CTU构建基于结构相似度失真的R-D模型,该模型可被表述为:
DSSIM=α·Rβ (13)
式中,α和β为待计算的模型参数;
由于拉格朗日乘子λ等于失真相对于码率的负导数,依据公式(8)可以得到如下基于结构相似度的R-λ关系:
λSSIM=-αβ·Rβ-1 (14)
对公式DSSIM=θ·Θ·DMSE+η使用导数链式法则,θ和η为通过最小二乘法随编码过程在时域相邻LCU之间更新的线性模型参数,则可得到如下基于结构相似度的拉格朗日乘子λSSIM和基于均方误差的拉格朗日乘子λMSE的关系:
λSSIM=θ·Θ·λMSE. (15)
根据公式(13)、(14)、(15)可得到如下基于结构相似度失真的R-D-λ联合关系:
Figure FDA0003726828540000041
在此联合关系中,在一个LCU编码结束后,R和DSSIM为已知的编码结果,λMSE为已知的编码过程实际使用的拉格朗日乘子,因此仅有α和β两个未知数,故可通过如下公式计算得到其唯一解:
Figure FDA0003726828540000042
计算得到的基于结构相似度的R-D模型参数将作为下一编码帧相同位置LCU的模型参数的估计,同时使用拉格朗日乘子法求解最优化码率分配问题,一帧中所有LCU的模型参数α和β已知时,根据公式(14)可反推出如下R-λSSIM关系:
Figure FDA0003726828540000043
基于公式(18)可计算出所有LCU在给定λSSIM时所对应的比特,根据拉格朗日乘子法,比特分配问题的最优解要求一帧中所有图像块具有相同的λSSIM,利用公式(18),通过二分法搜索满足比特约束时所对应的最优λSSIM
S4、基于DSSIM-DMSE线性关系模型,进行基于结构相似度失真的率失真优化;
将公式DSSIM=θ·Θ·DMSE+η代入到公式Dk(mode)+λ·Rk(mode)中,Dk(mode)与Rk(mode)分别为编码模式mode所产生的实际失真与比特数,λ为权衡因子,基于结构相似度的率失真代价的最小化问题可进一步等价于:
Figure FDA0003726828540000044
式中m指代编码模式;
根据公式(19),在基于结构相似度失真的率失真优化中,无需为大量候选编码模式计算具有高复杂度的结构相似度失真,只需按照传统编码方法,为候选编码模式计算具有低复杂度的基于均方误差失真的率失真代价;同时,在该率失真代价中使用一个与结构相似度失真相关的新的拉格朗日乘子,这一新的拉格朗日乘子为:
Figure FDA0003726828540000051
式中,λSSIM为基于结构相似度的拉格朗日乘子,该乘子即为基于结构相似度失真的码率分配问题求解所得到的最优拉格朗日乘子。
CN202110269496.2A 2021-03-12 2021-03-12 一种联合优化码率分配和率失真性能的视频编码方法 Active CN113099227B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110269496.2A CN113099227B (zh) 2021-03-12 2021-03-12 一种联合优化码率分配和率失真性能的视频编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110269496.2A CN113099227B (zh) 2021-03-12 2021-03-12 一种联合优化码率分配和率失真性能的视频编码方法

Publications (2)

Publication Number Publication Date
CN113099227A CN113099227A (zh) 2021-07-09
CN113099227B true CN113099227B (zh) 2022-08-16

Family

ID=76667062

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110269496.2A Active CN113099227B (zh) 2021-03-12 2021-03-12 一种联合优化码率分配和率失真性能的视频编码方法

Country Status (1)

Country Link
CN (1) CN113099227B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113784130B (zh) * 2021-08-09 2024-05-07 西安交通大学 一种基于梯度模相似度离差最小化的比特分配方法
CN114584536B (zh) * 2022-02-22 2024-03-12 重庆大学 一种基于分区率失真建模的360度流媒体传输方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102647591A (zh) * 2012-04-17 2012-08-22 中国科学院声学研究所 基于ssim评价的容错率失真优化视频编码方法、装置
WO2012171113A1 (en) * 2011-06-14 2012-12-20 Zhou Wang Method and system for structural similarity based rate-distortion optimization for perceptual video coding
CN103607590A (zh) * 2013-11-28 2014-02-26 北京邮电大学 基于结构相似度的高效视频编码感知率失真优化方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2716048A4 (en) * 2011-06-01 2015-04-01 Zhou Wang METHOD AND SYSTEM FOR PERFORMANCE BASED ON STRUCTURAL SIMILAR PERCEPTUAL VIDEO CODING
US9781449B2 (en) * 2011-10-06 2017-10-03 Synopsys, Inc. Rate distortion optimization in image and video encoding
CN103634600B (zh) * 2012-08-22 2016-09-28 中国科学院声学研究所 一种基于ssim评价的视频编码模式选择方法、系统
CN104796705B (zh) * 2015-04-22 2018-01-12 福州大学 一种基于ssim的hevc视频编码率失真优化与码率控制算法
CN109743571B (zh) * 2018-12-26 2020-04-28 西安交通大学 一种基于并行压缩感知多层残差系数的图像编码方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012171113A1 (en) * 2011-06-14 2012-12-20 Zhou Wang Method and system for structural similarity based rate-distortion optimization for perceptual video coding
CN102647591A (zh) * 2012-04-17 2012-08-22 中国科学院声学研究所 基于ssim评价的容错率失真优化视频编码方法、装置
CN103607590A (zh) * 2013-11-28 2014-02-26 北京邮电大学 基于结构相似度的高效视频编码感知率失真优化方法

Also Published As

Publication number Publication date
CN113099227A (zh) 2021-07-09

Similar Documents

Publication Publication Date Title
US9451266B2 (en) Optimal intra prediction in block-based video coding to calculate minimal activity direction based on texture gradient distribution
CN113099227B (zh) 一种联合优化码率分配和率失真性能的视频编码方法
CN104796705B (zh) 一种基于ssim的hevc视频编码率失真优化与码率控制算法
CN107810632B (zh) 具有降低代价的块分割和细化的帧内模式选择的帧内预测处理器
CN104883565A (zh) 一种高效视频编码的帧内预测模式决策方法及装置
Pan et al. Frame-level Bit Allocation Optimization Based on<? brk?> Video Content Characteristics for HEVC
CN111741297B (zh) 帧间预测方法、视频编码方法及其相关装置
CN101674472A (zh) 多视点视频编码的多级码率控制方法
CN104811728A (zh) 一种视频内容自适应的运动搜索方法
CN104754335B (zh) 一种视频编码码率控制方法
CN103634601A (zh) 基于结构相似度的高效视频编码感知码率控制优化方法
CN103634600B (zh) 一种基于ssim评价的视频编码模式选择方法、系统
CN110139101B (zh) 一种基于λ域码率控制的帧级比特分配方法
CN106534855B (zh) 一种面向satd的拉格朗日因子计算方法
CN109889837B (zh) 最优拉格朗日乘子基准定点标定方法
CN109688411B (zh) 一种视频编码率失真代价估计方法和装置
CN108322740B (zh) 一种编码复杂度可控的编码方法
WO2021036462A1 (zh) 参数获取方法、像素点对选择方法及相关设备
CN108449591A (zh) 一种深度视频dmm模式简化方法
CN107592535B (zh) H.265/hevc图像层码率控制方法
CN112218083B (zh) 高效视频编码标准帧内图像码率估计方法
CN107371023A (zh) 一种帧内亮度预测模式的快速选择方法
WO2020253728A1 (zh) 编码方法及装置
CN110035285B (zh) 基于运动矢量敏感度的深度预测方法
CN104320660B (zh) 用于无损视频编码的率失真优化方法及编码方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant