CN112437314B - 高效视频编码标准帧内图像质量估计方法 - Google Patents

高效视频编码标准帧内图像质量估计方法 Download PDF

Info

Publication number
CN112437314B
CN112437314B CN202011108891.4A CN202011108891A CN112437314B CN 112437314 B CN112437314 B CN 112437314B CN 202011108891 A CN202011108891 A CN 202011108891A CN 112437314 B CN112437314 B CN 112437314B
Authority
CN
China
Prior art keywords
value
image
psi
texture
psnr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011108891.4A
Other languages
English (en)
Other versions
CN112437314A (zh
Inventor
杨楷芳
公衍超
马苗
杨豆豆
施姿羽
蒙琴琴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shaanxi Normal University
Original Assignee
Shaanxi Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shaanxi Normal University filed Critical Shaanxi Normal University
Priority to CN202011108891.4A priority Critical patent/CN112437314B/zh
Publication of CN112437314A publication Critical patent/CN112437314A/zh
Application granted granted Critical
Publication of CN112437314B publication Critical patent/CN112437314B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种高效视频编码标准帧内图像质量估计方法,由确定边长、确定基本计算单元大小、确定图像的标准差、确定图像类型、获得纹理简单图像模型参数、估计纹理简单图像质量、获得纹理复杂图像模型参数、估计纹理复杂图像质量步骤组成。采用本发明方法对高效视频编码标准国际制定组织推荐的标准视频序列进行实验,实验结果表明,相比HM16.0实际编码运行的时间,本发明方法可以在准确地估计图像峰值信噪比的同时节省超过96.42%的运行时间,大大降低了算法运算复杂度。本发明具有质量估计准确、模型参数计算简单、计算速度快等优点,可用于视频编码、视频通信等领域中。

Description

高效视频编码标准帧内图像质量估计方法
技术领域
本发明属于视频编码技术领域,具体涉及到高效视频编码标准帧内图像质量估计方法。
背景技术
在视频多媒体通信系统中,由摄像机采集的原始视频数据量非常庞大,如此庞大的原始视频如果不经过编码是无法在当前的多媒体系统中有效地传输和存储。视频编码是保证视频多媒体通信系统有效运行的关键技术,视频编码的目的是用更少的编码码率获得更高质量的编码重建视频。
目前随着高清设备的大量普及,面向高清视频的高效视频编码标准被广泛采用,使用高效视频编码标准编码视频时,需要综合各种因素给视频选择一组优化的编码参数组合,从而获得更加优化的编码性能。高效视频编码标准在选择优化的编码参数组合时,通常使用拉格朗日率失真优化的方法,在此方法中,需要用到图像编码的质量信息。视频图像的真实的编码质量信息只有在图像全部编码完成之后才能获得,但是编码图像要耗费大量时间,所以通过全编码过程获得图像质量信息的方式由于复杂度过高的技术问题,在实际应用中很少采用。
目前采用部分编码过程的方式获得图像质量的估计值,即对图像进行部分编码操作,然后基于相关编码信息,例如预测块的残差信息、量化后的变换系数、熵编码的上下文模型等,得到图像质量估计值。相比于全编码过程的方式,基于部分编码过程的图像质量估计方法虽然降低了一定的复杂度,但其仍然要执行部分编码操作,所以其复杂度仍然较高。特别是对于一些对实时性要求较高的视频多媒体通信应用,例如视频会议、视频监控,基于部分编码过程的方式仍然不适用。另外,不同的图像具有不同的内容特性,对于不同内容复杂程度的图像,其对应的优化的质量估计模型形式通常不一样。但目前部分质量估计模型对于所有的图像类型都使用相同的模型形式,例如幂函数形式,这类方法的质量估计准确度还有待于提升。此外,视频图像的内容特性及编码参数配置(例如量化参数)是影响图像质量的两个基本因素,一些图像质量估计方法只考虑了图像的内容特性,并没有考虑同样对图像质量有重要影响的编码参数。所以这类方法的复杂度虽然很低,但其质量估计的准确度很难保证。
发明内容
本发明所要解决的技术问题在于克服上述现有技术的缺点,提供一种质量估计准确、模型参数计算简单、计算速度快的高效视频编码标准帧内图像质量估计方法。
解决上述技术问题所采用的技术方案是由下述步骤组成:
(1)确定边长
输入视频图像的空间分辨率,按照式(1)得到边长l:
Figure BDA0002727907910000021
其中round()为四舍五入取整函数,wp为图像宽,hp为图像高,γ∈[0.5,3.5],σ∈[0.05,0.4],wc∈{88,89,...,704},hc∈{72,73,...,576}。
(2)确定基本计算单元大小
基本计算单元为矩形像素块,由边长l确定基本计算单元的宽wb和高hb
wb=αl (2)
hb=βl (3)
其中α∈{0.5,1,1.5,2,2.5,3},β∈{0.5,1,1.5,2,2.5,3}。
(3)确定图像的标准差
图像的标准差按式(4)确定:
Figure BDA0002727907910000022
其中sd(i)表示视频第i幅帧内图像的标准差,i∈{1,2,..,Np},Np是视频的总图像数、为有限的正整数,int()为下取整函数,x(i,k,j)表示视频第i幅帧内图像第k个基本计算单元第j个像素的亮度值,k、j为有限的正整数。
(4)确定图像类型
第i幅帧内图像满足sd(i)≥Tsd,此图像被分类为纹理复杂图像,第i幅帧内图像满足sd(i)<Tsd,此图像被分类为纹理简单图像,其中Tsd为复杂度分类阈值参数,Tsd∈[6,16]。
(5)获得纹理简单图像模型参数
对于纹理简单图像,根据式(5)-式(10)分别获得用于质量估计的6个模型参数θ1、θ2、θ3、θ4、θ5、θ6
Figure BDA0002727907910000031
Figure BDA0002727907910000032
Figure BDA0002727907910000033
Figure BDA0002727907910000034
Figure BDA0002727907910000035
Figure BDA0002727907910000036
其中In()是以自然常数e为底的对数函数,ξ1、ξ2、ξ3、ξ4、ξ5、ξ6、ξ7、ξ8、ξ9、ξ10、ξ11、ξ12、ξ13、ξ14、ξ15、ξ16、ξ17、ξ18为模型参数,模型参数的取值范围为:ξ1∈[-2,-0.1],ξ2∈[0.001,0.5],ξ3∈[-0.2,-0.01],ξ4∈[100,2000],ξ5∈[-5000,-800],ξ6∈[1000,10000],ξ7∈[-2,-0.1],ξ8∈[5,100],ξ9∈[-200,-0.01],ξ10∈[1000,10000],ξ11∈[-30000,-2000],ξ12∈[5000,50000],ξ13∈[1×10-10,30×10-10],ξ14∈[0.1,12],ξ15∈[-2,-0.01],ξ16∈[130,2000],ξ17∈[-10000,-100],ξ18∈[1000,20000]。
(6)估计纹理简单图像质量
使用图像质量评价领域广泛使用的峰值信噪比衡量图像的质量,用式(11)-式(13)分别得到纹理简单图像亮度分量Y、色度分量Cb、色度分量Cr对应的峰值信噪比PSNRf,Y、PSNRf,Cb、PSNRf,Cr
PSNRf,Y=θ1QP+θ2 (11)
PSNRf,Cb=θ3QP+θ4 (12)
PSNRf,Cr=θ5QP+θ6 (13)
其中QP表示用于编码的量化参数。
(7)获得纹理复杂图像模型参数
对于纹理复杂图像,根据式(14)-式(19)分别获得用于质量估计的6个模型参数θ7、θ8、θ9、θ10、θ11、θ12
θ7=ψ12sd(i)+ψ3exp(-sd(i)) (14)
θ8=ψ45sd(i)+ψ6exp(-sd(i)) (15)
Figure BDA0002727907910000041
Figure BDA0002727907910000042
θ11=ψ1314sd(i)+ψ15(sd(i))2 (18)
Figure BDA0002727907910000043
其中exp()是以自然常数e为底的指数函数,ψ1、ψ2、ψ3、ψ4、ψ5、ψ6、ψ7、ψ8、ψ9、ψ10、ψ11、ψ12、ψ13、ψ14、ψ15、ψ16、ψ17、ψ18为模型参数,模型参数的取值范围分别为:ψ1∈[-2,-0.01],ψ2∈[-1,-0.0001],ψ3∈[100,3000],ψ4∈[10,100],ψ5∈[0,2],ψ6∈[-20×104,-0.1×104],ψ7∈[10,200],ψ8∈[-1000,-100],ψ9∈[-10×105,-0.1×105],ψ10∈[10,200],ψ11∈[-12,-2],ψ12∈[-2,-0.01],ψ13∈[10,50],ψ14∈[2,12],ψ15∈[-2,-0.01],ψ16∈[-2,-0.2],ψ17∈[0.1×10-6,10×10-6],ψ18∈[0.1,5]。
(8)估计纹理复杂图像质量
根据式(20)-式(22)分别得到纹理复杂图像亮度分量Y、色度分量Cb、色度分量Cr对应的峰值信噪比PSNRg,Y、PSNRg,Cb、PSNRg,Cr
PSNRg,Y=θ7QP+θ8 (20)
Figure BDA0002727907910000044
Figure BDA0002727907910000051
在本发明的确定边长步骤(1)中,所述的γ最佳取值为2.312,σ最佳取值为0.1098,wc最佳取值为176,hc最佳取值为144。
在本发明的确定基本计算单元大小步骤(2)中,所述的α最佳取值为1,β最佳取值为1。
在本发明的确定图像类型步骤(4)中,所述的Tsd最佳取值为9.12。
在本发明的取值获得纹理简单图像模型参数步骤(5)中,所述的ξ1最佳取值为-0.5637,ξ2最佳取值为0.0757,ξ3最佳为-0.1341,ξ4最佳取值为988.9938,ξ5最佳取值为-3757.8642,ξ6最佳取值为6992.5402,ξ7最佳取值为-1.3832,ξ8最佳取值为17.1871,ξ9最佳取值为-69.3852,ξ10最佳取值为4261.0297,ξ11最佳取值为-16930.2401,ξ12最佳取值为31464.9802,ξ13最佳取值为7.6974×10-1014最佳取值为1.1118,ξ15最佳取值为-0.3504,ξ16最佳取值为1303.1992,ξ17最佳取值为-5013.0618,ξ18最佳取值为9302.5936。
在本发明的获得纹理复杂图像模型参数步骤(7)中,所述的ψ1最佳取值为-0.5893,ψ2最佳取值为-0.0141,ψ3最佳取值为1871.2642,ψ4最佳取值为55.4507,ψ5最佳取值为0.302,ψ6最佳取值为-2.4956×104,ψ7最佳取值为140.8854,ψ8最佳取值为-421.6006,ψ9最佳取值为-1.2082×105,ψ10最佳取值为123.5036,ψ11最佳取值为-8.4543,ψ12最佳取值为-0.3476,ψ13最佳取值为22.2138,ψ14最佳取值为8.0586,ψ15最佳取值为-0.1659,ψ16最佳取值为-0.802,ψ17最佳取值为3.5974×10-6,ψ18最佳取值为1.3514。
由于上述技术方案采用了确定图像类型步骤、估计纹理简单图像模型参数步骤、估计纹理简单图像质量步骤、估计纹理复杂图像模型参数步骤、估计纹理复杂图像质量步骤,解决了现有技术需要执行全部编码或部分编码过程算法复杂度高、对不同内容复杂程度图像使用相同优化模型形式、没有同时考虑图像内容特性和编码参数对于图像质量影响的技术问题,经仿真实验证明,减少了超过96.42%的运行时间,降低了运算复杂度,具有质量估计准确、模型参数计算简单、计算速度快等优点,可用于视频编码、视频通信等技术领域。
附图说明
图1是实施例1高效视频编码标准帧内图像质量估计方法的流程图。
具体实施方式
下面结合附图和实施例对本发明进一步详细说明,但本发明不限于下面的实施例。
实施例1
在图1中,本实施例的高效视频编码标准帧内图像质量估计方法由下述步骤组成:
(1)确定边长
输入视频图像的空间分辨率,按照式(1)得到边长l,
Figure BDA0002727907910000061
其中round()为四舍五入取整函数,wp为图像宽,hp为图像高,γ∈[0.5,3.5],σ∈[0.05,0.4],wc∈{88,89,...,704},hc∈{72,73,...,576},本实施例中,γ取值为2.312,σ取值为0.1098,wc取值为176,hc取值为144。
(2)确定基本计算单元大小
基本计算单元为矩形像素块,由边长l确定基本计算单元的宽wb和高hb
wb=αl (2)
hb=βl (3)
其中α∈{0.5,1,1.5,2,2.5,3},β∈{0.5,1,1.5,2,2.5,3},本实施例中,α取值为1,β取值为1。
(3)确定图像的标准差
图像的标准差按式(4)确定:
Figure BDA0002727907910000062
其中sd(i)表示视频第i幅帧内图像的标准差,i∈{1,2,..,Np},Np是视频的总图像数、为有限的正整数,int()为下取整函数,x(i,k,j)表示视频第i幅帧内图像第k个基本计算单元第j个像素的亮度值,k、j为有限的正整数。
(4)确定图像类型
第i幅帧内图像满足sd(i)≥Tsd,此图像被分类为纹理复杂图像,如果第i幅帧内图像满足sd(i)<Tsd,则此图像被分类为纹理简单图像,其中Tsd为复杂度分类阈值参数,Tsd∈[6,16],本实施例的Tsd取值为9.12。
(5)获得纹理简单图像模型参数
对于纹理简单图像,根据式(5)-式(10)分别获得用于质量估计的6个模型参数θ1、θ2、θ3、θ4、θ5、θ6
Figure BDA0002727907910000071
Figure BDA0002727907910000072
Figure BDA0002727907910000073
Figure BDA0002727907910000074
Figure BDA0002727907910000075
Figure BDA0002727907910000076
其中In()是以自然常数e为底的对数函数,ξ1、ξ2、ξ3、ξ4、ξ5、ξ6、ξ7、ξ8、ξ9、ξ10、ξ11、ξ12、ξ13、ξ14、ξ15、ξ16、ξ17、ξ18为模型参数,模型参数的取值范围为:ξ1∈[-2,-0.1],ξ2∈[0.001,0.5],ξ3∈[-0.2,-0.01],ξ4∈[100,2000],ξ5∈[-5000,-800],ξ6∈[1000,10000],ξ7∈[-2,-0.1],ξ8∈[5,100],ξ9∈[-200,-0.01],ξ10∈[1000,10000],ξ11∈[-30000,-2000],ξ12∈[5000,50000],ξ13∈[1×10-10,30×10-10],ξ14∈[0.1,12],ξ15∈[-2,-0.01],ξ16∈[130,2000],ξ17∈[-10000,-100],ξ18∈[1000,20000]。本实施例的ξ1取值为-0.5637,ξ2取值为0.0757,ξ3取值为-0.1341,ξ4取值为988.9938,ξ5取值为-3757.8642,ξ6取值为6992.5402,ξ7取值为-1.3832,ξ8取值为17.1871,ξ9取值为-69.3852,ξ10取值为4261.0297,ξ11取值为-16930.2401,ξ12取值为31464.9802,ξ13取值为7.6974×10-1014取值为1.1118,ξ15取值为-0.3504,ξ16取值为1303.1992,ξ17取值为-5013.0618,ξ18取值为9302.5936。
(6)估计纹理简单图像质量
使用图像质量评价领域广泛使用的峰值信噪比衡量图像的质量,用式(11)-式(13)分别得到纹理简单图像亮度分量Y、色度分量Cb、色度分量Cr对应的峰值信噪比PSNRf,Y、PSNRf,Cb、PSNRf,Cr
PSNRf,Y=θ1QP+θ2 (11)
PSNRf,Cb=θ3QP+θ4 (12)
PSNRf,Cr=θ5QP+θ6 (13)
其中QP表示用于编码的量化参数。
(7)获得纹理复杂图像模型参数
对于纹理复杂图像,根据式(14)-式(19)分别获得用于质量估计的6个模型参数θ7、θ8、θ9、θ10、θ11、θ12
θ7=ψ12sd(i)+ψ3exp(-sd(i)) (14)
θ8=ψ45sd(i)+ψ6exp(-sd(i)) (15)
Figure BDA0002727907910000081
Figure BDA0002727907910000082
θ11=ψ1314sd(i)+ψ15(sd(i))2 (18)
Figure BDA0002727907910000083
其中exp()是以自然常数e为底的指数函数,ψ1、ψ2、ψ3、ψ4、ψ5、ψ6、ψ7、ψ8、ψ9、ψ10、ψ11、ψ12、ψ13、ψ14、ψ15、ψ16、ψ17、ψ18为模型参数,模型参数的取值范围分别为:ψ1∈[-2,-0.01],ψ2∈[-1,-0.0001],ψ3∈[100,3000],ψ4∈[10,100],ψ5∈[0,2],ψ6∈[-20×104,-0.1×104],ψ7∈[10,200],ψ8∈[-1000,-100],ψ9∈[-10×105,-0.1×105],ψ10∈[10,200],ψ11∈[-12,-2],ψ12∈[-2,-0.01],ψ13∈[10,50],ψ14∈[2,12],ψ15∈[-2,-0.01],ψ16∈[-2,-0.2],ψ17∈[0.1×10-6,10×10-6],ψ18∈[0.1,5]。本实施例的ψ1取值为-0.5893,ψ2取值为-0.0141,ψ3取值为1871.2642,ψ4取值为55.4507,ψ5取值为0.302,ψ6取值为-2.4956×104,ψ7取值为140.8854,ψ8取值为-421.6006,ψ9取值为-1.2082×105,ψ10取值为123.5036,ψ11取值为-8.4543,ψ12取值为-0.3476,ψ13取值为22.2138,ψ14取值为8.0586,ψ15取值为-0.1659,ψ16取值为-0.802,ψ17取值为3.5974×10-6,ψ18取值为1.3514。
(8)估计纹理复杂图像质量
根据式(20)-式(22)分别得到纹理复杂图像亮度分量Y、色度分量Cb、色度分量Cr对应的峰值信噪比PSNRg,Y、PSNRg,Cb、PSNRg,Cr
PSNRg,Y=θ7QP+θ8 (20)
Figure BDA0002727907910000091
Figure BDA0002727907910000092
由于本发明采用了确定图像类型步骤、估计纹理简单图像模型参数步骤、估计纹理简单图像质量步骤、估计纹理复杂图像模型参数步骤、估计纹理复杂图像质量步骤,解决了现有技术需要执行全部编码或部分编码过程算法复杂度高、对不同内容复杂程度图像使用相同优化模型形式、没有同时考虑图像内容特性和编码参数对于图像质量影响的技术问题,减少了超过96.42%的运行时间,降低了运算复杂度,具有质量估计准确、模型参数计算简单、计算速度快等优点,可用于视频编码、视频通信等技术领域中。
实施例2
本实施例的高效视频编码标准帧内图像质量估计方法由下述步骤组成:
在确定边长步骤(1)中,输入视频图像的空间分辨率,按照式(1)得到边长l,
Figure BDA0002727907910000093
其中round()为四舍五入取整函数,wp为图像宽,hp为图像高,γ∈[0.5,3.5],σ∈[0.05,0.4],wc∈{88,89,...,704},hc∈{72,73,...,576}。本实施例中,γ取值为0.5,σ取值为0.05,wc取值为88,hc取值为72。
在确定基本计算单元大小步骤(2)中,基本计算单元为矩形像素块,由边长l确定基本计算单元的宽wb和高hb
wb=αl (2)
hb=βl (3)
其中α∈{0.5,1,1.5,2,2.5,3},β∈{0.5,1,1.5,2,2.5,3},本实施例中,α取值为0.5,β取值为0.5。
在确定图像类型步骤(4)中,第i幅帧内图像满足sd(i)≥Tsd,此图像被分类为纹理复杂图像,第i幅帧内图像满足sd(i)<Tsd,此图像被分类为纹理简单图像,其中Tsd为复杂度分类阈值参数,Tsd∈[6,16],本实施例的Tsd取值为6。
在获得纹理简单图像模型参数步骤(5)中,对于纹理简单图像,根据式(5)-式(10)分别获得用于质量估计的6个模型参数θ1、θ2、θ3、θ4、θ5、θ6
Figure BDA0002727907910000101
Figure BDA0002727907910000102
Figure BDA0002727907910000103
Figure BDA0002727907910000104
Figure BDA0002727907910000105
Figure BDA0002727907910000106
其中In()是以自然常数e为底的对数函数,ξ1、ξ2、ξ3、ξ4、ξ5、ξ6、ξ7、ξ8、ξ9、ξ10、ξ11、ξ12、ξ13、ξ14、ξ15、ξ16、ξ17、ξ18为模型参数,模型参数的取值范围为:ξ1∈[-2,-0.1],ξ2∈[0.001,0.5],ξ3∈[-0.2,-0.01],ξ4∈[100,2000],ξ5∈[-5000,-800],ξ6∈[1000,10000],ξ7∈[-2,-0.1],ξ8∈[5,100],ξ9∈[-200,-0.01],ξ10∈[1000,10000],ξ11∈[-30000,-2000],ξ12∈[5000,50000],ξ13∈[1×10-10,30×10-10],ξ14∈[0.1,12],ξ15∈[-2,-0.01],ξ16∈[130,2000],ξ17∈[-10000,-100],ξ18∈[1000,20000]。本实施例的ξ1取值为-2,ξ2取值为0.001,ξ3取值为-0.2,ξ4取值为100,ξ5取值为-5000,ξ6取值为1000,ξ7取值为-2,ξ8取值为5,ξ9取值为-200,ξ10取值为1000,ξ11取值为-30000,ξ12取值为5000,ξ13取值为1×10-10,ξ14取值为0.1,ξ15取值为-2,ξ16取值为130,ξ17取值为-10000,ξ18取值为1000。
在获得纹理复杂图像模型参数步骤(7)中,对于纹理复杂图像,根据式(14)-式(19)分别获得用于质量估计的6个模型参数θ7、θ8、θ9、θ10、θ11、θ12
θ7=ψ12sd(i)+ψ3exp(-sd(i)) (14)
θ8=ψ45sd(i)+ψ6exp(-sd(i)) (15)
Figure BDA0002727907910000111
Figure BDA0002727907910000112
θ11=ψ1314sd(i)+ψ15(sd(i))2 (18)
Figure BDA0002727907910000113
其中exp()是以自然常数e为底的指数函数,ψ1、ψ2、ψ3、ψ4、ψ5、ψ6、ψ7、ψ8、ψ9、ψ10、ψ11、ψ12、ψ13、ψ14、ψ15、ψ16、ψ17、ψ18为模型参数,模型参数的取值范围分别为:ψ1∈[-2,-0.01],ψ2∈[-1,-0.0001],ψ3∈[100,3000],ψ4∈[10,100],ψ5∈[0,2],ψ6∈[-20×104,-0.1×104],ψ7∈[10,200],ψ8∈[-1000,-100],ψ9∈[-10×105,-0.1×105],ψ10∈[10,200],ψ11∈[-12,-2],ψ12∈[-2,-0.01],ψ13∈[10,50],ψ14∈[2,12],ψ15∈[-2,-0.01],ψ16∈[-2,-0.2],ψ17∈[0.1×10-6,10×10-6],ψ18∈[0.1,5]。本实施例的ψ1取值为-2,ψ2取值为-1,ψ3取值为100,ψ4取值为10,ψ5取值为0,ψ6取值为-20×104,ψ7取值为10,ψ8取值为-1000,ψ9取值为-10×105,ψ10取值为10,ψ11取值为-12,ψ12取值为-2,ψ13取值为10,ψ14取值为2,ψ15取值为-2,ψ16取值为-2,ψ17取值为0.1×10-6,ψ18取值为0.1。
其它步骤与实施例1相同。
实施例3
本实施例的高效视频编码标准帧内图像质量估计方法由下述步骤组成:
在确定边长步骤(1)中,输入视频图像的空间分辨率,按照式(1)得到边长l,
Figure BDA0002727907910000121
其中round()为四舍五入取整函数,wp为图像宽,hp为图像高,γ∈[0.5,3.5],σ∈[0.05,0.4],wc∈{88,89,...,704},hc∈{72,73,...,576}。本实施例中,γ取值为3.5,σ取值为0.4,wc取值为704,hc取值为576。
在确定基本计算单元大小步骤(2)中,基本计算单元为矩形像素块,由边长l确定基本计算单元的宽wb和高hb
wb=αl (2)
hb=βl (3)
其中α∈{0.5,1,1.5,2,2.5,3},β∈{0.5,1,1.5,2,2.5,3},本实施例中,α取值为3,β取值为3。
在确定图像类型步骤(4)中,如果第i幅帧内图像满足sd(i)≥Tsd,则此图像被分类为纹理复杂图像,如果第i幅帧内图像满足sd(i)<Tsd,则此图像被分类为纹理简单图像,其中Tsd为复杂度分类阈值参数,Tsd∈[6,16],本实施例的Tsd取值为16。
在获得纹理简单图像模型参数步骤(5)中,对于纹理简单图像,根据式(5)-式(10)分别获得用于质量估计的6个模型参数θ1、θ2、θ3、θ4、θ5、θ6
Figure BDA0002727907910000122
Figure BDA0002727907910000131
Figure BDA0002727907910000132
Figure BDA0002727907910000133
Figure BDA0002727907910000134
Figure BDA0002727907910000135
其中In()是以自然常数e为底的对数函数,ξ1、ξ2、ξ3、ξ4、ξ5、ξ6、ξ7、ξ8、ξ9、ξ10、ξ11、ξ12、ξ13、ξ14、ξ15、ξ16、ξ17、ξ18为模型参数,模型参数的取值范围为:ξ1∈[-2,-0.1],ξ2∈[0.001,0.5],ξ3∈[-0.2,-0.01],ξ4∈[100,2000],ξ5∈[-5000,-800],ξ6∈[1000,10000],ξ7∈[-2,-0.1],ξ8∈[5,100],ξ9∈[-200,-0.01],ξ10∈[1000,10000],ξ11∈[-30000,-2000],ξ12∈[5000,50000],ξ13∈[1×10-10,30×10-10],ξ14∈[0.1,12],ξ15∈[-2,-0.01],ξ16∈[130,2000],ξ17∈[-10000,-100],ξ18∈[1000,20000]。本实施例的ξ1取值为-0.1ξ2取值为0.5,ξ3取值为-0.01ξ4取值为2000,ξ5取值为-800,ξ6取值为10000,ξ7取值为-0.1,ξ8取值为100,ξ9取值为-0.01,ξ10取值为10000,ξ11取值为-2000,ξ12取值为50000,ξ13取值为30×10-10,ξ14取值为12,ξ15取值为-0.01,ξ16取值为2000,ξ17取值为-100,ξ18取值为20000。
在获得纹理复杂图像模型参数步骤(7)中,对于纹理复杂图像,根据式(14)-式(19)分别获得用于质量估计的6个模型参数θ7、θ8、θ9、θ10、θ11、θ12
θ7=ψ12sd(i)+ψ3exp(-sd(i)) (14)
θ8=ψ45sd(i)+ψ6exp(-sd(i)) (15)
Figure BDA0002727907910000136
Figure BDA0002727907910000137
θ11=ψ1314sd(i)+ψ15(sd(i))2 (18)
Figure BDA0002727907910000141
其中exp()是以自然常数e为底的指数函数,ψ1、ψ2、ψ3、ψ4、ψ5、ψ6、ψ7、ψ8、ψ9、ψ10、ψ11、ψ12、ψ13、ψ14、ψ15、ψ16、ψ17、ψ18为模型参数,模型参数的取值范围分别为:ψ1∈[-2,-0.01],ψ2∈[-1,-0.0001],ψ3∈[100,3000],ψ4∈[10,100],ψ5∈[0,2],ψ6∈[-20×104,-0.1×104],ψ7∈[10,200],ψ8∈[-1000,-100],ψ9∈[-10×105,-0.1×105],ψ10∈[10,200],ψ11∈[-12,-2],ψ12∈[-2,-0.01],ψ13∈[10,50],ψ14∈[2,12],ψ15∈[-2,-0.01],ψ16∈[-2,-0.2],ψ17∈[0.1×10-6,10×10-6],ψ18∈[0.1,5]。本实施例的ψ1取值为-0.01,ψ2取值为-0.0001,ψ3取值为3000,ψ4取值为100,ψ5取值为2,ψ6取值为-0.1×104,ψ7取值为200,ψ8取值为-100,ψ9取值为-0.1×105,ψ10取值为200,ψ11取值为-2,ψ12取值为-0.01,ψ13取值为50,ψ14取值为12,ψ15取值为-0.01,ψ16取值为-0.2,ψ17取值为10×10-6,ψ18取值为5。
其它步骤与实施例1相同。
为了验证本发明的有益效果,发明人采用本发明实施例1的方法对高效视频编码标准国际制定组织推荐的4个标准视频和服(Kimonol)、克里斯汀和萨拉(KristenAndSara)、赛马(RaceHorses)、公园景观(ParkScene)进行了实验,实验如下:
选择高效视频编码标准国际制定组织推荐的编码器HM16.0,在量化参数被分别设置为12、17、22、27、32、37的情况下,编码视频的第一幅图像,第一幅图像类型为帧内图像。编码后即可以获得图像对应的真实峰值信噪比及编码时间。
使用本发明实施例1的方法分别得到图像的估计峰值信噪比及方法运行的时间。方法运行的主要软硬件环境为:Windows 10操作系统,处理器为Intel(R)Core(TM)i7-8565U CPU(1.80GHz),内存8.00GB。
采用式(23)-式(25)所示的BAf,Y,BAf,Cb,BAf,Cr衡量本发明实施例1的方法对于纹理简单图像的质量估计准确度。
Figure BDA0002727907910000151
Figure BDA0002727907910000152
Figure BDA0002727907910000153
其中PSNRf,Y,act,PSNRf,Cb,act,PSNRf,Cr,act分别表示HM16.0编码完纹理简单图像后得到的图像亮度分量Y、色度分量Cb、色度分量Cr对应的峰值信噪比。
采用式(26)-式(28)所示的BAg,Y,BAg,Cb,BAg,Cr衡量本发明实施例1的方法对于纹理复杂图像的质量估计准确度,
Figure BDA0002727907910000154
Figure BDA0002727907910000155
Figure BDA0002727907910000156
其中PSNRg,Y,act,PSNRg,Cb,act,PSNRg,Cr,act分别表示HM16.0编码完纹理复杂图像后得到的图像亮度分量Y、色度分量Cb、色度分量Cr对应的峰值信噪比。
采用算法运行的时间评判算法的复杂度,如式(29)-式(31)所示,采用ATCf,Y,ATCf,Cb,ATCf,Cr分别衡量本发明实施例1的方法在估计纹理简单图像的亮度分量Y、色度分量Cb、色度分量Cr对应的峰值信噪比时的复杂度变化。
Figure BDA0002727907910000157
Figure BDA0002727907910000158
Figure BDA0002727907910000159
其中ATf,Y,act、ATf,Cb,act、ATf,Cr,act分别表示HM16.0编码完纹理简单图像得到亮度分量Y、色度分量Cb、色度分量Cr对应的峰值信噪比需要运行的时间,ATf,Y、ATf,Cb、ATf,Cr分别表示本发明实施例1的方法得到纹理简单图像亮度分量Y、色度分量Cb、色度分量Cr对应的峰值信噪比需要运行的时间。
如式(32)-式(34)所示,采用ATCg,Y、ATCg,Cb、ATCg,Cr分别衡量本发明实施例1的方法在估计纹理复杂图像的亮度分量Y、色度分量Cb、色度分量Cr对应的峰值信噪比时的复杂度变化。
Figure BDA0002727907910000161
Figure BDA0002727907910000162
Figure BDA0002727907910000163
其中ATg,Y,act,ATg,Cb,act,ATg,Cr,act分别表示HM16.0编码完纹理复杂图像得到亮度分量Y、色度分量Cb、色度分量Cr对应的峰值信噪比需要运行的时间,ATg,Y,ATg,Cb,ATg,Cr分别表示本发明实施例1的方法得到纹理复杂图像亮度分量Y、色度分量Cb、色度分量Cr对应的峰值信噪比需要运行的时间。
这里需要说明,HM16.0编码完图像得到亮度分量Y、色度分量Cb、色度分量Cr对应的峰值信噪比需要运行的时间是相同的。而本发明实施例1的方法中估计图像亮度分量Y、色度分量Cb、色度分量Cr对应的峰值信噪比的步骤一样。所以ATCf,Y=ATCf,Cb=ATCf,Cr,ATCg,Y=ATCg,Cb=ATCg,Cr
使用实施例1的方法,和服(Kimonol)和克里斯汀和萨拉(KristenAndSara)中的第一幅图像被判定为纹理简单图像,赛马(RaceHorses)和公园景观(ParkScene)中的第一幅图像被判定为纹理复杂图像。实验结果见表1和表2。
表1纹理简单图像对应的质量估计准确度及运行时间比较
Figure BDA0002727907910000164
Figure BDA0002727907910000171
由表1所示,对于纹理简单图像,实施例1的方法对应的BAf,Y、BAf,Cb、BAf,Cr分别为1.43%、0.48%、0.44%,即估计的峰值信噪比与真实的峰值信噪比分别只有1.43%、0.48%、0.44%的偏差,说明实施例1的方法可以准确地估计图像的峰值信噪比。实施例1的方法对应的ATCf,Y、ATCf,Cb、ATCf,Cr为96.98%,即相比HM16.0实际编码运行的时间,实施例1的方法节省了96.98%的运行时间,大大降低了运算复杂度。
表2纹理复杂图像对应的质量估计准确度及运行时间比较
Figure BDA0002727907910000172
由表2可见,实验数据也能得到表1类似的结论,即相比于HM16.0实际编码的方法,本发明实施例1的方法可以准确估计纹理复杂图像的峰值信噪比的同时显著降低算法的运算复杂度。

Claims (6)

1.一种高效视频编码标准帧内图像质量估计方法,其特征在于它是由下述步骤组成:
(1)确定边长
输入视频图像的空间分辨率,按照式(1)得到边长l:
Figure FDA0003840700380000011
其中round()为四舍五入取整函数,wp为图像宽,hp为图像高,γ∈[0.5,3.5],σ∈[0.05,0.4],wc∈{88,89,...,704},hc∈{72,73,...,576};
(2)确定基本计算单元大小
基本计算单元为矩形像素块,由边长l确定基本计算单元的宽wb和高hb
wb=αl (2)
hb=βl (3)
其中α∈{0.5,1,1.5,2,2.5,3},β∈{0.5,1,1.5,2,2.5,3};
(3)确定图像的标准差
图像的标准差按式(4)确定:
Figure FDA0003840700380000012
其中sd(i)表示视频第i幅帧内图像的标准差,i∈{1,2,..,Np},Np是视频的总图像数、为有限的正整数,int()为下取整函数,x(i,k,j)表示视频第i幅帧内图像第k个基本计算单元第j个像素的亮度值,k、j为有限的正整数;
(4)确定图像类型
第i幅帧内图像满足sd(i)≥Tsd,此图像被分类为纹理复杂图像,第i幅帧内图像满足sd(i)<Tsd,此图像被分类为纹理简单图像,其中Tsd为复杂度分类阈值参数,Tsd∈[6,16];
(5)获得纹理简单图像模型参数
对于纹理简单图像,根据式(5)-式(10)分别获得用于质量估计的6个模型参数θ1、θ2、θ3、θ4、θ5、θ6
Figure FDA0003840700380000021
Figure FDA0003840700380000022
Figure FDA0003840700380000023
Figure FDA0003840700380000024
Figure FDA0003840700380000025
Figure FDA0003840700380000026
其中ln()是以自然常数e为底的对数函数,ξ1、ξ2、ξ3、ξ4、ξ5、ξ6、ξ7、ξ8、ξ9、ξ10、ξ11、ξ12、ξ13、ξ14、ξ15、ξ16、ξ17、ξ18为模型参数,模型参数的取值范围为:ξ1∈[-2,-0.1],ξ2∈[0.001,0.5],ξ3∈[-0.2,-0.01],ξ4∈[100,2000],ξ5∈[-5000,-800],ξ6∈[1000,10000],ξ7∈[-2,-0.1],ξ8∈[5,100],ξ9∈[-200,-0.01],ξ10∈[1000,10000],ξ11∈[-30000,-2000],ξ12∈[5000,50000],ξ13∈[1×10-10,30×10-10],ξ14∈[0.1,12],ξ15∈[-2,-0.01],ξ16∈[130,2000],ξ17∈[-10000,-100],ξ18∈[1000,20000];
(6)估计纹理简单图像质量
用式(11)-式(13)分别得到纹理简单图像亮度分量Y、色度分量Cb、色度分量Cr对应的估计峰值信噪比PSNRf,Y、PSNRf,Cb、PSNRf,Cr
PSNRf,Y=θ1QP+θ2 (11)
PSNRf,Cb=θ3QP+θ4 (12)
PSNRf,Cr=θ5QP+θ6 (13)
其中QP表示用于编码的量化参数;
(7)获得纹理复杂图像模型参数
对于纹理复杂图像,根据式(14)-式(19)分别获得用于质量估计的6个模型参数θ7、θ8、θ9、θ10、θ11、θ12
θ7=ψ12sd(i)+ψ3exp(-sd(i)) (14)
θ8=ψ45sd(i)+ψ6exp(-sd(i)) (15)
Figure FDA0003840700380000031
Figure FDA0003840700380000032
θ11=ψ1314sd(i)+ψ15(sd(i))2 (18)
Figure FDA0003840700380000033
其中exp()是以自然常数e为底的指数函数,ψ1、ψ2、ψ3、ψ4、ψ5、ψ6、ψ7、ψ8、ψ9、ψ10、ψ11、ψ12、ψ13、ψ14、ψ15、ψ16、ψ17、ψ18为模型参数,模型参数的取值范围分别为:ψ1∈[-2,-0.01],ψ2∈[-1,-0.0001],ψ3∈[100,3000],ψ4∈[10,100],ψ5∈[0,2],ψ6∈[-20×104,-0.1×104],ψ7∈[10,200],ψ8∈[-1000,-100],ψ9∈[-10×105,-0.1×105],ψ10∈[10,200],ψ11∈[-12,-2],ψ12∈[-2,-0.01],ψ13∈[10,50],ψ14∈[2,12],ψ15∈[-2,-0.01],ψ16∈[-2,-0.2],ψ17∈[0.1×10-6,10×10-6],ψ18∈[0.1,5];
(8)估计纹理复杂图像质量
根据式(20)-式(22)分别得到纹理复杂图像亮度分量Y、色度分量Cb、色度分量Cr对应的峰值信噪比PSNRg,Y、PSNRg,Cb、PSNRg,Cr
PSNRg,Y=θ7QP+θ8 (20)
Figure FDA0003840700380000034
Figure FDA0003840700380000035
2.根据权利要求1所述的高效视频编码标准帧内图像质量估计方法,其特征在于:在确定边长步骤(1)中,所述的γ取值为2.312,σ取值为0.1098,wc取值为176,hc取值为144。
3.根据权利要求1所述的高效视频编码标准帧内图像质量估计方法,其特征在于:在确定基本计算单元大小步骤(2)中,所述的α取值为1,β取值为1。
4.根据权利要求1所述的高效视频编码标准帧内图像质量估计方法,其特征在于:在确定图像类型步骤(4)中,所述的Tsd取值为9.12。
5.根据权利要求1所述的高效视频编码标准帧内图像质量估计方法,其特征在于:在获得纹理简单图像模型参数步骤(5)中,所述的ξ1取值为-0.5637,ξ2取值为0.0757,ξ3为-0.1341,ξ4取值为988.9938,ξ5取值为-3757.8642,ξ6取值为6992.5402,ξ7取值为-1.3832,ξ8取值为17.1871,ξ9取值为-69.3852,ξ10取值为4261.0297,ξ11取值为-16930.2401,ξ12取值为31464.9802,ξ13取值为7.6974×10-1014取值为1.1118,ξ15取值为-0.3504,ξ16取值为1303.1992,ξ17取值为-5013.0618,ξ18取值为9302.5936。
6.根据权利要求1所述的高效视频编码标准帧内图像质量估计方法,其特征在于:在获得纹理复杂图像模型参数步骤(7)中,所述的ψ1取值为-0.5893,ψ2取值为-0.0141,ψ3取值为1871.2642,ψ4取值为55.4507,ψ5取值为0.302,ψ6取值为-2.4956×104,ψ7最佳取值为140.8854,ψ8最佳取值为-421.6006,ψ9取值为-1.2082×105,ψ10取值为123.5036,ψ11取值为-8.4543,ψ12取值为-0.3476,ψ13取值为22.2138,ψ14取值为8.0586,ψ15取值为-0.1659,ψ16取值为-0.802,ψ17取值为3.5974×10-6,ψ18取值为1.3514。
CN202011108891.4A 2020-10-16 2020-10-16 高效视频编码标准帧内图像质量估计方法 Active CN112437314B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011108891.4A CN112437314B (zh) 2020-10-16 2020-10-16 高效视频编码标准帧内图像质量估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011108891.4A CN112437314B (zh) 2020-10-16 2020-10-16 高效视频编码标准帧内图像质量估计方法

Publications (2)

Publication Number Publication Date
CN112437314A CN112437314A (zh) 2021-03-02
CN112437314B true CN112437314B (zh) 2022-11-01

Family

ID=74694973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011108891.4A Active CN112437314B (zh) 2020-10-16 2020-10-16 高效视频编码标准帧内图像质量估计方法

Country Status (1)

Country Link
CN (1) CN112437314B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108989818A (zh) * 2017-05-31 2018-12-11 深圳市中兴微电子技术有限公司 一种图像编码参数调整方法及装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104780369B (zh) * 2012-08-21 2018-04-17 华为技术有限公司 一种获得视频编码压缩质量的方法及装置
CN103136748B (zh) * 2013-01-21 2015-10-28 宁波大学 一种基于特征图的立体图像质量客观评价方法
US9858656B2 (en) * 2013-03-13 2018-01-02 Raytheon Company Video interpretability and quality estimation
US20180150966A1 (en) * 2014-09-22 2018-05-31 Aselsan Elektronik Sanayi Ve Ticaret Anonim Sirketi System and method for estimating object size
CN105321175B (zh) * 2015-09-23 2017-09-19 宁波大学 一种基于结构纹理稀疏表示的立体图像质量客观评价方法
US9922411B2 (en) * 2015-11-30 2018-03-20 Disney Enterprises, Inc. Saliency-weighted video quality assessment
CN107465914B (zh) * 2017-08-18 2019-03-12 电子科技大学 基于局部纹理特征和全局亮度特征的视频质量评价方法
CN108184117B (zh) * 2018-01-10 2021-11-26 北京工业大学 基于内容的比特流层视频质量评价模型
CN109194846B (zh) * 2018-10-08 2020-05-12 陕西师范大学 一种基于复杂度的EMD(n,m,δ)自适应图像密写方法
CN110611809B (zh) * 2019-10-16 2020-10-27 西安邮电大学 帧分辨率自适应的视频空时域复杂度评价方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108989818A (zh) * 2017-05-31 2018-12-11 深圳市中兴微电子技术有限公司 一种图像编码参数调整方法及装置

Also Published As

Publication number Publication date
CN112437314A (zh) 2021-03-02

Similar Documents

Publication Publication Date Title
CN108495135B (zh) 一种屏幕内容视频编码的快速编码方法
RU2402885C2 (ru) Классификация контента для обработки мультимедийных данных
CN108989802B (zh) 一种利用帧间关系的hevc视频流的质量估计方法及系统
US6546049B1 (en) Parameterized quantization matrix adaptation for video encoding
CN106170093B (zh) 一种帧内预测性能提升编码方法
CN110677654B (zh) 高效视频编码标准低时延编码结构的量化参数级联方法
US20120087411A1 (en) Internal bit depth increase in deblocking filters and ordered dither
WO2004056125A1 (en) Video encoding with skipping motion estimation for selected macroblocks
KR20030086076A (ko) 블록킹 효과를 제거하기 위한 필터링 방법 및 그 장치
CN116456101A (zh) 图像编码方法、图像解码方法及相关装置
WO1997015887A1 (en) Method and device for selectively compressing video codec
CN107343202B (zh) 基于附加码率的无反馈分布式视频编解码方法
CN112437314B (zh) 高效视频编码标准帧内图像质量估计方法
CN112218083B (zh) 高效视频编码标准帧内图像码率估计方法
WO2022021422A1 (zh) 视频编码方法、编码器、系统以及计算机存储介质
CN108401185A (zh) 参考帧选择方法、视频转码方法、电子设备和存储介质
Boitard et al. Motion-guided quantization for video tone mapping
CN112218084A (zh) 面向监控视频的高效视频编码标准帧级码率控制方法
CN112839234B (zh) 屏幕内容编码标准帧内图像码率的估计方法
KR101345294B1 (ko) 영상의 양자화 장치 및 방법
Shindo et al. Image Coding for Machines with Object Region Learning
CN114173131A (zh) 一种基于帧间相关性的视频压缩方法及系统
CN110446042B (zh) 一种提升h.264中p帧质量的编码方法
Sagheer et al. Fast intra-frame compression for video conferencing using adaptive shift coding
CN109587487B (zh) 一种对rdo策略的结构性失真度的评估方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant