CN115022638A - 一种面向全景视频编码的率失真优化方法 - Google Patents

一种面向全景视频编码的率失真优化方法 Download PDF

Info

Publication number
CN115022638A
CN115022638A CN202210758994.8A CN202210758994A CN115022638A CN 115022638 A CN115022638 A CN 115022638A CN 202210758994 A CN202210758994 A CN 202210758994A CN 115022638 A CN115022638 A CN 115022638A
Authority
CN
China
Prior art keywords
coding
ctu
rate
new
lambda
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210758994.8A
Other languages
English (en)
Inventor
朱策
侯晶晶
郭红伟
刘翼鹏
杜金
杨栩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202210758994.8A priority Critical patent/CN115022638A/zh
Publication of CN115022638A publication Critical patent/CN115022638A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种面向全景视频编码的率失真优化方法,通过编码器对视频进行编码并控制视频编码的量化参数,所述方法包括编码单元级量化参数调整、CTU级拉格朗日乘子的校正以及基于编码树单元间时域依赖性的率失真优化方法。CU级QP调整主要是根据球域与二维平面的对应关系,计算出不同位置的CU对应的权重,根据权重调整对应的QP,对不同位置的CU带入相应的调整后的QP从而确定最佳编码单元划分方式;CTU级λ的校正指的是根据不同位置的CTU的权重得到对应的CTU级QP,然后根据相应的CTU级QP去调整λ。CTU级时域率失真优化算法是在时域上根据不同CTU之间的率失真依赖关系,计算出每个CTU的时域影响因子去微调CTU对应的拉格朗日乘子从而对率失真过程进行优化。

Description

一种面向全景视频编码的率失真优化方法
技术领域
本发明属于视频/图像编解码技术领域,尤其是涉及一种面向全景视频编码的率失真优化方法。
背景技术
目前现有的全景视频率失真优化算法包括以下步骤:
步骤1、根据球域与二维平面的对应关系,计算出二维平面上不同位置的编码树单元(CTU,coding tree unit)对应的权重。
步骤2、根据步骤1得到的权重调整CTU对应的量化参数(QP,Quantitativeparameter)。编码时对不同位置的CTU带入相应的QP从而确定最佳编码单元划分方式。由于ERP格式在两极部分有像素冗余,且观众的大部分关注点在赤道附近,所以CTU的位置越接近两极部分,则计算出来的QP越大,分配给两级区域的码率越少,从而达到码率节省的目标。
以下是QP的计算方法:
Figure BDA0003723667650000011
Figure BDA0003723667650000012
Figure BDA0003723667650000013
其中,
Figure BDA0003723667650000014
是不同维度对应的权重值,
Figure BDA0003723667650000015
是权重的均值,QPold是每一帧对应的QP;
该方法使用的率失真优化算法的基本过程如下,在计算得到二维平面中不同位置的CTU的权重以后,得到对应的QP,没有计算CU级QP,也没有根据CTU级QP去调整相应的拉格朗日乘子(λ,lambda);没有利用CTU之间的时域率失真依赖关系。
因此传统的方法需要计算每帧图像每个编码单元的rd-cost(率失真代价函数),消耗较多编码时间。没有考虑立方体投影(CMP,CubeMap Projection)等其他投影格式的优化。
发明内容
针对上述问题,本发明提出一种面向全景视频编码的率失真优化方法。
为了便于理解,对本发明中采用的术语进行如下解释:
全景视频:全景视频是一种用3D摄像机进行全方位360°拍摄的视频,用户在观看视频的时候,可以随意调节视频上下左右进行观看。
率失真优化:率失真优化是一种提高视频压缩视频质量的方法。该名称是指针对视频编码所需的数据量(速率)优化失真量(视频质量损失)。编码器通过率失真优化(RDO)为输入视频选择一组最优的编码参数。
ERP(Equirectangular projection):等距柱状投影是一种简单的投影方式,将经线映射为恒定间距的垂直线,将纬线映射为恒定间距的水平线。这种投影方式映射关系简单,但既不是等面积的也不是保角的,引入了相当大的失真。
S-PSNR(Spherical PSNR):S-PSNR是360Lib采纳的一种360视频的客观质量评估标准,使用球面上一系列预先确定位置的点来对参考图像和测试图像进行采样,比较它们两两之间的差值,累加得到整幅图像的S-PSNR值。
WS-PSNR(Weighted to Spherically uniform PSNR):WS-PSNR通过引入权重的方式对源视频与输出视频直接计算PSNR。不同的投影格式有不同的权重,常见的ERP和CMP格式的投影权重的计算公式如下所示:
Figure BDA0003723667650000021
Figure BDA0003723667650000022
本发明的技术方案为:
一种面向全景视频编码的率失真优化方法,包括以下步骤:
S1、向编码器输入固定量化参数以及待编码序列;
S2、根据输入的待编码序列尺寸计算不同位置的编码单元对应的权重值,具体为:
通过如下公式分别计算大小为64*64、32*32、16*16、8*8的编码单元的权重:
Figure BDA0003723667650000023
Figure BDA0003723667650000031
Figure BDA0003723667650000032
其中,
Figure BDA0003723667650000033
是每一行像素所对应的纬度,w是最终得到的权重;大小为64*64的编码单元的权重即是编码树单元CTU的权重;
S3、将S2计算得到的权重值w与初始拉格朗日乘子λold相乘得到新的拉格朗日乘子λnew,根据量化参数QP与λ的对应关系,计算不同位置的编码单元所对应的新的QPnew,具体为:
设:λnew=λold*w
Figure BDA0003723667650000034
故:
Figure BDA0003723667650000035
所以有:
Figure BDA0003723667650000036
其中,QPold是每一帧所对应的量化参数,QPnew是计算得出的新量化参数;大小为64*64的编码单元对应的量化参数即是编码树单元CTU的量化参数;
S4、对I帧编码时对不同位置的编码单元(CU,coding unit)带入步骤S3得到的QPnew从而确定最佳编码单元划分方式;对非I帧编码时,调用每一帧所对应的QP确定最佳编码单元划分方式;
S5、根据S3中得到的CTU的QP值计算每个CTU对应的λ(即CTU级λ),进而实现率失真优化:
λ=e(QP+0.49-13.7122)/4.2005
S6、计算时域影响因子:
Figure BDA0003723667650000041
其中,Dcur,i是当前第i个编码块的失真,
Figure BDA0003723667650000042
是当前第i个编码块的运动补偿预测误差;ki是第i个编码块的时域影响因子(编码块的大小为16x16),ki的范围介于0到1之间。
每个CTU的时域影响因子由下面式子得到:
Figure BDA0003723667650000043
式中Γi是待编码帧中第i个CTU的时域影响因子,L是第i个CTU中的16×16像素块个数;
S7、在步骤S5的基础上对得到的每个CTU级λ除以对应的时域影响因子,从而在时域依赖的角度对率失真过程进行优化。
本发明的有益效果为:本发明给出了一个既能提高编码器性能,同时又可以保证视频质量方法,而且算法中用到的权重参数可以提前根据视频尺寸计算出来,不占用编码时间,不增加算法复杂度和时间复杂度;同时本发明使用CU级QP提高编码效率,使用CTU级QP确定拉格朗日乘子lambda并使用CTU级时域影响因子对lambda微调来改进率失真优化过程。
附图说明
图1是本发明的流程示意图。
具体实施方式
下面结合仿真示例来简述本发明的有效性。
仿真实验
使用HM-16.14作为实验平台,参考的对象为HM-16.14中的定QP方法(QP=22,27,32,37),测试的序列为全景视频标准测试序列,编码方式为LDP,对比的指标有BD-Rate,S-PSNR,WS-PSNR。
其中当BD-Rate为负值时,代表相同重建质量下码率减少,技术具有增益,当BD-Rate为正值时,代表相同重建质量下码率增加,技术存在损失。此处对比的基准均为给定QP时HM编码器的编码质量。
表1给出了本方案在BD-rate上的表现。
表1 ERP格式下序列在S-PSNR、WS-PSNR上的码率节省
Figure BDA0003723667650000051
相较于基准编码器,在S-PSNR质量指标方面平均降低了4.15%,在WS-PSNR质量指标方面平均降低了4.14%,明显在保证视频质量的前提下节省了码率。
在率失真优化算法中,权重值的计算方法是Minhao Tang等人提出的,他们的工作是只根据CTU级的QP确定编码单元划分方式,本发明进行了细化和改进,不但重新计算了32*32,16*16,8*8编码单元的权重,根据权重确定I帧CU级量化参数QP从而确定编码单元划分方式,本发明的另一个创新点是根据CTU级的QP去推导CTU级的拉格朗日乘子lambda,从而实现了更精确地率失真优化过程。
T.Yang等人根据H.264的编码参考结构提出了信源失真时域影响模型估算编码块的传播因子,随后,Y.Gao等人把上述时域依赖率失真优化方法扩展到HEVC低延时编码结构中。本发明提出的CTU级时域依赖率失真优化中利用了上述方法估计CTU级时域影响因子。
使用CU级(经过试验把最小CU限定在32*32)QP去确定I帧编码单元的划分方式并且利用CTU级QP确定拉格朗日乘子lambda来进行率失真优化,用CTU级时域影响因子对lambda进行微调,这是本发明最主要的创新工作,也是编码性能能够提高的主要部分。需要注意的是该率失真优化算法可以应用在其他编码框架中。

Claims (1)

1.一种面向全景视频编码的率失真优化方法,其特征在于,包括以下步骤:
S1、向编码器输入固定量化参数以及待编码序列;
S2、根据输入的待编码序列尺寸计算不同位置的编码单元对应的权重值,具体为:
通过如下公式分别计算大小为64*64、32*32、16*16、8*8的编码单元的权重:
Figure FDA0003723667640000011
Figure FDA0003723667640000012
Figure FDA0003723667640000013
其中,
Figure FDA0003723667640000014
是每一行像素所对应的纬度,w是最终得到的权重,大小为64*64的编码单元的权重即是编码树单元CTU的权重;
S3、将S2计算得到的权重值w与初始拉格朗日乘子λold相乘得到新的λnew,根据量化参数QP与λ的对应关系,计算不同位置的编码单元所对应的新的QPnew,具体为:
设:λnew=λold*w
Figure FDA0003723667640000015
故:
Figure FDA0003723667640000016
得到:
Figure FDA0003723667640000017
其中,QPold是每一帧所对应的量化参数,QPnew是计算得出的新量化参数;大小为64*64的编码单元对应的量化参数即是编码树单元CTU的量化参数;
S4、对I帧编码时对不同位置的编码单元带入步骤S3得到的QPnew从而确定最佳编码单元划分方式;对非I帧编码时,调用每一帧所对应的QP确定最佳编码单元划分方式;
S5、根据S3中得到的编码树单元的QP值计算每个编码树单元对应的λ,进而实现率失真优化:
λ=e(QP+0.49-13.7122)/4.2005
S6、计算时域影响因子:
Figure FDA0003723667640000021
其中,Dcur,i是当前第i个编码块的失真,
Figure FDA0003723667640000022
是当前第i个编码块的运动补偿预测误差;ki是第i个编码块的时域影响因子,编码块的大小为16x16,ki的范围介于0到1之间;
每个CTU的时域影响因子由下面式子得到:
Figure FDA0003723667640000023
式中Γi是待编码帧中第i个CTU的时域影响因子,L是第i个CTU中的16×16像素块个数;
S7、在步骤S5的基础上对得到的每个CTU级λ除以对应的时域影响因子,从而在时域依赖的角度对率失真过程进行优化。
CN202210758994.8A 2022-06-30 2022-06-30 一种面向全景视频编码的率失真优化方法 Pending CN115022638A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210758994.8A CN115022638A (zh) 2022-06-30 2022-06-30 一种面向全景视频编码的率失真优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210758994.8A CN115022638A (zh) 2022-06-30 2022-06-30 一种面向全景视频编码的率失真优化方法

Publications (1)

Publication Number Publication Date
CN115022638A true CN115022638A (zh) 2022-09-06

Family

ID=83079263

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210758994.8A Pending CN115022638A (zh) 2022-06-30 2022-06-30 一种面向全景视频编码的率失真优化方法

Country Status (1)

Country Link
CN (1) CN115022638A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116723330A (zh) * 2023-03-28 2023-09-08 成都师范学院 一种自适应球域失真传播链长度的全景视频编码方法
CN117440158A (zh) * 2023-12-20 2024-01-23 华侨大学 基于三维几何失真的miv沉浸式视频编码率失真优化方法
WO2024082579A1 (zh) * 2022-10-18 2024-04-25 电子科技大学 一种考虑时域失真传播的零时延全景视频码率控制方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106412594A (zh) * 2016-10-21 2017-02-15 乐视控股(北京)有限公司 全景图像编码方法和装置
WO2018175215A1 (en) * 2017-03-23 2018-09-27 Qualcomm Incorporated Adaptive parameters for coding of 360-degree video
KR20180125326A (ko) * 2017-05-15 2018-11-23 홍익대학교 산학협력단 Hevc 부호화 장치 및 그것을 이용한 코딩 유닛 깊이 범위 예측 방법
CN108924554A (zh) * 2018-07-13 2018-11-30 宁波大学 一种球形加权结构相似度的全景视频编码率失真优化方法
WO2018221946A1 (ko) * 2017-05-30 2018-12-06 주식회사 케이티 비디오 신호 처리 방법 및 장치
US20190045195A1 (en) * 2018-03-30 2019-02-07 Intel Corporation Reduced Partitioning and Mode Decisions Based on Content Analysis and Learning
WO2019165863A1 (zh) * 2018-03-02 2019-09-06 电子科技大学 用于经纬图的编码块级拉格朗日乘子的优化方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106412594A (zh) * 2016-10-21 2017-02-15 乐视控股(北京)有限公司 全景图像编码方法和装置
WO2018175215A1 (en) * 2017-03-23 2018-09-27 Qualcomm Incorporated Adaptive parameters for coding of 360-degree video
KR20180125326A (ko) * 2017-05-15 2018-11-23 홍익대학교 산학협력단 Hevc 부호화 장치 및 그것을 이용한 코딩 유닛 깊이 범위 예측 방법
WO2018221946A1 (ko) * 2017-05-30 2018-12-06 주식회사 케이티 비디오 신호 처리 방법 및 장치
WO2019165863A1 (zh) * 2018-03-02 2019-09-06 电子科技大学 用于经纬图的编码块级拉格朗日乘子的优化方法
US20190045195A1 (en) * 2018-03-30 2019-02-07 Intel Corporation Reduced Partitioning and Mode Decisions Based on Content Analysis and Learning
CN108924554A (zh) * 2018-07-13 2018-11-30 宁波大学 一种球形加权结构相似度的全景视频编码率失真优化方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024082579A1 (zh) * 2022-10-18 2024-04-25 电子科技大学 一种考虑时域失真传播的零时延全景视频码率控制方法
CN116723330A (zh) * 2023-03-28 2023-09-08 成都师范学院 一种自适应球域失真传播链长度的全景视频编码方法
CN116723330B (zh) * 2023-03-28 2024-02-23 成都师范学院 一种自适应球域失真传播链长度的全景视频编码方法
CN117440158A (zh) * 2023-12-20 2024-01-23 华侨大学 基于三维几何失真的miv沉浸式视频编码率失真优化方法
CN117440158B (zh) * 2023-12-20 2024-04-12 华侨大学 基于三维几何失真的miv沉浸式视频编码率失真优化方法

Similar Documents

Publication Publication Date Title
CN115022638A (zh) 一种面向全景视频编码的率失真优化方法
CN104796705B (zh) 一种基于ssim的hevc视频编码率失真优化与码率控制算法
CN106358040B (zh) 一种基于显著性的码率控制比特分配方法
CN108924554B (zh) 一种球形加权结构相似度的全景视频编码率失真优化方法
CN104185024B (zh) 一种基于总码率与信息熵模型的hevc量化参数优化方法
CN111918068A (zh) 基于视频序列特征和QP-λ修正的时域率失真优化方法
CN104853191B (zh) 一种hevc的快速编码方法
CN108900838B (zh) 一种基于hdr-vdp-2失真准则的率失真优化方法
WO2020098751A1 (zh) 一种视频数据的编码处理方法和计算机存储介质
WO2018095890A1 (en) Methods and apparatuses for encoding and decoding video based on perceptual metric classification
Li et al. A bit allocation method based on inter-view dependency and spatio-temporal correlation for multi-view texture video coding
US8165202B1 (en) Video compression rate
CN111447446B (zh) 一种基于人眼视觉区域重要性分析的hevc码率控制方法
CN112825557A (zh) 一种针对于视频编码的自适应感知时空域量化方法
Liang et al. A novel RQ model based rate control scheme in HEVC
CN115695799A (zh) 一种考虑时域失真传播的零时延全景视频码率控制方法
Lei et al. Region adaptive R-$\lambda $ model-based rate control for depth maps coding
Xiang et al. Perceptual quality consistency oriented CTU level rate control for HEVC intra coding
CN108989818A (zh) 一种图像编码参数调整方法及装置
CN103051897A (zh) 一种h264视频编码码率控制方法
CN112351279B (zh) 面向hevc快速编码的自适应复杂度调整系统及方法
CN116016927A (zh) 一种考虑时域相关性和熵平衡的低延时全景视频编码方法
WO1998035500A1 (en) Method and apparatus for optimizing quantizer values in an image encoder
US8457211B2 (en) System and method for image coding
CN111757112B (zh) 一种基于恰可察觉失真的hevc感知码率控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination