CN115022638A - 一种面向全景视频编码的率失真优化方法 - Google Patents
一种面向全景视频编码的率失真优化方法 Download PDFInfo
- Publication number
- CN115022638A CN115022638A CN202210758994.8A CN202210758994A CN115022638A CN 115022638 A CN115022638 A CN 115022638A CN 202210758994 A CN202210758994 A CN 202210758994A CN 115022638 A CN115022638 A CN 115022638A
- Authority
- CN
- China
- Prior art keywords
- coding
- ctu
- rate
- new
- lambda
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000005457 optimization Methods 0.000 title claims abstract description 22
- 238000013139 quantization Methods 0.000 claims abstract description 14
- 239000000126 substance Substances 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 abstract description 7
- 230000001276 controlling effect Effects 0.000 abstract 1
- 230000001105 regulatory effect Effects 0.000 abstract 1
- 238000004364 calculation method Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种面向全景视频编码的率失真优化方法,通过编码器对视频进行编码并控制视频编码的量化参数,所述方法包括编码单元级量化参数调整、CTU级拉格朗日乘子的校正以及基于编码树单元间时域依赖性的率失真优化方法。CU级QP调整主要是根据球域与二维平面的对应关系,计算出不同位置的CU对应的权重,根据权重调整对应的QP,对不同位置的CU带入相应的调整后的QP从而确定最佳编码单元划分方式;CTU级λ的校正指的是根据不同位置的CTU的权重得到对应的CTU级QP,然后根据相应的CTU级QP去调整λ。CTU级时域率失真优化算法是在时域上根据不同CTU之间的率失真依赖关系,计算出每个CTU的时域影响因子去微调CTU对应的拉格朗日乘子从而对率失真过程进行优化。
Description
技术领域
本发明属于视频/图像编解码技术领域,尤其是涉及一种面向全景视频编码的率失真优化方法。
背景技术
目前现有的全景视频率失真优化算法包括以下步骤:
步骤1、根据球域与二维平面的对应关系,计算出二维平面上不同位置的编码树单元(CTU,coding tree unit)对应的权重。
步骤2、根据步骤1得到的权重调整CTU对应的量化参数(QP,Quantitativeparameter)。编码时对不同位置的CTU带入相应的QP从而确定最佳编码单元划分方式。由于ERP格式在两极部分有像素冗余,且观众的大部分关注点在赤道附近,所以CTU的位置越接近两极部分,则计算出来的QP越大,分配给两级区域的码率越少,从而达到码率节省的目标。
以下是QP的计算方法:
该方法使用的率失真优化算法的基本过程如下,在计算得到二维平面中不同位置的CTU的权重以后,得到对应的QP,没有计算CU级QP,也没有根据CTU级QP去调整相应的拉格朗日乘子(λ,lambda);没有利用CTU之间的时域率失真依赖关系。
因此传统的方法需要计算每帧图像每个编码单元的rd-cost(率失真代价函数),消耗较多编码时间。没有考虑立方体投影(CMP,CubeMap Projection)等其他投影格式的优化。
发明内容
针对上述问题,本发明提出一种面向全景视频编码的率失真优化方法。
为了便于理解,对本发明中采用的术语进行如下解释:
全景视频:全景视频是一种用3D摄像机进行全方位360°拍摄的视频,用户在观看视频的时候,可以随意调节视频上下左右进行观看。
率失真优化:率失真优化是一种提高视频压缩视频质量的方法。该名称是指针对视频编码所需的数据量(速率)优化失真量(视频质量损失)。编码器通过率失真优化(RDO)为输入视频选择一组最优的编码参数。
ERP(Equirectangular projection):等距柱状投影是一种简单的投影方式,将经线映射为恒定间距的垂直线,将纬线映射为恒定间距的水平线。这种投影方式映射关系简单,但既不是等面积的也不是保角的,引入了相当大的失真。
S-PSNR(Spherical PSNR):S-PSNR是360Lib采纳的一种360视频的客观质量评估标准,使用球面上一系列预先确定位置的点来对参考图像和测试图像进行采样,比较它们两两之间的差值,累加得到整幅图像的S-PSNR值。
WS-PSNR(Weighted to Spherically uniform PSNR):WS-PSNR通过引入权重的方式对源视频与输出视频直接计算PSNR。不同的投影格式有不同的权重,常见的ERP和CMP格式的投影权重的计算公式如下所示:
本发明的技术方案为:
一种面向全景视频编码的率失真优化方法,包括以下步骤:
S1、向编码器输入固定量化参数以及待编码序列;
S2、根据输入的待编码序列尺寸计算不同位置的编码单元对应的权重值,具体为:
通过如下公式分别计算大小为64*64、32*32、16*16、8*8的编码单元的权重:
S3、将S2计算得到的权重值w与初始拉格朗日乘子λold相乘得到新的拉格朗日乘子λnew,根据量化参数QP与λ的对应关系,计算不同位置的编码单元所对应的新的QPnew,具体为:
设:λnew=λold*w
故:
所以有:
其中,QPold是每一帧所对应的量化参数,QPnew是计算得出的新量化参数;大小为64*64的编码单元对应的量化参数即是编码树单元CTU的量化参数;
S4、对I帧编码时对不同位置的编码单元(CU,coding unit)带入步骤S3得到的QPnew从而确定最佳编码单元划分方式;对非I帧编码时,调用每一帧所对应的QP确定最佳编码单元划分方式;
S5、根据S3中得到的CTU的QP值计算每个CTU对应的λ(即CTU级λ),进而实现率失真优化:
λ=e(QP+0.49-13.7122)/4.2005
S6、计算时域影响因子:
每个CTU的时域影响因子由下面式子得到:
式中Γi是待编码帧中第i个CTU的时域影响因子,L是第i个CTU中的16×16像素块个数;
S7、在步骤S5的基础上对得到的每个CTU级λ除以对应的时域影响因子,从而在时域依赖的角度对率失真过程进行优化。
本发明的有益效果为:本发明给出了一个既能提高编码器性能,同时又可以保证视频质量方法,而且算法中用到的权重参数可以提前根据视频尺寸计算出来,不占用编码时间,不增加算法复杂度和时间复杂度;同时本发明使用CU级QP提高编码效率,使用CTU级QP确定拉格朗日乘子lambda并使用CTU级时域影响因子对lambda微调来改进率失真优化过程。
附图说明
图1是本发明的流程示意图。
具体实施方式
下面结合仿真示例来简述本发明的有效性。
仿真实验
使用HM-16.14作为实验平台,参考的对象为HM-16.14中的定QP方法(QP=22,27,32,37),测试的序列为全景视频标准测试序列,编码方式为LDP,对比的指标有BD-Rate,S-PSNR,WS-PSNR。
其中当BD-Rate为负值时,代表相同重建质量下码率减少,技术具有增益,当BD-Rate为正值时,代表相同重建质量下码率增加,技术存在损失。此处对比的基准均为给定QP时HM编码器的编码质量。
表1给出了本方案在BD-rate上的表现。
表1 ERP格式下序列在S-PSNR、WS-PSNR上的码率节省
相较于基准编码器,在S-PSNR质量指标方面平均降低了4.15%,在WS-PSNR质量指标方面平均降低了4.14%,明显在保证视频质量的前提下节省了码率。
在率失真优化算法中,权重值的计算方法是Minhao Tang等人提出的,他们的工作是只根据CTU级的QP确定编码单元划分方式,本发明进行了细化和改进,不但重新计算了32*32,16*16,8*8编码单元的权重,根据权重确定I帧CU级量化参数QP从而确定编码单元划分方式,本发明的另一个创新点是根据CTU级的QP去推导CTU级的拉格朗日乘子lambda,从而实现了更精确地率失真优化过程。
T.Yang等人根据H.264的编码参考结构提出了信源失真时域影响模型估算编码块的传播因子,随后,Y.Gao等人把上述时域依赖率失真优化方法扩展到HEVC低延时编码结构中。本发明提出的CTU级时域依赖率失真优化中利用了上述方法估计CTU级时域影响因子。
使用CU级(经过试验把最小CU限定在32*32)QP去确定I帧编码单元的划分方式并且利用CTU级QP确定拉格朗日乘子lambda来进行率失真优化,用CTU级时域影响因子对lambda进行微调,这是本发明最主要的创新工作,也是编码性能能够提高的主要部分。需要注意的是该率失真优化算法可以应用在其他编码框架中。
Claims (1)
1.一种面向全景视频编码的率失真优化方法,其特征在于,包括以下步骤:
S1、向编码器输入固定量化参数以及待编码序列;
S2、根据输入的待编码序列尺寸计算不同位置的编码单元对应的权重值,具体为:
通过如下公式分别计算大小为64*64、32*32、16*16、8*8的编码单元的权重:
S3、将S2计算得到的权重值w与初始拉格朗日乘子λold相乘得到新的λnew,根据量化参数QP与λ的对应关系,计算不同位置的编码单元所对应的新的QPnew,具体为:
设:λnew=λold*w
故:
得到:
其中,QPold是每一帧所对应的量化参数,QPnew是计算得出的新量化参数;大小为64*64的编码单元对应的量化参数即是编码树单元CTU的量化参数;
S4、对I帧编码时对不同位置的编码单元带入步骤S3得到的QPnew从而确定最佳编码单元划分方式;对非I帧编码时,调用每一帧所对应的QP确定最佳编码单元划分方式;
S5、根据S3中得到的编码树单元的QP值计算每个编码树单元对应的λ,进而实现率失真优化:
λ=e(QP+0.49-13.7122)/4.2005
S6、计算时域影响因子:
每个CTU的时域影响因子由下面式子得到:
式中Γi是待编码帧中第i个CTU的时域影响因子,L是第i个CTU中的16×16像素块个数;
S7、在步骤S5的基础上对得到的每个CTU级λ除以对应的时域影响因子,从而在时域依赖的角度对率失真过程进行优化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210758994.8A CN115022638A (zh) | 2022-06-30 | 2022-06-30 | 一种面向全景视频编码的率失真优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210758994.8A CN115022638A (zh) | 2022-06-30 | 2022-06-30 | 一种面向全景视频编码的率失真优化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115022638A true CN115022638A (zh) | 2022-09-06 |
Family
ID=83079263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210758994.8A Pending CN115022638A (zh) | 2022-06-30 | 2022-06-30 | 一种面向全景视频编码的率失真优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115022638A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116723330A (zh) * | 2023-03-28 | 2023-09-08 | 成都师范学院 | 一种自适应球域失真传播链长度的全景视频编码方法 |
CN117440158A (zh) * | 2023-12-20 | 2024-01-23 | 华侨大学 | 基于三维几何失真的miv沉浸式视频编码率失真优化方法 |
WO2024082579A1 (zh) * | 2022-10-18 | 2024-04-25 | 电子科技大学 | 一种考虑时域失真传播的零时延全景视频码率控制方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106412594A (zh) * | 2016-10-21 | 2017-02-15 | 乐视控股(北京)有限公司 | 全景图像编码方法和装置 |
WO2018175215A1 (en) * | 2017-03-23 | 2018-09-27 | Qualcomm Incorporated | Adaptive parameters for coding of 360-degree video |
KR20180125326A (ko) * | 2017-05-15 | 2018-11-23 | 홍익대학교 산학협력단 | Hevc 부호화 장치 및 그것을 이용한 코딩 유닛 깊이 범위 예측 방법 |
CN108924554A (zh) * | 2018-07-13 | 2018-11-30 | 宁波大学 | 一种球形加权结构相似度的全景视频编码率失真优化方法 |
WO2018221946A1 (ko) * | 2017-05-30 | 2018-12-06 | 주식회사 케이티 | 비디오 신호 처리 방법 및 장치 |
US20190045195A1 (en) * | 2018-03-30 | 2019-02-07 | Intel Corporation | Reduced Partitioning and Mode Decisions Based on Content Analysis and Learning |
WO2019165863A1 (zh) * | 2018-03-02 | 2019-09-06 | 电子科技大学 | 用于经纬图的编码块级拉格朗日乘子的优化方法 |
-
2022
- 2022-06-30 CN CN202210758994.8A patent/CN115022638A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106412594A (zh) * | 2016-10-21 | 2017-02-15 | 乐视控股(北京)有限公司 | 全景图像编码方法和装置 |
WO2018175215A1 (en) * | 2017-03-23 | 2018-09-27 | Qualcomm Incorporated | Adaptive parameters for coding of 360-degree video |
KR20180125326A (ko) * | 2017-05-15 | 2018-11-23 | 홍익대학교 산학협력단 | Hevc 부호화 장치 및 그것을 이용한 코딩 유닛 깊이 범위 예측 방법 |
WO2018221946A1 (ko) * | 2017-05-30 | 2018-12-06 | 주식회사 케이티 | 비디오 신호 처리 방법 및 장치 |
WO2019165863A1 (zh) * | 2018-03-02 | 2019-09-06 | 电子科技大学 | 用于经纬图的编码块级拉格朗日乘子的优化方法 |
US20190045195A1 (en) * | 2018-03-30 | 2019-02-07 | Intel Corporation | Reduced Partitioning and Mode Decisions Based on Content Analysis and Learning |
CN108924554A (zh) * | 2018-07-13 | 2018-11-30 | 宁波大学 | 一种球形加权结构相似度的全景视频编码率失真优化方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024082579A1 (zh) * | 2022-10-18 | 2024-04-25 | 电子科技大学 | 一种考虑时域失真传播的零时延全景视频码率控制方法 |
CN116723330A (zh) * | 2023-03-28 | 2023-09-08 | 成都师范学院 | 一种自适应球域失真传播链长度的全景视频编码方法 |
CN116723330B (zh) * | 2023-03-28 | 2024-02-23 | 成都师范学院 | 一种自适应球域失真传播链长度的全景视频编码方法 |
CN117440158A (zh) * | 2023-12-20 | 2024-01-23 | 华侨大学 | 基于三维几何失真的miv沉浸式视频编码率失真优化方法 |
CN117440158B (zh) * | 2023-12-20 | 2024-04-12 | 华侨大学 | 基于三维几何失真的miv沉浸式视频编码率失真优化方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115022638A (zh) | 一种面向全景视频编码的率失真优化方法 | |
CN104796705B (zh) | 一种基于ssim的hevc视频编码率失真优化与码率控制算法 | |
CN106358040B (zh) | 一种基于显著性的码率控制比特分配方法 | |
CN108924554B (zh) | 一种球形加权结构相似度的全景视频编码率失真优化方法 | |
CN104185024B (zh) | 一种基于总码率与信息熵模型的hevc量化参数优化方法 | |
CN111918068A (zh) | 基于视频序列特征和QP-λ修正的时域率失真优化方法 | |
CN104853191B (zh) | 一种hevc的快速编码方法 | |
CN108900838B (zh) | 一种基于hdr-vdp-2失真准则的率失真优化方法 | |
WO2020098751A1 (zh) | 一种视频数据的编码处理方法和计算机存储介质 | |
WO2018095890A1 (en) | Methods and apparatuses for encoding and decoding video based on perceptual metric classification | |
Li et al. | A bit allocation method based on inter-view dependency and spatio-temporal correlation for multi-view texture video coding | |
US8165202B1 (en) | Video compression rate | |
CN111447446B (zh) | 一种基于人眼视觉区域重要性分析的hevc码率控制方法 | |
CN112825557A (zh) | 一种针对于视频编码的自适应感知时空域量化方法 | |
Liang et al. | A novel RQ model based rate control scheme in HEVC | |
CN115695799A (zh) | 一种考虑时域失真传播的零时延全景视频码率控制方法 | |
Lei et al. | Region adaptive R-$\lambda $ model-based rate control for depth maps coding | |
Xiang et al. | Perceptual quality consistency oriented CTU level rate control for HEVC intra coding | |
CN108989818A (zh) | 一种图像编码参数调整方法及装置 | |
CN103051897A (zh) | 一种h264视频编码码率控制方法 | |
CN112351279B (zh) | 面向hevc快速编码的自适应复杂度调整系统及方法 | |
CN116016927A (zh) | 一种考虑时域相关性和熵平衡的低延时全景视频编码方法 | |
WO1998035500A1 (en) | Method and apparatus for optimizing quantizer values in an image encoder | |
US8457211B2 (en) | System and method for image coding | |
CN111757112B (zh) | 一种基于恰可察觉失真的hevc感知码率控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |