CN114466190B - 一种图像集合级别的码率控制方法 - Google Patents

一种图像集合级别的码率控制方法 Download PDF

Info

Publication number
CN114466190B
CN114466190B CN202210153276.8A CN202210153276A CN114466190B CN 114466190 B CN114466190 B CN 114466190B CN 202210153276 A CN202210153276 A CN 202210153276A CN 114466190 B CN114466190 B CN 114466190B
Authority
CN
China
Prior art keywords
psnr
coding
value
picture
code rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210153276.8A
Other languages
English (en)
Other versions
CN114466190A (zh
Inventor
范益波
刘超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fudan University
Original Assignee
Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fudan University filed Critical Fudan University
Priority to CN202210153276.8A priority Critical patent/CN114466190B/zh
Publication of CN114466190A publication Critical patent/CN114466190A/zh
Application granted granted Critical
Publication of CN114466190B publication Critical patent/CN114466190B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers

Abstract

本发明属于图像编码技术领域,具体为一种图像集合级别的码率控制算法。本发明通过使用拉格朗日函数,将有约束的码率控制问题变为无约束的问题,从而实现无极调节输出动态BPP(比特每像素)或PSNR(峰值信噪比)。相比于每张图片输出固定的BPP或PSNR值,本发明可以获得大约2%的BD‑Rate增益。

Description

一种图像集合级别的码率控制方法
技术领域
本发明属于图像编码技术领域,具体涉及一种适用于图像集合级别的码率控制方法。
背景技术
码率控制在编码器中占有了非常重要的地位。从主观质量的角度来看,使用码率控制策略可以给人眼更感兴趣的区域分配更多的码率。而从客观质量的角度来看,其也可以在相同的码率条件下,更合理地分配码率给整张图片或者是图片集合。本发明将介绍一种提升客观质量的图片集合域的码率控制方法。
参数定义
D,表示编码失真,为编/解码器重建结果和原始输入的视频/图像之间的差别衡量,常用PSNR(峰值信噪比)、SSIM(结构相似度)来进行衡量。
R,表示编码码率,为编码器输出的码流长度,其越大表示码流的文件大小越大,相应地传输成本和存储成本越高,反之亦然。一般认为更高的码率可以带来更小的失真。
J,表示率失真优化损失函数,使用拉格朗日数乘法对编码失真D和编码码率R进行权衡,通过计算不同编码方案的J,实现在他们之间的定量比较。
λ,表示率失真优化超参数,是率失真优化损失函数的超参数,其作用在R或者D上,当其变大时,选择更小的J意味着其对应作用的对象的重要程度就变大,反之亦然。
发明内容
本发明的目的是提出一种适用于图像集合级别的码率控制算法,以有效地提升编码器的分配码率的能力。
下面以输出目标PSNR(峰值信噪比)为例,介绍提升码率控制性能的原理。考察图1,考虑RDO(率失真优化)曲线C1和C2,正方形点表示目前的图片选择策略,菱形的点表示新的RDO策略。圆形点和菱形点的失真和码率是一样的,而圆形点在正方形点的点左下方。因此,圆形点具有比正方形点更低的RDO损失。换句话说,拥有更好的率失真优化表现。具体证明过程如下:
符号定义:d表示失真,R表示码率,d和R的下标,第一个下标表示曲线的序号,1表示C1曲线,2表示C2区线;第二个下标表示方法的序号,1表示原始方法,2表示新的方法,*表示新方法等价RDO损失的选择。
问题描述:对于一组待编码的图片,希望图片集合输出的平均PSNR为预先设定的目标PSNR。原始方法1表示,对每一张图片都选择输出预先设定的目标PSNR的QP作为编码QP进行编码。而原始方法2表示对每一张图片都选择在相同参数λ下的最小RDO损失的QP作为编码QP进行编码。可以假设方法1和方法2都可以输出预先设定的PSNR值,因此两者的失真之和相等,可以写作等式(1):
d11+d21=d22+d12, (1)
需要证明不等式(2),即可说明新的RDO策略更好。
R11+R21>R12+R22, (2)
证明:考虑圆形点,因为d11(d21)到d22和d12的距离相同,所以:
R1*+R2*=R12+R22, (3)
而:
R11>R1*
R21>R2*, (4)
所以:
r11+r21>r1*+r2*=r12+r22, (5)
因此,式(2)得证,新的码率控制策略相比原始策略更好。
基于上述原理,本发明提供一种适用于图像集合级别的码率控制算法,对于待编码的图像集合,从整体的角度来考虑率失真优化,以实现比仅从图像的角度达到更高压缩率效果。这里以输出目标PSNR(峰值信噪比)为例,具体步骤如下:
(1)初始化编码量化参数QP为任意有效的值,这里的量化参数是指一般编码器中的量化参数,比如在HM(HEVC标准测试模型)中是0到51;
(2)将所有图片以选定的QP进行编码,每次编码计算平均的PSNR值,使用搜索算法(比如二分法)找到最接近目标PSNR的QP值;
(3)对每一张图片在步骤(2)中求得的QP附近的若干个QP都进行编码,得到重建图像;实际实验中若干个QP的数量选取越多,性能越好,这里我们推荐数量为4-6个。并统计每一张重建图像在每一个QP下编码消耗的BPP(比特每像素)以及PSNR(峰值信噪比)值;
(4)初始化率失真优化超参数λ为0.1,计算每一张图片在以λ为系数的拉格朗日公式下的率失真优化损失J,找到每一张图片中最小J对应的QP,进行保存;其中J定义为J等于失真加上BPP乘以λ;
(5)比较保存的结果的平均PSNR和目标PSNR的差别,以进行调整λ值;当保存的PSNR比目标PSNR大时,增大λ值,反之减小λ值;不断搜索直至达到目标的PSNR值;
(6)记录下最后一次满足要求的λ,对应选中每一张图片最小J的QP作为编码QP,从而实现码率控制。
本发明通过使用拉格朗日函数,将有约束的码率控制问题变为无约束的问题,从而可以实现无极调节输出动态BPP(比特每像素)或PSNR(峰值信噪比)。相比于每张图片输出固定的BPP或PSNR值,本方法可以获得大约2%的BD-Rate增益。
附图说明
图1本发明方法示意图。
具体实施方式
仍然以输出目标PSNR为例,介绍如何提升实施。在实际的过程中,如果输出目标为BPP,也是一样的,将提到的PSNR换成BPP即可。具体方法包含两个步骤,确定编码QP范围。搜索率失真优化参数λ。当率失真优化参数λ确定之后,每一张图片对应的编码QP值也就确定了。
(一)确定编码QP范围:
(1)初始化编码量化参数QP为任意有效的值,比如在HM中是0到51,可选择30作为起始值。在第一次编码过程中,初始化的QP用作每一张图片的编码参数,从而可以得到这个图片集合在QP=30的情况下平均PSNR和BPP。
(2)将所有图片以选定的QP进行编码,从而得到每一张图片的编码结果,对编码的PSNR结果计算平均,即可得到数据集在当前选定QP下的平均PSNR值。当得到的PSNR值比目标的PSNR值要小的时候,增大QP值;反之当得到的PSNR值比目标的PSNR值要大的时候,减小QP值。不断重复进行此步骤,直到找到最接近目标PSNR的QP值,此时采用的是原始方法1的码率控制策略以输出目标的PSNR或者得到目标的BPP。
(3)以步骤(2)中求得的QP附近的若干个QP对每一张图片进行编码得到重建图像。对应N张图片,M个QP就一共是M×N次编码。比如假设步骤(2)中得到的QP为28,计算资源允许一定的搜索,我们可以搜索[26,27,28,29,30]五个QP作为候选QP,这里的M就是5。以此统计每一张重建图像在每一个QP下编码消耗的BPP以及PSNR值,记录为一张M×N的表格。
(二)搜索率失真优化参数λ
(4)在得到了M×N的编码结果表格后,需要对每一张图片挑选出最优的编码参数QP。其具体是通过计算率失真优化函数得到的。率失真优化函数定义为失真和码率的拉格朗日函数:
J=D+λR, (6)
为了计算率失真优化函数,我们首先初始化λ为0.1,计算每一张图片在以λ为系数的拉格朗日公式下的RDO损失J,因此,每张图片就包含M个J,找到每一张图片中M个J中最小J对应的QP进行保存编码结果。
(5)对每一张图片都搜索完毕之后,统计保存的结果的平均PSNR和目标PSNR的差别,以进行调整λ值。当保存的PSNR比目标PSNR大时,增大λ值,反之减小λ值。更新λ这里的更新规则也可以采用二分法或者是其他常见的搜索算法。重复进行步骤(4),直至统计保存的结果的平均PSNR达到目标的PSNR值。
(6)记录下最后一次保存的结果作为整个码率控制的编码结果。

Claims (1)

1.一种图像集合级别的码率控制方法,其特征在于,对于输出目标PSNR,具体步骤如下:
(1)初始化编码量化参数QP为任意有效的值;
(2)将所有图片以选定的QP进行编码,每次编码计算平均的PSNR值,使用搜索算法找到最接近目标PSNR的QP值;
(3)对每一张图片在步骤(2)中求得的QP附近的若干个QP都进行编码;并统计每一张重建图像在每一个QP下编码消耗的BPP以及PSNR值;BPP表示比特每像素;
(4)初始化率失真优化超参数λ为0.1,计算每一张图片在以λ为系数的拉格朗日公式下的率失真优化损失J,找到每一张图片中最小J对应的QP,进行保存;其中J定义为J等于失真加上BPP乘以λ;
(5)比较保存的结果的平均PSNR和目标PSNR的差别,以进行调整λ值;当保存的PSNR比目标PSNR大时,增大λ值,反之减小λ值;不断搜索直至达到目标的PSNR值;
(6)记录下最后一次满足要求的λ,对应选中每一张图片最小J的QP作为编码QP,从而实现码率控制。
CN202210153276.8A 2022-02-18 2022-02-18 一种图像集合级别的码率控制方法 Active CN114466190B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210153276.8A CN114466190B (zh) 2022-02-18 2022-02-18 一种图像集合级别的码率控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210153276.8A CN114466190B (zh) 2022-02-18 2022-02-18 一种图像集合级别的码率控制方法

Publications (2)

Publication Number Publication Date
CN114466190A CN114466190A (zh) 2022-05-10
CN114466190B true CN114466190B (zh) 2023-01-06

Family

ID=81415099

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210153276.8A Active CN114466190B (zh) 2022-02-18 2022-02-18 一种图像集合级别的码率控制方法

Country Status (1)

Country Link
CN (1) CN114466190B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101883283A (zh) * 2010-06-18 2010-11-10 北京航空航天大学 一种基于saqd域的立体视频码率控制方法
CN103281530A (zh) * 2013-05-07 2013-09-04 西安电子科技大学 基于率失真优化的hevc码率控制方法
CN104796705A (zh) * 2015-04-22 2015-07-22 福州大学 一种基于ssim的hevc视频编码率失真优化与码率控制算法
US11025914B1 (en) * 2020-03-15 2021-06-01 Tfi Digital Media Limited Method based on global rate-distortion optimization for rate control in video coding
CN113489981A (zh) * 2021-07-06 2021-10-08 电子科技大学 一种考虑时域率失真优化的零延迟码率控制方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107707918A (zh) * 2017-10-26 2018-02-16 北京佳讯飞鸿电气股份有限公司 基于hevc/h.265平均码率控制的优化算法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101883283A (zh) * 2010-06-18 2010-11-10 北京航空航天大学 一种基于saqd域的立体视频码率控制方法
CN103281530A (zh) * 2013-05-07 2013-09-04 西安电子科技大学 基于率失真优化的hevc码率控制方法
CN104796705A (zh) * 2015-04-22 2015-07-22 福州大学 一种基于ssim的hevc视频编码率失真优化与码率控制算法
US11025914B1 (en) * 2020-03-15 2021-06-01 Tfi Digital Media Limited Method based on global rate-distortion optimization for rate control in video coding
CN113489981A (zh) * 2021-07-06 2021-10-08 电子科技大学 一种考虑时域率失真优化的零延迟码率控制方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Haiwen Liu ; Yichao Fan ; Zhichong Zhang ; Yulong Zhao ; Wenyuan Xu ; .Dual-Band Superconducting Bandpass Filter Using Embedded Split Ring Resonator.《IEEE Transactions on Applied Superconductivity》.2012, *
一种降低硬件HEVC帧间编码器存储器开销的方法;魏家聪;范益波;曾晓洋;《复旦学报》;20200415;全文 *

Also Published As

Publication number Publication date
CN114466190A (zh) 2022-05-10

Similar Documents

Publication Publication Date Title
JP5365518B2 (ja) 画像処理装置及び方法
US7653129B2 (en) Method and apparatus for providing intra coding frame bit budget
US6005981A (en) Quadtree-structured coding of color images and intra-coded images
KR100970315B1 (ko) 트랜스코더 및 부호화 화상 변환 방법
EP1033036B1 (en) Adaptive entropy coding in adaptive quantization framework for video signal coding systems and processes
KR100206261B1 (ko) 디지탈 vtr의 영상신호 대역 압축장치
US6891889B2 (en) Signal to noise ratio optimization for video compression bit-rate control
US20030128756A1 (en) Method and apparatus for selecting macroblock quantization parameters in a video encoder
US5489944A (en) Encoding method and apparatus to determine quantization levels using energy characteristics in the DCT domain
US6603813B1 (en) Video signal coding systems and processes using adaptive quantization
KR100238066B1 (ko) 양자화활동도를 이용한 비트 발생량 제어방법 및 그 영상 부호화장치
US8374451B2 (en) Image processing device and image processing method for reducing the circuit scale
JP2007503784A (ja) ハイブリッドビデオ圧縮法
CN108574841B (zh) 一种基于自适应量化参数的编码方法及装置
US20050243930A1 (en) Video encoding method and apparatus
US20050036549A1 (en) Method and apparatus for selection of scanning mode in dual pass encoding
US8295623B2 (en) Encoding and decoding with elimination of one or more predetermined predictors
CN108200431B (zh) 一种视频编码码率控制帧层比特分配方法
JPH05276501A (ja) 可変長の適応映像圧縮方法及び装置
Yang et al. Generalized rate-distortion optimization for motion-compensated video coders
US5907362A (en) Picture coding apparatus
JP3777002B2 (ja) 映像信号符号化方法及び映像信号符号化装置
CN114466190B (zh) 一种图像集合级别的码率控制方法
US5724096A (en) Video signal encoding method and apparatus employing inter-block redundancies
JP4532607B2 (ja) ブロック・ベースのコード化システムにおいてコード化モードを選択するための装置および方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant