CN110677664A - 一种面向4k/8k超高清视频编码的低抖动码率控制方法 - Google Patents

一种面向4k/8k超高清视频编码的低抖动码率控制方法 Download PDF

Info

Publication number
CN110677664A
CN110677664A CN201910907206.5A CN201910907206A CN110677664A CN 110677664 A CN110677664 A CN 110677664A CN 201910907206 A CN201910907206 A CN 201910907206A CN 110677664 A CN110677664 A CN 110677664A
Authority
CN
China
Prior art keywords
saturation
gop
executing
buffer
setting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910907206.5A
Other languages
English (en)
Other versions
CN110677664B (zh
Inventor
廖义
谢亚光
李日
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dang Hong Polytron Technologies Inc
Hangzhou Arcvideo Technology Co ltd
Original Assignee
Hangzhou Dang Hong Polytron Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dang Hong Polytron Technologies Inc filed Critical Hangzhou Dang Hong Polytron Technologies Inc
Priority to CN201910907206.5A priority Critical patent/CN110677664B/zh
Publication of CN110677664A publication Critical patent/CN110677664A/zh
Application granted granted Critical
Publication of CN110677664B publication Critical patent/CN110677664B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种面向4K/8K超高清视频编码的低抖动码率控制方法。它具体包括如下步骤:(1)将GOP的长度设为整数N,GOP的初始缓冲区饱和度设为T0,其中T0的取值范围为0~1.0,执行步骤(2);(2)开始编码第i个GOP中的第j帧,将其目标缓冲区饱和度大小设置为一个指定比例,使相邻GOP之间的缓冲区饱和度大小基本一致,执行步骤(3);(3)根据目标缓冲区饱和度,计算第i个GOP中的第j帧的量化参数QP进行编码,执行步骤(4);(4)判断当前视频中所有的GOP以及所有的帧是否完成编码,若是则结束当前编码,否则执行步骤(2)。本发明的有益效果是:GOP并行编码时缓冲区波动更加稳定,减少了缓冲区溢出的问题。

Description

一种面向4K/8K超高清视频编码的低抖动码率控制方法
技术领域
本发明涉及视频编码相关技术领域,尤其是指一种面向4K/8K超高清视频编码的低抖动码率控制方法。
背景技术
随着网络通信和视频处理技术的快速发展,4K、8K和HDR(High Dynamic Range,高动态范围)等技术逐步成为人们对视觉体验的新需求。4K/8K视频的数据量大,对编码压缩性能要求比较高,目前国内外针对4K/8K视频采用的编码压缩标准主要有HEVC和AVS2,它们的压缩效率较高但是计算复杂度也偏大,而4K/8K的实时直播通常要求编码器的速度达到50帧/秒以上。因此,如何在一定的网络带宽和速度要求下提升视频输出稳定性是视频编码技术发展的一个关键。
码率控制属于视频编码的一个重要环节,它通过获取视频信源特性(如运动剧烈程度、图像纹理复杂度等)和可用网络带宽来计算视频中每一帧图像和该图像中的各个区域应该分配的比特数,指导编码器对视频进行编码,使输出的码流符合信道的传输,同时使输出的视频质量尽可能好。由于视频信源每帧的复杂度(比特数)不相同,而网络带宽则是恒定的,因此码率控制中需要设置缓冲区,使编码出的码流以恒定的码率(单位时间内的比特数)发送到网络中。
常用编码器中比较有效的缓冲区控制方式为Lookahead-vbv方式,它通过分析未来若干帧的复杂度来估算接下来缓冲区的占用情况,各帧的目标码率和实际码率会存在偏差,目标缓冲区饱和度和实际缓冲区饱和度也会存在偏差。
另一方面,4K/8K视频的实时直播对性能的要求非常高,通常需要采用GOP并行编码,让不同的GOP(Group of Picture,图像组)分布到不同的节点进行编码,例如,对于2个节点的编码器且当GOP长度为50时,则将第1个GOP(第1~50帧)放置于第1个节点,第2个GOP(第51~100帧)放置于第2个节点,将第3个GOP(第101~150帧)再放置于第1个节点,将第4个GOP(第151~200帧)再放置于第2个节点,以此类推。当编码完各个节点上GOP中的帧再将各节点的码流按照帧显示顺序进行合并,由于相邻GOP分布在不同的节点上,各自的缓冲区无法进行通信有可能造成码率溢出,例如,第3个GOP在编码首帧时,初始缓冲区大小为第1个GOP尾帧的缓冲区饱和度,而无法获得第2个GOP尾帧的缓冲区饱和度,当第2个GOP和第3个GOP合并时,缓冲区饱和度有可能超过1.0造成上溢或者小于0形成下溢。
发明内容
本发明是为了克服现有技术中存在上述的不足,提供了一种减少缓冲区溢出的面向4K/8K超高清视频编码的低抖动码率控制方法。
为了实现上述目的,本发明采用以下技术方案:
一种面向4K/8K超高清视频编码的低抖动码率控制方法,具体包括如下步骤:
(1)将GOP的长度设为整数N,GOP的初始缓冲区饱和度设为T0,其中T0的取值范围为0~1.0,执行步骤(2);
(2)开始编码第i个GOP中的第j帧,将其目标缓冲区饱和度大小设置为一个指定比例,使相邻GOP之间的缓冲区饱和度大小基本一致,执行步骤(3);
(3)根据目标缓冲区饱和度,计算第i个GOP中的第j帧的量化参数QP进行编码,执行步骤(4);
(4)判断当前视频中所有的GOP以及所有的帧是否完成编码,若是则结束当前编码,否则执行步骤(2)。
针对HEVC/AVS2的4K/8K视频的GOP并行编码,传统码率控制方法未能考虑相邻GOP缓冲区之间的通信,导致相邻GOP的码流在合并之后出现码率溢出,本发明方法针对传统码率控制方法存在的弊端,做出了以下改进及创新:当编码各个GOP的最后若干帧时,将其目标缓冲区大小设置为一个指定比例,每个GOP开始时初始缓冲区大小也设置为该指定比例,从而使相邻GOP之间的缓冲区大小基本一致,且维持在一个合理范围之内,减少了缓冲区溢出的问题。
作为优选,在步骤(2)中,开始编码第i个GOP中的第j帧,若j值为0,则将初始缓冲区饱和度设为T0,目标缓冲区饱和度设为0.5~0.8;若j值大于0且小于a*N,则将目标缓冲区饱和度设为0.5~0.8,其中a的取值范围为0~1.0;若j大于或等于a*N,则将目标缓冲区饱和度设为T0,执行步骤(3)。
本发明的有益效果是:使相邻GOP之间的缓冲区大小基本一致,且维持在一个合理范围之内,GOP并行编码时缓冲区波动更加稳定,减少了缓冲区溢出的问题。
附图说明
图1是本发明实施例Boat_Todd序列中的缓冲区波动情况示意图;
图2是本发明实施例Football序列中的缓冲区波动情况示意图;
图3是本发明实施例PQA序列中的缓冲区波动情况示意图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步的描述。
一种面向4K/8K超高清视频编码的低抖动码率控制方法,具体包括如下步骤:
(1)将GOP的长度设为整数N,GOP的初始缓冲区饱和度设为T0,其中T0的取值范围为0~1.0,执行步骤(2);
(2)开始编码第i个GOP中的第j帧,将其目标缓冲区饱和度大小设置为一个指定比例,使相邻GOP之间的缓冲区饱和度大小基本一致,执行步骤(3);
具体为,开始编码第i个GOP中的第j帧,若j值为0,则将初始缓冲区饱和度设为T0,目标缓冲区饱和度设为0.5~0.8;若j值大于0且小于a*N,则将目标缓冲区饱和度设为0.5~0.8,其中a的取值范围为0~1.0;若j大于或等于a*N,则将目标缓冲区饱和度设为T0,执行步骤(3);
(3)根据目标缓冲区饱和度,计算第i个GOP中的第j帧的量化参数QP进行编码,执行步骤(4);
(4)判断当前视频中所有的GOP以及所有的帧是否完成编码,若是则结束当前编码,否则执行步骤(2)。
针对HEVC/AVS2的4K/8K视频的GOP并行编码,传统码率控制方法未能考虑相邻GOP缓冲区之间的通信,导致相邻GOP的码流在合并之后出现码率溢出,本发明方法针对传统码率控制方法存在的弊端,做出了以下改进及创新:当编码各个GOP的最后若干帧时,将其目标缓冲区大小设置为一个指定比例,每个GOP开始时初始缓冲区大小也设置为该指定比例,从而使相邻GOP之间的缓冲区大小基本一致,且维持在一个合理范围之内,减少了缓冲区溢出的问题。本发明以HEVC/AVS2编码器为例进行实施,但并不局限于HEVC/AVS2,还可应用于H264、AVS、AVS3等编码器。
如图1、图2和图3所示,是测试3个视频序列的缓冲区波动情况,所用参数为:T0=0.55,N=50,a=0.2,缓冲区大小为500ms,GOP并行数目为2,图中横轴代表帧数,纵轴代表缓冲区饱和度,虚线代表传统方法,而实线代表本发明方法,从这3个视频序列可以看出,传统方法对于Boat_Todd序列和Football序列的上溢情况比较严重,对于PQA序列出现了下溢的情况,本发明方法的缓冲区波动更加稳定,减少了上溢的程度,且不会出现下溢。

Claims (2)

1.一种面向4K/8K超高清视频编码的低抖动码率控制方法,其特征是,具体包括如下步骤:
(1)将GOP的长度设为整数N,GOP的初始缓冲区饱和度设为T0,其中T0的取值范围为0~1.0,执行步骤(2);
(2)开始编码第i个GOP中的第j帧,将其目标缓冲区饱和度大小设置为一个指定比例,使相邻GOP之间的缓冲区饱和度大小基本一致,执行步骤(3);
(3)根据目标缓冲区饱和度,计算第i个GOP中的第j帧的量化参数QP进行编码,执行步骤(4);
(4)判断当前视频中所有的GOP以及所有的帧是否完成编码,若是则结束当前编码,否则执行步骤(2)。
2.根据权利要求1所述的一种面向4K/8K超高清视频编码的低抖动码率控制方法,其特征是,在步骤(2)中,开始编码第i个GOP中的第j帧,若j值为0,则将初始缓冲区饱和度设为T0,目标缓冲区饱和度设为0.5~0.8;若j值大于0且小于a*N,则将目标缓冲区饱和度设为0.5~0.8,其中a的取值范围为0~1.0;若j大于或等于a*N,则将目标缓冲区饱和度设为T0,执行步骤(3)。
CN201910907206.5A 2019-09-24 2019-09-24 一种面向4k/8k超高清视频编码的低抖动码率控制方法 Active CN110677664B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910907206.5A CN110677664B (zh) 2019-09-24 2019-09-24 一种面向4k/8k超高清视频编码的低抖动码率控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910907206.5A CN110677664B (zh) 2019-09-24 2019-09-24 一种面向4k/8k超高清视频编码的低抖动码率控制方法

Publications (2)

Publication Number Publication Date
CN110677664A true CN110677664A (zh) 2020-01-10
CN110677664B CN110677664B (zh) 2021-07-13

Family

ID=69078885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910907206.5A Active CN110677664B (zh) 2019-09-24 2019-09-24 一种面向4k/8k超高清视频编码的低抖动码率控制方法

Country Status (1)

Country Link
CN (1) CN110677664B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101159867A (zh) * 2007-03-31 2008-04-09 红杉树(杭州)信息技术有限公司 一种基于片的自适应码率控制方法
US20100246677A1 (en) * 2007-11-07 2010-09-30 Michael Erling Nilsson Video coding
CN102217308A (zh) * 2008-11-13 2011-10-12 汤姆森特许公司 使用画面组合并和位分配的多线程视频编码
CN105392001A (zh) * 2015-11-16 2016-03-09 四川大学 基于梯度的自适应高性能视频编码码率控制方法
CN110139101A (zh) * 2019-06-20 2019-08-16 电子科技大学 一种基于λ域码率控制的帧级比特分配方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101159867A (zh) * 2007-03-31 2008-04-09 红杉树(杭州)信息技术有限公司 一种基于片的自适应码率控制方法
US20100246677A1 (en) * 2007-11-07 2010-09-30 Michael Erling Nilsson Video coding
CN102217308A (zh) * 2008-11-13 2011-10-12 汤姆森特许公司 使用画面组合并和位分配的多线程视频编码
EP2345243B1 (en) * 2008-11-13 2014-08-06 Thomson Licensing Multiple thread video encoding using hrd information sharing and bit allocation waiting
CN105392001A (zh) * 2015-11-16 2016-03-09 四川大学 基于梯度的自适应高性能视频编码码率控制方法
CN110139101A (zh) * 2019-06-20 2019-08-16 电子科技大学 一种基于λ域码率控制的帧级比特分配方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
D. FANI ET AL.: "A GOP-level fuzzy logic rate controller for high efficiency video coding standard", 《2015 4TH IRANIAN JOINT CONGRESS ON FUZZY AND INTELLIGENT SYSTEMS (CFIS)》 *

Also Published As

Publication number Publication date
CN110677664B (zh) 2021-07-13

Similar Documents

Publication Publication Date Title
US8804825B2 (en) Bi-pred mode decision in GOP architecture
CA2737728C (en) Low latency video encoder
CN101742319B (zh) 基于背景建模的静态摄像机视频压缩方法与系统
CN101835042B (zh) 基于无反馈速率控制的Wyner-Ziv视频编码系统及方法
CN106993190B (zh) 软硬件协同编码方法及系统
CN101699867A (zh) 一种视频数据传输速率动态调整方法
US11343501B2 (en) Video transcoding method and device, and storage medium
CN110351552B (zh) 视频编码中一种快速编码方法
CN108737819B (zh) 一种基于四叉树二叉树结构的灵活编码单元划分方法
CN113038127A (zh) 一种基于roi的实时视频多路并行传输码率控制方法
CN105025347B (zh) 一种gop图像组的发送和接收方法
US20230045884A1 (en) Rio-based video coding method and deivice
CN102196253B (zh) 一种帧类型自适应选择的视频编码方法及装置
US20190356911A1 (en) Region-based processing of predicted pixels
CN108322740B (zh) 一种编码复杂度可控的编码方法
CN110677664B (zh) 一种面向4k/8k超高清视频编码的低抖动码率控制方法
CN101605250A (zh) 码率控制中确定初始量化步长的方法
CN114827617B (zh) 一种基于感知模型的视频编解码方法及系统
CN110572661B (zh) 一种面向4k/8k超高清视频编码的低延时码率控制方法
US20070297505A1 (en) Method and device for video encoding and decoding
EP0899961A1 (en) Pipelined processing for moving picture compression bit rate control
CN112218082B (zh) 一种基于可重构的多视频编码加速设计的方法及系统
Guo et al. Quality-progressive coding for high bit-rate background frames on surveillance videos
CN112004084B (zh) 一种利用量化参数排序的码率控制优化方法及系统
CN114339263A (zh) 一种针对视频数据的无损处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant