CN109348223B - 一种适用于avs2和hevc帧内编码的快速方法 - Google Patents

一种适用于avs2和hevc帧内编码的快速方法 Download PDF

Info

Publication number
CN109348223B
CN109348223B CN201811526564.3A CN201811526564A CN109348223B CN 109348223 B CN109348223 B CN 109348223B CN 201811526564 A CN201811526564 A CN 201811526564A CN 109348223 B CN109348223 B CN 109348223B
Authority
CN
China
Prior art keywords
ssd
coding
8x8pu
max
intra
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811526564.3A
Other languages
English (en)
Other versions
CN109348223A (zh
Inventor
朱建国
李日
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Arcvideo Technology Co ltd
Original Assignee
Hangzhou Arcvideo Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Arcvideo Technology Co ltd filed Critical Hangzhou Arcvideo Technology Co ltd
Priority to CN201811526564.3A priority Critical patent/CN109348223B/zh
Publication of CN109348223A publication Critical patent/CN109348223A/zh
Application granted granted Critical
Publication of CN109348223B publication Critical patent/CN109348223B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种适用于AVS2和HEVC帧内编码的快速方法。它具体包括如下步骤:(1)对I帧进行编码,每个LCU进行四叉树向下递归划分,当编码8x8的CU时,首先计算8x8PU的编码代价,同时得到8x8PU的重建图像;(2)将8x8PU的重建图像均分为4个4x4的区域,分别计算每个4x4块重建图像与原始图像之间的失真SSD,得到四个失真SSD;(3)计算这四个失真SSD的最大值ssd_max和最小值ssd_min,当ssd_max与ssd_min的差距及ssd_max小于某个阈值时,直接选择8x8PU预测模式;否则,需要计算INTRA_NxN的编码代价;(4)计算4个4x4PU的总的编码代价,两个编码代价进行比较,选择编码代价更小的作为8x8PU编码单元的最终预测模式。本发明的有益效果是:判断准确度高,节省AVS2和HEVC的帧内编码时间,保证高压缩率。

Description

一种适用于AVS2和HEVC帧内编码的快速方法
技术领域
本发明涉及视频编码相关技术领域,尤其是指一种适用于AVS2和HEVC帧内编码的快速方法。
背景技术
HEVC是2013年由国际电信联盟(ITU-T)发布的最新一代的视频编码标准,相比上一代编码标准H264,HEVC的压缩效率提升了一倍,能大大降低目前正在普及的4K超高清视频的码率,减少带宽消耗。
AVS2是中国于2016年12月份发布的面向超高清视频应用的最新一代标准。AVS2的编码框架与HEVC类似,在编码效率上要略优于HEVC。目前AVS2视频标准已成为中国广电总局<<4K超高清电视技术应用实施指南(2018版)>>采用的唯一视频编码标准,具有广阔的应用前景。
为了适应更高分辨率的视频的压缩,AVS2和HEVC都采用了基于四叉树的块划分结构,这种结构允许采用更大的块及对块进行更灵活的划分来提高压缩效率。具体来说:1、相比H264的16x16编码宏块而言,AVS2/HEVC最大允许64x64的编码单元(LCU,Largest CodingUnit)。2、AVS2/HEVC对编码单元进行四叉树划分成更小的编码单元(CU,Coding Unit),而且最小的编码单元可以小到8x8。3、对AVS2/HEVC来说,在正方形的编码单元内部,可以进一步划分成不同形状的预测单元(Prediction Unit,PU),所有的帧内/帧间预测都是在预测单元内进行的。4、对AVS2/HEVC的帧内编码而言,在编码最小CU(8x8)时,有两种预测单元划分方式,即1个8x8 PU和4个4x4的PU,其中4个4x4的PU可以称之为INTRA_NXN模式。INTRA_NXN模式对4个4x4的小图像分别进行预测编码,可以对4个小块得到更精确的预测结果,因此对纹理丰富的区域可以获得更好的预测效果。但是对高清超高清视频而言,由于视频分辨率很高,因此尺寸很小的丰富纹理相对较少。对AVS2或者HEVC码流进行分析统计得到,最终选择INTRA_NXN模式的比例一般都不超过10%。
AVS2/HEVC编码器采用率失真优化(RDO)来选择最优的编码单元和预测单元。率失真优化是根据编码失真和编码后比特数来计算编码代价RDCost,公式表达为RDCost=D+lambda*R。其中D为编码失真,一般将解码后的重建图像与原始图像之间的差值平方和SSD(Sum of Squared Difference)作为失真度量;R为编码后比特数;lambda是与量化参数QP正相关的拉格朗日常数。编码器比较不同尺寸的编码单元或者不同的预测单元之间的编码代价,选择代价最小的作为最终模式,从而达到最高的压缩效率。
在编码器的优化过程中,普遍采用SIMD(单指令多数据流)汇编优化技术对函数进行加速。一条SSE指令最多可处理16个8bit数据,而AVX2指令则可以处理最多32个8bit数据。因此对AVS2/HEVC而言,尺寸较小的CU/PU(8x8的CU及4x4的Intra PU),由于一行的数据量过少导致汇编指令优势难以完全发挥,所以汇编优化效果不如大尺寸的CU/PU。通过对目前优化完善的开源HEVC编码器x265的统计发现,在I帧编码过程中,8x8的Intra PU分析过程占总的编码时间为25%左右,而INTRA_NXN的分析过程占总编码时间甚至达到了35%左右,即I帧编码有超过一半的时间消耗在小尺寸的CU的分析过程中。对AVS2编码器也有类似的统计结果,因此优化INTRA_NXN对AVS2/HEVC编码器的加速具有相当重要的意义。
目前业内普遍采用BDRate指标来衡量不同编码器压缩效率的差别。BDRate是在相同的图像客观质量下,编码码率的增加或节省的幅度。图像客观质量一般利用解码后重建图像与原始图像之间的峰值信噪比(Peak Signal to Noise Ratio,PSNR)来衡量。
发明内容
本发明是为了克服现有技术中存在上述的不足,提供了一种节省帧内编码时间且保证高压缩率的适用于AVS2和HEVC帧内编码的快速方法。
为了实现上述目的,本发明采用以下技术方案:
一种适用于AVS2和HEVC帧内编码的快速方法,具体包括如下步骤:
(1)对I帧进行编码,每个LCU进行四叉树向下递归划分,当编码8x8的CU时,首先计算8x8 PU的编码代价RDCost_8x8,当计算完8x8 PU的编码代价之后,得到8x8 PU的重建图像;
(2)通过计算8x8 PU的重建图像与原始图像的之间的失真作为纹理一致性及预测效果是否够好的依据;具体为:将8x8 PU的重建图像均分为4个4x4的区域,分别计算每个4x4块重建图像与原始图像之间的失真SSD,得到四个失真SSD分别为ssd0、ssd1、ssd2、ssd3;
(3)计算这四个失真SSD的最大值和最小值,分别为ssd_max和ssd_min,当ssd_max与ssd_min的差距及ssd_max小于某个阈值时,则不需要再尝试INTRA_NXN预测模式,直接选择8x8 PU预测模式;否则,需要计算INTRA_NxN的编码代价;
(4)计算4个4x4 PU的总的编码代价RDCost_intraNxN,RDCost_8x8与RDCost_intraNxN进行比较,选择编码代价更小的作为8x8 PU编码单元的最终预测模式。
AVS2/HEVC作为当前最新一代视频编码标准,压缩效率和编码复杂度都远超上一代编码标准H264。为了推动AVS2和HEVC的商用,必须对他们进行充分的优化,降低计算复杂度,同时保证他们的高压缩率。对AVS2/HEVC而言,汇编优化在小尺寸编码单元上的加速效果不及大尺寸编码单元。通过大量的统计发现,在I帧的编码过程中,INTRA_NXN的分析时间超过总编码时间的1/3,但是被选中的比例却小于1/10。因此,本发明提出一种快速算法,可以提前判决是否需要对8x8的CU进行INTRA_NXN的分析。本发明的创新之处在于当计算完8x8 PU的编码代价之后,对8x8的重建图像进行分析,如果纹理一致性足够高,而且预测效果足够好,则不再计算INTRA_NxN的编码代价,直接采用8x8 PU的预测模式。本发明具有很高的判断准确度,可大大节省AVS2和HEVC的帧内编码时间,同时保证高压缩率,对编码器的优化具有很高的实际意义。
作为优选,在步骤(3)中,计算ssd_diff_ratio来量化ssd_max与ssd_min的差距:ssd_diff_ratio=(ssd_max–ssd_min)/ssd_min;如果ssd_diff_ratio<Threshold1时,则认为纹理一致,Threshold1是预先设定的阈值。
作为优选,在步骤(3)中,通过阈值来判断8x8 PU的预测效果;具体来说,如果ssd_max<Threshold2,则认为当前8x8 PU预测效果够好,Threshold2是预先设定的阈值。
作为优选,在步骤(3)中,还需要满足ssd_max与ssd_min的差距与ssd_max的乘积小于某个阈值时,则不需要再尝试INTRA_NXN预测模式。
本发明的有益效果是:具有很高的判断准确度,可大大节省AVS2和HEVC的帧内编码时间,同时保证高压缩率,对编码器的优化具有很高的实际意义。
具体实施方式
下面结合具体实施方式对本发明做进一步的描述。
一种适用于AVS2和HEVC帧内编码的快速方法,具体包括如下步骤:
(1)对I帧进行编码,每个LCU进行四叉树向下递归划分,当编码8x8的CU时,首先计算8x8 PU的编码代价RDCost_8x8,当计算完8x8 PU的编码代价之后,得到8x8 PU的重建图像;
(2)通过计算8x8 PU的重建图像与原始图像的之间的失真作为纹理一致性及预测效果是否够好的依据;具体为:将8x8 PU的重建图像均分为4个4x4的区域,分别计算每个4x4块重建图像与原始图像之间的失真SSD,得到四个失真SSD分别为ssd0、ssd1、ssd2、ssd3;
(3)计算这四个失真SSD的最大值和最小值,分别为ssd_max和ssd_min,当ssd_max与ssd_min的差距及ssd_max小于某个阈值时,则不需要再尝试INTRA_NXN预测模式,直接选择8x8 PU预测模式;否则,需要计算INTRA_NxN的编码代价;如果ssd_max与ssd_min之间差别越小,说明4个4x4区域纹理越一致;如果ssd_max越小,说明预测效果越好;
计算ssd_diff_ratio来量化ssd_max与ssd_min的差距:ssd_diff_ratio=(ssd_max–ssd_min)/ssd_min;如果ssd_diff_ratio<Threshold1时,则认为纹理一致,Threshold1是预先设定的阈值;对于编码器而言,编码失真SSD随着量化参数QP的增大而增大,所以阈值Threshold1也是QP正相关的,本发明中,阈值Threshold1是根据实验结果得到的经验值;具体来说:Threshold1=QP*0.05;
通过阈值来判断8x8 PU的预测效果;具体来说,如果ssd_max<Threshold2,则认为当前8x8 PU预测效果够好,Threshold2是预先设定的阈值;同样的,由于编码失真SSD随着量化参数QP的增大而增大,阈值Threshold2也是QP正相关的,本发明中,阈值Threshold2也是根据实验结果得到的经验值;具体来说:Threshold2取值如下表所示:
QP 0 1 2 3 4 5 6 7 8
Threshold2 0 6 12 24 36 48 72 96 144
QP 9 10 11 12 13 14 15 16 17
Threshold2 192 240 300 360 450 540 630 750 870
QP 18 19 20 21 22 23 24 25 26
Threshold2 990 1140 1320 1500 1680 1950 2400 3000 3600
QP 27 28 29 30 31 32 33 34 35
Threshold2 4800 5400 6000 6600 7200 7800 8400 9000 9900
QP 36 37 38 39 40 41 42 43 44
Threshold2 10800 11700 12900 14400 16200 18300 20400 22800 25200
QP 45 46 47 48 49 50 51
Threshold2 27600 30000 32400 34800 37200 39600 42000
此外,还需要满足ssd_max与ssd_min的差距与ssd_max的乘积小于某个阈值时,则不需要再尝试INTRA_NXN预测模式;具体为:ssd_diff_ratio*ssd_max<Threshold3,Threshold3与Threshold1、Threshold2相关;具体来说:Threshold3=Threshold1*Threshold2/3;
当上述3个条件都满足时,当前8x8CU直接采用8x8 PU预测模式,不再尝试INTRA_NxN预测模式;否则,需要计算INTRA_NxN的编码代价;
(4)计算4个4x4 PU的总的编码代价RDCost_intraNxN,RDCost_8x8与RDCost_intraNxN进行比较,选择编码代价更小的作为8x8 PU编码单元的最终预测模式。
AVS2/HEVC作为当前最新一代视频编码标准,压缩效率和编码复杂度都远超上一代编码标准H264。为了推动AVS2和HEVC的商用,必须对他们进行充分的优化,降低计算复杂度,同时保证他们的高压缩率。对AVS2/HEVC而言,汇编优化在小尺寸编码单元上的加速效果不及大尺寸编码单元。通过大量的统计发现,在I帧的编码过程中,INTRA_NXN的分析时间超过总编码时间的1/3,但是被选中的比例却小于1/10。因此,本发明提出一种快速算法,可以提前判决是否需要对8x8的CU进行INTRA_NXN的分析。本发明的创新之处在于当计算完8x8 PU的编码代价之后,对8x8的重建图像进行分析,如果纹理一致性足够高,而且预测效果足够好,则不再计算INTRA_NxN的编码代价,直接采用8x8 PU的预测模式。判断纹理是否一致及预测效果是否足够好是本发明的关键部分。本发明具有很高的判断准确度,可大大节省AVS2和HEVC的帧内编码时间,同时保证高压缩率,对编码器的优化具有很高的实际意义。将本发明应AVS2和HEVC的参考软件中,对I帧编码时间平均节省15%左右,而且在相同的图像客观质量下,码率增加小于0.1%。

Claims (4)

1.一种适用于AVS2和HEVC帧内编码的快速方法,其特征是,具体包括如下步骤:
(1)对I帧进行编码,每个LCU进行四叉树向下递归划分,当编码8x8的CU时,首先计算8x8 PU的编码代价RDCost_8x8,当计算完8x8 PU的编码代价之后,得到8x8 PU的重建图像;
(2)通过计算8x8 PU的重建图像与原始图像的之间的失真作为纹理一致性及预测效果是否够好的依据;具体为:将8x8 PU的重建图像均分为4个4x4的区域,分别计算每个4x4块重建图像与原始图像之间的失真SSD,得到四个失真SSD分别为ssd0、ssd1、ssd2、ssd3;其中:重建图像与原始图像之间的失真SSD指的是重建图像与原始图像之间的差值平方和;
(3)计算这四个失真SSD的最大值和最小值,分别为ssd_max和ssd_min,当ssd_max与ssd_min的差距小于Threshold1及ssd_max小于Threshold2时,则不需要再尝试INTRA_NXN预测模式,直接选择8x8PU预测模式;否则,需要计算INTRA_NxN的编码代价;其中:Threshold1是预先设定的阈值,Threshold2是预先设定的阈值;
(4)计算4个4x4 PU的总的编码代价RDCost_intraNxN,RDCost_8x8与RDCost_intraNxN进行比较,选择编码代价更小的作为8x8 PU编码单元的最终预测模式。
2.根据权利要求1所述的一种适用于AVS2和HEVC帧内编码的快速方法,其特征是,在步骤(3)中,计算ssd_diff_ratio来量化ssd_max与ssd_min的差距:ssd_diff_ratio=(ssd_max–ssd_min)/ssd_min;如果ssd_diff_ratio<Threshold1时,则认为纹理一致。
3.根据权利要求1所述的一种适用于AVS2和HEVC帧内编码的快速方法,其特征是,在步骤(3)中,通过阈值来判断8x8 PU的预测效果;具体来说,如果ssd_max<Threshold2,则认为当前8x8 PU预测效果够好。
4.根据权利要求1或2或3所述的一种适用于AVS2和HEVC帧内编码的快速方法,其特征是,在步骤(3)中,还需要满足ssd_max与ssd_min的差距与ssd_max的乘积小于Threshold3时,则不需要再尝试INTRA_NXN预测模式;其中:Threshold3=Threshold1*Threshold2/3。
CN201811526564.3A 2018-12-13 2018-12-13 一种适用于avs2和hevc帧内编码的快速方法 Active CN109348223B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811526564.3A CN109348223B (zh) 2018-12-13 2018-12-13 一种适用于avs2和hevc帧内编码的快速方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811526564.3A CN109348223B (zh) 2018-12-13 2018-12-13 一种适用于avs2和hevc帧内编码的快速方法

Publications (2)

Publication Number Publication Date
CN109348223A CN109348223A (zh) 2019-02-15
CN109348223B true CN109348223B (zh) 2021-02-26

Family

ID=65304468

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811526564.3A Active CN109348223B (zh) 2018-12-13 2018-12-13 一种适用于avs2和hevc帧内编码的快速方法

Country Status (1)

Country Link
CN (1) CN109348223B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110581990B (zh) * 2019-09-25 2021-07-27 杭州当虹科技股份有限公司 一种适用于hevc 4k和8k超高清编码的tu递归快速算法
CN110896481B (zh) * 2019-12-31 2022-03-08 杭州当虹科技股份有限公司 一种适用于hevc的快速帧内模式编码方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101895755B (zh) * 2010-07-20 2012-10-03 杭州电子科技大学 一种快速4x4块帧内预测模式选择方法
KR101519557B1 (ko) * 2013-12-27 2015-05-13 연세대학교 산학협력단 고속 화면 내 예측 부호화 방법 및 그 장치
CN106028047B (zh) * 2016-05-24 2019-02-26 西安电子科技大学 一种基于Hadamard变换的帧内预测的快速模式选择和PU划分的方法
CN106961606B (zh) * 2017-01-26 2020-04-07 浙江工业大学 基于纹理划分特征的hevc帧内编码模式选择方法

Also Published As

Publication number Publication date
CN109348223A (zh) 2019-02-15

Similar Documents

Publication Publication Date Title
US8331449B2 (en) Fast encoding method and system using adaptive intra prediction
CN103997646B (zh) 一种高清视频编码中快速帧内预测模式选择方法
CN109688414B (zh) 一种vvc帧内编码单元候选预测模式缩减及块划分提前终止方法
CA2687260C (en) Adaptive coding of video block prediction mode
KR101433170B1 (ko) 인접 블록의 공간 예측 방향성을 이용하여 화면 내 예측모드를 추정하는 인코딩 및 디코딩 방법, 그 장치
KR102323427B1 (ko) 영상 부호화 방법 및 장치
CN110662078B (zh) 适用于avs2和hevc的4k/8k超高清编码帧间编码帧快速算法
CN102648627A (zh) 率失真优化量化的加速技术
CN111901597B (zh) 一种基于视频复杂度的cu级qp分配算法
KR101960470B1 (ko) 오프라인 cabac을 지원하는 비디오 코딩 프로세스의 비트 예측 기반 비트 레이트 컨트롤 방법 및 그 장치
CN110351552B (zh) 视频编码中一种快速编码方法
CN109348223B (zh) 一种适用于avs2和hevc帧内编码的快速方法
CN102364950B (zh) 基于h.264/avc标准的帧内预测模式快速选择方法及装置
WO2022121787A1 (zh) 视频预测编码的方法及装置
CN1285214C (zh) 一种环路滤波方法和环路滤波器
CN110896481B (zh) 一种适用于hevc的快速帧内模式编码方法
CN104581152A (zh) 一种hevc帧内预测模式选择加速方法
CN110581990B (zh) 一种适用于hevc 4k和8k超高清编码的tu递归快速算法
KR101138736B1 (ko) 부호화기 및 부호화기의 후보 모드 결정 방법
CN110677646B (zh) 一种基于cpu+gpu混合编码的帧内编码预测方法
Wang et al. A fast intra optimization algorithm for HEVC
CN113542738B (zh) 一种视频编码模式快速决策的方法
TWI834547B (zh) 一種解碼、編碼方法、裝置及其設備
CN103402101A (zh) 基于边界平滑度的avs环路滤波快速算法
Ren et al. An Adaptive Intra-frame Quantization Parameter Derivation Model Jointing with Inter-frame Analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant