CN111757129B - 一种面向vvc的快速帧内预测方法 - Google Patents

一种面向vvc的快速帧内预测方法 Download PDF

Info

Publication number
CN111757129B
CN111757129B CN202010645425.3A CN202010645425A CN111757129B CN 111757129 B CN111757129 B CN 111757129B CN 202010645425 A CN202010645425 A CN 202010645425A CN 111757129 B CN111757129 B CN 111757129B
Authority
CN
China
Prior art keywords
mode
candidate
vvc
cost
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010645425.3A
Other languages
English (en)
Other versions
CN111757129A (zh
Inventor
魏宏安
林桑
周彬倩
赵铁松
徐艺文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN202010645425.3A priority Critical patent/CN111757129B/zh
Publication of CN111757129A publication Critical patent/CN111757129A/zh
Application granted granted Critical
Publication of CN111757129B publication Critical patent/CN111757129B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明涉及一种面向VVC的快速帧内预测方法,包括以下步骤:步骤S1:构建HAD代价预测模型,预测每种预测模式的HAD代价,按从小到大的排序,并选择前若干个HAD代价的模式初始化CU候选模式列表;步骤S2:通过统计分析候选模式成为最佳模式的概率,优化CU候选模式列表;步骤S3:基于贝叶斯定理,在每个CU深度级别执行CU划分的提前终止,进一步进行VVC的下一步编码流程,从而加快编码时间。本发明实现在保证视频质量的前提下,有效地加快了视频的编码时间。

Description

一种面向VVC的快速帧内预测方法
技术领域
本发明涉及视频编码技术领域,具体涉及一种面向VVC的快速帧内预测方法。
背景技术
VVC是新一代视频编码标准,它具有较高的编码效率,在VVC测试模式中,已经采用了许多新颖的技术来提高压缩效率。其中,删除预测单元和转换单元的概念是最重大的变化之一,编码单元直接用于预测和变换进度,无需进一步划分;另一项关键创新是,划分方法采用具有嵌套多类型树编码块结构的四叉树,而不是传统的四叉树结构;此外,为了更好地捕获任意边缘方向,VVC还扩展了预测模式的数量,在原有35种模式基础上,新增了32种子模式。
发明内容
有鉴于此,本发明的目的在于提供一种面向VVC的快速帧内预测方法,能够有效的加快视频的编码时间。
为实现上述目的,本发明采用如下技术方案:
一种面向VVC的快速帧内预测方法,包括以下步骤:
步骤S1:构建HAD代价预测模型,预测每种预测模式的HAD代价,按从小到大的排序,并选择前若干个HAD代价的模式初始化CU候选模式列表;
步骤S2:通过统计分析候选模式成为最佳模式的概率,优化CU候选模式列表;
步骤S3:基于贝叶斯定理,在每个CU深度级别执行CU划分的提前终止,进一步进行VVC的下一步编码流程,从而加快编码时间。
进一步的,所述步骤S1采用全帧内配置来计算不同类型视频序列中CU的HAD代价,将相邻参考CU分为UCU,LCU和coCU。
进一步的,所述步骤S1具体为:
步骤S11:当前CU的HAD代价分布C(t)由相邻块代价分布来预测,估算模型为:
Figure BDA0002572883140000021
其中Cl(t)和Cu(t)分别是LCU和UCU的HAD代价,
Figure BDA0002572883140000022
是对应的权重,由coCU权重预测得到;
步骤S12:按从小到大的排序,并选择前N个预测模式来初始化候选列表,并加入平面模式、DC模式、水平模式和垂直模式一起进入粗粒度模式选择过程,将预测模式从35降低到N+4。
进一步的,所述在VVC帧内预测中仅在LCU和UCU同时存在的情况下采用步骤S1初始化方法,否则当前CU将由原始VVC编码器进行编码。
进一步的,所述步骤S2具体为:
步骤S21:在几种不同类型的序列中进行测试,统计不同CU尺寸的候选列表中每个候选模式被选为最佳模式的概率,通过统计结果,证明通过在列表中的前x模式即可以达到准确预测;
步骤S22:尝试若干种不同CU尺寸采用不同候选模式数量的组合,且这里的每个CU尺寸的候选模式数量不超过x,将它们与VVC编码器的原始候选模式方案进行比较,选择编码性能较好和计算复杂度较低的组合;
步骤S23:根据步骤S22得到的组合中列出的不同CU尺寸所需的候选模式数量进一步优化CU候选模式列表,从候选列表中选择所需的候选模式作为在连续模式决策过程中使用的最终候选模式。
进一步的,所述步骤S3具体为:
步骤S31:利用对数正态函数来拟合拆分和未拆分CU的RD代价概率密度分布曲线:
Figure BDA0002572883140000031
其中,r表示RD代价,fi(r)是i情况下RD代价的概率密度分布,i有s,n两种情况,其中s表示继续拆分CU,n表示终止CU划分;μ是均值,σ2是方差;
步骤S32:计算CU划分的错误概率Pe
Figure BDA0002572883140000032
其中,P(*)是s或n情况的先验概率,且P(s)+P(n)=1;Th是RD代价的阈值,
步骤S33:计算Pe最小时Th的值,在拆分CU的概率密度分布曲线和未拆分CU的概率密度分布曲线两条曲线相交的情况下Pe最小,并且相交值就是最优阈值Thopt;并设置CU划分的提前终止描述;
步骤S34:阈值Thopt的偏移,将Thopt重写为:
Figure BDA0002572883140000033
其中,Thmax是用于防止由阈值过大引起的错误判断的最大阈值,α是离线训练的偏移值,适应不同的量化参数和CU大小。
进一步的,所述CU划分的提前终止描述为:
Figure BDA0002572883140000041
其中,Hn表示终止CU划分的情况,Hs表示CU继续拆分,当RD代价r小于等于最优阈值Thopt就终止CU划分。
本发明与现有技术相比具有以下有益效果:
本发明实现在保证视频质量的前提下,有效地加快了视频的编码时间。
附图说明
图1是本发明方法流程图;
图2是本发明一实施例中用于内部预测的相邻参考CU示意图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
请参照图1,本发明提供一种面向VVC的快速帧内预测方法,包括以下步骤:
步骤S1:构建HAD代价预测模型,预测每种预测模式的HAD代价,按从小到大的排序,并选择前若干个HAD代价的模式初始化CU候选模式列表;
步骤S2:通过统计分析候选模式成为最佳模式的概率,优化CU候选模式列表;
步骤S3:基于贝叶斯定理,在每个CU深度级别执行CU划分的提前终止,进一步进行VVC的下一步编码流程,从而加快编码时间。
在本实施例中,采用全帧内配置来计算不同类型视频序列中CU的HAD代价,将相邻参考CU分为上侧CU(UCU),左侧CU(LCU)和同位CU(coCU),如图2所示。
在本实施例中,所述步骤S1具体为:
步骤S11:当前CU的HAD代价分布C(t)由相邻块代价分布来预测,估算模型为:
Figure BDA0002572883140000051
其中Cl(t)和Cu(t)分别是LCU和UCU的HAD代价,
Figure BDA0002572883140000052
是对应的权重,由coCU权重预测得到;
步骤S12:按从小到大的排序,并选择前10个预测模式来初始化候选列表,并加入平面模式、DC模式、水平模式和垂直模式一起进入粗粒度模式选择过程,将预测模式从35降低到14,降低了编码复杂度。
优选的,在VVC帧内预测中,有些块可能不存在相邻的块,这导致无法完全获得模型所需的参数,所以仅在LCU和UCU同时存在的情况下采用上述候选模式初始化方法,否则当前CU将由原始VVC编码器进行编码。
在本实施例中,所述步骤S2具体为:
步骤S21:在几种不同类型的序列中进行测试,统计不同CU尺寸的候选列表中每个候选模式被选为最佳模式的概率,通过统计结果,证明通过在列表中的前2模式即可以达到准确预测;
步骤S22:尝试若干种不同CU尺寸采用不同候选模式数量的组合,且这里的每个CU尺寸的候选模式数量为1-2,将它们与VVC编码器的原始候选模式方案进行比较,选择编码性能较好和计算复杂度较低的组合;
步骤S23:根据步骤S22得到的组合中列出的不同CU尺寸所需的候选模式数量进一步优化CU候选模式列表,从候选列表中选择所需的候选模式作为在连续模式决策过程中使用的最终候选模式。
在本实施例中,所述步骤S3具体为:
步骤S31:利用对数正态函数来拟合拆分和未拆分CU的RD代价概率密度分布曲线:
Figure BDA0002572883140000061
其中,r表示RD代价,fi(r)是i情况下RD代价的概率密度分布,i有s,n两种情况,其中s表示继续拆分CU,n表示终止CU划分;μ是均值,σ2是方差,可以通过最大似然估计来计算。
步骤S32:计算CU划分的错误概率Pe
Figure BDA0002572883140000062
其中,P(*)是s或n情况的先验概率,且P(s)+P(n)=1;Th是RD代价的阈值,用于确定是否需要拆分CU。
步骤S33:计算Pe最小时Th的值,在拆分CU的概率密度分布曲线和未拆分CU的概率密度分布曲线两条曲线相交的情况下Pe最小,并且相交值就是最优阈值Thopt;并设置CU划分的提前终止描述;因此CU划分的提前终止可以描述为:
Figure BDA0002572883140000063
其中,Hn表示终止CU划分的情况,Hs表示CU继续拆分,当RD代价r小于等于最优阈值Thopt就终止CU划分。
步骤S34:阈值Thopt的偏移,将Thopt重写为:
Figure BDA0002572883140000071
其中,Thmax是用于防止由阈值过大引起的错误判断的最大阈值,α是离线训练的偏移值,适应不同的量化参数和CU大小。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (6)

1.一种面向VVC的快速帧内预测方法,其特征在于,包括以下步骤:
步骤S1:构建HAD代价预测模型,预测每种预测模式的HAD代价,按从小到大的排序,并选择前若干个HAD代价的模式初始化CU候选模式列表;
步骤S2:通过统计分析候选模式成为最佳模式的概率,优化CU候选模式列表;
步骤S3:基于贝叶斯定理,在每个CU深度级别执行CU划分的提前终止,进一步进行VVC的下一步编码流程,从而加快编码时间;
所述步骤S3具体为:
步骤S31:利用对数正态函数来拟合拆分和未拆分CU的RD代价概率密度分布曲线:
Figure FDA0004137917170000011
其中,r表示RD代价,fi(r)是i情况下RD代价的概率密度分布,i有s,n两种情况,其中s表示继续拆分CU,n表示终止CU划分;μ是均值,σ2是方差;
步骤S32:计算CU划分的错误概率Pe
Figure FDA0004137917170000012
其中,P(*)是s或n情况的先验概率,且P(s)+P(n)=1;Th是RD代价的阈值,
步骤S33:计算Pe最小时Th的值,在拆分CU的概率密度分布曲线和未拆分CU的概率密度分布曲线两条曲线相交的情况下Pe最小,并且相交值就是最优阈值Thopt;并设置CU划分的提前终止描述;
步骤S34:阈值Thopt的偏移,将Thopt重写为:
Figure FDA0004137917170000021
其中,Thmax是用于防止由阈值过大引起的错误判断的最大阈值,α是离线训练的偏移值,适应不同的量化参数和CU大小。
2.根据权利要求1所述的一种面向VVC的快速帧内预测方法,其特征在于,所述步骤S1采用全帧内配置来计算不同类型视频序列中CU的HAD代价,将相邻参考CU分为上侧CU(UCU),左侧CU(LCU)和同位CU(coCU)。
3.根据权利要求2所述的一种面向VVC的快速帧内预测方法,其特征在于,所述步骤S1具体为:
步骤S11:当前CU的HAD代价分布C(t)由相邻块代价分布来预测,估算模型为:
Figure FDA0004137917170000022
其中Cl(t)和Cu(t)分别是LCU和UCU的HAD代价,
Figure FDA0004137917170000023
是对应的权重,由coCU权重预测得到;
步骤S12:按从小到大的排序,并选择前N个预测模式来初始化候选列表,并加入平面模式、DC模式、水平模式和垂直模式一起进入粗粒度模式选择过程,将预测模式从35降低到N+4。
4.根据权利要求3所述的一种面向VVC的快速帧内预测方法,其特征在于,所述在VVC帧内预测中仅在LCU和UCU同时存在的情况下采用步骤S1初始化方法,否则当前CU将由原始VVC编码器进行编码。
5.根据权利要求1所述的一种面向VVC的快速帧内预测方法,其特征在于,所述步骤S2具体为:
步骤S21:在几种不同类型的序列中进行测试,统计不同CU尺寸的候选列表中每个候选模式被选为最佳模式的概率,通过统计结果,证明通过在列表中的前2模式即达到准确预测;
步骤S22:尝试若干种不同CU尺寸采用不同候选模式数量的组合,且这里的每个CU尺寸的候选模式数量不超过2,将它们与VVC编码器的原始候选模式方案进行比较,选择编码性能较好和计算复杂度较低的组合;
步骤S23:根据步骤S22得到的组合中列出的不同CU尺寸所需的候选模式数量进一步优化CU候选模式列表,从候选列表中选择所需的候选模式作为在连续模式决策过程中使用的最终候选模式。
6.根据权利要求1所述的一种面向VVC的快速帧内预测方法,其特征在于,所述CU划分的提前终止描述为:
Figure FDA0004137917170000031
其中,Hn表示终止CU划分的情况,Hs表示CU继续拆分,当RD代价r小于等于最优阈值Thopt就终止CU划分。
CN202010645425.3A 2020-07-07 2020-07-07 一种面向vvc的快速帧内预测方法 Active CN111757129B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010645425.3A CN111757129B (zh) 2020-07-07 2020-07-07 一种面向vvc的快速帧内预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010645425.3A CN111757129B (zh) 2020-07-07 2020-07-07 一种面向vvc的快速帧内预测方法

Publications (2)

Publication Number Publication Date
CN111757129A CN111757129A (zh) 2020-10-09
CN111757129B true CN111757129B (zh) 2023-07-07

Family

ID=72679811

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010645425.3A Active CN111757129B (zh) 2020-07-07 2020-07-07 一种面向vvc的快速帧内预测方法

Country Status (1)

Country Link
CN (1) CN111757129B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106713935A (zh) * 2017-01-09 2017-05-24 杭州电子科技大学 一种基于贝叶斯决策的hevc块划分快速方法
CN108184115A (zh) * 2017-12-29 2018-06-19 华南理工大学 Hevc帧内cu划分和pu预测模式选择方法及系统
CN108881905A (zh) * 2018-08-04 2018-11-23 福州大学 基于概率的帧内编码器优化方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106713935A (zh) * 2017-01-09 2017-05-24 杭州电子科技大学 一种基于贝叶斯决策的hevc块划分快速方法
CN108184115A (zh) * 2017-12-29 2018-06-19 华南理工大学 Hevc帧内cu划分和pu预测模式选择方法及系统
CN108881905A (zh) * 2018-08-04 2018-11-23 福州大学 基于概率的帧内编码器优化方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
低复杂度的HEVC帧内编码模式决策算法;朱威等;《小型微型计算机系统》;20171215(第12期);全文 *

Also Published As

Publication number Publication date
CN111757129A (zh) 2020-10-09

Similar Documents

Publication Publication Date Title
CN111462261B (zh) 针对h.266/vvc的快速cu分区和帧内决策方法
CN108063944B (zh) 一种基于视觉显著性的感知码率控制方法
CN105120292A (zh) 一种基于图像纹理特征的视频编码帧内预测方法
CN103997645B (zh) 一种快速的hevc帧内编码单元和模式决策方法
CN111263145B (zh) 基于深度神经网络的多功能视频快速编码方法
CN103517069A (zh) 一种基于纹理分析的hevc帧内预测快速模式选择方法
CN104159117B (zh) 一种hevc视频的信息隐藏方法
US20150208094A1 (en) Apparatus and method for determining dct size based on transform depth
WO2022121787A1 (zh) 视频预测编码的方法及装置
CN111429497A (zh) 基于深度学习和多特征融合的自适应cu拆分决策方法
CN106534849A (zh) 一种快速的hevc帧间编码方法
CN116489386A (zh) 一种基于参考块的vvc帧间快速编码方法
CN103702131B (zh) 一种基于模式预处理的帧内编码优化方法和系统
CN112929657B (zh) 基于梯度与方差的h.266/vvc快速cu划分决策方法
CN111757129B (zh) 一种面向vvc的快速帧内预测方法
CN112601087B (zh) 一种针对h.266/vvc的快速cu分裂模式决策方法
CN110650342A (zh) 基于编码单元多特征分析的快速编码方法
CN104333755A (zh) HEVC中B帧的基于SKIP/Merge RD Cost的CU提前终止方法
CN108881905A (zh) 基于概率的帧内编码器优化方法
CN111107359A (zh) 一种适用于hevc标准的帧内预测编码单元划分方法
CN114257819A (zh) 基于时空深度信息的vcc编码单元快速划分方法
CN105812796A (zh) 一种scc帧间编码单元备选预测模式缩减方法
CN115941960A (zh) 基于轻量级神经网络的vvc帧间cu划分提前跳过方法
CN111212292B (zh) 基于h.266的自适应cu分区和跳过模式方法
Zhang et al. Fast CU partition decision based on texture for H. 266/VVC

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant