CN115695802A - 一种用于加快视频编码的编码单元划分方法及装置 - Google Patents
一种用于加快视频编码的编码单元划分方法及装置 Download PDFInfo
- Publication number
- CN115695802A CN115695802A CN202211303965.9A CN202211303965A CN115695802A CN 115695802 A CN115695802 A CN 115695802A CN 202211303965 A CN202211303965 A CN 202211303965A CN 115695802 A CN115695802 A CN 115695802A
- Authority
- CN
- China
- Prior art keywords
- division
- coding
- sub
- binary
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000005192 partition Methods 0.000 claims description 15
- 101100208381 Caenorhabditis elegans tth-1 gene Proteins 0.000 claims description 9
- 238000012706 support-vector machine Methods 0.000 claims description 9
- OIGNJSKKLXVSLS-VWUMJDOOSA-N prednisolone Chemical compound O=C1C=C[C@]2(C)[C@H]3[C@@H](O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 OIGNJSKKLXVSLS-VWUMJDOOSA-N 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 claims description 2
- 238000004891 communication Methods 0.000 claims description 2
- 230000003993 interaction Effects 0.000 claims description 2
- 238000000638 solvent extraction Methods 0.000 claims 5
- 238000004590 computer program Methods 0.000 claims 1
- 238000004364 calculation method Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012812 general test Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种用于加快视频编码的编码单元划分方法及装置。所述装置包括编码模块、存储模块、运算模块和逻辑控制模块。所述方法利用该装置,通过对编码图像的每个CTU,H.266/VVC使用四叉树、三叉树和二叉树等多类型树,从而递归地划分为不同大小的编码单元。在进行RDO过程前,为了减少编码复杂度,使用SVM模型对编码块的二叉、三叉划分方向进行预测并跳过划分,对于处于分类边界的样本,使用完整的RDO过程以提高编码效率。本发明所提出的方法能够在保证编码效率的情况下,有效降低编码时间复杂度。
Description
技术领域
本发明涉及视频编码技术领域,具体涉及一种用于加快视频编码的编码单元划分方法及装置。
背景技术
近年来,随着高清和超高清视频技术逐渐进入人们的视野,各式各样的视频应用不断涌现,视频应用的多样化和高清化趋势对视频编码性能提出了更高的要求。与现有的视频编码标准相比,H.266/VVC标准考虑了更多的视频格式和内容,具有更好的编码性能。与H.265/HEVC标准相比,同样编码质量下H.266/VVC平均可以节省50%左右的码率。H.266/VVC标准能变现出优秀的性能,原因是采用了一系列新技术,其中最有效但同时也最耗时的过程是具有嵌套多类型树(MTT)编码结构的四叉树。为了更加灵活高效地表示视频内容,H.266/VVC通过率失真优化(RDO),选择四叉树(QT)、三叉树(TT)和二叉树(BT)等多类型树中的一种,将CTU递归地划分为编码单元(CU)的方式。在RDO过程中,需要计算每种划分模式下的率失真代价,再根据率失真代价选择最优划分结果,因此虽然这种编码结构提高了编码的压缩性能,但由于遍历率失真优化过程,使得编码复杂度大大增加。如何在维持编码性能的同时减少编码的时间复杂度,成为视频压缩领域的一个研究方向。
发明内容
针对现有技术的不足,本发明提出了一种用于加快视频编码的编码单元划分方法及装置,对于指定大小的编码块,根据其纹理特征,利用支持向量机预测较优的划分方向,以减少RDO过程的计算次数,从而降低编码复杂度,节约编码时间。
一种用于加快视频编码的编码单元划分方法,具体包括以下步骤:
步骤一、在进行RDO过程前,首先根据编码块的大小,计算不同划分方式下子编码单元的特征值。具体地,对于32x32、32x16、16x32大小的编码块,计算二叉、三叉划分下子CU的特征值;对于8x16、16x8大小的编码块,计算二叉划分下子CU的特征值;对16x16大小的编码块,在RDO过程中跳过四叉划分;对其它大小的编码块,直接进行完整的RDO过程。
步骤二、根据步骤一得到的特征值,进行特征距离的计算,然后将特征距离作为样本,对应的编码块划分方式作为标签,建立训练数据集对支持向量机进行训练,获取支持向量机输出的垂直划分概率Pv和水平划分概率Ph。具体地,二叉划分下的特征距离△Fb为:
ΔFb=|Fbth_0-Fbth_1|-|Fbtv_0-Fbtv_1
其中,Fbth_0、Fbth_1表示二叉水平划分上方子CU、下方子CU特征值,Fbtb_0、Fbtv_1表示二叉垂直划分左方子CU、右方子CU特征值。
三叉划分下的特征距离△Ft为:
ΔFt=|Fthh_0-Ftth_1|+|Ftth_1-Ftth_2|-|Fttv_0-Fttv_1|-|Fttv_1-Fttv_2|
其中,Ftth_0、Ftth_1、Ftth_2分别表示三叉水平划分上方、中间和下方子CU特征值,Fttv_0、Fttv_1、Fttv_2分别表示三叉垂直划分左方、中间和右方子CU特征值。
步骤三、设置判断阈值T,计算垂直划分概率pv和水平划分概率Ph的差值,并与判断阈值T进行比较:
①当|Pv-Ph|≤T时,不跳过划分方式;
②当|Pv-Ph|>T,且Pv>Ph时,跳过水平划分方式;
③当|Pv-Ph|>T,且Pv<Ph时,跳过垂直划分方式。
步骤四、根据步骤三的判断结果,决定相应编码块在进行RDO过程需要跳过多类型树划分方式。
进一步的,步骤一中子CU的特征值包括方差、熵和纹理对比度。
方差Var的计算公式为:
熵E的计算公式为:
其中p(x)表示属于第x个灰度的可能性。
纹理对比度C的计算公式为:
其中δ(i,j)=|i-j|表示相邻像素之间的差异度,Pδ(i,j)表示度差为δ的像素的分布概率。
进一步的,根据输入样本的标签,支持向量机的输出包括Pbv和Pbh、Ptv和Pth,分别表示二叉划分下进行垂直划分和水平划分的概率,以及三叉划分下进行垂直划分和水平划分的概率。
进一步的,当Pbv-Pbh>T时,跳过二叉水平划分;当Pbh-Pbv>T时,跳过二叉垂直划分;当Ptv-Pth>T时,跳过三叉水平划分;当Pth-Ptv>T时,跳过三叉垂直划分。
一种用于加快视频编码的编码单元划分装置,包括编码模块、存储模块、运算模块和逻辑控制模块,模块间直接或间接地电性连接,以实现数据的传输或交互。
所述编码模块用于针对待编码图像生成对应的编码块。
所述存储模块用于存储待编码图像和预测编码块划分方向的SVM模型。
所述运算模块用于计算编码模块生成的编码块的特征值与特征距离,并输入SVM模型预测划分方式。
所述逻辑控制模块根据SVM模型的预测结果,决策当前编码块在RDO过程中可以跳过的划分模式。
本发明具有以下有益效果:
本发明通过预测CU划分的方向,可以减少嵌套四叉树结构的计算时间。实验结果表明,与VTM-15.0相比,本发明提出的方法在保证编码性能的条件下显著降低了时间复杂度。
附图说明
图1为实施例中用于加快视频编码的编码单元划分装置的结构示意图;
图2为实施例中用于加快视频编码的编码单元划分方法的流程图。
具体实施方式
以下结合附图对本发明作进一步的解释说明;
如图1所示,一种用于加快视频编码的编码单元划分装置,包括编码模块100、存储模块200、运算模块300和逻辑控制模块400,通过一条或多条通讯总线或信号线实现模块间电性连接。
所述编码模块100通过H.266/VVC原生编码器生成当前图像生成对应的编码块。
所述存储模块200用于存储待编码图像201、预测编码块划分方向的SVM模型202,以及运算模块输出的分类结果203。
所述运算模块300计算待编码图像201的特征值与特征距离,并输入SVM模型202预测划分方式,再将得到的结果存储在分类结果203中。
所述逻辑控制模块400根据分类结果203,决策当前编码块在RDO过程的划分方向。
实施例1
如图2所示,一种用于加快视频编码的编码单元划分方法,具体包括以下步骤:
步骤一、在进行RDO过程前,首先根据编码块的大小,计算不同划分方式下子编码单元的特征值。
s1.1、对于32x32、32x16、16x32大小的编码块,计算二叉、三叉划分下子CU的特征值,进入步骤二。
s1.2、对于8x16、16x8大小的编码块,计算二叉划分下子CU的特征值,进入步骤二。
s1.3、对16x16大小的编码块,在RDO过程中跳过四叉划分,不进行后续的预测过程。
s1.4、对于不属于s1.1~1.3所述大小的编码块,直接进行完整的RDO过程,不进行后续的预测过程。
所述特征值包括方差、熵和纹理对比度。方差Var的计算公式为:
熵E的计算公式为:
其中p(x)表示属于第x个灰度的可能性。
纹理对比度C的计算公式为:
其中δ(i,j)=|i-j|表示相邻像素之间的差异度,Pδ(i,j)表示度差为δ的像素的分布概率。
步骤二、根据步骤一得到的特征值,进行特征距离的计算,然后将特征距离作为样本,对应的编码块划分方式作为标签,建立训练数据集对支持向量机进行训练,获取支持向量机输出的二叉划分下进行垂直划分的概率Pbv、水平划分的概率Pbh,或三叉划分下进行垂直划分的概率Ptv、水平划分的概率Pth。具体地,二叉划分下的特征距离△Fb为:
ΔFb=|Fbth_0-Fbth_1|-|Fbtv_0-Fbtv_1
其中,Fbth_0、Fbth_1表示二叉水平划分上方子CU、下方子CU特征值,Fbtv_0、Fbtv_1表示二叉垂直划分左方子CU、右方子CU特征值。
三叉划分下的特征距离△Ft为:
ΔFt=|Fthh_0-Ftth_1|+|Ftth_1-Ftth_2|-|Fttv_0-Fttv_1|-|Fttv_1-Fttv_2|
其中,Ftth_0、Ftth_1、Ftth_2分别表示三叉水平划分上方、中间和下方子CU特征值,Fttv_0、Fttv_1、Ftt_2分别表示三叉垂直划分左方、中间和右方子CU特征值。
步骤三、设置判断阈值T=0.4,计算垂直划分概率和水平划分概率的差值,并与判断阈值T进行比较:
①垂直划分概率和水平划分概率的差值绝对值小于0.4时,对编码块进行垂直划分和水平划分的RDO过程;
②当Pbv-Pbh>T时,跳过二叉水平划分;
③当Pbh-Pbv>T时,跳过二叉垂直划分;
④当Ptv-Pth>T时,跳过三叉水平划分;
⑤当Pth-Ptv>T时,跳过三叉垂直划分。
步骤四、根据步骤三的判断结果,决定相应编码块在进行RDO过程中需要跳过的划分方式。
实施例2
本实施例在实施例1的基础上,将步骤三中的阈值T设置为0,即直接比较支持向量机输出的垂直划分和水平划分概率的大小,并跳过同一树型下概率较小的划分方向:
①当Pbv>Pbh时,跳过二叉水平划分;
②当Pbh>Pbv时,跳过二叉垂直划分;
③当Rtv>Pth时,跳过三叉水平划分;
④当Pth>Ptv时,跳过三叉垂直划分。
为了验证本方法的有效性,根据JVET通用测试条件设置实验测试序列和参数,分别使用本方法与VTM-15.0进行了对比实验,实验结果证明,本方法相较于VTM-15.0可以减少36.75%~51.03%的编码时间,而BDBR仅上升1.22%~1.65%。
以上实施例描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (8)
1.一种用于加快视频编码的编码单元划分方法,其特征在于:具体包括以下步骤:
步骤一、在进行RDO过程前,首先根据编码块的大小,计算不同划分方式下子编码单元的特征值;具体地,对于32x32、32x16、16x32大小的编码块,计算二叉、三叉划分下子CU的特征值;对于8x16、16x8大小的编码块,计算二叉划分下子CU的特征值;对16x16大小的编码块,在RDO过程中跳过四叉划分;对其它大小的编码块,直接进行完整的RDO过程;
步骤二、根据步骤一得到的特征值,进行特征距离的计算,然后将特征距离作为样本,对应的编码块划分方式作为标签,建立训练数据集对支持向量机进行训练,获取支持向量机输出的垂直划分概率Pυ和水平划分概率Ph;具体地,二叉划分下的特征距离ΔFb为:
ΔFb=|Fbth_0-Fbth_1|-|Fbtυ_0-Fbtυ_1
其中,Fbth_0、Fbth_1表示二叉水平划分上方子CU、下方子CU特征值,Fbtυ_0、Fbtυ_1表示二叉垂直划分左方子CU、右方子CU特征值;
三叉划分下的特征距离ΔFt为:
ΔFt=|Fthh_0-Ftth_1|+|Ftth_1-Ftth_2|-|Fttυ_0-Fttυ_1|-|Fttυ_1-Fttυ_2|
其中,Ftth_0、Ftth_1、Ftth_2分别表示三叉水平划分上方、中间和下方子CU特征值,Fttυ_0、Fttυ_1、Fttυ_2分别表示三叉垂直划分左方、中间和右方子CU特征值;
步骤三、设置判断阈值T,计算垂直划分概率Pυ和水平划分概率Ph的差值,并与判断阈值T进行比较:
①当|Pv-Ph|≤T时,不跳过划分方式;
②当|Pv-Ph|>T,且Pv>Ph时,跳过水平划分方式;
③当|Pv-Ph|>T,且Pv<Ph时,跳过垂直划分方式;
步骤四、根据步骤三的判断结果,决定相应编码块在进行RDO过程使用的多类型树划分方式。
3.如权利要求1所述一种用于加快视频编码的编码单元划分方法,其特征在于:根据输入样本的为二叉划分或三叉划分,支持向量机的输出包括Pbυ和Pbh或Ptυ和Pth,分别表示二叉划分下进行垂直划分和水平划分的概率,以及三叉划分下进行垂直划分和水平划分的概率。
4.如权利要求3所述一种用于加快视频编码的编码单元划分方法,其特征在于:当Pbυ-Pbh>T时,跳过二叉水平划分;当Pbh-Pbυ>T时,跳过二叉垂直划分;当Ptυ-Pth>T时,跳过三叉水平划分;当Pth-Ptυ>T时,跳过三叉垂直划分。
5.如权利要求1所述一种用于加快视频编码的编码单元划分方法,其特征在于:在步骤三中,设置阈值T=0.4或T=0。
6.一种用于加快视频编码的编码单元划分装置,其特征在于:用于实现如权利要求1~5任一所述的用于加快视频编码的编码单元划分方法,包括编码模块、存储模块、运算模块和逻辑控制模块,模块间直接或间接地电性连接,以实现数据的传输或交互;
所述编码模块用于针对待编码图像生成对应的编码块;
所述存储模块用于存储待编码图像和预测编码块划分方向的SVM模型;
所述运算模块用于计算编码模块生成的编码块的特征值与特征距离,并输入SVM模型预测划分方式;
所述逻辑控制模块根据SVM模型的预测结果,决策当前编码块在RDO过程中可以跳过的划分模式。
7.如权利要求6所述一种用于加快视频编码的编码单元划分装置,其特征在于:使用一条或多条通讯总线或信号线实现模块间电性连接。
8.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1~5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211303965.9A CN115695802A (zh) | 2022-10-24 | 2022-10-24 | 一种用于加快视频编码的编码单元划分方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211303965.9A CN115695802A (zh) | 2022-10-24 | 2022-10-24 | 一种用于加快视频编码的编码单元划分方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115695802A true CN115695802A (zh) | 2023-02-03 |
Family
ID=85099519
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211303965.9A Withdrawn CN115695802A (zh) | 2022-10-24 | 2022-10-24 | 一种用于加快视频编码的编码单元划分方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115695802A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115802044A (zh) * | 2023-02-06 | 2023-03-14 | 深流微智能科技(深圳)有限公司 | 编码块划分方式的确定及装置、设备及存储介质 |
CN117692663A (zh) * | 2024-01-31 | 2024-03-12 | 腾讯科技(深圳)有限公司 | 用于编码单元的二叉树划分处理方法、设备及存储介质 |
-
2022
- 2022-10-24 CN CN202211303965.9A patent/CN115695802A/zh not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115802044A (zh) * | 2023-02-06 | 2023-03-14 | 深流微智能科技(深圳)有限公司 | 编码块划分方式的确定及装置、设备及存储介质 |
CN115802044B (zh) * | 2023-02-06 | 2023-08-18 | 深流微智能科技(深圳)有限公司 | 编码块划分方式的确定及装置、设备及存储介质 |
CN117692663A (zh) * | 2024-01-31 | 2024-03-12 | 腾讯科技(深圳)有限公司 | 用于编码单元的二叉树划分处理方法、设备及存储介质 |
CN117692663B (zh) * | 2024-01-31 | 2024-05-24 | 腾讯科技(深圳)有限公司 | 用于编码单元的二叉树划分处理方法、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115695802A (zh) | 一种用于加快视频编码的编码单元划分方法及装置 | |
WO2020207162A1 (zh) | 帧内预测编码方法、装置、电子设备及计算机存储介质 | |
CN104780379A (zh) | 一种屏幕图像集合的压缩方法 | |
CN111263145B (zh) | 基于深度神经网络的多功能视频快速编码方法 | |
CN114286093A (zh) | 一种基于深度神经网络的快速视频编码方法 | |
CN104702955A (zh) | 屏幕视频的预测编码的方法与系统 | |
CN112291562B (zh) | 针对h.266/vvc的快速cu分区和帧内模式决策方法 | |
Zhang et al. | Fast CU decision-making algorithm based on DenseNet network for VVC | |
CN103402042A (zh) | 基于分块式误差扩散的半色调图像生成方法 | |
JP2002519956A (ja) | 逆量子化及びi走査中にブロック統計を採取する方法及び装置 | |
CN107690069B (zh) | 一种数据驱动的级联视频编码方法 | |
CN115941943A (zh) | 一种hevc视频编码方法 | |
Zhao et al. | ResNet-based fast CU partition decision algorithm for VVC | |
CN111741313B (zh) | 基于图像熵k均值聚类的3d-hevc快速cu分割方法 | |
CN110225339A (zh) | 一种hevc视频序列编解码加速方法 | |
CN111385585B (zh) | 一种基于机器学习的3d-hevc深度图编码单元划分方法 | |
CN109618169A (zh) | 用于hevc的帧内决策方法、装置和存储介质 | |
CN111259826B (zh) | 一种图像特征信息帧内快速划分方法、系统及存储介质 | |
CN111713105B (zh) | 一种视频图像处理方法、设备及存储介质 | |
CN106231340A (zh) | 一种基于hevc 的帧内预测解码方法及装置 | |
CN114449273B (zh) | 基于hevc增强型块划分搜索方法和装置 | |
Liu et al. | An Adaptive CU Split Method for VVC Intra Encoding | |
CN113709482B (zh) | 面向硬件的帧内编码模式中编码单元划分模式确定方法 | |
CN109618152A (zh) | 深度划分编码方法、装置和电子设备 | |
CN116634147B (zh) | 基于多尺度特征融合的hevc-scc帧内cu快速划分编码方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20230203 |
|
WW01 | Invention patent application withdrawn after publication |