CN112601087A - 一种针对h.266/vvc的快速cu分裂模式决策方法 - Google Patents

一种针对h.266/vvc的快速cu分裂模式决策方法 Download PDF

Info

Publication number
CN112601087A
CN112601087A CN202011320958.0A CN202011320958A CN112601087A CN 112601087 A CN112601087 A CN 112601087A CN 202011320958 A CN202011320958 A CN 202011320958A CN 112601087 A CN112601087 A CN 112601087A
Authority
CN
China
Prior art keywords
ctu
current
asm
current ctu
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011320958.0A
Other languages
English (en)
Other versions
CN112601087B (zh
Inventor
张秋闻
赵永博
蒋斌
赵进超
黄立勋
崔腾耀
郭睿骁
吴庆岗
魏涛
常化文
王晓
张伟伟
孟颍辉
李祖贺
黄伟
甘勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou University of Light Industry
Original Assignee
Zhengzhou University of Light Industry
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou University of Light Industry filed Critical Zhengzhou University of Light Industry
Priority to CN202011320958.0A priority Critical patent/CN112601087B/zh
Publication of CN112601087A publication Critical patent/CN112601087A/zh
Application granted granted Critical
Publication of CN112601087B publication Critical patent/CN112601087B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明提出了一种针对H.266/VVC的快速CU分裂模式决策方法,用于解决H.266/VVC编码的计算复杂度高的技术问题。其步骤为:首先,采用原始VTM算法对待编码的当前帧的第一个CTU进行编码,并统计编码过程中该CTU所有CU的ASM,进而得到第一个CTU的最小阈值和最大阈值;其次,在对后续的视频序列编码时,将当前CU的ASM值与最小阈值和最大阈值进行对比,从而判断当前CU是否继续分裂。最后通过纹理方向算法计算需要进行分裂的CU的纹理方向,根据纹理方向选择出最佳CU分裂模式。本发明通过GLCM和SAD的结合,能够在节省大量计算量的前提下,提前预测最佳CU分裂模式,降低了计算复杂度,节省了编码时间。

Description

一种针对H.266/VVC的快速CU分裂模式决策方法
技术领域
本发明涉及图像处理技术领域,特别是指一种针对H.266/VVC的快速CU分裂决策方法。
背景技术
近年来,诸如360度和高动态范围(HDR)之类的视频显示出巨大的需求潜力。当前广泛使用的高效视频编码(HEVC)是ITU-T VCEG在2013年制定的视频编码标准。但是,HEVC很难应对视频的更高压缩率(例如360度和高动态范围(HDR))的需求。为了解决这个问题,联合视频探索小组(JVET)在2018年定义了VVC和VVC测试模型1(VTM 1)编码方法的初稿。在随后的会议中逐渐添加了一系列具有更高压缩效率的编码工具。例如,MTT拆分结构用于编码树单元(CTU)分区过程。在HEVC中,一个CU分为四个子CU。MTT拆分结构不像HEVC这样仅可以使用四叉树(QT)拆分结构,VVC在编码过程中可以使用QT、BT和TT结构。这允许在VVC中将CU分为两个,三个或四个CU,编码器可以更灵活地拆分CU,以降低视频比特率。这种结构对提高编码率有很大的作用。另外,对于I切片,亮度和色度CU的编码树结构是不同的。为了提高当前CU的预测精度,VVC的定向帧内模式的数量已经增加到65,这远远超过HEVC的33。在帧内预测过程中,所有大小的亮度和色度CU均可使用这65种模式。
由于引入了这些新的编码工具,因此VVC的编码效率比HEVC大约高50%。但是,这些编码工具也给编码过程带来了巨大的复杂性。尤其是MTT结构的灵活性导致很高的编码计算复杂度。与HEVC不同,VVC需要在CU分区过程中预测CU深度并选择CU拆分模式,其中CU拆分模式包括垂直二进制拆分、水平二进制拆分、垂直三元拆分或水平三元拆分。因此,MTT结构带来的计算复杂性限制了VVC的使用。在过去几年中,出现了许多基于QT拆分结构的方法来加速帧内预测编码。但是这些策略很少降低VVC的复杂性。因此,开发一种能够加快VVC编码快速的算法是非常有实用意义的。
许多研究人员提出了一些有效的方法,可以加快帧内预测并降低编码复杂度。T.Fu和M.Jamali都研究了SATD和CU深度之间的关系,其中可以根据邻近CU的SATD的大小和当前CU的SATD的大小提前消除一些不良的候选模式。为了进一步加速帧内编码,H.S.Lee等人使用相邻CU的CU深度信息来加快帧内预测,这可以大大减少当前CU分区过程中的计算。而且,由于它仅考虑相邻CU之间的时间相关性,因此受到限制。几乎所有这些算法都对RMD进行了初步评估,然后,将具有较小SATD的CU拆分模式添加到MPM,最后,执行RD计算以选择最佳分割模式。L.Shen提出了一种快速的TU大小决策算法,该算法使用Bayes决策方法以及残差因子和变换大小之间的方差关系,可以减少HEVC中变换大小的候选数量。Q.Zhang提出了一种HEVC-SCC有效的帧内模式决策方法,该方法有效地利用了HE树块的纹理复杂度。该方法根据亮度值的变化程度来分析SC树块的纹理复杂度。将来可以使用此方法来降低VVC的编码复杂度。上述这些方法可以节省大量的编码时间。但是,由于VVC的CU拆分结构与HEVC显著不同,因此这些方法无法直接应用于VVC。此外,Q.Hu和H.Huang等人已经提出了许多基于CNN的快速帧内预测算法,这些算法大多数是基于形状的CNN训练方案,使用CNN训练来加快CU分区模式和CU深度的预测。但是,将在VTM的编码过程中分别生成长宽比为1/8、1/4、1/2、1、2、4或8的矩形。因此,在VVC编码过程中使用CNN将大大增加CNN的参数,并导致CNN的复杂性显着。换句话说,很难实现与HEVC使用CNN相同的效率。
最近,许多研究人员研究了MTT结构的特性,以提高VVC的编码复杂度。J.Chen设计了一种基于方差和梯度的快速方法来加快VVC的编码。该算法首先终止平滑区域的进一步划分。然后,根据由Sobel算子计算出的梯度特征进一步选择更好的QT分区。最后,通过比较子CU的方差,直接从五个可能的分区模式中选择分区。Q.Zhang设计了一种快速编码单元(CU)分区和帧内模式决策算法,该算法包括基于随机森林分类器(RFC)模型的快速CU分区和基于纹理区域特征的快速帧内预测模式优化。S.De-Luxán-Hernández介绍了内部子分区(ISP)算法的用法,ISP将帧内预测块细分为2个或4个子分区(最多16个样本),然后分别对每个分区进行编码。该方法可以提高帧内预测的编码率,但是增加了计算复杂度。Q.Zhang提出了一种基于改进的有向无环图支持向量机(DAG-SVM)模型的快速CU分区决策算法,设计了一种快速CU分区决策算法,该方法提出了减少编码复杂度的新思路。K.Fan提出了一种新的基于Karhunen-Loève变换(KLT)的可分离变换算法,该方法解决了传统KLT的缺点。M.Lei提出了基于前瞻性预测的CU大小修剪算法,以减少冗余的MTT分区,该方法通过提前识别不必要的划分方向来加快帧内预测模式决策过程。尽管这些方法可以加快VVC的帧内预测过程,但MTT结构与纹理特征之间的相关性并未得到很好的利用。因此,仍有很大的潜力来进一步降低VVC编码的复杂性。
发明内容
针对H.266/VVC编码的计算复杂度高的技术问题,本发明提出了一种针对H.266/VVC的快速CU分裂决策方法,通过改进的灰度共生矩阵纹理复杂度方法GLCM和改进的纹理方向计算方法SAD的结合,能够在节省大量计算量的前提下,提前预测最佳CU分裂模式,降低了计算复杂度,节省了编码时间。
本发明的技术方案是这样实现的:
一种针对H.266/VVC的快速CU分区决策方法,其步骤如下:
S1、采用原始VTM算法对待编码的当前帧的第一个编码树单元(CTU)进行编码,计算第一个CTU中的每个CU的纹理复杂度能量值(ASM),统计编码过程中产生的所有CU的ASM,将所有未停止分裂的CU中最小的ASM作为阈值LowerLimit,将所有停止分裂的CU中最大的ASM作为阈值HigherLimit;
S2、将当前帧的下一个CTU作为当前CTU,对当前CTU进行编码时,根据当前CTU上方的CTU和CTU左侧的CTU采用自适应迭代算法计算当前CTU的阈值LowerLimit0和HigherLimit0
S3、将当前CTU的每个CU的ASM分别与阈值LowerLimit0和HigherLimit0进行对比,若当前CTU的CU的ASM小于阈值LowerLimit0,则当前CTU的CU停止分裂,跳至下一个CTU,返回步骤S2;若当前CTU的CU的ASM大于HigherLimit0,则执行步骤S5继续分裂,若当前CTU的CU的ASM大于LowerLimit0且小于HigherLimit0,执行步骤S4;
S4、使用原始VTM算法判断当前CTU的CU是否进行分裂,若是,执行步骤S5,否则,当前CTU的CU停止分裂,跳至下一个CTU,返回步骤S2;
S5、使用纹理方向算法计算当前CTU的CU的纹理方向斜率ThSAD,将ThSAD与纹理方向阈值0.25和4作对比;若ThSAD小于0.25,则当前CTU的CU的纹理方向是横向,执行步骤S6,若ThSAD大于4,则当前CTU的CU的纹理方向是纵向,执行步骤S7,若ThSAD位于0.25和4之间,对当前CTU的CU进行四叉树分裂模式进行分裂,跳至下一个CTU,返回步骤S2;
S6、对当前CTU的CU分别进行横向二叉树、横向三叉树分裂模式进行分裂,并对比横向二叉树、横向三叉树分裂后的率失真值,将最小的率失真值对应的分裂模式作为当前CTU的CU的分裂模式,跳至下一个CTU,返回步骤S2;
S7、对当前CTU的CU分别进行纵向二叉树、纵向三叉树分裂模式进行分裂,并对比纵向二叉树、纵向三叉树分裂后的率失真值,将最小的率失真值对应的分裂模式作为当前CU的分裂模式,跳至下一个CTU,返回步骤S2。
所述纹理复杂度能量值的计算方法为:
S11、首先将CU中图像的像素灰度值按一定比例压缩,压缩后的位置(i,j)处的像素灰度值为gij,其中,(i,j)为CU中像素位置,i表示横坐标,j表示纵坐标;
S12、利用像素相等性判别公式计算相同像素的数量,其中,0度、45度和90度像素相等性判别公式分别:
Figure BDA0002792892060000041
Figure BDA0002792892060000042
Figure BDA0002792892060000043
其中,M是压缩后的CU的长度,N是压缩后的CU的宽度,Rij表示距离为δ的两个像素值相等的数量;
S13、统计压缩后的CU内所有相等像素的数量,组成灰度共生矩阵Pδ
Figure BDA0002792892060000044
Figure BDA0002792892060000045
Figure BDA0002792892060000046
Figure BDA0002792892060000047
其中,δ是相比较的两个像素点的距离;
S14、统计0度、45度和90度的灰度共生矩阵的和,并将其归一化得到压缩后的CU的纹理复杂度能量值ASMδ
Figure BDA0002792892060000048
其中,Asm表示当前正在编码CU的纹理复杂度能量值。
所述根据当前CTU上方的CTU和CTU左侧的CTU采用自适应迭代算法计算当前CTU的阈值LowerLimit0和HigherLimit0的方法为:
Figure BDA0002792892060000049
Figure BDA00027928920600000410
其中,Hc,c是当前CTU的阈值HigherLimit0,Lc,c是当前CTU的阈值LowerLimit0,Hc-1,c′是当前CTU左侧的已经编码完成CTU的自校正后的阈值Hc-1,c,Lc-1,c′是当前CTU左侧的CTU的自校正后的阈值Lc-1,c,Hc,c-1′是当前CTU上方的CTU的自校正后的阈值Hc,c-1,Lc,c-1′是当前CTU上方的CTU的自校正后的阈值Lc,c-1
Figure BDA0002792892060000051
Figure BDA0002792892060000052
Figure BDA0002792892060000053
Figure BDA0002792892060000054
其中,Pc-1,c,1为当前CTU上方的CTU中编码后的CU的ASM大于Hc-1,c的概率,Pc-1,c,2为当前CTU上方的CTU中编码后的CU的ASM小于Lc-1,c的概率,Pc-2,c,1为当前CTU上方的CTU的上方的CTU中编码后的CU的ASM大于Hc-2,c的概率,Pc-2,c,2为当前CTU上方的CTU的上方的CTU中编码后的CU的ASM小于Lc-2,c的概率,Pc-1,c-1,1为当前CTU上方的CTU的左侧的CTU中编码后的CU的ASM大于Hc-1,c-1的概率,Pc-1,c-1,2为当前CTU上方的CTU的左侧的CTU中编码后的CU的ASM小于Lc-1,c-1的概率,Hc-1,c为当前CTU上方的CTU的高阈值,Lc-1,c为当前CTU上方的CTU的低阈值,Hc-2,c为当前CTU上方的CTU的上方CTU的高阈值,Lc-2,c为当前CTU上方的CTU的上方CTU的低阈值,Hc-1,c-1为当前CTU上方的CTU的左侧CTU的高阈值,Lc-1,c-1为当前CTU上方的CTU的左侧CTU的低阈值;Pc,c-1,1为当前CTU左侧的CTU中编码后的CU的ASM大于Hc,c-1的概率,Pc,c-1,2为当前CTU左侧的CTU中编码后的CU的ASM小于Lc,c-1的概率,Pc,c-2,1为当前CTU左侧的CTU的左侧CTU中编码后的CU的ASM大于Hc,c-2的概率,Pc,c-2,2为当前CTU左侧的CTU的左侧CTU中编码后的CU的ASM小于Lc,c-2的概率,Pc-1,c-1,1为当前CTU左侧的CTU的上方CTU中编码后的CU的ASM大于Hc-1,c-1的概率,Pc-1,c-1,2为当前CTU左侧的CTU的上方CTU中编码后的CU的ASM小于Lc-1,c-1的概率,Hc,c-1为当前CTU左侧的CTU的高阈值,Lc,c-1为当前CTU左侧的CTU的低阈值,Hc,c-2为当前CTU左侧的CTU的左侧CTU的高阈值,Lc,c-2为当前CTU左侧的CTU的左侧CTU的低阈值。
所述使用纹理方向算法计算当前CTU的CU的纹理方向斜率ThSAD的方法为:
S31、计算CU中每一行像素点的均值
Figure BDA0002792892060000055
和每一列的像素点均值
Figure BDA0002792892060000056
计算方式如下:
Figure BDA0002792892060000061
Figure BDA0002792892060000062
其中,Y(x,y)为位置(x,y)处的像素值,M1为CU的长度,N1为CU的宽度;
S32、分别计算CU的横向纹理复杂度和纵向纹理复杂度:
Figure BDA0002792892060000063
Figure BDA0002792892060000064
其中,SADhor为CU的横向纹理复杂度,SADver为CU的纵向纹理复杂度;
S33、根据CU的横向和纵向纹理复杂度计算CU纹理方向的斜率ThSAD
Figure BDA0002792892060000065
其中,
Figure BDA0002792892060000066
表示CU的自适应因子。
本技术方案能产生的有益效果:本发明首先通过改进的灰度共生矩阵纹理复杂度方法GLCM计算正在编码的CTU中每个CU的纹理复杂度ASM;利用当前CTU上方和左侧已经编码CTU的深度预测阈值HigherLimit和LowerLimit来计算当前CTU的自适应阈值;其次,将每个CU的ASM与当前CTU的自适应阈值相比较,直接判断该CU是否需要继续分裂。若ASM小于LowerLimit则停止分裂,开始对下一个CU处理;若ASM大于HigherLimit则继续分裂;若ASM位于LowerLimit和HigherLimit之间,则使用原始的VTM算法判断CU是否需要继续分裂;然后,当该CU被判定为需要被继续分裂,计算该CU的横向纹理复杂度和纵向纹理复杂度SAD,计算纹理复杂度斜率与纹理方向阈值进行比较;若大于横向纹理阈值则可判定该CU的纹理方向是横向,此时可直接判定CU的分裂模式是横向二叉树分裂或横向三叉树分裂;若小于纵向纹理阈值则可判定该CU的纹理方向是纵向,此时可直接判定CU的分裂模式是纵向二叉树分裂或纵向三叉树分裂;因此,降低了计算复杂度,节省了编码时间。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的流程图;
图2为本发明的自适应变量LowerLimit和HigherLimit的向右迭代示意图;
图3为本发明的自适应变量LowerLimit和HigherLimit的向下迭代示意图;
图4为本发明方法与PV-CNN、FQPD-VG和RFCTRF方法的编码时间的节省情况对比结果;
图5为本发明方法与PV-CNN、FQPD-VG和RFCTRF方法的BDBR的增加情况对比结果。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种针对H.266/VVC的快速CU分区决策方法,具体步骤如下:
S1、采用原始VTM算法对待编码的当前帧的第一个编码树单元(CTU)进行编码,VTM会将CTU划分为4个大的CU,再对每个CU进行分裂。在这个过程中,计算第一个CTU中的每个CU的纹理复杂度能量值(ASM),统计编码过程中产生的所有CU的ASM,将所有未停止分裂的CU中最小的ASM作为阈值LowerLimit,将所有停止分裂的CU中最大的ASM作为阈值HigherLimit。
所述纹理复杂度能量值的计算方法为:
S11、首先将CU中图像的像素灰度值按一定比例压缩,压缩后的位置(i,j)处的像素灰度值为gij,其中,(i,j)为CU中像素位置,i表示横坐标,j表示纵坐标;比如:CU中图像的像素灰度值是0-255,将图像中的灰度值按一定比例压缩,例如按照1/5进行压缩,压缩后的像素灰度值为0-51。
S12、利用像素相等性判别公式计算相同像素的数量,其中,0度、45度和90度像素相等性判别公式分别为:
Figure BDA0002792892060000071
Figure BDA0002792892060000081
Figure BDA0002792892060000082
其中,M是压缩后的CU的长度,N是压缩后的CU的宽度,Rij表示距离为δ的两个像素值相等的数量;若距离为δ的两个像素值相等则Rij等于1,若不相等则Rij等于0。
S13、统计压缩后的CU内所有相等像素的数量,组成灰度共生矩阵Pδ
Figure BDA0002792892060000083
Figure BDA0002792892060000084
Figure BDA0002792892060000085
Figure BDA0002792892060000086
其中,δ是相比较的两个像素点的距离;一般可将δ设置为1-3,因为一个CU的最小边长为4,超出最小边长时,Pδ的计算值无效。
S14、统计0度、45度和90度的灰度共生矩阵的和,并将其归一化得到压缩后的CU的纹理复杂度能量值ASMδ
Figure BDA0002792892060000087
其中,Asm表示当前正在编码CU的纹理复杂度能量值,ASM越大表示CU的纹理复杂度越高。Rij表示0、45度和90度方向上相同像素的数量。
S2、将当前帧的下一个CTU作为当前CTU,对当前CTU进行编码时,根据当前CTU上方的CTU和CTU左侧的CTU采用自适应迭代算法计算当前CTU的阈值LowerLimit0和HigherLimit0;对当前帧第一个CTU之后的每个CTU编码时,均使用当前CTU的上方的CTU和左侧的CTU使用自适应迭代算法计算LowerLimit和HigherLimit。若其中一个被参考的CTU不存在,则只使用另一个单个CTU进行计算。然后,将当前CTU的每个CU的ASM与LowerLimit和HigherLimit对比;如图1中显示,若ASM小于LowerLimit,则当前CU停止分裂;若ASM大于HigherLimit则继续分裂,若ASM大于LowerLimit且小于HigherLimit则使用原始VTM算法进行判断。如图2和图3所示,具体方法为:
所述根据当前CTU上方的CTU和CTU左侧的CTU采用自适应迭代算法计算当前CTU的阈值LowerLimit0和HigherLimit0的方法为:
Figure BDA0002792892060000091
Figure BDA0002792892060000092
其中,Hc,c是当前CTU的阈值HigherLimit0,Lc,c是当前CTU的阈值LowerLimit0,Hc-1,c′是当前CTU左侧的已经编码完成CTU的自校正后的阈值Hc-1,c,Lc-1,c′是当前CTU左侧的CTU的自校正后的阈值Lc-1,c,Hc,c-1′是当前CTU上方的CTU的自校正后的阈值Hc,c-1,Lc,c-1′是当前CTU上方的CTU的自校正后的阈值Lc,c-1
Figure BDA0002792892060000093
Figure BDA0002792892060000094
Figure BDA0002792892060000095
Figure BDA0002792892060000096
其中,Pc-1,c,1为当前CTU上方的CTU中编码后的CU的ASM大于Hc-1,c的概率,Pc-1,c,2为当前CTU上方的CTU中编码后的CU的ASM小于Lc-1,c的概率,Pc-2,c,1为当前CTU上方的CTU的上方的CTU中编码后的CU的ASM大于Hc-2,c的概率,Pc-2,c,2为当前CTU上方的CTU的上方的CTU中编码后的CU的ASM小于Lc-2,c的概率,Pc-1,c-1,1为当前CTU上方的CTU的左侧的CTU中编码后的CU的ASM大于Hc-1,c-1的概率,Pc-1,c-1,2为当前CTU上方的CTU的左侧的CTU中编码后的CU的ASM小于Lc-1,c-1的概率,Hc-1,c为当前CTU上方的CTU的高阈值,Lc-1,c为当前CTU上方的CTU的低阈值,Hc-2,c为当前CTU上方的CTU的上方CTU的高阈值,Lc-2,c为当前CTU上方的CTU的上方CTU的低阈值,Hc-1,c-1为当前CTU上方的CTU的左侧CTU的高阈值,Lc-1,c-1为当前CTU上方的CTU的左侧CTU的低阈值;Pc,c-1,1为当前CTU左侧的CTU中编码后的CU的ASM大于Hc,c-1的概率,Pc,c-1,2为当前CTU左侧的CTU中编码后的CU的ASM小于Lc,c-1的概率,Pc,c-2,1为当前CTU左侧的CTU的左侧CTU中编码后的CU的ASM大于Hc,c-2的概率,Pc,c-2,2为当前CTU左侧的CTU的左侧CTU中编码后的CU的ASM小于Lc,c-2的概率,Pc-1,c-1,1为当前CTU左侧的CTU的上方CTU中编码后的CU的ASM大于Hc-1,c-1的概率,Pc-1,c-1,2为当前CTU左侧的CTU的上方CTU中编码后的CU的ASM小于Lc-1,c-1的概率,Hc,c-1为当前CTU左侧的CTU的高阈值,Lc,c-1为当前CTU左侧的CTU的低阈值,Hc,c-2为当前CTU左侧的CTU的左侧CTU的高阈值,Lc,c-2为当前CTU左侧的CTU的左侧CTU的低阈值。
S3、将当前CTU的每个CU的ASM分别与阈值LowerLimit0和HigherLimit0进行对比,若当前CTU的CU的ASM小于阈值LowerLimit0,则当前CTU的CU停止分裂,跳至下一个CTU,返回步骤S2;若当前CTU的CU的ASM大于HigherLimit0,则执行步骤S5继续分裂,若当前CTU的CU的ASM大于LowerLimit0且小于HigherLimit0,执行步骤S4;
所述使用纹理方向算法计算当前CTU的CU的纹理方向斜率ThSAD的方法为:
S31、计算CU中每一行像素点的均值
Figure BDA0002792892060000101
和每一列的像素点均值
Figure BDA0002792892060000102
计算方式如下:
Figure BDA0002792892060000103
Figure BDA0002792892060000104
其中,Y(x,y)为位置(x,y)处的像素值,M1为CU的长度,N1为CU的宽度;
S32、分别计算CU的横向纹理复杂度和纵向纹理复杂度:
Figure BDA0002792892060000105
Figure BDA0002792892060000106
其中,SADhor为CU的横向纹理复杂度,SADver为CU的纵向纹理复杂度;
S33、根据CU的横向和纵向纹理复杂度计算CU纹理方向的斜率ThSAD
Figure BDA0002792892060000107
其中,
Figure BDA0002792892060000108
表示CU的自适应因子。
S4、使用原始VTM算法判断当前CTU的CU是否进行分裂,若是,执行步骤S5,否则,当前CTU的CU停止分裂,跳至下一个CTU,返回步骤S2;
S5、使用纹理方向算法计算当前CTU的CU的纹理方向斜率ThSAD,将ThSAD与纹理方向阈值0.25和4作对比;若ThSAD小于0.25,则当前CTU的CU的纹理方向是横向,执行步骤S6,若ThSAD大于4,则当前CTU的CU的纹理方向是纵向,执行步骤S7,若ThSAD位于0.25和4之间,对当前CTU的CU进行四叉树分裂模式进行分裂,跳至下一个CTU,返回步骤S2;
S6、对当前CTU的CU分别进行横向二叉树、横向三叉树分裂模式进行分裂,并对比横向二叉树、横向三叉树分裂后的率失真值,将最小的率失真值对应的分裂模式作为当前CTU的CU的分裂模式,跳至下一个CTU,返回步骤S2;
S7、对当前CTU的CU分别进行纵向二叉树、纵向三叉树分裂模式进行分裂,并对比纵向二叉树、纵向三叉树分裂后的率失真值,将最小的率失真值对应的分裂模式作为当前CU的分裂模式,跳至下一个CTU,返回步骤S2。
为了评估本发明的方法,在H.266/VVC编码器(VTM7.0)上进行了仿真测试。BDBR反映了本发明的压缩性能,节省的时间(△T)体现了复杂性的降低。表1给出了本发明的编码性能,本发明可以节省48.58%编码运行时间,平均BDBR增量为0.91%。因此,本发明可以有效地节省编码时间,并且RD性能的损失可以忽略不计。
表1本发明的编码性能
Figure BDA0002792892060000111
从表1可以看出本发明与VTM相比RD性能和节省的编码运行时间。本发明可以有效地增加时间节省,并且具有良好的RD性能。与VTM相比,本发明方法可以减少48.58%的编码时间,同时BDBR可以忽略不计。对于不同的视频序列,实验结果会有小的波动,但是本发明提出的方法是有效的。
将本发明方法与最新的H.266/VVC快速方法相比较,这些算法包括PV-CNN、FQPD-VG、和RFCTRF方法。图4和图5分别给出了节省编码时间和BDBR的编码结果,由图4和图5可知,本发明方法可以节省时间并具有良好的RD性能,与CTDM、FIVG、FBDA和PDFD方法相比,本发明提出的方法在控制BDBR恶化方面具有更高的性能,本发明提出的方法与PV-CNN方法相比,本发明提出的方法节省了15.18%的编码节省时间,可将BDBR降低0.08%。与FQPD-VG和RFCTRF方法相比,本发明提出的方法虽然在节约编码时间减少2.63-7.82%,同比减少4.86-16.1%,但提出的方法将BDBR降低0.03-0.32%,同比降低8.79-26.02%。
仿真结果表明,本发明提出的方法对各种视频有效,在性能评估上优于最新快速方法。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种针对H.266/VVC的快速CU分区决策方法,其特征在于,其步骤如下:
S1、采用原始VTM算法对待编码的当前帧的第一个编码树单元(CTU)进行编码,计算第一个CTU中的每个CU的纹理复杂度能量值(ASM),统计编码过程中产生的所有CU的ASM,将所有未停止分裂的CU中最小的ASM作为阈值LowerLimit,将所有停止分裂的CU中最大的ASM作为阈值HigherLimit;
S2、将当前帧的下一个CTU作为当前CTU,对当前CTU进行编码时,根据当前CTU上方的CTU和CTU左侧的CTU采用自适应迭代算法计算当前CTU的阈值LowerLimit0和HigherLimit0
S3、将当前CTU的每个CU的ASM分别与阈值LowerLimit0和HigherLimit0进行对比,若当前CTU的CU的ASM小于阈值LowerLimit0,则当前CTU的CU停止分裂,跳至下一个CTU,返回步骤S2;若当前CTU的CU的ASM大于HigherLimit0,则执行步骤S5继续分裂,若当前CTU的CU的ASM大于LowerLimit0且小于HigherLimit0,执行步骤S4;
S4、使用原始VTM算法判断当前CTU的CU是否进行分裂,若是,执行步骤S5,否则,当前CTU的CU停止分裂,跳至下一个CTU,返回步骤S2;
S5、使用纹理方向算法计算当前CTU的CU的纹理方向斜率ThSAD,将ThSAD与纹理方向阈值0.25和4作对比;若ThSAD小于0.25,则当前CTU的CU的纹理方向是横向,执行步骤S6,若ThSAD大于4,则当前CTU的CU的纹理方向是纵向,执行步骤S7,若ThSAD位于0.25和4之间,对当前CTU的CU进行四叉树分裂模式进行分裂,跳至下一个CTU,返回步骤S2;
S6、对当前CTU的CU分别进行横向二叉树、横向三叉树分裂模式进行分裂,并对比横向二叉树、横向三叉树分裂后的率失真值,将最小的率失真值对应的分裂模式作为当前CTU的CU的分裂模式,跳至下一个CTU,返回步骤S2;
S7、对当前CTU的CU分别进行纵向二叉树、纵向三叉树分裂模式进行分裂,并对比纵向二叉树、纵向三叉树分裂后的率失真值,将最小的率失真值对应的分裂模式作为当前CU的分裂模式,跳至下一个CTU,返回步骤S2。
2.根据权利要求1所述的针对CTU编码过程中计算CU纹理复杂度能量值的方法,其特征在于,所述纹理复杂度能量值的计算方法为:
S11、首先将CU中图像的像素灰度值按一定比例压缩,压缩后的位置(i,j)处的像素灰度值为gij,其中,(i,j)为CU中像素位置,i表示横坐标,j表示纵坐标;
S12、利用像素相等性判别公式计算相同像素的数量,其中,0度、45度和90度像素相等性判别公式分别:
Figure FDA0002792892050000021
Figure FDA0002792892050000022
Figure FDA0002792892050000023
其中,M是压缩后的CU的长度,N是压缩后的CU的宽度,Rij表示距离为δ的两个像素值相等的数量;
S13、统计压缩后的CU内所有相等像素的数量,组成灰度共生矩阵Pδ
Figure FDA0002792892050000024
Figure FDA0002792892050000025
Figure FDA0002792892050000026
Figure FDA0002792892050000027
其中,δ是相比较的两个像素点的距离;
S14、统计0度、45度和90度的灰度共生矩阵的和,并将其归一化得到压缩后的CU的纹理复杂度能量值ASMδ
Figure FDA0002792892050000028
其中,Asm表示当前正在编码CU的纹理复杂度能量值。
3.根据权利要求1所述的针对H.266/VVC的快速CU分区决策方法,其特征在于,所述根据当前CTU上方的CTU和CTU左侧的CTU采用自适应迭代算法计算当前CTU的阈值LowerLimit0和HigherLimit0的方法为:
Figure FDA0002792892050000029
Figure FDA00027928920500000210
其中,Hc,c是当前CTU的阈值HigherLimit0,Lc,c是当前CTU的阈值LowerLimit0,Hc-1,c′是当前CTU左侧的已经编码完成CTU的自校正后的阈值Hc-1,c,Lc-1,c′是当前CTU左侧的CTU的自校正后的阈值Lc-1,c,Hc,c-1′是当前CTU上方的CTU的自校正后的阈值Hc,c-1,Lc,c-1′是当前CTU上方的CTU的自校正后的阈值Lc,c-1
Figure FDA0002792892050000031
Figure FDA0002792892050000032
Figure FDA0002792892050000033
Figure FDA0002792892050000034
其中,Pc-1,c,1为当前CTU上方的CTU中编码后的CU的ASM大于Hc-1,c的概率,Pc-1,c,2为当前CTU上方的CTU中编码后的CU的ASM小于Lc-1,c的概率,Pc-2,c,1为当前CTU上方的CTU的上方的CTU中编码后的CU的ASM大于Hc-2,c的概率,Pc-2,c,2为当前CTU上方的CTU的上方的CTU中编码后的CU的ASM小于Lc-2,c的概率,Pc-1,c-1,1为当前CTU上方的CTU的左侧的CTU中编码后的CU的ASM大于Hc-1,c-1的概率,Pc-1,c-1,2为当前CTU上方的CTU的左侧的CTU中编码后的CU的ASM小于Lc-1,c-1的概率,Hc-1,c为当前CTU上方的CTU的高阈值,Lc-1,c为当前CTU上方的CTU的低阈值,Hc-2,c为当前CTU上方的CTU的上方CTU的高阈值,Lc-2,c为当前CTU上方的CTU的上方CTU的低阈值,Hc-1,c-1为当前CTU上方的CTU的左侧CTU的高阈值,Lc-1,c-1为当前CTU上方的CTU的左侧CTU的低阈值;Pc,c-1,1为当前CTU左侧的CTU中编码后的CU的ASM大于Hc,c-1的概率,Pc,c-1,2为当前CTU左侧的CTU中编码后的CU的ASM小于Lc,c-1的概率,Pc,c-2,1为当前CTU左侧的CTU的左侧CTU中编码后的CU的ASM大于Hc,c-2的概率,Pc,c-2,2为当前CTU左侧的CTU的左侧CTU中编码后的CU的ASM小于Lc,c-2的概率,Pc-1,c-1,1为当前CTU左侧的CTU的上方CTU中编码后的CU的ASM大于Hc-1,c-1的概率,Pc-1,c-1,2为当前CTU左侧的CTU的上方CTU中编码后的CU的ASM小于Lc-1,c-1的概率,Hc,c-1为当前CTU左侧的CTU的高阈值,Lc,c-1为当前CTU左侧的CTU的低阈值,Hc,c-2为当前CTU左侧的CTU的左侧CTU的高阈值,Lc,c-2为当前CTU左侧的CTU的左侧CTU的低阈值。
4.根据权利要求1或2所述的针对H.266/VVC的快速CU分裂模式决策方法,其特征在于,所述使用纹理方向算法计算当前CTU的CU的纹理方向斜率ThSAD的方法为:
S31、计算CU中每一行像素点的均值
Figure FDA0002792892050000035
和每一列的像素点均值
Figure FDA0002792892050000036
计算方式如下:
Figure FDA0002792892050000041
Figure FDA0002792892050000042
其中,Y(x,y)为位置(x,y)处的像素值,M1为CU的长度,N1为CU的宽度;
S32、分别计算CU的横向纹理复杂度和纵向纹理复杂度:
Figure FDA0002792892050000043
Figure FDA0002792892050000044
其中,SADhor为CU的横向纹理复杂度,SADver为CU的纵向纹理复杂度;
S33、根据CU的横向和纵向纹理复杂度计算CU纹理方向的斜率ThSAD
Figure FDA0002792892050000045
其中,
Figure FDA0002792892050000046
表示CU的自适应因子。
CN202011320958.0A 2020-11-23 2020-11-23 一种针对h.266/vvc的快速cu分裂模式决策方法 Active CN112601087B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011320958.0A CN112601087B (zh) 2020-11-23 2020-11-23 一种针对h.266/vvc的快速cu分裂模式决策方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011320958.0A CN112601087B (zh) 2020-11-23 2020-11-23 一种针对h.266/vvc的快速cu分裂模式决策方法

Publications (2)

Publication Number Publication Date
CN112601087A true CN112601087A (zh) 2021-04-02
CN112601087B CN112601087B (zh) 2022-10-18

Family

ID=75183827

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011320958.0A Active CN112601087B (zh) 2020-11-23 2020-11-23 一种针对h.266/vvc的快速cu分裂模式决策方法

Country Status (1)

Country Link
CN (1) CN112601087B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113613018A (zh) * 2021-08-18 2021-11-05 广州佰锐网络科技有限公司 Scc帧内编码单元候选预测模式缩减方法及系统
CN116600107A (zh) * 2023-07-20 2023-08-15 华侨大学 基于ipms-cnn和空域相邻cu编码模式的hevc-scc快速编码方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108184115A (zh) * 2017-12-29 2018-06-19 华南理工大学 Hevc帧内cu划分和pu预测模式选择方法及系统
WO2019047763A1 (en) * 2017-09-08 2019-03-14 Mediatek Inc. METHODS AND APPARATUSES FOR PROCESSING IMAGES IN AN IMAGE OR VIDEO ENCODING SYSTEM
EP3499891A1 (en) * 2017-12-14 2019-06-19 Thomson Licensing Texture-based partitioning decisions for video compression
WO2019118536A1 (en) * 2017-12-14 2019-06-20 Interdigital Vc Holdings, Inc. Texture-based partitioning decisions for video compression
CN111429497A (zh) * 2020-03-20 2020-07-17 郑州轻工业大学 基于深度学习和多特征融合的自适应cu拆分决策方法
CN111462261A (zh) * 2020-04-06 2020-07-28 郑州轻工业大学 针对h.266/vvc的快速cu分区和帧内决策方法
CN111654698A (zh) * 2020-06-12 2020-09-11 郑州轻工业大学 一种针对h.266/vvc的快速cu分区决策方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019047763A1 (en) * 2017-09-08 2019-03-14 Mediatek Inc. METHODS AND APPARATUSES FOR PROCESSING IMAGES IN AN IMAGE OR VIDEO ENCODING SYSTEM
EP3499891A1 (en) * 2017-12-14 2019-06-19 Thomson Licensing Texture-based partitioning decisions for video compression
WO2019118536A1 (en) * 2017-12-14 2019-06-20 Interdigital Vc Holdings, Inc. Texture-based partitioning decisions for video compression
CN108184115A (zh) * 2017-12-29 2018-06-19 华南理工大学 Hevc帧内cu划分和pu预测模式选择方法及系统
CN111429497A (zh) * 2020-03-20 2020-07-17 郑州轻工业大学 基于深度学习和多特征融合的自适应cu拆分决策方法
CN111462261A (zh) * 2020-04-06 2020-07-28 郑州轻工业大学 针对h.266/vvc的快速cu分区和帧内决策方法
CN111654698A (zh) * 2020-06-12 2020-09-11 郑州轻工业大学 一种针对h.266/vvc的快速cu分区决策方法

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
QIUWEN ZHANG 等: "Fast CU Partition Decision Method Based on Texture Characteristics for H.266VVC", 《IEEE》 *
QIUWEN ZHANG 等: "Fast_CU_Partition_and_Intra_Mode_Decision_Method_for_H.266_VVC", 《IEEE》 *
任妍等: "结合随机森林的FVC帧内编码单元快速划分", 《中国图象图形学报》 *
司丽娜等: "一种提前终止CU划分和模式选择的HEVC快速算法", 《科技通报》 *
张大禹: "高效视频编码帧内预测算法", 《电子技术与软件工程》 *
林亿: "一种HEVC帧内预测的快速模式选择算法设计", 《电子世界》 *
谢红 等: "纹理图的3D-HEVC深度图编码单元快速划分算法", 《应用科技》 *
雷海军 等: "一种快速HEVC编码单元决策算法", 《计算机工程》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113613018A (zh) * 2021-08-18 2021-11-05 广州佰锐网络科技有限公司 Scc帧内编码单元候选预测模式缩减方法及系统
CN116600107A (zh) * 2023-07-20 2023-08-15 华侨大学 基于ipms-cnn和空域相邻cu编码模式的hevc-scc快速编码方法及装置
CN116600107B (zh) * 2023-07-20 2023-11-21 华侨大学 基于ipms-cnn和空域相邻cu编码模式的hevc-scc快速编码方法及装置

Also Published As

Publication number Publication date
CN112601087B (zh) 2022-10-18

Similar Documents

Publication Publication Date Title
CN110691254B (zh) 一种多功能视频编码的快速判决方法、系统及存储介质
CN111147867B (zh) 一种多功能视频编码cu划分快速决策方法及存储介质
CN110087087B (zh) Vvc帧间编码单元预测模式提前决策及块划分提前终止方法
CN112601087B (zh) 一种针对h.266/vvc的快速cu分裂模式决策方法
CN109302610B (zh) 一种基于率失真代价的屏幕内容编码帧间快速编码方法
CN111462261B (zh) 针对h.266/vvc的快速cu分区和帧内决策方法
CN103517069A (zh) 一种基于纹理分析的hevc帧内预测快速模式选择方法
US20150208094A1 (en) Apparatus and method for determining dct size based on transform depth
CN110446052B (zh) 一种3d-hevc帧内深度图快速cu深度选择方法
CN114222145A (zh) 一种低复杂度的快速vvc帧内编码方法
CN111246219B (zh) 一种vvc帧内cu深度快速划分方法
US10356403B2 (en) Hierarchial video code block merging using depth-dependent threshold for block merger
CN106534849A (zh) 一种快速的hevc帧间编码方法
CN112929657B (zh) 基于梯度与方差的h.266/vvc快速cu划分决策方法
CN109151467A (zh) 基于图像块活动性的屏幕内容编码帧间模式快速选择方法
CN110708546B (zh) 多功能视频编码的帧内模式选择划分方法、系统及存储介质
Li et al. Efficient search and mode prediction algorithms for motion estimation in H. 264/AVC
EP2153659A1 (en) Post processing of motion vectors using sad for low bit rate video compression
CN111246218B (zh) 基于jnd模型的cu分割预测和模式决策纹理编码方法
CN114257819A (zh) 基于时空深度信息的vcc编码单元快速划分方法
Chen et al. A fast cu partition decision strategy for avs3 intra coding
Wang et al. Fast CU Partition Method Based on Extra Trees for VVC Intra Coding
CN111212292A (zh) 基于h.266的自适应cu分区和跳过模式方法
Zhang et al. Fast CU partition decision based on texture for H. 266/VVC
KR20080022843A (ko) 움직임 벡터를 이용한 탐색 영역 조절 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant