CN110139106A - 一种视频编码单元分割方法及其系统、装置、存储介质 - Google Patents

一种视频编码单元分割方法及其系统、装置、存储介质 Download PDF

Info

Publication number
CN110139106A
CN110139106A CN201910271123.1A CN201910271123A CN110139106A CN 110139106 A CN110139106 A CN 110139106A CN 201910271123 A CN201910271123 A CN 201910271123A CN 110139106 A CN110139106 A CN 110139106A
Authority
CN
China
Prior art keywords
layer
depth
optimal
suboptimum
video encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910271123.1A
Other languages
English (en)
Other versions
CN110139106B (zh
Inventor
张昊
李明娟
牟凡
马学睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN201910271123.1A priority Critical patent/CN110139106B/zh
Publication of CN110139106A publication Critical patent/CN110139106A/zh
Application granted granted Critical
Publication of CN110139106B publication Critical patent/CN110139106B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/533Motion estimation using multistep search, e.g. 2D-log search or one-at-a-time search [OTS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria

Abstract

本发明公开了一种视频编码单元分割方法及其系统、装置、存储介质,通过模式设定模块选取MERGE模式为第一次选层的默认模式,选择模块选取率失真代价最小的最优层,并在与最优层相邻的两层里以率失真代价为基准选取其中一层作为次优层,深度设定模块将最优层和次优层的深度设置为深度范围的两个端值后最终分割模块对视频编码单元进行分割,无须遍历当前视频编码单元所有的划分模式,从而有效降低编码器的计算复杂度,减少编码时间,提高编码效率。另外,通过设置阈值,判断运动估计过程中产生的绝对误差和与阈值的关系,根据不同的情况进行不同的像素搜索方式,有利于降低时间复杂度,进一步提高编码效率。

Description

一种视频编码单元分割方法及其系统、装置、存储介质
技术领域
本发明涉及视频编码技术领域,尤其是一种视频编码单元分割方法及其系统、装置、存储介质。
背景技术
HEVC是视频编码标准发展历程中非常具有革命性的一代,它由MPEG和VCEG组织于2012年成立的视频联合协作小组(JCT-VC)所研发。HEVC在性能上相较于H.264更加优秀,它在同等视频质量下其压缩率可达到H.264的2倍。与H.264相比起来HEVC采用了例如图像可划分为互不重叠的树形视频编码单元CTU,一个CTU又能被划分为若干个视频编码单元CU,这种方法被称为基于四叉树的循环分层结构;而CU又可作为PU树和TU树的根节点;TU突破了原有的变换尺寸限制,可支持大小为4×4~32×32的编码变换;解码循环中的样点自适应补偿技术,在去方块滤波之后对重建样本进行滤波,以此改善解码序列的主观质量和压缩效率等。但同时这些新型编码结构和编码工具大幅度提高了编码器的计算复杂度,不利于该视频编码标准的产业化推广,编码器在编码时需要遍历当前CU所有的PU划分模式,即8种划分模式,通过率失真优化(RDO)找到具有最小率失真代价的一个,以此来判定当前CU是否需要划分为PU以及如何划分。这意味着率失真模型(RDO)需要评估CTU的所有视频编码单元CU,每一个视频编码单元CU的预测单元PU和变换单元TU,此外,在进行帧间预测时,每一种预测单元划分模式都需要进行运动估计,因此现有的这种编码方式所需的工作量是巨大的,编码效率时间长、效率低。
发明内容
为解决上述问题,本发明的目的在于提供一种视频编码单元分割方法及其系统、装置、存储介质,能够有效提高编码效率。
本发明解决其问题所采用的技术方案是:
第一方面,本发明实施例提出了一种视频编码单元分割方法,包括:
选取MERGE模式作为第一次选层的默认模式;
选取率失真代价最小的一层作为最优层,获取最优层对应的深度;
在与最优层相邻的两层中,以率失真代价为基准选取其中一层作为次优层,获取次优层对应的深度;
以最优层和次优层的深度作为深度范围的两个端值对视频编码单元进行分割,并设置阈值,统计已编码块运动估计过程像素精度,将运动估计过程中产生的绝对误差和与阈值进行比较;若所述绝对误差和小于所述阈值,则分割时终止分像素搜索,否则分割时同时进行整像素搜索与分像素搜索。
进一步,所述以率失真代价为基准选取其中一层作为次优层,包括:比较最优层的率失真代价与其相邻的两层的率失真代价的差值,选取差值小的一层作为次优层,或者直接比较与最优层相邻的两层的率失真代价,选取率失真代价小的作为次优层。
进一步,选取最优层后,判断最优层的深度,若最优层的深度为1或者2,在与最优层相邻的两层中,以率失真代价为基准选取其中一层作为次优层;若最优层的深度为0,则直接将深度范围设置为0到1;若最优层的深度为3,则直接将深度范围设置为2到3。
进一步,若次优层是较深的一层,则将较深的一层的深度作为深度范围的最大值,最优层的深度作为深度范围的最小值;否则将较浅的一层的深度作为深度范围的最小值,最优层的深度作为深度范围的最大值。
进一步,所述阈值包括第一阈值和第二阈值,若所述绝对误差和小于所述第一阈值,则分割时终止1/2像素搜索,否则同时进行整像素搜索和1/2像素搜索;在进行1/2像素搜索时,将运动估计过程中产生的哈达码变换后的绝对误差和与第二阈值进行比较;若所述哈达码变换后的绝对误差和小于所述第二阈值,则分割时终止1/4像素搜索,否则分割时同时进行整像素搜索、1/2像素搜索和1/4像素搜索。
进一步,采用2N*2N模式以最优层和次优层的深度作为深度范围的两个端值对视频编码单元进行分割。
第二方面,本发明实施例还提出了一种视频编码单元分割系统,包括:
模式设定模块,用于选取MERGE模式作为第一次选层的默认模式;
选择模块,用于选取率失真代价最小的一层作为最优层,以及在与最优层相邻的两层中,以率失真代价为基准选取其中一层作为次优层;
深度设定模块,用于获取最优层和次优层对应的深度,以及设定分割的深度范围;
分割模块,用于对视频编码单元进行分割,在分割时先设置阈值,统计已编码块运动估计过程像素精度,将运动估计过程中产生的绝对误差和与阈值进行比较;若所述绝对误差和小于所述阈值,则分割时终止分像素搜索,否则分割时同时进行整像素搜索与分像素搜索。
进一步,所述选择模块比较最优层的率失真代价与其相邻的两层的率失真代价的差值,选取差值小的一层作为次优层,或者直接比较与最优层相邻的两层的率失真代价,选取率失真代价小的作为次优层。
进一步,所述深度设定模块包括判断单元,所述判断单元用于判断最优层的深度,若最优层的深度为1或者2,在与最优层相邻的两层中,以率失真代价为基准选取其中一层作为次优层;若最优层的深度为0,则直接将深度范围设置为0到1;若最优层的深度为3,则直接将深度范围设置为2到3。
进一步,若次优层是较深的一层,则所述深度设定模块将较深的一层的深度作为深度范围的最大值,将最优层的深度作为深度范围的最小值;否则所述深度设定模块将较浅的一层的深度作为深度范围的最小值,将最优层的深度作为深度范围的最大值。
进一步,所述分割单元在分割时,所述阈值包括第一阈值和第二阈值,若所述绝对误差和小于所述第一阈值,则分割时终止1/2像素搜索,否则同时进行整像素搜索和1/2像素搜索;在进行1/2像素搜索时,将运动估计过程中产生的哈达码变换后的绝对误差和与第二阈值进行比较;若所述哈达码变换后的绝对误差和小于所述第二阈值,则分割时终止1/4像素搜索,否则分割时同时进行整像素搜索、1/2像素搜索和1/4像素搜索。
进一步,所述分割模块采用2N*2N模式以最优层和次优层的深度作为深度范围的两个端值对视频编码单元进行分割。
第三方面,本发明实施例还提出了一种视频编码单元分割装置,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明第一方面所述的方法。
第四方面,本发明实施例还提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行本发明第一方面所述的方法。
本发明实施例中提供的一个或多个技术方案,至少具有如下有益效果:本发明实施例提供的一种视频编码单元分割方法,通过以MERGE模式为第一次选层的默认模式,选取率失真代价最小的最优层,并在与最优层相邻的两层里以率失真代价为基准选取其中一层作为次优层,最终以最优层和次优层的深度作为深度范围的两个端值对视频编码单元进行分割,无须遍历当前视频编码单元所有的划分模式,从而有效降低编码器的计算复杂度,减少编码时间,提高编码效率。另外,通过设置阈值,判断运动估计过程中产生的绝对误差和与阈值的关系,根据不同的情况进行不同的像素搜索方式,有利于降低时间复杂度,进一步提高编码效率。
本发明实施例提供的一种视频编码单元分割系统,通过模式设定模块选取MERGE模式为第一次选层的默认模式,选择模块选取率失真代价最小的最优层,并在与最优层相邻的两层里以率失真代价为基准选取其中一层作为次优层,深度设定模块将最优层和次优层的深度设置为深度范围的两个端值后最终分割模块对视频编码单元进行分割,无须遍历当前视频编码单元所有的划分模式,从而有效降低编码器的计算复杂度,减少编码时间,提高编码效率。另外,通过设置阈值,判断运动估计过程中产生的绝对误差和与阈值的关系,根据不同的情况进行不同的像素搜索方式,有利于降低时间复杂度,进一步提高编码效率。
附图说明
下面结合附图和实例对本发明作进一步说明。
图1是本发明一种视频编码单元分割方法的一个实施例的示意图;
图2是本发明一种视频编码单元分割方法的另一个实施例的示意图;
图3是本发明一种视频编码单元分割系统的示意图;
图4是本发明一种视频编码单元分割装置的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
需要说明的是,如果不冲突,本发明实施例中的各个特征可以相互结合,均在本发明的保护范围之内。另外,虽然在系统示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于系统中的模块划分,或流程图中的顺序执行所示出或描述的步骤。
HEVC是视频编码标准发展历程中非常具有革命性的一代,它由MPEG和VCEG组织于2012年成立的视频联合协作小组(JCT-VC)所研发。HEVC在性能上相较于H.264更加优秀,它在同等视频质量下其压缩率可达到H.264的2倍。与H.264相比起来HEVC采用了例如图像可划分为互不重叠的树形视频编码单元CTU,一个CTU又能被划分为若干个视频编码单元CU,这种方法被称为基于四叉树的循环分层结构;而CU又可作为PU树和TU树的根节点;TU突破了原有的变换尺寸限制,可支持大小为4×4~32×32的编码变换;解码循环中的样点自适应补偿技术,在去方块滤波之后对重建样本进行滤波,以此改善解码序列的主观质量和压缩效率等。但同时这些新型编码结构和编码工具大幅度提高了编码器的计算复杂度,不利于该视频编码标准的产业化推广。
预测单元PU规定了视频编码单元的所有预测模式,一切与预测有关的信息都定义在预测单元部分。比如,帧内预测的方向、帧间预测的分割方式、运动矢量预测,以及帧间预测参考图像索引号都属于预测单元的范畴。对于图像的帧内预测,预测单元PU的尺寸与所属的视频编码单元CU相同,只有当视频编码单元CU在最低层即0层时,才能被划分为N*N的预测单元PU。因此,PU尺寸范围为4×4到64×64。对于图像的帧间预测,预测单元的分割模式有8种,4种对称模式(2N×2N、2N×N、N×2N、N×N)和4种非对称模式(2N×nU、2N×nD、nL×2N、nR×2N),其中2N×nU和2N×nD分别以上下1:3、3:1的比率划分,nL×2N和nR×2N分别以左右1:3、3:1的比率划分。SKIP模式是MERGE模式的一种,MERGE模式只需要对运动参数集索引进行编码,而SKIP模式除此之外,也不需要对残差信息进行编码。从预测单元PU中得到的预测残差经过适当的变换,使图像能量在空间域的分散分布转为在变换域的集中分布,以达到去除空间冗余的目的。
变换单元TU是独立完成变换和量化的基本单元,其尺寸也是灵活变化的。它的大小依赖于CU模式,在一个CU内,允许TU跨越多个PU,以四叉树的形式递归划分。对于一个2N×2N的CU,有一个标志位决定其是否划分为4个N×N的TU。根据预测残差的局部变化特性,TU可以自适应地选择最优的模式。大块的TU模式能够将能量更好地集中,小块的TU模式能够保存更多的图像细节。这种灵活的分割结构,可以使变换后的残差能量得到充分压缩,以进一步提高编码增益。
编码器在编码时需要遍历当前CU所有的PU划分模式,即8种划分模式,通过率失真优化(RDO)找到具有最小率失真代价的一个,以此来判定当前CU是否需要划分为PU以及如何划分。这意味着率失真模型(RDO)需要评估CTU的所有视频编码单元CU,每一个视频编码单元CU的预测单元PU和变换单元TU,此外,在进行帧间预测时,每一种预测单元划分模式都需要进行运动估计,最终,为了达到最佳的编码性能所需的工作量是巨大的,最后获得最佳划分模式也是相当耗时的。而随着速度的提升,在正常配置的HEVC中MERGE作为一种极简单的模式所占时间比极少,因此基于MERGE模式时间占比少的特点,本发明提供了一种视频编码单元分割方法及其系统、装置、存储介质,通过以MERGE模式为第一次选层的默认模式,选取率失真代价最小的最优层,并在与最优层相邻的两层里以率失真代价为基准选取其中一层作为次优层,最终以最优层和次优层的深度作为深度范围的两个端值对视频编码单元进行分割,无须遍历当前视频编码单元所有的划分模式,从而有效降低编码器的计算复杂度,减少编码时间,提高编码效率。
下面结合附图,对本发明实施例作进一步阐述。
参照图1,本发明的第一实施例提供了一种视频编码单元分割方法,包括但不限于以下步骤:
S100:选取MERGE模式作为第一次选层的默认模式;
S200:选取率失真代价最小的一层作为最优层,获取最优层对应的深度;
S300:在与最优层相邻的两层中,以率失真代价为基准选取其中一层作为次优层,获取次优层对应的深度;
S400:以最优层和次优层的深度作为深度范围的两个端值对视频编码单元进行分割,并设置阈值,统计已编码块运动估计过程像素精度,将运动估计过程中产生的绝对误差和与阈值进行比较;若所述绝对误差和小于所述阈值,则分割时终止分像素搜索,否则分割时同时进行整像素搜索与分像素搜索;
在本实施例中,通过以MERGE模式为第一次选层的默认模式,选取率失真代价最小的最优层,并在与最优层相邻的两层里以率失真代价为基准选取其中一层作为次优层,最终以最优层和次优层的深度作为深度范围的两个端值对视频编码单元进行分割,无须遍历当前视频编码单元所有的划分模式,从而有效降低编码器的计算复杂度,减少编码时间,提高编码效率。另外,通过设置阈值,判断运动估计过程中产生的绝对误差和与阈值的关系,根据不同的情况进行不同的像素搜索方式,有利于降低时间复杂度,进一步提高编码效率。
进一步地,基于第一实施例,本发明的第二实施例还提供了一种视频编码单元分割方法,其中,选取最优层后,判断最优层的深度,若最优层的深度为1或者2,在与最优层相邻的两层中,以率失真代价为基准选取其中一层作为次优层;若最优层的深度为0,则直接将深度范围设置为0到1;若最优层的深度为3,则直接将深度范围设置为2到3。
一般来说单个视频编码单元具有0、1、2、3四层,可见,最优层为1层和2层时,均有两个相邻层,因此可以将两个相邻层的率失真代价与最优层的率失真代价的差值进行比较,从而确定次优层;当最优层为0层时,只有一个相邻层,因此直接将第1层设置为次优层,即深度范围的最大值设置为1,此时深度范围为0到1;当最优层为3层时,同样只有一个相邻层,因此直接将第2层设置为次优层,即深度范围的最小值设置为2,此时深度范围为2到3。
进一步地,基于第一实施例,本发明的第三实施例还提供了一种视频编码单元分割方法,其中,若次优层是较深的一层,则将较深的一层的深度作为深度范围的最大值,最优层的深度作为深度范围的最小值;否则将较浅的一层的深度作为深度范围的最小值,最优层的深度作为深度范围的最大值。
在本实施例中,假设最优层是1层,那么当与最优层的率失真代价相差最小的一层是较浅的一层时,即0层,此时的深度范围为0到1;而当与最优层的率失真代价相差最小的一层是较深的一层,即2层,此时的深度范围为1到2。
进一步地,基于第一实施例,本发明的第四实施例还提供了一种视频编码单元分割方法,其中,所述以率失真代价为基准选取其中一层作为次优层,包括:比较最优层的率失真代价与其相邻的两层的率失真代价的差值,选取差值小的一层作为次优层,或者直接比较与最优层相邻的两层的率失真代价,选取率失真代价小的作为次优层。
进一步地,基于第一实施例,本发明的第五实施例还提供了一种视频编码单元分割方法,其中,所述阈值包括第一阈值和第二阈值,若所述绝对误差和小于所述第一阈值,则分割时终止1/2像素搜索,否则同时进行整像素搜索和1/2像素搜索;在进行1/2像素搜索时,将运动估计过程中产生的哈达码变换后的绝对误差和与第二阈值进行比较;若所述哈达码变换后的绝对误差和小于所述第二阈值,则分割时终止1/4像素搜索,否则分割时同时进行整像素搜索、1/2像素搜索和1/4像素搜索。
一般来说,分割时会同时进行整像素搜索和分像素搜索,因此时间复杂度较高。在本实施例中,第一阈值为0.6×时间及空间已视频编码单元块执行整像素运动估计时的sad的均值,第二阈值为0.6×时间及空间已视频编码单元块执行1/2像素运动估计时的satd的均值,在进行整像素搜索时,会产生一个sad,若此sad小于第一阈值,则终止1/2像素搜索,否则同时进行1/2像素搜索;在进行1/2像素搜索时,会产生一个satd,若此satd小于第二阈值,则终止1/4像素搜索,否则同时进行1/4像素搜索。通过引入第二阈值,对分像素搜索的进一步细化,根据不同情况进行1/2像素搜索与1/4像素搜索,可以进一步降低时间复杂度。其中,sad为绝对误差和,satd为哈达码变换后的绝对误差和。在其他实施例中,也可以仅设置第一阈值,仅判断是否进行1/2像素搜索,但是时间复杂度会变高。
另外,参照图2,本发明的第六实施例还提供了一种视频编码单元分割方法,包括但不限于以下步骤:
S510:选取MERGE模式作为第一次选层的默认模式,遍历后选取率失真代价最小的一层作为最优层,获取最优层对应的深度;
S520:判断最优层的深度,若最优层的深度为1或者2,跳转S530;否则跳转S550;
S530:分别取与最优层相邻的两层的率失真代价与最优层的率失真代价作比较,得到较浅的一层的率失真代价与最优层的率失真代价的差值lower_cur,以及较深的一层的率失真代价与最优层的率失真代价的差值deeper_cur,跳转S540;
S540:判断lower_cur与deeper_cur的大小,若deeper_cur小于lower_cur,则将较深的一层作为次优层,并将其深度作为深度范围的最大值,将最优层的深度作为深度范围的最小值,跳转S560;否则将较浅的一层作为次优层,并将其深度作为深度范围的最小值,将最优层的深度作为深度范围的最大值,跳转S560;
S550:判断最优层的深度,若最优层的深度为0,则直接将深度范围设置为0到1,跳转S560;若最优层的深度为3,则直接将深度范围设置为2到3,跳转S560;
S560:在深度范围内对视频编码单元进行2N*2N模式的分割;
在S540中,假如deeper_cur=lower_cur,选择较浅的一层作为次优层,而不选择较深的一层作为次优层,是因为较浅的一层包含的子块数量少,编码时复杂程度低。
在S560中,分割时设置像素精度阈值,所述阈值包括第一阈值和第二阈值,若所述绝对误差和小于所述第一阈值,则分割时终止1/2像素搜索,否则同时进行整像素搜索和1/2像素搜索;在进行1/2像素搜索时,将运动估计过程中产生的哈达码变换后的绝对误差和与第二阈值进行比较;若所述哈达码变换后的绝对误差和小于所述第二阈值,则分割时终止1/4像素搜索,否则分割时同时进行整像素搜索、1/2像素搜索和1/4像素搜索。
在本实施例中,是通过比较最优层的率失真代价与其相邻的两层的率失真代价的差值,选取差值小的一层作为次优层;在其他实施例中,也可以直接比较与最优层相邻的两层的率失真代价,选取率失真代价小的作为次优层。
为了验证本发明实施例的视频编码单元分割方法的性能好坏,采用BDBR(Bjotegaard Delta Bit rate)以及ΔT两个指标来进行评估。其中,BDBR是用来评估视频编码单元分割方法对视频质量的影响,BDBR越大说明视频编码单元分割方法对视频质量的影响越大,即视频编码单元分割方法的性能越差,其主要是通过设置四组不同的量化参数QP以获取四组不同Bits以及PSNR来进行计算。ΔT则是反映当前视频编码单元分割方法对编码器效率的提升,其计算公式如下所示:
其中,Torg代表使用不增加任何视频编码单元分割方法的原始编码器编码所使用的时间,Tnew代表增加本发明的视频编码单元分割方法后编码所需时间,ΔT则代表增加本发明的视频编码单元分割方法后编码器在效率上提升的百分比。
以上方法的实验基于开源参考软件在Visual Studio 2013软件实现,本次实验的测试序列为Fourpeople、Johnny和KvistenArdSora,由下表的实验结果可以看出,与普通编码器原始的编码方法相比较,在增加了本发明视频编码单元分割方法以后,有效地减少编码时间,提高编码效率。
在本实施例中,通过以MERGE模式为第一次选层的默认模式,选取率失真代价最小的最优层,并在与最优层相邻的两层里以率失真代价为基准选取其中一层作为次优层,最终以最优层和次优层的深度作为深度范围的两个端值对视频编码单元进行分割,无须遍历当前视频编码单元所有的划分模式,从而有效降低编码器的计算复杂度,减少编码时间,提高编码效率。另外,通过设置阈值,判断运动估计过程中产生的绝对误差和与阈值的关系,根据不同的情况进行不同的像素搜索方式,有利于降低时间复杂度,进一步提高编码效率。
此外,参照图3,本发明的第七实施例还提供了一种视频编码单元分割系统,包括:
模式设定模块,用于选取MERGE模式作为第一次选层的默认模式;
选择模块,用于选取率失真代价最小的一层作为最优层,以及在与最优层相邻的两层中,以率失真代价为基准选取其中一层作为次优层;
深度设定模块,用于获取最优层和次优层对应的深度,以及设定分割的深度范围;
分割模块,用于对视频编码单元进行分割,在分割时先设置阈值,统计已编码块运动估计过程像素精度,将运动估计过程中产生的绝对误差和与阈值进行比较;若所述绝对误差和小于所述阈值,则分割时终止分像素搜索,否则分割时同时进行整像素搜索与分像素搜索。
本实施例中的视频编码单元分割系统可以执行第一至第五方法实施例中的任一方法。所述选择模块比较最优层的率失真代价与其相邻的两层的率失真代价的差值,选取差值小的一层作为次优层,或者直接比较与最优层相邻的两层的率失真代价,选取率失真代价小的作为次优层。
所述深度设定模块包括判断单元,所述判断单元用于判断最优层的深度,若最优层的深度为1或者2,在与最优层相邻的两层中,以率失真代价为基准选取其中一层作为次优层;若最优层的深度为0,则直接将深度范围设置为0到1;若最优层的深度为3,则直接将深度范围设置为2到3。
若次优层是较深的一层,则所述深度设定模块将较深的一层的深度作为深度范围的最大值,将最优层的深度作为深度范围的最小值;否则所述深度设定模块将较浅的一层的深度作为深度范围的最小值,将最优层的深度作为深度范围的最大值。
所述分割模块采用2N*2N模式以最优层和次优层的深度作为深度范围的两个端值对视频编码单元进行分割。
所述分割单元在分割时,所述阈值包括第一阈值和第二阈值,若所述绝对误差和小于所述第一阈值,则分割时终止1/2像素搜索,否则同时进行整像素搜索和1/2像素搜索;在进行1/2像素搜索时,将运动估计过程中产生的哈达码变换后的绝对误差和与第二阈值进行比较;若所述哈达码变换后的绝对误差和小于所述第二阈值,则分割时终止1/4像素搜索,否则分割时同时进行整像素搜索、1/2像素搜索和1/4像素搜索。
在本实施例中,通过模式设定模块选取MERGE模式为第一次选层的默认模式,选择模块选取率失真代价最小的最优层,并在与最优层相邻的两层里以率失真代价为基准选取其中一层作为次优层,深度设定模块将最优层和次优层的深度设置为深度范围的两个端值后最终分割模块对视频编码单元进行分割,无须遍历当前视频编码单元所有的划分模式,从而有效降低编码器的计算复杂度,减少编码时间,提高编码效率。另外,通过设置阈值,判断运动估计过程中产生的绝对误差和与阈值的关系,根据不同的情况进行不同的像素搜索方式,有利于降低时间复杂度,进一步提高编码效率。
参照图4,本发明的第八实施例还提供了一种视频编码单元分割装置,包括:
至少一个处理器;
以及与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上述第一至第六实施例中任意一种视频编码单元分割方法。
该装置可以是任意类型的智能终端,例如手机、平板电脑、个人计算机等。
处理器和存储器可以通过总线或者其他方式连接,图4中以通过总线连接为例。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态性计算机可执行程序以及模块,如本发明实施例中的视频编码单元分割方法对应的程序指令/模块。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行视频编码单元分割装置的各种功能应用以及数据处理,即实现上述任一方法实施例的视频编码单元分割方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据视频编码单元分割装置的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该视频编码单元分割装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器中,当被所述一个或者多个处理器执行时,执行上述任意方法实施例中的视频编码单元分割方法,例如,执行以上描述的第一实施例中的方法步骤S100至S400,第六实施例中的方法步骤S510至S560。
本发明的第九实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个控制处理器执行,例如,被图4中的一个处理器执行,可使得上述一个或多个处理器执行上述方法实施例中的一种视频编码单元分割方法,例如第一实施例中的方法步骤S100至S400,第五实施例中的方法步骤S510至S560。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
通过以上的实施方式的描述,本领域普通技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上是对本发明的较佳实施进行了具体说明,但本发明并不局限于上述实施方式,熟悉本领域的技术人员在不违背本发明精神的前提下还可作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (10)

1.一种视频编码单元分割方法,其特征在于,包括:
选取MERGE模式作为第一次选层的默认模式;
选取率失真代价最小的一层作为最优层,获取最优层对应的深度;
在与最优层相邻的两层中,以率失真代价为基准选取其中一层作为次优层,获取次优层对应的深度;
以最优层和次优层的深度作为深度范围的两个端值对视频编码单元进行分割,并设置阈值,统计已编码块运动估计过程像素精度,将运动估计过程中产生的绝对误差和与阈值进行比较;若所述绝对误差和小于所述阈值,则分割时终止分像素搜索,否则分割时同时进行整像素搜索与分像素搜索。
2.根据权利要求1所述的一种视频编码单元分割方法,其特征在于:所述以率失真代价为基准选取其中一层作为次优层,包括:比较最优层的率失真代价与其相邻的两层的率失真代价的差值,选取差值小的一层作为次优层,或者直接比较与最优层相邻的两层的率失真代价,选取率失真代价小的作为次优层。
3.根据权利要求1所述的一种视频编码单元分割方法,其特征在于:选取最优层后,判断最优层的深度,若最优层的深度为1或者2,在与最优层相邻的两层中,以率失真代价为基准选取其中一层作为次优层;若最优层的深度为0,则直接将深度范围设置为0到1;若最优层的深度为3,则直接将深度范围设置为2到3。
4.根据权利要求1所述的一种视频编码单元分割方法,其特征在于:若次优层是较深的一层,则将较深的一层的深度作为深度范围的最大值,最优层的深度作为深度范围的最小值;否则将较浅的一层的深度作为深度范围的最小值,最优层的深度作为深度范围的最大值。
5.根据权利要求1所述的一种视频编码单元分割方法,其特征在于:所述阈值包括第一阈值和第二阈值,若所述绝对误差和小于所述第一阈值,则分割时终止1/2像素搜索,否则同时进行整像素搜索和1/2像素搜索;在进行1/2像素搜索时,将运动估计过程中产生的哈达码变换后的绝对误差和与第二阈值进行比较;若所述哈达码变换后的绝对误差和小于所述第二阈值,则分割时终止1/4像素搜索,否则分割时同时进行整像素搜索、1/2像素搜索和1/4像素搜索。
6.一种视频编码单元分割系统,其特征在于,包括:
模式设定模块,用于选取MERGE模式作为第一次选层的默认模式;
选择模块,用于选取率失真代价最小的一层作为最优层,以及在与最优层相邻的两层中,以率失真代价为基准选取其中一层作为次优层;
深度设定模块,用于获取最优层和次优层对应的深度,以及设定分割的深度范围;
分割模块,用于对视频编码单元进行分割,在分割时先设置阈值,统计已编码块运动估计过程像素精度,将运动估计过程中产生的绝对误差和与阈值进行比较;若所述绝对误差和小于所述阈值,则分割时终止分像素搜索,否则分割时同时进行整像素搜索与分像素搜索。
7.根据权利要求6所述的一种视频编码单元分割系统,其特征在于:所述选择模块比较最优层的率失真代价与其相邻的两层的率失真代价的差值,选取差值小的一层作为次优层,或者直接比较与最优层相邻的两层的率失真代价,选取率失真代价小的作为次优层。
8.根据权利要求6所述的一种视频编码单元分割系统,其特征在于:所述深度设定模块包括判断单元,所述判断单元用于判断最优层的深度,若最优层的深度为1或者2,在与最优层相邻的两层中,以率失真代价为基准选取其中一层作为次优层;若最优层的深度为0,则直接将深度范围设置为0到1;若最优层的深度为3,则直接将深度范围设置为2到3。
9.一种视频编码单元分割装置,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-5任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1-5任一项所述的方法。
CN201910271123.1A 2019-04-04 2019-04-04 一种视频编码单元分割方法及其系统、装置、存储介质 Active CN110139106B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910271123.1A CN110139106B (zh) 2019-04-04 2019-04-04 一种视频编码单元分割方法及其系统、装置、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910271123.1A CN110139106B (zh) 2019-04-04 2019-04-04 一种视频编码单元分割方法及其系统、装置、存储介质

Publications (2)

Publication Number Publication Date
CN110139106A true CN110139106A (zh) 2019-08-16
CN110139106B CN110139106B (zh) 2023-01-17

Family

ID=67569413

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910271123.1A Active CN110139106B (zh) 2019-04-04 2019-04-04 一种视频编码单元分割方法及其系统、装置、存储介质

Country Status (1)

Country Link
CN (1) CN110139106B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111968151A (zh) * 2020-07-03 2020-11-20 北京博雅慧视智能技术研究院有限公司 一种运动估计精细搜索方法及装置
CN114727115A (zh) * 2022-04-14 2022-07-08 中南大学 一种视频编码的整数运动估计方法、系统及存储介质
CN117440168A (zh) * 2023-12-19 2024-01-23 福州时芯科技有限公司 一种实现并行螺旋搜索算法的硬件架构

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103348651A (zh) * 2011-03-09 2013-10-09 联发科技(新加坡)私人有限公司 具有降低复杂性的变换单元分割的方法及装置
WO2015055134A1 (zh) * 2013-10-18 2015-04-23 华为技术有限公司 视频编解码中的块分割方式确定方法及相关装置
CN105141954A (zh) * 2015-08-19 2015-12-09 浙江工业大学 一种hevc帧间编码快速模式选择方法
CN106454342A (zh) * 2016-09-07 2017-02-22 中山大学 一种视频压缩编码的帧间模式快速选择方法及系统
WO2018117334A1 (ko) * 2016-12-21 2018-06-28 전자부품연구원 고효율 비디오 부호화 모드 결정방법 및 결정장치
CN109302610A (zh) * 2018-10-26 2019-02-01 重庆邮电大学 一种基于率失真代价的屏幕内容编码帧间快速算法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103348651A (zh) * 2011-03-09 2013-10-09 联发科技(新加坡)私人有限公司 具有降低复杂性的变换单元分割的方法及装置
WO2015055134A1 (zh) * 2013-10-18 2015-04-23 华为技术有限公司 视频编解码中的块分割方式确定方法及相关装置
CN105141954A (zh) * 2015-08-19 2015-12-09 浙江工业大学 一种hevc帧间编码快速模式选择方法
CN106454342A (zh) * 2016-09-07 2017-02-22 中山大学 一种视频压缩编码的帧间模式快速选择方法及系统
WO2018117334A1 (ko) * 2016-12-21 2018-06-28 전자부품연구원 고효율 비디오 부호화 모드 결정방법 및 결정장치
CN109302610A (zh) * 2018-10-26 2019-02-01 重庆邮电大学 一种基于率失真代价的屏幕内容编码帧间快速算法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111968151A (zh) * 2020-07-03 2020-11-20 北京博雅慧视智能技术研究院有限公司 一种运动估计精细搜索方法及装置
CN111968151B (zh) * 2020-07-03 2022-04-05 北京博雅慧视智能技术研究院有限公司 一种运动估计精细搜索方法及装置
CN114727115A (zh) * 2022-04-14 2022-07-08 中南大学 一种视频编码的整数运动估计方法、系统及存储介质
CN114727115B (zh) * 2022-04-14 2024-05-03 中南大学 一种视频编码的整数运动估计方法、系统及存储介质
CN117440168A (zh) * 2023-12-19 2024-01-23 福州时芯科技有限公司 一种实现并行螺旋搜索算法的硬件架构
CN117440168B (zh) * 2023-12-19 2024-03-08 福州时芯科技有限公司 一种实现并行螺旋搜索算法的硬件架构

Also Published As

Publication number Publication date
CN110139106B (zh) 2023-01-17

Similar Documents

Publication Publication Date Title
Tissier et al. Complexity reduction opportunities in the future VVC intra encoder
CN104581153B (zh) 通过使用去块滤波对视频进行解码的方法和设备
CN102474613B (zh) 考虑具有分层结构的编码单元的扫描顺序来对视频进行编码和解码的方法和设备
CN102742277B (zh) 基于分层数据单元的扫描顺序对视频进行编码的方法和设备以及基于分层数据单元的扫描顺序对视频进行解码的方法和设备
CN105072442B (zh) 对视频数据进行解码的设备
CN103220522B (zh) 对视频编码的方法和设备及对视频解码的方法和设备
CN110024384A (zh) 基于帧间预测模式处理视频的方法和用于该方法的设备
CN102857764B (zh) 帧内预测模式处理的方法和装置
CN104581181B (zh) 一种基于备选模式列表优化的帧内编码方法
CN104811696B (zh) 一种视频数据的编码方法和装置
CN103533355B (zh) 一种hevc快速编码方法
CN110139106A (zh) 一种视频编码单元分割方法及其系统、装置、存储介质
Shen et al. Ultra fast H. 264/AVC to HEVC transcoder
JP2013530658A (ja) ブロック併合を利用したビデオ符号化方法及びその装置、ブロック併合を利用したビデオ復号化方法及びその装置
CN107087194A (zh) 基于帧间预测对视频信号进行解码的方法
CN103596003B (zh) 高性能视频编码的帧间预测快速模式选择方法
CN107295336B (zh) 基于图像相关性的自适应快速编码单元划分方法及装置
US20220232237A1 (en) Image decoding device using tool set and image decoding method thereby, and image encoding device and image encoding method thereby
CN109788283A (zh) 一种编码单元分割方法及其系统、装置、存储介质
CN111586417B (zh) 一种基于多视频编码标准的vvc转码系统及方法
KR101711894B1 (ko) 상위깊이의 부호화 정보를 이용한 영상 부호화 방법 및 장치
KR20210000691A (ko) 비디오 부호화 및 복호화 방법, 그를 이용한 장치
CN117596396A (zh) 一种视频编码方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant