CN105721866B - 一种编码单元划分方法及装置 - Google Patents

一种编码单元划分方法及装置 Download PDF

Info

Publication number
CN105721866B
CN105721866B CN201610070362.7A CN201610070362A CN105721866B CN 105721866 B CN105721866 B CN 105721866B CN 201610070362 A CN201610070362 A CN 201610070362A CN 105721866 B CN105721866 B CN 105721866B
Authority
CN
China
Prior art keywords
image
encoded
unit
coding unit
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610070362.7A
Other languages
English (en)
Other versions
CN105721866A (zh
Inventor
朱洪波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201610070362.7A priority Critical patent/CN105721866B/zh
Publication of CN105721866A publication Critical patent/CN105721866A/zh
Application granted granted Critical
Publication of CN105721866B publication Critical patent/CN105721866B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本申请提供了一种编码单元划分方法,属于图像处理领域,解决了现有技术中编码单元划分效率低下的问题,所述方法包括:选择当前待编码单元所在图像的参考图像;确定所述参考图像中与当前待编码单元对应的图像区域,将该图像区域向四周扩展预设数目个像素点,并获得扩展后的图像区域内的运动场信息;当判断获得的所述运动场信息一致时,若预测得到的所述当前待编码单元的率失真花费和非零的量化频域变换系数的数目满足预设条件,则终止划分所述待编码单元。与现有技术中需要对编码单元逐层递归划分至8×8的最小编码单元的划分方式相比,减少了编码单元的划分层次,提高了编码单元的划分效率,同时也提高了图像编码的效率。

Description

一种编码单元划分方法及装置
技术领域
本申请涉及图像处理技术领域,特别是涉及一种编码单元划分方法及装置。
背景技术
随着高分辨率视频拍摄设备的普及,播放高清视频的需求也越来越多,因此,对视频图像的存储和传输提出了更高的要求。HEVC/H.265是针对高分辨率视频推出的视频编码标准,比上一代的H.264编码标准,具有更多的可选编码模式。为了获得高的压缩效率,HEVC可以采用层次B编码。在层次B编码中,HEVC主框架最多允许8层次,在对视频图像进行编码时,编码器以8帧图像为一组进行编码,图像帧的编码顺序和显示顺序(POC)并不相同。
而对于每一帧图像,编码器将其分割成编码树单元(CTU),然后逐个CTU进行编码。CTU大小由编码器决定,为了提高编码效率,一般设CTU为编码标准允许的最大尺寸64x64。编码器以四叉树的形式把CTU分为编码单元(CU),然后对CU选择帧内或帧间模式进行编码。CU可以有64x64、32x32、16x16、8x8共4种级别大小,通常把64x64作为最高级别一级,下一级别为32x32,最低级别为8x8。作为高级别的CU,编码器可以直接对其进行编码,也可以以四叉树的形式任意分割成低级别的CU进行编码。对于最低级别8x8的CU不能继续划分,直接进行编码。
现有技术中,对CU的划分通常是通过计算率失真花费来决定的。首先,计算当前CU的率失真花费cost_n_cur;然后,将当前CU划分成四个子CU,对4个子CU按顺序进行独立的递归编码,得到四个子CU的率失真花费cost_n+1_0、cost_n+1_1、cost_n+1_2和cost_n+1_3;然后得到cost_n+1=cost_n+1_0+cost_n+1_1+cost_n+1_2+cost_n+1_3。最后比较cost_n_cur和cost_n+1,若cost_n+1<cost_n_cur则选择n+1层的划分方式。
现有技术中需要对编码单元逐层递归划分至8×8的最小编码单元,然后通过计算各种划分模式的率失真花费,选择最小率失真花费对应的CU划分模式进行最终编码。综上所述,现有技术中的CU划分方法存在效率低下的缺陷,从而影响图像编码效率。
发明内容
本申请所要解决的技术问题是:提供一种编码单元划分方法,解决现有技术中编码单元划分效率低下的问题。
为了解决上述问题,本申请实施例提供了一种编码单元划分方法,包括:选择当前待编码单元所在图像的参考图像;确定所述参考图像中与当前待编码单元对应的图像区域,将该图像区域向四周扩展预设数目个像素点,并获得扩展后的图像区域内的运动场信息;当判断获得的扩展后的图像区域内的运动场信息一致时,若预测得到的所述当前待编码单元的率失真花费和非零的量化频域变换系数的数目满足预设条件,则终止划分所述待编码单元。
进一步地,所述选择当前待编码单元所在图像的参考图像,具体为:选择距离当前待编码单元所在图像显示时间最近且编码层次最接近的已编码图像作为当前待编码单元所在图像的参考图像。
具体实施时,获得的扩展后的图像区域内的运动场信息,包括:扩展后的图像区域覆盖的编码单元的参考索引和运动向量;判断获得的扩展后的图像区域内的运动场信息一致,具体为:扩展后的图像区域覆盖的编码单元的参考索引全部相同,且所有运动向量的偏移小于或等于预设值,则确定获得的所述运动场信息一致。
进一步地,所述若预测得到的所述当前待编码单元的率失真花费和非零的量化频域变换系数的数目满足预设条件,则终止划分所述待编码单元,具体为:若预测得到的所述当前待编码单元的率失真花费小于阈值率失真花费,且非零的量化频域变换系数的数目小于阈值数目时,则终止划分所述待编码单元。
具体实施时,所述阈值率失真花费和所述阈值数目根据编码单元的宽度和编码单元的变换单元划分层次确定。
相应的,本申请还公开了一种编码单元划分装置,包括:
参考图像选择模块,用于选择当前待编码单元所在图像的参考图像;
参考运动场信息获取模块,用于确定所述参考图像中与当前待编码单元对应的图像区域,将该图像区域向四周扩展预设数目个像素点,并获得扩展后的图像区域内的运动场信息;
编码单元划分判断模块,用于当判断获得的扩展后的图像区域内的运动场信息一致时,若预测得到的所述当前待编码单元的率失真花费和非零的量化频域变换系数的数目满足预设条件,则终止划分所述待编码单元。
所述参考图像选择模块进一步用于:选择距离当前待编码单元所在图像显示时间最近且编码层次最接近的已编码图像作为当前待编码单元所在图像的参考图像。
具体实施时,获得的扩展后的图像区域内的运动场信息,包括:扩展后的图像区域覆盖的编码单元的参考索引和运动向量;判断获得的扩展后的图像区域内的运动场信息一致,具体为:扩展后的图像区域覆盖的编码单元的参考索引全部相同,且所有运动向量的偏移小于或等于预设值,则确定获得的扩展后的图像区域内的运动场信息一致。
进一步地,所述若预测得到的所述当前待编码单元的率失真花费和非零的量化频域变换系数的数目满足预设条件,则终止划分所述待编码单元,具体为:若预测得到的所述当前待编码单元的率失真花费小于阈值率失真花费,且非零的量化频域变换系数的数目小于阈值数目时,则终止划分所述待编码单元。
具体实施时,所述阈值率失真花费和所述阈值数目根据编码单元的宽度和编码单元的变换单元划分层次确定。
本申请的实施例通过选择当前待编码单元所在图像的参考图像;然后,确定所述参考图像中与当前待编码单元对应的图像区域,将该图像区域向四周扩展预设数目个像素点,并获得扩展后的图像区域内的运动场信息;当判断获得的扩展后的图像区域内的运动场信息一致时,若预测得到的所述当前待编码单元的率失真花费和非零的量化频域变换系数的数目满足预设条件,则终止划分所述待编码单元。与现有技术中需要对编码单元逐层递归划分至8×8的最小编码单元的划分方式相比,减少了编码单元的划分层次,提高了编码单元的划分效率,同时也提高了图像编码的效率。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个实施例的编码单元划分方法的流程图;
图2是HEVC层次B编码图像显示顺序和编码顺序示意图;
图3是本申请一个实施例的编码单元划分方法中扩展后的图像区域示意图;
图4是本申请一个实施例的编码单元划分装置的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请公开的一种基于时域运动的图像编码方法,如图1所示,该方法包括:
步骤100,选择当前待编码单元所在图像的参考图像。
步骤110,确定所述参考图像中与当前待编码单元对应的图像区域,将该图像区域向四周扩展预设数目个像素点,并获得扩展后的图像区域内的运动场信息;
步骤120,当判断获得的所述运动场信息一致时,若预测得到的所述当前待编码单元的率失真花费和非零的量化频域变换系数的数目满足预设条件,则终止划分所述待编码单元。
上述步骤100中,当前待编码单元所在图像的参考图像是已经编码完成的图像。对于采用HEVC编码标准的层次B编码时,图像的编码顺序与图像的实际显示顺序并不相同,下面以采用8个层次编码为例说明图像的编码顺序和显示顺序(POC)之间的具体关系。如图2所示。时间轴以下的数字代表图像的显示顺序编号,编号小的图像先显示;图像上的数字表示图像的编码顺序编号,编号小的图像先编码。对于8个层次的编码器,编码器以8个图像为一组进行编码。以图2所示的图像为例,首先编码POC=0的图像,然后依次编码POC=8、POC=4、POC=2、POC=1、POC=3、POC=6、POC=5、POC=7的图像。这组编码完成后,编码下一组的8个图像,编码顺序依次是POC=16、POC=12、POC=10、POC=9、POC=11、POC=14、POC=13、POC=15。这组编码完成后再编码下一组8个图像。编码器给每组图像划分为四个图像层次(pichier),最高层为第一层,最低层为第四层。以图2为例,第一组图像中,POC=0和POC=8是图像层次中的第一层,POC=4是第二层,POC=2和POC=6是第三层,POC=1、POC=3、POC=5、POC=7是第四层。
选择当前待编码单元所在图像的参考图像时,选择距离当前待编码单元所在图像显示时间最近的已编码图像作为当前待编码单元所在图像的参考图像。以当前待编码单元所在图像为图2中的显示顺序为16的图像为例,在编码POC=16的图像之前,POC=0~8的图像已经编码完成,编码器从POC=0~POC=8的图像中选择一幅图像作为参考图像,这些图像中POC=8的参考图像是离当前图像POC=12最近的图像,所以它被选为协定位图像。
如果距离当前待编码单元所在图像显示时间最近的已编码图像大于1帧时,选择距离当前待编码单元所在图像显示时间最近的已编码图像中,编码层次与当前待编码单元所在图像最接近的图像。以当前待编码单元所在图像为图2中的显示顺序为10的图像为例,在编码POC=10的图像之前,POC=0~8、POC=16、POC=12的图像已经编码完成,编码器从POC=0~POC=8、POC=16、POC=12的图像中选择距离当前待编码单元所在图像显示时间最近的已编码图像为POC=12和POC=8的两帧图像作为备选参考图像;POC=10的图像的编码层次为第三层(即L10=3),POC=8的图像的编码层次为第一层(即L8=1),POC=12的图像的编码层次为第二层(即L12=2)。备选参考图像POC=8的编码层次和当前编码图像POC=10的编码层次的差值为|L10-L8|=2,备选参考图像POC=12的编码层次和当前编码图像POC=10的编码层次的差值为|L10-L12|=1,通过计算备选参考图像的编码层次和当前编码图像的编码层次之间的差值,选择编码层次差值最小即编码层次与当前待编码单元所在图像最接近的图像POC=12的图像为当前待编码单元的参考图像。
具体实施时,在视频数据输入至编码器时已经为每帧图像设置显示顺序(POC)和图像的编码层次,本申请只需要读取每帧图像的属性即可获得图像的显示顺序(POC)和编码层次。
上述步骤110中,如图3所示,根据当前待编码单元301所在图像A的位置信息确定参考图像B中的相应图像区域302,然后将该图像区域向上、下、左、右四个方向分别扩展预设数目个像素点,得到扩展后的参考图像区域303。编码器会记录已经编码完成的图像的编码信息,根据参考图像B的编码信息,可以获得参考图像区域303的运动场信息,参考图像区域303的运动场信息包括参考图像区域303覆盖的所有编码单元的参考索引和运动向量。参考图像区域303的运动场信息包括参考图像区域303覆盖的所有编码单元的运动场信息,根据参考图像的编码单元树确定参考图像区域303覆盖的编码单元以及各编码单元的运动场信息。首先,根据参考图像的编码单元树确定参考图像的编码单元的区域坐标,根据当前待编码单元的区域坐标确定扩展后的参考图像区域303的坐标;然后根据参考图像区域303的坐标确定参考图像区域303覆盖的编码单元。对于仅有一部分区域被参考图像区域303覆盖的编码单元,可以设定当被参考图像区域303覆盖的区域的面积超过该编码单元的面积的一半时认为该编码单元是被参考图像区域303覆盖的编码单元。以图3所示的参考图像为例,参考图像中的参考图像区域303覆盖的编码单元包括标号1至12的编码单元,因此,参考图像区域303的运动场信息包括标号1至12的编码单元的运动场信息。运动场信息包括:参考索引和运动向量。其中,参考索引表示编码单元的参考图像的显示顺序。
其中,预设数目大于8且小于32,优选为16。所述预设数目通过预先对大量视频图像进行编码、统计得到。预设数目过大或过小,参考图像区域中的图像编码信息就会过多或过少,会导致判断不准确。
上述步骤120中,当所述参考图像区域303覆盖的编码单元1至12的参考索引全部一致,并且所述参考图像区域303覆盖的编码单元1至12的运动向量的偏移小于阈值数目(如1个)的像素点时,说明参考图像的相应参考图像区域303中的图像的运动场信息比较平滑。然后,判断当前待编码单元的率失真花费和当前待编码单元的非零的量化频域变换系数的数目是否满足预设条件,若满足,则终止继续划分。所述预设条件为:
其中,rdcost_th为阈值率失真花费,根据编码单元的宽度和当前待编码单元的变换单元划分层次确定;coefnum_th为当前待编码单元的非零的量化频域变换系数的阈值数目,根据编码单元的宽度和当前待编码单元的变换单元划分层次确定。具体实施时,通过对大量图像的编码数据根据函数rdcost_th=f(width,tu_is_split)和coefnum_th=f(width,tu_is_split)进行统计,确定rdcost_th与(width,tu_is_split)、coefnum_th与(width,tu_is_split)的对应关系。其中,width代表当前待编码单元的宽度(8<width≤64);tu_is_split表示当前待编码单元的变换单元(TU)的划分层次,优选地tu_is_split表示当前待编码单元的变换单元(TU)的第一层是否划分。对于宽度为16至64的编码单元,coefnum_th取值在5-11之间,rdcost_th取值从几千到几万不定。
具体实施时,对当前待编码单元采用四叉树进行划分得到变换单元,根据当前待编码单元的宽度,变换单元的划分层次各不相同,最小的变换单元宽度为8,通过计算率失真花费进一步判断变换单元的划分层次。一个宽度是64的编码单元最多可以划分三层,得到的最小变换单元的宽度为8。HEVC的编码器通常根据率失真花费来确定编码单元到变换单元的划分。以一个宽度为width的编码单元CU为例,首先对其进行四叉树划分,得到四个变换单元TU1、TU2、TU3、TU4。当编码单元CU的率失真花费小于四个变换单元的率失真花费之和时,不再继续划分,当前待编码单元的第一层变换单元不划分,即tu_is_split=0;当编码单元CU的率失真花费大于四个变换单元的率失真花费之和时,确定当前CU划分为四个TU,即tu_is_split=1。然后,对于每个TU按照四叉树划分方法,通过计算率失真花费进一步判断是否继续划分。计算变换单元的率失真花费采用现有技术实现,本申请不再赘述。
下面结合一个具体实施例来说明当前待编码单元的率失真花费rdcost的计算方式。HEVC编码框架中,一个编码单元的编码分为两个步骤:第一步是预测编码模式,第二步是计算源图像和采用预测编码模式编码后形成的图像的残差,并对计算得到的残差进行DCT变换(离散余弦变换)。在对一个编码单元(CU)进行编码时,因为编码单元有很多的预测单元(PU)分割模式,对于每个PU分割模式,编码单元又有很多变换单元(TU)划分模式。所以要选择一个CU到底采用哪种PU分割模式以及对应的TU划分模式,编码器需要针对所有预测模式和TU划分模式进行组合,根据组合后的PU分割模式和TU划分模式对CU进行编码,分别计算CU编码的率失真花费,然后选择率失真花费最小的组合模式对应的PU分割模式和TU划分模式,并将得到的最小的率失真花费作为当前待编码单元的率失真花费。具体实施时,PU分割模式可以采用帧内预测和帧间预测两种方式。帧间预测最多可以有除PART_NxN外共七种模式,包括:INTER_2Nx2N、INTER_2NxN、INTER_Nx2N、INTER_2NxnU、INTER_2NxnD、INTER_nLx2N、INTER_nRx2N,而帧内预测最多只有两种模式PART_2Nx2N和PART_NxN,CU只能在帧间预测或帧内预测中选择一种预测模式,然后再选择一种相应的PU分割模式作为其预测分割方式。
在对编码单元进行编码时,首先选择一种PU分割模式,按照选择的PU分割模式对当前CU进行编码获得当前CU每个像素点的预测,将获得的像素点预测和源图像中相应的像素点相减得到当前每个像素点的残差;然后,选择一种可能的TU划分模式,对计算得到的残差根据选择的TU划分模式执行空域到频域的变换(如离散余弦变换,DCT),再对DCT变换结果进行量化,得到量化系数。得到的多个量化系数中,为零的量化系数越多,说明预测模式选择越准确,记录其中的非零的量化DCT变换系数的数目coefnum。再然后,对当前待编码单元进行重构,得到当前待编码单元的重构图像,并计算源图像和重构图像之间的误差平方和(SSE)。图像重构可以采用现有技术实现,本申请在此不再赘述。最后,把当前CU的编码参数和量化系数等用熵编码器编码,得到其码率bits,通过公式:J(CUd)=SSEd+λ×Bd计算当前CU的率失真花费。其中,d表示当前CU的深度值;Bd代表当前CU经过各种PU预测和模式选择后编码所需的比特数;λ为拉格朗日算子,通过公式λmode=α×2((QP-12)/3.0)计算获得,α是一个依赖于图像类型的参数,Qp为量化参数;SSEd是源图像和重构图像之间的误差平方和,其计算公式如下:
其中:IO(i,j)为当前待编码单元源图像的像 素值,IR(i,j)’为重构图像块的像素值。
对于每种PU分割模式和TU划分模式,分别进行组合后,执行计算当前CU的率失真花费的操作,可以得到多个coefnum和J(CUd),选择其中最小的率失真花费J(CUd),及其对应的PU分割模式和TU划分方式计算得到的非零的量化DCT变换系数的数目coefnum。
本申请首先选择当前待编码单元所在图像的参考图像,然后,确定所述参考图像中与当前待编码单元对应的图像区域,将该图像区域向四周扩展预设数目个像素点,并获得扩展后的图像区域内的运动场信息;当判断获得的所述运动场信息一致时,若计算得到的所述当前待编码单元的率失真花费和非零的量化频域变换系数的数目满足预设条件,则终止划分所述编码单元。通过结合参考图像的运动场信息以及预设的率失真花费和非零的量化频域变换系数的数目作为综合判断条件,快速决策当前待编码单元是否需要继续划分,与现有技术中需要对编码单元逐层递归划分至8×8的最小编码单元的划分方式相比,减少了编码单元的划分层次,提高了编码单元的划分效率,同时也提高了图像编码的效率。
在具体应用时,对于第一帧图像,可以根据现有技术中的编码单元划分方法,将其划分至8×8的最小编码单元,然后进行编码。对于第二帧及以后的图像,可以采用本申请的编码单元划分方法进行划分。
相应的,本申请还公开了一种编码单元的划分装置,如图4所示,包括:
参考图像选择模块410,用于选择当前待编码单元所在图像的参考图像;
参考运动场信息获取模块420,用于确定所述参考图像中与当前待编码单元对应的图像区域,将该图像区域向四周扩展预设数目个像素点,并获得扩展后的图像区域内的运动场信息;
编码单元划分判断模块430,用于当判断获得的所述运动场信息一致时,若预测得到的所述当前待编码单元的率失真花费和非零的量化频域变换系数的数目满足预设条件,则终止划分所述待编码单元。
在本申请的一个具体实施例中,所述参考图像选择模块410进一步用于,选择距离当前待编码单元所在图像显示时间最近且编码层次最接近的已编码图像作为当前待编码单元所在图像的参考图像。
当前待编码单元所在图像的参考图像是已经编码完成的图像。对于采用HEVC编码标准的层次B编码时,图像的编码顺序与图像的实际显示顺序并不相同,在视频数据输入至编码器时已经为每帧图像设置显示顺序(POC)和图像的编码层次。选择当前待编码单元所在图像的参考图像时,选择距离当前待编码单元所在图像显示时间最近的已编码图像作为当前待编码单元所在图像的参考图像。如果距离当前待编码单元所在图像显示时间最近的已编码图像大于1帧时,选择距离当前待编码单元所在图像显示时间最近的已编码图像中,距离且编码层次与当前待编码单元所在图像最接近的图像。参考图像的具体选择方法参见方法是实施例部分,此处不再赘述。
本申请具体实施时,结合参考图像中与当前待编码单元对应的参考图像区域的运动信息,判断当前编码单元是否继续划分。因此,在确定了参考图像之后,首先,参考运动场信息获取模块420需要确定参考图像中与当前待编码单元对应的参考图像区域。确定方法为:根据当前编码单元的坐标信息选择参考图形中相应坐标的图像区域,然后该图像区域向上、下、左、右四个方向分别扩展预设数目个像素点,得到扩展后的参考图像区域。参考图像中与当前待编码单元对应的图像区域的具体确定方法参见图2和方法是实施例部分的描述,此处不再赘述。然后,参考运动场信息获取模块420获得扩展后的图像区域内的运动场信息。参考图像是已经编码完成的图像,因此编码器保存有参考图像的各编码单元的运动场信息,本申请的实施例中,获得的运动场信息,包括:扩展后的图像区域(即参考图像区域)覆盖的所有编码单元的参考索引和运动向量;判断获得的扩展后的图像区域内的运动场信息一致,具体为:扩展后的图像区域覆盖的编码单元的参考索引全部相同,且所有运动向量的偏移小于或等于预设值,则确定获得的扩展后的图像区域内的运动场信息一致。获得扩展后的图像区域内的运动场信息具体方法参见方法是实施例部分,此处不再赘述。
编码单元划分判断模块430当判断获得的扩展后的图像区域内的运动场信息一致时,进一步判断预测得到的所述当前待编码单元的率失真花费和非零的量化频域变换系数的数目是否满足预设条件,若预测得到的所述当前待编码单元的率失真花费和非零的量化频域变换系数的数目满足预设条件,则终止划分所述待编码单元;否则,基于当前CU的划分模式,针对每一个子CU,继续下一个层级的划分。若预测得到的所述当前待编码单元的率失真花费和非零的量化频域变换系数的数目满足预设条件,则终止划分所述待编码单元,具体为:若预测得到的所述当前待编码单元的率失真花费小于阈值率失真花费,且非零的量化频域变换系数的数目小于阈值数目时,则终止划分所述待编码单元。具体实施例时,所述阈值率失真花费和所述阈值数目根据编码单元的宽度和编码单元的变换单元划分层次确定。
本申请首先选择当前待编码单元所在图像的参考图像,然后,确定所述参考图像中与当前待编码单元对应的图像区域,将该图像区域向四周扩展预设数目个像素点,并获得扩展后的图像区域内的运动场信息;当判断获得的所述运动场信息一致时,若计算得到的所述当前待编码单元的率失真花费和非零的量化频域变换系数的数目满足预设条件,则终止划分所述编码单元。通过结合参考图像的运动场信息以及预设的率失真花费和非零的量化频域变换系数的数目作为综合判断条件,快速决策当前待编码单元是否需要继续划分,与现有技术中需要对编码单元逐层递归划分至8×8的最小编码单元的划分方式相比,减少了编码单元的划分层次,提高了编码单元的划分效率,同时也提高了图像编码的效率。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对本申请提供的一种编码单元划分方法进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

Claims (6)

1.一种编码单元划分方法,其特征在于,包括:
选择当前待编码单元所在图像的参考图像,具体为:选择距离当前待编码单元所在图像显示时间最近且编码层次最接近的已编码图像作为当前待编码单元所在图像的参考图像;
确定所述参考图像中与当前待编码单元对应的图像区域,将该图像区域向四周扩展预设数目个像素点,并获得扩展后的图像区域内的运动场信息;
当判断获得的扩展后的图像区域内的运动场信息一致时,若预测得到的所述当前待编码单元的率失真花费和非零的量化频域变换系数的数目满足预设条件,则终止划分所述待编码单元,具体为:若预测得到的所述当前待编码单元的率失真花费小于阈值率失真花费,且非零的量化频域变换系数的数目小于阈值数目时,则终止划分所述待编码单元。
2.如权利要求1所述的方法,其特征在于,获得的扩展后的图像区域内的运动场信息,包括:扩展后的图像区域覆盖的编码单元的参考索引和运动向量;
判断获得的扩展后的图像区域内的运动场信息一致,具体为:扩展后的图像区域覆盖的编码单元的参考索引全部相同,且所有运动向量的偏移小于或等于预设值,则确定获得的扩展后的图像区域内的运动场信息一致。
3.如权利要求1所述的方法,其特征在于,所述阈值率失真花费和所述阈值数目根据编码单元的宽度和编码单元的变换单元划分层次确定。
4.一种编码单元划分装置,其特征在于,包括:
参考图像选择模块,用于选择当前待编码单元所在图像的参考图像,进一步用于:选择距离当前待编码单元所在图像显示时间最近且编码层次最接近的已编码图像作为当前待编码单元所在图像的参考图像;
参考运动场信息获取模块,用于确定所述参考图像中与当前待编码单元对应的图像区域,将该图像区域向四周扩展预设数目个像素点,并获得扩展后的图像区域内的运动场信息;
编码单元划分判断模块,用于当判断获得的扩展后的图像区域内的运动场信息一致时,若预测得到的所述当前待编码单元的率失真花费和非零的量化频域变换系数的数目满足预设条件,则终止划分所述待编码单元,具体为:若预测得到的所述当前待编码单元的率失真花费小于阈值率失真花费,且非零的量化频域变换系数的数目小于阈值数目时,则终止划分所述待编码单元。
5.如权利要求4所述的装置,其特征在于,获得的扩展后的图像区域内的运动场信息,包括:扩展后的图像区域覆盖的编码单元的参考索引和运动向量;
判断获得的所述运动场信息一致,具体为:扩展后的图像区域覆盖的编码单元的参考索引全部相同,且所有运动向量的偏移小于或等于预设值,则确定获得的扩展后的图像区域内的运动场信息一致。
6.如权利要求4所述的装置,其特征在于,所述阈值率失真花费和所述阈值数目根据编码单元的宽度和编码单元的变换单元划分层次确定。
CN201610070362.7A 2016-02-01 2016-02-01 一种编码单元划分方法及装置 Active CN105721866B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610070362.7A CN105721866B (zh) 2016-02-01 2016-02-01 一种编码单元划分方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610070362.7A CN105721866B (zh) 2016-02-01 2016-02-01 一种编码单元划分方法及装置

Publications (2)

Publication Number Publication Date
CN105721866A CN105721866A (zh) 2016-06-29
CN105721866B true CN105721866B (zh) 2019-02-12

Family

ID=56154591

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610070362.7A Active CN105721866B (zh) 2016-02-01 2016-02-01 一种编码单元划分方法及装置

Country Status (1)

Country Link
CN (1) CN105721866B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107197253B (zh) * 2017-04-10 2019-12-27 中山大学 一种基于kb滤波器的qtbt快速判决方法及系统
CN112601085A (zh) * 2017-06-28 2021-04-02 华为技术有限公司 一种图像数据的编码、解码方法及装置
CN108322748B (zh) * 2018-01-31 2021-07-23 北京奇艺世纪科技有限公司 一种编码单元的层次决定方法及装置
CN112165617B (zh) * 2020-10-17 2022-09-06 浙江大华技术股份有限公司 一种视频编码方法、装置、电子设备和存储介质
CN112866693B (zh) * 2021-03-25 2023-03-24 北京百度网讯科技有限公司 编码单元cu的划分方法、装置、电子设备和存储介质
CN117440157B (zh) * 2023-09-26 2024-05-28 书行科技(北京)有限公司 视频编码方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011040795A2 (ko) * 2009-10-01 2011-04-07 에스케이텔레콤 주식회사 분할 레이어를 이용한 영상 부호화/복호화 방법 및 장치
CN103491371A (zh) * 2013-09-04 2014-01-01 华为技术有限公司 基于分层的编码方法、装置和设备
CN104125463A (zh) * 2013-04-26 2014-10-29 华为技术有限公司 一种图像预测编码方法及图像编码器
CN104506860A (zh) * 2014-12-16 2015-04-08 上海国茂数字技术有限公司 视频编码的参考图像选择方法及系统
CN103067704B (zh) * 2012-12-12 2015-12-09 华中科技大学 一种基于编码单元层次提前跳过的视频编码方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011040795A2 (ko) * 2009-10-01 2011-04-07 에스케이텔레콤 주식회사 분할 레이어를 이용한 영상 부호화/복호화 방법 및 장치
CN103067704B (zh) * 2012-12-12 2015-12-09 华中科技大学 一种基于编码单元层次提前跳过的视频编码方法和系统
CN104125463A (zh) * 2013-04-26 2014-10-29 华为技术有限公司 一种图像预测编码方法及图像编码器
CN103491371A (zh) * 2013-09-04 2014-01-01 华为技术有限公司 基于分层的编码方法、装置和设备
CN104506860A (zh) * 2014-12-16 2015-04-08 上海国茂数字技术有限公司 视频编码的参考图像选择方法及系统

Also Published As

Publication number Publication date
CN105721866A (zh) 2016-06-29

Similar Documents

Publication Publication Date Title
CN105721866B (zh) 一种编码单元划分方法及装置
CN105532001B (zh) 用于使用基于深度的视差矢量对视频进行层间编码方法以及解码方法和设备
JP6076414B2 (ja) 映像の符号化方法及び装置、並びに映像の復号化方法及び装置
CN104935938B (zh) 一种混合视频编码标准中帧间预测方法
JP6443869B2 (ja) デジタル画像を処理するためのシステムおよび方法
CN102970526B (zh) 一种获得变换块尺寸的方法和模块
JP5654594B2 (ja) 映像の符号化方法及び装置、その復号化方法及び装置
CN104243997B (zh) 一种质量可分级hevc视频编码方法
CN109792519A (zh) 基于帧内预测模式的图像处理方法及其装置
CN104639940B (zh) 一种快速hevc帧内预测模式选择方法
CN108605124A (zh) 一种视频编解码的方法及装置
CN107113425A (zh) 视频编码方法和设备以及视频解码方法和设备
CN106131546B (zh) 一种提前确定hevc合并和跳过编码模式的方法
CN108432248A (zh) 用于对视频信号进行熵编码和解码的方法和设备
TR201908743T4 (tr) Hiyerarşik kodlanmış blok düzeni bilgisine göre video kodu çözme usulü.
KR20110112240A (ko) 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR20110065090A (ko) 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
KR20200023480A (ko) 비디오 압축을 위한 변환을 구성하는 방법 및 장치
CN110366850A (zh) 基于帧内预测模式处理图像的方法和用于该方法的设备
TR201820601T4 (tr) Hiyerarşik yapıya sahip olan kodlama birimlerinin tarama sırasının dikkate alındığı video kodu çözme cihazı.
CN103067704B (zh) 一种基于编码单元层次提前跳过的视频编码方法和系统
CN105959693A (zh) 图像编码装置和方法以及图像解码装置和方法
CN106105199A (zh) 基于多边形单元的编/解码图像的方法及其装置
CN106664413A (zh) 用于补偿亮度差的层间视频编码方法和装置以及视频解码方法和装置
CN104811729B (zh) 一种视频多参考帧编码方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant