CN105933717A - 一种编码单元的模式决策方法和装置 - Google Patents

一种编码单元的模式决策方法和装置 Download PDF

Info

Publication number
CN105933717A
CN105933717A CN201610262469.1A CN201610262469A CN105933717A CN 105933717 A CN105933717 A CN 105933717A CN 201610262469 A CN201610262469 A CN 201610262469A CN 105933717 A CN105933717 A CN 105933717A
Authority
CN
China
Prior art keywords
current coded
unit
coded unit
mode decision
motion vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610262469.1A
Other languages
English (en)
Other versions
CN105933717B (zh
Inventor
朱洪波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201610262469.1A priority Critical patent/CN105933717B/zh
Publication of CN105933717A publication Critical patent/CN105933717A/zh
Application granted granted Critical
Publication of CN105933717B publication Critical patent/CN105933717B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]

Abstract

本发明实施例提供了一种编码单元的模式决策方法和装置。其中的方法包括:对当前编码单元分别进行Merge模式决策和2N×2N模式决策,得到最优编码模式;确定所述最优编码模式对应的非零DCT系数数目和最小率失真花费;在非零DCT系数数目和最小率失真花费满足终止决策条件时,终止对所述当前编码单元的模式决策。本发明实施例可以避免遍历计算所有帧内模式和帧间模式的率失真花费,从而可以减少模式决策过程中选择预测模式所需要的计算量,进而能够在一定程度减少编码过程中的运算量及复杂度,降低编码的复杂度和编码时间。

Description

一种编码单元的模式决策方法和装置
技术领域
本发明涉及视频编码技术领域,特别是涉及一种编码单元的模式决策方法和装置。
背景技术
HEVC(High Efficiency Video Coding,高效视频编码标准)是新一代视频编码标准,其可用于解决人们对视觉和听觉质量日益增加的需求。
为了提高编码效率,HEVC采用了更加灵活的编码结构,包括CU(Coding Unit,编码单元)、PU(Prediction Unit,预测单元)和TU(Transform unit,变换单元)。其中,CU是HEVC编码的基本单元,CU的最大尺寸为64×64,最小尺寸为4×4。PU以CU为基础进行划分,用于实现CU的预测过程,每个CU可以划分为1个、2个或者4个PU。TU以CU为基础进行划分,用于实现对CU的变换过程,每个CU可以包含一个或多个TU。
其中,PU的划分是和预测模式相关的,预测模式具体可以包括:帧内(intra)模式和帧间(inter)模式。对于采用帧内模式编码的CU,可以采用2N×2N和N×N两种PU划分方式;对于采用帧间模式编码的CU,可以采用2N×2N、2N×N、N×2N、2N×nU、2N×nD、nL×2N和nR×2N七种PU划分方式。
最终选择哪种PU划分方式是由率失真花费决定的,编码器需要依次遍历帧内模式和帧间模式中的所有PU划分方式,逐个计算率失真花费,并选择率失真花费最小的PU划分方式。然而,由于需要计算每一种预测模式下的率失真代价,且率失真代价的计算量较大,导致模式决策过程需要花费较多的时间,占整个编码时长的60%~70%,大大增加了编码的复杂度和编码时间。
发明内容
本发明实施例所要解决的技术问题是提供一种编码单元的模式决策方法和装置,能够减少预测模式选择过程所需要的计算量,从而能够在一定程度减少编码过程中的运算量及复杂度,进一步地可以降低编码的复杂度和编码时间。
为了解决上述问题,本发明公开了一种编码单元的模式决策方法,包括:
对当前编码单元分别进行Merge模式决策和2N×2N模式决策,得到最优编码模式;
确定所述最优编码模式对应的非零DCT系数数目和最小率失真花费;
在非零DCT系数数目和最小率失真花费满足终止决策条件时,终止对所述当前编码单元的模式决策。
可选地,所述终止决策条件包括:
所述非零DCT系数数目小于第一阈值,且所述最小率失真花费小于第二阈值;其中,所述第一阈值、所述第二阈值为依据所述当前编码单元的尺寸参数、以及均匀运动场参数所确定。
可选地,通过如下步骤确定所述均匀运动场参数:
确定所述当前编码单元的最优参考索引;
将所述当前编码单元划分为多个子编码单元;
以所述最优参考索引对应的最优运动向量为参考,对所述多个子编码单元分别进行运动估计,以得到所述多个子编码单元分别对应的运动向量;
在所有的子编码单元对应的运动向量均和所述最优运动向量相同时,设置所述当前编码单元的均匀运动场参数为1;否则,设置所述当前编码单元的均匀运动场参数为0。
可选地,所述确定所述最优编码模式对应的非零DCT系数数目的步骤,包括:
根据所述最优编码模式确定所述当前编码单元对应的预测图像;
将所述预测图像和所述当前编码单元对应的源图像相减得到对应的残差;
对所述残差执行DCT变换以及量化操作,得到非零DCT系数数目。
可选地,所述对当前编码单元进行Merge模式决策的步骤,包括:
对所述当前编码单元构建Merge候选列表;
对所述Merge候选列表中的候选运动向量计算率失真花费;
选择率失真花费最小的候选运动向量作为最优运动向量,所述最优运动向量对应的Merge候选模式为最优Merge模式。
依据本发明的另一方面,提供了一种编码单元的模式决策装置,包括:
模式确定模块,用于对当前编码单元分别进行Merge模式决策和2N×2N模式决策,得到最优编码模式;
参数确定模块,用于确定所述最优编码模式对应的非零DCT系数数目和最小率失真花费;
条件判断模块,用于在非零DCT系数数目和最小率失真花费满足终止决策条件时,终止对所述当前编码单元的模式决策。
可选地,所述终止决策条件包括:
所述非零DCT系数数目小于第一阈值,且所述最小率失真花费小于第二阈值;其中,所述第一阈值、所述第二阈值为依据所述当前编码单元的尺寸参数、以及均匀运动场参数所确定。
可选地,所述装置还包括:运动场参数确定模块,用于确定均匀运动场参数;所述运动场参数确定模块,包括:
索引确定子模块,用于确定所述当前编码单元的最优参考索引;
划分子模块,用于将所述当前编码单元划分为多个子编码单元;
运动估计子模块,用于以所述最优参考索引对应的最优运动向量为参考,对所述多个子编码单元分别进行运动估计,以得到所述多个子编码单元分别对应的运动向量;
参数确定子模块,用于在所有的子编码单元对应的运动向量均和所述最优运动向量相同时,设置所述当前编码单元的均匀运动场参数为1;否则,设置所述当前编码单元的均匀运动场参数为0。
可选地,所述参数确定模块包括:非零系数数目确定子模块,用于确定所述最优编码模式对应的非零DCT系数数目;所述非零系数数目确定子模块,包括:
预测单元,用于根据所述最优编码模式确定所述当前编码单元对应的预测图像;
残差计算单元,用于将所述预测图像和所述当前编码单元对应的源图像相减得到对应的残差;
量化单元,用于对所述残差执行DCT变换以及量化操作,得到非零DCT系数数目。
可选地,所述装置还包括:Merge模式决策模块,用于对当前编码单元进行Merge模式决策;所述Merge模式决策模块,包括:
建立子模块,用于对所述当前编码单元构建Merge候选列表;
计算子模块,用于对所述Merge候选列表中的候选运动向量计算率失真花费;
确定子模块,用于选择率失真花费最小的候选运动向量作为最优运动向量,所述最优运动向量对应的Merge候选模式为最优Merge模式。
与现有技术相比,本发明实施例包括以下优点:
本发明实施例在对编码单元进行编码的过程中,首先对当前编码单元分别进行帧间Merge模式决策和帧间2N×2N模式决策,得到最优编码模式。如果所述最优编码模式满足终止决策条件,即可终止对所述当前编码单元的模式决策过程。如果通过帧间Merge模式和帧间2N×2N模式这两种模式决策得到的最优编码模式满足终止决策条件,说明所述最优编码模式已经可以达到预期的编码效果,即可提前终止对所述当前编码单元的模式决策过程。因此,本发明实施例可以避免遍历计算所有帧内模式和帧间模式的率失真花费,从而可以减少模式决策过程中选择预测模式所需要的计算量,进而能够在一定程度减少编码过程中的运算量及复杂度,降低编码的复杂度和编码时间。此外,本发明实施例能够有效降低选择预测模式花费的时间,进而可以满足一些实时性要求较高的场景的需求。
附图说明
图1示出了本发明实施例的一种编码单元的模式决策方法的步骤流程图;
图2示出了本发明实施例的一种编码单元的模式决策装置的结构框图;
图3示出了本发明实施例的另一种编码单元的模式决策装置的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
方法实施例
参照图1,示出了本发明实施例的一种编码单元的模式决策方法的步骤流程图,具体可以包括如下步骤:
步骤101、对当前编码单元分别进行帧间Merge模式决策和帧间2N×2N模式决策,得到最优编码模式;
步骤102、确定所述最优编码模式对应的非零DCT系数数目和最小率失真花费;
步骤103、在非零DCT系数数目和最小率失真花费满足终止决策条件时,终止对所述当前编码单元的模式决策。
本发明实施例可应用于各种电子设备中的视频编码器,在视频编码器对视频图像进行编码的过程中,在满足终止决策条件时,可以提前终止对编码单元模式决策的计算过程,避免对当前编码单元遍历计算所有帧内模式和帧间模式的率失真花费,从而能够在一定程度上减少当前编码单元模式决策过程中的运算量及复杂度,进一步地可以降低编码的复杂度和编码时间。可以理解,所述电子设备具体可以包括:移动电话、无线装置、个人数据助理、手持式或便携式计算机、GPS(Global Positioning System,全球定位系统)接收机/导航器、照相机、音频/视频播放器、摄像机、录像机、监控设备等,本发明实施例对于所述电子设备的具体形式不加以限制。
需要说明的是,在对编码单元进行编码的过程中,首先需要对编码单元进行预测,以得到预测图像;然后对残差进行DCT(Discrete CosineTransform,离散余弦变换)编码。其中,残差为将预测图像和当前编码单元对应的源图像相减得到。本发明实施例中所述的非零DCT系数数目具体指对残差进行DCT变换,以及量化后得到的非零DCT系数数目。具体地,所述确定所述最优编码模式对应的非零DCT系数数目的步骤,具体可以包括:
步骤S11、根据所述最优编码模式确定所述当前编码单元对应的预测图像;
步骤S12、将所述预测图像和所述当前编码单元对应的源图像相减得到对应的残差;
步骤S13、对所述残差执行DCT变换以及量化操作,得到非零DCT系数数目。
在具体应用中,DCT是指将一组光强数据转换成频率数据,通过DCT变换可以将原始图像信息块转换成代表不同频率分量的DCT系数集,量化实际上就是对DCT系数的一个优化过程,利用人眼对高频数据不敏感的特性来实现数据的大幅简化。量化的目的是减小非零DCT系数的数目以及增加零值DCT系数的数目。
由于在实际的编码过程中,对于一个任意尺寸的CU,帧间Merge模式和帧间2N×2N模式使用的比例显著高于其它的PU划分模式。因此,本发明实施例首先对当前编码单元分别进行帧间Merge模式决策和帧间2N×2N模式决策,得到最优编码模式。如果通过这两种模式决策得到的最优编码模式满足终止决策条件时,说明所述最优编码模式已经可以达到预期的编码效果,即可终止对所述当前编码单元的模式决策过程,也即可以节省对其它7种帧间预测模式以及两种帧内预测模式的率失真花费计算过程,减少了预测模式选择过程所需要的计算量,能够有效降低预测模式选择的耗时,进而可以满足一些实时性要求较高的场景的需求。
在具体应用中,帧间预测采用Merge模式时,不需要进行复杂的运动估计,只有运动补偿。当前PU的运动信息(包括运动矢量、参考索引、预测模式)都可以通过相邻PU的运动信息推导得到。编码时,当前PU只需要传送合并标记(Merge Flag)以及合并索引(Merge Index),无需传送其运动信息。这样可以大幅度节省运动信息的编码比特数,并且可以减少编码的复杂度。因此,本发明实施例首先对当前编码单元进行Merge模式决策,可选地,所述对当前编码单元进行Merge模式决策的步骤,具体可以包括:
步骤S21、对所述当前编码单元构建Merge候选列表;
步骤S22、对所述Merge候选列表中的候选运动向量计算率失真花费;
步骤S23、选择率失真花费最小的候选运动向量作为最优运动向量,所述最优运动向量对应的Merge候选模式为最优Merge模式。
具体地,首先为当前CU建立一个Merge候选列表,该候选列表中包括若干Merge候选模式对应的候选运动向量MV及参考图像。通过遍历这些候选MV,确定其对应的TU划分模式,以及计算每个候选MV对应的率失真花费,最终选取率失真花费最小的候选MV作为最优MV,所述最优MV对应的Merge候选模式为最优Merge模式。若编码器依照相同的方式建立该候选列表,则编码器只需要传输最优MV在候选列表中的索引即可,这样大幅度节省了运动信息的编码比特数。
在本发明实施例中,可以先对当前编码单元进行帧间Merge模式决策,得到最优Merge模式,再对当前编码单元再进行帧间2N×2N模式决策,得到最优2N×2N模式,最后选择最优Merge模式和最优2N×2N模式中率失真花费最小的一个作为最优编码模式,且对应的率失真花费为最小率失真花费。
在本发明实施例中,计算率失真花费的过程可以通过现有的率失真花费计算公式所得到,此处不再赘述。在确定所述最优编码模式对应的非零DCT系数数目和最小率失真花费之后,可以判断所述非零DCT系数数目和最小率失真花费是否满足终止决策条件,若满足,则终止对所述当前编码单元的模式决策。
在本发明的一种可选实施例中,所述终止决策条件具体可以包括:
所述非零DCT系数数目小于第一阈值,且所述最小率失真花费小于第二阈值;其中,所述第一阈值、所述第二阈值为依据所述当前编码单元的尺寸参数、以及均匀运动场参数所确定。
具体地,所述终止决策条件可以包括如下不等式:
coefnum<coefnum_th(cu_width,is_mvf_all_eq) (1)
rdcost<rdcost_th(cu_width,is_mvf_all_eq) (2)
其中,coefnum为非零DCT系数数目,coefnum_th为第一阈值,rdcost为最小率失真花费,rdcost_th为第二阈值。需要说明的是,所述第一阈值coefnum_th和第二阈值rdcost_th,可以为通过运行编码器,根据大量的测试结果测试得到的经验值。
在具体应用中,coefnum的值越大,说明当前编码单元的预测越不精确,残差越多;rdcost的值越大说明当前编码单元的复杂度越高,该编码单元需要的预测花费和残差的DCT变换花费都较多。本发明实施例可以预置较小的第一阈值coefnum_th和第二阈值rdcost_th,使得在满足上述终止决策条件时,表示coefnum和rdcost的值都比较小,在这种情况下,说明当前编码单元的复杂度较低,按照当前PU划分模式进行预测已经很精确了,不需要再决策当前CU的2N×N模式、N×2N模式以及4个非对称模式的情况。因此,可以节省一部分CU模式的计算过程,从而极大节省计算复杂度。
在本发明实施例中,所述coefnum_th为依据cu_width、以及is_mvf_all_eq所确定。其中,所述cu_width为当前编码单元的尺寸。所述is_mvf_all_eq为当前编码单元的均匀运动场参数,在is_mvf_all_eq为1时,表示当前编码单元的各部分具有相同的运动场;在is_mvf_all_eq为0时,表示当前编码单元的各部分不具有相同的运动场。具体地,coefnum_th的值随cu_width的增加而增大;coefnum_th的值在is_mvf_all_eq为1时比在is_mvf_all_eq为0时显著增大。
在本发明的一种可选实施例中,可以通过如下步骤确定所述均匀运动场参数:
步骤S31、确定所述当前编码单元的最优参考索引;
具体地,可以确定当前编码单元2N×2N模式的最优参考索引best_ref,如果当前编码单元的2N×2N模式是双向运动补偿,那么可以存在两个最优参考索引,则从中随意选择一个即可。
步骤S32、将所述当前编码单元划分为多个子编码单元;
具体地,可以将当前编码单元划分为4个N×N子编码单元。
步骤S33、以所述最优参考索引对应的最优运动向量为参考,对所述多个子编码单元分别进行运动估计,以得到所述多个子编码单元分别对应的运动向量;
具体地,可以最优参考索引对应的最优运动向量best_mv为参考,对上述4个子编码单元分别执行一次运动估计,以得到所述子编码单元对应的运动向量。
步骤S34、在所有的子编码单元对应的运动向量均和所述最优运动向量相同时,设置所述编码单元的均匀运动场参数为1;否则,设置所述编码单元的均匀运动场参数为0。
具体地,在所述4个子编码单元对应的运动向量均和best_mv相同时,则,可以确定当前编码单元具有均匀运动场,则设置变量is_mvf_all_eq的值为1;否则,可以确定当前编码单元不具有均匀运动场,则设置变量is_mvf_all_eq的值为0。
综上,本发明实施例在对编码单元进行编码的过程中,首先对当前编码单元分别进行帧间Merge模式决策和帧间2N×2N模式决策,得到最优编码模式。如果所述最优编码模式满足终止决策条件,即可终止对所述当前编码单元的模式决策过程。如果通过帧间Merge模式和帧间2N×2N模式这两种模式决策得到的最优编码模式满足终止决策条件,说明所述最优编码模式已经可以达到预期的编码效果,即可提前终止对所述当前编码单元的模式决策过程。因此,本发明实施例可以避免遍历计算所有帧内模式和帧间模式的率失真花费,从而可以减少模式决策过程中选择预测模式所需要的计算量,进而能够在一定程度减少编码过程中的运算量及复杂度,降低编码的复杂度和编码时间。此外,本发明实施例能够有效降低选择预测模式花费的时间,进而可以满足一些实时性要求较高的场景的需求。
应用示例
为了使本领域技术人员更加理解本发明实施例的编码单元的模式决策方法,下面通过具体示例说明本发明实施例的实现过程。
对于当前CU,首先,分别决策其帧间Merge模式和帧间2N×2N模式,得到其中率失真花费最小的模式,以及得到非零DCT系数数目coefnum和最小率失真花费rdcost。
然后,获得当前CU的2N×2N模式的一个最优参考索引best_ref(如果当前CU的2N×2N模式是双向运动补偿,那么最优参考索引是2个,随意选择一个即可),将当前CU块划分为四个N×N块,以最优参考索引对应的2N×2N的最优运动向量best_mv为参考,分别执行一次运动估计,判断其运动向量是否全部和best_mv相同,如果相同,设置is_mvf_all_eq为1,否则为0。
最后,判断如下两个不等式是否成立,若成立,则终止当前CU的模式决策过程。
coefnum<coefnum_th(cu_width,is_mvf_all_eq)
rdcost<rdcost_th(cu_width,is_mvf_all_eq)
本发明改进了CU的模式决策算法,可以节省一部分CU模式的计算量,从而极大节省计算复杂度。具体地,可以加速H.265编码器11%,而压缩效率损失仅为0.5%。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
装置实施例
参照图2,示出了本发明实施例的一种编码单元的模式决策装置的结构框图,具体可以包括如下模块:
模式确定模块210,用于对当前编码单元分别进行Merge模式决策和2N×2N模式决策,得到最优编码模式;
参数确定模块220,用于确定所述最优编码模式对应的非零DCT系数数目和最小率失真花费;
条件判断模块230,用于在非零DCT系数数目和最小率失真花费满足终止决策条件时,终止对所述当前编码单元的模式决策。
在本发明的一种可选实施例中,所述终止决策条件具体可以包括:
所述非零DCT系数数目小于第一阈值,且所述最小率失真花费小于第二阈值;其中,所述第一阈值、所述第二阈值为依据所述当前编码单元的尺寸参数、以及均匀运动场参数所确定。
参照图3,示出了本发明实施例的另一种编码单元的模式决策装置的结构框图。具体可以包括如下模块:模式确定模块310、参数确定模块320、条件判断模块330、运动场参数确定模块340;
其中,所述运动场参数确定模块340,用于确定均匀运动场参数;所述运动场参数确定模块340,具体可以包括:
索引确定子模块341,用于确定所述当前编码单元的最优参考索引;
划分子模块342,用于将所述当前编码单元划分为多个子编码单元;
运动估计子模块343,用于以所述最优参考索引对应的最优运动向量为参考,对所述多个子编码单元分别进行运动估计,以得到所述多个子编码单元分别对应的运动向量;
参数确定子模块344,用于在所有的子编码单元对应的运动向量均和所述最优运动向量相同时,设置所述当前编码单元的均匀运动场参数为1;否则,设置所述当前编码单元的均匀运动场参数为0。
在本发明的一种可选实施例中,所述参数确定模块320,具体可以包括:非零系数数目确定子模块321,用于确定所述最优编码模式对应的非零DCT系数数目;所述非零系数数目确定子模块321,具体可以包括:
预测单元3211,用于根据所述最优编码模式确定所述当前编码单元对应的预测图像;
残差计算单元3212,用于将所述预测图像和所述当前编码单元对应的源图像相减得到对应的残差;
量化单元3213,用于对所述残差执行DCT变换以及量化操作,得到非零DCT系数数目。
在本发明的另一种可选实施例中,所述装置还可以包括:Merge模式决策模块350,用于对当前编码单元进行Merge模式决策;所述Merge模式决策模块350,具体可以包括:
建立子模块351,用于对所述当前编码单元构建Merge候选列表;
计算子模块352,用于对所述Merge候选列表中的候选运动向量计算率失真花费;
确定子模块353,用于选择率失真花费最小的候选运动向量作为最优运动向量,所述最优运动向量对应的Merge候选模式为最优Merge模式。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种编码单元的模式决策方法和装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种编码单元的模式决策方法,其特征在于,所述方法包括:
对当前编码单元分别进行Merge模式决策和2N×2N模式决策,得到最优编码模式;
确定所述最优编码模式对应的非零DCT系数数目和最小率失真花费;
在非零DCT系数数目和最小率失真花费满足终止决策条件时,终止对所述当前编码单元的模式决策。
2.如权利要求1所述的方法,其特征在于,所述终止决策条件包括:
所述非零DCT系数数目小于第一阈值,且所述最小率失真花费小于第二阈值;其中,所述第一阈值、所述第二阈值为依据所述当前编码单元的尺寸参数、以及均匀运动场参数所确定。
3.如权利要求2所述的方法,其特征在于,通过如下步骤确定所述均匀运动场参数:
确定所述当前编码单元的最优参考索引;
将所述当前编码单元划分为多个子编码单元;
以所述最优参考索引对应的最优运动向量为参考,对所述多个子编码单元分别进行运动估计,以得到所述多个子编码单元分别对应的运动向量;
在所有的子编码单元对应的运动向量均和所述最优运动向量相同时,设置所述当前编码单元的均匀运动场参数为1;否则,设置所述当前编码单元的均匀运动场参数为0。
4.如权利要求1至3任一所述的方法,其特征在于,所述确定所述最优编码模式对应的非零DCT系数数目的步骤,包括:
根据所述最优编码模式确定所述当前编码单元对应的预测图像;
将所述预测图像和所述当前编码单元对应的源图像相减得到对应的残差;
对所述残差执行DCT变换以及量化操作,得到非零DCT系数数目。
5.如权利要求1至3任一所述的方法,其特征在于,所述对当前编码单元进行Merge模式决策的步骤,包括:
对所述当前编码单元构建Merge候选列表;
对所述Merge候选列表中的候选运动向量计算率失真花费;
选择率失真花费最小的候选运动向量作为最优运动向量,所述最优运动向量对应的Merge候选模式为最优Merge模式。
6.一种编码单元的模式决策装置,其特征在于,所述装置包括:
模式确定模块,用于对当前编码单元分别进行Merge模式决策和2N×2N模式决策,得到最优编码模式;
参数确定模块,用于确定所述最优编码模式对应的非零DCT系数数目和最小率失真花费;
条件判断模块,用于在非零DCT系数数目和最小率失真花费满足终止决策条件时,终止对所述当前编码单元的模式决策。
7.如权利要求6所述的装置,其特征在于,所述终止决策条件包括:
所述非零DCT系数数目小于第一阈值,且所述最小率失真花费小于第二阈值;其中,所述第一阈值、所述第二阈值为依据所述当前编码单元的尺寸参数、以及均匀运动场参数所确定。
8.如权利要求7所述的装置,其特征在于,所述装置还包括:运动场参数确定模块,用于确定均匀运动场参数;所述运动场参数确定模块,包括:
索引确定子模块,用于确定所述当前编码单元的最优参考索引;
划分子模块,用于将所述当前编码单元划分为多个子编码单元;
运动估计子模块,用于以所述最优参考索引对应的最优运动向量为参考,对所述多个子编码单元分别进行运动估计,以得到所述多个子编码单元分别对应的运动向量;
参数确定子模块,用于在所有的子编码单元对应的运动向量均和所述最优运动向量相同时,设置所述当前编码单元的均匀运动场参数为1;否则,设置所述当前编码单元的均匀运动场参数为0。
9.如权利要求6至8任一所述的装置,其特征在于,所述参数确定模块包括:非零系数数目确定子模块,用于确定所述最优编码模式对应的非零DCT系数数目;所述非零系数数目确定子模块,包括:
预测单元,用于根据所述最优编码模式确定所述当前编码单元对应的预测图像;
残差计算单元,用于将所述预测图像和所述当前编码单元对应的源图像相减得到对应的残差;
量化单元,用于对所述残差执行DCT变换以及量化操作,得到非零DCT系数数目。
10.根据权利要求6至8任一所述的装置,其特征在于,所述装置还包括:Merge模式决策模块,用于对当前编码单元进行Merge模式决策;所述Merge模式决策模块,包括:
建立子模块,用于对所述当前编码单元构建Merge候选列表;
计算子模块,用于对所述Merge候选列表中的候选运动向量计算率失真花费;
确定子模块,用于选择率失真花费最小的候选运动向量作为最优运动向量,所述最优运动向量对应的Merge候选模式为最优Merge模式。
CN201610262469.1A 2016-04-25 2016-04-25 一种编码单元的模式决策方法和装置 Active CN105933717B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610262469.1A CN105933717B (zh) 2016-04-25 2016-04-25 一种编码单元的模式决策方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610262469.1A CN105933717B (zh) 2016-04-25 2016-04-25 一种编码单元的模式决策方法和装置

Publications (2)

Publication Number Publication Date
CN105933717A true CN105933717A (zh) 2016-09-07
CN105933717B CN105933717B (zh) 2019-03-12

Family

ID=56836992

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610262469.1A Active CN105933717B (zh) 2016-04-25 2016-04-25 一种编码单元的模式决策方法和装置

Country Status (1)

Country Link
CN (1) CN105933717B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107566846A (zh) * 2017-09-20 2018-01-09 北京维境视讯信息技术有限公司 视频编码跳过模式决策方法、装置、设备及存储介质
CN108156458A (zh) * 2017-12-28 2018-06-12 北京奇艺世纪科技有限公司 一种确定编码模式方法及装置
CN108322741A (zh) * 2018-01-31 2018-07-24 北京奇艺世纪科技有限公司 一种确定编码模式的方法及装置
WO2018201954A1 (zh) * 2017-05-03 2018-11-08 腾讯科技(深圳)有限公司 视频编码处理方法、装置及存储介质
WO2019085942A1 (zh) * 2017-11-01 2019-05-09 北京金山云网络技术有限公司 Sao模式决策方法、装置、电子设备及可读存储介质
CN109788287A (zh) * 2017-11-10 2019-05-21 腾讯科技(深圳)有限公司 视频编码方法、装置、计算机设备和存储介质
CN110351557A (zh) * 2018-04-03 2019-10-18 朱政 视频编码中一种快速帧间预测编码方法
CN110351552A (zh) * 2018-04-03 2019-10-18 朱政 视频编码中一种快速编码方法
CN110381311A (zh) * 2019-07-01 2019-10-25 腾讯科技(深圳)有限公司 视频帧的编码方法、装置、计算机可读介质及电子设备
CN110611813A (zh) * 2019-10-28 2019-12-24 北京达佳互联信息技术有限公司 视频合并编码场景下的最优候选获取方法及装置
CN111246212A (zh) * 2020-02-21 2020-06-05 北京大学 一种基于编解码端的几何划分模式预测方法、装置、存储介质及终端
CN112866711A (zh) * 2021-01-07 2021-05-28 北京博雅慧视智能技术研究院有限公司 一种视频编码中模式决策电路
CN117376551A (zh) * 2023-12-04 2024-01-09 淘宝(中国)软件有限公司 视频编码加速方法及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1482810A (zh) * 2002-08-13 2004-03-17 三星电子株式会社 通过参考离散余弦变换系数来估计运动的方法及其装置
CN101026756A (zh) * 2007-03-23 2007-08-29 武汉大学 视频转码中帧间模式的快速选择方法
CN101141647A (zh) * 2007-08-24 2008-03-12 上海广电(集团)有限公司中央研究院 基于avs视频编码的快速帧间预测模式选择方法
CN101141649A (zh) * 2007-07-31 2008-03-12 北京大学 用于视频编码的帧内预测编码最佳模式的选取方法及装置
US8326067B2 (en) * 2009-02-27 2012-12-04 Research In Motion Limited Optimization of image encoding using perceptual weighting
CN103581670A (zh) * 2013-10-09 2014-02-12 合一网络技术(北京)有限公司 H264自适应帧内模式选择码率估计的率失真优化方法及其装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1482810A (zh) * 2002-08-13 2004-03-17 三星电子株式会社 通过参考离散余弦变换系数来估计运动的方法及其装置
CN101026756A (zh) * 2007-03-23 2007-08-29 武汉大学 视频转码中帧间模式的快速选择方法
CN101141649A (zh) * 2007-07-31 2008-03-12 北京大学 用于视频编码的帧内预测编码最佳模式的选取方法及装置
CN101141647A (zh) * 2007-08-24 2008-03-12 上海广电(集团)有限公司中央研究院 基于avs视频编码的快速帧间预测模式选择方法
US8326067B2 (en) * 2009-02-27 2012-12-04 Research In Motion Limited Optimization of image encoding using perceptual weighting
CN103581670A (zh) * 2013-10-09 2014-02-12 合一网络技术(北京)有限公司 H264自适应帧内模式选择码率估计的率失真优化方法及其装置

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10791326B2 (en) 2017-05-03 2020-09-29 Tencent Technology (Shenzhen) Company Limited Video coding processing method and apparatus, and storage medium
WO2018201954A1 (zh) * 2017-05-03 2018-11-08 腾讯科技(深圳)有限公司 视频编码处理方法、装置及存储介质
CN107566846A (zh) * 2017-09-20 2018-01-09 北京维境视讯信息技术有限公司 视频编码跳过模式决策方法、装置、设备及存储介质
CN107566846B (zh) * 2017-09-20 2020-04-14 北京字节跳动网络技术有限公司 视频编码跳过模式决策方法、装置、设备及存储介质
WO2019085942A1 (zh) * 2017-11-01 2019-05-09 北京金山云网络技术有限公司 Sao模式决策方法、装置、电子设备及可读存储介质
CN109788287A (zh) * 2017-11-10 2019-05-21 腾讯科技(深圳)有限公司 视频编码方法、装置、计算机设备和存储介质
CN108156458B (zh) * 2017-12-28 2020-04-10 北京奇艺世纪科技有限公司 一种确定编码模式方法及装置
CN108156458A (zh) * 2017-12-28 2018-06-12 北京奇艺世纪科技有限公司 一种确定编码模式方法及装置
CN108322741A (zh) * 2018-01-31 2018-07-24 北京奇艺世纪科技有限公司 一种确定编码模式的方法及装置
CN108322741B (zh) * 2018-01-31 2020-08-28 北京奇艺世纪科技有限公司 一种确定编码模式的方法、装置、编码器及可读存储介质
CN110351557A (zh) * 2018-04-03 2019-10-18 朱政 视频编码中一种快速帧间预测编码方法
CN110351552A (zh) * 2018-04-03 2019-10-18 朱政 视频编码中一种快速编码方法
CN110351552B (zh) * 2018-04-03 2021-06-25 杭州微帧信息科技有限公司 视频编码中一种快速编码方法
CN110381311A (zh) * 2019-07-01 2019-10-25 腾讯科技(深圳)有限公司 视频帧的编码方法、装置、计算机可读介质及电子设备
CN110611813A (zh) * 2019-10-28 2019-12-24 北京达佳互联信息技术有限公司 视频合并编码场景下的最优候选获取方法及装置
CN111246212A (zh) * 2020-02-21 2020-06-05 北京大学 一种基于编解码端的几何划分模式预测方法、装置、存储介质及终端
CN111246212B (zh) * 2020-02-21 2022-06-03 北京大学 一种基于编解码端的几何划分模式预测方法、装置、存储介质及终端
CN112866711A (zh) * 2021-01-07 2021-05-28 北京博雅慧视智能技术研究院有限公司 一种视频编码中模式决策电路
CN112866711B (zh) * 2021-01-07 2022-10-21 北京博雅慧视智能技术研究院有限公司 一种视频编码中模式决策电路
CN117376551A (zh) * 2023-12-04 2024-01-09 淘宝(中国)软件有限公司 视频编码加速方法及电子设备
CN117376551B (zh) * 2023-12-04 2024-02-23 淘宝(中国)软件有限公司 视频编码加速方法及电子设备

Also Published As

Publication number Publication date
CN105933717B (zh) 2019-03-12

Similar Documents

Publication Publication Date Title
CN105933717A (zh) 一种编码单元的模式决策方法和装置
JP6334006B2 (ja) ビデオ符号化用の高コンテンツ適応型品質回復フィルタ処理のためのシステムおよび方法
CN104754355B (zh) 一种图像解码设备
CN103843345B (zh) 编码设备、解码设备、编码方法和解码方法
CN107071465B (zh) 动态图像预测解码装置及方法
US20140126635A1 (en) Optimal intra prediction in block-based video coding
CN107113425A (zh) 视频编码方法和设备以及视频解码方法和设备
CN105959699B (zh) 一种基于运动估计和时空域相关性的快速帧间预测方法
CN108632626A (zh) 推导参考预测模式值的方法
CN109155856A (zh) 用于视频编解码的利用近邻块模式的运动估计的方法和系统
CN109672894A (zh) 一种帧间预测方法、装置及存储介质
CN110312130A (zh) 基于三角模式的帧间预测、视频编码方法及设备
CN109587491A (zh) 一种帧内预测方法、装置及存储介质
CN108353175A (zh) 使用系数引起的预测处理视频信号的方法和装置
CN110351554A (zh) 用于视频编码的分割和模式决策的生成
CN104811729A (zh) 一种视频多参考帧编码方法
CN110169062A (zh) 去块滤波控制
CN105933718B (zh) 一种编码单元的分割方法和装置
CN107690069A (zh) 一种数据驱动的级联视频编码方法
CN110198442A (zh) 一种用于视频编码的帧内预测方法、装置和存储介质
CN109889838A (zh) 一种基于roi区域的hevc快速编码方法
CN110971896A (zh) 一种h.265编码方法和装置
Si et al. Fast Adaptive CU Partition Decision Algorithm for VVC Intra Coding
CN103475883A (zh) 一种基于运动区域划分的hevc运动估计提前终止方法
CN104247431B (zh) 性能和带宽高效的分数运动估计

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant