CN111182298A - 一种编码模式的确定方法、装置、设备和存储介质 - Google Patents
一种编码模式的确定方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN111182298A CN111182298A CN202010193743.0A CN202010193743A CN111182298A CN 111182298 A CN111182298 A CN 111182298A CN 202010193743 A CN202010193743 A CN 202010193743A CN 111182298 A CN111182298 A CN 111182298A
- Authority
- CN
- China
- Prior art keywords
- coding
- cost
- under
- unit
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 230000009466 transformation Effects 0.000 claims abstract description 95
- 238000005457 optimization Methods 0.000 claims abstract description 50
- 230000010354 integration Effects 0.000 claims abstract description 25
- 238000004590 computer program Methods 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 abstract description 13
- 230000008569 process Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 7
- 238000013139 quantization Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明实施例公开了一种编码模式的确定方法、装置、设备和存储介质,其中,该方法包括:将每一编码规格下的编码单元划分出该编码规格相邻的下一编码规格下的变换单元,并计算各变换单元的编码代价;依次对同一编码规格下的编码单元和变换单元进行代价最优化整合,得到最优编码代价下的整体编码模式。本发明实施例提供的技术方案,使得采用该整体编码模式进行视频编码时的编码代价能够达到最低,保证不同视频下所采用的视频编码模式的自适应性,降低视频编码的计算开销,进而提高视频编码速率。
Description
技术领域
本发明实施例涉及视频编码技术领域,尤其涉及一种编码模式的确定方法、装置、设备和存储介质。
背景技术
目前,视频编码通常以编码单元(Coding Unit,CU)为基本单位进行编码的,此时编码单元CU存在64*64、32*32、16*16和8*8四种尺寸,在视频编码过程中均需要从64*64尺寸的CU到8*8尺寸的CU进行四叉树递归尝试,以便选出最优效率下的编码尺寸,此时64*64尺寸的CU所处的递归深度为0,每向下递归一次深度加1,8*8尺寸的CU所处的递归深度为3,同时在每一递归深度上,对当前不递归的CU下的编码代价与当前CU在递归后划分出的4个小CU的编码代价之和进行比对,从而判断该递归深度下是否需要进行递归划分。
每一CU通常包括变换单元(Transform Unit,TU)和预测单元(Prediction Unit,PU)两部分,TU主要考虑到视频编码码率和失真度的影响而执行基本的率失真优化(RateDistortion Optimization,RDO)过程,PU主要尝试在不同预测模式下计算CU递归划分为各个TU后执行RDO过程下的编码代价;如图1所示,PU尝试在每一预测模式(如MERGE/SKIP/2Nx2N/BIDIR/2NxN/Nx2N/2NxnD/2NxnU/nRx2N/nLx2N/Intra2Nx2N/IntraNxN12种)下,得到TU执行过程中的预测数据,进而对所计算出的残差数据进行变换、量化和熵编码得到当前预测模式下的编码码率,同时对量化后的残差数据进行反量化和反变换得到对应的重构数据,进而与原始的残差数据进行比对得到对应的编码失真,进而根据该编码码率和编码失真计算出该预测模式下的编码代价,依此分别计算每一递归深度下当前不递归CU下的编码代价及当前CU在递归后划分出的4个小CU的编码代价之和,从而判断当前CU是否需要进行递归划分;此时从64*64尺寸的CU到8*8尺寸的CU下的每种递归情况均需要基于该CU下划分的TU逐一计算对应的编码代价,造成大量的计算负担,增加了视频编码的资源开销。
因此,为了减少CU在递归划分时TU的计算开销,通常存在如下两种方式:1)采用量化域的系数预估编码失真,同时建立码率模型来预估编码码率,从而无需进行残差数据的反量化和反变换过程,但对编码失真和编码码率预估的准确性要求较高,一旦预估不准确就会造成加大的视频编码损失;2)根据已有编码信息或者计算分析各个TU下的视频纹理以决定是否需要进行递归划分,此时会增加额外的计算量,同时采用统一计算编码代价的方式会损失不同分量下的编码质量。
发明内容
本发明实施例提供了一种编码模式的确定方法、装置、设备和存储介质,降低视频编码的计算开销,保证视频编码模式的自适应性。
第一方面,本发明实施例提供了一种编码模式的确定方法,该方法包括:
将每一编码规格下的编码单元划分出该编码规格相邻的下一编码规格下的变换单元,并计算各所述变换单元的编码代价;
依次对同一编码规格下的编码单元和变换单元进行代价最优化整合,得到最优编码代价下的整体编码模式。
第二方面,本发明实施例提供了一种编码模式的确定装置,该装置包括:
编码划分模块,用于将每一编码规格下的编码单元划分出该编码规格相邻的下一编码规格下的变换单元,并计算各所述变换单元的编码代价;
编码模式优化模块,用于依次对同一编码规格下的编码单元和变换单元进行代价最优化整合,得到最优编码代价下的整体编码模式。
第三方面,本发明实施例提供了一种设备,该设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所述的编码模式的确定方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所述的编码模式的确定方法。
本发明实施例提供的一种编码模式的确定方法、装置、设备和存储介质,首先将每一编码规格下的编码单元均划分出该编码规格相邻的下一编码规格下的变换单元,并计算出划分后的各个变换单元的编码代价,从而依次对同一编码规格下的编码单元和变换单元进行代价最优化整合,得到最优编码代价下的整体编码模式,使得采用该整体编码模式进行视频编码时的编码代价能够达到最低,保证不同视频下所采用的视频编码模式的自适应性,降低视频编码的计算开销,进而提高视频编码速率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1A为本发明实施例一提供的一种编码模式的确定方法的流程图;
图1B为本发明实施例一提供的编码模式的确定过程的原理示意图;
图2A为本发明实施例二提供的一种编码模式的确定方法的流程图;
图2B为本发明实施例二提供的方法中对同一编码规格下的编码单元和变换单元进行代价最优化整合的原理示意图;
图3为本发明实施例三提供的一种编码模式的确定装置的结构示意图;
图4为本发明实施例四提供的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。此外,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例一
图1A为本发明实施例一提供的一种编码模式的确定方法的流程图,本实施例可适用于对任一视频存在编码需求的场景中。本实施例提供的编码模式的确定方法可以由本发明实施例提供的编码模式的确定装置来执行,该装置可以通过软件和/或硬件的方式来实现,并集成在执行本方法的设备中,该设备可以是参与视频数据交互的后台服务器。
具体的,参考图1A,该方法可以包括如下步骤:
S110,将每一编码规格下的编码单元划分出该编码规格相邻的下一编码规格下的变换单元,并计算各变换单元的编码代价。
具体的,视频编码通常以编码单元CU为基本单位进行编码,本实施例这种的编码规格是指现有的编码单元CU包含的尺寸大小,此时编码单元CU存在64*64、32*32、16*16和8*8这四种编码规格,目前在视频编码过程中需要从最大编码规格下的编码单元开始,不断进行四叉树递归尝试,直至递归到最小编码规格下的编码单元,从而在每一编码格式下递归前后的编码单元中选取出最优效率的编码单元,此时在递归后可能会存在多个相同编码规格的编码单元,而且需要分别计算在每一递归深度下递归前后的每一编码单元的编码效率,极大增加了视频编码过程中的计算开销,因此本实施例会针对不同编码规格下的递归进行优化,避免对递归过程中每一编码规格下的多个编码单元均计算对应的编码效率时带来的极大计算开销。
可选的,针对编码单元存在的64*64、32*32、16*16和8*8这四种编码规格,分别在每一编码规格下选出一个对应的编码单元,并对每一编码规格下的编码单元进行相应的划分,此时由于编码规格之间存在相应的比例关系,如图1B所示,本实施例可以将每一编码规格下的编码单元分别划分出该编码规格相邻的下一编码规格下的变换单元TU,例如对于64*64尺寸下的编码单元,能够划分出4个32*32尺寸下的变换单元TU,而32*32尺寸下的编码单元,能够划分出4个16*16尺寸下的变换单元TU,以此类推,8*8尺寸下的编码单元,能够划分出4个4*4尺寸下的变换单元TU,同时针对每一编码规格,在将编码单元划分出对应的变换单元后,可以采用现有的计算方式分别计算出每一编码单元划分出的各个变换单元的编码代价,例如基于率失真优化方式计算对应的编码代价,此时该编码代价的计算公式为RD cost=D+λR,RD cost为当前划分的变换单元的编码代价,D为当前划分的变换单元的编码失真,R为当前划分的变换单元的编码码率,λ为调节因子,用于调节编码码率与编码失真的权重;此时在每一编码规格下,仅需要计算一个编码单元划分出的变换单元的编码代价,避免现有的从最大编码规格下的编码单元开始不断进行四叉树递归尝试,直至递归到最小编码规格下的编码单元时相同编码规格下的多个编码单元的计算开销,从而极大降低视频编码过程中的计算开销,提高视频编码速率。
示例性的,本实施例中计算各变换单元的编码代价,可以具体包括:采用全零块编码方式计算各变化单元的编码代价。此时全零块编码方式能使编码单元划分出的变换单元在执行率失真优化(Rate Distortion Optimization,RDO)过程时的各项系数均为零,从而极大降低编码代价的计算复杂度,提高编码代价的计算效率。同时,视频编码通常会采用YUV420格式的编码器,每一编码规格下的编码单元在划分出对应的变换单元时,会自行计算Y、U、V三个分量下的编码代价,此时可能会陷入局部优化的情况,而本实施例在所有分量划分后,统一计算一次整体的编码代价,此时Y、U、V三个分量下的编码失真已经计算出,在计算编码代价时可以直接使用,无需带来额外的计算量。
需要说明的是,相对于现有技术中从64*64编码规格开始到8*8编码规格下的编码单元的递归,本实施例是将整体递归改为不同编码规格下编码单元的一次划分,此时64*64编码规格下的编码单元对应的最大和最小变换单元TU均为32*32编码规格,32*32编码规格下的编码单元对应的最大变换单元TU为32*32编码规格,而最小变换单元TU为16*16编码规格,16*16编码规格下的编码单元对应的最大变换单元TU为16*16编码规格,而最小变换单元TU为8*8编码规格,8*8编码规格下的编码单元对应的最大变换单元TU为8*8编码规格,而最小变换单元TU为4*4编码规格。此时,对于64*64编码规格下的编码单元,如果外部设定的编码量化参数不为64,则直接对4个32*32编码规格下的全零块进行计算。
此外,由于现有的编码规格之间存在相应的比例关系,本实施例还会预先设定编码规格的相邻关系。
示例性的,按照不同编码规格下对应的尺寸高低,以及各尺寸之间的关联关系,可以将各个编码规格进行高低排序,如64*64编码规格相邻的下一编码规格为32*32,而32*32编码规格相邻的下一编码规格为16*16,以此类推。
S120,依次对同一编码规格下的编码单元和变换单元进行代价最优化整合,得到最优编码代价下的整体编码模式。
具体的,在对每一编码规格下的编码单元进行划分,并计算出划分后的各变换单元的编码代价后,此时对于每一编码规格而言,当前编码规格下的编码单元划分后的变换单元与下一编码规格下的编码单元的尺寸相同,因此同一编码规格下的编码单元和变换单元之间由于尺寸相同则可以相互替换来执行相同的RDO过程,例如64*64编码规格下的编码单元划分后的变换单元是32*32编码规格,32*32编码规格下的编码单元也会划分出4个16*16编码规格下的变换单元,此时64*64编码规格下的编码单元中划分出的32*32编码规格下的变换单元可以与已经划分出4个16*16编码规格下的变换单元的32*32编码规格下的编码单元相互替换,因此如图1B所示,为了保证视频编码过程中的编码代价达到最低,本实施例会依次对同一编码规格下的编码单元和变换单元的编码代价进行比对,而该编码单元的编码代价为该编码单元划分出的各个变换单元的编码代价之和,从而在同一编码规格下选用编码代价较低的单元,例如对于64*64编码规格下的编码单元划分后的4个32*32编码规格下的变换单元,如果64*64编码规格下的编码单元中某一32*32编码规格下的变换单元的编码代价大于32*32编码规格下的编码单元的编码代价,则将该变换单元替换为已经划分出4个16*16编码规格下的变换单元的32*32编码规格下的编码单元,以此类推,继续比对16*16编码规格下的变换单元与已经划分出4个8*8编码规格下的变换单元的16*16编码规格下的编码单元之间的编码代价大小,从而依次对同一编码规格下的编码单元和变换单元进行代价最优化整合,使得在相同编码规格下均选用编码代价较低的单元,得到最优编码代价下的整体编码模式。
本实施例提供的技术方案,首先将每一编码规格下的编码单元均划分出该编码规格相邻的下一编码规格下的变换单元,并计算出划分后的各个变换单元的编码代价,从而依次对同一编码规格下的编码单元和变换单元进行代价最优化整合,得到最优编码代价下的整体编码模式,使得采用该整体编码模式进行视频编码时的编码代价能够达到最低,保证不同视频下所采用的视频编码模式的自适应性,降低视频编码的计算开销,进而提高视频编码速率。
实施例二
图2A为本发明实施例二提供的一种编码模式的确定方法的流程图,图2B为本发明实施例二提供的方法中对同一编码规格下的编码单元和变换单元进行代价最优化整合的原理示意图。本实施例是在上述实施例的基础上进行优化。具体的,如图2A所示,本实施例对于对同一编码规格下的编码单元和变换单元进行代价最优化整合的具体过程进行详细的解释说明。
可选的,如图2A所示,本实施例中可以包括如下步骤:
S210,将每一编码规格下的编码单元划分出该编码规格相邻的下一编码规格下的变换单元,并计算各变换单元的编码代价。
S220,将最大编码规格下编码单元的划分结果作为初始编码模式,并将最大编码规格相邻的下一编码规格作为当前编码规格。
可选的,为了避免对同一编码规格下的编码单元和变换单元进行代价最优化整合时某一编码规格下的整合遗漏,本实施例会按照预先设定的各个编码规格之间的相邻关系,依次对每一编码规格下的编码单元和变换单元进行代价最优化整合,保证代价最优化整合的有序性。
在本实施例中,由于64*64编码规格下的编码单元会划分出32*32编码规格下的变换单元,后续需要通过变换单元执行对应的RDO过程,此时变换单元的最大编码规格为32*32,因此64*64编码规格下的编码单元必定会进行划分,此时将最大编码规格(64*64)下的编码单元划分出的4个次大编码规格(32*32)下的变换单元作为初始编码模式,并将最大编码规格(64*64)相邻的下一编码规格(32*32)作为当前编码规格,以便后续有序对初始编码模式中当前编码规格下的变换单元进行代价最优化整合,保证视频编码的高效性。
S230,依次采用当前编码规格下的编码单元对初始编码模式内在当前编码规格下的每一变换单元进行代价最优化更新,得到新的初始编码模式。
可选的,由于初始编码模式在当前编码规格下会存在上一编码规格下的编码单元划分出的多个变换单元,此时需要依次对每一变换单元进行过代价最优化更新,因此本实施例首先会在初始编码模式下选取出当前编码规格下的每一变换单元,并采用当前编码规格下已经划分出当前编码规格相邻的下一编码规格的变换单元的编码单元,依次与初始编码模式内在当前编码规格下的每一变换单元进行代价最优化比对,如果当前编码规格下的编码单元的编码代价小于该当前编码规格下的某一变换单元的编码代价,则直接将该变换单元替换为当前编码规格下的编码单元,从而得到新的初始编码模式。
示例性的,本实施例中对于采用当前编码规格下的编码单元对初始编码模式内在当前编码规格下的每一变换单元进行代价最优化更新的方式可以包含如下两种:
1)针对初始编码模式内在当前编码规格下的每一变换单元,如果该变换单元的编码代价大于当前编码规格下的编码单元的编码代价,则将该变换单元替换为当前编码规格下的编码单元,否则该变换单元保持不变。
具体的,当前编码规格下的编码单元的编码代价为该编码单元所划分出的当前编码规格相邻的下一编码规格下的各个变换单元的编码代价之和;此时,针对初始编码模式内在当前编码规格下的每一变换单元,分别与当前编码规格下的编码单元进行代价最优化比对,如果某一变换单元的编码代价大于当前编码规格下的编码单元的编码代价,则直接将该变换单元替换为当前编码规格下的编码单元,此时该编码单元内已经划分出当前编码规格相邻的下一编码规格下的变换单元;而如果该变换单元的编码代价小于等于当前编码规格下的编码单元的编码代价,则在该初始编码模式内保留该变换单元,无需替换;从而保证最终得到的整体编码模式内的变换单元的编码代价最优。
需要说明的是,由于当前编码规格下的编码单元的编码代价为该编码单元所划分出的当前编码规格相邻的下一编码规格下的各个变换单元的编码代价之和,而编码单元会划分出多个变换单元,进而会按照一定顺序依次计算每一变换单元的编码代价,此时为了加快对初始编码模式内在当前编码规格下的每一变换单元进行代价最优化更新的速率,本实施例会在确定当前编码规格下的编码单元划分出的前几个变换单元的编码代价之和已经大于或等于初始编码模式内在当前编码规格下的变换单元的编码代价时,则直接跳出该初始编码模式内该变换单元的代价最优化更新,提高编码模式进行代价最优化整合的速率。
2)在初始编码模式内当前编码规格下的变换单元中选取出编码代价大于当前编码规格下的代价阈值的变换单元,将所选取出的变换单元替换为当前编码规格下的编码单元,其他变换单元保持不变。
可选的,由于初始编码模式内在当前编码规格下的每一变换单元均需要与当前编码规格下的编码单元进行代价最优化比对,为了提高编码模式的整合速率,本实施例会通过分析各个编码规格下的编码单元的编码效率,预先在每一编码规格下设定一个对应的代价阈值,该代价阈值用于指示当前编码规格下代价最优化更新时所允许达到的编码代价的最大值;此时采用当前编码规格下的编码单元对初始编码模式内在当前编码规格下的每一变换单元进行代价最优化更新时,首先会在初始编码模式内当前编码规格下的各个变换单元中选取出编码代价大于当前编码规格下的代价阈值的变换单元,所选取出的变换单元的编码代价超出限定,说明该变换单元的编码代价并不是最优的,因此直接将所选取出的变换单元替换为当前编码规格下的编码单元,其他变换单元保持不变。
示例性的,对于各个编码规格下的代价阈值,本实施例可以根据预先构建的代价模型计算每一编码规格下的代价阈值;本实施例会预先分析不同编码格式下的变换单元和编码单元的编码代价最优化比对时所涉及到的各项参数,预先建立对应的代价模型,该代价模型用于自适应计算各个编码规格下的代价阈值;例如假设当前编码规格下的编码单元的编码代价为Jb=Db+λRb,当前编码规格下的变换单元的编码代价为Js=Ds+λRs,此时两者之间编码代价的比对差值为ΔJ=(Ds-Db)+λ(Rs-Rb),如果视频编码块为纹理平坦块,则当前编码规格下的编码单元和变换单元之间的编码失真极为接近,此时Ds-Db最大概率趋于零,此时如果Rs-Rb为正,说明当前编码规格下的编码单元的编码代价较小,如果Rs-Rb为负,说明当前编码规格下的变换单元的编码代价较小,因此本实施例会基于调节因子λ和各个编码规格的大小预先构建出对应的代价模型,本实施例中的代价模型可以为Threshold=α*λ>>(tuDepth+β),其中Threshold为不同编码规格下的编码代价,tuDepth为不同编码规格对应的递归深度,λ可以从编码代价的量化参数查询得到,α和β为代码模型的调节参数,取值范围可以为1~4之间,可以通过离线统计来确定;此时可以通过该代价模型来计算每一编码规格下的代价阈值,以便后续快速对初始编码模式内在当前编码规格下的每一变换单元进行代价最优化更新,从而得到新的初始编码模式。
S240,将当前编码规格相邻的下一编码规格作为新的当前编码规格,继续对新的初始编码模式内在新的当前编码规格下的每一变换单元进行代价最优化更新,直至对最小编码规格下的变换单元进行代价最优化更新,则将最新的初始编码模式作为整体编码模式。
可选的,在依次采用当前编码规格下的编码单元对初始编码模式内在当前编码规格下的每一变换单元进行代价最优化更新后,再次将当前编码规格相邻的下一编码规格作为新的当前编码规格,继续采用上述步骤对新的初始编码模式内在新的当前编码规格下的每一变换单元进行代价最优化更新,直至对最小编码规格下的变换单元进行代价最优化更新后,得到最终的初始编码模式,进而将最新的初始编码模式作为本实施例中代价最优化整合后得到的最优编码代价下的整体编码模式,从而有序完成每一编码规格下的编码单元和变换单元进行代价最优化整合,保证视频编码的高效性。
本实施例提供的技术方案,首先将每一编码规格下的编码单元均划分出该编码规格相邻的下一编码规格下的变换单元,并计算出划分后的各个变换单元的编码代价,从而依次对同一编码规格下的编码单元和变换单元进行代价最优化整合,得到最优编码代价下的整体编码模式,使得采用该整体编码模式进行视频编码时的编码代价能够达到最低,保证不同视频下所采用的视频编码模式的自适应性,降低视频编码的计算开销,进而提高视频编码速率。
实施例三
图3为本发明实施例三提供的一种编码模式的确定装置的结构示意图,具体的,如图3所示,该装置可以包括:
编码划分模块310,用于将每一编码规格下的编码单元划分出该编码规格相邻的下一编码规格下的变换单元,并计算各变换单元的编码代价;
编码模式优化模块320,用于依次对同一编码规格下的编码单元和变换单元进行代价最优化整合,得到最优编码代价下的整体编码模式。
本实施例提供的技术方案,首先将每一编码规格下的编码单元均划分出该编码规格相邻的下一编码规格下的变换单元,并计算出划分后的各个变换单元的编码代价,从而依次对同一编码规格下的编码单元和变换单元进行代价最优化整合,得到最优编码代价下的整体编码模式,使得采用该整体编码模式进行视频编码时的编码代价能够达到最低,保证不同视频下所采用的视频编码模式的自适应性,降低视频编码的计算开销,进而提高视频编码速率。
本实施例提供的编码模式的确定装置可适用于上述任意实施例提供的编码模式的确定方法,具备相应的功能和有益效果。
实施例四
图4为本发明实施例四提供的一种设备的结构示意图,如图4所示,该设备包括处理器40、存储装置41和通信装置42;设备中处理器40的数量可以是一个或多个,图4中以一个处理器40为例;设备中的处理器40、存储装置41和通信装置42可以通过总线或其他方式连接,图4中以通过总线连接为例。
存储装置41作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明任意实施例所述的编码模式的确定方法对应的程序指令/模块。处理器40通过运行存储在存储装置41中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述编码模式的确定方法。
存储装置41可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储装置41可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储装置41可进一步包括相对于处理器40远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
通信装置42可用于实现设备间的网络连接或者移动数据连接。
本实施例提供的一种设备可用于执行上述任意实施例提供的编码模式的确定方法,具备相应的功能和有益效果。
实施例五
本发明实施例五还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时可实现上述任意实施例中的编码模式的确定方法。
该方法具体可以包括:
将每一编码规格下的编码单元划分出该编码规格相邻的下一编码规格下的变换单元,并计算各变换单元的编码代价;
依次对同一编码规格下的编码单元和变换单元进行代价最优化整合,得到最优编码代价下的整体编码模式。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的编码模式的确定方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述编码模式的确定装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种编码模式的确定方法,其特征在于,包括:
将每一编码规格下的编码单元划分出该编码规格相邻的下一编码规格下的变换单元,并计算各所述变换单元的编码代价;
依次对同一编码规格下的编码单元和变换单元进行代价最优化整合,得到最优编码代价下的整体编码模式。
2.根据权利要求1所述的方法,其特征在于,所述依次对同一编码规格下的编码单元和变换单元进行代价最优化整合,包括:
将最大编码规格下编码单元的划分结果作为初始编码模式,并将所述最大编码规格相邻的下一编码规格作为当前编码规格;
依次采用当前编码规格下的编码单元对所述初始编码模式内在当前编码规格下的每一变换单元进行代价最优化更新,得到新的初始编码模式;
将当前编码规格相邻的下一编码规格作为新的当前编码规格,继续对新的初始编码模式内在新的当前编码规格下的每一变换单元进行代价最优化更新,直至对最小编码规格下的变换单元进行代价最优化更新,则将最新的初始编码模式作为所述整体编码模式。
3.根据权利要求2所述的方法,其特征在于,采用当前编码规格下的编码单元对所述初始编码模式内在当前编码规格下的每一变换单元进行代价最优化更新,得到新的初始编码模式,包括:
针对所述初始编码模式内在当前编码规格下的每一变换单元,如果该变换单元的编码代价大于当前编码规格下的编码单元的编码代价,则将该变换单元替换为当前编码规格下的编码单元,否则该变换单元保持不变,当前编码规格下的编码单元的编码代价为该编码单元所划分出的各个变换单元的编码代价之和。
4.根据权利要求2所述的方法,其特征在于,依次采用当前编码规格下的编码单元对所述初始编码模式内在当前编码规格下的每一变换单元进行代价最优化更新,得到新的初始编码模式,包括:
在所述初始编码模式内当前编码规格下的变换单元中选取出编码代价大于当前编码规格下的代价阈值的变换单元,将所选取出的变换单元替换为当前编码规格下的编码单元,其他变换单元保持不变。
5.根据权利要求4所述的方法,其特征在于,还包括:
根据预先构建的代价模型计算每一编码规格下的代价阈值。
6.根据权利要求1-5任一项所述的方法,其特征在于,计算各所述变换单元的编码代价,包括:
采用全零块编码方式计算各所述变化单元的编码代价。
7.根据权利要求1-5任一项所述的方法,其特征在于,还包括:
预先设定编码规格的相邻关系。
8.一种编码模式的确定装置,其特征在于,包括:
编码划分模块,用于将每一编码规格下的编码单元划分出该编码规格相邻的下一编码规格下的变换单元,并计算各所述变换单元的编码代价;
编码模式优化模块,用于依次对同一编码规格下的编码单元和变换单元进行代价最优化整合,得到最优编码代价下的整体编码模式。
9.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的编码模式的确定方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的编码模式的确定方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010193743.0A CN111182298B (zh) | 2020-03-18 | 2020-03-18 | 一种编码模式的确定方法、装置、设备和存储介质 |
PCT/CN2021/077148 WO2021185022A1 (zh) | 2020-03-18 | 2021-02-22 | 编码模式的确定方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010193743.0A CN111182298B (zh) | 2020-03-18 | 2020-03-18 | 一种编码模式的确定方法、装置、设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111182298A true CN111182298A (zh) | 2020-05-19 |
CN111182298B CN111182298B (zh) | 2022-04-12 |
Family
ID=70651612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010193743.0A Active CN111182298B (zh) | 2020-03-18 | 2020-03-18 | 一种编码模式的确定方法、装置、设备和存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111182298B (zh) |
WO (1) | WO2021185022A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021185022A1 (zh) * | 2020-03-18 | 2021-09-23 | 百果园技术(新加坡)有限公司 | 编码模式的确定方法、装置、设备和存储介质 |
CN113596442A (zh) * | 2021-07-07 | 2021-11-02 | 北京百度网讯科技有限公司 | 视频处理方法、装置、电子设备及存储介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117981304A (zh) * | 2021-10-27 | 2024-05-03 | 深圳市大疆创新科技有限公司 | 编码方法、装置、电子设备和计算机可读介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103181169A (zh) * | 2010-10-01 | 2013-06-26 | 高通股份有限公司 | 使用联合上下文模型对系数进行熵译码 |
US20130272415A1 (en) * | 2012-04-17 | 2013-10-17 | Texas Instruments Incorporated | Memory Bandwidth Reduction for Motion Compensation in Video Coding |
CN103733628A (zh) * | 2011-08-08 | 2014-04-16 | 摩托罗拉移动有限责任公司 | 变换单元分割的残差树结构 |
CN105530518A (zh) * | 2014-09-30 | 2016-04-27 | 联想(北京)有限公司 | 一种视频编码、解码方法及装置 |
US20160234495A1 (en) * | 2013-10-01 | 2016-08-11 | Telefonaktiebolaget L M Ericsson (Publ) | Encoder and Method for Video Processing |
US20160373744A1 (en) * | 2014-04-23 | 2016-12-22 | Sony Corporation | Image processing apparatus and image processing method |
CN108933941A (zh) * | 2017-05-26 | 2018-12-04 | 富士通株式会社 | 图像编码方法和装置以及图像解码方法和装置 |
CN110574372A (zh) * | 2017-02-24 | 2019-12-13 | 株式会社Kt | 视频信号处理方法和设备 |
CN110581990A (zh) * | 2019-09-25 | 2019-12-17 | 杭州当虹科技股份有限公司 | 一种适用于hevc 4k和8k超高清编码的tu递归快速算法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9788019B2 (en) * | 2011-03-09 | 2017-10-10 | Hfi Innovation Inc. | Method and apparatus of transform unit partition with reduced complexity |
US9131210B2 (en) * | 2012-03-16 | 2015-09-08 | Texas Instruments Incorporated | Low-complexity two-dimensional (2D) separable transform design with transpose buffer management |
CN104363450B (zh) * | 2014-11-27 | 2017-10-27 | 北京奇艺世纪科技有限公司 | 一种帧内编码模式决策方法及装置 |
CN104902276B (zh) * | 2015-05-15 | 2018-07-06 | 腾讯科技(北京)有限公司 | 变换单元划分方法及装置 |
CN111182298B (zh) * | 2020-03-18 | 2022-04-12 | 广州市百果园信息技术有限公司 | 一种编码模式的确定方法、装置、设备和存储介质 |
-
2020
- 2020-03-18 CN CN202010193743.0A patent/CN111182298B/zh active Active
-
2021
- 2021-02-22 WO PCT/CN2021/077148 patent/WO2021185022A1/zh active Application Filing
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103181169A (zh) * | 2010-10-01 | 2013-06-26 | 高通股份有限公司 | 使用联合上下文模型对系数进行熵译码 |
CN103733628A (zh) * | 2011-08-08 | 2014-04-16 | 摩托罗拉移动有限责任公司 | 变换单元分割的残差树结构 |
US20130272415A1 (en) * | 2012-04-17 | 2013-10-17 | Texas Instruments Incorporated | Memory Bandwidth Reduction for Motion Compensation in Video Coding |
US20160234495A1 (en) * | 2013-10-01 | 2016-08-11 | Telefonaktiebolaget L M Ericsson (Publ) | Encoder and Method for Video Processing |
US20160373744A1 (en) * | 2014-04-23 | 2016-12-22 | Sony Corporation | Image processing apparatus and image processing method |
CN105530518A (zh) * | 2014-09-30 | 2016-04-27 | 联想(北京)有限公司 | 一种视频编码、解码方法及装置 |
CN110574372A (zh) * | 2017-02-24 | 2019-12-13 | 株式会社Kt | 视频信号处理方法和设备 |
CN108933941A (zh) * | 2017-05-26 | 2018-12-04 | 富士通株式会社 | 图像编码方法和装置以及图像解码方法和装置 |
CN110581990A (zh) * | 2019-09-25 | 2019-12-17 | 杭州当虹科技股份有限公司 | 一种适用于hevc 4k和8k超高清编码的tu递归快速算法 |
Non-Patent Citations (3)
Title |
---|
KUANG-HAN TAI: "Acceleration for HEVC Encoder by Bimodal Segmentation of Rate-Distortion Cost and Accurate Determination of Early Termination and Early Split", 《IEEE ACCESS》 * |
吴良堤: "HEVC编码快速算法的研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
杨骁: "基于自适应深度预测的快速变换单元判决算法", 《光电子激光》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021185022A1 (zh) * | 2020-03-18 | 2021-09-23 | 百果园技术(新加坡)有限公司 | 编码模式的确定方法、装置、设备和存储介质 |
CN113596442A (zh) * | 2021-07-07 | 2021-11-02 | 北京百度网讯科技有限公司 | 视频处理方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2021185022A1 (zh) | 2021-09-23 |
CN111182298B (zh) | 2022-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111182298B (zh) | 一种编码模式的确定方法、装置、设备和存储介质 | |
RU2551207C2 (ru) | Способ и устройство для кодирования видео | |
CN112019850B (zh) | 基于场景切换的图像组划分方法、视频编码方法及装置 | |
EP4262205A1 (en) | Video predictive coding method and apparatus | |
JP6953067B2 (ja) | 符号化単位分割決定方法及び装置、コンピューティングデバイス及び読み取り可能な記憶媒体 | |
US11122284B2 (en) | Picture coding device, picture coding method, and picture coding program, and picture decoding device, picture decoding method, and picture decoding program | |
US20240031576A1 (en) | Method and apparatus for video predictive coding | |
WO2020248715A1 (zh) | 基于高效率视频编码的编码管理方法及装置 | |
CN111741297A (zh) | 帧间预测方法、视频编码方法及其相关装置 | |
CN107431809A (zh) | 图像处理的方法和装置 | |
CN111988612B (zh) | 一种视频编码处理方法、装置及电子设备 | |
CN111669602A (zh) | 编码单元的划分方法、装置、编码器及存储介质 | |
CN113068050B (zh) | 树形编码块的样点自适应补偿模式确定方法、装置 | |
CN106231303B (zh) | 一种hevc编码中使用预测模式进行复杂度控制的方法 | |
CN109618152B (zh) | 深度划分编码方法、装置和电子设备 | |
CN110267047B (zh) | 视频帧间运动估计方法、装置、设备及可读存储介质 | |
WO2020258039A1 (zh) | 运动补偿的处理方法、编码器、解码器以及存储介质 | |
CN108702505B (zh) | 一种编码单元划分决策方法、装置、编码器及存储介质 | |
CN113612992B (zh) | 一种针对avs3硬件编码器的快速帧内编码单元的编码方法 | |
CN113542768B (zh) | 运动搜索方法、装置及计算机可读存储介质 | |
CN109788283B (zh) | 一种编码单元分割方法及其系统、装置、存储介质 | |
CN116366839A (zh) | 预测模式的决策方法、装置、设备及存储介质 | |
CN115955572A (zh) | 编码方法、解码方法、电子设备和计算机可读存储介质 | |
CN115665424A (zh) | 图像处理方法、装置、设备、存储介质及程序产品 | |
CN116074537A (zh) | 编码方法、解码方法、电子设备和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20221206 Address after: 31a, 15 / F, building 30, maple mall, bangrang Road, Brazil, Singapore Patentee after: Baiguoyuan Technology (Singapore) Co.,Ltd. Address before: 5-13 / F, West Tower, building C, 274 Xingtai Road, Shiqiao street, Panyu District, Guangzhou, Guangdong 510000 Patentee before: GUANGZHOU BAIGUOYUAN INFORMATION TECHNOLOGY Co.,Ltd. |