CN111988612B - 一种视频编码处理方法、装置及电子设备 - Google Patents
一种视频编码处理方法、装置及电子设备 Download PDFInfo
- Publication number
- CN111988612B CN111988612B CN202010885826.6A CN202010885826A CN111988612B CN 111988612 B CN111988612 B CN 111988612B CN 202010885826 A CN202010885826 A CN 202010885826A CN 111988612 B CN111988612 B CN 111988612B
- Authority
- CN
- China
- Prior art keywords
- distortion cost
- coding
- rate
- rate distortion
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 27
- 238000004364 calculation method Methods 0.000 claims abstract description 80
- 238000012545 processing Methods 0.000 claims abstract description 79
- 238000000034 method Methods 0.000 claims abstract description 50
- 238000004891 communication Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 description 14
- 238000000638 solvent extraction Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 238000005192 partition Methods 0.000 description 5
- QEQYAQFYVFRGQD-YFKPBYRVSA-N (2s)-2-amino-5-[[methyl(nitroso)carbamoyl]amino]pentanoic acid Chemical compound O=NN(C)C(=O)NCCC[C@H](N)C(O)=O QEQYAQFYVFRGQD-YFKPBYRVSA-N 0.000 description 4
- PCTMTFRHKVHKIS-BMFZQQSSSA-N (1s,3r,4e,6e,8e,10e,12e,14e,16e,18s,19r,20r,21s,25r,27r,30r,31r,33s,35r,37s,38r)-3-[(2r,3s,4s,5s,6r)-4-amino-3,5-dihydroxy-6-methyloxan-2-yl]oxy-19,25,27,30,31,33,35,37-octahydroxy-18,20,21-trimethyl-23-oxo-22,39-dioxabicyclo[33.3.1]nonatriaconta-4,6,8,10 Chemical compound C1C=C2C[C@@H](OS(O)(=O)=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2.O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/C=C/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 PCTMTFRHKVHKIS-BMFZQQSSSA-N 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 208000037528 Primary eosinophilic gastrointestinal disease Diseases 0.000 description 2
- 108010001267 Protein Subunits Proteins 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 208000019097 eosinophilic gastrointestinal disease Diseases 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000013441 quality evaluation Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000011056 performance test Methods 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明实施例提供了一种视频编码处理方法、装置及电子设备,该方法包括:获取视频图像帧中的目标编码单元;在N个编码子单元对应的图像区域均存在率失真代价的历史计算值的情况下,根据历史计算值,确定第一划分方式对应的第一率失真代价;N个编码子单元由所述目标编码单元采用所述第一划分方式划分得到;在第一率失真代价大于或等于参考值的情况下,在第二划分方式和不进行划分的方式中确定目标处理方式,第二划分方式为除所述第一划分方式外的划分方式;按照目标处理方式,对目标编码单元进行编码处理;其中,参考值由第二率失真代价确定,第二率失真代价为目标编码单元不进行划分所对应的率失真代价。本发明实施例提升了视频编码处理速度。
Description
技术领域
本发明涉及视频图像处理技术领域,特别是涉及一种视频编码处理方法、装置及电子设备。
背景技术
视频是连续的图像序列,由连续的帧构成,一帧即为一幅图像。由于人眼的视觉暂留效应,当帧序列以一定的速率播放时,我们看到的就是动作连续的视频。由于连续的帧之间相似性极高,为便于储存传输,我们需要对原始的视频进行编码压缩,以去除空间、时间维度的冗余。
在目前主流的视频编码标准下,进行视频编码时,首先会将一帧图像划分成若干互不重叠的编码树单元(Coding Tree Unit,CTU),一帧图像划分成若干CTU后,对于每个CTU,以CTU作为根节点,迭代进行多类型树的划分,可以划分成若干尺寸更小的编码单元(Coding Unit,CU)。对于每个CU可以选择不划分,或者,也可以选择四叉树划分、水平二叉树划分、垂直二叉树划分、水平三叉树划分或垂直三叉树划分,因此在确定每个CU的采用不划分方式,还是采用多种划分方式中的一种时,需要计算不划分的率失真代价,并遍历其他多种划分方式的率失真代价,选择率失真代价最小的划分方式作为最优划分方式。由于目前视频编码可以迭代进行多种划分方式,视频编码处理时需要遍历多种划分方式,并分别计算多种划分方式的率失真代价,这使得视频编码的复杂度较高。可见现有的视频编码处理方式的编码处理速度较慢。
发明内容
本发明实施例的目的在于提供一种视频编码处理方法、装置及电子设备,以解决现有的视频编码处理方式的编码处理速度较慢的问题。具体技术方案如下:
在本发明实施的第一方面,首先提供了一种视频编码处理方法,包括:
获取视频图像帧中的目标编码单元;
在N个编码子单元对应的图像区域均存在率失真代价的历史计算值的情况下,根据所述历史计算值,确定第一划分方式对应的第一率失真代价;所述N个编码子单元由所述目标编码单元采用所述第一划分方式划分得到;N为正整数;
在所述第一率失真代价大于或等于参考值的情况下,在第二划分方式和不进行划分的方式中确定目标处理方式,所述第二划分方式为候选划分方式中除所述第一划分方式外的划分方式;
按照所述目标处理方式,对所述目标编码单元进行编码处理;
其中,所述参考值由第二率失真代价确定,所述第二率失真代价为目标编码单元不进行划分所对应的率失真代价。
在本发明实施的第二方面,还提供了一种视频编码处理装置,包括:
第一获取模块,用于获取视频图像帧中的目标编码单元;
第一确定模块,用于在N个编码子单元对应的图像区域均存在率失真代价的历史计算值的情况下,根据所述历史计算值,确定第一划分方式对应的第一率失真代价;所述N个编码子单元由所述目标编码单元采用所述第一划分方式划分得到;N为正整数;
第二确定模块,用于在所述第一率失真代价大于或等于参考值的情况下,在第二划分方式和不进行划分的方式中确定目标处理方式,所述第二划分方式为候选划分方式中除所述第一划分方式外的划分方式;
处理模块,用于按照所述目标处理方式,对所述目标编码单元进行编码处理;
其中,所述参考值由第二率失真代价确定,所述第二率失真代价为目标编码单元不进行划分所对应的率失真代价。
在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的视频编码处理方法。
在本发明实施的又一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的视频编码处理方法。
本发明实施例提供的视频编码处理方法,由于一位置的编码子单元在不同的划分方式下得到的率失真代价虽然不完全相同,但是相关性较强,可以用同一位置已编码的率失真代价近似的估计当前的率失真代价。
因此针对视频图像帧中的目标编码单元,在N个编码子单元对应的图像区域均存在率失真代价的历史计算值的情况下,可以根据历史计算值确定第一率失真代价,并结合参考值判断是否采用率第一划分方式对目标编码单元进行编码处理。而在第一率失真代价大于或等于参考值的情况下,在第二划分方式和不进行划分的方式中确定目标处理方式。这样,在N个编码子单元对应的图像区域均已存在率失真代价的历史计算值的情况下,将根据历史计算值确定的第一率失真代价,近似确定为目标编码单元在第一划分方式下的率失真代价,如此,不需要再计算目标编码单元在第一划分方式下的率失真代价,这可以在一定程度上减少计算量,进而提升了视频编码处理速度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1是本发明实施例中视频编码处理方法的流程图之一;
图2a是本发明实施例中的编码单元不进一步划分的示意图;
图2b是本发明实施例中的编码单元划分示意图之一;
图2c是本发明实施例中的编码单元划分示意图之二;
图2d是本发明实施例中的编码单元划分示意图之三;
图2e是本发明实施例中的编码单元划分示意图之四;
图2f是本发明实施例中的编码单元划分示意图之五;
图3a是本发明实施例中的编码单元划分示意图之六;
图3b是本发明实施例中的编码单元划分示意图之七;
图4是本发明实施例中视频编码处理方法的流程图之二;
图5是本发明实施例中视频编码处理装置的结构示意图;
图6是本发明实施例中电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
视频编码专家组(Video Coding Expert Group,VCEG)和活动图像专家组(MovingPicture Export Group,MPEG)联合主导开发了一系列视频编码国际标准,包括H.264/AVC(Advanced Video Coding)、H.265/HEVC(High Efficiency Video Coding)和多功能视频编码(Versatile Video Coding,VCC)。开放视频联盟(Alliance for Open Media,AOM)在2018年发布了AV1(AOMedia Video1)。先进音视频编码(Audio Video coding Standard,AVS)产业联盟开发了AVS、AVS+、AVS2和AVS3,是基于我国自主创新技术和国际公开技术构建的音视频编码标准。
本发明实施例提供了一种视频编码处理方法,可以应用且不限于VVC、AV1和AVS3等视频编码标准的视频中。需要说明的是,一段视频中包括多个图像帧,本发明实施例提供的视频编码处理方法可以应用于其中任一图像帧中的任一编码单元的编码处理。
参见图1,图1是本发明实施例提供的一种视频编码处理方法的流程图,如图1所示,包括以下步骤:
步骤101、获取视频图像帧中的目标编码单元;
步骤102、在N个编码子单元对应的图像区域均存在率失真代价的历史计算值的情况下,根据所述历史计算值,确定第一划分方式对应的第一率失真代价;所述N个编码子单元由所述目标编码单元采用所述第一划分方式划分得到;N为正整数;
其中,所述第一划分方式为候选划分方式中的任意一种划分方式,其中,候选划分方式可以为视频编码标准支持的多种划分方式。
步骤103、在所述第一率失真代价大于或等于参考值的情况下,在第二划分方式和不进行划分的方式中确定目标处理方式,所述第二划分方式为候选划分方式中除所述第一划分方式外的划分方式;
步骤104、按照所述目标处理方式,对所述目标编码单元进行编码处理;
其中,所述参考值由第二率失真代价确定,所述第二率失真代价为目标编码单元不进行划分所对应的率失真代价。
通常对于视频编码而言,上述视频图像帧可以先划分为若干互不重叠的编码树单元,而在视频编码标准VVC、AV1和AVS3中,编码树单元大小是相同的,编码树单元中亮度像素点的个数为128x128。在将一帧图像划分成若干编码树单元后,对于每个编码树单元,以编码树单元作为根节点,迭代进行多类型树的划分,可以划分得到若干尺寸更小的编码单元。上述步骤101中的目标编码单元,可以为视频图像帧中由编码树单元经过一次划分,或经过多次迭代划分得到的任意一个编码单元。
而对于任意一个编码单元,可以选择不进行划分,也可以选择视频编码标准中多种预设划分方式中的一种进一步迭代划分,得到多个编码子单元。即编码单元和编码子单元为相对的概念,来对划分前后的状态进行区分。换句话说,对于视频图像帧中的任意一个编码单元,其进一步迭代划分得到的单元,可以理解为编码子单元。应理解,对于上述的编码子单元而言,也可以选择不进行划分,或选择视频编码标准中多种预设划分方式中的一种进一步迭代划分。在对上述的编码子单元进一步划分的过程中,上述的编码子单元也可以相当于该过程中的编码单元,其划分得到的子单元也可以相当于是该过程中的编码子单元。
对于一个编码单元而言,从视频编码的角度考虑,通常指视频图像帧中,进行编码处理的一个单元;而在一帧视频图像中,该编码单元存在于特定的位置,并有特定的大小,该特定大小的区域即为编码单元对应的图像区域。在本发明实施例中,上述目标编码单元在同一划分方式下,可以划分出N个编码子单元。其中任意两个编码子单元对应的图像区域不重叠,同时N个编码子单元对应的图像区域可以组合形成目标编码单元所对应的图像区域。
以上述VVC、AV1和AVS3视频编码标准为例,视频编码标准可以包含多种预设划分方式。如在AV1视频编码标准中,可以采用四叉树划分(QuadTree,QT)、水平划分(HORZ)、垂直划分(VERT)、水平四分(HORZ_4),垂直四分(VERT_4)、水平划分A型(HORZ_A)、水平划分B型(HORZ_B)、垂直划分A型(VERT_A)或垂直划分B型(VERT_B)的划分方式;而在VVC视频编码标准中,可以采用四叉树划分、水平二叉树划分、垂直二叉树划分、水平三叉树划分或垂直三叉树划分的划分方式;在AVS3视频编码标准中,可以采用四叉树划分、水平/垂直二叉树划分或水平/垂直扩展四叉树划分的划分方式。可以理解,第一划分方式与第二划分方式属于同一种编码标准。上述步骤102中的第一划分方式,可以为当前编码标准下,针对目标编码单元的任意一种划分方式。上述步骤103中的第二划分方式,可以包括当前编码标准下包含的多种候选划分方式中,除第一划分方式外的划分方式。
应理解,上述候选划分方式,是用于将编码单元划分成更小的子单元进行编码的不同方式。上述编码单元通过上述划分方式,可以得到更小的图像块,从而更好地处理视频图像帧的各图像块中的细节,使得复杂图像的处理更准确。
具体的,以VVC视频编码标准为例,参照图2a至图2f,可以以图中的方式对目标编码单元进行处理。其中,图2a为不进行划分,图2b为四叉树划分,图2c为水平二叉树划分,图2d为垂直二叉树划分,图2e为水平三叉树划分,图2f为垂直三叉树划分。图2a-2f中,最大的矩形区域相当于是目标编码单元对应的图像区域。在该区域中,由水平线和竖直线划分出的多个矩形,相当于是目标编码单元划分得到的编码子单元对应的图像区域。图中“R”表示递归(Recursive),表示由目标编码单元划分得到的编码子单元可以递归继续划分。
在VVC视频编码标准中,上述目标编码单元可以选择不进行划分,也可以选择四叉树划分、水平二叉树划分、垂直二叉树划分、水平三叉树划分或垂直三叉树划分。上述第一划分方式在VVC视频编码标准中可以为四叉树划分、水平二叉树划分、垂直二叉树划分、水平三叉树划分和垂直三叉树划分中的任一划分方式。
在本发明实施例中,若上述第一划分方式为四叉树划分,那么上述第二划分方式可以为水平二叉树划分、垂直二叉树划分、水平三叉树划分和垂直三叉树划分中的任一种划分方式。
通常而言,对于目标编码单元,通过水平二叉树划分、垂直二叉树划分、水平三叉树划分或垂直三叉树划分得到的编码子单元不能进一步进行四叉树划分,而可以继续进行如图2c-2f中除四叉树划分以外的其他4种划分方式。
需要说明的是,对于目标编码单元采用同一划分方式划分得到的多个编码子单元,其对应的图像区域不同;而对于目标编码单元采用不同划分方式划分得到的多个编码子单元,其对应的图像区域可能存在相同的情况。
继续举例说明,以VCC视频编码标准为例,如图3a至图3b所示,假设VVC视频编码标准下,矩形ABCD对应的编码单元先进行了图3a中的四叉树划分,得到了四个编码子单元,此时四个编码子单元对应的图像区域为矩形AHGE、HBFG、EGID、GFCI。进一步的,上述矩形HBFG对应的编码单元还可以进行垂直二叉树划分,得到两个编码子单元,分别对应矩形HJKG和矩形JBFK。
矩形ABCD对应的编码单元还可以先进行图3b中的水平二叉树划分,得到矩形ABNL和矩形LNCD对应的编码子单元。进一步的,矩形ABNL对应的编码单元可以进行垂直三叉树划分,得到矩形APSL、PQRS和QBNR对应的编码子单元;矩形LNCD对应的编码单元可以进行垂直二叉树划分,得到矩形LMOD和矩形MNCO对应的编码子单元。此时,图3b中的矩形LMOD与图3a中的矩形EGID区域相同,图3b中的矩形MNCO和图3a中的GFCI区域相同,图3b中矩形QBRN和图3a中矩形JBFK区域相同。
通常的,在视频编码过程中,对于编码单元在不同划分方式得到的编码子单元而言,需要分别计算其对应的率失真代价。例如在本发明实施例中,对于目标编码单元而言,其在第一划分方式下对应的率失真代价,可以为“N个编码子单元对应的率失真代价之和+第一划分方式消耗的比特数”的计算值。由上述内容可知,不同划分方式划分得到的编码子单元对应的图像区域可能相同。由于上述视频编码标准均包含多种划分方式,递归按照多种划分方式进行计算,会导致某些图像区域在不同的划分情况下会计算多次。因此,对于上述第一划分方式而言,上述编码子单元对应的图像区域的率失真代价,可能在第二划分方式中已经计算过。
由于相同图像区域的编码子单元对应的原始像素点是完全相同的,因此,相同图像区域的编码子单元在不同的划分方式下得到的率失真代价虽然不完全相同,但有较强的相关性。因此上述第一划分方式下对应的率失真代价除了通过“N个编码子单元对应的率失真代价之和+第一划分方式消耗的比特数”计算确定,也可以用在已计算的划分方式中,与上述N个编码子单元对应的图像区域,分别相同的图像区域的率失真代价近似确定。在本发明实施例中,可以将近似确定的率失真代价,作为上述第一划分方式对应的第一率失真代价。
在本发明实施例中,若第一划分方式下的N个编码子单元对应的相同区域的率失真代价,均已在第二划分方式中计算过,即可以将第二划分方式中计算的率失真代价作为该图像区域的率失真代价的历史计算值。利用该历史计算值,可以近似确定第一划分方式下的编码子单元对应的相同区域的率失真代价,从而无需再分别对N个编码子单元对应的率失真代价进行计算,减少了计算量。
需要说明的是,一方面,对应同一图像区域的编码子单元在不同的划分方式下得到的率失真代价有较强的相关性,可以用对应同一图像区域的编码子单元已计算的率失真代价近似的估计当前的率失真代价;而另一方面,由于当前编码子单元在进行率失真代价计算时,需要用到相邻图像区域的信息,因此对应同一图像区域的不同划分方式下的编码子单元的率失真代价不完全相等。上述第一率失真代价为上述目标编码单元在上述第一划分方式下,对应的率失真代价的近似值。
由于视频编码的过程中,视频编码器通常需要计算视频图像帧中每一编码单元在多种划分方式下的率失真代价,而率失真代价越小,即代表编码单元对应的图像区域的失真程度越小。若一帧视频图像中的每一编码单元的率失真代价均较小,此时视频的失真程度也较小,视频画面的清晰度较高,用户的观看体验也较好。因此,编码器一般选取具有最小率失真代价的划分方式对目标编码单元进行编码处理。
在本发明实施例中,是否采用上述第一划分方式对目标编码单元进行编码处理,可以通过设置参考值的方式进行判断。例如,在上述第一率失真代价大于或等于参考值的情况下,此时说明上述第一划分方式对应的率失真代价较高,可以在第二划分方式或不进行划分的方式中确定目标处理方式,对目标编码单元进行编码处理。换句话说,在此种情况下,可以跳过目标编码单元在第一划分方式下的率失真代价的具体计算,进而减少了计算量。
在上述步骤103中,上述参考值可以由目标编码单元在不进行划分的方式下,对应的第二率失真代价确定。上述第二率失真代价的值,可以由计算确定,也可以近似估计确定,在此不进行限定。
具体的,在一可选的实施例中,上述参考值可以为第二率失真代价;在另一实施例中,上述参考值可以为上述第二率失真代价与预设阈值的乘积等。
本发明实施例中,通过设置参考值的方式来判断是否采用第一划分方式对目标编码单元进行编码处理,在第一率失真代价大于或等于参考值的情况下,从而可以选择率失真代价较小的划分方式对目标编码单元进行处理,在减少计算量的前提下,降低视频图像的失真程度。
本发明实施例提供的视频编码处理方法,由于一位置的编码子单元在不同的划分方式下得到的率失真代价虽然不完全相同,但是相关性较强,可以用同一位置已编码的率失真代价近似的估计当前的率失真代价。
因此针对视频图像帧中的目标编码单元,在N个编码子单元对应的图像区域均存在率失真代价的历史计算值的情况下,根据历史计算值确定第一率失真代价,并结合参考值判断是否采用率第一划分方式对目标编码单元进行编码处理。在第一率失真代价大于或等于参考值的情况下,在第二划分方式和不进行划分的方式中确定目标处理方式。这样,在N个编码子单元对应的图像区域均已存在率失真代价的历史计算值的情况下,将根据历史计算值确定的第一率失真代价,近似确定为目标编码单元在第一划分方式下的率失真代价,如此,不需要再计算目标编码单元在第一划分方式下的率失真代价,这可以在一定程度上减少计算量,进而提升了视频编码处理速度。
可选的,所述方法还可以包括:
在至少一个编码子单元对应的图像区域未存在率失真代价的历史计算值,或在所述第一率失真代价小于所述参考值的情况下,计算所述N个编码子单元对应的N个迭代率失真代价。
在第一编码子单元对应的图像区域未存在率失真代价的历史计算值的情况下,将所述第一编码子单元对应的所述迭代率失真代价保存为所述第一编码子单元对应的图像区域的历史计算值,并对所述第一编码子单元对应的图像区域的标志位进行设置。后续对标志位做具体说明,此处暂不讨论。此外,可以理解,第一编码子单元为当前划分方式下,N个编码子单元中的任意一个编码子单元。
在本发明实施例中,参照图3a至图3b,假设图3a至图3b中的矩形ABCD所对应的是目标编码单元,而在图3a的划分方式下的编码子单元的迭代率失真代价均已计算。此时,如上所述,图3b中,矩形QBNR、矩形MNCO和矩形LMOD的图像区域对应的编码子单元的迭代率失真代价在图3a中均已计算,上述三块区域对应的编码子单元存在历史计算值,而矩形APSL和矩形PQRS的图像区域对应的编码子单元的迭代率失真代价在图3a中的划分方式下未计算。若此前仅计算过图3a划分方式下所有编码子单元的迭代率失真代价,那么在图3b划分方式下,有两个编码子单元对应的图像区域未存在率失真代价的历史计算值。
若至少一个编码子单元对应的图像区域未存在率失真代价的历史计算值,即相当于在上述N个编码子单元对应的图像区域中,存在率失真代价未计算的图像区域,此时无法近似得到上述第一率失真代价。在此种情况下,可以分别计算N个编码子单元对应的N个迭代率失真代价,从而根据迭代率失真代价来确定目标编码单元在第一划分方式下对应的率失真代价。
若第一率失真代价小于参考值,则说明目标编码单元在上述第一划分方式下的率失真代价较小,此时上述第一划分方式可能作为目标处理方式。因此可以计算上述N个编码子单元对应的N个迭代率失真代价,以得到目标编码单元在上述第一划分方式下准确度较高的率失真代价。
基于上述内容可知,由目标编码单元在第一划分方式下得到的编码子单元,可以采用多种划分方式中的一种进一步迭代划分,也可以不进行划分。在计算上述编码子单元对应的迭代率失真代价的过程中,可能还会对编码子单元进行迭代划分,直至在约束条件下,无法继续划分为止。在此情况下,可以计算得到编码子单元在不进行划分的方式和多种划分方式下的多个率失真代价。其中,任意一个编码子单元的率失真代价,可以通过计算得到,也可以通过上述第一率失真代价的确定方式确定得到。即上述得到任意一个编码子单元的率失真代价的过程中,编码子单元可以看作是本发明实施例中的目标编码单元。如此,任意一个编码子单元对应的迭代率失真代价,即可以为采用不进行划分的方式和采用多种划分方式下,该编码子单元对应的最小率失真代价。
在计算上述N个编码子单元对应的N个迭代率失真代价后,进一步的,若其中的第一编码子单元对应的图像区域在计算之前,未存在率失真代价的历史计算值,此时,可以将计算得到的迭代率失真代价保存为第一编码子单元对应的图像区域的历史计算值,并设置标志位,用于表示第一编码子单元对应的图像区域的率失真代价已计算。
以上述继续说明,若上述第一编码子单元为图3b中矩形APSL或矩形PQRS的图像区域对应的编码子单元,此时上述编码子单元应的图像区域未存在率失真代价的历史计算值。
具体的,可以在计算上述第一编码子单元对应的迭代率失真代价后,将迭代率失真代价和标志位保存至对应图像区域的结构体数组中。结构体数组用于存储图像区域的数据信息,其表现形式通常可以包括图像、表格、文档和dom文件等。在本发明实施例中,该结构体数组可以定义为info[idx_x][idx_y][idx_w][idx_h],其中包含的字符变量idx_x、idx_y、idx_w和idx_h分别为编码单元对应的图像区域起始编码点的横坐标、纵坐标以及图像区域的像素宽度和高度。由于每一块图像区域的起始编码点的横坐标、纵坐标以及图像区域的像素宽度和高度不会完全相同,因此数组中每一图像区域的字符变量idx_x、idx_y、idx_w和idx_h的组合具有唯一性,从而可以根据上述字符变量的组合准确确定每一结构体所对应的图像区域。
上述结构体数组中存储的标志位可以根据实际需要进行设置。例如,在一可选的实施方式中,可以将计算后的图像区域对应的结构体数组的标志位设置为“1”,而未计算的图像区域对应的结构体数组中,将标志位设置为“0”,从而可以根据标志位确定该图像区域的率失真代价是否已计算。
在另一种可能的实施例中,计算后的图像区域对应的结构体数组的标志位不为空,而未计算的图像区域对应的结构体数组的标志位为空。这样,可以根据结构体数组中标志位是否为空确定该图像区域的率失真代价是否已计算。
可选的,在计算所述N个编码子单元对应的N个迭代率失真代价的步骤之后,所述方法还包括:
在所述第一编码子单元对应的图像区域已存在率失真代价的历史计算值的情况下,以所述第一编码子单元对应的所述迭代率失真代价替换所述第一编码子单元对应的图像区域的历史计算值。
在本发明实施例中,以图3a至图3b继续说明,若上述第一编码子单元为图3b中,矩形QBNR、矩形MNCO和矩形LMOD的图像区域对应的编码子单元,则上述第一编码子单元对应的图像区域已存在率失真代价的历史计算值。
在计算上述N个编码子单元对应的N个迭代率失真代价后,若其中的第一编码子单元对应的图像区域在计算之前,已存在率失真代价的历史计算值,此时,可以以本次计算得到的迭代率失真代价替换之前已存储的历史计算值,从而实现了历史计算值的更新。
具体的,在一可选的实施方式中,还可以将本次计算得到的迭代率失真代价和历史计算值进行比较,在迭代率失真代价小于历史计算值的情况下,以迭代率失真代价替换上述历史计算值。在迭代率失真代价大于或等于历史计算值的情况下,保持上述历史计算值不变。这样,可以保证上述N个编码子单元对应的图像区域的历史计算值为多次计算中的较小值,从而可以提升确定第一率失真代价时的准确性。
可选的,所述方法还包括:
获取所述编码子单元对应的图像区域的数据信息;所述数据信息中携带标志位,所述标志位用于指示所述图像区域是否存在历史计算值;
基于所述标志位,确定所述编码子单元对应的图像区域存在历史计算值。
如上所述,可以在计算上述编码子单元对应的率失真代价后,将目标率失真代价和标志位保存至对应图像区域的结构体数组中。在本发明实施例中,可以获取上述编码子单元对应的图像区域的数据信息,该数据信息可以存放于对应的结构体数组中。在上述编码子单元对应的图像区域存在标志位的情况下,则代表该编码子单元对应的图像区域的率失真代价已经计算。此时,可以确定上述编码子单元对应的图像区域存在历史计算值。
具体的,可以通过获取数据信息中,标志位的内容来判断上述编码子单元对应的图像区域是否存在历史计算值。例如,在一种可能的实施例中,若标志位为“1”,则确定上述编码子单元对应的图像区域存在历史计算值;若标志位为“0”,则确定上述编码子单元对应的图像区域未存在历史计算值。
在另一种可能的实施例中,也可以通过查找编码子单元对应的图像区域的数据信息中标志位是否为空,来判断上述编码子单元对应的图像区域是否存在历史计算值。当标志位不为空时,则确定上述编码子单元对应的图像区域存在历史计算值;当标志位为空时,则确定上述编码子单元对应的图像区域未存在历史计算值。
本发明实施例提供的视频处理编码方法,可以根据编码子单元对应的图像区域的数据信息中标志位,确定编码子单元对应的图像区域是否存在历史计算值,从而可以提升视频编码处理的速率。
可选的,上述在第二划分方式和不进行划分的方式中确定目标处理方式的步骤可以包括:
在所述第二率失真代价和第四率失真代价中,将最小的率失真代价对应的处理方式确定为所述目标处理方式;
其中,所述第四率失真代价为所述目标编码单元在所述第二划分方式下对应的率失真代价;当所述第二划分方式为多种时,所述第四率失真代价为多个,且与所述第二划分方式一一对应。
在本发明实施例中,若上述第一率失真代价大于或等于参考值,说明上述目标编码单元在第一划分方式下的率失真代价较大。此时,不采用第一划分方式对目标编码单元进行编码处理,而在第二划分方式和不进行划分的方式中,确定目标处理方式。
其中,上述第四率失真代价为目标编码单元在第二划分方式下,对应的率失真代价。由于上述第二划分方式中包括多种划分方式,因此,上述第四率失真代价也可以对应有多个,具体根据视频编码标准确定。
需要说明的是,上述第四率失真代价也可能用第一率失真代价的方式计算得到,即,在确定上述第二划分方式对应的率失真代价时,也可以通过上述确定历史计算值的方式近似估计该率失真代价。
具体的,在上述第二率失真代价和第四率失真代价确定最小值的方式,可以为在计算出其中的两个具体值后,进行一次比较,将比较后较小的值与下一次计算得到的值再进行比较,之后的每一次计算后都与之前确定的较小值进行比较,两两依次比较直至上述第二率失真代价和第四率失真代价全部比较完毕,从而确定其中的最小值。
在另一可选的实施方式中,也可以在计算出上述所有第二率失真代价和第四率失真代价后,从所有值中确定最小值。
本发明实施例通过在第一率失真代价大于或等于参考值的情况下,在第二划分方式和不进行划分的方式中确定目标处理方式,从而可以避免目标编码单元在第一划分方式下的率失真代价较大时,计算确定该率失真代价,进而减少了计算量,提升了视频编码处理的速度。
可选的,上述根据所述历史计算值,确定第一划分方式对应的第一率失真代价的步骤可以包括但不限于如下几种方式:
在一种可能的实施例中,将所述N个编码子单元对应的图像区域的历史计算值之和,确定为所述第一率失真代价。
或者,
在另一种可能的实施例中,将所述历史计算值之和加或减第一预设值后的计算值,确定为所述第一率失真代价。
或者,
在另一种可能的实施例中,将所述历史计算值之和乘预设系数后的计算值,确定为所述第一率失真代价。
为了提升上述第一率失真代价的准确性,本发明实施例可以在N个编码子单元对应的图像区域均存在率失真代价的历史计算值的情况下,将N个编码子单元对的历史计算值之和确定为所述第一率失真代价。
当然,在其他可选的实施方式中,也可以在上述历史计算值之和的基础上,加或减去一预设数值,或者乘以一预设系数得到。上述预设数值可以为自定义数值,也可以根据当前划分方式所消耗的比特数确定,同理,上述预设系数也可以自定义设置。
可选的,参考值的确定方式也可以有多种实施方式,示例性的,可以包括但不限于如下几种:
在一种可能的实施例中,将与所述第二率失真代价成正比例关系的第二预设值,确定为所述参考值。
在本发明实施例中,上述参考值可以为第二率失真代价和预设阈值的乘积。
具体的,上述预设阈值的默认值可以为1.0。在其他可选的实施方式中,例如,若已知编码子单元对应的图像区域的率失真代价的历史计算值确定的第一率失真代价,相较于目标编码单元在第一划分方式下的率失真代价较小,上述预设阈值也可以设置为小于1的数值,例如0.95或0.98等值;若相较于目标编码单元在第一划分方式下的率失真代价较大,上述预设阈值也可以设置为大于1的数值,例如1.05或1.02等值。
或者,在另一种可能的实施例中,将所述第二率失真代价加或减第三预设值后的计算值,确定为所述参考值。
上述参考值也可以为上述第二率失真代价加或减去某一预设数值,该预设数值可以为自定义数值。例如若已知编码子单元对应的图像区域的率失真代价的历史计算值确定的第一率失真代价,相较于目标编码单元在第一划分方式下的率失真代价较小,上述参考值可以为上述第二率失真代价-1或-0.1等;若相较于目标编码单元在第一划分方式下的率失真代价较大,上述参考值可以为上述第二率失真代价+1或+0.1等。
本发明实施例通过将参考值设置为与上述第二率失真代价成正比例关系的数值,从而可以在根据第二率失真代价确定参考值时,灵活调节参考值的计算方式,进而在利用该参考值与第一率失真代价进行比较,判断是否采用第一划分方式时,提升判断的准确性。
应理解,在另一实施例中,上述参考值也可以为目标编码单元已经在不进行划分的方式,或多种划分方式中,确定得到的第二率失真代价和第四率失真代价中的最小值,并根据每次的计算结果进行更新。
具体的,目标编码单元在任一第二划分方式下,确定得到第四率失真代价后,可以由该率失真代价确定得到当前的参考值。
在此之后的另一第二划分方式中,若当前确定得到的率失真代价小于此前确定的率失真代价时,利用当前确定得到的率失真代价重新确定当前的参考值,并进行更新。在本实施例中,上述参考值可以随着计算过程进行更新,从而使得与上述第一率失真代价进行比较的参考值更准确,在判断是否采用第一划分方式时,提升判断的准确性。
可选的,所述方法还可以包括:
在N个编码子单元对应的图像区域未均存在率失真代价的历史计算值,或在所述第一率失真代价小于参考值的情况下,计算所述N个编码子单元对应的N个迭代率失真代价;
根据所述N个迭代率失真代价,确定所述第一划分方式对应的第三率失真代价。
在所述第二率失真代价、所述第三率失真代价和第四率失真代价中,将最小的率失真代价对应的划分方式确定为所述目标处理方式。
其中,所述第四率失真代价为所述目标编码单元在所述第二划分方式下对应的多个率失真代价。
在本发明实施例中,若至少一个编码子单元对应的图像区域未存在率失真代价的历史计算值,即相当于在上述N个编码子单元对应的图像区域中,存在率失真代价未计算的图像区域,此时无法近似得到上述第一率失真代价。在此种情况下,可以分别计算N个编码子单元对应的N个迭代率失真代价,从而根据迭代率失真代价来确定目标编码单元在第一划分方式下对应的率失真代价。
基于上述内容可知,由目标编码单元在第一划分方式下得到的编码子单元,可以采用多种划分方式中的一种进一步迭代划分,也可以不进行划分。上述编码子单元对应的迭代率失真代价,即为采用不进行划分的方式和采用多种划分方式下,所对应的最小率失真代价。而N个编码子单元对应的N个迭代率失真代价,可以确定上述目标编码单元在第一划分方式下对应的率失真代价。在本发明实施例中,由上述N个迭代率失真代价确定的率失真代价,即为第三率失真代价。
具体的,在一可选的实施方式中,上述第三率失真代价可以为上述N个迭代率失真代价之和;在另一可选的实施方式中,上述第三率失真代价也可以为上述N个迭代率失真代价与第一划分方式消耗的比特数相加的总和。
在本发明实施例中,若上述第一率失真代价小于参考值,此时说明目标编码单元在上述第一划分方式下的率失真代价较小。在此种情况下,由于上述第一率失真代价为近似值,若需要确定目标处理方式,则需要计算上述目标编码单元在上述第一划分方式下,准确度较高的率失真代价。因此也可以采用上述方式,计算确定上述目标编码单元在第一划分方式下的第三率失真代价。
在确定上述第三率失真代价后,为了确定目标处理方式,可以比较上述目标编码单元在第一划分方式、第二划分方式和不进行划分的方式下的率失真代价,选择其中最小的率失真代价对应的方式,对目标编码单元进行编码处理。
具体的,在上述第二率失真代价、第三率失真代价和第四率失真代价确定最小值的方式,可以为在计算出其中的两个具体值后,进行一次比较,依次比较直至确定最小值。
在另一可选的实施方式中,也可以在计算出上述所有第二率失真代价、第三率失真代价和第四率失真代价后,从所有值中确定最小值。
本发明实施例通过在第一率失真代价大于或等于参考值的情况下,在第二划分方式和不进行划分的方式中确定目标处理方式;在无法近似确定第一率失真代价,或第一率失真代价小于参考值的情况下,计算出目标编码单元在第一划分方式下,准确度较高的第三率失真代价。最终在第二率失真代价、第三率失真代价和第四率失真代价对应的方式中,选择率失真代价最小的方式,作为目标处理方式,从而可以在减少计算量的前提下,提升确定目标处理方式时的准确性。
为了更好的理解本发明,参照图4,图4是本发明提供的视频编码方法一种可能的实施方式,以下将以VVC视频编码标准例详细阐述本发明的具体实现过程。
步骤201、保存或更新不同位置的编码子单元的率失真代价。
在计算得到编码单元多种划分方式下,和不划分方式下对应的多个率失真代价后,保存已计算标志位和最优率失真代价到划分得到的编码子单元对应的图像区域所对应的结构体数组info[idx_x][idx_y][idx_w][idx_h]。其中,最优率失真代价可以为上述编码子单元对应的图像区域最终用于更新历史计算值的迭代率失真代价。在其过程中,上述编码子单元可以在计算过程中保存或更新对应图像区域的历史计算值,直至最终得到该图像区域的最优率失真代价。其中,idx_x=x/4,idx_y=y/4,idx_w=log2(width),idx_h=log2(height)。x、y、width和height可以分别表示上述编码子单元对应的图像区域起始编码点的横坐标和纵坐标,图像区域像素宽度和高度。
由于每一块图像区域的起始编码点的横坐标、纵坐标以及图像区域的像素宽度和高度不会完全相同,因此,数组中每一图像区域的字符变量idx_x、idx_y、idx_w和idx_h的组合具有唯一性,字符变量的组合对应的字符数组可以包含两个值:已计算标志位和历史计算值。其中,已计算的标志位可以为数值“1”,同时在字符数组中以迭代率失真代价保存或更新历史计算值。
步骤202、利用已编码的最优率失真代价进行划分快速判决。
在当前划分方式下进行判定:如果所有编码子单元对应位置都已经计算过,即所有编码子单元对应位置的已计算标志位全部为真,则读取编码子单元对应位置保存的最优率失真代价作为当前编码子单元率失真代价的预测值,比较当前的编码子单元的率失真代价的预测值之和是否大于当前编码单元不划分的率失真代价和阈值的乘积,满足则跳过当前划分方式的计算,将预测值作为当前编码子单元的率失真代价。阈值默认设为1.0,也可以设为其他值。
该方法在VVC、AVS3和AV1等视频编码格式中都可以应用,其在VVC视频编码格式中的性能测试结果如下表一所示:
表一
如表一所示,视频编码质量评价标准(Delta Bit Rate,BDBR),表示同样的客观质量下,新方法得到的视频相对于旧方法的码率变化情况。BDBR为正数,表示新方法得到的视频质量更差一些,BDBR越大,表示质量差的越多。
由上表可以看到,在示出的22个测试序列中,本发明实施例提供的视频编码处理方法使得测试序列1-22的编码时间平均节省了17.53%,平均视频编码质量评价标准仅为0.6585,此情况下视频的失真程度较小。因此,本发明实施例提升了编码处理的速率,节省了可观的编码时间。
需要说明的是,本发明实施例中介绍的多种可选的实施方式,彼此可以相互结合实现,也可以单独实现,对此本发明实施例不作限定。
参见图5,图5是本发明实施例提供的视频编码处理装置的结构图,如图5所示,上述视频编码处理装置500包括:
第一获取模块510,用于获取视频图像帧中的目标编码单元。
第一确定模块520,用于在N个编码子单元对应的图像区域均存在率失真代价的历史计算值的情况下,根据所述历史计算值,确定第一划分方式对应的第一率失真代价;所述N个编码子单元由所述目标编码单元采用所述第一划分方式划分得到;N为正整数。
第二确定模块530,用于在所述第一率失真代价大于或等于参考值的情况下,在第二划分方式和不进行划分的方式中确定目标处理方式,所述第二划分方式为候选划分方式中除所述第一划分方式外的划分方式。
处理模块540,用于按照所述目标处理方式,对所述目标编码单元进行编码处理。
其中,所述参考值由第二率失真代价确定,所述第二率失真代价为目标编码单元不进行划分所对应的率失真代价。
可选的,上述视频编码处理装置500还可以包括:
第二获取模块,用于获取所述编码子单元对应的图像区域的数据信息;所述数据信息中携带标志位,所述标志位用于指示所述图像区域是否存在历史计算值;
第三确定模块,基于所述标志位,确定所述编码子单元对应的图像区域存在历史计算值。
可选的,上述视频编码处理装置500还可以包括:
第一计算模块,用于在至少一个编码子单元对应的图像区域未存在率失真代价的历史计算值,或在所述第一率失真代价小于所述参考值的情况下,计算所述N个编码子单元对应的N个迭代率失真代价;
保存模块,用于在第一编码子单元对应的图像区域未存在率失真代价的历史计算值的情况下,将所述第一编码子单元对应的所述迭代率失真代价保存为所述第一编码子单元对应的图像区域的历史计算值,并对所述第一编码子单元对应的图像区域的标志位进行设置。
可选的,上述视频编码处理装置500还可以包括:
更新模块,用于在所述第一编码子单元对应的图像区域已存在率失真代价的历史计算值的情况下,以所述第一编码子单元对应的所述迭代率失真代价替换所述第一编码子单元对应的图像区域的历史计算值。
可选的,上述第二确定模块530可以包括:
第一确定单元,用于在所述第二率失真代价和第四率失真代价中,将最小的率失真代价对应的划分方式确定为所述目标处理方式;
其中,所述第四率失真代价为所述目标编码单元在所述第二划分方式下对应的率失真代价;当所述第二划分方式为多种时,所述第四率失真代价为多个,且与所述第二划分方式一一对应。
可选的,上述第一确定模块520可以包括:
第二确定单元,用于将所述N个编码子单元对应的图像区域的历史计算值之和,确定为所述第一率失真代价;
或者,第三确定单元,用于将所述历史计算值之和加或减第一预设值后的计算值,确定为所述第一率失真代价;
或者,第四确定单元,用于将所述历史计算值之和乘预设系数后的计算值,确定为所述第一率失真代价。
可选的,上述视频编码处理装置500还可以包括:
第四确定模块,用于将与所述第二率失真代价成正比例关系的第二预设值,确定为所述参考值;
或者,第五确定模块,用于将所述第二率失真代价加或减第三预设值后的计算值,确定为所述参考值。
所述参考值与所述第二率失真代价成正比例关系,或所述参考值由所述第二率失真代价加或减预设值得到。
可选的,上述视频编码处理装置500还可以包括:
第二计算模块,用于在N个编码子单元对应的图像区域未均存在率失真代价的历史计算值,或在所述第一率失真代价小于参考值的情况下,计算所述N个编码子单元对应的N个迭代率失真代价;
第六确定模块,用于根据所述N个迭代率失真代价,确定所述第一划分方式对应的第三率失真代价。
第七确定模块,用于在所述第二率失真代价、所述第三率失真代价和第四率失真代价中,将最小的率失真代价对应的划分方式确定为所述目标处理方式。
其中,所述第四率失真代价为所述目标编码单元在所述第二划分方式下对应的率失真代价。
本发明实施例提供的执行端能够实现图1的方法实施例中视频编码处理方法实现的各个过程,为避免重复,这里不再赘述。
本发明实施例还提供了一种电子设备,如图6所示,包括处理器601、通信接口602、存储器603和通信总线604,其中,处理器601,通信接口602,存储器603通过通信总线604完成相互间的通信,
存储器603,用于存放计算机程序;
处理器601,用于执行存储器603上所存放的程序时,实现如下步骤:
获取视频图像帧中的目标编码单元;在N个编码子单元对应的图像区域均存在率失真代价的历史计算值的情况下,根据所述历史计算值,确定第一划分方式对应的第一率失真代价;所述N个编码子单元由所述目标编码单元采用所述第一划分方式划分得到;N为正整数;在所述第一率失真代价大于或等于参考值的情况下,在第二划分方式和不进行划分的方式中确定目标处理方式,所述第二划分方式为除所述第一划分方式外的划分方式;按照所述目标处理方式,对所述目标编码单元进行编码处理。
其中,所述参考值由第二率失真代价确定,所述第二率失真代价为目标编码单元不进行划分所对应的率失真代价。
上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的视频编码处理方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的视频编码处理方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘SolidState Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (10)
1.一种视频编码处理方法,其特征在于,包括:
获取视频图像帧中的目标编码单元;
在N个编码子单元对应的图像区域均存在率失真代价的历史计算值的情况下,根据所述历史计算值,确定第一划分方式对应的第一率失真代价;所述N个编码子单元由所述目标编码单元采用所述第一划分方式划分得到;N为正整数;
在所述第一率失真代价大于或等于参考值的情况下,在第二划分方式和不进行划分的方式中确定目标处理方式,所述第二划分方式为候选划分方式中除所述第一划分方式外的划分方式;
按照所述目标处理方式,对所述目标编码单元进行编码处理;
其中,所述参考值由第二率失真代价确定,所述第二率失真代价为目标编码单元不进行划分所对应的率失真代价;
所述方法还包括:
在至少一个编码子单元对应的图像区域未存在率失真代价的历史计算值,或在所述第一率失真代价小于所述参考值的情况下,计算所述N个编码子单元对应的N个迭代率失真代价;
在第一编码子单元对应的图像区域未存在率失真代价的历史计算值的情况下,将所述第一编码子单元对应的所述迭代率失真代价保存为所述第一编码子单元对应的图像区域的历史计算值,并对所述第一编码子单元对应的图像区域的标志位进行设置;
其中,所述编码子单元对应的迭代率失真代价,为采用不进行划分的方式和采用多种划分方式下,所述编码子单元对应的最小率失真代价。
2.根据权利要求1所述的视频编码处理方法,其特征在于,所述方法还包括:
获取所述编码子单元对应的图像区域的数据信息;所述数据信息中携带标志位,所述标志位用于指示所述图像区域是否存在历史计算值;
基于所述标志位,确定所述编码子单元对应的图像区域存在历史计算值。
3.根据权利要求1所述的视频编码处理方法,其特征在于,在计算所述N个编码子单元对应的N个迭代率失真代价的步骤之后,所述方法还包括:
在所述第一编码子单元对应的图像区域已存在率失真代价的历史计算值的情况下,以所述第一编码子单元对应的所述迭代率失真代价替换所述第一编码子单元对应的图像区域的历史计算值。
4.根据权利要求1所述的视频编码处理方法,其特征在于,所述在第二划分方式和不进行划分的方式中确定目标处理方式的步骤包括:
在所述第二率失真代价和第四率失真代价中,将最小的率失真代价对应的划分方式确定为所述目标处理方式;
其中,所述第四率失真代价为所述目标编码单元在所述第二划分方式下对应的率失真代价;当所述第二划分方式为多种时,所述第四率失真代价为多个,且与所述第二划分方式一一对应。
5.根据权利要求1所述的视频编码处理方法,其特征在于,所述根据所述历史计算值,确定第一划分方式对应的第一率失真代价的步骤包括:
将所述N个编码子单元对应的图像区域的历史计算值之和,确定为所述第一率失真代价;或者,
将所述历史计算值之和加或减第一预设值后的计算值,确定为所述第一率失真代价;或者,
将所述历史计算值之和乘预设系数后的计算值,确定为所述第一率失真代价。
6.根据权利要求1中所述的视频编码处理方法,其特征在于,所述方法还包括:
将与所述第二率失真代价成正比例关系的第二预设值,确定为所述参考值;
或者,
将所述第二率失真代价加或减第三预设值后的计算值,确定为所述参考值。
7.根据权利要求1所述的视频编码处理方法,其特征在于,所述方法还包括:
在N个编码子单元对应的图像区域未均存在率失真代价的历史计算值,或在所述第一率失真代价小于所述参考值的情况下,计算所述N个编码子单元对应的N个迭代率失真代价;
根据所述N个迭代率失真代价,确定所述第一划分方式对应的第三率失真代价;
在所述第二率失真代价、所述第三率失真代价和第四率失真代价中,将最小的率失真代价对应的划分方式确定为所述目标处理方式;
其中,所述第四率失真代价为所述目标编码单元在所述第二划分方式下对应的率失真代价。
8.一种视频编码处理装置,其特征在于,包括:
第一获取模块,用于获取视频图像帧中的目标编码单元;
第一确定模块,用于在N个编码子单元对应的图像区域均存在率失真代价的历史计算值的情况下,根据所述历史计算值,确定第一划分方式对应的第一率失真代价;所述N个编码子单元由所述目标编码单元采用所述第一划分方式划分得到;N为正整数;
第二确定模块,用于在所述第一率失真代价大于或等于参考值的情况下,在第二划分方式和不进行划分的方式中确定目标处理方式,所述第二划分方式为候选划分方式中除所述第一划分方式外的划分方式;
处理模块,用于按照所述目标处理方式,对所述目标编码单元进行编码处理;
其中,所述参考值由第二率失真代价确定,所述第二率失真代价为目标编码单元不进行划分所对应的率失真代价;
所述视频编码处理装置还包括:
第一计算模块,用于在至少一个编码子单元对应的图像区域未存在率失真代价的历史计算值,或在所述第一率失真代价小于所述参考值的情况下,计算所述N个编码子单元对应的N个迭代率失真代价;
保存模块,用于在第一编码子单元对应的图像区域未存在率失真代价的历史计算值的情况下,将所述第一编码子单元对应的所述迭代率失真代价保存为所述第一编码子单元对应的图像区域的历史计算值,并对所述第一编码子单元对应的图像区域的标志位进行设置;
其中,所述编码子单元对应的迭代率失真代价,为采用不进行划分的方式和采用多种划分方式下,所述编码子单元对应的最小率失真代价。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-7中任一所述的方法步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010885826.6A CN111988612B (zh) | 2020-08-28 | 2020-08-28 | 一种视频编码处理方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010885826.6A CN111988612B (zh) | 2020-08-28 | 2020-08-28 | 一种视频编码处理方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111988612A CN111988612A (zh) | 2020-11-24 |
CN111988612B true CN111988612B (zh) | 2023-05-02 |
Family
ID=73439777
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010885826.6A Active CN111988612B (zh) | 2020-08-28 | 2020-08-28 | 一种视频编码处理方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111988612B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113660490A (zh) * | 2021-06-24 | 2021-11-16 | 浙江大华技术股份有限公司 | 编码单元的划分方法、编码方法、电子装置及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103780910A (zh) * | 2014-01-21 | 2014-05-07 | 华为技术有限公司 | 视频编码中的块分割方式和最佳预测模式确定方法及相关装置 |
CN106331699B (zh) * | 2015-06-19 | 2019-04-26 | 华为技术有限公司 | 图像编码方法和图像编码器 |
CN109788287B (zh) * | 2017-11-10 | 2022-10-25 | 腾讯科技(深圳)有限公司 | 视频编码方法、装置、计算机设备和存储介质 |
CN109905702B (zh) * | 2017-12-11 | 2021-12-21 | 腾讯科技(深圳)有限公司 | 一种视频编码中参考信息确定的方法、装置及存储介质 |
-
2020
- 2020-08-28 CN CN202010885826.6A patent/CN111988612B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111988612A (zh) | 2020-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110839155B (zh) | 运动估计的方法、装置、电子设备及计算机可读存储介质 | |
US11451772B2 (en) | Intra-frame prediction coding method and apparatus, electronic device, and computer storage medium | |
JP4797009B2 (ja) | 予測モード情報符号化方法,予測モード情報復号方法,これらの装置,およびこれらのプログラム並びにコンピュータ読み取り可能な記録媒体 | |
CN109819250B (zh) | 一种多核全组合方式的变换方法和系统 | |
WO2019085942A1 (zh) | Sao模式决策方法、装置、电子设备及可读存储介质 | |
JP6953067B2 (ja) | 符号化単位分割決定方法及び装置、コンピューティングデバイス及び読み取り可能な記憶媒体 | |
CN111182298B (zh) | 一种编码模式的确定方法、装置、设备和存储介质 | |
US20240031576A1 (en) | Method and apparatus for video predictive coding | |
CN109587491A (zh) | 一种帧内预测方法、装置及存储介质 | |
CN111669593B (zh) | 视频编码方法、装置、电子设备和存储介质 | |
US20220210459A1 (en) | Coding management method and apparatus based on high efficiency video coding | |
CN111988612B (zh) | 一种视频编码处理方法、装置及电子设备 | |
Chen et al. | Rough mode cost–based fast intra coding for high-efficiency video coding | |
US20150003751A1 (en) | Picture coding apparatus, picture coding program, picture decoding apparatus, and picture decoding program | |
US20230396780A1 (en) | Illumination compensation method, encoder, and decoder | |
CN110769255B (zh) | 一种图像编码方法及装置 | |
CN113242427B (zh) | 一种基于vvc中自适应运动矢量精度的快速方法及装置 | |
CN110267047B (zh) | 视频帧间运动估计方法、装置、设备及可读存储介质 | |
US11375192B2 (en) | Coding unit division decision method and device, encoder, and storage medium | |
CN113691811A (zh) | 编码块划分方法、装置、系统及存储介质 | |
CN113365077A (zh) | 帧间预测方法、编码器、解码器、计算机可读存储介质 | |
CN112383774B (zh) | 编码方法、编码器以及服务器 | |
CN113542768B (zh) | 运动搜索方法、装置及计算机可读存储介质 | |
CN115474060B (zh) | 一种hevc并行加速编码方法、系统、设备及存储介质 | |
WO2024055155A1 (zh) | 一种编解码方法、装置、编码器、解码器及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |