CN114449280A - 一种视频编解码方法、装置及设备 - Google Patents
一种视频编解码方法、装置及设备 Download PDFInfo
- Publication number
- CN114449280A CN114449280A CN202210324527.4A CN202210324527A CN114449280A CN 114449280 A CN114449280 A CN 114449280A CN 202210324527 A CN202210324527 A CN 202210324527A CN 114449280 A CN114449280 A CN 114449280A
- Authority
- CN
- China
- Prior art keywords
- target
- coded
- coding
- sequences
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 230000033001 locomotion Effects 0.000 claims abstract description 98
- 239000013598 vector Substances 0.000 claims abstract description 92
- 108091026890 Coding region Proteins 0.000 claims abstract description 24
- 238000000605 extraction Methods 0.000 claims abstract description 8
- 239000011159 matrix material Substances 0.000 claims description 48
- 238000004891 communication Methods 0.000 claims description 16
- 230000002194 synthesizing effect Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 14
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000008521 reorganization Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种视频编解码方法、装置及设备,其中,所述视频编码方法包括:获取待编码视频的至少两个图像帧;对所述至少两个图像帧的每个图像帧进行特征提取,得到至少四个第一特征矩阵;调整所述至少四个第一特征矩阵的序列,得到至少两组待编码序列,其中,每组待编码序列包括至少两个第一特征矩阵;对所述至少两组待编码序列中的目标待编码序列进行编码,得到目标编码数据以及目标残差运动矢量;根据所述目标残差运动矢量,对所述至少两组待编码序列中未编码的待编码序列进行编码,得到待编码视频的码流数据。通过上述方式,本发明提高了视频编解码的性能。
Description
技术领域
本发明涉及视频编解码技术领域,具体涉及一种视频编解码方法、装置及设备。
背景技术
在视频编码技术中,对同一视频提取出的特征矩阵之间存在着空间关联性,不同的特征矩阵分别经由不同的卷积核(Kernel)、激活层和池化层处理得到,因此,表征视频不同维度的特征,所以,各特征矩阵之间空间关联性并非简单的像素平移可以表达。但现有的编码技术在编解码过程中,只是将特征矩阵作为一组像素平移后的帧序列来处理,从而导致编解码的性能较差。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的视频编解码方法、装置及设备。
根据本发明实施例的一个方面,提供了一种视频编码方法,包括:
获取待编码视频的至少两个图像帧;
对所述至少两个图像帧的每个图像帧进行特征提取,得到至少四个第一特征矩阵;
调整所述至少四个第一特征矩阵的序列,得到至少两组待编码序列,其中,每组待编码序列包括至少两个第一特征矩阵;
对所述至少两组待编码序列中的目标待编码序列进行编码,得到目标编码数据以及目标残差运动矢量;
根据所述目标残差运动矢量,对所述至少两组待编码序列中未编码的待编码序列进行编码,得到待编码视频的码流数据。
可选的,对所述至少四个第一特征矩阵进行序列调整,得到至少两组待编码序列,包括:
对所述至少四个第一特征矩阵分类,得到至少两组待编码序列,每组所述待编码序列所包含的第一特征矩阵的数据特征类型相同。
可选的,对所述至少两组待编码序列中的目标待编码序列进行编码,得到目标残差运动矢量,包括:
将所述至少两组待编码序列中的目标待编码序列进行编码,得到至少两组运动矢量;
对每两组相邻的所述运动矢量进行补偿计算,得到目标残差运动矢量。
可选的,所述目标残差运动矢量RMV满足:
RMV=MV2-MV1,其中,MV1为第一运动矢量,MV2为第二运动矢量,所述第一运动矢量是任意一组运动矢量,所述第二运动矢量是指晚于所述第一运动矢量且与所述第一运动矢量相邻的运动矢量。
可选的,根据所述目标残差运动矢量,对未编码的所述待编码序列进行编码,得到待编码视频的码流数据,包括:
针对每个未编码的待编码序列,根据与所述待编码序列在时间上对应的目标残差运动矢量,对所述待编码序列的两组特征矩阵运动补偿,得到待编码视频的码流数据。
根据本发明实施例的另一方面,提供了一种视频解码方法,包括:
接收码流数据,其中,所述码流数据包括目标编码序列和至少一组非目标编码序列;
对所述目标编码序列进行解码,得到一组目标特征矩阵及一组目标特征矩阵的编码参数,其中,所述一组目标特征矩阵包括至少两个目标特征矩阵;
根据所述一组目标矩阵的编码参数对所述至少一组非目标编码数据进行解码,得到至少一组非目标特征矩阵,其中,一组非目标特征矩阵包括至少两个非目标特征矩阵;
重组所述至少一组非目标特征矩阵与所述目标特征矩阵,得到至少两组重组后的特征矩阵序列;
将所述至少两组重组后的特征矩阵序列进行合成,得到至少两个图像帧,所述至少两个图像帧为解码后视频的图像帧。
可选的,重组所述至少一组非目标特征矩阵与所述目标特征矩阵,得到至少两组重组后的特征矩阵序列,包括:
将所述至少一组非目标特征矩阵与目标特征矩阵按特征类型进行分类,得到至少两组重组后的特征矩阵序列,每组所述重组后的特征矩阵序列中均为不同类型的目标特征矩阵和非目标特征矩阵。
根据本发明实施例的又一方面,提供了一种视频编码装置,包括:
获取模块,用于获取待编码视频的至少两个图像帧;
编码模块,用于对所述至少两个图像帧的每个图像帧进行特征提取,得到至少四个第一特征矩阵;调整所述至少四个第一特征矩阵的序列,得到至少两组待编码序列,其中,每组待编码序列包括至少两个第一特征矩阵;对所述至少两组待编码序列中的目标待编码序列进行编码,得到目标编码数据以及目标残差运动矢量;根据所述目标残差运动矢量,对所述至少两组待编码序列中未编码的待编码序列进行编码,得到待编码视频的码流数据。
根据本发明实施例的又一方面,提供了一种视频解码装置,包括:
接收模块,用于接收码流数据,其中,所述码流数据包括目标编码序列和至少一组非目标编码序列;
解码模块,用于对所述目标编码序列进行解码,得到目标特征矩阵及目标特征矩阵的编码参数,其中,目标特征矩阵包括至少两个目标特征矩阵;将所述目标矩阵的编码参数复制到所述码流数据中未进行解码的非目标编码数据中,按照所述编码参数进行解码,得到至少一组非目标特征矩阵,其中,一组非目标特征矩阵包括至少两个非目标特征矩阵;将所述至少一组非目标特征矩阵与目标特征矩阵进行重组,得到至少两组重组后的特征矩阵序列;将所述至少两组重组后的特征矩阵序列进行合成,得到待编码视频的至少两个重组图像帧。
根据本发明实施例的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述视频编码方法和视频解码方法任一项对应的操作。
根据本发明实施例的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述视频编码方法和视频解码方法任一项对应的操作。
根据本发明上述实施例提供的方案,通过获取待编码视频的至少两个图像帧;对所述至少两个图像帧的每个图像帧进行特征提取,得到至少四个第一特征矩阵;调整所述至少四个第一特征矩阵的序列,得到至少两组待编码序列,其中,每组待编码序列包括至少两个第一特征矩阵;对所述至少两组待编码序列中的目标待编码序列进行编码,得到目标编码数据以及目标残差运动矢量;根据所述目标残差运动矢量,对所述至少两组待编码序列中未编码的待编码序列进行编码,得到待编码视频的码流数据,可以利用不同的特征均来自同一原始图像的神经网络结构的原理,来提高视频编解码的性能。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明实施例的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明实施例的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的视频编码方法流程图;
图2示出了本发明实施例提供的一种以一个小球移动为例的视频编码方法原理示意图;
图3示出了本发明实施例提供的一种特征压缩方法示意图;
图4示出了本发明实施例提供的一种以当前帧(第Z帧)的编码为例的编码原理示意图;
图6示出了本发明实施例提供的另一种具体的编码方法原理示意图;
图7示出了本发明实施例提供的一种数据样例示意图;
图8示出了本发明实施例提供的视频解码方法流程图;
图9示出了本发明实施例提供的一种具体的视频编码方法流程图;
图10示出了本发明实施例提供的视频编码装置的结构示意图;
图11示出了本发明实施例提供的视频解码装置的结构示意图;
图12示出了本发明实施例提供的计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
图1示出了本发明实施例提供的视频编码方法的流程图。如图1所示,该方法包括以下步骤:
步骤11,获取待编码视频的至少两个图像帧;
步骤12,对所述至少两个图像帧的每个图像帧进行特征提取,得到至少四个第一特征矩阵;
步骤13,调整所述至少四个第一特征矩阵的序列,得到至少两组待编码序列,其中,每组待编码序列包括至少两个第一特征矩阵;
步骤14,对所述至少两组待编码序列中的目标待编码序列进行编码,得到目标编码数据以及目标残差运动矢量;
步骤15,根据所述目标残差运动矢量,对所述至少两组待编码序列中未编码的待编码序列进行编码,得到待编码视频的码流数据。
该实施例中,通过获取待编码视频的至少两个图像帧;对所述至少两个图像帧的每个图像帧进行特征提取,得到至少四个第一特征矩阵;调整所述至少四个第一特征矩阵的序列,得到至少两组待编码序列,其中,每组待编码序列包括至少两个第一特征矩阵;对所述至少两组待编码序列中的目标待编码序列进行编码,得到目标编码数据以及目标残差运动矢量;根据所述目标残差运动矢量,对所述至少两组待编码序列中未编码的待编码序列进行编码,得到待编码视频的码流数据,可以利用不同的特征均来自同一原始图像的神经网络结构的原理,来提高视频编解码的性能。
图2示出了本发明实施例提供的一种具体的视频编码方法原理示意图,如图2所示,以一个小球移动为例,帧n和帧m为小球在移动过程中一个画面组内的临近帧,将帧n和帧m分别输入至特征提取模型,得到帧n的特征矩阵n1、n2以及帧m的特征矩阵m1、m2,其中,特征矩阵n1到特征矩阵m1的像素偏移与特征矩阵n2到特征矩阵m2的像素偏移保持一致,这表征不同的特征均来自于同一原始图像这个神经网络结构。
在本发明的一可选的实施例中,步骤13可以包括:
步骤131,对所述至少四个第一特征矩阵分类,得到至少两组待编码序列,每组所述待编码序列所包含的第一特征矩阵的数据特征类型相同。
该实施例中,主要是将同一特征统一成一个序列,例如或者,但不限于如上所述,其中,在序列中,为原始图像中x帧的第一特征,为原始图像中x+1帧的第一特征,在序列中,为原始图像中x帧的第二特征,为原始图像中x+1帧的第二特征。
在本发明的又一可选的实施例中,步骤14可以包括:
步骤141,将所述至少两组待编码序列中的目标待编码序列进行编码,得到至少两组运动矢量;
步骤142,对每两组相邻的所述运动矢量进行补偿计算,得到目标残差运动矢量。
该实施例中,所述目标残差运动矢量RMV满足:
RMV=MV2-MV1,其中,MV1为第一运动矢量,MV2为第二运动矢量,所述第一运动矢量是任意一组运动矢量,所述第二运动矢量是指晚于所述第一运动矢量且与所述第一运动矢量相邻的运动矢量。
在本发明的又一可选的实施例中,步骤15可以包括:
步骤151,针对每个未编码的待编码序列,根据与所述待编码序列在时间上对应的目标残差运动矢量,对所述待编码序列的两组特征矩阵运动补偿,得到待编码视频的码流数据。
如图3所示,图中以第n个特征为目标待编码数据,第n+1个特征为其中一个未编码数据,该实施例中,编码器在对未编码的待编码序列编码时,会直接复制所述待编码序列在时间上对应的目标残差矢量运动,然后再根据所述目标残差矢量运动,对每个未编码的待编码序列的两组矩阵特征进行运动补偿,直到每个未编码的待编码序列都完成编码,得到待编码视频的码流数据,因此,基于每个未编码的编码过程都是直接复制目标残差矢量运动的,所以在每个未编码的压缩数据中,只包含残差信息,而不包括参考帧和运动矢量信息。
图4示出了本发明实施例提供的一种具体的编码原理示意图,图5示出了本发明实施例提供的一种具体的视频编码方法流程图,如图4和图5所示,第个特征视频是由原始视频的第个特征提取的特征矩阵组成的视频。第个特征视频输入至基于分块的编码器,获得压缩视频数据,所述压缩数据包括每个块的参考帧、运动矢量以及预测残差数据。可以将预测残差数据的参数记录为,其中指示选中的特征矩阵编号。图4中以当前帧(第Z帧)的编码为例,当前帧有两个参考帧,分别为第X帧和第Y帧,其中第X帧和第Y帧由编码器判定为I帧或P帧。并且两个块分别对应两个运动矢量。当对第个特征视频进行编码时,直接复制第个特征视频的控制信息。即第个特征视频内自动将第X帧和第Y帧设定为I帧或P帧,并且第Z帧的两个参考帧也自动设定为第X帧和第Y帧,其中对应的两个块也使用相同的运动矢量(MV1、MV2)。最后,第个特征视频在相同的控制信息下,复制的结果到,并基于对在的视频中的特征矩阵进行视频编码,重复上述过程,直到所有的特征视频完成编码。
图6示出了本发明实施例提供的另一种具体的编码方法原理示意图,其中第个特征视频中当前帧(第Z帧)使用了两个参考帧,分别为第X帧和第Y帧,并且其中两个块的运动矢量分别如图所示为MV1,MV2。编码器对第个特征视频进行编码,获得对应的两个块的参考帧和运动矢量(MV1,MV3)。即第一个块(块#A)的运动矢量和参考帧与第个特征视频的第Z帧的结果一致,而另外一个块的运动矢量和参考帧与第个特征视频不同。此时,对第个特征视频的第Z帧的块#A编码使用1bit信令(c=0),该信令用于指示块#A的运动矢量和参考帧均复制于第个特征视频的第Z帧的运动矢量和参考帧。对第个特征视频的第Z帧的块#B编码使用1bit信令(c=1),用于指示块#B的运动矢量和参考帧均复制于第个特征视频的第Z帧的运动矢量和参考帧并且对残差运动矢量进行编码,即RMV=MV3-MV2。一个数据样例如图7所示,块#A的编码数据中的1bit信息取值为0,指示运动矢量进行直接复制,其后续的比特数据为预测残差的编码信息。块#B的编码数据中的1bit信息取值为1,用于指示后续比特流中还包含残差运动矢量。这样可以使所有特征视频均经过编码器的块搜索,每个块获得对应的参考帧和运动矢量。在当前块与选定的特征视频中对应块的控制信息相同时,编码器为当前块记录一个bit的控制信息,该信息指示当前块复制了选定特征视频中对应块的控制信息。如果当前块与选定的特征视频中对应的块的控制信息不同的时,还可以对残差运动矢量进行编码。
图8示出了本发明实施例提供的视频解码方法的流程图。如图8所示,该方法包括以下步骤:
步骤81,接收码流数据,其中,所述码流数据包括目标编码序列和至少一组非目标编码序列;
步骤82,对所述目标编码序列进行解码,得到一组目标特征矩阵及一组目标特征矩阵的编码参数,其中,所述一组目标特征矩阵包括至少两个目标特征矩阵;
步骤83,根据所述一组目标矩阵的编码参数对所述至少一组非目标编码数据进行解码,得到至少一组非目标特征矩阵,其中,一组非目标特征矩阵包括至少两个非目标特征矩阵;
步骤84,重组所述至少一组非目标特征矩阵与所述目标特征矩阵,得到至少两组重组后的特征矩阵序列;
具体的,将所述至少一组非目标特征矩阵与目标特征矩阵按特征类型进行分类,得到至少两组重组后的特征矩阵序列,每组所述重组后的特征矩阵序列中均为不同类型的目标特征矩阵和非目标特征矩阵。
步骤85,将所述至少两组重组后的特征矩阵序列进行合成,得到待编码视频的至少两个重组图像帧。
可选的,本发明涉及的“重组”是指将在执行“重组”步骤前的特征矩阵序列,根据某一特定的排列顺序,排列成与“重组”步骤前不同的顺序,形成新的排列顺序。
如图9所示,该实施例中,解码的流程与编码的流程相对应。解码器对目标编码序列(例如上述实施例中,在编码的过程中第个特征视频)直接使用视频解码方法解码,获得目标特征图数据,所述目标特征图数据包括:至少两个目标矩阵和目标矩阵对应的编码参数,但不限于如上所述。然后,解码器在对未进行解码的其他编码数据中(例如上述实施例中,在编码的过程中第k+1个特征视频),解码器首先会通过复制指示信息获得当前块的复制方式,包括:直接复制或带残差运动矢量复制,但不限于如上所述,然后通过目标编码序列对应的编码参数获得其他编码序列的编码参数,包括参考帧的编号、运动矢量、分块方式。解码器根据获得的编码参数,完成对其他编码序列的解码。重复上述过程,直到对所有的其他编码序列完成解码,并重新对解码后的特征矩阵进行重组,得到待编码始视频对应的特征流数据,即所述待编码视频的至少两个重组图像帧。
在本发明的上述实施例中,通过获取待编码视频的至少两个图像帧;对所述至少两个图像帧的每个图像帧进行特征提取,得到至少四个第一特征矩阵;调整所述至少四个第一特征矩阵的序列,得到至少两组待编码序列,其中,每组待编码序列包括至少两个第一特征矩阵;对所述至少两组待编码序列中的目标待编码序列进行编码,得到目标编码数据以及目标残差运动矢量;根据所述目标残差运动矢量,对所述至少两组待编码序列中未编码的待编码序列进行编码,得到待编码视频的码流数据,可以利用不同的特征均来自同一原始图像的神经网络结构的原理,来提高视频编解码的性能。
图10示出了本发明实施例提供的视频编码装置100的结构示意图。如图10所示,该装置包括:
获取模块101,用于获取待编码视频的至少两个图像帧;
编码模块102,用于对所述至少两个图像帧的每个图像帧进行特征提取,得到至少四个第一特征矩阵;调整所述至少四个第一特征矩阵的序列,得到至少两组待编码序列,其中,每组待编码序列包括至少两个第一特征矩阵;对所述至少两组待编码序列中的目标待编码序列进行编码,得到目标编码数据以及目标残差运动矢量;根据所述目标残差运动矢量,对所述至少两组待编码序列中未编码的待编码序列进行编码,得到待编码视频的码流数据。
可选的,所述编码模块102还用于对所述至少四个第一特征矩阵分类,得到至少两组待编码序列,每组所述待编码序列所包含的第一特征矩阵的数据特征类型相同。
可选的,所述编码模块102还用于将所述至少两组待编码序列中的目标待编码序列进行编码,得到至少两组运动矢量;
对每两组相邻的所述运动矢量进行补偿计算,得到目标残差运动矢量。
可选的,所述目标残差运动矢量RMV满足:
RMV=MV2-MV1,其中,MV1为第一运动矢量,MV2为第二运动矢量,所述第一运动矢量是任意一组运动矢量,所述第二运动矢量是指晚于所述第一运动矢量且与所述第一运动矢量相邻的运动矢量。
可选的,所述编码模块102还用于针对每个未编码的待编码序列,根据与所述待编码序列在时间上对应的目标残差运动矢量,对所述待编码序列的两组特征矩阵运动补偿,得到待编码视频的码流数据。
图11示出了本发明实施例提供的视频解码装置110的结构示意图。如图11所示,该装置包括:
接收模块111,用于接收码流数据,其中,所述码流数据包括目标编码序列和至少一组非目标编码序列;
解码模块112,用于对所述目标编码序列进行解码,得到目标特征矩阵及目标特征矩阵的编码参数,其中,目标特征矩阵包括至少两个目标特征矩阵;将所述目标矩阵的编码参数复制到所述码流数据中未进行解码的非目标编码数据中,按照所述编码参数进行解码,得到至少一组非目标特征矩阵,其中,一组非目标特征矩阵包括至少两个非目标特征矩阵;将所述至少一组非目标特征矩阵与目标特征矩阵进行重组,得到至少两组重组后的特征矩阵序列;将所述至少两组重组后的特征矩阵序列进行合成,得到待编码视频的至少两个重组图像帧。
可选的,所述解码模块112还用于将所述至少一组非目标特征矩阵与目标特征矩阵按特征类型进行分类,得到至少两组重组后的特征矩阵序列,每组所述重组后的特征矩阵序列中均为不同类型的目标特征矩阵和非目标特征矩阵。
需要说明的是,该实施例是与上述方法实施例对应的装置实施例,上述方法实施例中的所有实现方式均适用于该装置的实施例中,也能达到相同的技术效果。
本发明实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的视频编解码方法。
图12示出了本发明实施例提供的计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图12所示,该计算设备可以包括:处理器(processor)、通信接口(Communications Interface)、存储器(memory)、以及通信总线。
其中:处理器、通信接口、以及存储器通过通信总线完成相互间的通信。通信接口,用于与其它设备比如客户端或其它服务器等的网元通信。处理器,用于执行程序,具体可以执行上述用于计算设备的视频编解码方法实施例中的相关步骤。
具体地,程序可以包括程序代码,该程序代码包括计算机操作指令。
处理器可能是中央处理器CPU,或者是特定集成电路ASIC(Application SpecificIntegrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器,用于存放程序。存储器可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序具体可以用于使得处理器执行上述任意方法实施例中的视频编解码方法。程序中各步骤的具体实现可以参见上述视频编解码方法实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明实施例的内容,并且上面对特定语言所做的描述是为了披露本发明实施例的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明实施例并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一些或者全部部件的一些或者全部功能。本发明实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明实施例的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明实施例进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。
Claims (11)
1.一种视频编码方法,其特征在于,所述方法包括:
获取待编码视频的至少两个图像帧;
对所述至少两个图像帧的每个图像帧进行特征提取,得到至少四个第一特征矩阵;
调整所述至少四个第一特征矩阵的序列,得到至少两组待编码序列,其中,每组待编码序列包括至少两个第一特征矩阵;
对所述至少两组待编码序列中的目标待编码序列进行编码,得到目标编码数据以及目标残差运动矢量;
根据所述目标残差运动矢量,对所述至少两组待编码序列中未编码的待编码序列进行编码,得到待编码视频的码流数据。
2.根据权利要求1所述的视频编码方法,其特征在于,对所述至少四个第一特征矩阵进行序列调整,得到至少两组待编码序列,包括:
对所述至少四个第一特征矩阵分类,得到至少两组待编码序列,每组所述待编码序列所包含的第一特征矩阵的数据特征类型相同。
3.根据权利要求1所述的视频编码方法,其特征在于,对所述至少两组待编码序列中的目标待编码序列进行编码,得到目标残差运动矢量,包括:
将所述至少两组待编码序列中的目标待编码序列进行编码,得到至少两组运动矢量;
对每两组相邻的所述运动矢量进行补偿计算,得到目标残差运动矢量。
4.根据权利要求3所述的视频编码方法,其特征在于,所述目标残差运动矢量RMV满足:
RMV=MV2-MV1,其中,MV1为第一运动矢量,MV2为第二运动矢量,所述第一运动矢量是任意一组运动矢量,所述第二运动矢量是指晚于所述第一运动矢量且与所述第一运动矢量相邻的运动矢量。
5.根据权利要求4所述的视频编码方法,其特征在于,根据所述目标残差运动矢量,对未编码的所述待编码序列进行编码,得到待编码视频的码流数据,包括:
针对每个未编码的待编码序列,根据与所述待编码序列在时间上对应的目标残差运动矢量,对所述待编码序列的两组特征矩阵运动补偿,得到待编码视频的码流数据。
6.一种视频解码方法,其特征在于,包括:
接收码流数据,其中,所述码流数据包括目标编码序列和至少一组非目标编码序列;
对所述目标编码序列进行解码,得到一组目标特征矩阵及一组目标特征矩阵的编码参数,其中,所述一组目标特征矩阵包括至少两个目标特征矩阵;
根据所述一组目标矩阵的编码参数对所述至少一组非目标编码数据进行解码,得到至少一组非目标特征矩阵,其中,一组非目标特征矩阵包括至少两个非目标特征矩阵;
重组所述至少一组非目标特征矩阵与所述目标特征矩阵,得到至少两组重组后的特征矩阵序列;
将所述至少两组重组后的特征矩阵序列进行合成,得到至少两个图像帧,所述至少两个图像帧为解码后视频的图像帧。
7.根据权利要求6所述的视频解码方法,其特征在于,重组所述至少一组非目标特征矩阵与所述目标特征矩阵,得到至少两组重组后的特征矩阵序列,包括:
将所述至少一组非目标特征矩阵与目标特征矩阵按特征类型进行分类,得到至少两组重组后的特征矩阵序列,每组所述重组后的特征矩阵序列中均为不同类型的目标特征矩阵和非目标特征矩阵。
8.一种视频编码装置,其特征在于,所述装置包括:
获取模块,用于获取待编码视频的至少两个图像帧;
编码模块,用于对所述至少两个图像帧的每个图像帧进行特征提取,得到至少四个第一特征矩阵;调整所述至少四个第一特征矩阵的序列,得到至少两组待编码序列,其中,每组待编码序列包括至少两个第一特征矩阵;对所述至少两组待编码序列中的目标待编码序列进行编码,得到目标编码数据以及目标残差运动矢量;根据所述目标残差运动矢量,对所述至少两组待编码序列中未编码的待编码序列进行编码,得到待编码视频的码流数据。
9.一种视频解码装置,其特征在于,所述装置包括:
接收模块,用于接收码流数据,其中,所述码流数据包括目标编码序列和至少一组非目标编码序列;
解码模块,用于对所述目标编码序列进行解码,得到目标特征矩阵及目标特征矩阵的编码参数,其中,目标特征矩阵包括至少两个目标特征矩阵;将所述目标矩阵的编码参数复制到所述码流数据中未进行解码的非目标编码数据中,按照所述编码参数进行解码,得到至少一组非目标特征矩阵,其中,一组非目标特征矩阵包括至少两个非目标特征矩阵;将所述至少一组非目标特征矩阵与目标特征矩阵进行重组,得到至少两组重组后的特征矩阵序列;将所述至少两组重组后的特征矩阵序列进行合成,得到待编码视频的至少两个重组图像帧。
10.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存储至少一可执行指令,所述至少一可执行指令运行时使所述处理器执行如权利要求1-5中任一项所述的视频编码方法,或者权利要求2-7中任一项所述的视频解码方法。
11.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令运行时使计算设备执行权利要求1-5中任一项所述的视频编码方法,或者权利要求2-7中任一项所述的视频解码方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210324527.4A CN114449280B (zh) | 2022-03-30 | 2022-03-30 | 一种视频编解码方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210324527.4A CN114449280B (zh) | 2022-03-30 | 2022-03-30 | 一种视频编解码方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114449280A true CN114449280A (zh) | 2022-05-06 |
CN114449280B CN114449280B (zh) | 2022-10-04 |
Family
ID=81359336
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210324527.4A Active CN114449280B (zh) | 2022-03-30 | 2022-03-30 | 一种视频编解码方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114449280B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101282479A (zh) * | 2008-05-06 | 2008-10-08 | 武汉大学 | 基于感兴趣区域的空域分辨率可调整编解码方法 |
US20140355861A1 (en) * | 2011-08-25 | 2014-12-04 | Cornell University | Retinal encoder for machine vision |
US20170302920A1 (en) * | 2014-09-19 | 2017-10-19 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods, encoders and decoders for coding of video sequencing |
US20200304831A1 (en) * | 2019-03-21 | 2020-09-24 | Gyrfalcon Technology Inc. | Feature Encoding Based Video Compression and Storage |
CN112001923A (zh) * | 2020-11-02 | 2020-11-27 | 中国人民解放军国防科技大学 | 一种视网膜图像分割方法及装置 |
US20210203997A1 (en) * | 2018-09-10 | 2021-07-01 | Huawei Technologies Co., Ltd. | Hybrid video and feature coding and decoding |
US20210258588A1 (en) * | 2020-02-14 | 2021-08-19 | Alibaba Group Holding Limited | Method and system for characteristic-based video processing |
CN113382235A (zh) * | 2021-08-11 | 2021-09-10 | 浙江智慧视频安防创新中心有限公司 | 数字视网膜视频处理方法、装置、电子设备及存储介质 |
CN113473142A (zh) * | 2021-09-03 | 2021-10-01 | 浙江智慧视频安防创新中心有限公司 | 视频编码、视频解码方法及装置、电子设备、存储介质 |
US20210329254A1 (en) * | 2020-04-16 | 2021-10-21 | Alibaba Group Holding Limited | Bitrate control method for video coding |
US20210326638A1 (en) * | 2020-04-20 | 2021-10-21 | Adobe Inc. | Video panoptic segmentation |
CN113556582A (zh) * | 2021-07-30 | 2021-10-26 | 海宁奕斯伟集成电路设计有限公司 | 视频数据处理方法、装置、设备以及存储介质 |
US20220021870A1 (en) * | 2020-07-15 | 2022-01-20 | Tencent America LLC | Predicted frame generation by deformable convolution for video coding |
-
2022
- 2022-03-30 CN CN202210324527.4A patent/CN114449280B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101282479A (zh) * | 2008-05-06 | 2008-10-08 | 武汉大学 | 基于感兴趣区域的空域分辨率可调整编解码方法 |
US20140355861A1 (en) * | 2011-08-25 | 2014-12-04 | Cornell University | Retinal encoder for machine vision |
US20170302920A1 (en) * | 2014-09-19 | 2017-10-19 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods, encoders and decoders for coding of video sequencing |
US20210203997A1 (en) * | 2018-09-10 | 2021-07-01 | Huawei Technologies Co., Ltd. | Hybrid video and feature coding and decoding |
US20200304831A1 (en) * | 2019-03-21 | 2020-09-24 | Gyrfalcon Technology Inc. | Feature Encoding Based Video Compression and Storage |
US20210258588A1 (en) * | 2020-02-14 | 2021-08-19 | Alibaba Group Holding Limited | Method and system for characteristic-based video processing |
US20210329254A1 (en) * | 2020-04-16 | 2021-10-21 | Alibaba Group Holding Limited | Bitrate control method for video coding |
US20210326638A1 (en) * | 2020-04-20 | 2021-10-21 | Adobe Inc. | Video panoptic segmentation |
US20220021870A1 (en) * | 2020-07-15 | 2022-01-20 | Tencent America LLC | Predicted frame generation by deformable convolution for video coding |
CN112001923A (zh) * | 2020-11-02 | 2020-11-27 | 中国人民解放军国防科技大学 | 一种视网膜图像分割方法及装置 |
CN113556582A (zh) * | 2021-07-30 | 2021-10-26 | 海宁奕斯伟集成电路设计有限公司 | 视频数据处理方法、装置、设备以及存储介质 |
CN113382235A (zh) * | 2021-08-11 | 2021-09-10 | 浙江智慧视频安防创新中心有限公司 | 数字视网膜视频处理方法、装置、电子设备及存储介质 |
CN113473142A (zh) * | 2021-09-03 | 2021-10-01 | 浙江智慧视频安防创新中心有限公司 | 视频编码、视频解码方法及装置、电子设备、存储介质 |
Non-Patent Citations (2)
Title |
---|
WEN GAO,ET AL.: "Digital Retina: A Way to Make the City Brain More Efficient by Visual Coding", 《 IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY ( VOLUME: 31, ISSUE: 11, NOV. 2021)》 * |
高文,等.: "数字视网膜:智慧城市系统演进的关键环节", 《中国科学》 * |
Also Published As
Publication number | Publication date |
---|---|
CN114449280B (zh) | 2022-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pan et al. | Efficient in-loop filtering based on enhanced deep convolutional neural networks for HEVC | |
Wu et al. | Learned block-based hybrid image compression | |
CN111263161B (zh) | 视频压缩处理方法、装置、存储介质和电子设备 | |
CN105426883B (zh) | 视频分类快速识别的方法及装置 | |
CN112102212B (zh) | 一种视频修复方法、装置、设备及存储介质 | |
US9380314B2 (en) | Pixel retrieval for frame reconstruction | |
Ayzik et al. | Deep image compression using decoder side information | |
CN115486068A (zh) | 用于视频编码中基于深度神经网络的帧间预测的方法和设备 | |
CN111641826B (zh) | 对数据进行编码、解码的方法、装置与系统 | |
CN112235569B (zh) | 基于h264压缩域的快速视频分类方法、系统及装置 | |
CN113766249A (zh) | 视频编解码中的环路滤波方法、装置、设备及存储介质 | |
EP2168382A1 (en) | Method for processing images and the corresponding electronic device | |
CN113874916A (zh) | Ai辅助的可编程硬件视频编解码器 | |
JP2022500890A (ja) | ビデオ画像成分の予測方法、装置及びコンピュータ記憶媒体 | |
CN115409716B (zh) | 视频处理方法、装置、存储介质及设备 | |
CN114257818B (zh) | 视频的编、解码方法、装置、设备和存储介质 | |
CN110830808A (zh) | 一种视频帧重构方法、装置及终端设备 | |
WO2023132919A1 (en) | Scalable framework for point cloud compression | |
US20240080495A1 (en) | Iteratively updating a filtering model | |
CN111432213A (zh) | 用于视频和图像压缩的自适应贴片数据大小编码 | |
CN114501031B (zh) | 一种压缩编码、解压缩方法以及装置 | |
CN114449280B (zh) | 一种视频编解码方法、装置及设备 | |
WO2023133889A1 (zh) | 图像处理方法、装置、遥控设备、系统及存储介质 | |
CN115866245A (zh) | 视频编码方法、装置、计算机设备和存储介质 | |
KR20240024921A (ko) | 이미지 또는 비디오를 인코딩/디코딩하기 위한 방법들 및 장치들 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |