CN114422805B - 一种视频编解码方法、装置及设备 - Google Patents
一种视频编解码方法、装置及设备 Download PDFInfo
- Publication number
- CN114422805B CN114422805B CN202210325513.4A CN202210325513A CN114422805B CN 114422805 B CN114422805 B CN 114422805B CN 202210325513 A CN202210325513 A CN 202210325513A CN 114422805 B CN114422805 B CN 114422805B
- Authority
- CN
- China
- Prior art keywords
- video
- stream data
- video frames
- data
- coded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 230000033001 locomotion Effects 0.000 claims abstract description 144
- 239000013598 vector Substances 0.000 claims abstract description 86
- 239000011159 matrix material Substances 0.000 claims description 24
- 238000000605 extraction Methods 0.000 claims description 21
- 238000004891 communication Methods 0.000 claims description 15
- 230000009466 transformation Effects 0.000 claims description 12
- 230000015572 biosynthetic process Effects 0.000 claims description 7
- 238000003786 synthesis reaction Methods 0.000 claims description 7
- 238000013139 quantization Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 11
- 230000006798 recombination Effects 0.000 description 4
- 238000005215 recombination Methods 0.000 description 4
- 210000001525 retina Anatomy 0.000 description 4
- 239000011324 bead Substances 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种视频编解码方法、装置及设备,其中,所述编码方法包括:获取待编码视频的至少两个视频帧和所述至少两个视频帧两两之间的运动矢量;对所述至少两个视频帧中的每个视频帧进行特征提取,得到相应视频帧的至少两组特征流数据;对于任意两个相邻的视频帧,基于该两个视频帧对应的运动矢量对该两个视频帧对应的每组特征流数据编码,得到所述待编码视频的码流数据。通过上述方式,本发明提高了视频编解码的效率。
Description
技术领域
本发明涉及数字视网膜技术领域,具体涉及一种视频编解码方法、装置及设备。
背景技术
数字视网膜在处理视频的过程中,涉及视频流和视频流生成的特征流,且需要对视频流和相应特征流编码。
由于在数字视网膜技术中,特征流是根据视频流生成的,所以视频流的时间和空间冗余信息与特征流的时间和空间冗余信息之间存在高度的关联性。但是现有的数字视网膜技术,对这种关联性并没有很好的利用。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的视频编解码方法、装置及设备。
根据本发明实施例的一个方面,提供了一种视频编码方法,包括:
获取待编码视频的至少两个视频帧和所述至少两个视频帧两两之间的运动矢量;
对所述至少两个视频帧中的每个视频帧进行特征提取,得到相应视频帧的至少两组特征流数据;
对于任意两个相邻的视频帧,基于该两个视频帧对应的运动矢量对该两个视频帧对应的每组特征流数据编码,得到所述待编码视频的码流数据。
可选的,对于任意两个相邻的视频帧,基于该两个视频帧对应的运动矢量对该两个视频帧对应的每组特征流数据编码,得到所述待编码视频的码流数据,包括:
对于任意两个相邻的视频帧,对所述至少两个视频帧两两之间的运动矢量进行缩放,得到缩放后的运动矢量;
基于所述缩放后的运动矢量,对该两个视频帧对应的每组特征流数据编码进行运动补偿,得到至少两个第一运动补偿残差;
分别将每个所述第一运动补偿残差进行重组,得到至少两个第二运动补偿残差;
对每个所述第二运动补偿残差进行处理,得到所述待编码视频的码流数据。
可选的,对于任意两个相邻的视频帧,对所述至少两个视频帧两两之间的运动矢量进行缩放,得到缩放后的运动矢量,包括:
可选的,针对任一第二运动补偿残差,所述对每个所述第二运动补偿残差进行处理,得到所述待编码视频的码流数据,包括:
对所述第二运动补偿残差进行合成,得到第一合成残差帧;
对所述第一合成残差帧进行变换,得到变换后的数据;
对所述变换后的数据进行量化,得到离散编码数据;
将所述离散编码数据输入至熵编码器进行处理,得到所述待编码视频的码流数据。
根据本发明实施例的另一方面,提供了一种视频解码方法,包括:
接收码流数据,所述码流数据是根据待编码视频至少两个视频帧两两之间的运动矢量,对所述至少两个视频帧中的每个视频帧的至少两组特征流数据编码得到的;
重建所述码流数据分别得到视频流数据和特征流数据,所述视频流数据是指所述码流数据对应的解码后的视频。
可选的,在重建所述码流数据时,还包括:
将所述码流数据进行逆量化处理,得到第一处理结果;
对所述第一处理结果进行逆变换处理,得到空域的第二合成残差帧;
将所述第二合成残差帧进行像素重组,得到至少两个预测残差;
基于所述码流数据对应的运动矢量,对每个所述预测残差进行运动补偿,得到至少两个重建的特征矩阵,每个所述重建的特征矩阵是指所述重建的特征流数据。
根据本发明实施例的又一方面,提供了一种视频编码装置,包括:
获取模块,用于获取待编码视频的至少两个视频帧和所述至少两个视频帧两两之间的运动矢量;
编码模块,用于对所述至少两个视频帧中的每个视频帧进行特征提取,得到相应视频帧的至少两组特征流数据;对于任意两个相邻的视频帧,基于该两个视频帧对应的运动矢量对该两个视频帧对应的每组特征流数据编码,得到所述待编码视频的码流数据。
根据本发明实施例的又一方面,提供了一种视频解码装置,包括:
接收模块,用于接收码流数据,所述码流数据是根据待编码视频至少两个视频帧两两之间的运动矢量,对所述至少两个视频帧中的每个视频帧的至少两组特征流数据编码得到的;
解码模块,用于重建所述码流数据分别得到视频流数据和特征流数据,所述视频流数据是指所述码流数据对应的解码后的视频。
根据本发明实施例的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述任一项所述的视频编码方法和视频解码方法对应的操作。
根据本发明实施例的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述任一项所述的视频编码方法和视频解码方法对应的操作。
根据本发明上述实施例提供的方案,通过获取待编码视频的至少两个视频帧和所述至少两个视频帧两两之间的运动矢量;对所述至少两个视频帧中的每个视频帧进行特征提取,得到相应视频帧的至少两组特征流数据;对于任意两个相邻的视频帧,基于该两个视频帧对应的运动矢量对该两个视频帧对应的每组特征流数据编码,得到所述待编码视频的码流数据,可以利用视频流与特征流之间高度的关联性来提高视频编解码的效率。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明实施例的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明实施例的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的视频编码方法流程图;
图2示出了本发明实施例提供的一种具体的视频编码方法流程图;
图3示出了本发明实施例提供的一种具体的获取预测残差方法步骤132示意图;
图4示出了本发明实施例提供的一种具体的运动残差重组方法步骤133示意图;
图5示出了本发明实施例提供的一种具体的运动矢量缩放关系示意图;
图6示出了本发明实施例提供的一种具体的图像帧在编码后的数据流的结构示意图;
图7示出了本发明实施例提供的视频解码方法流程图;
图8示出了本发明实施例提供的一种具体的视频解码方法流程图;
图9示出了本发明实施例提供的视频编码装置的结构示意图;
图10示出了本发明实施例提供的视频解码装置的结构示意图;
图11示出了本发明实施例提供的计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
图1示出了本发明实施例提供的视频编码方法的流程图。如图1所示,该方法包括以下步骤:
步骤11,获取待编码视频的至少两个视频帧和所述至少两个视频帧两两之间的运动矢量;
步骤12,对所述至少两个视频帧中的每个视频帧进行特征提取,得到相应视频帧的至少两组特征流数据;
步骤13,对于任意两个相邻的视频帧,基于该两个视频帧对应的运动矢量对该两个视频帧对应的每组特征流数据编码,得到所述待编码视频的码流数据。
该实施例中,通过获取待编码视频的至少两个视频帧和所述至少两个视频帧两两之间的运动矢量;对所述至少两个视频帧中的每个视频帧进行特征提取,得到相应视频帧的至少两组特征流数据;对于任意两个相邻的视频帧,基于该两个视频帧对应的运动矢量对该两个视频帧对应的每组特征流数据编码,得到所述待编码视频的码流数据,可以利用视频流与特征流之间高度的关联性来提高视频编解码的效率。
图2示出了本发明实施例提供的一种具体的视频编码方法流程图,如图2所示,在本发明的一可选的实施例中,步骤11可以包括:对所述待编码视频的至少两个视频帧进行视频编码,得到至少两个视频帧两两之间的运动矢量。
具体的,通过视频编码器对所述待编码视频的至少两个视频帧进行视频编码,在编码完成后,视频编码器会输出每一个编码单元的预测模式及两个视频帧两两之间的运动矢量,其中,所述预测模式包括:宏块或CTU,但不限于如上所述。
该实施例中,由于视频编码技术中大量的冗余是被帧间预测模式压缩的,所以只考虑帧间预测模式。因此,每个宏块都存在至少一个运动矢量和参考帧,同时所述运动矢量和参考帧会作为控制信息被缓存。
在本发明的又一可选的实施例中,步骤12可以包括:通过特征提取模块对所述至少两个视频帧中的每个视频帧进行特征提取,得到相应视频帧的至少两组特征流数据。
该实施例中,由于当前帧为帧间预测模式,也就是P帧或B帧。所以,所述至少两个视频帧在经过特征提取模块之后,将会得到至少两组堆叠的2维特征矩阵,所述堆叠的2维特征矩阵即为特征流数据。
在本发明的又一可选的实施例中,步骤13可以包括:
步骤131,对于任意两个相邻的视频帧,对所述至少两个视频帧两两之间的运动矢量进行缩放,得到缩放后的运动矢量;
步骤132,基于所述缩放后的运动矢量,对该两个视频帧对应的每组特征流数据编码进行运动补偿,得到至少两个第一运动补偿残差;
步骤133,分别将每个所述第一运动补偿残差进行重组,得到至少两个第二运动补偿残差;
步骤134,对每个所述第二运动补偿残差进行处理,得到所述待编码视频的码流数据。
该实施例中,步骤132可以是通过将所述缩放后的运动矢量输入至变换器,对该两个视频帧对应的每组特征流数据编码进行运动补偿,得到至少两个第一运动补偿残差。
所述变换器包括:DCT变换器,但不限于如上所述。所述变换器可以将空域残差转化到频域残差。由于残差值主要集中在低频分量,因此使用变换器和量化器能进一步压缩残差数据。针对某一特定的特征矩阵,其残差值也遵循相同的规律,也就是残差值将集中在低频分量。
具体的,步骤132过程如图3所示,以一个小球移动为例,假设原始图像中只存在一个运动的小球,其他的区域为静态背景,同时经过特征提取模块后共计生成K个特征矩阵。则在原始图像的编码过程中,由于运动补偿的误差,预测残差将高度集中在当前帧小球所处位置的区域,类似的,每个特征矩阵的预测残差也将集中在小球所处的位置区域。然而,在原始图像中只需将小球所处分块进行频域变换即可压缩高频分量,但特征矩阵中将出现多个“小球区域”,假设小球以外区域预测残差为0,则在小球边界处将出现高频分量,并且每个特征矩阵均出现一次高频分量,即该高频分量重复出现K次。这说明变换器处理后经过量化处理,每个特征矩阵都将需要额外的比特来表示这些非零高频分量。所以,需要再对运动补偿残差进行重组来处理这些非零高频分量。
步骤133过程如图4所示,以两个第一运动补偿残差重组为例,图中A代表来自特征矩阵1的残差像素,B代表来自特征矩阵2的残差像素,AB两个残差像素按照垂直方向交替的方式进行排列。这样可以使得相同运动矢量的预测残差互相临近。残差像素重组的目的是将不同特征近似的残差值聚合在一起,使得其频域分量集中在低频分量,从而压缩最终所需的比特数。
在本发明的又一可选的实施例中,步骤131可以包括:
该实施例中,在进行缩放时,需要每个特征矩阵的参考帧均等于特征矩阵对应的视频帧的参考帧的特征矩阵,同时需要令MVF(X=0,Y=0),这样可以避免预测出现严重误差或超出特征矩阵的边界的问题。在缩放后,每个特征矩阵的每个块均具有了至少一个参考帧和对应的运动矢量。同时,该运动矢量的缩放方法还可以通过控制信息指示,并复用到编码数据流中,这样可以使编码器针对每一个分块,均可以计算一个最优的运动矢量缩放方法。
具体的,图5示出了一种具体的运动矢量缩放关系来说明两个视频帧两两之间的运动矢量是如何缩放的,图5的原视频以一个小球移动为例,一个小球从参考帧运动到当前帧在空间发生了平移,因此在视频编码过程中,对应的分块基于参考帧的预测进行运动补偿,预测使用的运动矢量MV(X=A,Y=0),其中A为水平移动的像素。在特征提取网络对原视频中的原始图像进行特征提取后,分别获得参考帧和当前帧对应的多个特征矩阵,如:特征矩阵1和特征矩阵2。对应的,小球的不同特征也在两个帧内发生了水平位移,并且可以基于运动矢量MVF进行预测。但是由于特征矩阵的尺寸与原始图像已经发生了不同,因此如果令MVF=MV,则整个特征帧的运动预测将出现严重的误差。除非当前分块为静止背景,即MV(X=0,Y=0)。因此MVF必须使用上述缩放公式,也就是令,此时运动矢量将能如图5所示精准预测小球的特征的移动。由于特征矩阵1和特征矩阵2均源自原始图像,因此所有特征矩阵均可以使用相同的运动矢量MVF。
在本发明的又一可选的实施例中,步骤134中,针对任一第二运动补偿残差,所述对每个所述第二运动补偿残差进行处理,得到所述待编码视频的码流数据,可以包括:
步骤1341,对所述第二运动补偿残差进行合成,得到第一合成残差帧;
步骤1342,对所述第一合成残差帧进行变换,得到变换后的数据;
步骤1343,对所述变换后的数据进行量化,得到离散编码数据;
步骤1344,将所述离散编码数据输入至熵编码器进行处理,得到所述待编码视频的码流数据。
该实施例中,首先,对所述第二运动补偿残差进行合成,得到第一合成残差帧,所述第一合成残差帧的图像高度变为特征矩阵的2倍,而宽度保持不变。此时,所有的非零残差值聚集在小球对应的位置处。其次,对合成残差帧再进行频域变换,这样可以使不同特征的误差均被集中在相同区域,因此变换后的频域分量将更集中在低频分量处,这相对分别对每个特征残差帧进行频域变换后量化能够压缩更多的冗余,其中,合成残差帧并不是将多个特征矩阵对应的残差值加和,每个特征需要单独的编码,这样才能在解码端用于各项机器分析任务。然后在对所述变换后的数据进行量化,得到离散编码数据,将离散编码数据与所述待编码视频图像的编码数据进行复用,输入至熵编码器后得到所述待编码视频的码流数据。
图6示出了本发明实施例提供的一种具体的图像帧在编码后的数据流的结构示意图,如图6所示,其中每个分块的数据被独立编码,视频流数据包含两个参考帧的指示以及两个运动矢量和视频图像的预测残差。在每个块的数据包内,还包括合成特征帧的预测残差和可选的运动矢量缩放配置。但数据包内并不存在单独针对特征矩阵的运动矢量,这是由于使用了运动矢量缩放的方法造成的。
图7示出了本发明实施例提供的视频编码方法的流程图。如图7所示,该方法包括以下步骤:
步骤71,接收码流数据,所述码流数据是根据待编码视频至少两个视频帧两两之间的运动矢量,对所述至少两个视频帧中的每个视频帧的至少两组特征流数据编码得到的;
步骤72,重建所述码流数据分别得到视频流数据和特征流数据,所述视频流数据是指所述码流数据对应的解码后的视频。
该实施例中,所述重建是指通过与所述编码相反的过程来还原在编码时使用的原视频或在编码时产生的特征流数据。
在本发明的再一可选的实施例中,步骤72中在重建所述码流数据时,还可以包括:
步骤73,将所述码流数据进行逆量化处理,得到第一处理结果;
步骤74,对所述第一处理结果进行逆变换处理,得到空域的第二合成残差帧;
步骤75,将所述第二合成残差帧进行像素重组,得到至少两个预测残差;
步骤76,基于所述码流数据对应的运动矢量,对每个所述预测残差进行运动补偿,得到至少两个重建的特征矩阵,每个所述重建的特征矩阵是指所述重建的特征流数据。
如图8所示,该实施例中,在解码过程中,运动矢量、参考帧、分块信息作为控制信息被用于特征流的运动补偿。特征流数据主要是合成残差帧数据,经过逆量化起和逆变换器(IDCT)的处理后,获得空域的合成残差帧。然后,通过对合成残差帧进行像素重排列,得到多个特征矩阵的预测残差。多个特征矩阵的预测残差结合缓存器中的参考帧的特征矩阵,以及经过缩放后的运动矢量,合成重建的多个特征矩阵。多个特征矩阵可以用于后续机器分析任务的特征流数据,也就是重建的特征流数据。
在本发明的上述实施例中,通过获取待编码视频的至少两个视频帧和所述至少两个视频帧两两之间的运动矢量;对所述至少两个视频帧中的每个视频帧进行特征提取,得到相应视频帧的至少两组特征流数据;对于任意两个相邻的视频帧,基于该两个视频帧对应的运动矢量对该两个视频帧对应的每组特征流数据编码,得到所述待编码视频的码流数据,可以利用视频流与特征流之间高度的关联性来提高视频编解码的效率。同时上述实施例中的运动矢量缩放方法,针对每一个分块,均可以计算一个最优的运动矢量缩放方法,且在解码过程中,直接使用与编码相反的流程,也提高了视频解码的效率。
图9示出了本发明实施例提供的视频编码装置90的结构示意图。如图9所示,该装置包括:
获取模块91,用于获取待编码视频的至少两个视频帧和所述至少两个视频帧两两之间的运动矢量;
编码模块92,用于对所述至少两个视频帧中的每个视频帧进行特征提取,得到相应视频帧的至少两组特征流数据;对于任意两个相邻的视频帧,基于该两个视频帧对应的运动矢量对该两个视频帧对应的每组特征流数据编码,得到所述待编码视频的码流数据。
可选的,所述编码模块92还用于对于任意两个相邻的视频帧,对所述至少两个视频帧两两之间的运动矢量进行缩放,得到缩放后的运动矢量;
基于所述缩放后的运动矢量,对该两个视频帧对应的每组特征流数据编码进行运动补偿,得到至少两个第一运动补偿残差;
分别将每个所述第一运动补偿残差进行重组,得到至少两个第二运动补偿残差;
对每个所述第二运动补偿残差进行处理,得到所述待编码视频的码流数据。
可选的,所述编码模块92还用于对所述第二运动补偿残差进行合成,得到第一合成残差帧;
对所述第一合成残差帧进行变换,得到变换后的数据;
对所述变换后的数据进行量化,得到离散编码数据;
将所述离散编码数据输入至熵编码器进行处理,得到所述待编码视频的码流数据。
图10示出了本发明实施例提供的视频解码装置100的结构示意图。如图10所示,该装置包括:
接收模块101,用于接收码流数据,所述码流数据是根据待编码视频至少两个视频帧两两之间的运动矢量,对所述至少两个视频帧中的每个视频帧的至少两组特征流数据编码得到的;
解码模块102,用于重建所述码流数据分别得到视频流数据和特征流数据,所述视频流数据是指所述码流数据对应的解码后的视频。
可选的,所述解码模块102还用于将所述码流数据进行逆量化处理,得到第一处理结果;对所述第一处理结果进行逆变换处理,得到空域的第二合成残差帧;将所述第二合成残差帧进行像素重组,得到至少两个预测残差;基于所述码流数据对应的运动矢量,对每个所述预测残差进行运动补偿,得到至少两个重建的特征矩阵,每个所述重建的特征矩阵是指所述重建的特征流数据。
需要说明的是,该实施例是与上述方法实施例对应的装置实施例,上述方法实施例中的所有实现方式均适用于该装置的实施例中,也能达到相同的技术效果。
本发明实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的视频编码方法和视频解码方法。
图11示出了本发明实施例提供的计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图11所示,该计算设备可以包括:处理器(processor)、通信接口(Communications Interface)、存储器(memory)、以及通信总线。
其中:处理器、通信接口、以及存储器通过通信总线完成相互间的通信。通信接口,用于与其它设备比如客户端或其它服务器等的网元通信。处理器,用于执行程序,具体可以执行上述用于计算设备的视频编码方法和视频解码方法中的至少一个实施例中的相关步骤。
具体地,程序可以包括程序代码,该程序代码包括计算机操作指令。
处理器可能是中央处理器CPU,或者是特定集成电路ASIC(Application SpecificIntegrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器,用于存放程序。存储器可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序具体可以用于使得处理器执行上述任意方法实施例中的视频编码方法和视频解码方法中的至少一个。程序中各步骤的具体实现可以参见上述视频编码方法和视频解码方法中的至少一个实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明实施例的内容,并且上面对特定语言所做的描述是为了披露本发明实施例的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明实施例并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一些或者全部部件的一些或者全部功能。本发明实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明实施例的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明实施例进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。
Claims (7)
1.一种视频编码方法,其特征在于,所述方法包括:
获取待编码视频的至少两个视频帧和所述至少两个视频帧两两之间的运动矢量;
对所述至少两个视频帧中的每个视频帧进行特征提取,得到相应视频帧的至少两组特征流数据;
对于任意两个相邻的视频帧,基于该两个相邻的视频帧对应的运动矢量对该两个相邻的视频帧对应的每组特征流数据编码,得到所述待编码视频的码流数据,包括:
对于任意两个相邻的视频帧,对所述至少两个视频帧两两之间的运动矢量利用缩放因子nl进行缩放,得到缩放后的运动矢量;其中,n是指特征提取网络所使用窗的大小,l是指所述特征提取网络的层数;
基于所述缩放后的运动矢量,对所述两个相邻的视频帧对应的每组特征流数据进行运动补偿,得到每个视频帧对应的至少两个第一运动补偿残差;
将每个视频帧对应的所述至少两个第一运动补偿残差的像素按照垂直方向交替的方式进行重组,得到与所述至少两个视频帧对应的至少两个第二运动补偿残差;
对每个所述第二运动补偿残差进行频域变换,得到变换后的数据;
对所述变换后的数据进行量化,得到离散编码数据;
将所述离散编码数据输入至熵编码器进行处理,得到所述待编码视频的码流数据。
2.一种视频解码方法,其特征在于,所述方法包括:
接收码流数据,所述码流数据是根据待编码视频至少两个视频帧两两之间的运动矢量,对所述至少两个视频帧中的每个视频帧的至少两组特征流数据编码得到的;其中,对于任意两个相邻的视频帧,基于该两个相邻的视频帧对应的运动矢量对该两个相邻的视频帧对应的每组特征流数据编码,得到所述待编码视频的码流数据,包括:
对于任意两个相邻的视频帧,对所述至少两个视频帧两两之间的运动矢量利用缩放因子nl进行缩放,得到缩放后的运动矢量;其中,n是指特征提取网络所使用窗的大小,l是指所述特征提取网络的层数;
基于所述缩放后的运动矢量,对所述两个相邻的视频帧对应的每组特征流数据进行运动补偿,得到每个视频帧对应的至少两个第一运动补偿残差;
将每个视频帧对应的所述至少两个第一运动补偿残差的像素按照垂直方向交替的方式进行重组,得到与所述至少两个视频帧对应的至少两个第二运动补偿残差;
对每个所述第二运动补偿残差进行频域变换,得到变换后的数据;
对所述变换后的数据进行量化,得到离散编码数据;
将所述离散编码数据输入至熵编码器进行处理,得到所述待编码视频的码流数据;
解码所述码流数据分别得到视频流数据和特征流数据,所述视频流数据是指所述码流数据对应的解码后的视频。
3.根据权利要求2所述的视频解码方法,其特征在于,在解码所述码流数据时,还包括:
将所述码流数据进行逆量化处理,得到第一处理结果;
对所述第一处理结果进行逆变换处理,得到空域的合成残差帧;
将所述合成残差帧进行像素重排列,得到至少两个预测残差;
基于所述码流数据对应的运动矢量,对每个所述预测残差进行运动补偿,得到至少两个重建的特征矩阵,每个所述重建的特征矩阵是指所述重建的特征流数据。
4.一种视频编码装置,其特征在于,所述装置包括:
获取模块,用于获取待编码视频的至少两个视频帧和所述至少两个视频帧两两之间的运动矢量;
编码模块,用于对所述至少两个视频帧中的每个视频帧进行特征提取,得到相应视频帧的至少两组特征流数据;对于任意两个相邻的视频帧,基于该两个相邻的视频帧对应的运动矢量对该两个相邻的视频帧对应的每组特征流数据编码,得到所述待编码视频的码流数据,包括:
对于任意两个相邻的视频帧,对所述至少两个视频帧两两之间的运动矢量利用缩放因子nl进行缩放,得到缩放后的运动矢量;其中,n是指特征提取网络所使用窗的大小,l是指所述特征提取网络的层数;
基于所述缩放后的运动矢量,对所述两个相邻的视频帧对应的每组特征流数据进行运动补偿,得到每个视频帧对应的至少两个第一运动补偿残差;
将每个视频帧对应的所述至少两个第一运动补偿残差的像素按照垂直方向交替的方式进行重组,得到与所述至少两个视频帧对应的至少两个第二运动补偿残差;
对每个所述第二运动补偿残差进行频域变换,得到变换后的数据;
对所述变换后的数据进行量化,得到离散编码数据;
将所述离散编码数据输入至熵编码器进行处理,得到所述待编码视频的码流数据。
5.一种视频解码装置,其特征在于,所述装置包括:
接收模块,用于接收码流数据,所述码流数据是根据待编码视频至少两个视频帧两两之间的运动矢量,对所述至少两个视频帧中的每个视频帧的至少两组特征流数据编码得到的;其中,对于任意两个相邻的视频帧,基于该两个相邻的视频帧对应的运动矢量对该两个相邻的视频帧对应的每组特征流数据编码,得到所述待编码视频的码流数据,包括:
对于任意两个相邻的视频帧,对所述至少两个视频帧两两之间的运动矢量利用缩放因子nl进行缩放,得到缩放后的运动矢量;其中,n是指特征提取网络所使用窗的大小,l是指所述特征提取网络的层数;
基于所述缩放后的运动矢量,对所述两个相邻的视频帧对应的每组特征流数据进行运动补偿,得到每个视频帧对应的至少两个第一运动补偿残差;
将每个视频帧对应的所述至少两个第一运动补偿残差的像素按照垂直方向交替的方式进行重组,得到与所述至少两个视频帧对应的至少两个第二运动补偿残差;
对每个所述第二运动补偿残差进行频域变换,得到变换后的数据;
对所述变换后的数据进行量化,得到离散编码数据;
将所述离散编码数据输入至熵编码器进行处理,得到所述待编码视频的码流数据;
解码模块,用于解码所述码流数据分别得到视频流数据和特征流数据,所述视频流数据是指所述码流数据对应的解码后的视频。
6.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存储至少一可执行指令,所述至少一可执行指令运行时使所述处理器执行如权利要求1所述的视频编码方法或如权利要求2-3中任一项所述的视频解码方法。
7.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令运行时使计算设备执行如权利要求1所述的视频编码方法或如权利要求2-3中任一项所述的视频解码方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210325513.4A CN114422805B (zh) | 2022-03-30 | 2022-03-30 | 一种视频编解码方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210325513.4A CN114422805B (zh) | 2022-03-30 | 2022-03-30 | 一种视频编解码方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114422805A CN114422805A (zh) | 2022-04-29 |
CN114422805B true CN114422805B (zh) | 2022-09-02 |
Family
ID=81263925
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210325513.4A Active CN114422805B (zh) | 2022-03-30 | 2022-03-30 | 一种视频编解码方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114422805B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108495130A (zh) * | 2017-03-21 | 2018-09-04 | 腾讯科技(深圳)有限公司 | 视频编码、解码方法和装置、终端、服务器和存储介质 |
CN110719438A (zh) * | 2019-08-28 | 2020-01-21 | 北京大学 | 一种数字视网膜视频流与特征流的同步传输控制方法 |
WO2020155616A1 (zh) * | 2019-01-29 | 2020-08-06 | 浙江省北大信息技术高等研究院 | 一种基于数字视网膜的拍摄装置的定位方法 |
CN113095506A (zh) * | 2021-03-25 | 2021-07-09 | 北京大学 | 基于端、边及云协同的机器学习方法、系统及介质 |
CN113382235A (zh) * | 2021-08-11 | 2021-09-10 | 浙江智慧视频安防创新中心有限公司 | 数字视网膜视频处理方法、装置、电子设备及存储介质 |
CN114157863A (zh) * | 2022-02-07 | 2022-03-08 | 浙江智慧视频安防创新中心有限公司 | 基于数字视网膜的视频编码方法、系统及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010042486A1 (en) * | 2008-10-07 | 2010-04-15 | Euclid Discoveries, Llc | Feature-based video compression |
US10841577B2 (en) * | 2018-02-08 | 2020-11-17 | Electronics And Telecommunications Research Institute | Method and apparatus for video encoding and video decoding based on neural network |
CN108848380B (zh) * | 2018-06-20 | 2021-11-30 | 腾讯科技(深圳)有限公司 | 视频编码和解码方法、装置、计算机设备及存储介质 |
CN112995663B (zh) * | 2019-12-02 | 2022-09-23 | 华为技术有限公司 | 视频编码的方法、视频解码的方法及相应装置 |
-
2022
- 2022-03-30 CN CN202210325513.4A patent/CN114422805B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108495130A (zh) * | 2017-03-21 | 2018-09-04 | 腾讯科技(深圳)有限公司 | 视频编码、解码方法和装置、终端、服务器和存储介质 |
WO2020155616A1 (zh) * | 2019-01-29 | 2020-08-06 | 浙江省北大信息技术高等研究院 | 一种基于数字视网膜的拍摄装置的定位方法 |
CN110719438A (zh) * | 2019-08-28 | 2020-01-21 | 北京大学 | 一种数字视网膜视频流与特征流的同步传输控制方法 |
CN113095506A (zh) * | 2021-03-25 | 2021-07-09 | 北京大学 | 基于端、边及云协同的机器学习方法、系统及介质 |
CN113382235A (zh) * | 2021-08-11 | 2021-09-10 | 浙江智慧视频安防创新中心有限公司 | 数字视网膜视频处理方法、装置、电子设备及存储介质 |
CN114157863A (zh) * | 2022-02-07 | 2022-03-08 | 浙江智慧视频安防创新中心有限公司 | 基于数字视网膜的视频编码方法、系统及存储介质 |
Non-Patent Citations (1)
Title |
---|
数字视网膜:构筑反恐维稳的"慧眼"与"智脑";高文;《网信军民融合》;20170925(第04期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114422805A (zh) | 2022-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cheng et al. | Learned image compression with discretized gaussian mixture likelihoods and attention modules | |
RU2490815C1 (ru) | Способ и устройство для кодирования и декодирования блока кодирования границы картинки | |
JP2506332B2 (ja) | 動画像信号の高能率符号化方式 | |
US8064518B2 (en) | Encoding apparatus, encoding method, decoding apparatus, and decoding method | |
US8116581B2 (en) | Efficient image representation by edges and low-resolution signal | |
CN105141955A (zh) | 图像解码方法和图像解码设备 | |
US9380314B2 (en) | Pixel retrieval for frame reconstruction | |
KR20090095014A (ko) | 필터링된 예측 블록을 이용한 영상 부호화, 복호화 방법 및장치 | |
US8285064B2 (en) | Method for processing images and the corresponding electronic device | |
KR20010006292A (ko) | 비디오 화상 코딩 장치 및 방법 | |
JP2011055536A (ja) | 画像デジタル化のシーケンスにおけるモーションを表わす方法および装置 | |
US8594189B1 (en) | Apparatus and method for coding video using consistent regions and resolution scaling | |
CN112272298A (zh) | 转换系数编解码的方法及装置 | |
CN103975599A (zh) | 图像编码以及解码方法、装置、程序 | |
CN113079378B (zh) | 图像处理方法、装置和电子设备 | |
CN104937934A (zh) | 图像边界邻域中的自回归像素预测 | |
CN111757109A (zh) | 一种高实时性的并行视频编解码方法、系统和存储介质 | |
CN107896331B (zh) | 选择编码选项的方法、数据处理装置、计算机可读存储介质 | |
CN114422805B (zh) | 一种视频编解码方法、装置及设备 | |
KR20120045369A (ko) | 쿼드 트리 기반으로 블록 필터 정보를 부호화/복호화하는 영상 부호화/복호화 장치 및 방법 | |
CN106063268A (zh) | 将视频数据从h.264转码成h.265的方法和设备 | |
TWI795635B (zh) | 圖像解碼裝置、圖像解碼方法及程式 | |
US20050232353A1 (en) | Subband video decoding mehtod and device | |
CN114598877A (zh) | 帧间预测方法及相关设备 | |
CN109672889A (zh) | 约束的序列数据头的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |