CN113938680B - 视频序列的图像译码方法和装置以及终端设备 - Google Patents
视频序列的图像译码方法和装置以及终端设备 Download PDFInfo
- Publication number
- CN113938680B CN113938680B CN202111265258.0A CN202111265258A CN113938680B CN 113938680 B CN113938680 B CN 113938680B CN 202111265258 A CN202111265258 A CN 202111265258A CN 113938680 B CN113938680 B CN 113938680B
- Authority
- CN
- China
- Prior art keywords
- image block
- reference image
- candidate reference
- pixel point
- motion information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 117
- 230000033001 locomotion Effects 0.000 claims abstract description 218
- 239000013598 vector Substances 0.000 claims description 70
- 230000004927 fusion Effects 0.000 claims description 38
- 238000012937 correction Methods 0.000 claims description 24
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 17
- 238000004364 calculation method Methods 0.000 abstract description 7
- 230000006870 function Effects 0.000 description 34
- 230000002123 temporal effect Effects 0.000 description 9
- 239000000872 buffer Substances 0.000 description 6
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000005192 partition Methods 0.000 description 5
- 230000002146 bilateral effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000009795 derivation Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 101100537098 Mus musculus Alyref gene Proteins 0.000 description 2
- 101150095908 apex1 gene Proteins 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/149—Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/20—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
- H04N19/21—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding with binary alpha-plane coding for video objects, e.g. context-based arithmetic encoding [CAE]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/56—Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/523—Motion estimation or motion compensation with sub-pixel accuracy
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Color Television Systems (AREA)
Abstract
本发明提供一种视频序列的图像译码方法和装置,以及一种终端设备,所述图像包括当前图像块。在所述方法中,获取所述当前图像块的初始运动信息;根据所述初始运动信息,获取所述当前图像块对应的至少两个参考图像中的像素点值;将获取到的像素点值的位深度限制为预定义的位深度;然后根据至少两个受限候选参考图像块的受限像素点值,获取修正运动信息;根据所述修正运动信息,确定所述当前图像块的预测图像块。通过本发明提供的视频序列的图像译码方法或装置,在对所述运动信息进行修正之前,限制每个候选参考图像块的像素点值的位深度,从而降低计算复杂度,并缩短处理时间。
Description
技术领域
本发明涉及图像译码技术领域,尤其涉及一种视频序列的图像译码方法和装置,以及一种终端设备。
背景技术
视频译码(视频编码和解码)广泛用于数字视频应用,例如广播数字电视、基于互联网和移动网络的视频传输、视频聊天、视频会议等实时会话应用、DVD和蓝光光盘、视频内容采集和编辑系统以及安全应用的可携式摄像机。
在视频压缩中,帧间预测是通过指定相对于当前图像块的运动矢量来使用之前解码的参考图像的重建像素点的过程。这些运动矢量可以通过使用空间或时间运动矢量预测值译码为预测残差。运动矢量具有子像素精确度。为了从重建的整数位置值导出参考图像中的子像素精确像素值,使用插值滤波器。双向预测是指导出当前图像块的预测值为两个预测块的加权组合的过程,使用两个参考图像区域中的两个运动矢量进行导出。在这种情况下,除了运动矢量之外,还需要对导出两个预测块的参考图像的参考索引进行译码。当前图像块的运动矢量还可以通过融合过程导出,其中,在不对任何运动矢量残差进行译码的情况下继续使用空间相邻块的运动矢量和参考索引。除了空间相邻块之外,之前译码的参考图像的运动矢量也在适当缩放后被存储并用作时间融合模式选项,以考虑到参考图像的距离,相对于到当前图像的参考图像的距离。
已经提供了用于执行解码端运动矢量修正(简称DMVR)或导出(简称DMVD)的几种方法,从而可以进一步修正运动矢量。DMVR过程和DMVD过程中,都需要围绕可为子像素精确运动矢量的起点进行修正搜索,通常比较复杂耗时。
提供该背景信息是为了揭示申请人认为可能与本发明相关的信息。任何前述信息不允许或不应解释为构成与本发明相冲突的现有技术。
发明内容
鉴于此,为了克服上述问题,本发明提供了一种视频序列的图像译码方法和装置,以及一种终端设备。
上述和其它目的通过独立权利要求请求保护的主题实现。其它实现方式在从属权利要求、具体实施例和附图中显而易见。
根据第一方面,本发明涉及一种视频序列的图像译码方法,其中,所述图像包括当前图像块。所述方法由视频序列的图像译码装置执行。在所述方法中,获取所述当前图像块的初始运动信息;根据所述初始运动信息,获取所述当前图像块对应的至少两个候选参考图像块的像素点值;将每个候选参考图像块的像素点值的位深度限制为预定义的位深度;根据至少两个受限候选参考图像块的受限像素点值,获取修正运动信息;根据所述修正运动信息,确定所述当前图像块的预测图像块。
通过本发明提供的视频序列的图像译码方法,在对所述运动信息进行修正之前,限制每个候选参考图像块的像素点值的位深度,从而降低计算复杂度,并缩短处理时间。
在根据第一方面所述的方法的一种可能实现方式中,所述根据所述至少两个受限候选参考图像块的受限像素点值,获取修正运动信息包括:使用第二成本函数确定成本最小的受限候选参考图像块的位置;根据所述成本最小的受限候选参考图像块的位置,获取所述修正运动信息。所述第二成本函数表示受限候选参考图像块与所述当前图像块的模板的差值,其中,根据所述当前图像块的所述初始运动信息和位置获取所述模板,并且所述模板的像素点值的位深度限制为所述预定义的位深度。所述模板用作从两个受限候选参考图像块的加权组合获取的比较参考。所述成本计算如下:
其中,H为所述当前图像块的高度,W为所述当前图像块的宽度,I0(i,j)为受限候选参考图像块的位置(i,j)的像素点值,I1(i,j)为所述模板的位置(i,j)的像素点值,m0为受限候选参考图像块的像素点值的平均值,m1为所述模板的像素点值的平均值,d为预定义的位深度。
上述等式旨在限制其中的变量不超过可以用d个位表示的最大值。所述等式还指定了一个规范过程,通过该过程,可以在预定义的位深度的两个量之间执行最终的绝对差值,从而避免可能的溢出错误。
在根据第一方面所述的方法的一种可能实现方式中,使用第二成本函数确定成本最小的受限候选参考图像块的位置;根据所述成本最小的受限候选参考图像块的位置,获取所述修正运动信息。所述至少两个受限候选参考图像块包括第一受限候选参考图像块集和第二受限候选参考图像块集,所述第二成本函数表示第一受限候选参考图像块和第二受限候选参考图像块之间的差值。所述成本计算如下:
其中,H为所述当前图像块的高度,W为所述当前图像块的宽度,I0(i,j)为第一受限候选参考图像块的位置(i,j)的像素点值,I1(i,j)为第二受限候选参考图像块的位置(i,j)的像素点值,m0为所述第一受限候选参考图像块的像素点值的平均值,m1为所述第二受限候选参考图像块的像素点值的平均值,d为预定义的位深度。
上述等式旨在限制其中的变量不超过可以用d个位表示的最大值。所述等式还指定了一个规范过程,通过该过程,可以在预定义的位深度的两个量之间执行最终的绝对差值,从而避免可能的溢出错误。
根据第二方面,本发明涉及一种视频序列的图像译码装置。所述装置包括:获取模块、限制模块和确定模块,其中所述获取模块用于:获取所述当前图像块的初始运动信息;根据所述初始运动信息,获取所述当前图像块对应的至少两个候选参考图像块的像素点值;根据所述至少两个受限候选参考图像块的受限像素点值,获取修正运动信息。所述限制模块用于将每个候选参考图像块的像素点值的位深度限制为预定义的位深度,所述确定模块用于根据所述修正运动信息确定所述当前图像块的预测图像块。
通过本发明提供的视频序列的图像译码装置,在对所述运动信息进行修正之前,限制每个候选参考图像块的像素点值的位深度,从而降低计算复杂度,并缩短处理时间。
在根据第二方面所述的装置的一种可能实现方式中,所述获取模块具体用于:使用第二成本函数确定成本最小的受限候选参考图像块的位置;根据所述成本最小的受限候选参考图像块的位置,获取所述修正运动信息。所述第二成本函数表示受限候选参考图像块与所述当前图像块的模板的差值,其中,根据所述当前图像块的所述初始运动信息和位置获取所述模板,并且所述模板的像素点值的位深度限制为所述预定义的位深度。所述模板用作从两个受限候选参考图像块的加权组合获取的比较参考。所述成本计算如下:
其中,H为所述当前图像块的高度,W为所述当前图像块的宽度,I0(i,j)为受限候选参考图像块的位置(i,j)的像素点值,I1(i,j)为所述模板的位置(i,j)的像素点值,m0为受限候选参考图像块的像素点值的平均值,m1为所述模板的像素点值的平均值,d为预定义的位深度。
上述等式旨在限制其中的变量不超过可以用d个位表示的最大值。上述等式指定了一个规范过程,通过该过程,可以在预定义的位深度的两个量之间执行最终的绝对差值,从而避免可能的溢出错误。
在根据第二方面所述的装置的一种可能实现方式中,所述获取模块具体用于:使用第二成本函数确定成本最小的受限候选参考图像块的位置;根据所述成本最小的受限候选参考图像块的位置,获取所述修正运动信息。所述至少两个受限候选参考图像块包括第一受限候选参考图像块集和第二受限候选参考图像块集,所述第二成本函数表示第一受限候选参考图像块和第二受限候选参考图像块之间的差值。所述成本计算如下:
其中,H为所述当前图像块的高度,W为所述当前图像块的宽度,I0(i,j)为第一受限候选参考图像块的位置(i,j)的像素点值,I1(i,j)为第二受限候选参考图像块的位置(i,j)的像素点值,m0为所述第一受限候选参考图像块的像素点值的平均值,m1为所述第二受限候选参考图像块的像素点值的平均值,d为预定义的位深度。
上述等式指定了一个规范过程,通过该过程,可以在预定义的位深度的两个量之间执行最终的绝对差值,从而避免可能的溢出错误。
本发明第一方面所述的方法可由本发明第二方面所述的装置执行。本发明第一方面所述的方法的其它特征和实现方式直接产生于本发明第三方面及其不同实现方式所述的装置的功能。
根据第三方面,本发明涉及一种视频序列的图像译码装置,包括处理器和存储器。所述存储器存储指令,所述指令使得所述处理器执行第一方面所述的方法。
根据第四方面,提供一种储存有指令的计算机可读存储介质,其中,当所述指令在执行时使得一个或多个处理器对视频序列的图像进行译码。所述指令使得所述一个或多个处理器执行根据第一方面或第一方面任意可能的实施例所述的方法。
根据第五方面,本发明涉及一种编码器,包括根据第二方面或第三方面所述的视频序列的图像译码装置。
根据第六方面,本发明涉及一种解码器,包括根据第二方面或第三方面所述的视频序列的图像译码装置。
根据第七方面,本发明涉及一种终端设备,包括根据第五方面所述的编码器和根据第六方面所述的解码器。
通过本发明提供的视频序列的图像译码方法或装置,在对所述运动信息进行修正之前,限制每个候选参考图像块的像素点值的位深度,从而降低计算复杂度,并缩短处理时间。
附图说明
附图用于提供对本发明的进一步理解,构成说明书的一部分,并用于与以下具体实施例一起解释本发明,但不应理解为限制本发明。在附图中:
图1为基于模板匹配(template matching,TM)的解码端运动矢量导出(decoderside motion vector derivation,DMVD)的示意图;
图2为一种基于双边匹配(bilateral matching,BM)的DMVD的示意图;
图3为基于双边模板匹配的解码端运动矢量修正(decoder side motion vectorrefinement,DMVR)的示意图;
图4为本发明实施例提供的视频序列的图像译码方法的示意性流程图;
图5为本发明实施例提供的视频序列的图像译码方法的示意性流程图;
图6为本发明实施例提供的视频序列的图像译码装置的示意图。
具体实施方式
在以下描述中,参考构成本发明一部分的附图,附图通过说明的方式示出了本发明实施例的特定方面或可使用本发明实施例的特定方面。应理解,本发明的实施例可用于其它方面,并且包括未在附图中描绘的结构或逻辑变化。因此,以下详细的描述并不当作限定,本发明的范围由所附权利要求书界定。
可以理解的是,与所描述的方法有关的内容对于与用于执行方法对应的设备或系统也同样适用,反之亦然。例如,如果描述了一个或多个特定方法步骤,则对应的设备可以包括一个或多个单元,例如,功能单元,用于执行所描述的一个或多个方法步骤(例如,执行所述一个或多个步骤的一个单元,或各自执行所述多个步骤中的一个或多个步骤的多个单元),即使图中未明确描述或说明此类一个或多个单元。另一方面,例如,如果根据一个或多个单元(例如,功能单元)来描述特定装置,对应的方法可以包括一个步骤来执行一个或多个单元的功能(例如,执行所述一个或多个单元的功能的一个步骤,或各自执行所述多个单元中的一个或多个单元的功能的多个步骤),即使图中未明确描述或说明此类一个或多个步骤。此外,应理解,除非另外具体指出,否则本文中描述的各种示例性实施例和/或方面的特征可彼此组合。
视频译码通常指对构成视频或视频序列的图像序列进行的处理。在视频译码领域中,术语“帧(frame)”或“图像(picture/image)”可以用作同义词。本申请(或本发明)中使用的视频译码表示视频编码或视频解码。在源侧执行视频编码,通常包括处理(例如,通过压缩)原始视频图像,以减少表示视频图像所需的数据量(以进行更高效的存储和/或传输)。在目的地侧执行视频解码,通常包括相对于编码器的逆处理以重建视频图像。关于视频图像(或一般为图像,将在下文解释)的“译码(coding)”的实施例应理解为涉及视频图像的“编码(encoding)”和“解码”两者。编码部分和解码部分也合称为编解码(编码和解码,CODEC)。
在无损视频译码的情况下,可以重建原始视频图像,即,重建视频图像与原始视频图像的质量相同(假设在存储或传输过程中没有传输损失或其它数据丢失)。在有损视频译码的情况下,进一步执行压缩(例如,通过量化)以减少表示无法在解码端完全重建的视频图像的数据量,即,与原始视频图像相比,所述重建视频图像的质量较低或较差。
从H.261开始的几种视频译码标准都属于“有损混合视频编解码器”(即,结合像素点域中的空间预测和时间预测以及在变换域中应用量化的2D变换译码)。视频序列的每个图像通常被划分成一组不重叠的块,并且译码通常以块为单位执行。换句话说,在编码器中,通常在块(视频块)级对视频进行处理(即编码),例如,通过空间(帧内)预测和时间(帧间)预测来生成预测块;从当前块(当前处理/待处理的块)中减去预测块,获得残差块;在变换域中变换残差块并量化残差块,以减少待传输(压缩)的数据量,而在解码器中,将相对于编码器的逆处理部分应用于经编码或压缩的块,以重建当前块以进行表示。此外,编码器的处理环路与解码器的处理环路相同,使得两者将产生相同的预测(例如,帧内预测和帧间预测)和/或重建以对后续块进行处理(即,译码)。
如本文所使用的,术语“块”可以是图像或帧的一部分。为便于描述,本文参考由ITU-T视频译码专家组(Video Coding Experts Group,VCEG)和ISO/IEC运动图像专家组(Motion Picture Experts Group,MPEG)的视频译码联合工作组(Joint CollaborationTeam on Video Coding,JCT-VC)开发的高效视频译码(High-Efficiency Video Coding,HEVC)或通用视频译码(versatile video coding,VVC)参考软件描述本发明实施例。本领域普通技术人员应理解本发明实施例不限于HEVC或VVC。块可以指CU、PU和TU。在HEVC中,通过表示为译码树的四叉树结构将CTU划分成CU。在CU级决定是使用帧间(时间)预测还是帧内(空间)预测对图像区域进行译码。可以根据PU划分类型将每个CU进一步划分为一个、两个或四个PU。一个PU内应用相同的预测过程,并以PU为单位向解码器传输相关信息。在根据PU划分类型应用预测过程获取残差块之后,可以根据与用于CU的译码树类似的另一种四叉树结构将CU分割为变换单元(transform unit,TU)。在视频压缩技术的最新进展中,使用四叉树和二叉树(qual-tree and binary tree,QTBT)分割帧来分割译码块。在QTBT块结构中,CU可以为正方形或矩形。例如,首先通过四叉树结构分割译码树单元(coding treeunit,CTU)。通过二叉树结构进一步分割四叉树叶节点。二叉树叶节点称为译码单元(coding unit,CU),该分段用于预测和变换处理,而不进行任何进一步分割。这意味着在QTBT译码块结构中,CU、PU和TU的块大小相同。同时,还提出将三叉树分割等多重分割与QTBT块结构结合使用。
为了描述的清晰性,首先将解释本公开所涉及的几个术语。
本发明中的术语“译码”可以指编码或解码,除非另有说明,否则本发明的任一实施例中均不作限定。
本发明中的术语“当前图像块”表示当前正在处理的图像块,例如,在编码过程中,当前图像块可以是当前正在编码的图像块,而在解码过程中,所述当前图像块可以是当前正在解码的图像块。
本发明中的术语“参考图像块”表示为当前图像块提供参考信息的图像块,在搜索过程中,需要通过遍历操作在多个参考图像块中找到最佳匹配的参考图像块。
本发明中的术语“当前图像”是指当前图像块所在的图像。相应地,本发明中的术语“参考图像”是指参考图像块所在的图像。
本发明中的术语“预测图像块”表示为当前图像块提供预测的图像块。例如,可以在多个参考图像块中找到最佳匹配的参考图像块,该最佳匹配的参考图像块可以作为当前图像块的预测图像块。
本发明中的术语“运动矢量(motion vector,MV)”表示参考图像块相对于当前图像块的位置偏移。
本发明中的图像块的“运动信息”表示图像块的运动信息,在一些实施例中,运动信息可以包括参考图像的指示和参考图像块在所述参考图像中的运动矢量等两种信息;在一些实施例中,运动信息可仅包括所述参考图像块的运动矢量。运动信息的内容在本发明中不作限定,可以随具体应用场景而变化。
术语图像块的“像素点值”是指图像块的像素点的像素值。
终端设备可以是以下任意一种设备:智能手机、手机、蜂窝电话、无绳电话、会话发起协议(session initiation protocol,SIP)电话、无线本地环路(wireless local loop,WLL)站、个人数字助理(personal digital assistant,PDA)、能够进行无线通信的手持设备、车载设备、可穿戴设备、计算设备或者连接到无线调制解调器的其它处理设备。
从上述描述可以看出,运动信息需要进行编码并传输到解码端。MV编码有两种主要技术,包括融合技术和高级运动矢量预测(advanced motion vector prediction,AMVP)。这两种技术的原理与现有技术相同,在此不再赘述。
此外,已经提供了用于执行DMVD过程或DMVR过程的几种方法,从而可以进一步减少运动矢量残差译码位。
一种方法为模板匹配(template matching,TM)方法,使用与已经重建的当前块相邻的L形区域(如图1所示)作为模板,并标识最佳匹配的L形区域,使用绝对差值和(sum ofabsolute difference,SAD)或均值去除的绝对差值和(mean-removed sum of absolutedifference,MR-SAD)等成本函数,在每一个参考图像(图1中表示为Ref0)中使用多个适当缩放的空间和时间运动矢量候选。然后,以最佳匹配候选为中心,在该中心周围的一定修正距离内执行进一步修正。在编码端,计算速率失真优化成本以决定单向预测(即,使用最佳匹配参考进行预测)和双向预测(即,通过平均前两个最佳匹配参考进行预测)。
另一种方法为BM方法。如图2所示,通过在两个不同的参考图像(在图2中表示为Ref0和Ref1)中找到沿当前CU运动轨迹的两个块之间的最接近匹配来导出当前CU的运动信息。假设存在连续运动轨迹,分别指向参考块Ref0和Ref1的两个运动矢量MV0和MV1应与当前图像与两个参考图像之间的时间距离(即TD0和TD1)成比例。当当前图像的时间在两个参考图像之间时,且当前图像到两个参考图像的时间距离相同时,双边匹配为基于镜像的双向MV。
在BM融合模式中,由于CU的运动信息是根据两个不同参考图像中沿当前CU运动轨迹的两个块之间的最接近匹配来导出的,因此总是使用双向预测
在一些实施例中,时间距离被忽略,并且分别与过去和未来的参考图像中的相等运动矢量和相反运动矢量进行双边匹配。
在另一种双边匹配模式中,即上述DMVR方法中,如图3所示,首先使用初始MV0和MV1参考的预测块创建双向平均模板(在图3中表示为步骤1),所述预测块在从显式指示(signal)的融合索引获取的第一候选参考图像块列表L0和第二候选初始参考图像块列表L1中,并对该模板执行BM以找到由更新后的MV0’和MV1’参考的最佳匹配块(表示为如图3中的步骤2)。如果有任何移动,则更新模板。此外,在一些实施例中,在一次参考中执行修正,而通过将该修正运动矢量镜像对称来获取另一次参考中的运动矢量。修正在两次参考之间交替进行,直到中心位置的误差最小或达到最大迭代次数。
在一些修正方法中,首先执行CU级修正。然后,将CU级修正MV作为候选,进行子CU级多候选评估。可选地,每个子CU可以针对最佳匹配候选执行其自己的修正。
在默认融合模式下,不需要DMVD,而在显式融合模式下,可以指示融合模式(TM融合或BM融合)。在一些实施例中,不指示融合索引,而在其它实施例中,为了简化执行多个运动补偿的解码器复杂度,指示显式融合索引。
在隐式DMVD或DMVR过程中,编码器需要以与解码器完全相同的方式执行这些步骤,以便编码端重建与解码端重建相匹配。
实际上,DMVD不需要融合索引来获取当前图像块的初始运动信息,而DMVR需要融合索引来获取当前图像块的初始运动信息。
每当指示一个显式融合索引时,DMVR从运动矢量和从指示的融合索引中规范地导出的参考索引开始。当没有指示显式融合模式索引时(即DMVD情况),在解码器中使用成本函数评估一组初始运动矢量候选,并且选择成本最低的候选作为修正的起点。因此,无论DMVD方法是基于TM还是基于BM,通过将第一候选参考图像块列表L0和第二候选参考图像块列表L1中相等且相对移位的块之间的差值最小化(通常称为BM)或根据第一候选参考图像块列表L0和第二候选参考图像块列表L1中对应块的平均版本与L0/L1中的位移的差值(通常称为DMVR成本),修正搜索需要在起点周围执行,起点可以是子像素精确运动矢量。
为了评估成本函数,有时需要执行插值以根据整数位置中的参考图像的像素点值来导出子像素精确中心的像素点值。插值滤波器可以像双线性插值滤波器一样简单,也可以为像基于二维DCT的可分离插值滤波器的较长滤波器。为了降低在修正期间考虑的每个位置中一次又一次导出当前图像块的候选参考图像块的复杂度,在另一个发明中,提供了以第一候选参考图像块列表L0和/或第二候选参考图像块列表L1中的子像素精确位置为中心的修正点的整像素距离网格。由于新位置接近当前最佳成本位置,因此只需要执行增量插值。在对整像素距离网格进行修正后,得到了相对于融合MV的最佳整数增量MV。
为了进一步提高压缩增益,可以进行子像素距离修正。半像素距离修正要求从参考图像中的最佳整数距离MV位置中半像素距离处的候选参考图像块。可以使用BM成本或DMVR成本进行子像素精确修正。当进入四分之一像素距离且子像素精确度更低时,由于子像素位置相位不对齐,在每个位置所需的插值滤波器是不同的。在另一个应用中,使用在以成本最小的位置为中心的整数距离位置上评估的成本,拟合参数误差面,并计算成本最小的子像素精确位移。
然而,上述过程可能仍存在复杂且耗时的问题。已知,参考图像的位深度通常在8位到12位之间。因此,在上述整数距离修正迭代和计算误差面的参数的成本评估期间,在缓冲器中保持L0和L1的候选参考图像块。这些缓冲器的总存储需求是根据候选参考图像块的位深度确定的。例如,在软件中,一个10位的值占用16位的存储空间,以避免不必要的打包(转换成支持的数据类型)和相应的解包操作。此外,修正的成本计算通常使用SAD或其类似方法(例如MR-SAD)执行,其中绝对差值和是在调整两个块之间的平均差值之后(在像素点水平上)计算的。成本计算的复杂度和矢量运算(单指令多数据(single instructionmultiple data,SIMD))吞吐量是根据候选参考图像块的位深度确定的。例如,在软件中,8位SAD的执行周期几乎是执行9至16位SAD所需的周期的一半。此外,许多智能手机芯片组包含用于编码和解码的硬件引擎。作为编码器硬件引擎的一部分,往往具有8位SAD计算构建块。
因此,针对上述问题,本公开提供了一种视频序列的图像译码方法,限制候选参考图像块的位深度,从而降低缓冲器大小要求、节省硬件门数或提高成本评估能力,而不影响解码端运动矢量修正降低的码率。本发明提供一种规范方法(在编码端和解码端均采用),其将成本函数评估中使用的候选参考图像块的位深度限制为预定义的位深度。
下面将详细阐述本发明的实施例。
图4为本发明实施例提供的视频序列的图像译码方法的示意性流程图,其中所述图像包括当前图像块。该方法可以由编码端或解码端的视频序列的图像的装置实现。此外,该方法还可以与DMVD或DMVR过程结合,或者其它任何用于修正当前图像块的运动信息的过程,在此不做限定。
所述方法包括以下步骤:
S401:获取当前图像块的初始运动信息。
首先,可以获取当前图像块的初始运动信息,以确定当前图像块对应的候选参考图像块。
在DMVD过程中,如上所述,由于没有融合索引,因此可以根据当前图像块的邻块的运动信息构建融合候选列表。然后,可以使用第一成本函数从融合候选列表中确定成本最小的运动信息作为初始运动信息。这里,融合候选列表可以采用现有方法构建,在此不再赘述。第一成本函数可以是以下之一:SAD、MR-SAD或平方差值和(sum of squareddifference,SSD)。
在DMVR过程中,如上所述,融合候选列表中表示最佳运动信息的融合索引为可用的。因此,在这种情况下,可以从融合候选列表中确定融合索引标识的运动信息作为初始运动信息,其中,融合候选列表可以采用现有方法构建,与DMVD过程相同。
S402:根据初始运动信息,获取当前图像块对应的至少两个候选参考图像块的像素点值。
在获取到当前图像块的初始运动信息后,可以根据初始运动信息获取至少两个候选参考图像块,这些候选参考图像块作为候选进行选择。
实际上,在获取当前图像块对应的至少两个候选参考图像块的像素点值之前,首先应该确定至少两个候选参考图像块的位置。如上所述,候选参考图像块位于参考图像中,因此首先需要标识参考图像。
在一种可能的实现方式中,初始运动信息包括当前图像块的初始运动矢量和参考图像的指示,从而可以根据指示确定参考图像,在一些实施例中,该指示可以为参考图像的索引。在另一种可能的实现方式中,初始运动信息包括当前图像块的初始运动矢量,参考图像可以是预定义的图像,也可以基于预定义的算法,即编码端和解码端都已知的确定参考图像的算法,例如,将与当前图像最相邻的图像作为参考图像。
在一个实施例中,可以根据当前图像块的初始运动信息和位置确定至少两个候选参考图像块的位置。例如,可以根据当前图像块的初始运动矢量和位置,确定初始候选参考图像块作为起点。然后,可以根据可按实际需求预定义的、可以达到子像素精确度的搜索步长,确定候选参考图像块的位置。例如,如果搜索步长等于1,则候选参考图像块可以通过将初始候选参考图像块朝不同方向移动一个像素距离得到。至少两个候选参考图像块可以根据搜索步长迭代移动得到。此外,搜索范围可以是预定义的,因此,可以将预定义的搜索范围内的参考图像块确定为所述候选参考图像块。
然后,在确定每个候选参考图像块的位置之后,可以在此基础上进一步确定这些候选参考图像块的像素点值。可能只有参考图像的整像素位置的像素点值是已知的。对于每个候选参考图像块,如果候选参考图像块的像素点值可用,即可以从参考图像的像素点值中获取该候选参考图像块的像素点值,则当所述候选参考图像块的像素点位于参考图像的整像素位置时,候选参考图像块的像素点值可以仅通过复制参考图像的像素点值来获取。否则,即候选参考图像块的像素点值不可用的情况下,为了获取候选参考图像块的像素点值,可以执行插值运算以确定这些不可用的像素点值。可以使用任何现有方法来完成插值运算,在此将不再详细描述。例如,给定当前图像块的位置,可以执行双线性插值以获取在预定义搜索范围内的整数距离位置的像素点值。
S403:将每个候选参考图像块的像素点值的位深度限制为预定义的位深度。
如上所述,由于候选参考图像块的位深度可以影响整体处理速度和复杂度,因此,在执行运动信息修正之前,最好限制每个候选参考图像块的像素点值的位深度。
需要说明的是,对于每个候选参考图像块,像素点值的位深度相同,参考图像的位深度(即候选参考图像块所在的位置)也可以是每个候选参考图像块的像素点值的位深度。因此,将每个候选参考图像块的像素点值的位深度限制为预定义的位深度是指将每个候选参考图像块的每个像素点值的位深度限制为预定义的位深度。
在一个实施例中,可以通过将每个候选参考图像块的像素点值的位深度右移(b-d)的量来进行限制,其中,b为候选参考图像块的像素点值的位深度,d为预定义的位深度,b大于d。本领域技术人员知道,d的取值可以根据实际需要选择。
假设插值通常执行以下操作以导出由插值滤波器权重产生的Q格式调整后的像素点值,
设b为第一候选参考图像块的像素点值的位深度,d为预定义的位深度(小于b),则位深度受限像素点值导出如下:
L′=L>>(b-d) (2)
其中,L′为候选参考图像块的受限像素点值。插值过程所需的任何右移(来自在二维插值期间所需的增加的内部位深度)可以与该右移进行组合。
然后,位深度限制过程可以组合为
可以使用这些受限位深度像素点来执行规范运动矢量修正过程的其余步骤,以获得用于执行规范运动补偿预测和预测残差译码的修正运动矢量。
例如,如果b为10位,d为8位,则在将位深度限制为8位之后,当10位数据存储在16位数据类型中时,10位数据的缓冲器大小将减小2倍。即便如此,缓冲器大小要求也降低了20%。通过在软件平台上使用按字节的SIMD操作,评估成本函数的周期数可以减半。在硬件平台上,成本评估操作可以使用小于20%的位平面,从而减少门数和面积。
S404:根据至少两个受限候选参考图像块的受限像素点值,获取修正运动信息。
在S403的限制操作之后,可以根据至少两个受限候选参考图像块的受限像素点值,获取修正运动信息。这里术语“受限候选参考图像块”是指具有受限像素点值的候选参考图像块。
在一个实施例中,可以使用第二成本函数确定成本最小的受限候选参考图像块的位置,然后可以根据受限候选参考图像块的位置获取修正运动信息。第二成本函数为SAD、MR-SAD或SSD中之一。
在基于TM的DMVD过程中,第二成本函数可以表示受限候选参考图像块的模板(图1中所示的Ref0的L形区域)与当前图像块的模板(图1中所示的当前图像块的L形区域)的差值。这里,模板实际上是作为比较参考。
在基于BM的DMVD过程中,没有模板,第二成本函数可以表示两个候选参考图像块之间的差值。
关于DMVR,可以在以下部分进行详细说明。
如S402所述,在初始运动信息中同时包括初始MV和参考图像的指示的情况下,修正运动信息还可以包括修正MV和参考图像的指示。
S405:根据修正运动信息,确定当前图像块的预测图像块。
只要获取到修正运动信息,就可以在确定的参考图像下,确定当前图像块的预测图像块。
在一个实施例中,初始运动信息包括当前图像块的初始运动矢量,在这种情况下,修正运动信息还包括当前图像块的修正运动矢量。如在S402中描述,参考图像可以是预定义的或根据预定义算法得到的参考图像,因此,可以根据修正运动矢量和参考图像确定当前图像块的预测图像块。
在另一实施例中,初始运动信息包括初始运动矢量和参考图像的指示,在这种情况下,修正运动信息还包括当前图像块的修正运动矢量和参考图像的指示,因此可以根据修正运动矢量和参考图像的指示确定当前图像块的预测图像块。
应注意,虽然本文中的术语用单数形式表示,但是本领域技术人员在不付出创造性劳动的前提下,将该方法与利用若干参考图像进行预测的修正过程相结合,对应的术语可以表示多个元素,例如,如果该方法与基于BM的修正过程结合,则初始向量可以包括两个初始MV,可以存在两个参考图像。
本发明提供一种视频序列的图像译码方法,其中,获取当前图像块的初始运动信息;根据所述初始运动信息,获取当前图像块对应的至少两个候选参考图像块的像素点值;将每个候选参考图像块的像素点值的位深度限制为预定义的位深度;然后根据至少两个受限候选参考图像块的像素点值,获取修正运动信息;根据所述修正运动信息,确定当前图像块的预测图像块。由于在对运动信息进行修正之前,限制每个候选参考图像块的像素点值的位深度,从而降低计算复杂度,并缩短处理时间。
为了更清楚地阐述本发明的方法,下文将以基于BM的DMVR过程为例,结合基于BM的DMVR过程更详细地描述该方法。
图5为本发明实施例提供的视频序列的图像译码方法的示意性流程图。所述方法包括以下步骤:
S501:获取当前图像块的初始运动信息。
可以参考S401中的描述。
此外,本实施例中,初始运动信息包括第一初始运动矢量和第二初始运动矢量,以及两个参考图像的指示。两个参考图像包括第一初始运动矢量对应的第一参考图像和第二初始运动矢量对应的第二参考图像。
S502:根据当前图像块的初始运动信息和位置,获取第一初始参考图像块和第二初始参考图像块。
例如,可以根据指示获取第一参考图像和第二参考图像,指示可以是两个参考图像各自的索引。然后,可以根据当前图像块的第一初始运动矢量和位置,获取第一初始参考图像块,同样,可以根据当前图像块的第二初始运动矢量和位置,获取第二初始参考图像块。
S503:获取当前图像块的模板。
例如,模板可以是第一初始参考图像块和第二初始参考图像块的加权组合。这里可以根据实际需要选择权重,在此不做限定。
该步骤是可选的,因为使用成本函数进行的稍后成本评估可以根据参考图像块而不是使用模板来计算。
S504:获取当前图像块对应的第一候选参考图像块集的像素点值和第二候选参考图像块集的像素点值。
第一候选参考图像块可以位于列表L0中的参考图像中,也可以称为前向候选参考图像块。第二候选参考图像块位于列表L1中的参考图像中,也可以称为后向候选参考图像块。
其中,可以参照S402中的描述得到第一候选参考图像块和第二候选参考图像块的像素点值。
下文将简要介绍一个示例来说明如何实现插值。
假设当前图像块的位置为(x,y),尺寸为W×H,W为当前图像块的宽度,H为当前图像块的高度。第一参考图像表示为L0,第二参考图像表示为L1。第一初始运动矢量和第二初始运动矢量分别表示为MV0和MV1,其中MV0和MV1为子像素精确运动矢量。
首先,可以从第一初始运动矢量和第二初始运动矢量导出子像素偏移量FMV0和FMV1,整数部分IMV0和IMV1。FMV0和FMV1分别是第一初始运动矢量和第二初始运动矢量的小数部分,而IMV0和IMV1分别是第一初始运动矢量和第二初始运动矢量的整数部分。
然后,对于两个参考图像L0和L1中搜索范围所需的每个整数距离像素位置,可以使用子像素相位进行插值运算。
S505:将每个第一候选参考图像块的像素点值的位深度限制为预定义的位深度,将每个第二候选参考图像块的像素点值的位深度限制为预定义的位深度。
例如,在该实施例中,可以通过执行右移(有或无取整)等于第一参考图像的位深度与期望的位深度之间的差值的量,将每个第一候选参考图像块的位深度限制为期望的位深度。可以执行类似的操作来限制每个第二候选参考图像块的位深度。
值得注意的是,可以同时限制第一候选参考图像块和第二候选参考图像块的像素点值,也可以按照任意顺序进行限制,在此不做限定。
S506:使用第二成本函数确定成本最小的第一受限候选参考图像块的第一位置。
例如,第二成本函数可以用于确定第一修正运动矢量的第一位置,第二成本函数表示第一受限候选参考图像块与当前图像块的模板的差值。其中,模板的像素点值的位深度也限制为预定义的位深度。
因此,可以计算模板与每个第一受限候选参考图像块的差值并可以确定差值最小的第一受限参考图像块的第一位置。
这里,成本可以计算如下:
其中,H为所述当前图像块的高度,W为所述当前图像块的宽度,I0(i,j)为第一受限候选参考图像块的位置(i,j)的像素点值,I1(i,j)为所述模板的位置(i,j)的像素点值,m0为受限候选参考图像块的像素点值的平均值,m1为所述模板的像素点值的平均值,d为预定义的位深度。
上述等式旨在限制其中的变量不超过可以用d个位表示的最大值。上述等式指定了一个规范过程,通过该过程,可以在预定义的位深度的两个量之间执行最终的绝对差值,从而避免可能的溢出错误。
S507:使用第二成本函数确定第二受限候选参考图像块的第二位置。
类似地,可以计算模板与每个第二受限候选参考图像块的差值,并且可以从第二受限候选参考图像块的集合中选择差值最小的第二受限参考图像块。这里,也可以以与S506中类似的方式计算成本。
值得注意的是,S506和S507可以同时执行,也可以任意顺序执行,此处不做限定。
S508:根据修正运动信息,确定当前图像块的预测图像块。
例如,可以根据第一受限参考图像块的第一位置和第二受限参考图像块的第二位置,获取修正运动信息。
另外,如上所述,S503可以为可选步骤。实际上,在上面的示例中,成本是按照模板计算的,实际就是前面提到的DMVR成本。
也可以评估BM成本而不是DMVR成本。此时,省略S503。在S507和S508中,由于第二成本函数表示第一受限候选参考图像块和第二受限候选参考图像块之间的差值,因此,成本可以计算为:
其中,H为所述当前图像块的高度,W为所述当前图像块的宽度,I0(i,j)为第一受限候选参考图像块的位置(i,j)的像素点值,I1(i,j)为第一受限候选参考图像块对应的第二受限候选参考图像块的位置(i,j)的像素点值,m0为所述第一受限候选参考图像块的像素点值的平均值,m1为所述第二受限候选参考图像块的像素点值的平均值,b为第一候选参考图像块和第二候选参考图像块的像素点值的位深度,d为预定义的位深度,b大于d。本领域技术人员知道,d的取值可以根据实际需要选择。
上述等式旨在限制其中的变量不超过可以用d个位表示的最大值。可以看出,上述等式实际上是为了限制在m0>m1的情况下或者其它(m1-m0)))-I1(i,j)情况下(I0(i,j)-MIN((1<<d)-1,(I1(i,j)+(m0-m1)的取值。实际上,这是为了防止值存储在缓冲器时溢出。
上述等式指定了一个规范过程,通过该过程,可以在预定义的位深度的两个量之间执行最终的绝对差值,从而避免可能的溢出错误。
即使在如图4所示的实施例中将每个候选参考图像块的位深度限制为预定义的位深度d之后,当使用MR-SAD时,执行绝对值运算的值也可以超过d。这将需要在硬件实现中额外增加1位,但在软件SIMD中可能会产生2倍的结果(例如,9位绝对差值是8位绝对差值的一半)。此外,由于整个过程是规范的,因此还需要明确地指定MR-SAD情况下的位深度,以避免编码器实现和解码器实现之间的偏移。
本发明提供了一种视频序列的图像译码方法,该方法与基于BM的DMVR过程相结合。在所述方法中,获取当前图像块的初始运动信息;根据所述初始运动信息,获取当前图像块对应的至少两个候选参考图像块的像素点值;将每个候选参考图像块的像素点值的位深度限制为预定义的位深度;然后根据至少两个受限候选参考图像块的像素点值,获取修正运动信息;根据所述修正运动信息,确定当前图像块的预测图像块。由于在对运动信息进行修正之前,限制每个候选参考图像块的像素点值的位深度,从而降低计算复杂度,并缩短处理时间。
图6为本发明实施例提供的视频序列的图像译码装置的示意图。图像包括当前图像块,所述装置包括:获取模块601、限制模块602和确定模块603。
获取模块601用于获取当前图像块的初始运动信息。
获取模块601还用于根据所述初始运动信息获取当前图像块对应的至少两个候选参考图像块的像素点值。
限制模块602用于将每个候选参考图像块的像素点值的位深度限制为预定义的位深度。
获取模块601还用于根据至少两个受限候选参考图像块的受限像素点值,获取修正运动信息。
确定模块603用于根据所述修正运动信息确定当前图像块的预测图像块。
在一个实施例中,限制模块602具体用于:将每个候选参考图像块的像素点值的位深度右移(b-d)的量,其中,b为所述每个候选参考图像块的像素点值的位深度,d为预定义的位深度,b大于d。
在一个实施例中,获取模块601具体用于:使用第一成本函数确定融合候选列表中成本最小的运动信息作为初始运动信息,其中,所述融合候选列表包括当前图像块的邻块的运动信息。
在一个实施例中,获取模块601具体用于:确定融合候选列表中融合索引标识的运动信息作为初始运动信息,其中,所述融合候选列表包括当前图像块的邻块的运动信息。
在一个实施例中,获取模块601具体用于:根据当前图像的初始运动信息和位置,确定候选参考图像块的位置;根据候选参考图像块的位置,确定候选参考图像块的像素点值是否可用,如果所述候选参考图像块的像素点值不可用,则进行插值运算得到候选参考图像块的像素点值。
在一个实施例中,获取模块601具体用于:使用第二成本函数确定成本最小的受限候选参考图像块的位置;根据所述成本最小的受限候选参考图像块的位置,获取修正运动信息。
在一个实施例中,第二成本函数表示受限候选参考图像块与当前图像块的模板的差值,其中,根据当前图像块的初始运动信息和位置获取模板,并且所述模板的像素点值的位深度限制为预定义的位深度。
在一个实施例中,成本计算如下:
其中,H为所述当前图像块的高度,W为所述当前图像块的宽度,I0(i,j)为受限候选参考图像块的位置(i,j)的像素点值,I1(i,j)为所述模板的位置(i,j)的像素点值,m0为受限候选参考图像块的像素点值的平均值,m1为所述模板的像素点值的平均值,d为预定义的位深度。
在一个实施例中,至少两个受限候选参考图像块包括第一受限候选参考图像块集和第二受限候选参考图像块集,其中,获取模块601具体用于:根据当前图像块的第一初始运动信息和位置,获取第一初始参考图像块;根据当前图像块的第二初始运动信息和位置,获取第二初始参考图像块;计算第一初始参考图像块和第二初始参考图像块的加权组合作为模板;计算模板与每个第一受限候选参考图像块的差值,确定差值最小的第一受限参考图像块的位置;计算模板与每个第二受限候选参考图像块的差值,确定差值最小的第二受限参考图像块的位置。确定模块603具体用于:根据第一位置和第二位置,获取修正运动信息。
在一个实施例中,至少两个受限候选参考图像块包括第一受限候选参考图像块集和第二受限候选参考图像块集,第二成本函数表示第一受限候选参考图像块和第二受限候选参考图像块之间的差值。
在一个实施例中,成本计算如下:
其中,H为所述当前图像块的高度,W为所述当前图像块的宽度,I0(i,j)为第一受限候选参考图像块的位置(i,j)的像素点值,I1(i,j)为第二受限候选参考图像块的位置(i,j)的像素点值,m0为所述第一受限候选参考图像块的像素点值的平均值,m1为所述第二受限候选参考图像块的像素点值的平均值,d为预定义的位深度。
在一个实施例中,初始运动信息包括当前图像块的修正运动矢量,其中,确定模块603具体用于:根据修正运动矢量和参考图像,确定当前图像块的预测图像块,其中,所述参考图像为预定义图像或根据预定义算法获取的图像。
在一个实施例中,初始运动信息包括当前图像块的修正运动矢量和参考图像的指示,其中,确定模块603具体用于:根据修正运动矢量和参考图像的指示,确定当前图像块的预测图像块。
通过本发明提供的视频序列的图像译码装置,在对所述运动信息进行修正之前,限制每个候选参考图像块的像素点值的位深度,从而降低计算复杂度,并缩短处理时间。
本发明还提供一种视频序列的图像译码装置,包括处理器和存储器。存储器存储指令,所述指令使得处理器执行上文所述方法。
本发明还提供一种储存有指令的计算机可读存储介质,其中,当所述指令在执行时使得一个或多个处理器对视频序列的图像进行译码。所述指令使一个或多个处理器执行上文所述方法。
本发明还提供一种编码器,包括以上实施例提供的视频序列的图像译码装置。
本发明还提供一种解码器,包括以上实施例提供的视频序列的图像译码装置。
本发明还提供一种终端设备,包括上述编码器和上述解码器。
本发明说明书和权利要求书以及上述附图中的术语“第一”、“第二”等旨在区分不同的对象,但并不意图限定特定的顺序。
本发明实施例中的术语,例如,“和/或”,仅用于描述关联对象之间的关联关系,表示可以存在三种关系,例如,A和/或B可以表示仅有A、仅有B和同时有A和B。
术语“一”不是用于指定一个或单个元素,相反,它可用于在适当情况下表示多个元素。
在本发明实施例中,例如,使用“示例性的”或“例如”等表达来表示对示例或实例的说明。在本发明实施例中,描述为“示例性的”或“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或有利。具体来说,使用“示例性的”或“例如”旨在以特定方式呈现相关概念。
在一个或多个示例中,所描述的功能可以以硬件、软件、固件或其任意组合实现。如果以软件实现,则这些功能可以作为一个或多个指令或代码存储在计算机可读介质上或经由计算机可读介质传输,并由基于硬件的处理单元执行。计算机可读介质可包含计算机可读存储介质,其对应于有形介质,例如数据存储介质,或包括任何促进将计算机程序从一处传送到另一处的介质(例如根据通信协议)的通信介质。以此方式,计算机可读介质通常可以对应(1)非瞬时性的有形计算机可读存储介质,或(2)信号或载波等通信介质。数据存储介质可为可由一或多个计算机或一或多个处理器存取以检索用于实现本申请中描述的技术的指令、代码和/或数据结构的任何可用介质。计算机程序产品可以包括计算机可读介质。
作为示例而非限制,这类计算机可读存储介质可以包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储器、磁盘存储器或其它磁性存储设备、闪存或可用于存储指令或数据结构形式的所需程序代码并且可由计算机访问的任何其它介质。此外,任何连接都可以被适当地定义为电脑可读介质。例如,如果软件是从一个网站站点、服务器或其它远程资源通过一个同轴电缆、光缆、双绞线、数字用户线(digital subscriber line,DSL)或以例如红外、无线和微波等无线方式传输的,也被包含在所定义的介质中。但是,应理解,所述计算机可读存储介质和数据存储介质并不包括连接、载波、信号或其它瞬时性介质,而是实际上针对于非瞬时性有形存储介质。本文中使用的磁盘(disk)和光盘(disc)包括压缩磁盘(compactdisc,CD)、镭射盘、光盘、数字多功能光盘(digital versatile disc,DVD)、软盘和蓝光光盘,磁盘通常以磁性复制数据,而光盘通常以激光进行光学复制数据。上述的组合也可以包括在电脑可读介质范畴中。
可通过一个或多个数字信号处理器(digital signal processor,DSP)、通用微处理器、专用集成电路(application specific integrated circuit,ASIC)、现场可编程逻辑阵列(field programmable logic array,FPGA)或其它等效集成或离散逻辑电路等一个或多个处理器来执行指令。因此,如本文中所使用的术语“处理器”可指前述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。另外,在一些方面中,本文描述的各种功能可以提供在用于编码和解码的专用硬件和/或软件模块内,或者并入到组合编解码器中。而且,所述技术可以完全在一个或多个电路或逻辑元件中实施。
本发明的技术可以在多种设备或装置中实施,这些设备或装置包括无线手机、集成电路(integrated circuit,IC)或一组IC(例如芯片组)。本申请中描述各种组件、模块或单元是为了强调用于执行所公开技术的装置的功能方面,但未必需要由不同硬件单元实现。实际上,如上所述,各种单元可以结合合适的软件和/或固件组合在编解码器硬件单元中,或者通过互操作硬件单元(包括如上所述的一个或多个处理器)的集合来提供。
Claims (32)
1.一种视频序列的图像译码方法,其特征在于,所述图像包括当前图像块,所述方法包括:
获取所述当前图像块的初始运动信息;其中,所述初始运动信息包括与第一参考图像对应的第一初始运动矢量和与第二参考图像对应的第二初始运动矢量对应的第二参考图像;
根据所述初始运动信息,获取所述当前图像块对应的至少两个参考图像中的像素点值;其中,所述至少两个参考图像中的像素点值包括所述第一参考图像中的第一候选参考图像块的像素点值以及所述第二参考图像中的第二候选参考图像块的像素点值;
将获取到的像素点值的位深度限制为预定义的位深度,以得到至少两个受限候选参考图像块;其中,所述至少两个受限候选参考图像块包括第一受限候选参考图像块以及第二受限候选参考图像块,所述第一受限候选参考图像块对应于所述第一参考图像,所述第二受限候选参考图像块对应于所述第二参考图像;其中,所述将获取到的像素点值的位深度限制为预定义的位深度,以得到至少两个受限候选参考图像块包括:将所述第一候选参考图像块的像素点值以及所述第二候选参考图像块的像素点值按如下公式进行插值以得到由插值滤波器权重产生的Q格式调整后的像素点值:
根据所述至少两个受限候选参考图像块的受限像素点值,获取修正运动信息;包括:根据所述第一受限候选参考图像块的受限像素点值以及所述第二受限候选参考图像块的受限像素点值来获取所述修正运动信息;
根据所述修正运动信息,确定所述当前图像块的预测图像块。
2.根据权利要求1所述的方法,其特征在于,所述将获取到的像素点值的位深度限制为预定义的位深度包括:
将每个候选参考图像块的像素点值的位深度右移(b–d)的量,其中,b为所述每个候选参考图像块的所述像素点值的位深度,d为所述预定义的位深度。
3.根据权利要求1或2所述的方法,其特征在于,所述获取当前图像块的初始运动信息包括:
使用第一成本函数确定融合候选列表中成本最小的运动信息作为初始运动信息,其中,所述融合候选列表包括所述当前图像块的邻块的运动信息。
4.根据权利要求1或2所述的方法,其特征在于,所述获取当前图像块的初始运动信息包括:
确定融合候选列表中融合索引标识的运动信息作为所述初始运动信息,其中,所述融合候选列表包括所述当前图像块的邻块的运动信息。
5.根据权利要求1或2所述的方法,其特征在于,所述获取所述当前图像块对应的至少两个参考图像中的像素点值包括:
根据所述当前图像块的所述初始运动信息和位置,确定要获取的像素点的位置;
根据所述要获取的像素点的位置,确定所述像素点值是否可得,如果所述像素点值不可得,则进行插值运算得到所述像素点值。
6.根据权利要求1或2所述的方法,其特征在于,所述根据所述至少两个受限候选参考图像块的受限像素点值,获取修正运动信息包括:
使用第二成本函数确定成本最小的受限候选参考图像块的位置;
根据所述成本最小的受限候选参考图像块的位置,获取所述修正运动信息。
7.根据权利要求6所述的方法,其特征在于,所述第二成本函数表示受限候选参考图像块与所述当前图像块的模板的差值,其中,根据所述当前图像块的所述初始运动信息和位置获取所述模板,并且所述模板的像素点值的位深度限制为所述预定义的位深度。
9.根据权利要求7所述的方法,其特征在于,所述至少两个受限候选参考图像块包括第一受限候选参考图像块集和第二受限候选参考图像块集;
其中,所述初始运动信息包括第一初始运动信息和第二初始运动信息,所述方法还包括:
根据所述当前图像块的所述第一初始运动信息和位置,获取第一初始参考图像块;
根据所述当前图像块的所述第二初始运动信息和位置,获取第二初始参考图像块;
计算所述第一初始参考图像块和所述第二初始参考图像块的加权组合,作为所述模板;
其中,所述使用第二成本函数确定成本最小的受限候选参考图像块的位置包括:
计算所述模板与每个第一受限候选参考图像块的差值,确定差值最小的第一受限参考图像块的第一位置;
计算所述模板与每个第二受限候选参考图像块的差值,确定差值最小的第二受限参考图像块的第二位置;
其中,所述根据所述受限候选参考图像块的位置获取所述修正运动信息包括:
根据所述第一位置和所述第二位置,获取所述修正运动信息。
10.根据权利要求6所述的方法,其特征在于,所述至少两个受限候选参考图像块包括第一受限候选参考图像块集和第二受限候选参考图像块集,所述第二成本函数表示第一受限候选参考图像块和第二受限候选参考图像块之间的差值。
12.根据权利要求1或2所述的方法,其特征在于,所述修正运动信息包括所述当前图像块的修正运动矢量;
所述根据所述修正运动信息确定所述当前图像块的预测图像块包括:
根据所述修正运动矢量和参考图像,确定所述当前图像块的所述预测图像块,所述参考图像为预定义图像或根据预定义算法获取的图像。
13.根据权利要求1或2所述的方法,其特征在于,所述修正运动信息包括所述当前图像块的修正运动矢量和参考图像的指示;
所述根据所述修正运动信息确定所述当前图像块的预测图像块包括:
根据所述修正运动矢量和所述参考图像的指示,确定所述当前图像块的所述预测图像块。
14.根据权利要求3所述的方法,其特征在于,所述第一成本函数为绝对差值和(sum ofabsolute difference,SAD)、均值去除的绝对差值和(mean-removed sum of absolutedifference,MR-SAD)或平方差值和(sum of squared difference,SSD)中的一种。
15.根据权利要求6所述的方法,其特征在于,所述第二成本函数为绝对差值和(sum ofabsolute difference,SAD)、均值去除的绝对差值和(mean-removed sum of absolutedifference,MR-SAD)或平方差值和(sum of squared difference,SSD)中的一种。
16.根据权利要求1或2所述的方法,其特征在于,所述受限候选参考图像块是指具有受限像素点值的候选参考图像块。
17.一种视频序列的图像译码装置,其特征在于,所述图像包括当前图像块,所述装置包括:
获取模块,用于获取所述当前图像块的初始运动信息;其中,所述初始运动信息包括与第一参考图像对应的第一初始运动矢量和与第二参考图像对应的第二初始运动矢量对应的第二参考图像;
所述获取模块还用于根据所述初始运动信息,获取所述当前图像块对应的至少两个参考图像中的像素点值;其中,所述至少两个参考图像中的像素点值包括所述第一参考图像中的第一候选参考图像块的像素点值以及所述第二参考图像中的第二候选参考图像块的像素点值;
限制模块,用于将获取到的像素点值的位深度限制为预定义的位深度,以得到至少两个受限候选参考图像块;其中,所述至少两个受限候选参考图像块包括第一受限候选参考图像块以及第二受限候选参考图像块,所述第一受限候选参考图像块对应于所述第一参考图像,所述第二受限候选参考图像块对应于所述第二参考图像;其中,所述限制模块具体用于:将所述第一候选参考图像块的像素点值以及所述第二候选参考图像块的像素点值按如下公式进行插值以得到由插值滤波器权重产生的Q格式调整后的像素点值:
所述获取模块还用于根据至少两个受限候选参考图像块的受限像素点值,获取修正运动信息;其中,所述获取模块具体用于:根据所述第一受限候选参考图像块的受限像素点值以及所述第二受限候选参考图像块的受限像素点值来获取所述修正运动信息;
确定模块,用于根据所述修正运动信息确定所述当前图像块的预测图像块。
18.根据权利要求17所述的装置,其特征在于,所述限制模块具体用于:
将每个候选参考图像块的像素点值的位深度右移(b–d)的量,其中,b为所述每个候选参考图像块的所述像素点值的位深度,d为所述预定义的位深度,b大于d。
19.根据权利要求17或18所述的装置,其特征在于,所述获取模块具体用于:
使用第一成本函数确定融合候选列表中成本最小的运动信息作为初始运动信息,其中,所述融合候选列表包括所述当前图像块的邻块的运动信息。
20.根据权利要求17或18所述的装置,其特征在于,所述获取模块具体用于:
确定融合候选列表中融合索引标识的运动信息作为所述初始运动信息,其中,所述融合候选列表包括所述当前图像块的邻块的运动信息。
21.根据权利要求17或18所述的装置,其特征在于,所述获取模块具体用于:
根据所述当前图像块的所述初始运动信息和位置,确定候选参考图像块的位置;
根据所述候选参考图像块的位置,确定所述候选参考图像块的像素点值是否可用,如果所述候选参考图像块的所述像素点值不可用,则进行插值运算得到所述候选参考图像块的所述像素点值。
22.根据权利要求17或18所述的装置,其特征在于,所述获取模块具体用于:
使用第二成本函数确定成本最小的受限候选参考图像块的位置;
根据所述成本最小的受限候选参考图像块的位置,获取所述修正运动信息。
23.根据权利要求22所述的装置,其特征在于,所述第二成本函数表示受限候选参考图像块与所述当前图像块的模板的差值,其中,根据所述当前图像块的所述初始运动信息和位置获取所述模板,并且所述模板的像素点值的位深度限制为所述预定义的位深度。
25.根据权利要求23所述的装置,其特征在于,所述至少两个受限候选参考图像块包括第一受限候选参考图像块集和第二受限候选参考图像块集;
其中,所述获取模块具体用于:
根据所述当前图像块的所述第一初始运动信息和位置,获取第一初始参考图像块;
根据所述当前图像块的所述第二初始运动信息和位置,获取第二初始参考图像块;
计算所述第一初始参考图像块和所述第二初始参考图像块的加权组合作为所述模板;
计算所述模板与每个第一受限候选参考图像块的差值,确定差值最小的第一受限参考图像块的第一位置;
计算所述模板与每个第二受限候选参考图像块的差值,确定差值最小的第二受限参考图像块的第二位置;
其中,所述确定模块具体用于:
根据所述第一位置和所述第二位置,获取所述修正运动信息。
26.根据权利要求22所述的装置,其特征在于,所述至少两个受限候选参考图像块包括第一受限候选参考图像块集和第二受限候选参考图像块集,所述第二成本函数表示第一受限候选参考图像块和第二受限候选参考图像块之间的差值。
28.根据权利要求17或18所述的装置,其特征在于,所述修正运动信息包括所述当前图像块的修正运动矢量;
其中,所述确定模块具体用于:
根据所述修正运动矢量和参考图像,确定所述当前图像块的所述预测图像块,所述参考图像为预定义图像或根据预定义算法获取的图像。
29.根据权利要求17或18所述的装置,其特征在于,所述初始运动信息包括所述当前图像块的修正运动矢量和参考图像的指示;
其中,所述确定模块具体用于:
根据所述修正运动矢量和所述参考图像的指示,确定所述当前图像块的所述预测图像块。
30.一种编码器,其特征在于,包括根据权利要求17至29中任一项所述的视频序列的图像译码装置。
31.一种解码器,其特征在于,包括根据权利要求17至29中任一项所述的视频序列的图像译码装置。
32.一种终端设备,其特征在于,包括根据权利要求30所述的编码器和根据权利要求31所述的解码器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111265258.0A CN113938680B (zh) | 2018-09-05 | 2018-09-05 | 视频序列的图像译码方法和装置以及终端设备 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2018/104239 WO2020047788A1 (en) | 2018-09-05 | 2018-09-05 | Method and apparatus for coding image of video sequence, and terminal device |
CN201880097177.4A CN112640462A (zh) | 2018-09-05 | 2018-09-05 | 视频序列的图像译码方法和装置以及终端设备 |
CN202111265258.0A CN113938680B (zh) | 2018-09-05 | 2018-09-05 | 视频序列的图像译码方法和装置以及终端设备 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880097177.4A Division CN112640462A (zh) | 2018-09-05 | 2018-09-05 | 视频序列的图像译码方法和装置以及终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113938680A CN113938680A (zh) | 2022-01-14 |
CN113938680B true CN113938680B (zh) | 2022-11-25 |
Family
ID=69722939
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111265258.0A Active CN113938680B (zh) | 2018-09-05 | 2018-09-05 | 视频序列的图像译码方法和装置以及终端设备 |
CN201880097177.4A Pending CN112640462A (zh) | 2018-09-05 | 2018-09-05 | 视频序列的图像译码方法和装置以及终端设备 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880097177.4A Pending CN112640462A (zh) | 2018-09-05 | 2018-09-05 | 视频序列的图像译码方法和装置以及终端设备 |
Country Status (13)
Country | Link |
---|---|
EP (1) | EP3837838B1 (zh) |
JP (2) | JP7210707B2 (zh) |
KR (2) | KR20240042238A (zh) |
CN (2) | CN113938680B (zh) |
AU (2) | AU2018440297B2 (zh) |
BR (1) | BR112021004145A2 (zh) |
CA (1) | CA3111628C (zh) |
MX (1) | MX2021002603A (zh) |
PH (1) | PH12021550475A1 (zh) |
RU (1) | RU2770423C1 (zh) |
SG (1) | SG11202102183YA (zh) |
WO (1) | WO2020047788A1 (zh) |
ZA (1) | ZA202101706B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7210707B2 (ja) * | 2018-09-05 | 2023-01-23 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | ビデオシーケンスの画像をコーディングするための方法および装置、ならびに端末デバイス |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018097700A1 (ko) * | 2016-11-28 | 2018-05-31 | 한국전자통신연구원 | 필터링을 위한 방법 및 장치 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101415115B (zh) * | 2007-10-15 | 2011-02-02 | 华为技术有限公司 | 基于运动跳跃模式的视频编解码方法及其编解码器 |
RU2011120192A (ru) * | 2009-09-22 | 2013-10-27 | Панасоник Корпорэйшн | Устройство кодирования изображения, устройство декодирования изображения, способ кодирования изображения и способ декодирования изображения |
CN102215387B (zh) * | 2010-04-09 | 2013-08-07 | 华为技术有限公司 | 视频图像处理方法以及编/解码器 |
US20140212046A1 (en) * | 2013-01-31 | 2014-07-31 | Sony Corporation | Bit depth reduction techniques for low complexity image patch matching |
WO2014178563A1 (ko) * | 2013-04-29 | 2014-11-06 | 인텔렉추얼 디스커버리 주식회사 | 인트라 예측 방법 및 장치 |
WO2015033510A1 (ja) * | 2013-09-09 | 2015-03-12 | 日本電気株式会社 | 映像符号化装置、映像符号化方法及びプログラム |
CN114449287A (zh) * | 2016-03-16 | 2022-05-06 | 联发科技股份有限公司 | 视频编码的样式基础的运动向量推导之方法及装置 |
US10750203B2 (en) * | 2016-12-22 | 2020-08-18 | Mediatek Inc. | Method and apparatus of adaptive bi-prediction for video coding |
CN116866553A (zh) * | 2017-01-16 | 2023-10-10 | 世宗大学校产学协力团 | 影像解码/编码方法以及传送比特流的方法 |
US10701366B2 (en) * | 2017-02-21 | 2020-06-30 | Qualcomm Incorporated | Deriving motion vector information at a video decoder |
JP7210707B2 (ja) * | 2018-09-05 | 2023-01-23 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | ビデオシーケンスの画像をコーディングするための方法および装置、ならびに端末デバイス |
-
2018
- 2018-09-05 JP JP2021512766A patent/JP7210707B2/ja active Active
- 2018-09-05 BR BR112021004145-1A patent/BR112021004145A2/pt unknown
- 2018-09-05 AU AU2018440297A patent/AU2018440297B2/en active Active
- 2018-09-05 WO PCT/CN2018/104239 patent/WO2020047788A1/en active Application Filing
- 2018-09-05 MX MX2021002603A patent/MX2021002603A/es unknown
- 2018-09-05 KR KR1020247009539A patent/KR20240042238A/ko active Search and Examination
- 2018-09-05 SG SG11202102183YA patent/SG11202102183YA/en unknown
- 2018-09-05 RU RU2021108971A patent/RU2770423C1/ru active
- 2018-09-05 CN CN202111265258.0A patent/CN113938680B/zh active Active
- 2018-09-05 CN CN201880097177.4A patent/CN112640462A/zh active Pending
- 2018-09-05 CA CA3111628A patent/CA3111628C/en active Active
- 2018-09-05 EP EP18932920.4A patent/EP3837838B1/en active Active
- 2018-09-05 KR KR1020217009744A patent/KR102651484B1/ko active IP Right Grant
-
2021
- 2021-03-05 PH PH12021550475A patent/PH12021550475A1/en unknown
- 2021-03-12 ZA ZA2021/01706A patent/ZA202101706B/en unknown
-
2023
- 2023-01-11 JP JP2023002475A patent/JP7556988B2/ja active Active
- 2023-10-20 AU AU2023251522A patent/AU2023251522A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018097700A1 (ko) * | 2016-11-28 | 2018-05-31 | 한국전자통신연구원 | 필터링을 위한 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
EP3837838B1 (en) | 2024-06-19 |
ZA202101706B (en) | 2022-07-27 |
BR112021004145A2 (pt) | 2021-05-25 |
JP7556988B2 (ja) | 2024-09-26 |
WO2020047788A1 (en) | 2020-03-12 |
RU2770423C1 (ru) | 2022-04-18 |
CN113938680A (zh) | 2022-01-14 |
JP2021536707A (ja) | 2021-12-27 |
AU2018440297A1 (en) | 2021-04-15 |
KR102651484B1 (ko) | 2024-03-25 |
MX2021002603A (es) | 2021-07-21 |
CA3111628A1 (en) | 2020-03-12 |
AU2018440297B2 (en) | 2023-07-20 |
JP7210707B2 (ja) | 2023-01-23 |
JP2023071641A (ja) | 2023-05-23 |
CA3111628C (en) | 2023-10-03 |
AU2023251522A1 (en) | 2023-11-09 |
EP3837838A1 (en) | 2021-06-23 |
KR20240042238A (ko) | 2024-04-01 |
PH12021550475A1 (en) | 2021-11-22 |
KR20210055059A (ko) | 2021-05-14 |
EP3837838A4 (en) | 2021-08-25 |
CN112640462A (zh) | 2021-04-09 |
SG11202102183YA (en) | 2021-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10757417B2 (en) | Affine motion compensation in video coding | |
TW202025753A (zh) | 具有自我調整運動向量解析度的運動向量精度指示的信令通知 | |
TW202019180A (zh) | 運動向量精度細化 | |
WO2019244119A1 (en) | Sub-block mv inheritance between color components | |
TW201931854A (zh) | 統一合併候選列表運用 | |
CN110740321B (zh) | 基于更新的运动矢量的运动预测 | |
CN113383550A (zh) | 光流修正的提前终止 | |
CN117501689A (zh) | 视频处理的方法、设备和介质 | |
CN115442619A (zh) | 用于解码端运动矢量修正的基于误差面的子像素精确修正方法 | |
AU2023251522A1 (en) | Method and apparatus for coding image of video sequence, and terminal device | |
CN118765502A (zh) | 用于视频处理的方法、装置及介质 | |
WO2020049446A1 (en) | Partial interweaved prediction | |
CN118541977A (zh) | 用于视频处理的方法、装置和介质 | |
CN117529913A (zh) | 视频处理的方法、设备和介质 | |
CN118489250A (zh) | 用于视频处理的方法、装置及介质 | |
CN118285098A (zh) | 用于视频处理的方法、装置和介质 | |
CN118592027A (zh) | 用于视频处理的方法、装置和介质 | |
CN118743220A (zh) | 用于视频处理的方法、装置和介质 | |
CN117581538A (zh) | 视频处理的方法、设备和介质 | |
CN118511523A (zh) | 用于视频处理的方法、装置和介质 | |
CN117652142A (zh) | 用于视频处理的方法、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |