CN113170146A - 用于图片编码和解码的方法和设备 - Google Patents

用于图片编码和解码的方法和设备 Download PDF

Info

Publication number
CN113170146A
CN113170146A CN201980076913.2A CN201980076913A CN113170146A CN 113170146 A CN113170146 A CN 113170146A CN 201980076913 A CN201980076913 A CN 201980076913A CN 113170146 A CN113170146 A CN 113170146A
Authority
CN
China
Prior art keywords
current block
coding tool
disabling
following conditions
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980076913.2A
Other languages
English (en)
Inventor
P·博尔德斯
T·波里尔
陈娅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
InterDigital VC Holdings Inc
Original Assignee
InterDigital VC Holdings Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP18306535.8A external-priority patent/EP3657794A1/en
Application filed by InterDigital VC Holdings Inc filed Critical InterDigital VC Holdings Inc
Publication of CN113170146A publication Critical patent/CN113170146A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Abstract

公开了一种解码方法。首先,解码当前块的参数。在以下条件中的一者或多者得到验证的情况下,针对所述当前块禁用译码工具:第一译码工具被用于当前块,以及关于所解码的参数的给定条件得到验证。否则,针对所述当前块启用所述译码工具。最后,响应于所述第一和译码工具,解码所述当前块。

Description

用于图片编码和解码的方法和设备
1.技术领域
本发明的至少一个实施方式总体上涉及一种用于图片编码(encoding)和解码(decoding)的方法和设备,并且更具体地,涉及一种使用各种译码工具(例如,运动补偿、局部光照补偿、一般化双向预测(Generalized Bi-prediction)、重构后滤波器等)进行图片编码和解码的方法和设备。
2.背景技术
为了实现高压缩效率,图像和视频译码(coding)方案通常采用预测和变换以利用视频内容中的空间和时间冗余。通常,帧内或帧间预测用于利用帧内或帧间帧相关性,然后对原始图像块与所预测的图像块之间的差(其通常被表示为预测误差、预测残差或预测值)进行变换、量化和熵编码。在编码期间,通常可能使用四叉树分区而将原始图像块分区/划分成子块。为了重构所述视频,通过与所述预测、变换、量化和熵译码对应的逆处理来解码压缩数据。
3.发明内容
根据至少一个实施例的一般方面,提出一种用于解码视频数据的方法,其包括:
-解码当前块的参数;
-在以下条件中的一者或多者得到验证的情况下,禁用针对所述当前块的译码工具:第一译码工具被用于所述当前块,以及关于所解码的参数的给定条件得到了验证;
-否则,为所述当前块启用所述译码工具;以及
-响应于所述译码工具,对所述当前块进行解码。
根据至少一个实施例的一般方面,提出一种用于编码视频数据的方法,其包括:
-获得当前块的参数;
-在以下条件中的一者或多者得到验证的情况下,禁用针对所述当前块的译码工具:第一译码工具被用于所述当前块,以及关于所获得的参数的给定条件得到了验证;
-否则,为所述当前块启用所述译码工具;以及
-响应于所述译码工具,对所述当前块进行编码。
根据至少一个实施例的一般方面,提出了一种解码装置,包括一个或多个处理器,所述一个或多个处理器被配置为执行:
-解码当前块的参数;
-在以下条件中的一者或多者得到验证的情况下,禁用针对所述当前块的译码工具:第一译码工具被用于所述当前块,以及关于所解码的参数的给定条件得到了验证;
-否则,为所述当前块启用所述译码工具;以及
-响应于所述译码工具,对所述当前块进行解码。
根据至少一个实施例的一般方面,提出一种用于编码视频数据的方法,其包括:
-获得当前块的参数;
-在以下条件中的一者或多者得到验证的情况下,禁用针对所述当前块的译码工具:第一译码工具被用于所述当前块,以及关于所获得的参数的给定条件得到了验证;
-否则,为所述当前块启用所述译码工具;以及
-响应于所述译码工具,对所述当前块进行编码。
根据至少一个实施例的一般方面,提出了一种编码装置,包括一个或多个处理器,所述一个或多个处理器被配置为执行:
-获得当前块的参数;
-在以下条件中的一者或多者得到验证的情况下,禁用针对所述当前块的译码工具:第一译码工具被用于所述当前块,以及关于所获得的参数的给定条件得到了验证;
-否则,为所述当前块启用所述译码工具;以及
-响应于所述译码工具,对所述当前块进行编码。
根据至少一个实施例的另一个一般方面,比特流被格式化为包括根据上述编码方法生成的信号。
本发明实施例中的一者或多者还提供一种计算机可读存储介质,其上存储有用于根据上述方法中的任意者的至少部分来编码或解码视频数据的指令。一个或多个实施例还提供了一种计算机可读存储介质,其上存储有根据上述编码方法生成的比特流。一个或多个实施例还提供了一种用于发送或接收根据上述编码方法产生的比特流的方法和装置。一个或多个实施例还提供了一种计算机程序产品,其包括用于执行上述任意方法的至少一部分的指令。
4.附图的简要说明
图1A描绘了总的解码流水线(pipeline),图1B和图1C描绘了其他总的解码流水线,图1D描绘了根据一个实施例的总的解码流水线。
图2示出了局部光照补偿参数推导的原理;
图3示出了重叠块运动补偿的原理;
图4示出了帧间和帧内模式组合情况下的多假设预测的原理;
图5示出了块的非矩形分区和相关联的OBMC对角加权;
图6描绘了根据一个实施例的解码方法的流程图;
图7描绘了根据一个实施例的编码方法的流程图;
图8描绘了根据各种实施例的解码过程的流程图;
图9描绘了多假设预测过程的流程图;
图10描绘了根据一个实施例的多假设预测过程的流程图;
图11描绘了具有局部光照补偿的运动补偿预测过程的流程图;
图12描绘了根据一个实施例的具有局部光照补偿的运动补偿预测过程的流程图;
图13描绘了根据一个实施例的具有在解码器侧运动向量细化之前计算的局部光照补偿的总解码流水线;
图14示出了多假设的原理;
图15示出了根据实施例的视频编码器的框图;
图16示出了根据实施例的视频解码器的框图;以及
图17示出了其中实现了各个方面和实施例的系统的示例的框图。
5.具体实施方式
在HEVC译码中,图片被分区成正方形形状的CTU,其具有可配置的大小,通常为64×64。在其它视频译码标准中,该大小可以是128×128或256×256。CTU是被分区为4个相等大小的正方形译码单元(CU)的四叉树的根,即,所述大小在宽度和高度上为父块大小的一半。四叉树是其中父节点可以被分成四个子节点的树,每个子节点可以变为另一被分成四个子节点的父节点。在HEVC中,译码块(CB)含有对应于一个CU的一个颜色分量的样本。它被分区成一个或多个预测块(PB),并且形成分区成变换块(TB)的四叉树的根。对应于所述译码块、预测块和变换块,译码单元(CU)包括预测单元(PU)和具有变换单元(TU)的树结构集合,PU包括所有颜色分量的预测信息,并且TU包括每个颜色分量的残差译码语法结构。亮度分量的CB、PB和TB的大小适用于相应的CU、PU和TU。
在近来的编码系统中,CTU是分区成译码单元(CU)的译码树的根。译码树是其中父节点(通常对应于块)可以被划分成子节点(例如,划分成2、3或4个子节点)的树,其中的每一个可以成为用于另一划分成子节点的父节点。除了四叉树划分模式之外,还定义了新的划分模式(二叉树对称划分模式、二叉树非对称划分模式和三叉树划分模式),其增加了可能的划分模式的总数。译码树具有唯一的根节点,例如CTU。译码树的叶子是树的终止节点。译码树的每个节点表示一块,其可以被进一步分区成较小块(也称为子块)。一旦确定CTU到CU的分区,则编码对应于译码树的叶子的CU。将CTU分区成CU以及用于编码每个CU(对应于译码树的叶)的译码参数可以在编码器侧通过速率失真优化过程来确定。
在本申请中,术语“块”或“图片块”可以用于指代CTU、CU、PU、TU、CB、PB和TB中的任意者。另外,术语“块”或“图片块”可用于指代如H.264/AVC或其它视频译码标准中指定的宏块、分区和子块,且更一般来说指代具有各种大小的样本的阵列。
在本申请中,术语“重构”和“解码”可以互换使用,术语“像素”和“样本”可以互换使用,术语“图像”、“图片”和“帧”可以互换使用。通常,但不是必须的,术语“重构”在编码器侧使用,而“解码”在解码器侧使用。
在本申请中,术语“启用”和“使用”在它们应用于块级别的译码工具的情况下可以互换使用。以相同的方式,“禁用”和“不使用”在它们应用于块级别的译码工具的情况下可以互换地使用。
在本申请案中,术语“译码工具”和“译码过程”可互换使用。
在最近的编码系统中,例如在通用视频译码(VVC)的参考软件(称为VTM)中,解码流水线包括若干级联工具。图1a中描绘了针对VVC的解码流水线。解码过程在译码单元(CU)级完成。CU包括C个正方形或矩形块(例如,对于YUV或RGB色度格式,C=3)。在4:2:0格式中,在水平和垂直方向上以两个的比率相对于亮度块按比例缩小两个色度块。
“熵解码”过程解析比特流并解码语法元素,例如译码模式(例如帧间/帧内译码模式)和相关联的参数(例如,帧内方向、帧间运动向量MV和参考索引)。
运动补偿(MC)使用MC滤波器内插参考图片中一个或两个(在双向预测的情况下)矩形块(与当前CU相同大小)的样本,其中位移等于参考图片中相对于当前块的位置的MV(mvX、mvY)。
局部光照补偿(LIC)旨在补偿可能发生在预测块与其在运动补偿(MC)时间预测中使用的参考块之间的光照变化。这通常使用线性IC模型(a,b)来完成:
SIC=a*Sref+b (等式1)
其中:Sref是运动补偿参考样本值,而SIC是预测样本值。LIC参数(a,b)是针对启用了LIC的每个块而被计算的。
有几种方法来计算所述LIC参数(a,b)。在一种方法中,解码器基于一些重构的图片样本(例如,基于定位在当前块的左边和/或顶部的重构样本“y”和定位在运动补偿块的左边和/或顶部的参考图片样本“x”,参见图2a),计算LIC参数。在另一方法中,基于定位在当前块的左边和/或顶部的重构样本“y”和用于重构“y”的对应预测样本“x”来计算所述LIC参数(图2b)。对于这两种方法,可以在每个块重构之后,计算和存储所述LIC参数。IC参数(a,b)使样本“y”和“a.x+b”之间的差异(例如,最小二乘法)最小化:
Figure BDA0003077602000000071
这两种方法在下文中被称为“传统LIC”。LIC引入与相邻CU的依赖性,因为其使用相邻CU的重构样本。因此,在可计算当前块的LIC参数且因此可重构当前块之前,当前CU必须等待相邻块被完全重构(参见图1a中的“反馈重构样本(feedback rec.sample)”)。
在双向预测的情况下,LIC的变型(称为“bi-dir-IC”)直接从双向预测中使用的两个运动补偿块(块0和块1)导出IC参数(a0,b0)和(a1,b1)。其包括估计两个参考图片之间的亮度变化以导出当前块的IC参数(a0,b0)和(a1,b1)。例如,计算运动补偿块1和运动补偿块0之间的LIC的IC参数(a,b)。接下来,从值(a,b)和当前图片、参考图片0和参考图片1的图片顺序计数(POC)中导出(a0,b0)和(a1,b1)。假设值a0、a1、b0、b1是当前帧和参考图片之间的时间距离的线性函数。此变型的优点是其不引入与相邻CU的任何依赖性。
在双向预测的情况下,双向光流(BIO)旨在使用光流的埃尔米特(Hermite)插值来细化假定两个参考图片之间线性位移的每个样本的运动。因此,将新的项添加到传统的双向预测:
Figure BDA0003077602000000072
其中:
I0,I1是运动补偿预测(块0和块1),
Figure BDA0003077602000000073
Figure BDA0003077602000000074
是第i个参考的水平和垂直梯度(k={0,1}),
(vx,vy)是块1和块0之间的运动向量,
σ是时间差(POC1-POC0)。
在双向预测的情况下,解码器侧运动向量细化(DMVR)旨在通过测试所解码的MV值(MVinitial)周围的一些位移来细化运动。测试候选的几个MV对的集合(MVtested(L0),MVtested(L1))。如在BIO中,所测试的MV值关于初始MV值对称,即,(MVtested(L0)-MVinitial(L0)=MVtested(L1)-MVinitial(L1)),其中MVtested(L0)是针对列表L0测试的运动向量,MVtested(L1)是针对列表L1测试的运动向量。所选择的MV对是使用例如平均去除的绝对差和(MRSAD)而使差MC(ref0,MVtested(L0))-MC(ref1,MVtested(L1))最小化的MV对。
在双向预测的情况下,计算两个预测块,并将它们一起平均(也称为双向预测平均)。在一般化双向预测(GBI)的情况下,它们与加权和相组合如下:
PGBI=(((1<<gs)-gw1).P0+gw1.P1)>>gs(等式4)
其中P0,P1是运动补偿预测(块0和块1)。
在VTM中,要使用的权重通过“gbi索引”而针对每个CU被编码,所述“gbi索引”可取表1中所提及的值。
Figure BDA0003077602000000081
表1.GBi索引的二进制化和相关联的权重。
此后,权重对{1/2;1/2}将被称为默认权重。
在图1a中,在对每个单向运动补偿预测进行双向预测平均之前,应用LIC过程。在一种变型中,如图1b中所描绘的,在双向预测平均(710)之后,应用LIC过程(720)。
根据重叠块运动补偿(OBMC)工具(此后称为”OBMC过程“),相邻块的运动被用于扩展对该相邻块的预测PN(N=A或L)并且利用当前块预测PC来逐步执行加权(图3)。例如,设PA(x,y)表示上方块的上方预测样本(x={0,…W-1},y={0,..HA-1})。这些样本通过底部的附加的B个行而被扩展:PA(x,y)(x={0,…W-1},y={HA,..HA+B-1},其是用与PA的其它预测样本相同的过程(MC)和相同的运动信息而被计算的。假设用PC(x,y)表示当前预测POBMC样本(x={0,…W-1},y={0,..HC-1}),然后当前块的顶部B行样本的预测最终被计算为:
POBMC(x,y)=wN(y).PA(x,y+B)+wC(y).PA(x,y) (等式5)
基于从左侧块数据构建的PL(x,y)样本,对左侧B列的预测样本应用相同的过程。
在相邻块N使用LIC和/或BIO进行其预测的情况下,还可以通过应用LIC和BIO来获得附加PN样本(以下称为”OBMC过程“)。
例如,对于PN和PC,从边界向当前块中心的典型逐步权重分别为wC(y)={1/4,1/8,1/16,1/32}和wN(y)={3/4,7/8,15/16,31/32}。
一般多假设概念包括如图4上所描绘的在合并模式中执行的帧间预测与帧内预测模式或与另一帧间模式(例如,单向预测AMVP、跳过及合并)的组合。在合并模式中,构建合并候选(参考索引、运动值)列表且用信号发送标识一个候选的合并索引。然后,从由所述合并索引标识的候选,导出合并模式中的块的运动信息,并将其用于运动补偿预测。最终预测是关于合并索引的预测和由帧内预测模式生成的预测的加权平均,其中取决于该组合,应用不同的权重。在比特流中用信号发送所述帧内预测模式。在特定实施例中,在所有经典预测模式的子集(例如,子集大小等于4)中选择所述帧内预测模式。当前块被分成4个等面积区域。随着区域远离帧内参考样本,权重逐步减小。如图4和14的示例中所示,每个加权集(其被表示为(w_intrai,w_interi),其中i为1到4,并且(w_intra1,w_inter1)=(6,2),(w_intra2,w_inter2)=(5,3),(w_intra3,w_inter3)=(3,5),和(w_intra4,w_inter4)=(2,6))将被应用于相应的区域,用于帧内垂直方向预测。当选择DC或平面模式或CU的宽或高小于4时,对整个CU应用相同的权重。
几何(例如,三角形)模式允许在译码之前,将图片分区成块具有更多灵活性。这种分区的示例在图5的顶部示出。如图5的底部所示,通过对边界(图5的灰色区域)上的两个预测值(predictor)执行加权,可以获得附加的译码性能。该加权处理可以与诸如GBI或LIC的其它加权级联,并且增加了实现的复杂性。
“重构后”滤波器(730)允许在CU环路重构中对当前CU的经重构样本进行滤波,使得经滤波样本可用于帧内预测或用于同一图片(或同一切片或同一图块)中的后续CU的LIC参数导出。而“其它后置滤波器”(740)(例如,解块滤波器、SAO滤波器或ALF滤波器)在整个图片(或切片或图块)已被重构之后对经重构的样本进行滤波。“重构后”滤波器的示例是双边滤波器(J.Strom等人,“CE14:Reduced latency,LUT-free bilateral filter(CE14:缩短延时的无LUT双边滤波器)”,文档JVET-L0172,第12次会议:中国澳门,2018年10月3-12日)、Hadamard滤波器(S.Ikonen等人,Non-CE:Hadamard transform domain filter(非CE:Hadamard变换域滤波器)”,文档JVET-M0468,第13次会议:Marrachec,MA,2019年1月9-18日)或扩散滤波器(J.Rash等人,“CE10:Uniform Directional Diffusion Filters ForVideo Coding(CE10:用于视频编码的均匀定向扩散滤波器)”,文档JVET-M0042,第13次会议:Marrakech,MA,2019年1月9-18日)。
在一变型中,“重构后”滤波器仅应用于以帧间模式译码的CU,而不应用于以帧内或以组合的帧内和帧间预测译码的CU,如图1c中所描绘。在另一变型中,“重构后”滤波器被应用于仅以帧内模式而不以帧间模式译码的CU。“重构后”滤波器的应用可以以其它参数为条件,例如当前CU大小、QP值或分量类型(例如,如730中的虚线色度框所示,“重构后”滤波器不应用于色度分量)。
新的视频编解码器实现了更多数量的译码工具,这些译码工具可以被级联以提高译码效率。在一些情况下,级联相同性质的工具可能是起反作用的,即,降低译码效率,并且这也可能加重解码过程的流水线的负担。
至少一个实施例提出了协调不同译码工具之间的交互,并且通过确保合理的流水线复杂度来帮助在各种平台上实现视频编解码器。至少一个实施例提出了应用一些规则和限制而不降低整体编解码器性能。
至少一个实施例提出了减小流水线大小(处理级的数量)和由一些工具在“帧间”译码中引入的流水线依赖性,这可例如通过在它们的相互共同激活中添加限制来实现。
为了降低流水线依赖性,修改“帧间”解码流水线。
图6描述了根据一个实施例的解码方法的流程图。
参数被解码用于当前块的(S100)。在以下条件中的一者或多者得到验证的情况下,禁用(S110)当前块的译码工具(例如,LIC):第一译码工具被用于所述当前块(例如,GBI与不是默认权重的权重一起使用),以及关于所解码的参数的给定条件(块大小低于值)得到了验证。否则,所述译码工具被启用以用于所述当前块。考虑所述译码工具是否被启用来解码所述当前块(S120)。如果启用了所述译码工具,则使用所述译码工具对当前块进行解码。否则,不使用所述译码工具来解码所述当前块。
图7描绘根据一个实施例的编码方法的流程图。获得当前块的参数(S200)。在以下条件中的一者或多者得到验证的情况下,禁用(S110)当前块的译码工具(例如,LIC):第一译码工具被用于所述当前块(例如,GBI与不是默认权重的权重一起使用),并且关于所解码的参数的给定条件(块大小低于值)得到了验证。否则,所述译码工具被启用用于所述当前块。考虑所述译码工具是否被启用来编码所述当前块(S220)。如果启用了所述译码工具,则使用所述译码工具对所述当前块进行编码。否则,不使用所述译码工具对所述当前块进行编码。
如图8A到8C所示,可根据当前译码单元(CU)的一些性质和/或是否使用另一译码工具“X”(406、408)来调节译码工具的禁用。
在图8A中,解码CU参数(400)。在验证了CU参数的条件的情况下(410),例如在所述CU大小低于一值的情况下,禁用译码工具/过程“Y”(420)。
在图8B中,解码CU参数(400)。在第一译码工具“X”用于当前CU的情况下(406),那么应用所述第一译码工具(408)。在进一步验证了CU参数的条件的情况下(410),例如,在CU大小低于一值的情况下,禁用第二译码工具/过程。否则,使用所述第二译码工具(420)。
在一变型中,在第一译码工具“X”用于当前CU的情况下(406),那么应用第一译码工具(408)且禁用第二译码工具“Y”。在这个变型中,不检查关于CU的条件。
在图8C中,解码CU参数(400)。在第一译码工具“X”用于当前CU(406)且关于CU参数的条件经验证(410)的情况下,那么禁用第二译码工具“Y”。否则,使用所述第二译码工具(420)。虚线表示译码工具“X”的应用由406来调节。
所述变型是从“条件(CU)”的表达以及工具“X”和“Y”的过程顺序(图8-B或C)构建的。所述“条件(CU)”是从先前解码的数据(400)导出的,并且可以是以下规则的组合:
-对于小块(CU大小低于一值),禁用工具“X”,
-对于色度(CU分量是色度),禁用工具“X”,
-如果当前切片具有高于一值的时间标识符(TiD),则禁用工具“X”,
-如果工具“X”需要来自位于另一CTU中或当前VPDU(虚拟流水线数据单元)外部的另一重构块的信息(例如,重构样本),则禁用该工具“X”。
减少多假设模式的流水线依赖性
图9示出了在输入比特深度或内部比特深度等于10比特的情况下以及在还使用双向预测、BIO和GBI的情况下,针对MH的VVC软件帧间预测流水线过程。首先,应用运动补偿来构建两个参考块预测(500)。结果存储在N比特中,其中N>10(510),以在进一步的过程中保持更高的精度(例如,N=14比特),即,BIO(520)和GBI加权(530)。接着,将样本值存储(例如,右移)(540)并裁剪(550)在内部比特深度(例如,10比特)中,使得随后的MH过程(560)以内部比特深度(例如,10比特)执行。
由于“多假设”(MH)使用附加的“帧内”或“帧间”预测计算,并将其与另一预测组合,如图9所示,因此它增加了帧间流水线中的处理步骤的数量。人们可以通过以下限制中的一者或多者来减轻流水线。
在一个实施例中,在使用MH的情况下,LIC对于一个或所有帧间模式被禁用。这意味着如果当前帧间模式是“合并”并且因为使用MH而禁用LIC,则IC标志不被合并,而是被推断为零。IC标志是为块指示其是否使用LIC的参数。
在一个实施例中,在如图10所示使用MH的情况下,禁用帧间双向预测。BIO也被禁止(通过设计),因为它仅适用于双向预测。
在一个实施例中,在使用MH的情况下,禁用三角形模式。实际上,你已经具有用于两个三角形预测的加权过程,如图5上所描绘。
此外,当以增加的比特深度精度将帧内预测添加到帧间预测时且在裁剪操作之前,可改进MH组合级。在图10中,MH处理以N比特执行。
降低LIC的流水线依赖性:
图11描绘了在输入比特深度或内部比特深度等于10比特的情况下以及在使用双向预测的情况下,用于LIC的VVC软件帧间预测流水线过程。首先,应用运动补偿来构建两个参考块预测(600)。以内部比特深度精度(例如,10比特)存储结果(610)。接下来,从先前存储的数据估计或检索LIC参数,并且应用光照补偿(670)。它包括加权加上偏移。接着,应用右移到内部比特深度(10比特)(640)和裁剪(650)。然后,在应用GBI权重(630)之前,将样本变换为N比特精度(680)。
PLIC=(a.P+b)>>shiftLIC (等式6)
其中:(a;b)是LIC参数,
P是运动补偿块样本,
shiftLC是右移,使得PLIC是10比特,
PLIC是利用LIC的预测样本。
接着,样本值被存储(例如,右移)(640)并被裁剪(650)在内部比特深度(例如10比特)中。
基本上,LIC引入了与其它相邻的重构块的流水线依赖性,并在运动补偿之后增加一个步骤以改变亮度,如图11所示。这种依赖性可以通过使用一个或多个下列约束/限制来降低。
在一个实施例中,针对色度分量和/或小块(CU大小低于一值),禁用LIC。
在一个实施例中,针对色度分量和/或小块(CU大小低于一值),禁用GBI(或将GBI权重设定为默认权重)。
由于LIC的原理是对通过运动补偿获得的预测样本进行加权,因此当权重不等于默认权重时,其与GBI具有一些相似性。
在一个实施例中,在GBI权重不是默认权重的情况下,在双向预测中禁用LIC。因此,如果GBI索引与默认值不同,则不对IC标志进行译码。在合并模式中,如果继承了GBI索引,则如果GBI权重不是默认值,则IC标志被推断为假。在变型中,如果继承了IC标志并且其值为真,则推断GBI权重是默认权重。在一种变型中,如果GBI权重不是默认的,则使用双向IC(bi-dir-IC)代替传统LIC。
在一个实施例中,在IC标志被译码并且IC标志为真的情况下,则不对GBI索引进行译码,并且将GBI权重推断为默认权重。在一种变型中,在合并模式中,在继承了IC标志并且其值为真的情况下,则将GBI权重推断为默认权重。
语法的示例在表2中被提供。
Figure BDA0003077602000000161
表2示例译码单元语法,其中以IC_flag值为条件对GBI索引进行译码
在一个实施例中,在GBI权重不是默认权重的情况下,即使当前CU在“合并”模式中被译码,IC标志也被译码。
在一个实施例中,在重构样本“recN”属于一个相邻CU(称为N)的情况下,LIC被禁用,其中该相邻CU已经用非默认GBI权重译码。
虚拟流水线数据单元(VPDU)被定义为图片中的非重叠MxM-luma(L)/NxN-chroma(C)单元。在硬件解码器中,连续的VPDU由多个流水线级同时处理。不同的级同时处理不同的VPDU。通常,VPDU是64×64亮度/32×32色度块。必须验证以下三个条件:
-对于包含一个或多个CU的每个VPDU,CU被完全包含在VPDU中。
-对于含有一个或一个以上VPDU的每一CU,所述VPDU被完全包含于所述CU中。
-CU的处理顺序不应离开VPDU并在以后重新访问它。
对于高速缓冲存储器中的数据,利用LIC引入的块重构依赖性是可接受的,所述数据通常对应于一个CTU或对应于一个VPDU,该一个CTU或VPDU与用于解码基本CU的硬件和/或实现存储器高速缓存约束/限制有关,并且还与硬件可以一体化处理的最大样本区域大小有关。
在一个实施例中,在用于导出LIC参数的相邻块N的重构样本“recN”在CTU或VPDU之外的情况下,LIC被禁用。在一种变型中,可以使用LIC,但是仅使用当前CTU或VPDU内的重构样本。
在一个实施例中,在以下情况下:当前块的译码模式是“合并”,合并索引指示邻居N用于合并,该块具有等于真的IC标志(IC参数被表示为ICN),并且“recN”样本在CTU或VPDU之外,则IC标志对于当前块为真,并且重新使用ICN(由相邻块N使用的LIC参数)来构建当前块的预测,而不是使用“recN”样本来导出当前LIC参数。
在一个实施例中,LIC以增加的精度被计算(670),即,设置shiftLIC(等式6),使得样本精度在LIC过程之后是N比特,并且样本仅在预测过程结束时被剪切,如图12所示。
降低“重构后”滤波器的流水线依赖性:
在一个实施例中,LIC过程和“重构后”滤波过程对于每个分量是互斥的(即,如果LIC对于一个分量被启用,则对于该分量禁用“重构后”滤波器)或者对于所有分量是互斥的(即,如果LIC对于所有分量被启用,则对于所有分量禁用“重构后”滤波器)。
如果“重构后”不应用于一个分量(例如,色度),那么如果LIC针对当前CU被禁用(例如,LIC标志为假),那么“重构后”可仅应用于其他分量(例如,亮度)。
例如,如果LIC被启用和/或被应用于当前CU(例如,LIC标志为真、被推断或被译码),则如图1d中所描绘的,针对所有分量禁用重构后滤波。
在另一个示例中,如果LIC过程可以按分量被启用(例如,一个LIC标志被推断或译码用于亮度,另一个LIC标志被推断或译码用于色度),则如果LIC标志对于一个分量被启用,则对于该分量禁用所述“重构后”滤波过程。
减少用于OBMC的流水线:
OBMC对于小块可能具有较低的译码效率,而当图片中的小块的数量很高时,每个样本的平均处理量显著增加。人们可以通过以下限制中的一者或多者来减轻流水线。
在一个实施例中,对于小块(例如4×4),OBMC被禁止(即,不被使用)。在一个实施例中,不执行色度块OBMC。在一个实施例中,在当前块使用LIC的情况下,OBMC被禁用(即,不被使用)。在一个实施方案中,LIC不用于OBMC过程。在一个实施方案中,BIO不用于OBMC过程。
减小用于BIO的流水线:
在一个实施例中,如果GBI权重不是默认值,则BIO被禁用。
BIO和DMVR是两种具有相同目的技术,即,细化MV。因此,在DMVR用于当前块的情况下,BIO被禁用,反之亦然(互斥)。
减小用于DMVR的流水线:
在现有技术中,LIC通过DMVR而被禁用。实际上,启用LIC(包括针对每个要测试的MV的LIC参数的计算)显著地增加了计算量。已经提出在没有LIC的情况下执行DMVR,并且在DMVR级之后,启用LIC过程,如图1中所描绘的。然而,由于DMVR不包括LIC,所以MV细化的准确性显著降低。为了应对这种限制,提出利用MVinitial(在利用DMVR进行MV细化之前)执行LIC参数计算,并且不在DMVR处理中细化LIC参数,即,不在DMVR过程中或之后计算LIC参数,如图13中所描绘的。
减小用于解块滤波器的流水线:
在一个实施例中,如果在一个边缘上应用OBMC,则在该边缘上降低DBF强度,和/或在该边缘属于一个启用了LIC或BIO的块的情况下,降低DBF强度。
本申请描述了多个方面,这其中包括工具、特征、实施例、模型、方法等。这些方面中的许多方面被描述为具有特异性,并且至少为了示出个体特性,通常以可能听起来受限的方式来描述。然而,这是为了描述清楚的目的,并且不限制那些方面的应用或范围。实际上,所有不同的方面可以组合和互换以提供另外的方面。此外,这些方面也可以与在较早的文档中描述的方面组合和互换。
本申请中描述和预期的方面可以以许多不同的形式实现。以下图15、16和17提供了一些实施例,但是可以设想其他实施例,并且对图15、16和17的讨论不限制实现的广度。所述方面中的至少一个方面主要涉及视频编码和解码,并且至少一个其它方面主要涉及传送所生成或编码的比特流。这些和其它方面可以被实现为方法、装置、其上存储有用于根据所描述的任何方法来编码或解码视频数据的指令的计算机可读存储介质、和/或其上存储有根据所描述的任何方法生成的比特流的计算机可读存储介质。
本文描述了各种方法,并且每种方法包括用于实现所描述的方法的一个或多个步骤或动作。除非所述方法的正确操作需要特定顺序的步骤或动作,否则可修改或组合特定步骤和/或动作的顺序和/或使用。
本申请中描述的各种方法和其它方面可用于修改模块,例如,图15和图16所示的运动补偿模块(170,275)、运动细化模块(190,290)、LIC模块(195,295)、多预测组合模块(105,270)。此外,本发明不限于VVC或HEVC,并且可应用于例如其它标准和提案(无论是预先存在的还是将来开发的)以及任何此类标准和提案(包括VVC和HEVC)的扩展。除非另外指出或在技术上排除,本申请中描述的方面可以单独或组合使用。
在本申请中使用各种数值。具体值是出于示例目的,并且所描述的方面不限于这些具体值。
图15示出了编码器100。可以设想该编码器100的变型,但是为了清楚起见,下面描述编码器100,而没有描述所有预期的变型。
在被编码之前,视频序列可以经历预编码处理(101),例如,对输入颜色图片应用颜色变换(例如,从RGB 4:4:4到YCbCr 4:2:0的转换),或者执行输入图片分量的重新映射,以便获得对压缩更有弹性的信号分布(例如,使用所述颜色分量之一的直方图均衡)。元数据可以与所述预处理相关联,并且被附加到比特流。
在编码器100中,如下所述,由编码器元件对图片进行编码。以例如CU为单位分区(102)并处理要编码的图片。使用例如帧内或帧间模式来编码每个单元。当以帧内模式对单元进行编码时,其执行帧内预测(160)。在帧间模式中,执行执行运动估计(175)、可能的运动细化(190)、运动补偿(170)和可能的光照补偿(195)。所述编码器决定(105)使用帧内模式或帧间模式中的哪一者来对所述单元进行编码,并且通过例如预测模式标志来指示所述帧内/帧间决定。所述编码器还可以例如在MH模式或双向预测模式中组合(105)若干预测。例如,通过从原始图像块中减去(110)预测块来计算预测残差。
然后,对所述预测残差进行变换(125)和量化(130)。对所量化的变换系数以及运动向量和其它语法元素进行熵译码(145)以输出比特流。所述编码器可以跳过所述变换,并直接对未变换的残差信号应用量化。所述编码器可以绕过变换和量化这两者,即,直接对所述残差进行译码而不应用所述变换或量化处理。
所述编码器对译码块进行解码,以提供用于进一步预测的参考。对所量化的变换系数进行解量化(140)和逆变换(150)以对预测残差进行解码。组合(155)所解码的预测残差和预测块,重构图像块。环内滤波器(165)被应用于所重构的图片,以执行例如解块/SAO(样本自适应偏移)滤波,从而减少编码伪像。将所滤波的图像存储在参考图片缓冲器(180)中。
图16示出了视频解码器200的框图。在解码器200中,如下所述,由解码器元件解码比特流。视频解码器200通常执行与如图15中所描述的编码过程互逆的解码过程。所述编码器100通常还执行视频解码作为编码视频数据的一部分。
特别地,所述解码器的输入包括视频比特流,其可以由视频编码器100生成。所述比特流首先被熵解码(230)以获得变换系数、运动向量和其它译码信息。图片分区信息指示所述图片如何被分区。所述解码器因此可以根据所解码的图片分区信息来划分(235)所述图片。所述变换系数被解量化(240)和逆变换(250)以解码所述预测残差。将所解码的预测残差与预测块进行组合(255),重构图像块。所述预测块可以从帧内预测(260)或运动补偿预测(即,帧间预测)(275)或者从若干预测的组合(270)(例如在MH模式或双向模式中)获得。运动补偿预测可以在光照中进一步补偿(295)。如所述编码器那样,解码器还可包括被配置以细化(例如,使用DMVR或BIO)所解码的运动向量的模块(290)。环内滤波器(265)被应用于所重构的图像。将所滤波的图像存储在参考图片缓冲器(280)中。
解码后的图片可以进一步经历解码后处理(285),例如,逆颜色变换(例如,从YCbCr 4:2:0到RGB 4:4:4的转换)或执行在预编码处理(101)中执行的所述重新映射过程的逆重新映射。所述解码后处理可以使用在所述预编码处理中导出并且在所述比特流中用信号发送的元数据。
图19示出了其中实现了各个方面和实施例的系统的示例的框图。系统1000可以被实现为包括以下描述的各种组件的设备,并且被配置为执行本文中描述的一个或多个方面。此类设备的示例包括但不限于各种电子设备,诸如个人计算机、膝上型计算机、智能电话、平板计算机、数字多媒体机顶盒、数字电视接收机、个人视频记录系统、连接的家用电器和服务器。系统1000的元件可以单独地或组合地被实现在单个集成电路(IC)、多个IC和/或分立组件中。例如,在至少一个实施例中,系统1000的处理和编码器/解码器元件分布在多个IC和/或分立组件上。在各种实施例中,所述系统1000经由例如通信总线或通过专用输入和/或输出端口而被通信地耦合到一个或多个其他系统或其他电子设备。在各种实施例中,所述系统1000被配置为实现本文中描述的一个或多个方面。
所述系统1000包括至少一个处理器1010,其被配置为执行加载在其中的指令,以用于实现例如本文中描述的各个方面。处理器1010可以包括嵌入式存储器、输入输出接口和本领域已知的各种其它电路。所述系统1000包括至少一个存储器1020(例如,易失性存储器设备和/或非易失性存储器设备)。系统1000包括存储设备1040,其可以包括非易失性存储器和/或易失性存储器,这其中包括但不限于电可擦除可编程只读存储器(EEPROM)、只读存储器(ROM)、可编程只读存储器(PROM)、随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、闪存、磁盘驱动器和/或光盘驱动器。作为非限制性示例,所述存储设备1040可以包括内部存储设备、附接的存储设备(包括可拆卸的存储设备和不可拆卸的存储设备)和/或网络可访问的存储设备。
系统1000包括编码器/解码器模块1030,其被配置为例如处理数据以提供所编码的视频或所解码的视频,并且所述编码器/解码器模块1030可以包括其自己的处理器和存储器。所述编码器/解码器模块1030表示可包括在设备中以执行编码和/或解码功能的模块(一个或多个)。如已知的,设备可以包括所述编码模块和解码模块中的一个或两个。另外,编码器/解码器模块1030可实施为系统1000的单独元件或可并入处理器1010内作为如所属领域的技术人员已知的硬件与软件的组合。
要加载到处理器1010或编码器/解码器1030上以执行本文档中描述的各个方面的程序代码可以存储在存储设备1040中,并且随后加载到存储器1020上以供处理器1010执行。根据各种实施例,处理器1010、存储器1020、存储设备1040和编码器/解码器模块1030中的一者或多者可以在执行本文中描述的过程期间存储各种项中的一者或多者。这些存储的项可以包括但不限于输入视频、所解码的视频或该解码的视频的部分、比特流、矩阵、变量以及来自方程式、公式、运算和运算逻辑的处理的中间或最终结果。
在一些实施例中,所述处理器1010和/或所述编码器/解码器模块1030内的存储器用于存储指令,并且提供用于在编码或解码期间需要的处理的工作存储器。然而,在其它实施例中,所述处理设备(例如,所述处理设备可为所述处理器1010或所述编码器/解码器模块1030)外部的存储器用于这些功能中的一者或多者。外部存储器可以是存储器1020和/或存储设备1040,例如,动态易失性存储器和/或非易失性闪存。在几个实施例中,外部非易失性闪存用于存储例如电视的操作系统。在至少一个实施例中,诸如RAM的快速外部动态易失性存储器被用作视频译码和解码操作的工作存储器,诸如用于MPEG-2(MPEG是指运动图像专家组,MPEG-2也被称为ISO/IEC13818,并且13818-1也被称为H.222,并且13818-2也被称为H.262)、HEVC(HEVC是指高效视频译码,也被称为H.265和MPEG-H部分2)、或VVC(通用视频译码,由联合视频团队专家JVET开发的新标准)的工作存储器。
如框1130中所示,可以通过各种输入设备来提供对系统1000的元件的输入。这样的输入设备包括但不限于:(i)接收例如由广播者通过空中传输的射频(RF)信号的RF部分,(ii)分量(COMP)输入端子(或一组分量输入端子),(iii)通用串行总线(USB)输入端子,和/或(iv)高清晰度多媒体接口(HDMI)输入端子。图10中未示出的其它示例包括合成视频。
在各种实施例中,框1130的输入设备具有本领域已知的相关联的相应输入处理元件。例如,所述RF部分可以与适合于以下的元件相关联:(i)选择期望频率(也称为选择信号,或将信号频带限制到一频带),(ii)将所选择的信号下变频,(iii)再次将频带限制到较窄频带,以选择(例如,)在某些实施例中可以称为信道的信号频带,(iv)解调所述下变频且频带限制的信号,(v)执行纠错,和(vi)解复用以选择期望的数据分组流。各种实施例的RF部分包括一个或多个元件以执行这些功能,例如,频率选择器、信号选择器、限带器、信道选择器、滤波器、下变频器、解调器、纠错器和解复用器。所述RF部分可以包括执行各种这些功能的调谐器,这些功能包括例如将所接收的信号下变频到较低频率(例如,中频或近基带频率)或基带。在一个机顶盒实施例中,所述RF部分及其相关的输入处理元件接收通过有线(例如,电缆)介质发送的RF信号,并通过滤波、下变频和再次滤波来执行到期望频带的频率选择。各种实施例重新安排上述(和其它)元件的顺序,移除这些元件中的一些,和/或添加执行类似或不同功能的其它元件。添加元件可以包括在现有元件之间插入元件,例如插入放大器和模数转换器。在各种实施例中,所述RF部分包括天线。
另外,USB和/或HDMI终端可以包括用于通过USB和/或HDMI连接将系统1000连接到其它电子设备的相应接口处理器。应当理解,输入处理的各个方面(例如,,,所罗门纠错)可以根据需要在例如单独的输入处理IC或处理器1010内实现。类似地,USB或HDMI接口处理的各方面可以根据需要在单独的接口IC内或在处理器1010内实现。解调、纠错和解复用的流被提供给各种处理元件,这其中包括例如处理器1010和编码器/解码器1030,其与存储器和存储元件结合操作以根据需要来处理所述数据流以便在输出设备上呈现。
系统1000的各种元件可以设置在集成壳体内。在该集成壳体内,各种元件可以使用合适的连接布置(例如,本领域已知的内部总线,包括IC间(I2C)总线、布线和印刷电路板)互连并在其间传输数据。
所述系统1000包括通信接口1050,其使得能够经由通信信道1060与其他设备通信。所述通信接口1050可以包括但不限于被配置为通过通信信道1060发送和接收数据的收发器。所述通信接口1050可以包括但不限于调制解调器或网卡,并且所述通信信道1060可以例如在有线和/或无线介质内实现。
在各种实施例中,使用无线网络(例如,Wi-Fi网络,例如IEEE 802.11(IEEE是指电气和电子工程师协会)),将数据流式传输或以其他方式提供给所述系统1000。这些实施例的Wi-Fi信号通过适用于Wi-Fi通信的通信信道1060和通信接口1050来接收。这些实施例的通信信道1060通常连接到接入点或路由器,所述接入点或路由器提供对包括因特网的外部网络的接入以允许流式传输应用和其它云上通信。其它实施例使用通过输入框1130的HDMI连接来传递数据的机顶盒而向系统1000提供流式传输的数据。还有一些实施例使用输入框1130的RF连接而向所述系统1000提供流式传输的数据。如上所述,各种实施例以非流式传输方式提供数据。另外,各种实施例使用除Wi-Fi之外的无线网络,例如,蜂窝网络或蓝牙网络。
所述系统1000可以向各种输出设备(包括显示器1100、扬声器1110和其他外围设备1120)提供输出信号。各种实施例的显示器1100包含以下中的一者或多者:例如触摸屏显示器、有机发光二极管(OLED)显示器、弯曲显示器和/或可折叠显示器。所述显示器1100可以用于电视、平板电脑、膝上型计算机、蜂窝电话(移动电话)或其他设备。所述显示器1100还可与其它组件集成(例如,如在智能电话中),或是单独的(例如,用于膝上型计算机的外部监视器)。在各实施例的各示例中,所述其它外围设备1120包括以下中的一者或多者:独立数字视频盘(或数字多功能盘)(DVR,针对这两项)、盘播放器、立体声系统和/或光照系统。各种实施例使用一个或多个外围设备1120,其基于系统1000的输出来提供功能。例如,盘播放器执行播放所述系统1000的输出的功能。
在各种实施例中,使用信令(诸如,AV.Link(AV.链路)、消费电子控制(CEC)、或在有或没有用户干预的情况下实现设备到设备控制的其他通信协议)在系统1000和显示器1100、扬声器1110或其它外围设备1120之间传送控制信号。所述输出设备可以经由通过相应接口1070、1080和1090的专用连接而通信地耦合到系统1000。作为替代,所述输出设备可以使用通信信道1060经由通信接口1050连接到系统1000。所述显示器1100和扬声器1110可以与系统1000的其它组件一起集成在电子设备(例如,电视机)中的单个单元中。在各种实施例中,显示接口1070包括显示驱动器,例如定时控制器((T Con)芯片。
例如,如果输入1130的RF部分是单独机顶盒的一部分,则所述显示器1100和扬声器1110可以备选地与其它组件中的一者或多者分离。在所述显示器1100和扬声器1110是外部组件的各种实施例中,所述输出信号可以经由专用输出连接来提供,所述专用输出连接例如包括HDMI端口、USB端口或COMP输出。
这些实施例可以由处理器1010或由硬件实现的计算机软件或由硬件和软件的组合来实现。作为非限制性示例,所述实施例可以由一个或多个集成电路实现。所述存储器1020可以是适合于技术环境的任何类型,并且可以使用任何适当的数据存储技术来实现,作为非限制性示例,诸如光学存储器设备、磁存储器设备、基于半导体的存储器设备、固定存储器和可移动存储器。所述处理器1010可以是适合于技术环境的任何类型,并且作为非限制性示例,可以包含以下中的一者或多者:微处理器、通用计算机、专用计算机和基于多核架构的处理器。
各种实现方式涉及解码。如本申请中所使用的,“解码”可以包括例如对接收到的编码序列执行的全部或部分处理,以便产生适合于显示的最终输出。在各种实施例中,此类过程包括通常由解码器执行的过程中的一者或多者,例如熵解码、逆量化、逆变换和差分解码。在各种实施例中,这样的过程还或替代地包括由本申请中描述的各种实现的解码器执行的过程,例如,运动和光照补偿、运动细化和多预测组合。
作为进一步的示例,在一个实施例中,“解码”仅指熵解码,在另一实施例中,“解码”仅指差分解码,并且在另一实施例中,“解码”指熵解码和差分解码的组合。短语“解码过程”是旨在具体地指代操作的子集还是一般地指代更广泛的解码过程,这基于具体描述的上下文将是清楚的,并且相信是本领域技术人员所充分理解的。
各种实现涉及编码。以与以上关于“解码”的讨论类似的方式,如在本申请中使用的“编码”可以包括例如对输入视频序列执行的以便产生编码比特流的过程的全部或部分。在各种实施例中,此类过程包括通常由编码器执行的一个或多个过程,例如,分区、差分编码、变换、量化和熵译码。在各种实施例中,这样的过程还或替代地包括由本申请中描述的各种实现的编码器执行的过程,例如运动和光照补偿、运动细化和多预测组合。
作为进一步的示例,在一个实施例中,“编码”仅指熵编码,在另一实施例中,“编码”仅指差分编码,而在另一实施例中,“编码”指差分编码和熵译码的组合。短语“编码过程”的旨在具体地指代操作的子集还是一般地指代更广泛的编码过程,这将基于具体描述的上下文而变得清楚,并且相信是本领域技术人员所充分理解的。
注意,如本文所使用的语法元素(例如,IC-标志)是描述性术语。因此,它们不排除使用其它语法元素名称。
当附图被呈现为流程图时,应当理解,它还提供了对应装置的框图。类似地,当附图被呈现为框图时,应当理解,它还提供了对应的方法/过程的流程图。
各种实施例涉及速率失真优化。特别地,在编码过程期间,通常考虑速率和失真之间的平衡或折衷,通常给出计算复杂度的约束。所述速率失真优化通常被公式化为最小化速率失真函数,该速率失真函数是速率和失真的加权和。存在不同的方法来解决速率失真优化问题。例如,这些方法可以基于对所有编码选项的广泛测试,这其中包括所有考虑的模式或译码参数值,且对它们的译码成本和在译码和解码之后的重构信号的相关失真进行完整评估。还可以使用更快的方法来节省编码复杂度,特别是基于预测或预测残差信号而不是重构信号来计算近似失真。还可以使用这两种方法的混合,例如通过仅对一些可能的编码选项使用近似失真,而对其他编码选项使用完全失真。其它方法仅评估可能的编码选项的子集。更一般地,许多方法采用各种技术中的任何一种来执行所述优化,但是该优化不一定是对译码成本和相关失真这两者的完整评估。
本文描述的实现方式和方面可以在例如方法或过程、装置、软件程序、数据流或信号中实现。即使仅在单一形式的实现的上下文中被讨论(例如,仅作为方法而被讨论),所讨论的特征的实现也可以以其他形式(例如,装置或程序)来实现。例如,可以以适当的硬件、软件和固件来实现装置。所述方法可以在例如处理器中实现,所述处理器通常指处理设备,这其中包括例如计算机、微处理器、集成电路或可编程逻辑设备。处理器还包括通信设备,例如计算机、蜂窝电话、便携式/个人数字助理(“PDA”)和便于终端用户之间的信息通信的其他设备。
对“一个实施例”或“一实施例”或“一个实现方式”或“一实现方式”以及其它变化形式的提及意味着结合该实施例描述的特定特征、结构、特性等包含于至少一个实施例中。因此,在本申请中的各个地方出现的短语“在一个实施例中”或“在一实施例中”或“在一个实现方式中”或“在一实现方式中”以及任何其他变型的出现不一定都指同一实施例。
另外,本申请可以涉及“确定”各种信息。确定该信息可以包括例如以下一者或多者:估计该信息、计算该信息、预测该信息或从存储器检索该信息。
此外,本申请可以涉及“访问”各种信息。访问该信息可以包括例如以下一者或多者:接收该信息、检索该信息(例如,从存储器检索该信息)、存储该信息、移动该信息、复制该信息、计算该信息、确定该信息、预测该信息或估计该信息。
另外,本申请可以指“接收”各种信息。如同“访问”一样,接收旨在是广义的术语。接收所述信息可以包括例如以下一者或多者:访问该信息或(例如,从存储器)检索该信息。此外,在诸如存储信息、处理信息、发送信息、移动信息、复制信息、擦除信息、计算信息、确定信息、预测信息或估计信息的操作期间,通常以一种方式或另一种方式涉及“接收”。
应当理解,例如在“A/B”、“A和/或B”以及“A和B中的至少一者”的情况下,使用以下“/”、“和/或”以及“中的至少一者”中的任意者旨在涵盖仅对第一列出的选项(A)的选择、或仅对第二列出的选项(B)的选择、或对两个选项(A和B)的选择。作为进一步的示例,在“A、B和/或C”和“A、B和C中的至少一者”的情况下,这样的措词旨在包括仅选择第一个列出的选项(A)、或者仅选择第二个列出的选项(B)、或者仅选择第三个列出的选项(C)、或者仅选择第一个和第二个列出的选项(A和B)、或者仅选择第一个和第三个列出的选项(A和C)、或者仅选择第二个和第三个列出的选项(B和C)、或者选择所有三个选项(A和B和C)。如本领域和相关领域的普通技术人员所清楚的,这可以扩展到所列的多个项目。
此外,如本文所使用的,词语“信号”尤其是指向对应的解码器指示某物。例如,在某些实施例中,编码器用信号通知译码模式中的特定一个。这样,在一实施例中,在编码器侧和解码器侧使用相同的参数。因此,例如,编码器可以向解码器发送(显式地用信号发送)特定参数,使得解码器可以使用该相同的特定参数。相反,如果解码器已经具有所述特定参数以及其它参数,则可以使用信令而不进行发送(隐式地用信号发送),以简单地允许解码器知道并选择所述特定参数。通过避免任何实际功能的传输,在各种实施例中实现了比特节省。应当理解,可以以各种方式来实现信令。例如,在各种实施例中,一个或多个语法元素、标志等被用于将信息用信号发送给对应的解码器。虽然前述内容涉及词语“信号”的动词形式,但是词语“信号”在本文中也可以用作名词。
如对于本领域普通技术人员将显而易见的,实现方式可以产生被格式化以携带例如可以被存储或发送的信息的各种信号。该信息可以包括例如用于执行方法的指令,或者由所描述的实现方式之一产生的数据。例如,信号可以被格式化以携带所描述的实施例的比特流。这种信号可以被格式化为例如电磁波(例如,使用频谱的射频部分)或基带信号。所述格式化可以包括例如对数据流进行编码并且利用所编码的数据流对载波进行调制。所述信号携带的信息可以是例如模拟或数字信息。如已知的,所述信号可以通过各种不同的有线或无线链路来传输。所述信号可以存储在处理器可读介质上。
我们描述了多个实施例。这些实施例的特征可以单独提供或以任何组合提供。此外,跨越各种权利要求类别和类型,实施例可以单独或以任意组合包括以下特征、设备或方面中的一者或多者:
·TV、机顶盒、蜂窝电话、平板电脑或其他电子设备,其根据所描述的任何实施例执行运动和光照补偿、运动细化和多预测组合的适配。
·TV、机顶盒、蜂窝电话、平板电脑或其他电子设备,其根据所描述的任何实施例执行运动和光照补偿、运动细化和多预测组合的适配,并且显示(例如,使用监视器、屏幕或其他类型的显示器)所得到的图像。
·TV、机顶盒、蜂窝电话、平板电脑或其他电子设备,其调谐(例如,使用调谐器)信道以接收包括所编码的图像的信号,并且根据所描述的任何实施例执行运动和光照补偿、运动细化和多预测组合的适配。
·TV、机顶盒、蜂窝电话、平板电脑或其他电子设备,其通过空中接收(例如,使用天线)包括所编码的图像的信号,并且根据所描述的任何实施例执行运动和光照补偿、运动细化和多预测组合的适配。
根据至少一个实施例的一般方面,公开了一种解码方法,包括:
-解码当前块的参数;
-在以下条件中的一者或多者得到验证的情况下,禁用针对所述当前块的译码工具:第一译码工具被用于所述当前块,以及关于所解码的参数的给定条件得到了验证;
-否则,为所述当前块启用所述译码工具;以及
-响应于所述译码工具,对所述当前块进行解码。
根据至少一个实施例的一般方面,公开了一种编码方法,包括:
-获得当前块的参数;
-在以下条件中的一者或多者得到验证的情况下,禁用针对所述当前块的译码工具:第一译码工具被用于所述当前块,以及关于所解码的参数的给定条件得到了验证;
-否则,为所述当前块启用所述译码工具;以及
-响应于所述译码工具,对所述当前块进行编码。
根据至少一个实施例的一般方面,公开了一种解码装置,其包括一个或多个处理器,所述一个或多个处理器被配置为执行:
-解码当前块的参数;
-在以下条件中的一者或多者得到验证的情况下,禁用针对所述当前块的译码工具:第一译码工具被用于所述当前块,以及关于所解码的参数的给定条件得到了验证;
-否则,为所述当前块启用所述译码工具;以及
-响应于所述译码工具,对所述当前块进行解码。
根据至少一个实施例的一般方面,公开了一种编码装置,其包括一个或多个处理器,所述一个或多个处理器被配置为执行:
-获得当前块的参数;
-在以下条件中的一者或多者得到验证的情况下,禁用针对所述当前块的译码工具:第一译码工具被用于所述当前块,以及关于所解码的参数的给定条件得到了验证;
-否则,为所述当前块启用所述译码工具;以及
-响应于所述译码工具,对所述当前块进行编码。
在一个实施例中,在以下条件中的一者或多者被验证的情况下禁用用于所述当前块的译码工具包括:在多假设译码模式被用于当前块的情况下,禁用帧间双向预测。
在一个实施例中,在以下条件中的一者或多者条件得到验证的情况下禁用用于所述当前块的译码工具包括:在多假设译码模式被用于当前块的情况下,禁用局部光照补偿。
在一个实施例中,在以下条件中的一者或多者得到验证的情况下禁用所述当前块的译码工具包括:在多假设译码模式被用于当前块的情况下,禁用三角形分区。
在一个实施例中,在以下条件中的一者或多者得到验证的情况下禁用针对所述当前块的译码工具包括:针对小块和色度分量中的一者或多者,禁用局部光照补偿或OBMC。
在一个实施例中,在以下条件中的一者或多者得到验证的情况下禁用用于所述当前块的译码工具包括:在一般化双向预测权重不等于默认权重的情况下,禁用局部光照补偿。
在一个实施例中,在以下条件中的一者或多者得到验证的情况下禁用用于当前块的译码工具包括:在针对所述当前块启用了局部光照补偿的情况下,禁用一般化双向预测(或将一般化双向预测权重设定为默认权重)且不译码一般化双向预测索引。
在一个实施例中,在以下条件中的一者或多者得到验证的情况下禁用用于所述当前块的译码工具包括:在由局部光照补偿使用的所述当前块的相邻样本属于使用不等于默认权重的一般化双向预测权重的块的情况下,禁用局部光照补偿。
在一个实施例中,在以下条件中的一者或多者得到验证的情况下禁用所述当前块的译码工具包括:在使用局部光照补偿的情况下,禁用重叠块运动补偿。
在一个实施例中,在以下条件中的一个或多个条件得到验证的情况下禁用针对所述当前块的译码工具包括:在使用重叠块运动补偿的情况下,在权重不等于在重叠块运动补偿过程中的默认权重的情况下,禁用局部光照补偿和/或一般化双向预测。

Claims (32)

1.一种解码方法,包括:
–解码当前块的参数;
–在以下条件中的一者或多者得到验证的情况下,禁用针对所述当前块的第一译码工具:第二译码工具被用于所述当前块,以及关于所解码的参数的给定条件得到验证;
–否则,为所述当前块启用所述第一译码工具;以及
–如果所述第一译码工具被启用,则使用所述第一译码工具解码所述当前块。
2.根据权利要求1所述的方法,其中在以下条件中的一或多者得到验证的情况下禁用用于所述当前块的第一译码工具包括:在组合了帧间和帧内预测的多假设译码模式被用于所述当前块的情况下,禁用双向光流。
3.根据权利要求1所述的方法,其中在以下条件中的一者或多者得到验证的情况下禁用用于所述当前块的第一译码工具包括:如果一般化双向预测权重不等于默认权重,禁用双向光流。
4.根据权利要求1所述的方法,其中在以下条件中的一或多者得到验证的情况下禁用用于所述当前块的第一译码工具包括:如果双向光流被用于所述块,禁用解码器侧运动向量细化。
5.根据权利要求1所述的方法,其中在以下条件中的一者或多者得到验证的情况下禁用用于所述当前块的第一译码工具包含:如果组合了帧间和帧内预测的多假设译码模式被用于所述当前块,禁用帧间双向预测。
6.根据权利要求1所述的方法,其中在以下条件中的一或多者得到验证的情况下禁用用于所述当前块的第一译码工具包括:在组合了帧间和帧内预测的多假设译码模式被用于所述当前块的情况下,禁用局部光照补偿。
7.根据权利要求1所述的方法,其中在以下条件中的一或多者得到验证的情况下禁用用于所述当前块的第一译码工具包括:在组合了帧间和帧内预测的多假设译码模式被用于所述当前块的情况下,禁用三角形分区。
8.根据权利要求1所述的方法,其中在以下条件中的一或多者得到验证的情况下禁用用于所述当前块的第一译码工具包括:针对低于预定义值的当前块大小及色度分量中的一或多者,禁用局部光照补偿或重叠块运动补偿。
9.根据权利要求1所述的方法,其中在以下条件中的一者或多者得到验证的情况下禁用用于所述当前块的第一译码工具包括:在一般化双向预测权重不等于默认权重的情况下,禁用局部光照补偿。
10.根据权利要求1所述的方法,其中在以下条件中的一者或多者得到验证的情况下禁用用于所述当前块的第一译码工具包括:在针对所述当前块启用局部光照补偿的情况下,禁用重构后滤波。
11.根据权利要求1所述的方法,其中在以下条件中的一者或多者得到验证的情况下禁用用于所述当前块的第一译码工具包括:在针对所述当前块启用局部光照补偿的情况下,禁用一般化双向预测且不译码一般化双向预测索引。
12.根据权利要求1所述的方法,其中在以下条件中的一者或多者得到验证的情况下禁用用于所述当前块的第一译码工具包括:在由局部光照补偿使用的所述当前块的相邻样本属于使用不等于默认权重的一般化双向预测权重的块的情况下,禁用局部光照补偿。
13.根据权利要求1所述的方法,其中在以下条件中的一者或多者得到验证的情况下针对所述当前块禁用第一译码工具包括:在局部光照补偿被使用的情况下,禁用重叠块运动补偿。
14.根据权利要求1所述的方法,其中在以下条件中的一或多者得到验证的情况下禁用用于所述当前块的第一译码工具包括:在使用重叠块运动补偿的情况下,在权重不等于重叠块运动补偿过程中的默认权重的情况下,禁用局部光照补偿和/或一般化双向预测。
15.一种编码方法,包括:
–获得当前块的参数;
–在以下条件中的一者或多者得到验证的情况下,禁用针对所述当前块的第一译码工具:第二译码工具被用于所述当前块,以及关于所述参数的给定条件得到了验证;
–否则,为所述当前块启用所述第一译码工具;以及
–如果所述第一译码工具被启用,则使用第一译码工具来编码所述当前块。
16.根据权利要求15所述的方法,其中在以下条件中的一或多者得到验证的情况下禁用用于所述当前块的第一译码工具包括:在组合了帧间和帧内预测的多假设译码模式被用于所述当前块的情况下,禁用双向光流。
17.根据权利要求15所述的方法,其中在以下条件中的一者或多者得到验证的情况下禁用用于所述当前块的第一译码工具包括:在一般化双向预测权重不等于默认权重的情况下,禁用双向光流。
18.根据权利要求15所述的方法,其中在以下条件中的一者或多者得到验证的情况下禁用用于所述当前块的第一译码工具包括:在双向光流被用于所述块的情况下,禁用解码器侧运动向量细化。
19.根据权利要求15所述的方法,其中在以下条件中的一者或多者得到验证的情况下禁用用于所述当前块的第一译码工具包括:在组合了帧间和帧内预测的多假设译码模式被用于所述当前块的情况下,禁用帧间双向预测。
20.根据权利要求15所述的方法,其中在以下条件中的一者或多者得到验证的情况下禁用用于所述当前块的第一译码工具包括:在组合了帧间和帧内预测的多假设译码模式被用于所述当前块的情况下,禁用局部光照补偿。
21.根据权利要求15所述的方法,其中在以下条件中的一者或多者得到验证的情况下禁用用于所述当前块的第一译码工具包括:在组合了帧间和帧内预测的多假设译码模式被用于所述当前块的情况下,禁用三角形分区。
22.根据权利要求15所述的方法,其中在以下条件中的一者或多者得到验证的情况下禁用用于所述当前块的第一译码工具包括:针对当前块大小低于预定义值和色度分量中的一者或多者,禁用局部光照补偿或OBMC。
23.根据权利要求15所述的方法,其中在以下条件中的一者或多者得到验证的情况下禁用用于所述当前块的第一译码工具包括:在一般化双向预测权重不等于默认权重的情况下,禁用局部光照补偿。
24.根据权利要求15所述的方法,其中在以下条件中的一者或多者得到验证的情况下禁用用于所述当前块的第一译码工具包括:在由局部光照补偿使用的所述当前块的相邻样本属于使用不等于默认权重的一般化双向预测权重的块的情况下,禁用局部光照补偿。
25.根据权利要求15所述的方法,其中在以下条件中的一者或多者得到验证的情况下针对所述当前块禁用第一译码工具包括:在局部光照补偿被使用的情况下,禁用重叠块运动补偿。
26.根据权利要求15所述的方法,其中在以下条件中的一或多者得到验证的情况下禁用用于所述当前块的第一译码工具包括:在重叠块运动补偿被使用的情况下,在权重不等于重叠块运动补偿过程中的默认权重的情况下,禁用局部光照补偿和/或一般化双向预测。
27.一种解码装置,包括一个或多个处理器,所述一个或多个处理器被配置为执行:
–解码当前块的参数;
–在以下条件中的一者或多者得到验证的情况下,禁用针对所述当前块的第一译码工具:第二译码工具被用于所述当前块,以及关于所解码的参数的给定条件得到了验证;
–否则,为所述当前块启用所述第一译码工具;以及
–如果所述第一译码工具被启用,则使用所述第一译码工具解码所述当前块。
28.一种编码装置,其包括被配置以执行以下操作的一或多个处理器:
–获得当前块的参数;
–在以下条件中的一者或多者得到验证的情况下,禁用针对所述当前块的第一译码工具:第二译码工具被用于所述当前块,以及关于所述参数的给定条件得到了验证;
–否则,为所述当前块启用所述第一译码工具;以及
–如果所述第一译码工具被启用,则使用所述第一译码工具来编码所述当前块。
29.根据权利要求1或15所述的方法,其中在以下条件中的一者或多者得到验证的情况下禁用用于所述当前块的第一译码工具包括:如果块大小低于预定义值,禁用一般化双向预测或将一般化双向预测权重设定为默认权重。
30.一种信号,包括根据权利要求15至26和权利要求29中任意项所述的编码方法或者由根据权利要求28所述的编码装置生成的数据。
31.一种计算机程序,包括用于实现根据权利要求1至26中任意项或根据权利要求29所述的方法的程序代码指令。
32.信息存储装置,存储用于实现根据权利要求1至26中任意项或根据权利要求29所述的方法的程序代码指令。
CN201980076913.2A 2018-11-21 2019-11-15 用于图片编码和解码的方法和设备 Pending CN113170146A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
EP18306535.8 2018-11-21
EP18306535.8A EP3657794A1 (en) 2018-11-21 2018-11-21 Method and device for picture encoding and decoding
EP18306765 2018-12-20
EP18306765.1 2018-12-20
EP19305183.6 2019-02-14
EP19305183 2019-02-14
PCT/US2019/061658 WO2020106564A2 (en) 2018-11-21 2019-11-15 Method and device for picture encoding and decoding

Publications (1)

Publication Number Publication Date
CN113170146A true CN113170146A (zh) 2021-07-23

Family

ID=68766854

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980076913.2A Pending CN113170146A (zh) 2018-11-21 2019-11-15 用于图片编码和解码的方法和设备

Country Status (7)

Country Link
US (1) US20220021869A1 (zh)
EP (1) EP3884671A2 (zh)
JP (1) JP2022509962A (zh)
KR (1) KR20210091304A (zh)
CN (1) CN113170146A (zh)
BR (1) BR112021008108A2 (zh)
WO (1) WO2020106564A2 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020084509A1 (en) 2018-10-23 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Harmonized local illumination compensation and modified inter coding tools
WO2020084507A1 (en) 2018-10-23 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Harmonized local illumination compensation and modified inter prediction coding
MX2021008389A (es) 2019-01-09 2023-01-27 Beijing Dajia Internet Information Tech Co Ltd Sistema y metodo para mejorar la inter e intraprediccion combinada.
CN113302918A (zh) * 2019-01-15 2021-08-24 北京字节跳动网络技术有限公司 视频编解码中的加权预测
CN113316933A (zh) 2019-01-17 2021-08-27 北京字节跳动网络技术有限公司 使用运动预测进行去方块滤波
KR20210118188A (ko) * 2019-03-15 2021-09-29 엘지전자 주식회사 Bdof 기반의 인터 예측 방법 및 장치
KR102624093B1 (ko) * 2019-03-22 2024-01-12 엘지전자 주식회사 Dmvr 기반의 인터 예측 방법 및 장치
CN115699736A (zh) * 2020-06-03 2023-02-03 北京达佳互联信息技术有限公司 具有运动矢量细化的几何分区模式
WO2023055147A1 (ko) * 2021-09-29 2023-04-06 주식회사 윌러스표준기술연구소 Mhp(multi-hypothesis prediction)모드에 기초한 비디오 신호 처리 방법 및 이를 위한 장치

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004066634A1 (en) * 2003-01-20 2004-08-05 Koninklijke Philips Electronics N.V. Video coding
US20140023138A1 (en) * 2012-07-20 2014-01-23 Qualcomm Incorporated Reusing parameter sets for video coding
US20150189323A1 (en) * 2014-01-02 2015-07-02 Mediatek Singapore Pte. Ltd. Method of Three-Dimensional and Multiview Video Coding Using a Disparity Vector
WO2016057938A1 (en) * 2014-10-09 2016-04-14 Qualcomm Incorporated Intra block copy prediction restrictions for parallel processing
WO2018171796A1 (en) * 2017-03-24 2018-09-27 Mediatek Inc. Method and apparatus of bi-directional optical flow for overlapped block motion compensation in video coding
CN108781289A (zh) * 2016-03-22 2018-11-09 高通股份有限公司 针对视频译码工具的受约束块层级优化和用信号发送

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10158884B2 (en) * 2014-03-19 2018-12-18 Qualcomm Incorporated Simplified merge list construction process for 3D-HEVC
BR112017004886A2 (pt) * 2014-09-12 2017-12-05 Vid Scale Inc dispositivo de codificação de vídeo e método de codificação de vídeo
US9967577B2 (en) * 2015-08-31 2018-05-08 Microsoft Technology Licensing, Llc Acceleration interface for video decoding
CN110574374B (zh) * 2017-04-28 2022-02-25 夏普株式会社 图像解码装置
WO2019238008A1 (en) * 2018-06-11 2019-12-19 Mediatek Inc. Method and apparatus of bi-directional optical flow for video coding
JP7146086B2 (ja) * 2018-11-12 2022-10-03 北京字節跳動網絡技術有限公司 インター予測のためのバンド幅制御方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004066634A1 (en) * 2003-01-20 2004-08-05 Koninklijke Philips Electronics N.V. Video coding
US20140023138A1 (en) * 2012-07-20 2014-01-23 Qualcomm Incorporated Reusing parameter sets for video coding
US20150189323A1 (en) * 2014-01-02 2015-07-02 Mediatek Singapore Pte. Ltd. Method of Three-Dimensional and Multiview Video Coding Using a Disparity Vector
WO2016057938A1 (en) * 2014-10-09 2016-04-14 Qualcomm Incorporated Intra block copy prediction restrictions for parallel processing
CN106797479A (zh) * 2014-10-09 2017-05-31 高通股份有限公司 对于并行处理的帧内块复制预测限制
CN108781289A (zh) * 2016-03-22 2018-11-09 高通股份有限公司 针对视频译码工具的受约束块层级优化和用信号发送
WO2018171796A1 (en) * 2017-03-24 2018-09-27 Mediatek Inc. Method and apparatus of bi-directional optical flow for overlapped block motion compensation in video coding

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHIH-WEI HSU等: "Description of SDR video coding technology proposal by MediaTek", 《JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 10TH MEETING: SAN DIEGO, US, 10–20 APR. 2018, JVET-J0018》, pages 2 *
KIYOFUMI ABE等: "CE4-related: Low pipeline latency LIC", 《JOINT VIDEO EXPLORATION TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 12TH MEETING: MACAO, CN, 03–12 OCT. 2018, JVET-L0120》, pages 2 - 3 *

Also Published As

Publication number Publication date
EP3884671A2 (en) 2021-09-29
BR112021008108A2 (pt) 2021-08-03
KR20210091304A (ko) 2021-07-21
WO2020106564A2 (en) 2020-05-28
WO2020106564A3 (en) 2020-08-20
US20220021869A1 (en) 2022-01-20
JP2022509962A (ja) 2022-01-25

Similar Documents

Publication Publication Date Title
EP3657794A1 (en) Method and device for picture encoding and decoding
CN113170146A (zh) 用于图片编码和解码的方法和设备
CN113273209A (zh) Mmvd和smvd与运动和预测模型的组合
US20220038684A1 (en) Multi-reference line intra prediction and most probable mode
US20230164314A1 (en) Method and apparatus for deblocking an image
AU2019354653B2 (en) Generalized bi-prediction and weighted prediction
US11962753B2 (en) Method and device of video coding using local illumination compensation (LIC) groups
US20230232037A1 (en) Unified process and syntax for generalized prediction in video coding/decoding
CN112740674A (zh) 使用双预测进行视频编码和解码的方法和装置
US11936871B2 (en) Method and device for picture encoding and decoding using illumination compensation
CN114208194A (zh) 用于视频编码和解码的帧间预测参数推导
KR20220052991A (ko) 스위칭가능한 보간 필터들
JP2022537222A (ja) 局所照明補正フラグインヘリタンス
EP3991428A1 (en) Hmvc for affine and sbtmvp motion vector prediction modes
CN114073093A (zh) 三角形分割的合并索引的信令通知
CN117280684A (zh) 具有可切换内插滤波器的几何分区
CN117597933A (zh) 空间局部光照补偿

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination