CN108141588A - 图像编码系统中的帧间预测方法和装置 - Google Patents
图像编码系统中的帧间预测方法和装置 Download PDFInfo
- Publication number
- CN108141588A CN108141588A CN201680055921.5A CN201680055921A CN108141588A CN 108141588 A CN108141588 A CN 108141588A CN 201680055921 A CN201680055921 A CN 201680055921A CN 108141588 A CN108141588 A CN 108141588A
- Authority
- CN
- China
- Prior art keywords
- candidate
- motion vector
- motion vectors
- reference picture
- motion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/109—Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/573—Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/58—Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
由根据本发明的解码装置执行的帧间预测方法包括以下步骤:通过比特流来接收与MVD相关联的信息;基于当前块的相邻块来导出候选运动信息列表;基于所述候选运动信息列表来导出所述当前块的MVP;基于所述MVP和所述MVD来导出所述当前块的运动向量;以及基于所述运动向量来生成针对所述当前块的预测样本。根据本发明,可以在基于相邻块导出的候选运动信息列表的基础上来导出运动向量。因此,可以减少预测模式信息的数据量,并且可以提高帧间预测准确性和整体编码效率。
Description
技术领域
本发明涉及图像编码技术,并且更具体地,涉及图像编码系统中的帧间预测方法和设备。
背景技术
各领域中对诸如HD(高清晰度)图像和UHD(超高清晰度)图像这样的高分辨率、高质量图像的需求不断增加。随着图像数据具有高分辨率和高质量,相对于传统图像数据而言,要发送的信息或比特的量增加。因此,当使用诸如常规有线/无线宽带线这样的介质发送图像数据或者使用现有存储介质存储图像数据时,其传输成本和存储成本增加。
因此,需要高效率的图像压缩技术来有效地发送、存储和再现高分辨率和高质量图像的信息。
发明内容
技术目的
本发明的一个目的在于提供一种用于提高图像编码效率的方法和设备。
本发明的另一目的在于提供一种用于提高帧间预测效率的方法和设备。
本发明的又一目的在于提供一种用于基于经修改帧间预测模式来有效地导出运动向量的方法和设备。
本发明的又一目的在于提供一种用于导出包括在运动信息候选列表中的双向预测候选以导出运动向量的方法和设备。
本发明的又一目的在于提供一种用于通过使用基于相邻块导出的运动信息候选列表来导出更准确的运动向量的方法和设备。
技术方案
在本发明的一个总体方面,提供了一种由解码装置执行的帧间预测方法。该方法包括:通过比特流来接收与运动向量差(MVD)相关联的信息;基于当前块的相邻块来导出候选运动信息列表;基于所述候选运动信息列表来导出所述当前块的运动向量预测因子(MVP);基于所述MVP和所述MVD来导出所述当前块的运动向量;以及基于所述运动向量来生成针对所述当前块的预测样本。
在本发明的另一总体方面,提供了一种用于执行帧间预测的解码设备。该解码设备包括:熵解码器,其被配置为通过比特流来接收关于运动向量差(MVD)的信息;以及预测器,其被配置为基于当前块的相邻块来导出候选运动信息列表,基于所述候选运动信息列表来导出所述当前块的运动向量预测因子(MVP),基于所述MVP和所述MVD来导出所述当前块的运动向量,并且基于所述运动向量来生成针对所述当前块的预测样本。
在本发明的又一总体方面,提供了一种由编码设备执行的视频编码方法。该方法包括:基于当前块的相邻块来导出运动信息候选列表;基于所述运动信息候选列表来确定所述当前块的运动向量预测因子(MVP);基于所述MVP来导出所述当前块的运动向量;基于所述运动向量来生成针对所述当前块的预测样本;以及对指示所述帧间预测模式的预测模式信息进行编码,并且输出经编码的所述预测模式信息。
在本发明的又一总体方面,提供了一种视频编码设备。该编码设备包括:预测器,其被配置为基于当前块的相邻块来导出运动信息候选列表,基于所述运动信息候选列表来确定所述当前块的运动向量预测因子(MVP),基于所述MVP来导出所述当前块的运动向量,并且基于所述运动向量来生成针对所述当前块的预测样本;以及熵编码器,其被配置为对指示所述帧间预测模式的预测模式信息进行编码,并且输出经编码的所述预测模式信息。
技术效果
根据本发明,可以在基于相邻块导出的运动候选列表的基础上来导出运动向量,从而减少指示帧间预测模式的预测模式信息的数据量并提高整体编码效率。
根据本发明,提供了用于导出双向预测候选以导出运动向量的各种方法,从而实现准确的帧间预测并提高整体编码效率。
附图说明
图1是示意性地例示根据本发明的实施方式的视频编码设备的框图。
图2是示意性地例示根据本发明的实施方式的视频解码设备的框图。
图3示出了配置合并模式的运动向量预测因子(motion vector predictor,MVP)候选列表的示例。
图4示出了导出L1运动向量的示例。
图5示出了由解码设备来导出L1参考图片的示例。
图6示出了由解码设备来导出L1运动向量的示例。
图7示意性地示出了由编码设备执行的视频编码方法。
图8示意性地例示了根据本发明的由解码装置执行的视频解码方法。
具体实施方式
本发明可以以各种形式进行修改,并且将在附图中描述和说明本发明的具体实施方式。然而,这些实施方式并不旨在限制本发明。以下描述中使用的术语仅用于描述具体实施方式,而不旨在限制本发明。单数表达包括复数表达,只要它被明显不同地读出即可。诸如“包括”和“具有”这样的术语旨在指示存在以下描述中所使用的特征、数量、步骤、操作、元件、组件或其组合,因此应当理解,不排除存在或添加一个或更多个不同特征、数量、步骤、操作、元件、组件或其组合的可能性。
另一方面,出于便于解释图像编码/解码设备中的不同特定功能的目的,独立地绘制了本发明中描述的附图中的元件,而并不意味着这些元件由独立的硬件或独立的软件来具体实现。例如,可以将这些元件中的两个或更多个元件组合以形成单个元件,或者可以将一个元件划分成多个元件。在不脱离本发明的构思的情况下,将元件组合和/或划分的实施方式属于本发明。
以下,将参照附图来详细描述本发明的示例性实施方式。
图1是示意性地例示根据本发明的实施方式的视频编码设备的框图。
参照图1,视频编码设备100包括图片分割器105、预测器110、变换器120、量化器125、重新排列器130、熵编码器135、去量化器140、逆变换器145、滤波器155和存储器160。
图片分割器105可以被配置为将输入图片分成至少一个处理单元块。就此而言,作为处理单元的块可以是预测单元PU、变换单元TU或编码单元CU。图片可以由多个编码树单元CTU组成。每个CTU可以按照四叉树结构来分成CU。CU可以按照四叉树结构来分成具有更深深度的CU。可以从CU获得PU和TU。例如,PU可以从CU被分割成对称或不对称的方形结构。另外,TU可以从CU被分成四叉树结构。
如稍后将描述的,预测器110包括执行帧间预测处理的帧间预测单元和执行帧内预测处理的帧内预测单元。预测器110对由图片分割器105划分的图片的处理单元执行预测处理,以创建包括预测样本或预测样本阵列的预测块。在预测器110中,图片的处理单元可以是CU、TU或PU。预测器110可以确定对相应处理单元执行的预测是帧间预测还是帧内预测,并且可以确定具体细节,例如,预测方法的预测模式。经过预测处理的处理单元可以不同于确定预测方法和具体细节的处理单元。例如,可以以PU为单位来确定预测方法和预测模式,而可以以TU为单位来执行预测处理。
在帧间预测中,可以基于针对当前图片的先前图片和/或后续图片中的至少一个的信息来执行预测处理以创建预测块。在帧内预测中,可以基于当前图片的像素信息来执行预测处理以创建预测块。
作为帧间预测方法,可以使用跳过模式、合并模式和高级运动向量预测(AMVP)。在帧间预测中,可以选择用于PU的参考图片,并且可以选择与PU对应的参考块。可以在整数像素(或样本)或分数像素(或样本)的基础上来选择参考块。然后,按照使针对PU的残差信号最小化并且也使运动向量幅度最小化的方式来生成预测块。
预测块可以被生成为整数像素单元,或者被生成为诸如1/2像素单元或1/4像素单元这样的分数像素单元。就此而言,运动向量也可以被表达为分数像素单元。
诸如经由帧间预测选择的参考图片的索引、运动向量差MVD、运动向量预测因子MVP、残差信号等这样的信息可以被熵编码,然后被发送给解码设备。当应用跳过模式时,预测块可以用作重构块,使得可以不生成、变换、量化或发送残差。
当执行帧内预测时,可以以PU为单位来确定预测模式,并且可以以PU为单位来执行预测处理。另选地,可以以PU为单位来确定预测模式,并且可以以TU为单位来执行帧间预测。
作为示例,帧内预测中的预测模式可以包括33种定向预测模式和至少两种不定向模式。不定向模式可以包括DC预测模式和平面模式。
在帧内预测中,可以在将滤波器应用于参考样本之后配置预测块。此时,可以根据帧内预测模式和/或当前块的大小来确定是否应将滤波器应用于参考样本。
将所构建的预测块与原始块之间的残差值(残差块或残差信号)输入到变换器120。将用于预测的预测模式信息、运动向量信息等与残差值一起通过熵编码器135来进行编码并发送给解码设备。
变换器120以TU为单位来对残差块执行变换处理并且生成变换系数。
变换块是样本的矩形块,并且是应用了相同变换的块。变换块可以是TU并且可以具有四叉树结构。
变换器120可以根据应用于残差块的预测模式和块的大小来执行变换处理。
例如,当将帧内预测应用于残差块并且残差块具有4×4阵列时,利用离散正弦变换DST来变换残差块。否则,可以利用离散余弦变换DCT来变换残差块。
变换器120可以通过变换来构建变换系数的变换块。
量化器125可以量化由变换器120变换的残差值(即,变换系数),并且可以创建量化系数。由量化器125计算的值可以被提供给去量化器140和重新排列器130。
重新排列器130可以重新排列从量化器125提供的变换系数。通过重新排列量化系数,可以增强熵编码器135中的编码效率。
重新排列器130可以通过使用系数扫描方法来将二维块形式的量化变换系数重新排列为一维向量的形式。
熵编码器135可以被配置为根据基于由重新排列器130重新排列的量化变换值或在编码处理期间计算的编码参数值等的概率分布来对符号进行熵编码,然后输出比特流。熵编码方法是接收具有各种值的符号并且将符号表达为可以在去除其统计冗余的同时进行解码的二进制串的方法。
就此而言,符号意指待编码/解码的语法元素、编码参数、残差信号值等。编码参数是编码和解码所必需的。编码参数可以包含可以在编码或解码期间推断的信息、以及在编码设备中编码并且传递到解码设备的信息(例如,语法元素)。编码参数是编码或解码图像所需的信息。编码参数可以包括诸如(例如)帧内/帧间预测模式、移动/运动向量、参考图片索引、编码块图案、是否存在残差信号、变换系数、量化后的变换系数、量化参数、块大小、块分割信息等这样的统计量或值。另外,残差信号可以意指原始信号与预测信号之间的差。另外,原始信号与预测信号之间的差可以被变换以定义残差信号,或者原始信号与预测信号之间的差可以被变换和量化以定义残差信号。残差信号在块单元中可以被称为残差块,并且在样本单元中可以被称为残差样本。
当应用熵编码时,符号可以被表达为使得将少量比特分配给具有高发生概率的符号,并且将大量比特分配给具有低发生概率的符号。这可以减小用于待编码符号的比特串的大小。因此,可以经由熵编码来增大图像编码的压缩性能。
诸如指数哥伦布(Golomb)、上下文自适应可变长度编码(CAVLC)和上下文自适应二进制算术编码(CABAC)这样的编码方案可以用于熵编码。例如,熵编码器135可以在其中存储用于执行熵编码的表,例如,可变长度编码/代码(VLC)表。熵编码器135可以使用所存储的VLC表来执行熵编码。另外,熵编码器135导出对应符号的二值化方法和对应符号/二进制(bin)的概率模型,然后使用所导出的二值化方法或概率模型来执行熵编码。
如果需要,熵编码器135可以对要发送的参数集或语法给予预定改变。
去量化器140对由量化器125量化的值变换系数进行去量化。逆变换器145对由去量化器140去量化的值进行逆变换。
由去量化器140和逆变换器145生成的残差值、残差样本或残差样本阵列以及由预测器110预测的预测块可以被组合以形成包括重构样本或重构样本阵列的重构块。
在图1中,通过加法器来将残差块和预测块相加以创建重构块。此时,加法器可被认为是生成重构块的特定单元重构块创建单元。
滤波器155将去块滤波器、ALF自适应环路滤波器、SAO样本自适应偏移应用于重构图片。
去块滤波器去除在重构图片中的块之间的边界处生成的块失真。ALF基于原始图片与由去块滤波器对块进行滤波的重构图片的比较结果值来执行滤波处理。可以仅在需要高效率时应用ALF。SAO重构具有应用了去块滤波器的残差块与原始图片之间的偏移差,并且以带偏移、边缘偏移等的形式来应用SAO。
此外,滤波器单元155可以不对用于帧间预测的重构块应用滤波。
存储器160可以存储由滤波器155计算的重构块或图片。存储在存储器160中的重构块或图片可以被提供给执行帧间预测的预测器110。
图2是示意性地例示根据本发明的实施方式的视频解码设备的框图。参照图2,视频解码设备200可以包括熵解码器210、重新排列器215、去量化器220、逆变换器225、预测器230、滤波器235和存储器240。
当从视频编码设备输入视频比特流时,可以基于视频编码设备处理视频信息的顺序来解码所输入的比特流。
熵解码器210可以根据概率分布来对所输入的比特流进行熵解码以生成量化系数形式的符号。熵解码方法是接收二进制数序列并使用该序列生成每个符号的方法。熵解码方法类似于上述熵编码方法。
例如,当诸如CAVLC这样的可变长度编码VLC(以下,称为“VLC”)用于在视频编码设备中执行熵编码时,熵解码器210可以使用与编码设备中所使用的编码设备相同的VLC表来执行解码。另外,当CABAC用于在视频编码设备中执行熵编码时,熵解码器210可以使用CABAC来执行熵解码。
更具体地,CABAC熵解码方法可以包括:接收与比特流中的每个语法元素对应的二进制,使用待解码语法元素信息来确定上下文模型,解码相邻块和待解码块的信息或者先前步骤中解码的符号/二进制的信息,以及根据所确定的上下文模型来预测二进制的发生概率,从而执行二进制的算术解码以生成与每个语法元素的值对应的符号。就此而言,在确定上下文模型之后,CABAC熵解码方法还可以包括使用经解码的符号/二进制的信息来更新上下文模型以确定下一个符号/二进制的上下文模型的步骤。
可以将由熵解码器210解码的信息中的用于构建预测块的信息提供给预测器230,并且可以将由熵解码器210熵解码的残差值(即,量化后的变换系数)输入到重新排列器215。
重新排列器215可以基于视频编码设备中的重新排列方法来重新排列由熵解码器210熵解码的比特流信息(即,量化后的变换系数)。
重新排列器215可以将以一维向量的形式表达的系数重构并重新排列为二维块形式的系数。重新排列器215可以基于应用于当前块、变换块的预测模式和变换块的大小来扫描系数,并且可以以二维块的形式创建系数量化变换系数阵列。
去量化器220可以基于从视频编码设备提供的量化参数和重新排列块的系数值来执行去量化。
逆变换器225可以对来自视频编码设备的量化结果执行已经由视频编码设备的变换器执行的DCT和/或DST的逆DCT和/或逆DST。
可以基于由视频编码设备确定的图片的传送单元或分割单元来执行逆变换。视频编码设备的变换器可以根据诸如预测方法、当前块的大小和预测方向这样的多条信息来选择性地执行DCT和/或DST,并且视频解码设备的逆变换器225可以基于关于由视频编码设备的变换器执行的变换的变换信息来执行逆变换。
预测器230基于由熵解码器210提供的预测块生成相关信息和从存储器240提供的先前解码块和/或图片信息来生成包括预测样本或预测样本阵列的预测块。
如果针对当前PU的预测模式是帧内预测模式,则预测器230可以执行帧内预测以基于当前图片中的像素信息来生成预测块。
如果针对当前PU的预测模式是帧间预测模式,则预测器230可以被配置为基于包括在当前图片的先前图片或后续图片的至少一个图片中的信息来对当前PU执行帧间预测。就此而言,可以经由检查从编码设备接收的跳过标志和合并标志来推断关于在视频编码设备中提供的当前PU的帧间预测所需的运动信息的信息,例如,运动向量和参考图片索引。
预测器230可以生成预测块,使得在对当前图片执行帧间预测时相对于当前块的残差信号被最小化并且运动向量大小被最小化。
另一方面,可以根据当前块的预测模式来改变运动信息导出方法。应用于帧间预测的预测模式可以包括高级运动向量预测(AMVP)模式、合并模式等。
例如,当应用合并模式时,编码设备和解码设备可以使用重构的空间相邻块的运动向量和/或与作为时间相邻块的Col块对应的运动向量来生成合并候选列表。在合并模式中,在合并候选列表中选择的候选块的运动向量用作当前块的运动向量。编码设备可以将指示具有从包括在合并候选列表中的候选块中选择的最优运动向量的候选块的合并索引发送给解码设备。在这种情况下,解码设备可以使用合并索引来导出当前块的运动向量。
在另一示例中,当应用AMVP(高级运动向量预测)模式时,编码设备和解码设备使用重构的空间相邻块的运动向量和/或与作为时间相邻块的Col块对应的运动向量来生成运动向量预测因子候选列表。也就是说,重构的空间相邻块的运动向量和/或与作为时间相邻块的Col块对应的运动向量可以用作运动向量候选。编码设备可以向解码设备发送预测运动向量索引,该预测运动向量索引指示从包括在运动向量预测因子候选列表中的运动向量候选中选择的最优运动向量。就此而言,解码设备可以使用运动向量索引从包括在运动向量候选列表中的运动向量候选中选择当前块的预测运动向量。
编码设备可以获得当前块的运动向量与运动向量预测因子(MVP)之间的运动向量差MVD,对MVD进行编码,并且将经编码的MVD发送给解码设备。也就是说,MVD可以是通过从当前块的运动向量(MV)中减去运动向量预测因子(MVP)而获得的值。就此而言,解码设备可以解码接收到的运动向量差,并且经由将经解码的运动向量差与运动向量预测因子相加来导出当前块的运动向量。
另外,编码设备可以将指示参考图片的参考图片索引发送给解码设备。
解码设备可以使用相邻块的运动信息来预测当前块的运动向量,并且使用从编码设备接收的残差来导出当前块的运动向量。解码设备可以基于导出的运动向量和从编码设备接收的参考图片索引信息来生成当前块的预测块。
在另一示例中,当应用合并模式时,编码设备和解码设备可以使用重构相邻块的运动信息和/或Col块的运动信息来生成合并候选列表。也就是说,当存在重构相邻块的运动信息和/或Col块的运动信息时,编码设备和解码设备可以将这种信息用作当前块的合并候选。
编码设备可以将包括在合并候选列表中的合并候选当中的能够提供最优编码效率的合并候选选择为当前块的运动信息。在这种情况下,指示所选择的合并候选的合并索引可以被包括在比特流中并被发送给解码设备。解码设备可以通过使用所发送的合并索引来选择包括在合并候选列表中的合并候选之一,并且将所选择的合并候选确定为当前块的运动信息。因此,当应用合并模式时,与重构相邻块和/或Col块对应的运动信息可以被完整地用作当前块的运动信息。解码设备可以通过将预测块和从编码设备发送的残差相加来重构当前块。
在上述AMVP和合并模式中,重构相邻块的运动信息和/或Col块的运动信息可以用于导出当前块的运动信息。
在作为用于图片间预测的其它模式之一的跳过模式中,相邻块信息可以照原样用于当前块。因此,在跳过模式的情况下,除了指示哪个块的运动信息用作当前块的运动信息的信息之外,编码设备不向解码设备发送诸如残差这样的语法信息。
通过基于导出的运动信息对当前块执行运动补偿,编码设备和解码设备可以生成当前块的预测块。预测块可以指示作为当前块的运动补偿的结果而生成的运动补偿块。另外,多个运动补偿块可以形成单个运动补偿图像。
可以使用由预测器230生成的预测块和由逆变换器225提供的残差块来生成重构块。图2例示了使用加法器来将预测块和残差块组合以生成重构块。就此而言,加法器可以被视为配置为生成重构块的单独元件(重构块生成器)。就此而言,重构块包括如上所述的重构样本或重构样本阵列;预测块包括预测样本或预测样本阵列;残差块可以包括残差样本或残差样本阵列。因此,重构样本或重构样本阵列可以被认为是通过将对应的预测样本或预测样本阵列与对应的残差样本或残差样本阵列组合来生成的。
当跳过模式用于块时,可以不发送残差信号,并且预测块可以用作重构块。
可以将重构块和/或图片提供给滤波器235。滤波器235可以对重构块和/或图片执行去块滤波操作、SAO操作和/或ALF操作。
存储器240可以存储重构图片或块以用作参考图片或参考块,并且可以将重构图片提供给输出单元。
包括在解码设备200中的熵解码器210、重新排列器215、去量化器220、逆变换器225、预测器230、滤波器235和存储器240当中的与解码图像直接有关的元件(例如,熵解码器210、重新排列器215、去量化器220、逆变换器225、预测器230、滤波器235等)可以被表达为与其它元件区分开的解码器或解码模块。
另外,解码设备200还可以包括图中未例示的解析器,该解析器解析与包括在比特流中的编码图像有关的信息。解析器可以包括熵解码器210,并且可以被包括在熵解码器210中。这种解析器也可以被实现为解码模块的元件。
如上所述,导出在帧间预测模式中编码的当前块的运动向量的方法可以被分类为使用与当前块相邻的块的运动向量的模式、以及通过接收关于当前块的运动向量的附加信息(例如,MVD)来更准确地导出当前块的运动向量的模式。具体地,导出当前块的运动向量的方法可以是合并模式、AMVP模式等。在合并模式中,与AMVP模式相比,减少了关于帧间预测模式的附加信息,但是在这种情况下,可能会降低预测性能,因此可能会增加残差样本的数据量。此外,在AMVP模式的情况下,与合并模式相比,执行了更准确的运动预测,从而增大预测性能:然而,与合并模式相比,需要发送附加信息。
本发明提出了在提高帧间预测性能的同时使用附加信息的经修改帧间预测模式。如果应用了经修改帧间预测模式,则与AMVP模式相比,可以减少附加信息的数据量,并且与合并模式相比,可以执行更准确的预测,从而减少残差样本的数据量。结果,可以提高整体编码效率。
本发明提供一种诱导当前块的相邻块的运动信息并且基于该运动信息导出用于经修改帧间预测模式的运动信息候选列表的方法以及一种用于基于运动信息候选列表来导出当前块的运动向量的方法。
图3示出了在合并模式中配置用于导出运动信息的候选列表的示例。参照图3,可以基于当前块的相邻块来导出用于导出当前块的运动信息的候选列表。使用基于相邻块导出的候选当中的至少一个候选,可以导出根据本发明的用于经修改帧间预测模式的运动信息候选列表。合并模式中的候选列表可以由当前块的空间相邻块的运动信息组成,可以由当前块的时间相邻块(例如,图3中所示的T0或T1)的运动信息组成,或者可以通过组合上述相邻块的运动信息或包括零向量来组成。相邻块的运动信息可以被导出为用于配置当前块的运动信息候选列表的临时候选。临时候选可以是双向预测候选或者L0或L1预测运动向量候选。L0或L1预测运动向量候选可以是单向预测候选。双向预测候选各自均可以包括L0运动向量和L1运动向量,并且单向预测候选各自均可以包括L0运动向量和L1运动向量中的一个。L1运动向量指示用于L1预测的运动向量。L0指示参考图片列表L0(列表0),L1指示参考图片列表L1(列表1)。具体地,当相邻块的运动信息是双向预测信息时,运动信息可以包括L0参考图片索引、与L0参考图片相关联的运动向量、L1参考图片索引、以及与L1参考图片索引相关联的运动向量。相邻块的双向预测信息可以被导出为当前块的(双向预测)候选。
当相邻块的运动信息是单向预测信息时,运动信息可以包括L0参考图片索引和与L0参考图片相关联的运动向量、或者L1参考图片索引和与L1参考图片相关联的运动向量。在这种情况下,L0参考图片指示包括在参考图片列表L0中的参考图片当中的特定参考图片。在这种情况下,特定参考图片可以是指示包括在参考图片列表L0中的参考图片当中的与L0运动向量相关联的参考图片索引(L0参考图片索引)的参考图片。此外,L1参考图片指示包括在图片列表L1中的参考图片当中的特定参考图片。在这种情况下,特定参考图片可以是指示包括在参考图片列表L1中的参考图片当中的与L1运动向量相关联的参考图片索引(L1参考图片索引)的参考图片。
不同于AMVP模式,合并模式中的候选列表重新使用相邻块的相同运动信息,因此,固定对应相邻块的单向预测/双向预测信息和参考图片索引并将其用于当前块,因此,可能难以导出针对当前块的最佳运动向量(MV)或运动向量预测因子(MVP)。在本发明中,可以将临时候选当中的单向预测候选诱导为双向预测候选,并且可以通过调整单向预测候选的参考图片索引来导出与单向预测候选对应的双向预测候选。使用包括对应双向预测候选的经修改帧间预测模式的运动信息候选列表,可以获得更适合于当前块的MV或MVP。
基于相邻块导出的临时候选(临时候选列表)可以被呈现为如下表1所示。
[表1]
pred_idc | refldx(L0) | refldx(L1) | |
A1 | 双向 | 0 | 1 |
B1 | 单向 | 0 | - |
B0 | 单向 | 1 | - |
A0 | 双向 | 0 | 0 |
T0 | 单向 | 1 | - |
在这种情况下,A1、B2、B0、A0和T0指示当前块的空间或时间相邻块。Pred_idc指示单向预测/双向预测类型,refIdx(L0)指示L0参考图片索引,以及refIdx(L1)指示L1参考图片索引。当临时候选如表1所示时,可以导出与单向预测候选B1、B0和T0对应的双向预测候选。
例如,可以基于作为单向预测候选的B1的L0图片索引和/或L0运动向量来诱导L1参考图片索引和/或L1运动向量。
具体地,例如,L1参考图片索引可以被设置或固定为0。
在另一示例中,L1参考图片索引可以被导出为具有与B1的L0参考图片索引相同的POCDiff(即,图片顺序号(POC)差)的L1参考图片索引。换句话说,包括在具有以下POC差的参考图片列表L1中的参考图片可以被导出为L1参考图片索引:该POC差等同于与L0运动向量相关联的参考图片的POC和包括在参考图片列表L0中的参考图片当中的当前图片的POC之间的差。例如,当前图片的POC是10并且具有POC为9、7和6的参考图片按照递减顺序来被包括在参考图片列表内,并且在这种情况下,L0参考图片索引0可以指示具有POC为8的参考图片。如果具有POC为11、12和13的参考图片按照递增顺序来被包括在参考图片列表L1内,则根据上述示例,具有POCDiff2的POC为12的参考图片可以被确定为L1参考图片,并且在这种情况下,L1参考图片索引可以被设置为1。
在又一示例中,L1参考图片索引可以被导出为与包括在临时候选中的L1参考图片索引值当中的最小值相同的值。另选地,L1参考图片索引可以被导出为包括在临时候选中的L1参考图片索引值当中的最概然值。
此外,可以通过缩放包括在单向预测候选中的L0(或L1)运动向量来导出L1(或L0)运动向量。以下,将示例性地描述当L0运动向量被包括在单向预测候选中时获得L1运动向量的方法,并且将通过仅改变L0和L1并按照类似方式来描述当L1运动向量被包括在单向预测候选中时获得L0运动向量的方法。
图4示出了导出L1运动向量的示例。参照图4,假设包括在当前候选块(例如,B1)中的对象以相同的梯度移动,并且在这种情况下,可以在L1方向上缩放L0运动向量。也就是说,可以通过将公式应用于L0运动向量来导出L1运动向量。L1运动向量可以基于以下公式导出:
[式1]
MV(L1)==-MV(L0)
其中,MV(L1)表示L1运动向量,以及MV(L0)表示L0运动向量。
此外,当关于L0参考图片的POCDiff和关于L1参考图片的POCDiff不同时,L1运动向量可以与参考图片的距离比(即,POCDiff)成比例地缩放。例如,在当前图片与L0参考图片之间的POCDiff为1并且L1参考图片与当前图片之间的POCDiff为2时,L1运动向量可以被缩放为比L0运动向量大两倍。
另外,可以基于包括在临时候选中的L1运动向量来导出代表值(即,基于L1运动向量导出的代表性L1运动向量),并且该代表值可以被导出为B1的L1运动向量。具体地,包括在临时候选中的L1运动向量中的最概然向量可以被导出为代表值,并且包括在临时候选中的L1运动向量的平均值可以被导出为代表值,并且包括在临时候选中的L1运动向量的中值可以被导出为代表值。
另外,可以导出临时候选当中所包括的除了当前候选(即,基于L0运动向量导出的代表性L0运动向量)之外的候选中的L0运动向量的代表值,并且可以在L1方向上缩放该代表值以导出B1的L1运动向量。具体地,L0运动向量的代表值可以被导出为最概然运动向量、L0运动向量的平均值或L0运动向量的中值,并且可以在L1方向上缩放该代表值以导出B1的L1运动向量。
根据上述方法,可以基于单向预测候选(即,包括表1中的B1、B0和T0的运动信息的单向预测候选)来导出双向预测候选。可以用与单向预测候选对应的双向预测候选替换从临时候选当中导出的预先预测候选,以导出当前块的运动信息候选列表。运动信息候选列表可以被呈现为如下表2所示。
[表2]
候选索引 | 候选块 | pred_idc | refldx(L0) | refldx(L1) |
1 | A1 | 双向 | 0 | 1 |
2 | B1 | 双向 | 0 | 0 |
3 | B0 | 双向 | 1 | 0 |
4 | A0 | 双向 | 0 | 0 |
5 | T0 | 双向 | 1 | 0 |
在这种情况下,候选索引是指示每个运动信息候选列表的每个候选的运动信息候选索引。运动信息可以包括运动向量和参考图片索引。在上述示例中,具有运动信息候选索引值为2、3和5的候选对应于用双向预测候选替换的候选。
另外,除了临时候选之外的包括所导出的双向预测候选的候选可以被导出为当前块的运动信息候选列表。运动信息候选列表可以被呈现为如下表3所示。
[表3]
候选索引 | 候选块 | pred_idc | refldx(L0) | refldx(L1) |
1 | A1 | 双向 | 0 | 1 |
2 | B1 | 单向 | 0 | - |
3 | B0 | 单向 | 1 | - |
4 | A0 | 双向 | 0 | 0 |
5 | T0 | 单向 | 1 | - |
6 | B1 | 双向 | 0 | 0 |
7 | B0 | 双向 | 1 | 0 |
8 | T0 | 双向 | 1 | 0 |
在这种情况下,呈现了还包括具有运动信息候选索引值6、7和8的候选的双向预测候选。运动信息候选的索引顺序是示例性的并且可以改变。
此外,解码设备例如可以通过以下方法使用单元预测候选(或单元预测运动信息)来导出双向预测候选(或双向预测运动信息)。以下,基于单向预测候选包括L0运动信息(L0运动向量和/或L0参考图片索引)的情况来提供描述,并且在单向预测候选包括L1运动信息(L1运动因子和/或L1参考图片索引)的情况下,该方法可以通过仅改变L0和L1来实现。
图5示出了通过解码设备来导出L1参考图片的示例。参照图5,可以将临时候选中的单向预测候选导出为双向预测候选,并且可以导出包括双向预测候选的当前块的运动信息候选列表。该方法可以用作导出L1参考图片索引的方法。
另外,当单向预测候选的运动向量(例如,运动向量)是L0运动向量时,解码设备可以导出指示参考图片的参考图片列表L1的参考图片索引,该参考图片包括具有基于L0运动向量和与L0运动向量相关联的L0参考图片索引而导出的参考块与由作为L0运动向量在L1方向上的缩放结果而导出的L0运动向量指示的参考块之间的最小差(即,绝对差之和(SAD))的参考块。换句话说,可以在参考图片列表上导出参考图片,在该参考图片中,由L0运动向量指示的参考区域和由作为L0运动向量的缩放结果而导出的L1运动向量指示的参考区域由于相位而在样本之间具有最小差(即,残差)。
图6示出了由解码设备导出L1运动向量的示例。在导出与单向预测候选对应的双向预测候选的情况下,当单向预测候选的运动向量是L0运动向量时,可以经由上述方法来导出L1运动向量。
另外,经由上述方法,解码设备可以导出L1运动向量候选,并且将L1运动向量候选当中的以下L1运动向量候选导出为L1运动向量:该L1运动向量候选具有由L1运动向量候选指示的参考区域与由L0运动向量指示的参考区域之间的最小残差。
另外,经由上述方法,解码设备可以导出L1运动向量候选,并且基于单向预测候选来导出与L1运动向量相关联的L1参考图片索引,以对由参考图片索引指示的参考图片设置随机搜索范围。通过在搜索范围内基于L1运动向量候选来执行运动向量搜索,解码设备可以将具有针对由L0运动向量指示的参考区域的最小残差的L1运动向量候选导出为L1运动向量。
另外,可以通过组合导出L1运动向量的上述方法来生成L1运动向量,并且示例性导出过程如下。
当临时候选中的单向预测候选的运动向量(例如,前述运动向量)是L0运动向量时,可以通过在L1方向上缩放L0运动向量来导出L1运动向量候选。另外,L1运动向量候选可以被导出为临时候选当中的除了单向预测候选以外的候选的L1运动向量的代表值。可以通过从临时候选当中导出除了单向预测候选以外的L0运动向量的代表值并且在L1方向上对具有代表值的运动向量进行缩放来导出L1运动向量候选。可以基于L1运动向量候选来导出L1运动向量。例如,可以将指示L1运动向量候选所指示的参考区域当中的具有针对由L0运动向量指示的参考区域的最小残差的参考区域的L1运动向量候选导出为L1运动向量。另外,可以对由与基于单向预测候选导出的L1运动向量相关联的参考图片索引指示的参考图片设置随机搜索范围。通过在搜索范围内基于L1运动向量候选来执行运动向量搜索,可以将具有针对由L0运动向量指示的参考区域的最小残差的L1运动向量候选导出为L1运动向量。
当经由以上方法应用当前模式的经修改帧间预测模式时,编码设备可以生成指示是否应用经修改帧间预测模式的标志,并且可以将该标志发送给解码设备。例如,该标志可以被称为使用新模式标志、梳状模式平台等。另选地,现有合并标志可以用帧间模式类型索引信息来替换,并且当帧间模式类型索引信息的值为0时,其可以指示合并模式,并且当该值为1时,其指示AMVP模式,并且当该值为2时,其可以指示根据本发明的经修改帧间预测模式。
另外,当使用上述方法导出运动信息候选列表时,编码设备可以导出包括在运动信息候选列表中的特定候选,并且基于特定候选来导出当前块的运动向量。另外,编码设备可以生成指示特定候选的索引,并且将索引发送给解码设备。解码设备可以导出运动信息候选列表,通过接收指示特定候选的索引来导出特定候选,并且基于特定候选来导出当前块的运动向量。索引可以被称为新模式索引、运动向量索引或MVP索引。可以使用如下表4所示的语法来发送使用新模式标志和新模式索引。
[表4]
参照表4,use_new_mode_flag语法元素可以对应于新模式标志。另外,new_mode_idx语法元素可以对应于新模式索引。为了减少新模式标志的开销,可以根据图片类型、CU大小和深度来选择性地适配新模式标志。具体地,仅当图片类型是B图片类型时才可以对新模式标志进行编码,并且仅当CU尺寸小于32×32时才可以对新模式标志进行编码。
此外,解码设备可以导出特定候选而不需要接收新模式索引。解码设备可以基于相邻块来导出临时候选,导出与临时候选中的单向预测候选对应的双向预测候选,并导出包括双向预测候选的运动信息候选列表。解码设备可以将运动信息候选列表的双向预测候选当中的以下双向预测候选导出为当前块的MVP:该双向预测候选具有L0参考图片上的由L0运动向量指示的参考区域与L1参考图片上的由L1运动向量指示的参考区域之间的最小残差。在这种情况下,可以在解码处理期间导出MVP,编码设备可以不发送指示特定候选的索引(新模式索引)。未发送新模式索引的情况可以被呈现在下表5中。
[表5]
参照表5,new_mode_idx语法元素对应于新模式索引,但未被发送。
此外,基于单向预测候选导出双向预测候选的上述方法仅描述了L0运动信息被包括在单向预测候选中的情况,但这仅仅是示例性的,并且该方法可以将事件应用于L1运动信息被包括在单向预测候选中的情况。
图7示意性地示出了由编码设备执行的视频编码方法。图7中所示的方法可以由图1中所示的编码设备执行。例如,步骤S700至S730可以由编码设备的预测器执行,并且步骤S740可以由编码设备的熵编码器执行。
在S700中,编码设备基于当前块的相邻块来导出当前块的运动信息候选列表。编码设备可以基于相邻块来导出临时候选。临时候选可以是双向预测候选,或者可以是L0或L1预测运动向量候选。L0或L1预测运动向量候选可以是单向预测候选。单向预测候选可以与第一运动向量相关联,并且双向预测候选可以与第一运动向量和第二运动向量相关联。第一运动向量可以包括L0运动向量或L1运动向量,并且双向预测候选各自均可以包括L0运动向量和L1运动向量二者。L0运动向量可以指示关于L0预测的运动向量,并且L1运动向量可以指示关于L1预测的运动向量。L0指示参考图片列表L0(列表0),并且L1指示参考图片列表L1(列表1)。L1运动向量可以具有与L0运动向量的方向相反的方向。
编码设备可以基于临时候选中的单向预测候选来导出双向预测候选。当L0运动向量对应于第一运动向量时,编码装置可以导出包括在第二运动向量中的L1运动向量和与第二运动向量相关联的L1参考图片索引。
在一示例中,编码设备可以将与第二运动向量相关联的L1参考图片索引设置或固定为1。
在另一示例中,与第二运动向量相关联的L1参考图片索引可以被导出为指示参考图片列表L1中所包括的参考图片当中的针对当前图片具有特定POC差的L1参考图片的参考图片索引。特定POC差可以是等同于当前图片和参考图片列表L0中所包括的参考图片当中的与第一运动向量相关联的L0参考图片之间的POC差的值。
在又一示例中,与第二运动向量相关联的L1参考图片索引可以被导出为具有与包括在临时候选中的L1参考图片索引的值当中的最小值相同的值的图片索引。
在又一示例中,与第二运动向量相关联的L1参考图片索引可以被导出为具有包括在临时候选中的L1参考图片索引的值当中的最概然值的参考图片索引。
此外,包括在第二运动向量中的L1运动向量可以通过在L1方向上缩放L0运动向量来导出。在这种情况下,可以使用上式1来执行缩放。
在一示例中,编码设备可以通过基于第一差和第二差缩放L0运动向量来导出L1运动向量。第一差指示当前图片的图片顺序号(POC)和参考图片列表L0中所包括的参考图片当中的与L0运动向量相关联的L0参考图片的POC之间的差,并且第二差指示当前图片的POC与参考图片列表L1中所包括的L1参考图片的POC之间的差。
在又一示例中,可以基于临时候选当中的其它候选的L1运动向量来导出包括在第二运动向量中的L1运动向量。编码设备可以导出包括在临时候选中的L1运动向量的代表值,并且基于该代表值来导出L1运动向量。代表值可以是以下之一:包括在临时候选中的L1运动向量当中的最概然向量;包括在临时候选中的L1运动向量的平均值;以及包括在临时候选中的L1运动向量的中值。
在又一示例中,可以基于临时候选中的除了第一运动向量之外的L0运动向量来导出包括在第二运动向量中的L1运动向量。编码设备可以通过导出除了第一运动向量之外的L0运动向量的代表值并且在L1方向上对该代表值进行缩放来导出L1运动向量。代表值可以是以下之一:L0运动向量当中的除了第一运动向量之外的最概然运动向量;包括在临时候选中的L0运动向量的平均值;以及包括在临时候选中的L0运动向量的中值。
在又一示例中,编码设备可以通过组合上述导出方法来导出包括在第二运动向量中的L1运动向量。
此外,例如,编码设备可以通过用与单向预测候选对应的双向预测候选替换临时候选中的单向预测候选来导出运动信息候选列表。在这种情况下,运动信息候选列表可以与上表2相同。
在另一示例中,编码设备可以通过包括临时候选并且附加地包括与单向预测候选对应的双向预测候选来导出运动信息候选列表。在这种情况下,运动候选列表可以与上表3相同。
此外,当L1运动向量对应于第一运动向量时,编码设备可以导出包括在第二运动向量中的L0运动向量和与第二运动向量相关联的参考图片索引。
例如,编码设备可以将与第二运动向量相关联的L0参考图片索引设置或固定为0。
在另一示例中,与第二运动向量相关联的L0参考图片索引可以被导出为指示包括在参考图片列表L0中的参考图片当中的针对当前图片的POC差是特定POC差的L0参考图片。特定POC差可以是等同于当前图片和包括在参考图片列表L1中的参考图片当中的与第一运动向量相关联的L1参考图片之间的POC差的值。
在又一示例中,与第二运动向量相关联的L0参考图片索引可以被导出为具有与包括在临时候选中的L0参考图片索引的值当中的最小值相同的值的参考图片索引。
在又一示例中,与第二运动向量相关联的L0参考图片索引可以被导出为具有包括在临时候选中的L0参考图片索引的值当中的最概然值的参考图片索引。
此外,可以通过在L0方向上缩放L1运动向量来导出包括在第二运动向量中的L0运动向量。在这种情况下,可以使用上式1来执行缩放。
在一个示例中,编码设备可以通过基于第一差和第二差缩放L1运动向量来导出L0运动向量。第一差指示当前图片的POC与包括在参考图片列表L1中的参考图片当中的与L1运动向量相关联的L1参考图片的POC之间的差,并且第二差指示包括在参考图片列表L0中的L0参考图片的POC与当前图片的POC之间的差。
在另一示例中,可以基于临时候选当中的其它候选的L0运动向量来导出包括在第二运动向量中的L0运动向量。编码设备可以导出包括在临时候选中的L0运动向量的代表值,并且基于该代表值导出L0运动向量。代表值可以是以下之一:包括在临时候选中的L0运动向量当中的最概然运动向量;包括在临时候选中的L0运动向量的平均值;以及包括在临时候选中的L0运动向量的中值。
另外,可以基于临时候选中的除了第一运动向量之外的L1运动向量来导出包括在第二运动向量中的L0运动向量。编码设备可以通过导出除了第一运动向量之外的L1运动向量的代表值并且在L0方向上对该代表值进行缩放来导出L0运动向量。代表值可以是以下之一:L1运动向量当中的除了第一运动向量之外的最概然运动向量;包括在临时候选中的L1运动向量的平均值;以及包括在临时候选中的L1运动向量的中值。
在另一示例中,编码设备可以通过组合上述导出方法来导出包括在第二运动向量中的L0运动向量。
此外,在一示例中,编码设备可以通过用与单向预测候选对应的双向预测候选替换临时候选中的单向预测候选来导出运动信息候选列表。
在另一示例中,编码设备可以通过包括临时候选并且附加地包括与单向预测候选对应的双向预测候选来导出运动信息候选列表。
在S710中,编码设备基于运动信息候选列表来确定当前块的运动向量预测因子(MVP)。编码设备可以通过从当前块的运动信息候选列表中选择一个候选来导出MVP。编码设备可以生成指示所选择的候选的索引信息。该索引信息可被称为新模式索引、运动向量索引或MVP索引。
在S720中,编码设备基于MVP导出当前块的运动向量。编码设备可以基于MVP导出运动向量,并且基于运动向量与MVP之间的差来计算当前块的运动向量差(MVD)。
在S730中,编码设备基于运动向量来生成当前块的预测样本。编码设备可以获取关于由运动向量指示的参考图片的预测样本值,并且生成预测样本。
在S1340中,编码设备可以编码并输出指示帧间预测模式的预测模式信息。编码设备可以对指示在基于相邻块导出的运动信息候选列表的基础上导出当前块的运动向量的经修改帧间预测模式的预测模式信息进行熵编码,并且可以以比特流的形式输出熵编码预测模式信息。另外,编码设备可以生成并编码指示是否应用经修改帧间预测模式的标志,并且可以以比特流的形式输出该标志。例如,该标志可以被称为使用新模式标志、梳状模式标志等。另选地,现有合并标志可以用帧间模式类型索引信息替换,并且当帧间模式类型索引信息的值为0时,其可以指示合并模式,当该值为1时,其可以指示AMVP模式,并且当该值为2时,其可以指示根据本发明的经修改帧间预测模式。
另外,编码设备可以生成并编码指示包括在运动信息候选列表中的候选的新模式索引,并且以比特流的形式输出新模式索引。另外,编码设备可以编码当前块的MVD以发送关于MVD的信息。可以以比特流的形式将预测模式信息、新模式索引和MVD发送给解码设备。可以经由网络或存储介质来将比特流发送给解码设备。
尽管附图中未例示,但是编码设备可以编码并输出关于当前块的残差样本的信息。关于残差样本的信息可以包括关于残差样本的变换系数。
图8示意性地示出了由根据本发明的解码装置执行的视频解码方法。图8中所示的方法以由图8中所示的解码设备来执行。具体地,例如,图8中的步骤S800可以由编码设备的熵解码器执行,并且步骤S810至S840可以由解码设备的预测器执行。
在S800中,解码设备通过比特流来接收运动向量差(MVD)。关于MVD的信息可以通过比特流来接收。解码设备可以通过熵解码来接收关于MVD的信息。在这种情况下,解码设备可以通过不同的语法元素来接收关于MVD的X轴分量的信息和关于MVD的Y轴分量的信息。
在S810中,解码设备可以基于当前块的相邻块来导出运动信息候选列表。解码设备可以基于相邻块来导出临时候选。临时候选可以是双向预测候选,或者可以是L0或L1预测运动向量候选。L0或L1预测运动向量候选各自均可以是单向预测候选。单向预测候选可以与第一运动向量相关联,并且双向预测候选可以与第一运动向量和第二运动向量相关联。第一运动向量可以包括L0运动向量或L1运动向量,并且双向预测候选各自均可以包括L0运动向量和L1运动向量。L0运动向量指示关于L0预测的运动向量,并且L1运动向量指示关于L1预测的运动向量。L0指示参考图片列表L0(列表0),并且L1指示参考图片列表(列表1)。L1运动向量可以具有与L0运动向量的方向相反的方向。
解码设备可以基于临时候选当中的单向预测候选来导出双向预测候选。当L0运动向量对应于第一运动向量时,解码装置可以导出包括在第二运动向量中的L1运动向量和与第二运动向量相关联的L1参考图片索引。
在一示例中,解码设备可以将与第二运动向量相关联的L1参考图片索引设置或固定为0。
在另一示例中,与第二运动向量相关联的L1参考图片索引可以被导出为指示针对当前图片具有特定POC差的L1参考图片的参考图片索引。特定POC差可以是等同于当前图片和包括在参考图片列表L0中的参考图片当中的与第一运动向量相关联的L0参考图片之间的POC差的值。
在又一示例中,与第二运动向量相关联的L1参考图片索引可以被导出为具有与包括在临时候选中的L1参考图片索引的值当中的最小值相同的值的参考图片索引。
在又一示例中,与第二运动向量相关联的L1参考图片索引可以被导出为具有包括在临时候选中的L1参考图片索引的值当中的最概然值的参考图片索引。
在又一示例中,与第二运动向量相关联的L1参考图片索引可以被导出为指示L1参考图片的参考图片索引,该L1参考图片具有包括在参考图片列表L1中的所有参考图片当中的由第二运动向量指示的参考区域与由第一运动向量指示的参考区域之间的最小残差。
此外,可以通过在L1方向上缩放L0运动向量来导出包括在第二运动向量中的L1运动向量。在这种情况下,可以使用上式1来执行缩放。
在一示例中,解码设备可以通过基于第一差和第二差缩放L0运动向量来导出L1运动向量。第一差指示当前图片的POC和包括在参考图片列表L0中的参考图片当中的与L0运动向量相关联的L0参考图片的POC之间的差,并且第二差指示包括在参考图片列表L1中的参考图片的POC与当前图片的POC之间的差。
在又一示例中,可以基于临时候选当中的其它候选的L1运动向量来导出包括在第二运动向量中的L1运动向量。解码设备可以导出包括在临时候选中的L1运动向量的代表值,并且基于该代表值导出L1运动向量。代表值可以是以下之一:包括在临时候选中的L1运动向量当中的最概然运动向量;包括在临时候选中的L1运动向量的平均值;以及包括在临时候选中的L1运动向量的中值。
例如,可以基于临时候选当中的除了第一运动向量之外的L0运动向量来导出包括在第二运动向量中的L1运动向量。解码设备可以通过导出除了第一运动向量之外的L0运动向量的代表值并且在L1方向上对该代表值进行缩放来导出L1运动向量。代表值可以是以下之一:除了第一运动向量之外的L0运动向量当中的最概然运动向量;包括在临时候选中的L0运动向量的平均值;以及包括在临时候选中的L0运动向量的中值。
在另一示例中,解码设备可以通过组合上述导出方法来导出包括在第二运动向量中的L1运动向量。在这种情况下,解码设备可以使用上述导出方法来导出L1运动向量,并且将指示针对由L1运动向量当中的第一运动向量指示的参考区域具有最小残差的参考区域的L1运动向量导出为第二运动向量。另外,解码设备可以使用上述导出方法导出L1运动向量,并且设置由与第二运动向量相关联的L1参考图片索引指示的参考图片的随机搜索范围。接下来,通过在L1运动向量的搜索范围内执行运动搜索,解码设备可以将指示针对由第一运动向量指示的参考区域具有最小残差的参考区域的L1运动向量导出为第二运动向量。
此外,在一示例中,解码设备可以通过用与单向预测候选对应的双向预测候选替换临时候选中的单向预测候选来导出运动信息候选列表。在这种情况下,运动信息候选列表可以与上表2相同。
在另一示例中,解码设备可以通过包括临时候选并且附加地包括与单向预测候选对应的双向预测候选来导出运动信息列表。在这种情况下,运动信息候选列表可以与上表3相同。
此外,当L1运动向量对应于第一运动向量时,解码设备可以导出包括在第二运动向量中的L0运动向量和与第二运动向量相关联的参考图片索引。
例如,解码设备可以将与第二运动向量相关联的L0参考图片索引设置或固定为0。
在另一示例中,与第二运动向量相关联的参考图片索引可以被导出为指示包括在参考图片列表L0中的参考图片当中的L1参考图片的参考图片索引,该L1参考图片的针对当前POC的POC差是特定POC。该特定POC差可以等同于包括在参考图片列表L1中的参考图片当中的与第一运动向量相关联的L1参考图片的POC值的值。
在又一示例中,与第二运动向量相关联的L0参考图片索引可以被导出为具有与包括在临时候选中的L0参考索引的值当中的最小值相同的值的参考图片索引。
在又一示例中,与第二运动向量相关联的L0参考图片索引可以被导出为具有包括在临时候选中的L0参考图片索引的值当中的最概然值的参考图片索引。
在又一示例中,与第二运动向量相关联的L0参考图片索引可以被导出为指示包括在参考图片列表L0中的所有参考图片当中的具有由第二运动向量指示的参考区域与由第一运动向量指示的参考区域之间的最小残差的L1参考图片的参考图片索引。
此外,可以通过在L0方向上缩放L1运动向量来导出包括在第二运动向量中的L0运动向量。在这种情况下,可以使用上式1来执行缩放。
在一示例中,解码设备可以通过基于第一差和第二差缩放L1运动向量来导出L0运动向量。第一差指示当前图片的图片顺序号(POC)和参考图片列表L1中所包括的参考图片当中的与L1运动向量相关联的L1参考图片的POC之间的差,并且第二差指示当前图片的POC与包括在参考图片列表L0中的L0参考图片的POC之间的差。
在又一示例中,可以基于临时候选当中的其它候选的L0运动向量来导出包括在第二运动向量中的L0运动向量。编码设备可以导出包括在临时候选中的L0运动向量的代表值,并且基于该代表值导出L0运动向量。代表值可以是以下之一:包括在临时候选中的L0运动向量当中的最概然向量;包括在临时候选中的L0运动向量的平均值;以及包括在临时候选中的L0运动向量的中值。
在又一示例中,可以基于临时候选中的除了第一运动向量之外的L1运动向量来导出包括在第二运动向量中的L0运动向量。编码设备可以通过导出除了第一运动向量之外的L1运动向量的代表值并且在L0方向上缩放该代表值来导出L0运动向量。代表值可以是以下之一:L1运动向量当中的除了第一运动向量之外的最概然向量;包括在临时候选中的L1运动向量的平均值;以及包括在临时候选中的L1运动向量的中值。
在另一示例中,解码设备可以通过组合上述导出方法来导出包括在第二运动向量中的L0运动向量。在这种情况下,解码设备可以使用上述导出方法导出L0运动向量,并且将指示针对由L0运动向量当中的第一运动向量指示的参考区域具有最小残差的参考区域的L0运动向量导出为第二运动向量。另外,解码设备可以使用上述导出方法导出L0运动向量,并且设置由与第二运动向量相关联的L0参考画面索引指示的参考画面的随机搜索范围。接下来,通过在L0运动向量的搜索范围内执行运动搜索,解码设备可以将指示针对由第一运动向量指示的参考区域具有最小残差的参考区域的L0运动向量导出为第二运动向量。
此外,在一示例中,解码设备可以通过用与单向预测候选对应的双向预测候选替换临时候选中的单向预测候选来导出运动信息候选列表。
在另一示例中,解码设备可以通过包括临时候选并且附加地包括与单向预测候选对应的双向预测候选来导出运动信息列表。
在S820中,解码设备基于运动信息候选列表来导出当前块的MVP。解码设备可以通过比特流来获取指示来自于运动信息候选列表中的特定候选的索引信息。该索引信息可以被称为新模式索引、运动向量索引或MVP索引。解码设备可以基于由新模式索引指示的特定候选来导出当前块的MVP。该MVP可以是双向预测候选或单向预测候选。
此外,解码设备可以基于运动信息候选列表来导出当前块的MVP,而不需要接收新模式索引。解码设备可以基于包括在运动信息候选列表中的双向预测候选当中的双向预测运动信息候选来导出MVP,该双向预测运动信息候选具有L0参考图片上的由L0运动向量指示的第一参考区域与L1参考图片上的由L1方向运动向量指示的第二参考区域之间的最小残差。
在S830中,解码设备基于MVP和MVD来导出当前块的运动向量。解码设备可以通过将MVP和MVD相加来生成当前块的运动向量。
在S840中,解码设备基于当前块的运动向量来生成当前块的预测样本。解码设备可以获取关于由运动向量指示的参考图片的预测样本值,并且生成预测样本。
解码设备可以基于预测值来生成当前样本的重构样本。解码设备可以从接收自编码设备的比特流中获取残差信号,并且生成当前样本的残差样本。在这种情况下,解码设备可以基于预测样本和残差样本来生成重构样本。解码设备可以基于重构样本来生成重构图片。
根据本发明的以上描述,可以在基于相邻块导出的运动信息候选列表的基础上导出运动向量,从而减少指示帧间预测模式的预测模式信息的数据量并提高整体编码效率。
另外,根据本发明,提供了用于导出双向预测候选以导出运动向量的各种方法,从而能够实现更准确的帧间预测并提高整体编码效率。
在上述实施方式中,基于使用一系列步骤或块的流程图来描述了方法,但是本发明不受限于步骤的顺序。某些步骤可能会同时发生或以与上述步骤不同的顺序发生。另外,本领域技术人员将理解,序列图中例示的步骤不是排他性的,在不影响本发明的范围的情况下,可以包括其它步骤,或者可以删除流程图中的一个或更多个步骤。
以上描述的根据本发明的方法可以用软件来实现。根据本发明的编码设备和/或解码设备可以被包括在执行图像处理的设备中,例如,用于TV、计算机、智能电话、机顶盒或显示设备。
当用软件来实现本发明的实施方式时,可以通过执行上述功能的模块(进程、函数等)来实现上述方法。这些模块可以被存储在存储器中并由处理器执行。存储器可位于处理器的内部或外部,并且存储器可以使用各种公知手段来联接至处理器。处理器可以包括专用集成电路(ASIC)、其它芯片组、逻辑电路和/或数据处理器件。存储器可以包括ROM(只读存储器)、RAM(随机存取存储器)、闪存、存储卡、存储介质和/或其它存储设备。
Claims (15)
1.一种由解码装置执行的帧间预测方法,该方法包括以下步骤:
通过比特流来接收与运动向量差MVD相关联的信息;
基于当前块的相邻块来导出候选运动信息列表;
基于所述候选运动信息列表来导出所述当前块的运动向量预测因子MVP;
基于所述MVP和所述MVD来导出所述当前块的运动向量;以及
基于所述运动向量来生成针对所述当前块的预测样本。
2.根据权利要求1所述的方法,
其中,基于所述当前块的相邻块来导出运动信息候选列表的步骤包括:
基于所述相邻块来导出临时候选;
基于所述临时候选当中的单向预测候选来导出双向预测候选;以及
基于所述双向预测候选来导出所述当前块的所述运动信息候选列表,并且
其中,所述单向预测候选与第一运动向量相关联,并且所述双向预测候选与所述第一运动向量和第二运动向量相关联,并且
其中,所述第一运动向量包括L0运动向量或L1运动向量,并且所述第一运动向量和所述第二运动向量包括所述L0运动向量和所述L1运动向量二者。
3.根据权利要求2所述的方法,其中,所述L1运动向量具有与所述L0运动向量的方向相反的方向。
4.根据权利要求2所述的方法,其中,当所述L0运动向量对应于所述第一运动向量时,包括在所述第二运动向量中的所述L1运动向量是通过在L1方向上缩放所述L0运动向量来导出的。
5.根据权利要求4所述的方法,
其中,所述L1运动向量是通过基于第一差和第二差缩放所述L0运动向量来导出的,
其中,所述第一差指示当前图片的图片顺序号POC和包括在参考图片列表L0中的参考图片当中的与所述L0运动向量相关联的L0参考图片的POC之间的差,并且
其中,所述第二差指示包括在参考图片列表L1中的L1参考图片的POC与所述当前图片的POC之间的差。
6.根据权利要求2所述的方法,
其中,当所述L0运动向量对应于所述第一运动向量时,与所述第二运动向量相关联的L1参考图片索引指示包括在参考图片列表L1中的参考图片当中的针对当前图片的POC差是特定POC差的L1参考图片,并且
其中,所述特定POC差等同于所述当前图片的POC和包括在所述参考图片列表L0中的参考图片当中的与所述第一运动向量相关联的L0参考图片的POC之间的POC差。
7.根据权利要求2所述的方法,其中,当所述L0运动向量对应于所述第一运动向量时,与所述第二运动因子相关联的L1参考图片索引的值被导出为与包括在所述临时候选中的L1参考图片索引的值当中的最小值相同的值。
8.根据权利要求2所述的方法,其中,当所述L0运动向量对应于所述第一运动向量时,与所述第二运动向量相关联的L1参考图片索引的值被导出为包括在所述临时候选中的L1参考图片索引的值当中的最概然值。
9.根据权利要求2所述的方法,其中,与所述第二运动向量相关联的参考图片索引的值指示第二参考图片,所述第二参考图片具有第一参考图片上的由所述第一运动向量指示的第一参考区域与第二图片上的由第二运动向量指示的第二参考区域之间的最小残差。
10.根据权利要求2所述的方法,其中,所述MVP是基于包括在所述运动信息候选列表中的双向预测候选当中的具有L0参考图片上的由L0运动向量指示的第一参考区域与L1参考图片上的由L1运动向量指示的第二参考区域之间的最小残差的双向预测运动信息候选来导出的。
11.根据权利要求2所述的方法,其中,当所述L0运动向量对应于所述第一运动向量时,包括在所述第二运动向量中的L1运动向量是基于包括在所述临时候选中的L1运动向量来导出的。
12.根据权利要求2所述的方法,其中,当所述L0运动向量对应于所述第一运动向量时,包括在所述第二运动向量中的L1运动向量是通过在L1方向上缩放基于所述临时候选中的除了所述第一运动向量之外的L0运动向量而导出的L0运动向量来导出的。
13.根据权利要求2所述的方法,其中,所述运动信息候选列表是通过用与所述单向预测候选对应的所述双向预测候选替换所述临时候选当中的所述单向预测候选来导出的。
14.根据权利要求2所述的方法,其中,所述运动信息候选列表包括所述临时候选,并且还包括与所述单向预测候选对应的所述双向预测候选。
15.一种由编码设备执行的帧间预测方法,该方法包括以下步骤:
基于当前块的相邻块来导出运动信息候选列表;
基于所述运动信息候选列表来确定所述当前块的运动向量预测因子MVP;
基于所述MVP来导出所述当前块的运动向量;
基于所述运动向量来生成针对所述当前块的预测样本;以及
对指示所述帧间预测模式的预测模式信息进行编码,并且输出经编码的所述预测模式信息。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562222790P | 2015-09-24 | 2015-09-24 | |
US62/222,790 | 2015-09-24 | ||
PCT/KR2016/009410 WO2017052081A1 (ko) | 2015-09-24 | 2016-08-25 | 영상 코딩 시스템에서 인터 예측 방법 및 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108141588A true CN108141588A (zh) | 2018-06-08 |
Family
ID=58386166
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680055921.5A Pending CN108141588A (zh) | 2015-09-24 | 2016-08-25 | 图像编码系统中的帧间预测方法和装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10575011B2 (zh) |
EP (1) | EP3355578B1 (zh) |
KR (1) | KR20180048736A (zh) |
CN (1) | CN108141588A (zh) |
WO (1) | WO2017052081A1 (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020057556A1 (zh) * | 2018-09-20 | 2020-03-26 | 杭州海康威视数字技术股份有限公司 | 运动信息候选者列表构建方法、装置及可读存储介质 |
CN111247805A (zh) * | 2018-09-12 | 2020-06-05 | Lg电子株式会社 | 在图像编码系统中基于以子块为单元进行的运动预测的图像解码方法和设备 |
CN111418206A (zh) * | 2018-10-05 | 2020-07-14 | Lg电子株式会社 | 使用mpm列表的基于帧内预测的视频编码方法及其装置 |
CN111418212A (zh) * | 2018-07-13 | 2020-07-14 | Lg电子株式会社 | 基于图像编码系统中的仿射运动预测的图像解码方法和设备 |
CN111903123A (zh) * | 2018-07-02 | 2020-11-06 | Lg电子株式会社 | 基于帧间预测模式的图像处理方法和用于该方法的装置 |
CN112544083A (zh) * | 2019-01-28 | 2021-03-23 | 株式会社 Xris | 图像信号编码/解码方法及用于其的装置 |
CN112740671A (zh) * | 2018-09-18 | 2021-04-30 | 韩国电子通信研究院 | 图像编码/解码方法和装置以及存储比特流的记录介质 |
CN112866720A (zh) * | 2018-07-02 | 2021-05-28 | 华为技术有限公司 | 一种运动矢量预测方法、装置与编解码器 |
CN112956195A (zh) * | 2018-09-25 | 2021-06-11 | 数字洞察力有限公司 | 用于基于帧间模式对图像进行编码或解码的方法和装置 |
CN113170191A (zh) * | 2018-11-16 | 2021-07-23 | 联发科技股份有限公司 | 用于视频编码的运动向量差值改良式合并方法和装置 |
CN113661710A (zh) * | 2019-04-03 | 2021-11-16 | 联发科技股份有限公司 | 核心转换和次级转换间的交互作用 |
CN114051726A (zh) * | 2019-06-14 | 2022-02-15 | Lg 电子株式会社 | 使用运动矢量差进行图像编译的方法和装置 |
CN114270835A (zh) * | 2019-06-19 | 2022-04-01 | Lg电子株式会社 | 基于默认合并模式推导预测样本的图像解码方法及其装置 |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10560712B2 (en) | 2016-05-16 | 2020-02-11 | Qualcomm Incorporated | Affine motion prediction for video coding |
CN116915985A (zh) * | 2016-10-04 | 2023-10-20 | Lx 半导体科技有限公司 | 图像编码/解码方法和发送方法 |
US10448010B2 (en) * | 2016-10-05 | 2019-10-15 | Qualcomm Incorporated | Motion vector prediction for affine motion models in video coding |
US11062482B2 (en) * | 2016-10-12 | 2021-07-13 | Arris Enterprises Llc | Coding schemes for virtual reality (VR) sequences |
US11240526B2 (en) * | 2017-01-02 | 2022-02-01 | Industry-University Cooperation Foundation Hanyang University | Method and apparatus for decoding image using interpicture prediction |
US11082702B2 (en) | 2017-07-03 | 2021-08-03 | Lg Electronics Inc. | Inter prediction mode-based image processing method and device therefor |
KR102521521B1 (ko) * | 2017-09-12 | 2023-04-14 | 삼성전자주식회사 | 움직임 정보의 부호화 및 복호화 방법, 및 움직임 정보의 부호화 및 복호화 장치 |
US11877001B2 (en) | 2017-10-10 | 2024-01-16 | Qualcomm Incorporated | Affine prediction in video coding |
US11070842B2 (en) | 2018-01-02 | 2021-07-20 | Samsung Electronics Co., Ltd. | Video decoding method and apparatus and video encoding method and apparatus |
CN117640962A (zh) * | 2018-03-19 | 2024-03-01 | 英迪股份有限公司 | 图像解码方法、图像编码方法和存储比特流的记录介质 |
CN111971966B (zh) * | 2018-03-30 | 2024-10-29 | 英迪股份有限公司 | 图像编码/解码方法和设备以及存储比特流的记录介质 |
CN111937392B (zh) * | 2018-04-17 | 2024-05-10 | 联发科技股份有限公司 | 视频编解码的神经网络方法和装置 |
EP3787296A4 (en) * | 2018-05-21 | 2021-07-28 | LG Electronics Inc. | METHOD AND DEVICE FOR DECODING AN IMAGE USING AN MVD DERIVATIVE BASED ON A LUT TABLE IN AN IMAGE CODING SYSTEM |
KR20190139786A (ko) * | 2018-06-08 | 2019-12-18 | 주식회사 케이티 | 비디오 신호 처리 방법 및 장치 |
JP7060802B2 (ja) * | 2018-06-11 | 2022-04-27 | 日本電信電話株式会社 | バッファ装置 |
WO2020004879A1 (ko) * | 2018-06-25 | 2020-01-02 | 엘지전자 주식회사 | 영상 코딩 시스템에서 복수의 주변 블록들을 사용하는 인터 예측에 따른 영상 디코딩 방법 및 장치 |
US11257254B2 (en) * | 2018-07-20 | 2022-02-22 | Google Llc | Data compression using conditional entropy models |
BR112021004662A2 (pt) * | 2018-09-12 | 2021-06-01 | Huawei Technologies Co., Ltd. | codificador de vídeo, decodificador de vídeo e métodos correspondentes |
CN111093080B (zh) | 2018-10-24 | 2024-06-04 | 北京字节跳动网络技术有限公司 | 视频编码中的子块运动候选 |
US11470329B2 (en) * | 2018-12-26 | 2022-10-11 | Tencent America LLC | Method and apparatus for video coding |
WO2020138997A1 (ko) * | 2018-12-28 | 2020-07-02 | 엘지전자 주식회사 | 화면간 예측을 사용하여 비디오 신호를 처리하기 위한 방법 및 장치 |
JP7288964B2 (ja) * | 2018-12-28 | 2023-06-08 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | 動きベクトル予測因子リストを生成すること |
US11659166B2 (en) | 2019-01-02 | 2023-05-23 | Lg Electronics Inc. | Method and apparatus for coding image by using MMVD based on CPR |
CN113302936B (zh) * | 2019-01-07 | 2024-03-19 | 北京字节跳动网络技术有限公司 | 用于具有MVD的Merge的控制方法 |
CN113273207A (zh) | 2019-01-10 | 2021-08-17 | 北京字节跳动网络技术有限公司 | 基于几何分区的具有运动矢量差(MVD)的Merge |
WO2020147773A1 (en) * | 2019-01-16 | 2020-07-23 | Beijing Bytedance Network Technology Co., Ltd. | Inserting order of motion candidates in lut |
KR102612802B1 (ko) * | 2019-03-05 | 2023-12-13 | 엘지전자 주식회사 | 인터 예측을 위한 비디오 신호의 처리 방법 및 장치 |
WO2020180166A1 (ko) * | 2019-03-07 | 2020-09-10 | 디지털인사이트주식회사 | 영상 부호화/복호화 방법 및 장치 |
US12047582B2 (en) | 2019-03-24 | 2024-07-23 | Lg Electronics Inc. | Image encoding/decoding method and device using symmetric motion vector difference (SMVD), and method for transmitting bitstream |
WO2020251340A1 (ko) * | 2019-06-13 | 2020-12-17 | 엘지전자 주식회사 | 움직임 벡터 예측 기반 영상/비디오 코딩 방법 및 장치 |
EP3975561A4 (en) * | 2019-06-14 | 2023-03-22 | LG Electronics Inc. | METHOD AND DEVICE FOR IMAGE CODING BASED ON INTER PREDICTION |
WO2020251322A1 (ko) | 2019-06-14 | 2020-12-17 | 엘지전자 주식회사 | 움직임 벡터를 이용한 영상 코딩 방법 및 장치 |
JP7335365B2 (ja) | 2019-06-24 | 2023-08-29 | エルジー エレクトロニクス インコーポレイティド | 動きベクトル差分を利用した映像コーディング方法及び装置 |
US11190789B2 (en) * | 2019-06-30 | 2021-11-30 | Tencent America LLC | Method and apparatus for video coding using inter-prediction mode signaling to dertermine motion vectors |
KR102230265B1 (ko) * | 2019-07-01 | 2021-03-19 | 삼성전자주식회사 | 주변 움직임 정보를 이용하여 움직임 정보를 부호화 및 복호화하는 장치, 및 방법 |
CN112135127B (zh) * | 2019-11-05 | 2021-09-21 | 杭州海康威视数字技术股份有限公司 | 一种编解码方法、装置、设备及机器可读存储介质 |
CN114071159B (zh) * | 2020-07-29 | 2023-06-30 | Oppo广东移动通信有限公司 | 帧间预测方法、编码器、解码器及计算机可读存储介质 |
KR20240140018A (ko) * | 2023-03-15 | 2024-09-24 | 한국전자통신연구원 | 영상 부호화/복호화를 위한 방법 및 비트스트림을 저장하는 기록 매체 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102227132A (zh) * | 2011-05-25 | 2011-10-26 | 深圳市融创天下科技股份有限公司 | 一种运动矢量预测编解码方法、装置及编解码系统 |
US20120189053A1 (en) * | 2011-01-22 | 2012-07-26 | Qualcomm Incorporated | Combined reference picture list construction for video coding |
US8238433B2 (en) * | 2008-06-02 | 2012-08-07 | INSTITUTO POLITéCNICO DE LEIRIA | Method to transcode H.264/AVC video frames into MPEG-2 and device |
US20130101042A1 (en) * | 2011-10-19 | 2013-04-25 | Panasonic Corporation | Picture coding method, picture coding apparatus, picture decoding method, and picture decoding apparatus |
WO2013138631A1 (en) * | 2012-03-16 | 2013-09-19 | Qualcomm Incorporated | Motion vector coding and bi-prediction in hevc and its extensions |
US20140219357A1 (en) * | 2011-10-19 | 2014-08-07 | Mediatek Inc. | Method and apparatus for derivation of motion vector predictor candidate set |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7567617B2 (en) | 2003-09-07 | 2009-07-28 | Microsoft Corporation | Predicting motion vectors for fields of forward-predicted interlaced video frames |
KR101356734B1 (ko) | 2007-01-03 | 2014-02-05 | 삼성전자주식회사 | 움직임 벡터 트랙킹을 이용한 영상의 부호화, 복호화 방법및 장치 |
KR20110008653A (ko) * | 2009-07-20 | 2011-01-27 | 삼성전자주식회사 | 움직임 벡터 예측 방법과 이를 이용한 영상 부호화/복호화 장치 및 방법 |
KR101441889B1 (ko) | 2011-01-06 | 2014-09-29 | 에스케이텔레콤 주식회사 | 움직임벡터 부호화 및 복호화 장치와 방법 |
KR101921789B1 (ko) * | 2011-05-31 | 2018-11-23 | 가부시키가이샤 제이브이씨 켄우드 | 동영상 인코딩 장치, 동영상 인코딩 방법 및 동영상 인코딩 프로그램, 및 동영상 디코딩 장치, 동영상 디코딩 방법 및 동영상 디코딩 프로그램 |
KR20120140592A (ko) | 2011-06-21 | 2012-12-31 | 한국전자통신연구원 | 움직임 보상의 계산 복잡도 감소 및 부호화 효율을 증가시키는 방법 및 장치 |
US8396867B2 (en) * | 2011-07-13 | 2013-03-12 | Nimblecat, Inc. | Identifying and ranking networked biographies and referral paths corresponding to selected qualifications |
US20130114717A1 (en) * | 2011-11-07 | 2013-05-09 | Qualcomm Incorporated | Generating additional merge candidates |
WO2014049196A1 (en) * | 2012-09-27 | 2014-04-03 | Nokia Corporation | Method and techniqal equipment for scalable video coding |
CN107113424B (zh) * | 2014-11-18 | 2019-11-22 | 联发科技股份有限公司 | 以帧间预测模式编码的块的视频编码和解码方法 |
JP5922281B2 (ja) | 2015-04-17 | 2016-05-24 | 株式会社Nttドコモ | 動画像予測符号化装置、動画像予測符号化方法、動画像予測復号装置及び動画像予測復号方法 |
-
2016
- 2016-08-25 KR KR1020187007989A patent/KR20180048736A/ko unknown
- 2016-08-25 CN CN201680055921.5A patent/CN108141588A/zh active Pending
- 2016-08-25 EP EP16848807.0A patent/EP3355578B1/en active Active
- 2016-08-25 US US15/761,665 patent/US10575011B2/en active Active
- 2016-08-25 WO PCT/KR2016/009410 patent/WO2017052081A1/ko active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8238433B2 (en) * | 2008-06-02 | 2012-08-07 | INSTITUTO POLITéCNICO DE LEIRIA | Method to transcode H.264/AVC video frames into MPEG-2 and device |
US20120189053A1 (en) * | 2011-01-22 | 2012-07-26 | Qualcomm Incorporated | Combined reference picture list construction for video coding |
CN102227132A (zh) * | 2011-05-25 | 2011-10-26 | 深圳市融创天下科技股份有限公司 | 一种运动矢量预测编解码方法、装置及编解码系统 |
US20130101042A1 (en) * | 2011-10-19 | 2013-04-25 | Panasonic Corporation | Picture coding method, picture coding apparatus, picture decoding method, and picture decoding apparatus |
US20140219357A1 (en) * | 2011-10-19 | 2014-08-07 | Mediatek Inc. | Method and apparatus for derivation of motion vector predictor candidate set |
WO2013138631A1 (en) * | 2012-03-16 | 2013-09-19 | Qualcomm Incorporated | Motion vector coding and bi-prediction in hevc and its extensions |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111903123A (zh) * | 2018-07-02 | 2020-11-06 | Lg电子株式会社 | 基于帧间预测模式的图像处理方法和用于该方法的装置 |
CN111903123B (zh) * | 2018-07-02 | 2024-03-08 | Lg电子株式会社 | 基于帧间预测模式的图像处理方法和用于该方法的装置 |
US12113959B2 (en) | 2018-07-02 | 2024-10-08 | Huawei Technologies Co., Ltd. | Motion vector prediction for video coding |
CN112866720A (zh) * | 2018-07-02 | 2021-05-28 | 华为技术有限公司 | 一种运动矢量预测方法、装置与编解码器 |
CN111418212A (zh) * | 2018-07-13 | 2020-07-14 | Lg电子株式会社 | 基于图像编码系统中的仿射运动预测的图像解码方法和设备 |
CN111418212B (zh) * | 2018-07-13 | 2023-12-01 | Lg电子株式会社 | 基于图像编码系统中的仿射运动预测的图像解码方法和设备 |
US11622126B2 (en) | 2018-07-13 | 2023-04-04 | Lg Electronics Inc. | Image decoding method and apparatus based on affine motion prediction in image coding system |
CN111247805B (zh) * | 2018-09-12 | 2023-12-01 | Lg电子株式会社 | 在图像编码系统中基于以子块为单元进行的运动预测的图像解码方法和设备 |
US11616975B2 (en) | 2018-09-12 | 2023-03-28 | Lg Electronics Inc. | Image decoding method and apparatus based on motion prediction in sub-block unit in image coding system |
US11889106B2 (en) | 2018-09-12 | 2024-01-30 | Lg Electronics Inc. | Image decoding method and apparatus based on motion prediction in sub-block unit in image coding system |
CN111247805A (zh) * | 2018-09-12 | 2020-06-05 | Lg电子株式会社 | 在图像编码系统中基于以子块为单元进行的运动预测的图像解码方法和设备 |
CN112740671A (zh) * | 2018-09-18 | 2021-04-30 | 韩国电子通信研究院 | 图像编码/解码方法和装置以及存储比特流的记录介质 |
CN110933439B (zh) * | 2018-09-20 | 2022-05-31 | 杭州海康威视数字技术股份有限公司 | 运动信息候选者列表构建方法、装置及可读存储介质 |
CN110933439A (zh) * | 2018-09-20 | 2020-03-27 | 杭州海康威视数字技术股份有限公司 | 运动信息候选者列表构建方法、装置及可读存储介质 |
WO2020057556A1 (zh) * | 2018-09-20 | 2020-03-26 | 杭州海康威视数字技术股份有限公司 | 运动信息候选者列表构建方法、装置及可读存储介质 |
US12081795B2 (en) | 2018-09-25 | 2024-09-03 | Digitalinsights Inc. | Method and device for encoding or decoding image on basis of inter mode |
CN112956195A (zh) * | 2018-09-25 | 2021-06-11 | 数字洞察力有限公司 | 用于基于帧间模式对图像进行编码或解码的方法和装置 |
CN111418206B (zh) * | 2018-10-05 | 2023-12-01 | Lg电子株式会社 | 使用mpm列表的基于帧内预测的视频编码方法及其装置 |
CN111418206A (zh) * | 2018-10-05 | 2020-07-14 | Lg电子株式会社 | 使用mpm列表的基于帧内预测的视频编码方法及其装置 |
CN113170191A (zh) * | 2018-11-16 | 2021-07-23 | 联发科技股份有限公司 | 用于视频编码的运动向量差值改良式合并方法和装置 |
US11381838B2 (en) | 2018-11-16 | 2022-07-05 | Hfi Innovation Inc. | Method and apparatus of improved merge with motion vector difference for video coding |
CN112544083A (zh) * | 2019-01-28 | 2021-03-23 | 株式会社 Xris | 图像信号编码/解码方法及用于其的装置 |
US12126796B2 (en) | 2019-01-28 | 2024-10-22 | Apple Inc. | Image signal encoding/decoding method and device therefor |
CN113661710B (zh) * | 2019-04-03 | 2024-07-30 | 寰发股份有限公司 | 核心转换和次级转换间的交互作用 |
CN113661710A (zh) * | 2019-04-03 | 2021-11-16 | 联发科技股份有限公司 | 核心转换和次级转换间的交互作用 |
CN114051726A (zh) * | 2019-06-14 | 2022-02-15 | Lg 电子株式会社 | 使用运动矢量差进行图像编译的方法和装置 |
CN114270835A (zh) * | 2019-06-19 | 2022-04-01 | Lg电子株式会社 | 基于默认合并模式推导预测样本的图像解码方法及其装置 |
Also Published As
Publication number | Publication date |
---|---|
US20180352247A1 (en) | 2018-12-06 |
KR20180048736A (ko) | 2018-05-10 |
US10575011B2 (en) | 2020-02-25 |
EP3355578A1 (en) | 2018-08-01 |
EP3355578A4 (en) | 2019-03-13 |
EP3355578B1 (en) | 2020-12-09 |
WO2017052081A1 (ko) | 2017-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108141588A (zh) | 图像编码系统中的帧间预测方法和装置 | |
US20230379489A1 (en) | Method and apparatus for inter prediction in video coding system | |
US10750167B2 (en) | Intra-prediction method and apparatus in video coding system | |
CN103891283B (zh) | 帧内预测的方法和设备 | |
RU2585976C2 (ru) | Способ и устройство для определения способа сканирования на основании режима деления блока предсказания | |
CN103250417B (zh) | 编码和解码图像的方法及使用该方法的设备 | |
JP2020174362A (ja) | 映像復号化方法 | |
CN108293113A (zh) | 图像编码系统中的基于建模的图像解码方法和设备 | |
CN103748879B (zh) | 设置运动矢量列表的方法及使用其的装置 | |
CN110235444A (zh) | 使用多条参考线的帧内预测 | |
CN108370441A (zh) | 在图像编译系统中用于系数引起的帧内预测的方法和装置 | |
CN104272742B (zh) | 加权预测参数译码 | |
CN107925758A (zh) | 视频编译系统中的帧间预测方法和设备 | |
CN108605137A (zh) | 利用仿射运动补偿的视频编码方法与装置 | |
CN109417617A (zh) | 帧内预测方法和装置 | |
CN108293111A (zh) | 用于改善在图像编码系统中进行预测的滤波方法和装置 | |
CN109479149A (zh) | 视频信号处理方法和设备 | |
CN108353176A (zh) | 在图像编译系统中的基于amvr的图像编译方法和装置 | |
CN109644281A (zh) | 用于处理视频信号的方法和设备 | |
CN107810635A (zh) | 图像编译系统中基于照度补偿预测块的方法和设备 | |
CN104885453B (zh) | 支持多个层的用于编码/解码图像的方法和设备 | |
CN109417640A (zh) | 用于处理视频信号的方法和设备 | |
CN107750459A (zh) | 图像编码系统中的基于图像特性的自适应滤波方法和装置 | |
CN108141589A (zh) | 图像编译系统中对图像进行滤波的方法和装置 | |
CN107251556A (zh) | 用于运动搜索中低复杂度四分之一像素产生的方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180608 |
|
WD01 | Invention patent application deemed withdrawn after publication |