CN116614638A - 图像编码/解码方法和用于所述方法的记录介质 - Google Patents
图像编码/解码方法和用于所述方法的记录介质 Download PDFInfo
- Publication number
- CN116614638A CN116614638A CN202310761221.XA CN202310761221A CN116614638A CN 116614638 A CN116614638 A CN 116614638A CN 202310761221 A CN202310761221 A CN 202310761221A CN 116614638 A CN116614638 A CN 116614638A
- Authority
- CN
- China
- Prior art keywords
- block
- prediction
- information
- current block
- merge candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 191
- 230000033001 locomotion Effects 0.000 claims abstract description 619
- 230000002123 temporal effect Effects 0.000 claims description 146
- 239000013598 vector Substances 0.000 description 171
- 238000005192 partition Methods 0.000 description 59
- 238000010586 diagram Methods 0.000 description 54
- 238000009795 derivation Methods 0.000 description 52
- 230000008569 process Effects 0.000 description 48
- 238000013139 quantization Methods 0.000 description 36
- 238000000638 solvent extraction Methods 0.000 description 32
- 230000003044 adaptive effect Effects 0.000 description 22
- 239000000523 sample Substances 0.000 description 21
- 230000009466 transformation Effects 0.000 description 20
- 239000011159 matrix material Substances 0.000 description 19
- 239000013074 reference sample Substances 0.000 description 16
- 238000001914 filtration Methods 0.000 description 15
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 14
- 238000012545 processing Methods 0.000 description 10
- 239000000470 constituent Substances 0.000 description 9
- 230000002457 bidirectional effect Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000001965 increasing effect Effects 0.000 description 7
- 230000001131 transforming effect Effects 0.000 description 7
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- 241000209094 Oryza Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/583—Motion compensation with overlapping blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/196—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
- H04N19/197—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including determination of the initial value of an encoding parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/56—Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明涉及一种图像编码/解码方法和用于所述方法的记录介质。其图像解码方法可包括以下步骤:产生当前块的合并候选列表,其中,当前块的合并候选列表包括分别与多个参考画面列表相应的合并候选之中的至少一个合并候选;通过使用合并候选来确定至少一条运动信息;通过使用确定的所述至少一条运动信息产生当前块的预测块。
Description
本申请是申请号为201780043622.4、申请日为2017年7月12日、题目为“图像编码/解码方法和用于所述方法的记录介质”的发明申请的分案申请。
技术领域
本发明涉及一种用于对视频进行编码/解码的方法和设备。更具体地讲,本发明涉及一种用于通过使用合并模式来执行运动补偿的方法和设备。
背景技术
近来,对诸如高清(HD)图像和超高清(UHD)图像的高分辨率和高质量图像的需求在各个应用领域已获得增长。然而,与传统的图像数据相比,更高分辨率和质量的图像数据的数据量有所增加。因此,当通过使用诸如传统的有线宽带网络和无线宽带网络的介质发送图像数据时,或者当通过使用传统的存储介质存储图像数据时,发送和存储的成本增加。为了解决这些随着图像数据的分辨率和质量的提高而出现的问题,对于更高分辨率和更高质量的图像,需要高效图像编码/解码技术。
图像压缩技术包括各种技术,包括:从当前画面的先前画面或后续画面预测包括在当前画面中的像素值的帧间预测技术;通过使用当前画面中的像素信息来预测包括在当前画面中的像素值的帧内预测技术;用于压缩残差信号的能量的变换和量化技术;向高出现频率的值分配短码并且向低出现频率的值分配长码的熵编码技术;等等。通过使用这样的图像压缩技术,图像数据可被有效压缩,并且可被发送或存储。
在使用传统的合并模式的运动补偿中,仅空间合并候选、时间合并候选、双向预测合并候选和零合并候选被添加到将被使用的合并候选列表。因此,仅单向预测和双向预测被使用,从而对于提高编码效率有限制。
在使用传统的合并模式的运动补偿中,由于时间合并候选推导处理和双向预测合并候选推导处理之间的依赖性,在合并模式的吞吐量方面存在限制。另外,不可并行地执行合并候选推导处理。
在使用传统的合并模式的运动补偿中,通过双向预测合并候选推导处理而产生的双向预测合并候选被用作运动信息。因此,与单向预测合并候选相比,在运动补偿期间存储器存取带宽增加。
在使用传统的合并模式的运动补偿中,根据条带类型而不同地执行零合并候选推导,因此硬件逻辑是复杂的。此外,通过在运动补偿中将使用的双向预测零合并候选推导处理来产生双向预测零合并候选,因此存储器存取带宽增加。
发明内容
技术问题
本发明的目标在于提供一种通过使用组合的合并候选执行运动补偿以提高视频的编码/解码效率的方法和设备。
本发明的另一目标在于提供一种通过使用单向预测、双向预测、三向预测和四向预测执行运动补偿以提高视频的编码/解码效率的方法和设备。
本发明的另一目标在于提供一种通过合并候选推导处理的并行化、去除合并候选推导处理之间的依赖性、双向预测合并候选分割和单向预测零合并候选推导来确定运动信息,从而增加合并模式的吞吐量并简化硬件逻辑的方法和设备。
技术方案
一种根据本发明的用于对视频进行解码的方法,所述方法包括:产生当前块的合并候选列表,其中,当前块的合并候选列表包括与多个参考画面列表中的每个参考画面列表相应的至少一个合并候选;通过使用合并候选列表来确定至少一条运动信息;通过使用确定的所述至少一条运动信息产生当前块的预测块。
在用于对视频进行解码的方法中,合并候选列表可包括从当前块的空间邻近块推导的空间合并候选、从当前块的同位块推导的时间合并候选、通过修改空间合并候选而推导的修改的空间合并候选、通过修改时间合并候选而推导的修改的时间合并候选和具有预定义的运动信息值的合并候选中的至少一个。
在用于对视频进行解码的方法中,合并候选列表还可包括通过使用从包括空间合并候选、时间合并候选、修改的空间合并候选和修改的时间合并候选的组中选择的至少两个合并候选而推导的组合的合并候选。
在用于对视频进行解码的方法中,空间合并候选可以是从与当前块相邻的邻近块的子块推导出的,时间合并候选可以是从当前块的同位块的子块推导出的。
在用于对视频进行解码的方法中,通过使用确定的所述至少一条运动信息产生当前块的预测块的步骤可包括:根据当前块的帧间预测指示符产生多个时间预测块;通过将加权因子和偏移中的至少一个应用到产生的所述多个时间预测块来产生当前块的预测块。
在用于对视频进行解码的方法中,可在尺寸小于预定块的块中或在深度深于所述预定块的块中共享加权因子和偏移中的至少一个。
在用于对视频进行解码的方法中,可在尺寸小于预定块的块中或在深度深于所述预定块的块中共享合并候选列表。
在用于对视频进行解码的方法中,当当前块的尺寸小于预定块或者当前块的深度深于所述预定块时,可基于当前块的高层块产生合并候选列表,其中,高层块的尺寸或深度等于所述预定块的尺寸或深度。
一种根据本发明的用于对视频进行编码的方法,所述方法包括:产生当前块的合并候选列表,其中,当前块的合并候选列表包括与多个参考画面列表中的每个参考画面列表相应的至少一个合并候选;通过使用合并候选列表来确定至少一条运动信息;通过使用确定的所述至少一条运动信息来产生当前块的预测块。
在用于对视频进行编码的方法中,合并候选列表可包括从当前块的空间邻近块推导的空间合并候选、从当前块的同位块推导的时间合并候选、通过修改空间合并候选而推导的修改的空间合并候选、通过修改时间合并候选而推导的修改的时间合并候选和具有预定的运动信息值的合并候选中的至少一个。
在用于对视频进行编码的方法中,合并候选列表还可包括通过使用从包括空间合并候选、时间合并候选、修改的空间合并候选和修改的时间合并候选的组中选择的至少两个合并候选而推导的组合的合并候选。
在用于对视频进行编码的方法中,空间合并候选可以是从与当前块相邻的邻近块的子块推导出的,时间合并候选可以是从当前块的同位块的子块推导出的。
在用于对视频进行编码的方法中,通过使用确定的所述至少一条运动信息产生当前块的预测块的步骤可包括:根据当前块的帧间预测指示符产生多个时间预测块;通过将加权因子和偏移中的至少一个应用到产生的所述多个时间预测块来产生当前块的预测块。
在用于对视频进行编码的方法中,可在尺寸小于预定块的块中或在深度深于所述预定块的块中共享加权因子和偏移中的至少一个。
在用于对视频进行编码的方法中,可在尺寸小于预定块的块中或在深度深于所述预定块的块中共享合并候选列表。
在用于对视频进行编码的方法中,当当前块的尺寸小于预定块或者当前块的深度深于所述预定块时,基于当前块的高层块产生合并候选列表,其中,高层块的尺寸或深度等于所述预定块的尺寸或深度。
一种根据本发明的用于对视频进行解码的设备,所述设备包括:帧间预测单元,产生当前块的合并候选列表,其中,当前块的合并候选列表包括与多个参考画面列表中的每个参考画面列表相应的至少一个合并候选,通过使用合并候选列表来确定至少一条运动信息,通过使用确定的所述至少一条运动信息来产生当前块的预测块。
一种根据本发明的用于对视频进行编码的设备,所述设备包括:帧间预测单元,产生当前块的合并候选列表,其中,当前块的合并候选列表包括与多个参考画面列表中的每个参考画面列表相应的至少一个合并候选,通过使用合并候选列表来确定至少一条运动信息,通过使用确定的所述至少一条运动信息来产生当前块的预测块。
一种根据本发明的可读介质,存储通过用于对视频进行编码的方法形成的比特流,所述方法包括:产生当前块的合并候选列表,其中,当前块的合并候选列表包括与多个参考画面列表中的每个参考画面列表相应的至少一个合并候选;通过使用合并候选列表来确定至少一条运动信息;通过使用确定的所述至少一条运动信息来产生当前块的预测块。
有益效果
在本发明中,提供一种通过使用组合的合并候选执行运动补偿以提高视频的编码/解码效率的方法和设备。
在本发明中,提供一种通过使用单向预测、双向预测、三向预测和四向预测执行运动补偿以提高视频的编码/解码效率的方法和设备。
在本发明中,提供一种通过合并候选推导处理的并行化、去除合并候选推导处理之间的依赖性、双向预测合并候选分割和单向预测零合并候选推导来执行运动补偿,从而增加合并模式的吞吐量并简化硬件逻辑的方法和设备。
附图说明
图1是示出根据本发明的实施例的编码设备的配置的框图。
图2是示出根据本发明的实施例的解码设备的配置的框图。
图3是示意性地示出当对图像进行编码和解码时的图像的分区结构的示图。
图4是示出可被包括在编码单元(CU)中的预测单元(PU)的形式的示图。
图5是示出可被包括在编码单元(CU)中的变换单元(TU)的形式的示图。
图6是用于解释帧内预测的处理的实施例的示图。
图7是用于解释帧间预测的处理的实施例的示图。
图8是用于解释根据帧内预测模式的变换集的示图。
图9是用于解释变换的处理的示图。
图10是用于解释对量化的变换系数进行扫描的示图。
图11是用于解释块分区的示图。
图12是示出根据本发明的用于通过使用合并模式对视频进行编码的方法的流程图。
图13是示出根据本发明的用于通过使用合并模式对视频进行解码的方法的流程图。
图14是示出推导当前块的空间合并候选的示例的示图。
图15是示出将空间合并候选添加到合并候选列表的示例的示图。
图16是示出在CTU中推导并共享空间合并候选的实施例的示图。
图17是示出推导当前块的时间合并候选的示例的示图。
图18是示出将时间合并候选添加到合并候选列表的示例的示图。
图19是示出对同位块的运动矢量进行缩放以推导当前块的时间合并候选的示例的示图。
图20是示出组合的索引的示图。
图21a和图21b是示出推导组合的合并候选的方法的实施例的示图。
图22和图23是示出通过使用空间合并候选、时间合并候选和零合并候选中的至少一个推导组合的合并候选并且将组合的合并候选添加到合并候选列表的实施例的示图。
图24是示出在使用合并模式的运动补偿中通过仅使用空间合并候选推导组合的合并候选的优势的示图。
图25是示出分割合并的双向预测合并候选的方法的实施例的示图。
图26是示出推导零合并候选的方法的实施例的示图。
图27是示出将推导出的零合并候选添加到合并候选列表的实施例的示图。
图28是示出推导零合并候选的方法的另一实施例的示图。
图29是示出在CTU中推导并共享合并候选列表的实施例的示图。
图30和图31是示出关于运动补偿的信息的语法的示例的示图。
图32是示出在CTU中的尺寸比预定块更小的块中使用合并模式的实施例的示图。
图33是示出根据本发明的用于对视频进行解码的方法的示图。
图34是示出根据本发明的用于对视频进行编码的方法的示图。
具体实施方式
可对本发明做出多种修改,并且存在本发明的多种实施例,其中,现在将参照附图提供所述实施例的示例并且将详细描述所述实施例的示例。然而,本发明不限于此,尽管示例性实施例可被解释为包括本发明的技术构思和技术范围内的所有修改、等同形式或替换形式。相似的参考标号指在各方面相同或相似的功能。在附图中,为了清楚起见,元件的形状和尺寸可被夸大。在本发明的以下详细描述中,对通过图示的方式示出可对本发明进行实施的具体实施例的附图进行参照。这些实施例被足够详细地描述以使本领域技术人员能够实施本公开。应该理解,本公开的各种实施例尽管不同,但不必是相互排他的。例如,在不脱离本公开的精神和范围的情况下,这里描述的与一个实施例关联的特定特征、结构和特性可在其它实施例中被实施。此外,应该理解,在不脱离本公开的精神和范围的情况下,每个公开的实施例内的各个元件的位置或布置可被修改。因此,以下详细描述并不用以限制的含义,本公开的范围仅由所附权利要求(在合适的解释的情况下,还连同权利要求所要求保护的等同物的全部范围)来限定。
在说明书中使用的术语“第一”、“第二”等可被用于描述各种组件,但这些组件并不被解释为限制所述术语。所述术语仅被用于将一个组件与另一组件区分开。例如,在不脱离本发明的范围的情况下,“第一”组件可被称为“第二”组件,并且“第二”组件也可被类似地称为“第一”组件。术语“和/或”包括多个项的组合或者是多个项中的任意一项。
将理解的是,在本说明书中,当元件被简单称为“连接到”或“结合到”另一元件而不是“直接连接到”或“直接结合到”另一元件时,它可以“直接连接到”或“直接结合到”另一元件,或者是在其间插入其它元件的情况下连接到或结合到另一元件。相反,应该理解,当元件被称为“直接结合”或“直接连接”到另一元件时,不存在中间元件。
此外,在本发明的实施例中示出的组成部件被独立示出,以便呈现彼此不同的特性功能。因此,这并不意味着每个组成部件以单独的硬件或软件的组成单元被组成。换句话说,为了方便,每个组成部件包括枚举的组成部件中的每一个。因此,每个组成部件中的至少两个组成部件可被组合形成一个组成部件,或者一个组成部件可被划分为多个组成部件以执行每个功能。在没有脱离本发明的本质的情况下,每个组成部件被组合的实施例以及一个组成部件被划分的实施例也被包括在本发明的范围中。
在本说明书中使用的术语仅用于描述具体实施例,而不旨在限制本发明。以单数使用的表达包括复数表达,除非它在上下文中具有明显不同的含义。在本说明书中,将理解,诸如“包括...的”、“具有...的”等的术语旨在指明说明书中所公开的特征、数量、步骤、行为、元件、部件、或其组合的存在,而并不旨在排除一个或更多个其它特征、数量、步骤、行为、元件、部件、或其组合可能存在或者可能被添加的可能性。换句话说,当特定元件被称为“被包括”时,除相应元件以外的元件并不被排除,而是,另外的元件可被包括在本发明的实施例中或者是本发明的范围中。
此外,一些组成元件可能不是执行本发明的必要功能的不可缺的组成元件,而是仅提升其性能的可选组成元件。可通过仅包括用于实施本发明的实质的不可缺的组成部件而排除在提升性能时使用的组成部件来实施本发明。仅包括所述不可缺的组成部件而排除在仅提升性能时使用的可选组成部件的结构也被包括在本发明的范围中。
在下文中,将参照附图详细描述本发明的实施例。在描述本发明的示例性实施例时,将不详细描述公知功能或结构,这是因为它们会不必要地模糊对本发明的理解。附图中的相同的组成元件通过相同的参考标号来表示,并且对相同元件的重复描述将被省略。
此外,在下文中,图像可指构成视频的画面,或者可指视频本身。例如,“对图像进行编码或解码或者进行两者”可指“对视频进行编码或解码或者进行两者”,并且可指“对视频的多个图像之中的一个图像进行编码或解码或者进行两者”。这里,画面和图像可具有相同的含义。
术语描述
编码器:可指执行编码的设备。
解码器:可指执行解码的设备。
解析:可指通过执行熵解码来确定语法元素的值,或者可指熵解码本身。
块:可指M×N矩阵的样点。这里,M和N是正整数,并且块可指二维形式的样点矩阵。
样点:是块的基本单元,并且可指示依据比特深度(Bd)而范围为0至2Bd–1的值。样点在本发明中可指像素。
单元:可指对图像进行编码和解码的单元。在对图像进行编码和解码时,单元可以是通过对一个图像进行分区而产生的区域。此外,单元可指在编码或解码期间当一个图像被分区为多个子划分单元时的子划分单元。在对图像进行编码和解码时,可执行针对每个单元的预定处理。一个单元可被分区为尺寸比该单元的尺寸更小的子单元。依据功能,单元可指块、宏块、编码树单元、编码树块、编码单元、编码块、预测单元、预测块、变换单元、变换块等。此外,为了将单元与块区分开,单元可包括亮度分量块、亮度分量块的色度分量块、以及每个颜色分量块的语法元素。单元可具有各种尺寸和形状,具体而言,单元的形状可以是二维几何图形,诸如矩形、正方形、梯形、三角形、五边形等。此外,单元信息可包括单元类型(指示编码单元、预测单元、变换单元等)、单元尺寸、单元深度、对单元进行编码和解码的顺序等中的至少一个。
重建邻近单元:可指被在先编码或解码的重建单元,并且重建单元在空间上/时间上与编码/解码目标单元相邻。这里,重建邻近单元可指重建邻近块。
邻近块:可指与编码/解码目标块相邻的块。与编码/解码目标块相邻的块可指具有与编码/解码目标块接触的边界的块。邻近块可指位于编码/解码目标块的相邻顶点的块。邻近块可指重建邻近块。
单元深度:可指单元的被分区程度。在树结构中,根节点可以是最高节点,叶节点可以是最低节点。
符号:可指编码/解码目标单元的语法元素、编码参数、变换系数的值等。
参数集:可指比特流的结构中的头信息。参数集可包括视频参数集、序列参数集、画面参数集或自适应参数集中的至少一个参数集。此外,参数集可指条带(slice)头信息和并行块(tile)头信息等。
比特流:可指包括编码图像信息的比特串。
预测单元:可指当执行帧间预测或帧内预测以及针对预测的补偿时的基本单元。一个预测单元可被分区为多个分区。在这种情况下,多个分区中的每个分区可以是在执行预测和补偿时的基本单元,并且从预测单元分区获得的每个分区可以是预测单元。此外,一个预测单元可以被分区为多个小预测单元。预测单元可具有各种尺寸和形状,并且具体来说,预测单元的形状可以是二维几何图形,诸如矩形、正方形、梯形、三角形、五边形等。
预测单元分区:可指分区出的预测单元的形状。
参考画面列表:可指包括至少一个参考画面的列表,其中,所述至少一个参考画面被用于帧间预测或运动补偿。参考画面列表的类型可以是List Combined(LC)、List 0(L0)、List 1(L1)、List 2(L2)、List 3(L3)等。至少一个参考画面列表可被用于帧间预测。
帧间预测指示符:可指以下之一:帧间预测情况下的编码/解码目标块的帧间预测方向(单向预测、双向预测等)、用于通过所述编码/解码目标块产生预测块的参考画面的数量、以及用于通过所述编码/解码目标块执行帧间预测或运动补偿的参考块的数量。
参考画面索引:可指参考画面列表中的特定参考画面的索引。
参考画面:可指特定单元为了帧间预测或运动补偿所参考的画面。参考图像可被称为参考画面。
运动矢量:是用于帧间预测或运动补偿的二维矢量,并且可指编码/解码目标画面与参考画面之间的偏移。例如,(mvX,mvY)可指示运动矢量,mvX可指示水平分量,mvY可指示垂直分量。
运动矢量候选:可指当预测运动矢量时成为预测候选的单元,或者可指该单元的运动矢量。
运动矢量候选列表:可指通过使用运动矢量候选而配置的列表。
运动矢量候选索引:可指指示运动矢量候选列表中的运动矢量候选的指示符。运动矢量候选索引可被称为运动矢量预测因子的索引。
运动信息:可指运动矢量、参考画面索引和帧间预测指示符,以及包括参考画面列表信息、参考画面、运动矢量候选、运动矢量候选索引等中的至少一个的信息。
合并候选列表:可指通过使用合并候选而配置的列表。
合并候选:可包括空间合并候选、时间合并候选、组合的合并候选、组合的双向预测合并候选、零合并候选等。合并候选可包括诸如预测类型信息的运动信息、用于每个列表的参考画面索引、运动矢量等。
合并索引:可指指示合并候选列表中的合并候选的信息。此外,合并索引可指示与当前块在空间/时间上相邻的重建块之中的推导合并候选的块。此外,合并索引可指示合并候选的多条运动信息中的至少一条。
变换单元:可指当对残差信号执行与变换、逆变换、量化、反量化以及变换系数编码/解码类似的编码/解码时的基本单元。一个变换单元可被分区为多个小变换单元。变换单元可具有各种尺寸和形状。具体而言,变换单元的形状可以是二维几何图形,诸如矩形、正方形、梯形、三角形、五边形等。
缩放:可指将一因子与变换系数等级相乘的处理,其结果是,变换系数可被产生。缩放还可被称为反量化。
量化参数:可指在量化和反量化期间在对变换系数等级进行缩放时使用的值。这里,量化参数可以是被映射到量化的步长大小的值。
变量增量(Delta)量化参数:可指编码/解码目标单元的量化参数与预测出的量化参数之间的差值。
扫描:可指对块或矩阵内的系数顺序进行排序的方法。例如,将二维矩阵排序为一维矩阵的操作可被称为扫描,并且将一维矩阵排序为二维矩阵的操作可被称为扫描或逆扫描。
变换系数:可指在执行变换之后产生的系数值。在本发明中,量化的变换系数等级(即被应用了量化的变换系数)可被称为变换系数。
非零变换系数:可指值不为0的变换系数,或者可指值不为0的变换系数等级。
量化矩阵:可指在量化和反量化中使用以便提高图像的主体质量(subjectquality)或对象质量(object quality)的矩阵。量化矩阵可被称为缩放列表。
量化矩阵系数:可指量化矩阵的每个元素。量化矩阵系数可被称为矩阵系数。
默认矩阵:可指在编码器和解码器中被预先定义的预定量化矩阵。
非默认矩阵:可指在编码器和解码器中未被预先定义的情况下由用户发送/接收的量化矩阵。
编码树单元:可由一个亮度分量(Y)编码树单元以及相关的两个色度分量(Cb,Cr)编码树单元构成。每个编码树单元可通过使用至少一种分区方法(诸如四叉树、二叉树等)被分区,以构成诸如编码单元、预测单元、变换单元等的子单元。编码树单元可被用作用于指示像素块(即在图像的解码/编码处理中的处理单元,如输入图像的分区)的术语。
编码树块:可用作用于指示Y编码树单元、Cb编码树单元和Cr编码树单元之一的术语。
图1是示出根据本发明的实施例的编码设备的配置的框图。
编码设备100可以是视频编码设备或图像编码设备。视频可包括一个或更多个图像。编码设备100可按照时间顺序对视频的一个或更多个图像进行编码。
参照图1,编码设备100可包括运动预测单元111、运动补偿单元112、帧内预测单元120、切换器115、减法器125、变换单元130、量化单元140、熵编码单元150、反量化单元160、逆变换单元170、加法器175、滤波器单元180以及参考画面缓冲器190。
编码设备100可按照帧内模式或帧间模式或者是帧内模式和帧间模式两者来对输入画面进行编码。此外,编码设备100可通过对输入画面进行编码来产生比特流,并可输出产生的比特流。当帧内模式被用作预测模式时,切换器115可切换到帧内。当帧间模式被用作预测模式时,切换器115可切换到帧间。这里,帧内模式可被称为帧内预测模式,帧间模式可被称为帧间预测模式。编码设备100可产生输入画面的输入块的预测块。此外,在产生预测块之后,编码设备100可对输入块和预测块之间的残差进行编码。输入画面可被称为作为当前编码的目标的当前图像。输入块可被称为当前块或者可被称为作为当前编码的目标的编码目标块。
当预测模式是帧内模式时,帧内预测单元120可使用与当前块相邻的先前编码块的像素值作为参考像素。帧内预测单元120可通过使用参考像素来执行空间预测,并可通过使用空间预测来产生输入块的预测样点。这里,帧内预测可指帧内帧预测。
当预测模式是帧间模式时,运动预测单元111可在运动预测处理中从参考画面搜索与输入块最优匹配的区域,并可通过使用搜索到的区域推导运动矢量。参考画面可被存储在参考画面缓冲器190中。
运动补偿单元112可通过使用运动矢量执行运动补偿来产生预测块。这里,运动矢量可以是用于帧间预测的二维矢量。此外,运动矢量可指示当前画面和参考画面之间的偏移。这里,帧间预测可指帧间帧预测。
当运动矢量的值不为整数时,运动预测单元111和运动补偿单元112可通过对参考画面中的部分区域应用插值滤波器来产生预测块。为了基于编码单元执行帧间预测或运动补偿,可在跳过模式、合并模式、AMVP模式和当前画面参考模式之中确定编码单元中的预测单元的运动预测和补偿方法使用哪种方法。可根据每种模式执行帧间预测或运动补偿。这里,当前画面参考模式可指使用具有编码目标块的当前画面的预先构建的区域的预测模式。为了指明所述预先构建的区域,可定义针对当前画面参考模式的运动矢量。是否按照当前画面参考模式对编码目标块进行编码可通过使用编码目标块的参考画面索引而被编码。
减法器125可通过使用输入块和预测块之间的差来产生残差块。残差块可被称为残差信号。
变换单元130可通过对残差块进行变换来产生变换系数,并可输出变换系数。这里,变换系数可以是通过对残差块进行变换而产生的系数值。在变换跳过模式中,变换单元130可跳过对残差块的变换。
可通过对变换系数应用量化来产生量化的变换系数等级。在下文中,在本发明的实施例中,量化的变换系数等级可被称为变换系数。
量化单元140可通过依据量化参数对变换系数进行量化来产生量化的变换系数等级,并可输出量化的变换系数等级。这里,量化单元140可通过使用量化矩阵来对变换系数进行量化。
熵编码单元150可通过根据概率分布对由量化单元140计算出的值或对在编码处理中计算出的编码参数值等执行熵编码来产生比特流,并可输出产生的比特流。熵编码单元150可对用于对图像进行解码的信息执行熵编码,并对图像的像素的信息执行熵编码。例如,用于对图像进行解码的信息可包括语法元素等。
当熵编码被应用时,通过对具有高出现概率的符号分配少量比特并对具有低出现概率的符号分配大量比特来表示符号,从而减少对目标符号进行编码的比特流的大小。因此,通过熵编码,图像编码的压缩性能可提高。对于熵编码,熵编码单元150可使用诸如指数哥伦布、上下文自适应变长编码(CAVLC)以及上下文自适应二进制算术编码(CABAC)的编码方法。例如,熵编码单元150可通过使用变长编码/码(VLC)表来执行熵编码。此外,熵编码单元150可推导目标符号的二进制化方法以及目标符号/二进制位的概率模型,并且随后可通过使用推导出的二进制化方法或推导出的概率模型来执行算术编码。
为了对变换系数等级进行编码,熵编码单元150可通过使用变换系数扫描方法将二维块形式的系数改变为一维矢量形式。例如,通过用右上扫描来扫描块的系数,二维形式的系数可被改变为一维矢量。根据变换单元的尺寸以及帧内预测模式,可使用用于沿列方向扫描二维块形式的系数的垂直方向扫描以及用于沿行方向扫描二维块形式的系数的水平方向扫描,而不是使用右上扫描。也就是说,依据变换单元的尺寸以及帧内预测模式,可确定右上扫描、垂直方向扫描和水平方向扫描之中的哪种扫描方法将被使用。
编码参数可包括由编码器编码并被发送到解码器的诸如语法元素的信息,并可包括可在编码或解码处理中推导出的信息。编码参数可指对图像进行编码或解码所必要的信息。例如,编码参数可包括以下项中的至少一个值或组合形式:块尺寸、块深度、块分区信息、单元尺寸、单元深度、单元分区信息、四叉树形式的分区标志、二叉树形式的分区标志、二叉树形式的分区方向、帧内预测模式、帧内预测方向、参考样点滤波方法、预测块边界滤波方法、滤波器抽头、滤波器系数、帧间预测模式、运动信息、运动矢量、参考画面索引、帧间预测方向、帧间预测指示符、参考画面列表、运动矢量预测因子、运动矢量候选列表、关于运动合并模式是否被使用的信息、运动合并候选、运动合并候选列表、关于跳过模式是否被使用的信息、插值滤波器类型、运动矢量大小、运动矢量表示的精确度、变换类型、变换大小、关于附加(二次)变换是否被使用的信息、关于残差信号是否存在的信息、编码块样式、编码块标志、量化参数、量化矩阵、环路内的滤波器信息、关于滤波器是否在环路内被应用的信息、环路内的滤波器系数、二进制化/反二进制化方法、上下文模型、上下文二进制位、旁通二进制位、变换系数、变换系数等级、变换系数等级扫描方法、图像显示/输出顺序、条带识别信息、条带类型、条带分区信息、并行块识别信息、并行块类型、并行块分区信息、画面类型、比特深度、以及亮度信号或色度信号的信息。
残差信号可指原始信号与预测信号之间的差。可选择地,残差信号可以是通过对原始信号和预测信号之间的差进行变换而产生的信号。可选择地,残差信号可以是通过对原始信号和预测信号之间的差进行变换和量化而产生的信号。残差块可以是块单元的残差信号。
当编码设备100通过使用帧间预测执行编码时。编码的当前画面可被用作针对将被随后处理的另一图像的参考画面。因此,编码设备100可对编码的当前画面进行解码,并可将解码的图像存储为参考画面。为了执行解码,可对编码的当前画面执行反量化和逆变换。
量化的系数可通过反量化单元160被反量化,并可通过逆变换单元170被逆变换。可由加法器175将经过反量化和逆变换的系数与预测块相加,由此可产生重建块。
重建块可通过滤波器单元180。滤波器单元180可向重建块或重建画面应用去块滤波器、样点自适应偏移(SAO)以及自适应环路滤波器(ALF)中的至少一个。滤波器单元180可被称为环路滤波器。
去块滤波器可去除在块之间的边界处出现的块失真。为了确定去块滤波器是否被运行,可基于包括在块中的若干行或列中的像素来确定去块滤波器是否被应用于当前块。当去块滤波器被应用于块时,可依据所需的去块滤波器强度来应用强滤波器或弱滤波器。此外,在应用去块滤波器时,可并行处理水平方向滤波和垂直方向滤波。
样点自适应偏移可将最优偏移值添加到像素值以便对编码误差进行补偿。样点自适应偏移可针对每个像素对经过去块滤波的图像和原始画面之间的偏移进行校正。为了对特定画面执行偏移校正,可使用考虑每个像素的边缘信息来应用偏移的方法,或使用以下方法:将图像的像素分区为预定数量的区域,确定将被执行偏移校正的区域,并对所确定区域应用偏移校正。
自适应环路滤波器可基于通过将重建画面与原始画面进行比较而获得的值来执行滤波。图像的像素可被分区为预定组,被应用于每个组的一个滤波器被确定,并且不同的滤波可在每个组被执行。关于自适应环路滤波器是否被应用于亮度信号的信息可针对每个编码单元(CU)被发送。被应用于每个块的自适应环路滤波器的形状和滤波器系数可变化。此外,具有相同形式(固定形式)的自适应环路滤波器可在不考虑目标块的特性的情况下被应用。
经过滤波器单元180的重建块可被存储在参考画面缓冲器190中。
图2是示出根据本发明的实施例的解码设备的配置的框图。
解码设备200可以是视频解码设备或图像解码设备。
参照图2,解码设备200可包括熵解码单元210、反量化单元220、逆变换单元230、帧内预测单元240、运动补偿单元250、加法器255、滤波器单元260以及参考画面缓冲器270。
解码设备200可接收从编码设备100输出的比特流。解码设备200可按照帧内模式或帧间模式对比特流进行解码。此外,解码设备100可通过执行解码来产生重建画面,并可输出重建画面。
当在解码中使用的预测模式是帧内模式时,切换器可被切换到帧内。当在解码中使用的预测模式是帧间模式时,切换器可被切换到帧间。
解码设备200可从输入的比特流获得重建残差块,并可产生预测块。当重建残差块和预测块被获得时,解码设备200可通过将重建残差块与预测块相加来产生作为解码目标块的重建块。解码目标块可被称为当前块。
熵解码单元210可通过根据概率分布对比特流执行熵解码来产生符号。产生的符号可包括具有量化的变换系数等级的符号。这里,熵解码的方法可与上述熵编码的方法类似。例如,熵解码的方法可以是上述熵编码的方法的逆处理。
为了对变换系数等级进行解码,熵解码单元210可执行变换系数扫描,由此,一维矢量形式的系数可被改变为二维块形式。例如,通过用右上扫描来扫描块的系数,一维矢量形式的系数可被改变为二维块形式。根据变换单元的尺寸以及帧内预测模式,可使用垂直方向扫描以及水平方向扫描,而不是使用右上扫描。也就是说,依据变换单元的尺寸以及帧内预测模式,可确定在右上扫描、垂直方向扫描和水平方向扫描之中的哪种扫描方法被使用。
量化的变换系数等级可通过反量化单元220被反量化,并可通过逆变换单元230被逆变换。量化的变换系数等级被反量化并被逆变换以便产生重建残差块。这里,反量化单元220可对量化的变换系数等级应用量化矩阵。
当帧内模式被使用时,帧内预测单元240可通过执行空间预测来产生预测块,其中,空间预测使用与解码目标块相邻的先前解码块的像素值。
当帧间模式被使用时,运动补偿单元250可通过执行运动补偿来产生预测块,其中,运动补偿使用存储在参考画面缓冲器270中的参考画面以及运动矢量两者。当运动矢量的值不是整数时,运动补偿单元250可通过对参考画面中的部分区域应用插值滤波器来产生预测块。为了执行运动补偿,基于编码单元,可确定编码单元中的预测单元的运动补偿方法使用跳过模式、合并模式、AMVP模式和当前画面参考模式之中的哪种方法。此外,可依据所述模式执行运动补偿。这里,当前画面参考模式可指使用具有解码目标块的当前画面内的先前重建区域的预测模式。先前重建区域可不与解码目标块相邻。为了指定先前重建区域,可针对当前画面参考模式使用固定矢量。此外,指示解码目标块是否是按照当前画面参考模式被解码的块的标志或索引可被用信号传送,并可通过使用解码目标块的参考画面索引而被推导出。针对当前画面参考模式的当前画面可存在于针对解码目标块的参考画面列表内的固定位置(例如,参考画面索引为0的位置或最后的位置)。此外,当前画面可以可变地位于参考画面列表内,为此,可用信号传送指示当前画面的位置的参考画面索引。这里,用信号传送标志或索引可指编码器对相应的标志或索引进行熵编码并包括到比特流,解码器对来自比特流的相应的标志或索引进行熵解码。
可通过加法器255将重建残差块与预测块相加。通过将重建残差块和预测块相加而产生的块可经过滤波器单元260。滤波器单元260可对重建块或重建画面应用去块滤波器、样点自适应偏移和自适应环路滤波器中的至少一个。滤波器单元260可输出重建画面。重建画面可被存储在参考画面缓冲器270中,并可被用于帧间预测。
图3是示意性地示出当对图像进行编码和解码时的图像的分区结构的示图。图3示意性地示出将一个单元分区为多个子单元的实施例。
为了对图像进行有效分区,编码单元(CU)可在编码和解码中被使用。这里,编码单元可指进行编码的单元。单元可以是1)语法元素和2)包括图像样点的块的组合。例如,“单元的分区”可指“与单元相关的块的分区”。块分区信息可包括关于单元深度的信息。深度信息可指示单元被分区的次数或单元被分区的程度或两者。
参照图3,图像300针对每个最大编码单元(LCU)被顺序分区,并且分区结构针对每个LCU被确定。这里,LCU和编码树单元(CTU)具有相同的含义。一个单元可具有基于树结构的深度信息,并可被分层分区。每个分区出的子单元可具有深度信息。深度信息指示单元被分区的次数或单元被分区的程度或两者,因此,深度信息可包括关于子单元的尺寸的信息。
分区结构可指LCU 310中的编码单元(CU)的分布。CU可以是用于对图像进行有效编码/解码的单元。所述分布可基于一个CU是否将被多次(即等于或大于2的正整数,包括2、4、8、16等)分区而被确定。通过分区得到的CU的宽度尺寸和高度尺寸可分别为原始CU的一半宽度尺寸和一半高度尺寸。可选择地,根据分区的次数,分区出的CU的宽度尺寸和高度尺寸可分别小于原始CU的宽度尺寸和高度尺寸。分区出的CU可被递归地分区为多个进一步分区出的CU,其中,按照相同的分区方法,所述进一步分区出的CU具有比所述分区出的CU的宽度尺寸和高度尺寸更小的宽度尺寸和高度尺寸。
这里,CU的分区可被递归地执行直到预定深度。深度信息可以是指示CU的尺寸的信息,并且可针对每个CU被存储。例如,LCU的深度可以是0,并且最小编码单元(SCU)的深度可以是预定最大深度。这里,LCU可以是具有上述最大尺寸的编码单元,并且SCU可以是具有最小尺寸的编码单元。
每当LCU 310开始被分区,并且CU的宽度尺寸和高度尺寸通过分区操作而减小时,CU的深度增加1。在不能被分区的CU的情况下,CU针对每个深度可具有2N×2N尺寸。在能够被分区的CU的情况下,具有2N×2N尺寸的CU可被分区为多个N×N尺寸的CU。每当深度增加1时,N的尺寸减半。
例如,当一个编码单元被分区为四个子编码单元时,所述四个子编码单元之一的宽度尺寸和高度尺寸可分别为原始编码单元的一半宽度尺寸和一半高度尺寸。例如,当32×32尺寸的编码单元被分区为四个子编码单元时,所述四个子编码单元中的每一个可具有16×16尺寸。当一个编码单元被分区为四个子编码单元时,编码单元可按照四叉树形式被分区。
例如,当一个编码单元被分区为两个子编码单元时,所述两个子编码单元之一的宽度尺寸或高度尺寸可分别为原始编码单元的一半宽度尺寸或一半高度尺寸。例如,当32×32尺寸的编码单元被垂直分区为两个子编码单元时,所述两个子编码单元中的每一个可具有16×32尺寸。例如,当32×32尺寸的编码单元被水平分区为两个子编码单元时,所述两个子编码单元中的每一个可具有32×16尺寸。当一个编码单元被分区为两个子编码单元时,编码单元可按照二叉树形式被分区。
参照图3,具有最小深度0的LCU可以是64×64像素,并且具有最大深度3的SCU可以是8×8像素。这里,可由深度0来表示具有64×64像素的CU(即,LCU),可由深度1来表示具有32×32像素的CU,可由深度2来表示具有16×16像素的CU,并且可由深度3来表示具有8×8像素的CU(即,SCU)。
此外,可通过CU的分区信息来表示关于CU是否将被分区的信息。分区信息可以是1比特信息。分区信息可被包括在除SCU的所有CU中。例如,当分区信息的值为0时,CU可不被分区,当分区信息的值为1时,CU可被分区。
图4是示出可被包括在编码单元(CU)中的预测单元(PU)的形式的示图。
从LCU分区出的多个CU之中的不再被分区的CU可被分区为至少一个预测单元(PU)。该处理也可被称为分区。
PU可以是用于预测的基本单元。PU可按照跳过模式、帧间模式和帧内模式中的任一模式而被编码和解码。PU可依据所述模式按照各种形式被分区。
此外,编码单元可不被分区为多个预测单元,并且编码单元和预测单元可具有相同的尺寸。
如图4所示,在跳过模式中,CU可不被分区。在跳过模式中,可支持与不经分区的CU具有相同尺寸的2N×2N模式410。
在帧间模式中,在CU中可支持8个分区形式。例如,在帧间模式中,可支持2N×2N模式410、2N×N模式415、N×2N模式420、N×N模式425、2N×nU模式430、2N×nD模式435、nL×2N模式440以及nR×2N模式445。在帧内模式中,可支持2N×2N模式410和N×N模式425。
一个编码单元可被分区为一个或更多个预测单元。一个预测单元可被分区为一个或更多个子预测单元。
例如,当一个预测单元被分区为四个子预测单元时,所述四个子预测单元之一的宽度尺寸和高度尺寸可为原始预测单元的一半宽度尺寸和一半高度尺寸。例如,当32×32尺寸的预测单元被分区为四个子预测单元时,所述四个子预测单元中的每一个可具有16×16尺寸。当一个预测单元被分区为四个子预测单元时,预测单元可按照四叉树形式被分区。
例如,当一个预测单元被分区为两个子预测单元时,所述两个子预测单元之一的宽度尺寸或高度尺寸可为原始预测单元的一半宽度尺寸或一半高度尺寸。例如,当32×32尺寸的预测单元被垂直分区为两个子预测单元时,所述两个子预测单元中的每一个可具有16×32尺寸。例如,当32×32尺寸的预测单元被水平分区为两个子预测单元时,所述两个子预测单元中的每一个可具有32×16尺寸。当一个预测单元被分区为两个子预测单元时,预测单元可按照二叉树形式被分区。
图5是示出可被包括在编码单元(CU)中的变换单元(TU)的形式的示图。
变换单元(TU)可以是CU内的用于变换、量化、逆变换和反量化的基本单元。TU可具有正方形形状或矩形形状等。TU可按照CU的尺寸或CU的形式或两者而被独立确定。
从LCU分区出的CU之中的不再被分区的CU可被分区为至少一个TU。这里,TU的分区结构可以是四叉树结构。例如,如图5所示,一个CU 510可依据四叉树结构而被分区一次或更多次。一个CU被分区至少一次的情况可被称为递归分区。通过进行分区,一个CU 510可由具有不同尺寸的TU形成。可选择地,CU可依据对CU进行分区的垂直线的数量或对CU进行分区的水平线的数量或两者而被分区为至少一个TU。CU可被分区为彼此对称的TU,或者可被分区为彼此不对称的TU。为了将CU分区为彼此对称的TU,TU的尺寸/形状的信息可被用信号传送,并可从CU的尺寸/形状的信息推导出。
此外,编码单元可不被分区为变换单元,并且编码单元和变换单元可具有相同的尺寸。
一个编码单元可被分区为至少一个变换单元,并且一个变换单元可被分区为至少一个子变换单元。
例如,当一个变换单元被分区为四个子变换单元时,所述四个子变换单元之一的宽度尺寸和高度尺寸可分别为原始变换单元的一半宽度尺寸和一半高度尺寸。例如,当32×32尺寸的变换单元被分区为四个子变换单元时,所述四个子变换单元中的每一个可具有16×16尺寸。当一个变换单元被分区为四个子变换单元时,变换单元可按照四叉树形式被分区。
例如,当一个变换单元被分区为两个子变换单元时,所述两个子变换单元之一的宽度尺寸或高度尺寸可分别为原始变换单元的一半宽度尺寸或一半高度尺寸。例如,当32×32尺寸的变换单元被垂直分区为两个子变换单元时,所述两个子变换单元中的每一个可具有16×32尺寸。例如,当32×32尺寸的变换单元被水平分区为两个子变换单元时,所述两个子变换单元中的每一个可具有32×16尺寸。当一个变换单元被分区为两个子变换单元时,变换单元可按照二叉树形式被分区。
当执行变换时,可通过使用预定变换方法中的至少一种变换方法对残差块进行变换。例如,所述预定变换方法可包括离散余弦变换(DCT)、离散正弦变换(DST)、KLT等。可通过使用以下项中的至少一个来确定哪种变换方法被应用于对残差块进行变换:预测单元的帧间预测模式信息、预测单元的帧内预测模式信息以及变换块的尺寸/形状。指示变换方法的信息可被用信号传送。
图6是用于解释帧内预测的处理的实施例的示图。
帧内预测模式可以是非方向模式或方向模式。非方向模式可以是DC模式或平面模式。方向模式可以是具有特定方向或角度的预测模式,并且方向模式的数量可以是等于或大于1的M。方向模式可被指示为模式编号、模式值和模式角度中的至少一个。
帧内预测模式的数量可以是等于或大于1的N,包括非方向模式和方向模式。
帧内预测模式的数量可依据块的尺寸而变化。例如,当块的尺寸为4×4或8×8时,帧内预测模式的数量可以是67,当块的尺寸是16×16时,帧内预测模式的数量可以是35,当块的尺寸是32×32时,帧内预测模式的数量可以是19,当块的尺寸是64×64时,帧内预测模式的数量可以是7。
帧内预测模式的数量可被固定为N,而不管块的尺寸如何。例如,帧内预测模式的数量可被固定为35或67中的至少一个,而不管块的尺寸如何。
帧内预测模式的数量可依据颜色分量的类型而变化。例如,预测模式的数量可依据颜色分量是亮度信号还是色度信号而变化。
可通过使用重建邻近块中所包括的样点值或编码参数来执行帧内编码和/或解码。
为了按照帧内预测对当前块进行编码/解码,可识别包括在重建邻近块中的样点是否可用作编码/解码目标块的参考样点。当存在不能用作编码/解码目标块的参考样点的样点时,通过使用包括在重建邻近块中的样点中的至少一个样点,样点值被复制和/或插值到不能用作参考样点的样点,由此,不能用作参考样点的样点可被用作编码/解码目标块的参考样点。
在帧内预测中,基于帧内预测模式以及编码/解码目标块的尺寸中的至少一个,滤波器可被应用于参考样点或预测样点中的至少一个。这里,编码/解码目标块可指当前块,并且可指编码块、预测块和变换块中的至少一个。被应用于参考样点或预测样点的滤波器的类型可依据帧内预测模式或当前块的尺寸/形状中的至少一个而变化。滤波器的类型可依据滤波器抽头的数量、滤波器系数值或滤波器强度中的至少一个而变化。
在帧内预测模式之中的非方向平面模式中,当产生编码/解码目标块的预测块时,可根据样点位置通过使用当前样点的上参考样点、当前样点的左参考样点、当前块的右上参考样点、以及当前块的左下参考样点的加权和来产生预测块中的样点值。
在帧内预测模式之中的非方向DC模式中,当产生编码/解码目标块的预测块时,可通过当前块的上参考样点和当前块的左参考样点的均值来产生预测块。此外,可通过使用参考样点值对编码/解码块中与参考样点相邻的一个或更多个上方行以及一个或更多个左侧列执行滤波。
在帧内预测模式之中的多个方向模式(角度模式)的情况下,可通过使用右上参考样点和/或左下参考样点来产生预测块,并且所述多个方向模式可具有不同的方向。为了产生预测样点值,可执行实数单元的插值。
为了执行帧内预测方法,可从与当前预测块相邻的邻近预测块的帧内预测模式预测当前预测块的帧内预测模式。在通过使用从邻近帧内预测模式预测出的模式信息来预测当前预测块的帧内预测模式的情况下,在当前预测块和邻近预测块具有相同的帧内预测模式时,当前预测块和邻近预测块具有相同的帧内预测模式的信息可通过使用预定标志信息被发送。在当前预测块的帧内预测模式不同于邻近预测块的帧内预测模式时,可通过执行熵编码来对编码/解码目标块的帧内预测模式信息进行编码。
图7是用于解释帧间预测的处理的实施例的示图。
图7中示出的四角形可指示图像(或画面)。此外,图7的箭头可指示预测方向。也就是说,图像可根据预测方向被编码或解码或者被编码和解码。根据编码类型,每个图像可被分类为I画面(帧内画面)、P画面(单向预测画面)、B画面(双向预测画面)等。每个画面可依据每个画面的编码类型而被编码和解码。
当作为编码目标的图像是I画面时,画面本身可在无需帧间预测的情况下被帧内编码。当作为编码目标的图像是P画面时,可通过使用仅在前向的参考画面进行帧间预测或运动补偿来对图像进行编码。当作为编码目标的图像是B画面时,可通过使用在前向和逆向两者的参考画面进行帧间预测或运动补偿来对图像进行编码。可选择地,可通过使用在前向和逆向之一的参考画面进行帧间预测或运动补偿来对图像进行编码。这里,当帧间预测模式被使用时,编码器可执行帧间预测或运动补偿,并且解码器可响应于编码器执行运动补偿。通过使用参考画面被编码或解码或者被编码和解码的P画面和B画面的图像可被视为用于帧间预测的图像。
在下文中,将详细描述根据实施例的帧间预测。
可通过使用参考画面和运动信息两者来执行帧间预测或运动补偿。此外,帧间预测可使用上述跳过模式。
参考画面可以是当前画面的先前画面和后续画面中的至少一个。这里,帧间预测可依据参考画面来预测当前画面的块。这里,参考画面可指在对块进行预测时使用的图像。这里,参考画面内的区域可通过使用指示参考画面的参考画面索引(refIdx)、运动矢量等来指明。
帧间预测可选择参考画面和参考画面内与当前块相关的参考块。可通过使用选择的参考块来产生当前块的预测块。当前块可以是当前画面的块之中的作为当前编码目标或当前解码目标的块。
可由编码设备100和解码设备200从帧间预测的处理推导出运动信息。此外,推导出的运动信息可在执行帧间预测时被使用。这里,编码设备100和解码设备200可通过使用重建邻近块的运动信息或同位块(col块)的运动信息或两者来提高编码效率或解码效率或两者。col块可以是先前被重建的同位画面(col画面)内的与编码/解码目标块的空间位置相关的块。重建邻近块可以是当前画面内的块、以及通过编码或解码或者编码和解码两者先前被重建的块。此外,重建块可以是与编码/解码目标块相邻的块,或者是位于编码/解码目标块的外部拐角处的块,或者是两者。这里,位于编码/解码目标块的外部拐角处的块可以是与水平相邻于编码/解码目标块的邻近块垂直相邻的块。可选择地,位于编码/解码目标块的外部拐角处的块可以是与垂直相邻于编码/解码目标块的邻近块水平相邻的块。
编码设备100和解码设备200可分别确定存在于col画面内的与编码/解码目标块空间相关的位置处的块,并可基于确定的块来确定预定义的相对位置。所述预定义的相对位置可以是存在于与编码/解码目标块空间相关的位置处的块的内部位置或外部位置或者是内部位置和外部位置两者。此外,编码设备100和解码设备200可基于所确定的所述预定义的相对位置来分别推导出col块。这里,col画面可以是在参考画面列表中包括的至少一个参考画面中的一个画面。
推导运动信息的方法可根据编码/解码目标块的预测模式而变化。例如,被应用于帧间预测的预测模式可包括高级运动矢量预测(AMVP)、合并模式等。这里,合并模式可被称为运动合并模式。
例如,当AMVP作为预测模式被应用时,编码设备100和解码设备200可分别通过使用重建邻近块的运动矢量或col块的运动矢量或两者来产生运动矢量候选列表。重建邻近块的运动矢量或col块的运动矢量或者两者可被用作运动矢量候选。这里,col块的运动矢量可被称为时间运动矢量候选,重建邻近块的运动矢量可被称为空间运动矢量候选。
编码设备100可产生比特流,比特流可包括运动矢量候选索引。也就是说,编码设备100可通过对运动矢量候选索引进行熵编码来产生比特流。运动矢量候选索引可指示从包括在运动矢量候选列表中的运动矢量候选中选择出的最优运动矢量候选。运动矢量候选索引可通过比特流从编码设备100被发送到解码设备200。
解码设备200可从比特流对运动矢量候选索引进行熵解码,并可通过使用经过熵解码的运动矢量候选索引在运动矢量候选列表中所包括的运动矢量候选之中选择解码目标块的运动矢量候选。
编码设备100可计算解码目标块的运动矢量和运动矢量候选之间的运动矢量差(MVD),并对MVD进行熵编码。比特流可包括经过熵编码的MVD。MVD可通过比特流从编码设备100被发送到解码设备200。这里,解码设备200可从比特流对接收到的MVD进行熵解码。解码设备200可通过解码的MVD与运动矢量候选之和来推导出解码目标块的运动矢量。
比特流可包括指示参考画面的参考画面索引等,并且参考画面索引可被熵编码并通过比特流从编码设备100被发送到解码设备200。解码设备200可通过使用邻近块的运动信息来预测解码目标块的运动矢量,并可通过使用预测出的运动矢量以及运动矢量差来推导出解码目标块的运动矢量。解码设备200可基于推导出的运动矢量和参考画面索引信息来产生解码目标块的预测块。
作为推导运动信息的另一方法,合并模式被使用。合并模式可指多个块的运动的合并。合并模式可指一个块的运动信息被应用于另一个块。当合并模式被应用时,编码设备100和解码设备200可分别通过使用重建邻近块的运动信息或col块的运动信息或两者来产生合并候选列表。运动信息可包括以下至少一个:1)运动矢量、2)参考画面索引、以及3)帧间预测指示符。预测指示符可指示单向(L0预测、L1预测)或双向。
这里,合并模式可被应用于每个CU或每个PU。当合并模式在每个CU或每个PU被执行时,编码设备100可通过对预定义的信息进行熵解码来产生比特流,并可将比特流发送到解码设备200。比特流可包括所述预定义的信息。所述预定义的信息可包括:1)作为指示合并模式是否针对每个块分区被执行的信息的合并标志、2)作为指示与编码目标块相邻的邻近块之中的哪个块被合并的信息的合并索引。例如,与编码目标块相邻的邻近块可包括编码目标块的左邻近块、编码目标块的上邻近块、编码目标块的时间邻近块等。
合并候选列表可指示存储运动信息的列表。此外,合并候选列表可在执行合并模式之前被产生。存储在合并候选列表中的运动信息可以是以下运动信息中的至少一个:与编码/解码目标块相邻的邻近块的运动信息、参考画面中与编码/解码目标块相关的同位块的运动信息、通过对运动候选列表中存在的运动信息的预先组合而新产生的运动信息、以及零合并候选。这里,与编码/解码目标块相邻的邻近块的运动信息可被称为空间合并候选。参考画面中与编码/解码目标块相关的同位块的运动信息可被称为时间合并候选。
跳过模式可以是将邻近块本身的模式信息应用于编码/解码目标块的模式。跳过模式可以是用于帧间预测的模式之一。当跳过模式被使用时,编码设备100可对关于哪个块的运动信息被用作编码目标块的运动信息的信息进行熵编码,并可通过比特流将该信息发送到解码设备200。编码设备100可不将其它信息(例如,语法元素信息)发送到解码设备200。语法元素信息可包括运动矢量差信息、编码块标志以及变换系数等级中的至少一个。
在帧内预测或帧间预测之后产生的残差信号可通过作为量化处理的一部分的变换处理被变换到频域。这里,首次变换可使用DCT类型2(DCT-II)以及各种DCT、DST核。这些变换核可对残差信号执行用于沿水平和/或垂直方向执行1D变换的可分离变换,或者可对残差信号执行2D不可分离变换。
例如,在1D变换的情况下,在变换中使用的DCT和DST类型可使用如下表中所示的DCT-II、DCT-V、DCT-VIII、DST-I以及DST-VII。例如,如表1和表2中所示,可推导出通过合成变换集而在变换中使用的DCT或DST类型。
[表1]
变换集 | 变换 |
0 | DST_VII、DCT-VIII |
1 | DST-VII、DST-I |
2 | DST-VII、DCT-V |
[表2]
变换集 | 变换 |
0 | DST_VII、DCT-VIII、DST-I |
1 | DST-VII、DST-I、DCT-VIII |
2 | DST-VII、DCT-V、DST-I |
例如,如图8所示,根据帧内预测模式,不同的变换集针对水平方向和垂直方向被定义。接下来,编码器/解码器可通过使用当前编码/解码目标块的帧内预测模式和相关变换集的变换来执行变换和/或逆变换。在这种情况下,不对变换集执行熵编码/解码,并且编码器/解码器可根据相同的规则来定义变换集。在这种情况下,指示变换集的变换之中的哪种变换被使用的信息可被熵编码/解码。例如,当块的尺寸等于或小于64×64时,根据帧内预测模式,如表2中所示三个变换集被合成,并且三个变换被用于每个水平方向变换和垂直方向变换以组合并执行总共九个多变换方法。接下来,通过使用最优变换方法来对残差信号进行编码/解码,由此,编码效率可被提高。这里,为了对关于一个变换集中的三个变换之中哪个变换方法被使用的信息进行熵编码/解码,可使用截断一元二进制化。这里,为了进行垂直变换和水平变换中的至少一个,可对指示变换集的变换中的哪个变换被使用的信息执行熵编码/解码。
在完成上述首次变换之后,如图9中所示,编码器可针对变换系数执行二次变换以提高能量集中度。二次变换可执行用于沿水平和/或垂直方向执行1D变换的可分离变换,或者可执行2D不可分离变换。所使用的变换信息可被发送,或者可被编码器/解码器根据当前编码信息和邻近编码信息而推导出。例如,如1D变换,用于二次变换的变换集可被定义。不对该变换集执行熵编码/解码,并且编码器/解码器可根据相同的规则定义变换集。在这种情况下,指示变换集的变换之中的哪个变换被使用的信息可被发送,并且该信息可通过帧内预测或帧间预测被应用于至少一个残差信号。
变换候选的数量或类型中的至少一个针对每个变换集而不同。变换候选的数量或类型中的至少一个可基于以下至少一个而被不同地确定:块(CU、PU、TU等)的位置、尺寸、分区形式、以及预测模式(帧内/帧间模式)或帧内预测模式的方向/非方向。
解码器可依据二次逆变换是否被执行来执行二次逆变换,并可从二次逆变换的结果依据首次逆变换是否被执行来执行首次逆变换。
上述首次变换和二次变换可被应用于亮度/色度分量中的至少一个信号分量,或者可根据任意编码块的尺寸/形状被应用。可对指示首次变换/二次变换是否被使用以及任意编码块中的所使用的首次变换/二次变换两者的索引执行熵编码/解码。可选择地,所述索引可由编码器/解码器根据至少一条当前/邻近编码信息而默认推导出。
在帧内预测或帧间预测之后产生的残差信号在经过首次变换和/或二次变换之后经过量化处理,并且量化的变换系数经过熵编码处理。这里,如图10中所示,量化的变换系数可基于帧内预测模式或最小块的尺寸/形状中的至少一个,按照对角方向、垂直方向和水平方向被扫描。
此外,执行了熵解码的量化的变换系数可通过被逆扫描而按照块形式被布置,并且可对相关块执行反量化或逆变换中的至少一个。这里,作为逆扫描的方法,对角方向扫描、水平方向扫描和垂直方向扫描中的至少一个可被执行。
例如,在当前编码块的尺寸为8×8时,可对针对8×8的块的残差信号执行首次变换、二次变换以及量化,接下来,可根据图10中示出的三种扫描顺序方法中的至少一种针对四个4×4的子块中的每一个对量化的变换系数执行扫描和熵编码。此外,可通过执行熵解码来对量化的变换系数执行逆扫描。执行了逆扫描的量化的变换系数在经过反量化之后成为变换系数,并且二次逆变换或首次逆变换中的至少一个被执行,由此,重建残差信号可被产生。
在视频编码处理中,一个块可如图11所示被分区,并且与分区信息相应的指示符可被用信号传送。这里,分区信息可以是以下至少一个:分区标志(split_flag)、四叉/二叉树标志(QB_flag)、四叉树分区标志(quadtree_flag)、二叉树分区标志(binarytree_flag)以及二叉树分区类型标志(Btype_flag)。这里,split_flag是指示块是否被分区的标志,QB_flag是指示块是按照四叉树形式还是按照二叉树形式被分区的标志,quadtree_flag是指示块是否按照四叉树形式被分区的标志,binarytree_flag是指示块是否按照二叉树形式被分区的标志,Btype_flag是指示在二叉树形式的分区的情况下块是被垂直分区还是被水平分区的标志。
当分区标志为1时,它可指示分区被执行,当分区标志为0时,它可指示分区不被执行。在四叉/二叉树标志的情况下,0可指示四叉树分区,并且1可指示二叉树分区。可选择地,0可指示二叉树分区,1可指示四叉树分区。在二叉树分区类型标志的情况下,0可指示水平方向分区,1可指示垂直方向分区。可选择地,0可指示垂直方向分区,1可指示水平方向分区。
例如,可通过将如表3中示出的quadtree_flag、binarytree_flag和Btype_flag中的至少一个用信号传送来推导图11的分区信息。
[表3]
例如,可通过将如表4中示出的split_flag、QB_flag和Btype_flag中的至少一个用信号传送来推导图11的分区信息。
[表4]
可根据块的尺寸/形状仅按照四叉树形式或仅按照二叉树形式来执行分区方法。在这种情况下,split_flag可意为指示是按照四叉树形式还是按照二叉树形式执行分区的标志。块的尺寸/形状可根据块的深度信息来推导,并且深度信息可被用信号传送。
当块的尺寸在预定范围中时,可仅按照四叉树形式执行分区。这里,所述预定范围可被定义为仅能够按照四叉树形式被分区的最大块的尺寸或最小块的尺寸中的至少一个。可通过比特流用信号传送指示允许四叉树形式的分区的最大块/最小块的尺寸的信息,并且可以以序列、画面参数或条带(分段)中的至少一个为单位用信号传送该信息。可选择地,最大块/最小块的尺寸可以是在编码器/解码器中预设的固定尺寸。例如,当块的尺寸的范围是256×256至64×64时,可仅按照四叉树形式执行分区。在这种情况下,split_flag可以是指示是否按照四叉树形式执行分区的标志。
当块的尺寸在预定范围中时,可仅按照二叉树形式执行分区。这里,所述预定范围可被定义为仅能够按照二叉树形式被分区的最大块的尺寸或最小块的尺寸中的至少一个。可通过比特流用信号传送指示允许二叉树形式的分区的最大块/最小块的尺寸的信息,并且可以以序列、画面参数或条带(分段)中的至少一个为单位用信号传送该信息。可选择地,最大块/最小块的尺寸可以是在编码器/解码器中预设的固定尺寸。例如,当块的尺寸的范围是16×16至8×8时,可仅按照二叉树形式执行分区。在这种情况下,split_flag可以是指示是否按照二叉树形式执行分区的标志。
在按照二叉树形式对一个块进行分区之后,当分区出的块被进一步分区时,可仅按照二叉树形式执行分区。
当分区出的块的宽度尺寸或长度尺寸不能被进一步分区时,至少一个指示符可不被用信号传送。
除了基于四叉树的二叉树分区以外,基于四叉树的分区可在二叉树分区以后被执行。
基于上述描述,将详细描述根据本发明的对图像进行编码/解码的方法。
图12是示出根据本发明的通过使用合并模式对视频进行编码的方法的流程图。图13是示出根据本发明的通过使用合并模式对视频进行解码的方法的流程图。
参照图12,编码设备可在步骤S1201推导合并候选,并且可基于推导出的合并候选产生合并候选列表。当合并候选列表被产生时,在步骤S1202,通过使用产生的合并候选列表确定运动信息,并且在步骤S1203,可通过使用确定的运动信息来执行当前块的运动补偿。接下来,编码设备可在步骤S1204对关于运动补偿的信息进行熵编码。
参照图13,解码设备可在步骤S1301对从编码设备接收到的关于运动补偿的信息进行熵解码,并可在步骤S1302推导合并候选,并可基于推导出的合并候选产生合并候选列表。当合并候选列表被产生时,在步骤1303可通过使用产生的合并候选列表来确定当前块的运动信息。接下来,解码设备可在步骤S1304通过使用运动信息执行运动补偿。
在下文中,将详细描述图12和图13中示出的步骤。
首先,将详细描述在步骤S1201和S1302对合并候选的推导。
当前块的合并候选可包括空间合并候选、时间合并候选和附加合并候选中的至少一个。
可从与当前块邻近的重建块推导出当前块的空间合并候选。例如,与当前块邻近的重建块的运动信息可被确定为当前块的空间合并候选。这里,运动信息可包括运动矢量、参考画面索引和预测列表使用标志中的至少一个。
在这种情况下,空间合并候选的运动信息可包括与L0和L1相应的运动信息,以及与L0、L1、…、LX相应的运动信息。这里,X可以是包括零的正整数。因此,参考画面列表可包括L0、L1、…、LX中的至少一个。
图14是示出推导当前块的空间合并候选的示例的示图。这里,对空间合并候选的推导可指推导空间合并候选并将空间合并候选添加到合并候选列表。
参照图14,可从与当前块X相邻的邻近块推导出当前块的空间合并候选。与当前块相邻的邻近块可包括与当前块的上方相邻的块(B1)、与当前块的左侧相邻的块(A1)、与当前块的右上角相应的块(B0)、与当前块的左上角相邻的块(B2)和与当前块相邻的左下角相邻的块(A0)中的至少一个。同时,与当前块相邻的邻近块可具有正方形形状和非正方形形状。
为了推导当前块的空间合并候选,可确定与当前块相邻的邻近块能否被用于推导当前块的空间合并候选。这里,可根据预定优先级确定与当前块相邻的邻近块能否被用于推导当前块的空间合并候选。例如,在图14中示出的示例中,可根据在A1位置的块、在B1位置的块、在B0位置的块、在A0位置的块和在B2位置的块的顺序,确定推导空间合并候选的可用性。基于用于确定可用性的顺序确定的空间合并候选可被按顺序添加到当前块的合并候选列表。以下是不能用于推导当前块的空间合并候选的邻近块的示例。
1)当邻近块是在B2位置的块时从在A0位置的块、在A1位置的块、在B0位置的块和在B1位置的块推导空间合并候选的情况
2)邻近块不存在的情况(当前块存在于画面边界、条带边界或并行块边界等的情况)
3)邻近块被帧内编码的情况
4)邻近块的运动矢量、参考画面索引和参考画面中的至少一个与先前推导出的空间合并候选的运动矢量、参考画面索引和参考画面中的至少一个相同的情况
5)邻近块的运动矢量指向包括当前块的画面、条带和并行块中的至少一个的边界外部区域的情况
图15是示出将空间合并候选添加到合并候选列表的示例的示图。
参照图15,当从在A1位置的邻近块、在B0位置的邻近块、在A0位置的邻近块和在B2位置的邻近块推导出四个空间合并候选时,推导出的空间合并候选可被按顺序添加到合并候选列表。
maxNumSpatialMergeCand可表示能够包括在合并候选列表中的空间合并候选的最大数量,numMergeCand可表示包括在合并候选列表中的合并候选的数量。maxNumSpatialMergeCand可以是包括零的正整数。maxNumSpatialMergeCand可被预设以使编码设备和和解码设备使用相同的值。可选地,编码设备可对能够包括在当前块的合并候选列表中的合并候选的最大数量进行编码,并且该最大数量可通过比特流被用信号传送到解码设备。
如上所述,当从邻近块A1、B1、B0、A0和B2推导出至少一个空间合并候选时,可针对每个推导出的合并候选设置指示其是否是空间合并候选的空间合并候选标志信息(spatialCand)。例如,当空间合并候选被推导出时,spatialCand可被设置为预定值1。否则,spatialCand可被设置为预定值0。此外,每当空间合并候选被推导出,空间合并候选计数(spatialCandCnt)增加1。
可基于当前块或邻近块的编码参数中的至少一个来推导空间合并候选。
可在这些块中共享空间合并候选:这些块的尺寸小于关于运动补偿的信息被熵编码/解码的块或者这些块的深度深于关于运动补偿的信息被熵编码/解码的块。这里,关于运动补偿的信息可以是关于是否使用跳过模式的信息、关于是否使用合并模式的信息或者合并索引信息中的至少一个。
关于运动补偿的信息被熵编码/解码的块可以是CTU或CTU的子单元、CU或PU。
在下文中,为了便于解释,关于运动补偿的信息被熵编码/解码的块的尺寸被称为第一块尺寸。关于运动补偿的信息被熵编码/解码的块的深度被称为第一块深度。
具体地说,当当前块的尺寸小于第一块尺寸时,可从与具有第一块尺寸的高层块相邻的重建块中的至少一个推导出当前块的空间合并候选。此外,包括在高层块中的块可共享推导出的空间合并候选。这里,具有第一块尺寸的块可被称为当前块的高层块。
图16是示出在CTU中推导并共享空间合并候选的实施例的示图。参照图16,当第一块尺寸为32×32时,小于32×32的块1601、1602、1603和1604可从与具有第一块尺寸的高层块1600相邻的邻近块中的至少一个推导空间合并候选,并可共享推导出的空间合并候选。
例如,当第一块尺寸为32×32并且编码块的尺寸为32×32时,小于32×32的预测块可从当前块的邻近块的至少一条运动信息推导预测块的空间合并候选。编码块中的预测块可共享推导出的空间合并候选。这里,编码块和预测块可指作为更广义的表达方式的块。
当当前块的深度比第一块深度更深时,可从与具有第一块深度的更高块相邻的重建块中的至少一个推导空间合并候选。此外,包括在更高块中的块可共享推导出的空间合并候选。这里,具有第一块深度的块可被称为当前块的高层块。
例如,当第一块深度为2并且编码块的深度为2时,深度比块深度2更深的预测块可基于编码块的邻近块的至少一条运动信息推导预测块的空间合并候选。编码块中的预测块可共享推导出的空间合并候选。
这里,共享空间合并候选可表示可基于相同的空间合并候选产生共享块的各自的合并候选列表。
此外,共享空间合并候选可表示共享块可通过使用一个合并候选列表执行运动补偿。这里,共享的合并候选列表可包括基于关于运动补偿的信息被熵编码/解码的高层块推导出的空间合并候选中的至少一个。
与当前块相邻的邻近块或者当前块可具有正方形形状或非正方形形状。
此外,与当前块相邻的邻近块可被分区为子块。在这种情况下,在与当前块相邻的邻近块的子块之中,一个子块的运动信息可被确定为当前块的空间合并候选。此外,可基于与当前块相邻的邻近块的子块的至少一条运动信息来确定当前块的空间合并候选。这里,可确定邻近块的子块能否用于推导空间合并候选以确定当前块的空间合并候选。用于推导空间合并候选的可用性可包括以下项中的至少一个:邻近块的子块的运动信息是否存在、邻近块的子块的运动信息是否能够被用作当前块的空间合并候选。
此外,邻近块的子块的至少一条运动信息(即,运动矢量)的中值、平均值、最小值、最大值、加权平均值或模式之一可被确定为当前块的空间合并候选。
接下来,将描述推导当前块的时间合并候选的方法。
可从包括在当前画面的同位画面中的重建块推导当前块的时间合并候选。这里,同位画面是在当前画面之前已被编码/解码的画面。同位画面可以是与当前画面具有不同的时间顺序的画面。
图17是示出推导当前块的时间合并候选的示例的示图。这里,推导时间合并候选可表示推导时间合并候选并将时间合并候选添加到合并候选列表。
参照图17,在当前画面的同位画面中,可从包括在空间上与当前块X相同的位置所对应的块的外部位置的块或从包括在空间上与当前块X相同的位置所对应的块的内部位置的块推导出当前块的时间合并候选。这里,时间合并候选可指同位块的运动信息。例如,可从在空间上与当前块相同的位置所对应的块C的右下角所相邻的块H或从包括块C的中心点的块C3推导出当前块X的时间合并候选。被用于推导当前块的时间合并候选的块H或块C3可被称为“同位块”。
同时,当前块的同位块或当前块可具有正方形形状或非正方形形状。
当可从包括块C的外部位置的块H推导出当前块的时间合并候选时,块H可被设置为当前块的同位块。在这种情况下,可基于块H的运动信息推导当前块的时间合并候选。相反,当无法从块H推导出当前块的时间合并候选时,包括块C的内部位置的块C3可被设置为当前块的同位块。在这种情况下,可基于块C3的运动信息推导出当前块的时间合并候选。当无法从块H和块C推导出当前块的时间合并候选时(例如,当块H和块C3两者被帧内编码时),可不推导当前块的时间合并候选,或者可从位于与块H和块C3不同的位置的块推导当前块的时间合并候选。
作为另一示例,可从同位画面中的多个块推导当前块的时间合并候选。例如,可从块H和块C3推导当前块的多个时间合并候选。
图18是示出将时间合并候选添加到合并候选列表的示例的示图。
参照图18,当从位于H1位置的同位块推导出一个时间合并候选时,可将推导出的时间合并候选添加到合并候选列表。
当前块的同位块可被分区为子块。在这种情况下,在当前块的同位块的子块之中,一个子块的运动信息可被确定为当前块的时间合并候选。此外,可基于当前块的同位块的子块的至少一条运动信息来确定当前块的时间合并候选。
这里,可确定同位块的子块的运动信息是否存在或者同位块的子块的运动信息能否被用作当前块的时间合并候选以确定当前块的时间合并候选。
此外,同位块的子块的至少一条运动信息(即,运动矢量)的中值、平均值、最小值、最大值、加权平均值或模式之一可被确定为当前块的时间合并候选。
在图17中,可从与同位块的右下角相邻的块或从包括同位块的中心点的块推导当前块的时间合并候选。然而,用于推导当前块的时间合并候选的块的位置不限于图17中示出的示例。例如,可从与同位块的上/下边界、左/右边界或拐角相邻的块推导当前块的时间合并候选,并可从包括同位块中的特定位置的块(即,与同位块的拐角边界相邻的块)推导当前块的时间合并候选。
可通过考虑当前块和同位块的参考画面列表(或预测方向)来确定当前块的时间合并候选。同时,时间合并候选的运动信息可包括与L0和L1相应的运动信息以及与L0、L1、…、LX相应的运动信息。这里,X可以是包括零的正整数。
例如,当当前块可用的参考画面列表为L0时(即,当帧间预测指示符指示PRED_L0时),与同位块的L0相应的运动信息可被推导为当前块的时间合并候选。也就是说,当当前块可用的参考画面列表为LX时(这里,X为诸如0、1、2或3的整数,指示参考画面列表的索引),与同位块的LX相应的运动信息(在下文中被称为“LX运动信息”)可被推导为当前块的时间合并候选。
当当前块使用多个参考画面列表时,可通过考虑当前块和同位块的参考画面列表来确定当前块的时间合并候选。
例如,当对当前块执行双向预测时(即,帧间预测指示符为PRED_BI),从包括同位块的L0运动信息、L1运动信息、L2运动信息、…、和LX运动信息的组选择的至少两条信息可被推导为时间合并候选。当对当前块执行三向预测时(即,帧间预测指示符为PRED_TRI),从包括同位块的L0运动信息、L1运动信息、L2运动信息、…、和LX运动信息的组选择的至少三条信息可被推导为时间合并候选。当对当前块执行四向预测时(即,帧间预测指示符为PRED_QUAD),从包括同位块的L0运动信息、L1运动信息、L2运动信息、…、和LX运动信息的组选择的至少四条信息可被推导为时间合并候选。
此外,可基于当前块、邻近块和同位块的编码参数中的至少一个推导时间合并候选、同位画面、同位块、预测列表使用标志和参考画面索引中的至少一个。
当推导出的空间合并候选的数量少于合并候选的最大数量时,可预备推导时间合并候选。因此,当推导出的空间合并候选的数量达到合并候选的最大数量时,可省略推导时间合并候选的处理。
例如,当合并候选的最大数量为二,并且两个推导出的空间合并候选具有不同的值时,可省略推导时间合并候选的处理。
作为另一示例,可基于时间合并候选的最大数量推导当前块的时间合并候选。这里,时间合并候选的最大数量可被预设以使编码设备和解码设备使用相同的值。可选地,可通过比特流对指示当前块的时间合并候选的最大数量的信息进行编码,并可被用信号传送到解码设备。例如,编码设备可对指示当前块的时间合并候选的最大数量的maxNumTemporalMergeCand进行编码,并且maxNumTemporalMergeCand可通过比特流被用信号传送到解码设备。这里,maxNumTemporalMergeCand可被设置为包括0的正整数。例如,maxNumTemporalMergeCand可被设置为1。可基于关于被用信号传送的时间合并候选的数量的信息来不同地推导maxNumTemporalMergeCand的值,maxNumTemporalMergeCand可以是在编码器/解码器中预设的固定值。
当包括当前块的当前画面和当前块的参考画面之间的距离与包括同位块的同位画面和同位块的参考画面之间的距离不同时,可通过对同位块的运动矢量进行缩放来获得当前块的时间合并候选的运动矢量。这里,可基于由当前画面参考的参考画面和当前块之间的距离以及由同位画面参考的参考画面和同位块之间的距离中的至少一个来执行缩放。例如,根据由当前画面参考的参考画面和当前块之间的距离与由同位画面参考的参考画面和同位块之间的距离的比率,同位块的运动矢量被缩放,从而推导出当前块的时间合并候选的运动矢量。
基于关于运动补偿的信息被熵编码/解码的块的尺寸(第一块尺寸)或深度(第一块深度),可在这些块之中共享时间合并候选:这些块的尺寸小于关于运动补偿的信息被熵编码/解码的块,或者这些块的深度深于关于运动补偿的信息被熵编码/解码的块。这里,关于运动补偿的信息可以是关于是否使用跳过模式的信息、关于是否使用合并模式的信息和合并索引信息中的至少一个。
关于运动补偿的信息被熵编码/解码的块可以是CTU或CTU的子单元、CU或PU。
具体地,当当前块的尺寸小于第一块尺寸时,可从具有第一块尺寸的高层块的同位块推导出当前块的时间合并候选。此外,包括在高层块中的块可共享推导出的时间合并候选。
此外,当当前块的深度深于第一块深度时,可从具有第一块深度的高层块的同位块推导时间合并候选。此外,包括在高层块中的块可共享推导出的时间合并候选。
这里,共享时间合并候选可表示可基于相同的时间合并候选来产生共享块的各自的合并候选列表。
此外,共享时间合并候选可表示共享块可通过使用一个合并候选列表执行运动补偿。这里,共享的合并候选列表可包括基于关于运动补偿的信息被熵编码/解码的高层块推导出的时间合并候选。
图19是示出对同位块的运动信息的运动矢量进行缩放以推导当前块的时间合并候选的示例的示图。
可基于指示同位画面的显示顺序的POC(画面顺序计数)和同位块的参考画面的POC之间的差值(td)以及当前画面的POC和当前块的参考画面的POC之间的差值(tb)中的至少一个来对同位块的运动矢量进行缩放。
在执行缩放之前,td或tb可被调整使得td或tb存在于预定范围内。例如,当预定范围指示-128~127并且td或tb小于-128时,td或tb可被调整为-128。当td或tb大于127时,td或tb可被调整为127。当td或tb在-128~127的范围内时,td或tb不被调整。
可基于td或tb计算缩放因子DistScaleFactor。这里,可基于下面的公式1计算缩放因子。
【公式1】
DistScaleFactoe=(tb*tx+32)>>6
tx=(16384+Abs(td/2))/td
在公式1中,绝对值函数被指定为Abs(),该函数的输出值为输入值的绝对值。
基于公式1计算的缩放因子DistScaleFactor的值可被调整到预定范围。例如,DistScaleFactor可被调整为存在于-1024~1023的范围中。
通过使用缩放因子对同位块的运动矢量进行缩放,可确定当前块的时间合并候选的运动矢量。例如,可通过下面的公式2来确定当前块的时间合并候选的运动矢量。
【公式2】
Sign(SdistScaleFactor*mvCol)*((Abs(DistScaleFactor*mvCol)+127)>>8)
在公式2中,Sign()是输出()中的值的符号信息的函数。例如,Sign(-1)输出-。在公式2中,同位块的运动矢量可被指定为mvCol。
接下来,将描述推导当前块的附加合并候选的方法。
附加合并候选可指修改的空间合并候选、修改的时间合并候选、组合的合并候选和具有预定运动信息值的合并候选中的至少一个。这里,推导附加合并候选可表示推导附加合并候选,并将附加合并候选添加到合并候选列表。
修改的空间合并候选可指推导出的空间合并候选的至少一条运动信息被修改的合并候选。
修改的时间合并候选可指推导出的时间合并候选的至少一条运动信息被修改的合并候选。
组合的合并候选可指通过将合并候选列表中存在的空间合并候选、时间合并候选、修改的空间合并候选、修改的时间合并候选、组合的合并候选和具有预定运动信息值的合并候选的运动信息中的至少一条运动信息进行组合而推导出的合并候选。
可选地,组合的合并候选可指通过将空间合并候选、时间合并候选、修改的空间合并候选、修改的时间合并候选、组合的合并候选和具有预定运动信息值的合并候选的至少一条运动信息进行组合而推导出的合并候选。该空间合并候选和该时间合并候选是从不存在于合并候选列表但能够用于推导空间合并候选和时间合并候选中的至少一个的块推导出的。该修改的空间合并候选和该修改的时间合并候选是基于该空间合并候选和该时间合并候选产生的。
可选地,可通过使用由解码器从比特流熵解码出的运动信息来推导组合的合并候选。这里,在推导组合的合并候选时使用的运动信息可由编码器熵编码到比特流中。
组合的合并候选可指组合的双向预测合并候选。组合的双向预测合并候选是使用双向预测的合并候选,并可指具有L0运动信息和L1运动信息的合并候选。
此外,组合的合并候选可指具有从包括L0运动信息、L1运动信息、L2运动信息和L3运动信息的组选择的至少N个运动信息的合并候选。这里,N可指等于或大于2的正整数。
具有预定运动信息值的合并候选可指运动矢量为(0,0)的零合并候选。同时,具有预定运动信息值的合并候选可被预设以使编码设备和解码设备使用相同的值。
可基于当前块、邻近块和同位块的编码参数中的至少一个推导或产生修改的空间合并候选、修改的时间合并候选、组合的合并候选和具有预定运动信息值的合并候选中的至少一个。此外,可基于当前块、邻近块和同位块的编码参数中的至少一个,将修改的空间合并候选、修改的时间合并候选、组合的合并候选和具有预定运动信息值的合并候选中的至少一个添加到合并候选列表。
可针对当前块、邻近块或同位块的每个子块推导附加合并候选。针对每个子块推导出的合并候选可被添加到当前块的合并候选列表。
可仅在B条带/B画面的情况下或仅在使用M个参考画面列表的条带/画面的情况下推导附加合并候选。这里,M可以是3或4,并可指等于或大于3的正整数。
可推导至多N个附加合并候选。这里,N是包括0的正整数。N可以是基于关于包括在合并候选列表中的合并候选的最大数量的信息推导出的可变值。可选地,N可以是在编码器/解码器中预设的固定值。这里,N可根据在合并模式下被编码/解码的块的尺寸、形状、深度或位置而不同。
合并候选列表的大小是预设大小,并可增加在添加了空间合并候选或时间合并候选之后产生的附加合并候选的数量。在这种情况下,所有产生的附加合并候选可被包括在合并候选列表中。相反,合并候选列表的大小可被增加小于附加合并候选的数量的大小(例如,附加合并候选的数量-N,N是正整数)。在这种情况下,仅产生的附加合并候选的一部分可被包括在合并候选列表中。
此外,可基于当前块、邻近块或同位块的编码参数确定合并候选列表的大小,并可基于编码参数改变合并候选列表的大小。
为了增加编码器和解码器中的合并模式的吞吐量,可在不推导组合的合并候选的情况下仅通过空间合并候选推导、时间合并候选推导和零合并候选推导来执行使用合并模式的运动补偿。在需要相对较长的周期时间的时间合并候选推导处理之后执行组合的合并候选推导处理的情况下,当组合的合并候选推导处理不被执行时,合并模式的硬件复杂度的最坏情况可以是时间合并候选推导处理,而不是在时间合并候选推导处理之后的组合的合并候选推导处理。因此,可减少在合并模式下推导每个合并候选时所需要的周期时间。此外,在不推导组合的合并候选的合并模式下,合并候选推导处理之间不存在依赖性。因此,有利的是:可并行地执行空间合并候选推导、时间合并候选推导和零合并模式候选推导。
图21a和图21b是示出推导组合的合并候选的方法的实施例的示图。在推导组合的合并候选之前,当在合并候选列表中存在至少一个合并候选时,或者当合并候选列表中的合并候选的数量(numOrigMergeCand)小于合并候选的最大数量(MaxNumMergeCand)时,可执行图21a和图21b中的推导组合的合并候选的方法。
参照图21a和图21b,编码器/解码器可将输入的合并候选的数量(numInputMergeCand)设置为当前合并候选列表中的合并候选的数量(numMergeCand),并可将组合的索引(combIdx)设置为0。可推导第k(numMergeCand-numInputMergeCand)组合的合并候选。
在步骤S2101,编码器/解码器可通过使用如图20中示出的组合的索引来推导L0候选索引(l0CandIdx)、L1候选索引(l1CandIdx)、L2候选索引(l2CandIdx)和L3候选索引(l3CandIdx)中的至少一个。
每个候选索引可指示合并候选列表中的合并候选。根据L0、L1、L2和L3的候选索引的运动信息可以是关于组合的合并候选的L0、L1、L2和L3的运动信息。
在步骤S2102,编码器/解码器可将L0候选(l0Cand)推导为合并候选列表中的与L0候选索引相应的合并候选(mergeCandList[l0CandIdx]),可将L1候选(l1Cand)推导为合并候选列表中的与L1候选索引相应的合并候选(mergeCandList[l1CandIdx]),可将L2候选(l2Cand)推导为合并候选列表中的与L2候选索引相应的合并候选(mergeCandList[l2CandIdx]),并可将L3候选(l3Cand)推导为合并候选列表中的与L3候选索引相应的合并候选(mergeCandList[l3CandIdx])。
当在步骤S2103满足以下条件中的至少一个时,编码器/解码器可执行步骤S2104,否则可执行步骤S2105。
1)L0候选使用L0单向预测的条件(predFlagL0l0Cand==1)
2)L1候选使用L1单向预测的条件(predFlagL1l1Cand==1)
3)L2候选使用L2单向预测的条件(predFlagL2l2Cand==1)
4)L3候选使用L3单向预测的条件(predFlagL3l3Cand==1)
5)L0候选、L1候选、L2候选和L3候选的至少一个参考画面与另一候选的参考画面不同并且L0候选、L1候选、L2候选和L3候选的至少一个运动矢量与另一候选的运动矢量不同的条件
当在步骤S2103-是,上面提及的五个条件中的至少一个被满足时,在步骤S2104,编码器/解码器可将L0候选的L0运动信息确定为组合的候选的L0运动信息,可将L1候选的L1运动信息确定为组合的候选的L1运动信息,可将L2候选的L2运动信息确定为组合的候选的L2运动信息,可将L3候选的L3运动信息确定为组合的候选的L3运动信息,并可将组合的合并候选(combCandk)添加到合并候选列表。
例如,关于组合的合并候选的信息可与下述项相同。
第K组合的合并候选的L0参考画面索引(refIdxL0combCandk)=L0候选的L0参考画面索引(refIdxL0l0Cand)
第K组合的合并候选的L1参考画面索引(refIdxL1combCandk)=L1候选的L1参考画面索引(refIdxL1l1Cand)
第K组合的合并候选的L2参考画面索引(refIdxL2combCandk)=L2候选的L2参考画面索引(refIdxL2l2Cand)
第K组合的合并候选的L3参考画面索引(refIdxL3combCandk)=L3候选的L3参考画面索引(refIdxL3l3Cand)
第K组合的合并候选的L0预测列表使用标志(predFlagL0combCandk)=1
第K组合的合并候选的L1预测列表使用标志(predFlagL1combCandk)=1
第K组合的合并候选的L2预测列表使用标志(predFlagL2combCandk)=1
第K组合的合并候选的L3预测列表使用标志(predFlagL3combCandk)=1
第K组合的合并候选的L0运动矢量的x分量(mvL0combCandk[0])=L0候选的L0运动矢量的x分量(mvL0l0Cand[0])
第K组合的合并候选的L0运动矢量的y分量(mvL0combCandk[1])=L0候选的L0运动矢量的y分量(mvL0l0Cand[1])
第K组合的合并候选的L1运动矢量的x分量(mvL1combCandk[0])=L1候选的L1运动矢量的x分量(mvL1l1Cand[0])
第K组合的合并候选的L1运动矢量的y分量(mvL1combCandk[1])=L1候选的L1运动矢量的y分量(mvL1l1Cand[1])
第K组合的合并候选的L2运动矢量的x分量(mvL2combCandk[0])=L2候选的L2运动矢量的x分量(mvL2l2Cand[0])
第K组合的合并候选的L2运动矢量的y分量(mvL2combCandk[1])=L2候选的L2运动矢量的y分量(mvL2l2Cand[1])
第K组合的合并候选的L3运动矢量的x分量(mvL3combCandk[0])=L3候选的L3运动矢量的x分量(mvL3l3Cand[0])
第K组合的合并候选的L3运动矢量的y分量(mvL3combCandk[1])=L3候选的L3运动矢量的y分量(mvL3l3Cand[1])
numMergeCand=numMergeCand+1
此外,在步骤S2105,编码器/解码器可将组合的索引增加1。
此外,在步骤S2106,当组合的索引等于(numOrigMergeCand×(numOrigMergeCand-1))时或者当当前合并候选列表中的合并候选的数量(numMergeCand)等于合并候选的最大数量(MaxNumMergeCand)时,编码器/解码器可终止组合的合并候选推导步骤,否则可执行步骤S2101。
当执行图21a和图21b中的推导组合的合并候选的方法时,推导出的组合的合并候选可被添加到如图22中所示的合并候选列表。
同时,在推导组合的合并候选之前,当在合并候选列表中存在至少两个空间合并候选时,或者当合并候选列表中的合并候选的数量(numOrigMergeCand)小于合并候选的最大数量(MaxNumMergeCand)时,可执行通过仅使用空间合并候选推导组合的合并候选的方法。在这种情况下,可使用图21a和图21b中的推导组合的合并候选的方法。
然而,在图21a中的步骤S2101推导出的L0候选索引、L1候选索引、L2候选索引和L3候选索引可仅指示空间合并候选标志信息(spatialCand)为1的合并候选。因此,可通过使用合并候选列表中的空间合并候选标志信息(spatialCand)为1的合并候选,即,通过仅使用空间合并候选来推导在步骤S2102推导的L0候选、L1候选、L2候选和L3候选。
此外,在图21b的步骤S2106,将(spatialCandCnt×(spatialCandCnt-1))的值与组合的索引进行比较,而不将(numOrigMergeCand×(numOrigMergeCand-1))的值与组合的索引进行比较。当组合的索引等于(spatialCandCnt×(spatialCandCnt-1))时,或者当当前合并候选列表中的合并候选的数量(numMergeCand)等于‘MaxNumMergeCand’时,可终止组合的合并候选推导步骤,否则,可执行步骤S2101。
当执行通过仅使用空间合并候选推导组合的合并候选的方法时,仅与空间合并候选组合的组合的合并候选可被添加到如图23中所示的合并候选列表。
图22和图23是示出通过使用空间合并候选、时间合并候选和零合并候选中的至少一个来推导组合的合并候选,并将组合的合并候选添加到合并候选列表的示例的示图。
这里,具有L0运动信息、L1运动信息、L2运动信息和L3运动信息中的至少一条运动信息的合并候选可被包括在合并候选列表中。同时,L0、L1、L2和L3参考画面列表已作为示例被描述,但不限于此。具有关于L0~LX参考画面列表(X是正整数)的运动信息的合并候选可被包括在合并候选列表中。
每条运动信息可包括运动矢量、参考画面索引和预测列表使用标志中的至少一个。
如图22和图23所示,合并候选中的至少一个合并候选可被确定为最终合并候选。确定的最终合并候选可被用作当前块的运动信息。可在当前块的帧间预测或运动补偿中使用该运动信息。此外,通过改变与当前块的运动信息相应的信息的至少一个值,可在当前块的帧间预测或运动补偿中使用该运动信息。这里,在与运动信息相应的信息之中的将被改变的值可以是运动矢量的x分量、运动矢量的y分量和参考画面索引中的至少一个。此外,当改变与运动信息相应的信息的至少一个值时,与运动信息相应的信息的至少一个值可被改变使得通过使用失真计算方法(SAD、SSE、MSE等)以指示最小失真。
可根据合并候选的运动信息,通过使用L0运动信息、L1运动信息、L2运动信息和L3运动信息中的至少一条运动信息来产生当前块的预测块。可在当前块的帧间预测或运动补偿中使用产生的预测块。
当在产生预测块时使用L0运动信息、L1运动信息、L2运动信息和L3运动信息中的至少一条运动信息时,针对参考画面列表X,帧间预测指示符可被指示为作为指示PRED_L0或PRED_L1的单向预测的PRED_LX,以及作为双向预测的PRED_BI_LX。这里,X可指包括0的正整数,诸如0、1、2、3等。
此外,当从包括L0运动信息、L1运动信息、L2运动信息和L3运动信息的组中选择的至少三条信息被使用时,帧间预测指示符可被指示为作为三向预测的PRED_TRI。此外,当从包括L0运动信息、L1运动信息、L2运动信息和L3运动信息的组中选择的至少四条信息被使用时,帧间预测指示符可被指示为作为四向预测的PRED_QUAD。
例如,当针对参考画面列表L0的帧间预测指示符为PRED_L0以及针对针对参考画面列表L1的帧间预测指示符为PRED_BI_L1时,当前块的帧间预测指示符可以是PRED_TRI。也就是说,由针对每个参考画面列表的帧间预测指示符指示的预测块的数量的和可以是当前块的帧间预测指示符。
此外,可存在至少一个参考画面列表,诸如L0、L1、L2、L3等。可针对每个参考画面列表产生如图22和图23中所示的合并候选列表。因此,当产生当前块的预测块时,可产生至少一个至最多N个预测块以将被用于当前块的帧间预测或运动补偿。这里,N可指等于或大于1的正整数,诸如1、2、3、4等。
为了减少存储器带宽并提高处理速度,当合并候选的参考画面索引和运动矢量中的至少一个与另一合并候选的参考画面索引和运动矢量中的至少一个相同或者合并候选的参考画面索引和运动矢量中的至少一个在预测范围中时,可在推导组合的合并候选时使用合并候选的参考画面索引和运动矢量中的至少一个。
例如,在包括在合并候选列表中的合并候选之中,可在推导组合的合并候选时使用参考画面索引等于预定值的合并候选。这里,预定值可以是包括0的正整数。
作为另一示例,在包括在合并候选列表中的合并候选之中,可在推导组合的合并候选时使用参考画面索引在预定范围中的合并候选。这里,预定范围可以是包括0的正整数的范围。
作为另一示例,在包括在合并候选列表中的合并候选之中,可在推导组合的合并候选时使用运动矢量在预定范围中的合并候选。这里,预定范围可以是包括0的正整数的范围。
作为另一示例,在包括在合并候选列表中的合并候选之中,可在推导组合的合并候选时使用合并候选之间的运动矢量差值在预定范围中的合并候选。这里,预定范围可以是包括0的正整数的范围。
这里,可基于在编码器/解码器中共同设置的值来确定预定值和预定范围中的至少一个。此外,可基于被熵编码/解码的值来确定预定值和预定范围中的至少一个。
此外,在推导修改的空间合并候选、修改的时间合并候选和具有预定运动信息值的合并候选时,当合并候选的参考画面索引和运动矢量中的至少一个与另一合并候选的参考画面索引和运动矢量中的至少一个相同或者合并候选的参考画面索引和运动矢量中的至少一个在预测范围中时,可在推导组合的合并候选时使用合并候选的参考画面索引和运动矢量中的至少一个,其中,组合的合并候选可被推导并被添加到合并候选列表。
图24是示出在使用合并模式的运动补偿中通过仅使用空间合并候选推导组合的合并候选的优势的示图。
参照图24,为了增加编码器和解码器中的合并模式的吞吐量,可通过仅使用空间合并候选而不使用时间合并候选来推导组合的合并候选。与空间合并候选推导处理相比,时间合并候选推导处理由于运动矢量缩放而需要相对较长的周期时间。因此,在时间合并候选推导处理之后执行组合的合并候选推导处理的情况下,当通过使用合并模式确定运动信息时,需要较长的周期时间。
然而,当通过仅使用空间合并候选而不使用时间合并候选来推导组合的合并候选时,在与时间合并候选推导处理相比需要相对较短的周期时间的空间合并候选推导处理之后,可立即执行组合的合并候选推导处理。因此,与包括时间合并候选推导处理的方法相比,在通过使用合并模式确定运动信息时可减少需要的周期时间。
也就是说,通过去除时间合并候选推导处理和组合的合并候选推导处理之间的依赖性,可提高合并模式的吞吐量。此外,当由于传输错误等而在参考画面中发生差错时,可通过仅使用空间合并候选而不使用时间合并候选来推导组合的合并候选,从而可提高解码器的差错恢复。
此外,当使用通过仅使用空间合并候选而不使用时间合并候选来推导组合的合并候选的方法时,可以以相同的方式执行通过使用时间合并候选来推导组合的合并候选的方法和在不使用时间合并候选的情况下推导组合的合并候选的方法。可以以相同的方式实现所述方法,因此可将硬件逻辑集成。
图25是示出分割组合的双向预测合并候选的方法的实施例的示图。这里,组合的双向预测合并候选可以是包括L0运动信息、…、LX运动信息中的两条运动信息的组合的合并候选。在下文中,将在假设组合的双向预测合并候选包括L0运动信息和L1运动信息的情况下描述图25。
参照图25,编码器/解码器可将从合并候选列表中的组合的双向预测合并候选的信息分割出的L0运动信息和L1运动信息作为新的合并候选添加到合并候选列表。
具体地说,在步骤S2501,编码器/解码器可确定在合并候选列表中的被通过使用分割索引(splitIdx)执行分割的组合的双向预测合并候选。这里,分割索引(splitIdx)可以是指示被执行分割的组合的双向预测合并候选的索引信息。
在步骤S2502,编码器/解码器可将组合的双向预测合并候选的L0运动信息设置为L0分割候选的运动信息,并可将该运动信息添加到合并候选列表,并可将numMergeCand增加1。
编码器/解码器可确定当前合并候选列表中的合并候选的数量(numMergeCand)是否与合并候选的最大数量(MaxNumMergeCand)相同。当在步骤S2503-是,两者相同时,可终止分割处理。相反,当在步骤S2503-否,两者彼此不同时,在步骤S2504,编码器/解码器可将组合的双向预测合并候选的L1运动信息设置为L1分割候选的运动信息,并可将该运动信息添加到合并候选列表,并可将numMergeCand增加1。接下来,在步骤S2505,可将分割索引(splitIdx)增加1。
此外,在步骤S2506,当当前合并候选列表中的合并候选的数量(numMergeCand)等于合并候选的最大数量(MaxNumMergeCand)时,编码器/解码器可终止组合的合并候选分割处理,否则,可执行步骤S2501。
可仅在B条带/B画面的情况下或仅在使用至少M个参考画面列表的条带/画面的情况下,执行如图25中所示的对组合的双向预测合并候选进行分割的方法,其中,所述方法对双向合并候选进行分割。这里,M可以是三或四,并可指等于或大于三的正整数。
可通过使用以下方法中的至少一个方法来执行对组合的双向预测合并候选的分割:1)当组合的双向预测合并候选存在时将组合的双向预测合并候选分割为单向预测合并候选的方法、2)当组合的双向预测合并候选存在并且在组合的双向预测合并候选中L0参考画面和L1参考画面彼此不同时将组合的双向预测合并候选分割为单向预测合并候选的方法、3)当组合的双向预测合并候选存在并且在组合的双向预测合并候选中L0参考画面和L1参考画面相同时将组合的双向预测合并候选分割为单向预测合并候选的方法。
与使用一个参考画面中的重建像素数据的单向预测相比,组合的双向预测合并候选使用双向预测并且通过使用最多两个不同的参考画面中的重建像素数据执行运动补偿,因此在运动补偿中的存储器存取带宽大。因此,当使用对组合的双向预测合并候选的分割时,组合的双向预测合并候选被分割为单向预测合并候选。因此,当分割出的单向预测合并候选被确定为当前块的运动信息时,可减小在运动补偿中的存储器存取带宽。
编码器/解码器可推导具有运动矢量为(0,0)的零运动矢量的零合并候选。
零合并候选可指L0运动信息、L1运动信息、L2运动信息和L3运动信息中的至少一条运动信息的运动矢量为(0,0)的合并候选。
此外,零合并候选可以是两种类型中的至少一种。第一零合并候选可指运动矢量为(0,0)且参考画面索引的值等于或大于零的合并候选。第二零合并候选可指运动矢量为(0,0)且参考画面索引的值仅为零的合并候选。
当当前合并候选列表中的合并候选的数量(numMergeCand)与合并候选的最大数量(MaxNumMergeCand)不同时(即,当合并候选列表中的合并候选不满时),第一零合并候选和第二零合并候选中的至少一个可被重复地添加到合并候选列表,直到合并候选的数量(numMergeCand)等于合并候选的最大数量(MaxNumMergeCand)。
此外,第一零合并候选可被推导并被添加到合并候选列表。当合并候选列表中的合并候选不满时,第二零合并候选可被推导并被添加到合并候选列表。
图26是示出推导零合并候选的方法的实施例的示图。当当前合并候选列表中的合并候选的数量(numMergeCand)小于合并候选的最大数量(MaxNumMergeCand)时,可以以如图26中所示的相同顺序执行对零合并候选的推导。
首先,编码器/解码器可将输入的合并候选的数量(numInputMergeCand)设置为当前合并候选列表中的合并候选的数量(numMergeCand)。此外,零合并候选的参考画面索引(zeroIdx)可被设置为零。这里,第m(numMergeCand-numInputMergeCand)零合并候选可被推导。
在步骤S2601,编码器/解码器可确定条带类型(slice_type)是否为P条带。
当在步骤S2601-是,条带类型(slice_type)为P条带时,编码器/解码器可将参考画面的数量(numRefIdx)设置为L0列表中的可用参考画面的数量(num_ref_idx_l0_active_minus1+1)。
此外,在步骤S2602,编码器/解码器可如下推导零合并候选并可将numMergeCand增加1。
第m零合并候选的L0参考画面索引(refIdxL0zeroCandm)=零合并候选的参考画面索引(zeroIdx)
第m零合并候选的L1参考画面索引(refIdxL1zeroCandm)=-1
第m零合并候选的L0预测列表使用标志(predFlagL0zeroCandm)=1
第m零合并候选的L1预测列表使用标志(predFlagL1zeroCandm)=0
第m零合并候选的L0运动矢量的x分量(mvL0zeroCandm[0])=0
第m零合并候选的L0运动矢量的y分量(mvL0zeroCandm[1])=0
第m零合并候选的L1运动矢量的x分量(mvL1zeroCandm[0])=0
第m零合并候选的L1运动矢量的y分量(mvL1zeroCandm[1])=0
相反,当在步骤S2601-否,条带类型不为P条带(为B条带或另一条带)时,参考画面的数量(numRefIdx)可被设置为小于以下数量中的至少一个的值:L0列表中的可用参考画面的数量(num_ref_idx_l0_active_minus1+1)、L1列表中的可用参考画面的数量(num_ref_idx_l1_active_minus1+1)、L2列表中的可用参考画面的数量(num_ref_idx_l2_active_minus1+1)、L3列表中的可用参考画面的数量(num_ref_idx_l3_active_minus1+1)。
接下来,在步骤S2603,编码器/解码器可如下推导零合并候选并可将numMergeCand增加1。
refIdxL0zeroCandm=zeroIdx
refIdxL1zeroCandm=zeroIdx
refIdxL2zeroCandm=zeroIdx
refIdxL3zeroCandm=zeroIdx
predFlagL0zeroCandm=1
predFlagL1zeroCandm=1
predFlagL2zeroCandm=1
predFlagL3zeroCandm=1
mvL0zeroCandm[0]=0
mvL0zeroCandm[1]=0
mvL1zeroCandm[0]=0
mvL1zeroCandm[1]=0
mvL2zeroCandm[0]=0
mvL2zeroCandm[1]=0
mvL3zeroCandm[0]=0
mvL3zeroCandm[1]=0
在执行步骤S2602或步骤S2603之后,当参考画面计数(refCnt)等于参考画面的数量(numRefIdx)-1时,在步骤S2604,编码器/解码器可将零合并候选的参考画面索引(zeroIdx)设置为0,否则可将refCnt和zeroIdx增加1。
接下来,在步骤S2605,当numMergeCand等于MaxNumMergeCand时,编码器/解码器可终止零合并候选推导处理,否则可执行步骤S2601。
当图26中的推导零合并候选的方法被执行时,推导出的零合并候选可被添加到如图27中所示的合并候选列表。
图28是示出推导零合并候选的方法的另一实施例的示图。当当前合并候选列表中的合并候选的数量(numMergeCand)小于合并候选的最大数量(MaxNumMergeCand)时,可以以如图28中所示的相同顺序执行对L0单向预测零合并候选的推导。
首先,编码器/解码器可将输入的合并候选的数量(numInputMergeCand)设置为当前合并候选列表中的合并候选的数量(numMergeCand)。此外,零合并候选的参考画面索引(zeroIdx)可被设置为0。这里,第m(numMergeCand-numInputMergeCand)零合并候选可被推导。此外,参考画面的数量(numRefIdx)可被设置为L0列表中的可用参考画面的数量(num_ref_idx_l0_active_minus1+1)。
在步骤S2801,编码器/解码器可如下推导零合并候选并可将numMergeCand增加1。
第m零合并候选的L0参考画面索引(refIdxL0zeroCandm)=零合并候选的参考画面索引(zeroIdx)
第m零合并候选的L1参考画面索引(refIdxL1zeroCandm)=-1
第m零合并候选的L0预测列表使用标志(predFlagL0zeroCandm)=1
第m零合并候选的L1预测列表使用标志(predFlagL1zeroCandm)=0
第m零合并候选的L0运动矢量的x分量(mvL0zeroCandm[0])=0
第m零合并候选的L0运动矢量的y分量(mvL0zeroCandm[1])=0
第m零合并候选的L1运动矢量的x分量(mvL1zeroCandm[0])=0
第m零合并候选的L1运动矢量的y分量(mvL1zeroCandm[1])=0
当参考画面计数(refCnt)等于numRefIdx–1时,在步骤S2802,编码器/解码器可将zeroIdx设置为0,否则可将refCnt和zeroIdx增加1。
接下来,当在步骤S2803-是,numMergeCand等于MaxNumMergeCand时,编码器/解码器可终止零合并候选推导步骤,否则在步骤S2803-否,可执行步骤S2801。
在图26中的推导零合并候选的方法中,根据条带类型执行双向预测零合并候选推导或L0单向预测零合并候选推导。因此,根据条带类型需要两种实现方法。
在图28中的推导零合并候选的方法中,不根据条带类型执行双向预测零合并候选推导或L0单向预测零合并候选推导。不管条带类型,L0单向预测零合并候选被推导,由此硬件逻辑可简化。因此,在推导零合并候选时所需的周期时间可被减少。此外,当L0单向预测零合并候选而非双向预测零合并候选被确定为当前块的运动信息时,执行单向预测运动补偿而非双向预测运动补偿。因此,在运动补偿中能够减小存储器存取带宽。
例如,除了P条带的情况之外,L0单向预测零合并候选可被推导并被添加到合并候选列表。
编码器/解码器可将除了零合并候选之外的其它合并候选添加到合并候选列表,并随后可添加L0单向预测零合并候选。此外,编码器/解码器可使用L0单向预测零合并候选来初始化合并候选列表,并随后可将空间合并候选、时间合并候选、组合的合并候选、零合并候选、附加合并候选等添加到初始化后的合并候选列表。
图29是示出在CTU中推导并共享合并候选列表的实施例的示图。可在尺寸小于预定块的块或深度深于预定块的块中共享合并候选列表。这里,预定块的尺寸或深度可以是关于运动补偿的信息被熵编码/解码的块的尺寸或深度。此外,预定块的尺寸或深度可以是在编码器中被熵编码且在解码器中被熵解码的信息,并可以是在编码器/解码器中共同预设的值。
参照图29,当预定块的尺寸为128×128时,尺寸小于128×128的块(图29中的斜线区域中的块)可共享合并候选列表。
接下来,将详细描述通过使用在步骤S1202和S1303产生的合并候选列表来确定当前块的运动信息。
编码器可通过运动估计确定合并候选列表中的合并候选之中的在运动补偿中使用的合并候选,并可将指示确定的合并候选的合并候选索引(merge_idx)编码在比特流中。
同时,为了产生预测块,编码器可基于合并候选索引从合并候选列表选择合并候选以确定当前块的运动信息。这里,可通过基于确定的运动信息执行运动补偿来产生当前块的预测块。
例如,当合并候选索引为三时,合并候选列表中的由合并候选索引3指示的合并候选可被确定为运动信息,并可在编码目标块的运动补偿中被使用。
解码器可对比特流中的合并候选索引进行解码以确定合并候选列表中的由合并候选索引指示的合并候选。确定的合并候选可被确定为当前块的运动信息。确定的运动信息可在当前块的运动补偿中被使用。这里,运动补偿可表示帧间预测。
例如,当合并候选索引为二时,合并候选列表中的由合并候选索引2指示的合并候选可被确定为运动信息,并可在编码目标块的运动补偿中被使用。
此外,通过改变与当前块的运动信息相应的信息的至少一个值,运动信息可在当前块的帧间预测或运动补偿中被使用。这里,改变的与运动信息相应的信息的值可以是运动矢量的x分量、运动矢量的y分量和参考画面索引中的至少一个。此外,当改变与运动信息相应的信息的至少一个值时,与运动信息相应的信息的至少一个值可被改变使得通过使用失真计算方法(SAD、SSE、MSE等)指示最小失真。
接下来,将详细描述在步骤S1203和S1304通过使用确定的运动信息来执行当前块的运动补偿。
编码器和解码器可通过使用确定的合并候选的运动信息来执行帧间预测或运动补偿。这里,当前块(编码/解码目标块)可具有确定的合并候选的运动信息。
当前块可根据预测方向具有至少一条至最多N条运动信息。可通过使用运动信息产生至少一个至最多N个预测块以推导当前块的最终预测块。
例如,当当前块具有一条运动信息时,通过使用运动信息产生的预测块可被确定为当前块的最终预测块。
相反,当当前块具有数条运动信息时,可通过使用这数条运动信息产生数个预测块,并可基于这数个预测块的加权和确定当前块的最终预测块。分别包括由数条运动信息指示的数个预测块的参考画面可被包括在不同的参考画面列表中,并可被包括在相同的参考画面列表中。此外,当当前块具有数条运动信息时,数个参考画面的数条运动信息可指示相同的参考画面。
例如,可基于空间合并候选、时间合并候选、修改的空间合并候选、修改的时间合并候选、具有预定运动信息值的合并候选或组合的合并候选、和附加合并候选中的至少一个来产生多个预测块。可基于所述多个预测块的加权和确定当前块的最终预测块。
作为另一示例,可基于由预设合并候选索引指示的合并候选产生多个预测块。可基于所述多个预测块的加权和确定当前块的最终预测块。此外,可基于存在于预设的合并候选索引范围中的合并候选来产生多个预测块。可基于所述多个预测块的加权和确定当前块的最终预测块。
被应用于每个预测块的加权因子可具有相同的值1/N(这里,N是产生的预测块的数量)。例如,当产生两个预测块时,被应用于每个预测块的加权因子可以是1/2。当产生三个预测块时,被应用于每个预测块的加权因子可以是1/3。当产生四个预测块时,被应用于每个预测块的加权因子可以是1/4。可选地,可通过将不同的加权因子应用到预测块来确定当前块的最终预测块。
加权因子不必针对每个预测块具有固定值,并可针对每个预测块具有可变值。这里,被应用于预测块的加权因子可相同,并可彼此不同。例如,当产生两个预测块时,针对每个块,被应用于两个预测块的加权因子可以是可变值,诸如(1/2,1/2)、(1/3,2/3)、(1/4,3/4)、(2/5,3/5)、(3/8,,5/8)等。同时,加权因子可以是正实数和负实数。例如,加权因子可以是负实数,诸如(-1/2,3/2)、(-1/3,4/3)、(-1/4,5/4)等。
同时,为了应用可变加权因子,可通过比特流用信号传送针对当前块的至少一条加权因子信息。可针对每个预测块用信号传送加权因子信息,可针对每个参考画面用信号传送加权因子信息。多个预测块可共享一条加权因子信息。
编码器和解码器可基于预测块列表使用标志确定是否使用合并候选的运动信息。例如,当针对每个参考画面列表,预测块列表使用标志指示第一值1时,其可指示编码器和解码器可使用当前块的合并候选的运动信息来执行帧间预测或运动补偿。当预测块列表使用标志指示第二值0时,其可指示编码器和解码器不通过使用当前块的合并候选的运动信息来执行帧间预测或运动补偿。同时,预测块列表使用标志的第一值可被设置为0,其第二值可被设置为1。
下面的公式3至公式5示出当每个当前块的帧间预测指示符为PRED_BI(或当当前块可使用两条运动信息)、PRED_TRI(或当当前块可使用三条运动信息)和PRED_QUAD(或当当前块可使用四条运动信息),并且针对每个参考画面列表的预测方向为单向时,产生当前块的最终预测块的示例。
【公式3】
P_BI=(WF_L0*P_L0+OFFSET_L0+WF_L1*P_L1+OFFSET_L1+RF)>>1
【公式4】
P_TRI=(WF_L0*P_L0+OFFSET_L0+WF_L1*P_L1+OFFSET_L1+WF_L2*P_L2+OFFSET_L2+RF)/3
【公式5】
P_QUAD=(WF_L0*P0+OFFSET_L0+WF_L1*P_L1+OFFSET_L1+WF_L2*P_L2+OFFSET_L2+WF_L3*P_L3+OFFSET_L3+RF)>>2
在公式3至公式5中,当前块的最终预测块可被指定为P_BI、P_TRI和P_QUAD,参考画面列表可被指定为LX(X=0,1,2,3)。通过使用LX产生的预测块的加权因子值可被指定为WF_LX。通过使用LX产生的预测块的偏移值可被指定为OFFSET_LX。通过使用针对当前块的LX的运动信息产生的预测块可被指定为P_LX。舍入因子可被指定为RF,并可被设置为0、正数、或负数。LX参考画面列表可包括长期参考画面、未被执行去块滤波的参考画面、未被执行样点自适应偏移的参考画面、未被执行自适应环路滤波的参考画面、被执行去块滤波和自适应偏移的参考画面、被执行去块滤波和自适应环路滤波的参考画面、被执行样点自适应偏移和自适应环路滤波的参考画面、被执行去块滤波、样点自适应偏移和自适应环路滤波的参考画面中的至少一个。在这种情况下,LX参考画面列表可以是L0参考画面列表、L1参考画面列表、L2参考画面列表和L3参考画面列表中的至少一个。
当针对预定参考画面列表的预测方向为多个方向时,可基于预测块的加权和来获得针对当前块的最终预测块。这里,被应用于从相同的参考画面列表推导的预测块的加权因子可具有相同的值,并可具有不同的值。
针对多个预测块的加权因子(WF_LX)和偏移(OFFSET_LX)中的至少一个可以是被熵编码/解码的编码参数。
作为另一示例,可从与当前块相邻的编码/解码的邻近块推导加权因子和偏移。这里,当前块的邻近块可包括在推导当前块的空间合并候选时使用的块和在推导当前块的时间合并候选时使用的块中的至少一个。
作为另一示例,可基于当前画面和参考画面的显示顺序(POC)确定加权因子和偏移。在这种情况下,当当前画面离参考画面远时,加权因子或偏移可被设置为较小的值,当当前画面离参考画面近时,加权因子或偏移可被设置为较大的值。例如,当当前画面与L0参考画面之间的POC差为2时,被应用于通过参考L0参考画面而产生的预测块的加权因子值可被设置为1/3。相反,当当前画面与L0参考画面之间的POC差为1时,被应用于通过参考L0参考画面而产生的预测块的加权因子值可被设置为2/3。如上所述,加权因子或偏移值可与当前画面和参考画面之间的显示顺序差成反比。作为另一示例,加权因子或偏移值可与当前画面和参考画面之间的显示顺序差成正比。
作为另一示例,基于当前块、邻近块和同位块的编码参数中的至少一个,加权因子和偏移中的至少一个可被熵编码/解码。此外,基于当前块、邻近块和同位块的编码参数中的至少一个,可计算预测块的加权和。
多个预测块的加权和可仅被应用于预测块中的部分区域。这里,部分区域可以是预测块中的与边界相应的区域。如上所述,为了将加权和仅应用于部分区域,可针对预测块的每个子块应用加权和。
接下来,将详细地描述在步骤S1204和S1301对关于运动补偿的信息进行熵编码/解码。
图30和图31是示出关于运动补偿的信息的语法的示例的示图。图30示出编码单元(coding_unit)中的关于运动补偿的信息的语法的示例。图31示出预测单元(prediction_unit)中的关于运动补偿的信息的语法的示例。
编码设备可通过比特流对关于运动补偿的信息进行熵编码,解码设备可对包括在比特流中的关于运动补偿的信息进行熵解码。这里,被熵编码/解码的关于运动补偿的信息可包括关于是否使用跳过模式的信息(cu_skip_flag)、关于是否使用合并模式的信息(merge_flag)、合并索引信息(merge_index)、帧间预测指示符(inter_pred_idc)、加权因子值(wf_l0,wf_l1,wf_l2,wf_l3)和偏移值(offset_l0,offset_l1,offset_l2,offset_l3)中的至少一个。可在CTU、编码块和预测块中的至少一个中对关于运动补偿的信息进行熵编码/解码。
当关于是否使用跳过模式的信息(cu_skip_flag)具有第一值1时,其可指示使用跳过模式。当关于是否使用跳过模式的信息(cu_skip_flag)具有第二值2时,其可指示不使用跳过模式。可基于关于是否使用跳过模式的信息,通过使用跳过模式来执行当前块的运动补偿。
当关于是否使用合并模式的信息(merge_flag)具有第一值1时,其可指示使用合并模式。当关于是否使用合并模式的信息(merge_flag)具有第二值2时,其可指示不使用合并模式。可基于关于是否使用合并模式的信息,通过使用合并模式来执行当前块的运动补偿。
合并索引信息(merge_index)可指指示合并候选列表中的合并候选的信息。
此外,合并索引信息可指关于合并索引的信息。
此外,合并索引信息可指示与当前块空间上/时间上相邻的重建块之中的推导合并候选的块。
此外,合并索引信息可指示合并候选的至少一条运动信息。例如,当合并索引信息具有第一值0时,其可指示合并候选列表中的第一合并候选。当合并索引信息具有第二值1时,其可指示合并候选列表中的第二合并候选。当合并索引信息具有第三值2时,其可指示合并候选列表中的第三合并候选。以相同的方式,当合并索引信息具有第四值至第N值时,其可根据合并候选列表中的顺序指示与该值相应的合并候选。这里,N可指包括0的正整数。
可基于合并模式索引信息,通过使用合并模式来执行当前块的运动补偿。
当在帧间预测下对当前块进行编码/解码时,帧间预测指示符可指当前块的帧间预测方向和预测方向的数量中的至少一个。例如,帧间预测指示符可指示单向预测或多向预测(诸如双向预测、三向预测、四向预测等)。帧间预测指示符可指当当前块产生预测块时使用的参考画面的数量。可选地,一个参考画面可被用于多向预测。在这种情况下,M个参考画面被用于执行N(N>M)向预测。帧间预测指示符可指在执行运动补偿时使用的预测块的数量或当前块的帧间预测。
如上所述,根据帧间预测指示符,可确定在产生当前块的预测块时使用的参考画面的数量、在执行当前块的帧间预测或运动补偿时使用的预测块的数量或可用于当前块的参考画面列表的数量等。这里,参考画面列表的数量为正整数N,诸如1、2、3、4或更大。例如,参考画面列表可包括L0、L1、L2、L3等。可通过使用至少一个参考画面列表对当前块执行运动补偿。
例如,通过使用至少一个参考画面列表,当前块可产生至少一个预测块,以执行当前块的运动补偿。例如,可通过使用参考画面列表L0产生一个或更多个预测块以执行运动补偿。可选地,可通过使用参考画面列表L0和L1产生一个或更多个预测块来执行运动补偿。可选地,可通过使用参考画面列表L0、L1和L2产生一个或更多个预测块或最多N个预测块(这里,N是等于或大于3或2的正整数)以执行运动补偿。可选地,可通过使用参考画面列表L0、L1、L2和L3产生一个或更多个预测块或者最多N个预测块(这里,N为等于或大于4或2的正整数)以执行当前块的运动补偿。
参考画面指示符可根据当前块的预测方向的数量来指示单向(PRED_LX)、双向(PRED_BI)、三向(PRED_TRI)、四向(PRED_QUAD)或更多的方向。
例如,当执行针对每个参考画面列表的单向预测时,帧间预测指示符PRED_LX可表示通过使用参考画面列表LX(X是诸如0、1、2或3等的整数)产生一个预测块并通过使用产生的一个预测块执行帧间预测或运动补偿。帧间预测指示符PRED_BI可表示通过使用L0、L1、L2和L3参考画面列表中的至少一个来产生两个预测块并通过使用产生的两个预测块来执行帧间预测或运动补偿。帧间预测指示符PRED_TRI可表示通过使用L0、L1、L2和L3参考画面列表中的至少一个来产生三个预测块并通过使用产生的三个预测块来执行帧间预测或运动补偿。帧间预测指示符PRED_QUAD可表示通过使用L0、L1、L2和L3参考画面列表中的至少一个来产生四个预测块并通过使用产生的四个预测块来执行帧间预测或运动补偿。也就是说,在执行当前块的帧间预测时使用的预测块的数量的和可被设置为帧间预测指示符。
当执行针对参考画面列表的多向预测时,帧间预测指示符PRED_BI可表示执行针对L0参考画面列表的双向预测。帧间预测指示符PRED_TRI可表示:执行针对L0参考画面列表的三向预测;执行针对L0参考画面列表的单向预测并执行针对L1参考画面列表的双向预测;或者执行针对L0参考画面列表的双向预测并执行针对L1参考画面列表的单向预测。
如上所述,帧间预测指示符可表示从至少一个参考画面列表产生至少一个至最多N(这里,N是由帧间预测指示符指示的预测方向的数量)个预测块以执行运动补偿。可选地,帧间预测指示符可表示从N个参考画面产生至少一个至最多N个预测块并且通过使用产生的预测块执行针对当前块的运动补偿。
例如,帧间预测指示符PRED_TRI可表示通过使用L0、L1、L2和L3参考画面列表中的至少一个产生三个预测块以执行当前块的帧间预测或运动补偿。可选地,帧间预测指示符PRED_TRI可表示通过使用从包括L0、L1、L2和L3参考画面列表的组中选择的至少三个产生三个预测块以执行当前块的帧间预测或运动补偿。此外,帧间预测指示符PRED_QUAD可表示通过使用L0、L1、L2和L3参考画面列表中的至少一个产生四个预测块以执行当前块的帧间预测或运动补偿。可选地,帧间预测指示符PRED_QUAD可表示通过使用从包括L0、L1、L2和L3参考画面列表的组中选择的至少四个产生四个预测块以执行当前块的帧间预测或运动补偿。
可根据帧间预测指示符确定可用帧间预测方向,并可基于当前块的尺寸和/或形状可选地使用可用帧间预测方向中的全部或一些。
预测列表使用标志指示是否通过使用参考画面列表产生预测块。
例如,当预测列表使用标志指示第一值1时,其可指示通过使用参考画面列表产生预测块。当预测列表使用标志指示第二值0时,其可指示不通过使用参考画面列表产生预测块。这里,预测列表使用标志的第一值可被设置为0,预测列表使用标志的第二值可被设置为1。
也就是说,当预测列表使用标志指示第一值时,可通过使用与参考画面列表相应的运动信息产生当前块的预测块。
同时,可基于帧间预测指示符设置预测列表使用标志。例如,当帧间预测指示符指示PRED_LX、PRED_BI、PRED_TRI或PRED_QUAD时,预测列表使用标志predFlagLX可被设置为第一值1。当帧间预测指示符是PRED_LN(N是除了X之外的正整数)时,预测列表使用标志predFlagLX可被设置为第二值0。
此外,可基于预测列表使用标志来设置帧间预测指示符。例如,当预测列表使用标志predFlagL0和predFlagL1指示第一值1时,帧间预测指示符可被设置为PRED_BI。例如,当仅预测列表使用标志predFlagL0指示第一值1时,帧间预测指示符可被设置为PRED_L0。
当在针对当前块的运动补偿期间产生两个或更多个预测块时,可通过针对每个预测块的加权和来产生当前块的最终预测块。当计算加权和时,可针对每个预测块应用加权因子和偏移中的至少一个。可针对参考画面列表、参考画面、运动矢量候选索引、运动矢量差、运动矢量、关于是否使用跳过模式的信息、关于是否使用合并模式的信息、合并索引信息中的至少一个,对在计算加权和时使用的加权和因子(诸如加权因子或偏移等)进行熵编码/解码。此外,可基于帧间预测指示符对每个预测块的加权和因子进行熵编码/解码。这里,加权和因子可包括加权因子和偏移中的至少一个。
可由指定编码设备和解码设备中的预定设置之一的索引信息来推导加权和因子。在这种情况下,可对用于指定加权因子和偏移中的至少一个的索引信息进行熵编码/解码。可针对加权因子和偏移分别定义编码器和解码器中的预定设置。预定设置可包括至少一个加权因子候选或至少一个偏移候选。可选地,可使用定义加权因子和偏移之间的映射关系的表。在这种情况下,可通过使用一条索引信息来从表中获得针对预测块的加权因子值和偏移值。可对关于映射到针对被熵编码/解码的加权因子的每条索引信息的偏移的索引信息进行熵编码/解码。
与加权和因子相关的信息可按照块单元被熵编码/解码,并可在更高层被熵编码/解码。例如,加权因子或偏移可按照诸如CTU、CU或PU等的块单元被熵编码/解码,或者可在诸如视频参数集、序列参数集、画面参数集、自适应参数集或条带头等的更高层被熵编码/解码。
可基于加权和因子和加权和因子预测值之间的加权和因子差值来对加权和因子进行熵编码/解码。例如,加权因子预测值和加权因子差值可被熵编码/解码,或者偏移预测值和偏移差值可被熵编码/解码。这里,加权因子差值可指示加权因子和加权因子预测值之间的差值,偏移差值可指示偏移和偏移预测值之间的差值。
这里,加权和因子差值按照块单元被熵编码/解码,并且加权和因子预测值可在更高层被熵编码/解码。当加权和因子预测值(诸如加权因子预测值或偏移预测值等)按照画面或条带单元被熵编码/解码时,包括在画面或条带中的块可使用共同的加权和因子预测值。
可通过图像、条带或并行块内的特定区域或通过CTU或CU内的特定区域来推导加权和因子预测值。例如,图像、条带、并行块、CTU或CU内的特定区域的加权因子值或偏移值可被用作加权因子预测值或偏移预测值。在这种情况下,加权和因子预测值的熵编码/解码可被省略,仅加权和因子差值的熵编码/解码可被执行。
可选地,可从与当前块相邻的编码/解码的邻近块推导加权和因子预测值。例如,与当前块相邻的编码/解码的邻近块的加权因子值或偏移值可被设置为当前块的加权因子预测值或偏移预测值。这里,当前块的邻近块可包括在推导空间合并候选时使用的块和在推导时间合并候选时使用的块中的至少一个。
当使用加权因子预测值和加权因子差值时,解码设备可通过将加权因子预测值和加权因子差值相加来计算针对预测块的加权因子值。此外,当使用偏移预测值和偏移差值时,解码设备可通过将偏移预测值和偏移差值相加来计算针对预测块的偏移值。
可基于当前块、邻近块和同位块的编码参数中的至少一个来对加权和因子或加权和因子差值进行熵编码/解码。
基于当前块、邻近块和同位块的编码参数中的至少一个,加权和因子、加权和因子预测值或加权和因子差值可被推导为当前块的加权和因子、加权和因子预测值或加权和因子差值。
与当前块相邻的编码/解码的块的加权和因子可被用作当前块的加权和因子,而不对关于当前块的加权和因子的信息进行熵编码/解码。例如,当前块的加权因子或偏移可被设置为与相邻于当前块的编码/解码的邻近块的加权因子或偏移具有相同的值。
可通过使用加权和因子中的至少一个来对当前块执行运动补偿,或者可通过使用推导出的加权和因子中的至少一个来执行运动补偿。
加权和因子可被包括在关于运动补偿的信息中。
可在CTU和CTU的子单元(子CTU)中的至少一个中对关于运动补偿的上述信息中的至少一条信息进行熵编码/解码。这里,CTU的子单元可包括CU和PU中的至少一个。CTU的子单元的块可具有正方形形状或非正方形形状。为了方便起见,关于运动补偿的信息可指至少一条关于运动补偿的信息。
当在CTU中对关于运动补偿的信息进行熵编码/解码时,可根据关于运动补偿的信息的值,通过使用关于运动补偿的信息对存在于该CTU中的所有块或部分块执行运动补偿。
当在CTU或CTU的子单元中对关于运动补偿的信息进行熵编码/解码时,可基于预定块的尺寸和深度中的至少一个对关于运动补偿的信息进行熵编码/解码。
这里,可对关于预测块的尺寸或深度的信息进行熵编码/解码。可选地,可基于编码器和解码器中的预设值和编码参数中的至少一个或者基于另外的语法元素值中的至少一个来确定关于预定块的尺寸或深度的信息。
可仅在尺寸大于或等于预定块的块中对关于运动补偿的信息进行熵编码/解码,可不在尺寸小于预定块的块中对关于运动补偿的信息进行熵编码/解码。在这种情况下,可基于在尺寸大于或等于预定块的块中被熵编码/解码的关于运动补偿的信息,对尺寸大于或等于预定块的块中的子块执行运动补偿。也就是说,尺寸大于或等于预定块的块中的子块可共享关于运动补偿的信息,其中,关于运动补偿的信息包括运动矢量候选、运动矢量候选列表、合并候选、合并候选列表等。
可仅在深度浅于或等于预定块的块中对关于运动补偿的信息进行熵编码/解码,可不在深度深于预定块的块中对关于运动补偿的信息进行熵编码/解码。在这种情况下,可基于在深度浅于或等于预定块的块中被熵编码/解码的关于运动补偿的信息,对深度浅于或等于预定块的块中的子块执行运动补偿。也就是说,深度浅于或等于预定块的块中的子块可共享关于运动补偿的信息,其中,关于运动补偿的信息包括运动矢量候选、运动矢量候选列表、合并候选、合并候选列表等。
例如,当在块尺寸为64×64的CTU中的尺寸为32×32的子单元中对关于运动补偿的信息进行熵编码/解码时,可基于在32×32尺寸的块中被熵编码/解码的关于运动补偿的信息对包括在32×32尺寸的块中的尺寸小于32×32尺寸的块的块执行运动补偿。
作为另一示例,当在块尺寸为128×128的CTU中的尺寸为16×16的子单元中对关于运动补偿的信息进行熵编码/解码时,可基于在16×16尺寸的块中被熵编码/解码的关于运动补偿的信息对包括在16×16尺寸的块中的尺寸小于或等于16×16尺寸的块的块执行运动补偿。
作为另一示例,当在块深度为0的CTU中的块深度为1的子单元中对关于运动补偿的信息进行熵编码/解码时,可基于在深度为1的块中被熵编码/解码的关于运动补偿的信息对包括在深度为1的块中的深度深于深度为1的块的块执行运动补偿。
例如,当在块深度为0的CTU中的块深度为2的子单元中对至少一条关于运动补偿的信息进行熵编码/解码时,可基于在深度为2的块中被熵编码/解码的关于运动补偿的信息对包括在深度为2的块中的深度等于或深于深度为2的块的块执行运动补偿。
这里,块深度的值可以是包括0的正整数。当块深度的值较大时,这可表示深度较深。当块深度的值较小时,这可表示深度较浅。因此,当块深度的值较大时,块尺寸可较小。当块深度的值较小时,块尺寸可较大。此外,预定块的子块的深度可深于预定块,并在与预定块相应的块内,预定块的子块的深度可深于预定块。
可针对每个块对关于运动补偿的信息进行熵编码/解码,并可在更高层对关于运动补偿的信息进行熵编码/解码。例如,可针对诸如CTU、CU或PU等的每个块对关于运动补偿的信息进行熵编码/解码,或者可在诸如视频参数集、序列参数集、画面参数集、自适应参数集或条带头等的更高层对关于运动补偿的信息进行熵编码/解码。
可基于关于运动补偿的信息差值对关于运动补偿的信息进行熵编码/解码,其中,关于运动补偿的信息差值指示关于运动补偿的信息和关于运动补偿的信息预测值之间的差值。考虑作为示例的帧间预测指示符(即,关于运动补偿的信息中的一条信息),可对帧间预测指示符预测值和帧间预测指示符差值进行熵编码/解码。这里,可针对每个块对帧间预测指示符差值进行熵编码/解码,并可在更高层对帧间预测指示符预测值进行熵编码/解码。可针对每个画面或条带对关于运动补偿的信息预测值(诸如帧间预测指示符预测值等)进行熵编码/解码,画面或条带中的块可使用共同的关于运动补偿的信息预测值。
可通过图像、条带或并行块内的特定区域或通过CTU或CU内的特定区域来推导关于运动补偿的信息预测值。例如,在图像、条带、并行块、CTU或CU中的特定区域的帧间预测指示符可被用作帧间预测指示符预测值。在这种情况下,关于运动补偿的信息预测值的熵编码/解码可被省略,并且仅关于运动补偿的信息差值可被熵编码/解码。
可选地,可从与前块相邻的编码/解码的邻近块推导关于运动补偿的信息预测值。例如,与当前块相邻的编码/解码的邻近块的帧间预测指示符可被设置为当前块的帧间预测指示符预测值。这里,当前块的邻近块可包括在推导空间合并候选时使用的块和在推导时间合并候选时使用的块中的至少一个。此外,邻近块可具有与当前块相同的深度或比当前块更小的深度。当存在多个邻近块时,可根据预定优先级选择性地使用一个邻近块。被用于对关于运动补偿的信息进行预测的邻近块可基于当前块具有固定位置,并可根据当前块的位置而具有可变位置。这里,当前块的位置可以是基于包括当前块的画面或条带的位置,或可以是基于包括当前块的CTU、CU或PU的位置的位置。
可通过使用编码器和解码器中的预定设置中的索引信息来计算合并索引信息。
当使用关于运动补偿的信息预测值和关于运动补偿的信息差值时,解码设备可通过将关于运动补偿的信息预测值和关于运动补偿的信息差值相加来计算针对预测块的关于运动补偿的信息值。
可基于当前块、邻近块和同位块的编码参数中的至少一个来对关于运动补偿的信息或关于运动补偿的信息差值进行熵编码/解码。
基于当前块、邻近块和同位块的编码参数中的至少一个,关于运动补偿的信息、关于运动补偿的信息预测值、或关于运动补偿的信息差值可被推导为当前块的关于运动补偿的信息、关于运动补偿的信息预测值或关于运动补偿的信息差值。
与当前块相邻的编码/解码的块的关于运动补偿的信息可被用作当前块的关于运动补偿的信息,而不对当前块的关于运动补偿的信息进行熵编码/解码。例如,当前块的帧间预测指示符可被设置为与相邻于当前块的编码/解码的邻近块的帧间预测指示符相同的值。
此外,至少一条关于运动补偿的信息可具有在编码器和解码器中预设的固定值。预设的固定值可被确定为至少一条关于运动补偿的信息的值。特定块内的尺寸小于特定块的块可共享至少一条具有预设的固定值的关于运动补偿的信息。以相同的方式,深度深于特定块并且作为特定块的子块的块可共享至少一条具有预设的固定值的关于运动补偿的信息。这里,固定值可以是包括0的正整数,或可以是包括(0,0)的整数矢量值。
这里,共享至少一条关于运动补偿的信息可表示针对至少一条关于运动补偿的信息,多个块具有相同的值,或者可表示通过使用针对至少一条关于运动补偿的信息的相同的值对多个块执行运动补偿。
关于运动补偿的信息还可包括运动矢量、运动矢量候选、运动矢量候选索引、运动矢量差值、运动矢量预测值、关于是否使用跳过模式的信息(skip_flag)、关于是否使用合并模式的信息(merge_flag)、合并索引信息(merge_index)、运动矢量分辨率信息、重叠块运动补偿信息、局部照明补偿信息、仿射运动补偿信息、解码器端运动矢量推导信息、和双向光流信息中的至少一个。
运动矢量分辨率信息可以是指示是否针对运动矢量和运动矢量差值中的至少一个使用特定分辨率的信息。这里,分辨率可表示精度。此外,特定分辨率可被设置为整数像素(整数-pel)单位、1/2像素(1/2-pel)单位、1/4像素(1/4-pel)单位、1/8像素(1/8-pel)单位、1/16像素(1/16-pel)单位、1/32像素(1/32-pel)单位和1/64像素(1/64-pel)单位中的至少一个。
重叠块运动补偿信息可以是指示在当前块的运动补偿期间是否通过使用与当前块在空间上相邻的邻近块的运动矢量来计算当前块的预测块的加权和的信息。
局部照明补偿信息可以是指示当产生当前块的预测块时是否应用加权因子值和偏移值中的至少一个的信息。这里,加权因子值和偏移值中的至少一个可以是基于参考块计算的值。
仿射运动补偿信息可以是指示在当前块的运动补偿期间是否使用仿射运动模型的信息。这里,仿射运动模型可以是用于通过使用多个参数将一个块分区为数个子块并通过使用典型的运动矢量计算分区出的子块的运动矢量的模型。
解码器端运动矢量推导信息可以是指示是否通过由解码器的推导来使用运动补偿所需的运动矢量的信息。基于解码器端运动矢量推导信息,关于运动矢量的信息可不被熵编码/解码。此外,当解码器端运动矢量推导信息指示解码器推导并使用运动矢量时,关于合并模式的信息可被熵编码/解码。也就是说,解码器端运动矢量推导信息可指示在解码器中是否使用合并模式。
双向光流信息可以是指示是否通过修正针对每个像素或子块的运动矢量来执行运动补偿的信息。基于双向光流信息,针对每个像素或子块的运动矢量可不被熵编码/解码。这里,运动矢量修正可以是将运动矢量值从针对每个块的运动矢量修改为针对每个像素或子块的运动矢量。
通过使用至少一条关于运动补偿的信息来对当前块执行运动补偿,并可对至少一条关于运动补偿的信息进行熵编码/解码。
图32是示出在CTU中的尺寸小于预定块的块中使用合并模式的实施例的示图。
参照图32,当预定块的尺寸为8×8时,小于8×8的块(斜线块)可使用合并模式。
同时,当在块之间比较尺寸时,尺寸小于预定块可表示块中的样点的和小。例如,32×16尺寸的块可具有512个样点,因此32×16尺寸的块小于具有1024个样点的32×32尺寸的块。4×16尺寸的块可具有64个样点,因此4×16尺寸的块的尺寸可等于8×8的块。
当对关于运动补偿的信息进行熵编码/解码时,可使用二进制化方法,诸如,截断莱斯(truncated rice)二进制化方法、K阶指数哥伦布二进制化方法、有限K阶指数哥伦布二进制化方法、固定长度二进制化方法、一元二进制化方法或截断一元二进制化方法等。
当对关于运动补偿的信息进行熵编码/解码时,可通过使用与当前块相邻的邻近块的关于运动补偿的信息或邻近块的区域信息、关于先前编码/解码的运动补偿的信息或先前编码/解码的区域信息、关于当前块的深度的信息和关于当前块的尺寸的信息中的至少一条信息来确定上下文模型。
此外,当对关于运动补偿的信息进行熵编码/解码时,可通过使用邻近块的关于运动补偿的信息、关于先前编码/解码的运动补偿的信息、关于当前块的深度的信息和关于当前块的尺寸的信息中的至少一条信息作为针对当前块的关于运动补偿的信息的预测值,执行熵编码/解码。
可针对亮度信号和色度信号中的每一个执行编码/解码处理。例如,在编码/解码处理中,可针对亮度信号和色度信号不同地应用获得帧间预测指示符、产生合并候选列表、推导运动信息和执行运动补偿中的至少一种方法。
可针对亮度信号和色度信号相同地执行编码/解码处理。例如,在针对亮度信号应用的编码/解码处理中,帧间预测指示符、合并候选列表、合并候选、参考画面和参考画面列表中的至少一个可相同地应用于色度信号。
可以以相同的方式在编码器和解码器中执行这些方法。例如,在编码/解码处理中,获得帧间预测指示符、产生合并候选列表、推导运动信息和执行运动补偿中的至少一种方法可被相同地应用到编码器和解码器。此外,应用这些方法的顺序在编码器和解码器中可以不同。
可根据编码块、预测块、块和单元中的至少一个的尺寸来应用本发明的实施例。这里,该尺寸可被定义为最小尺寸和/或最大尺寸以应用实施例,并可被定义为实施例被应用到的固定尺寸。此外,可按第一尺寸应用第一实施例,可按第二尺寸应用第二实施例。也就是说,可根据该尺寸而多样地应用实施例。此外,仅当该尺寸等于或大于最小尺寸并且等于或小于最大尺寸时,可应用本发明的实施例。也就是说,仅当块尺寸在预定范围中时,可应用实施例。
例如,仅当编码/解码目标块的尺寸等于或大于8×8时,可应用实施例。例如,仅当编码/解码目标块的尺寸等于或大于16×16时,可应用实施例。例如,仅当编码/解码目标块的尺寸等于或大于32×32时,可应用实施例。例如,仅当编码/解码目标块的尺寸等于或大于64×64时,可应用实施例。例如,仅当编码/解码目标块的尺寸等于或大于128×128时,可应用实施例。例如,仅当编码/解码目标块的尺寸为4×4时,可应用实施例。例如,仅当编码/解码目标块的尺寸等于或小于8×8时,可应用实施例。例如,仅当编码/解码目标块的尺寸等于或小于16×16时,可应用实施例。例如,仅当编码/解码目标块的尺寸等于或大于8×8且等于或小于16×16时,可应用实施例。例如,仅当编码/解码目标块的尺寸等于或大于16×16且等于或小于64×64时,可应用实施例。
可根据时间层应用本发明的实施例。可用信号传送用于标识实施例能够被应用到的时间层的标识符,并且可针对由标识符指定的时间层应用实施例。这里,标识符可被定义为指示实施例能够被应用到的最低层和/或最高层,并可被定义为指示实施例能够被应用到的特定层。
例如,仅当当前画面的时间层为最低层时,可应用实施例。例如,仅当当前画面的时间层标识符为0时,可应用实施例。例如,仅当当前画面的时间层标识符等于或大于1时,可应用实施例。例如,仅当当前画面的时间层为最高层时,可应用实施例。
如本发明的实施例中所描述的,在参考画面列表建立和参考画面列表修改的处理中使用的参考画面集可使用参考画面列表L0、L1、L2和L3中的至少一个。
根据本发明的实施例,当去块滤波器计算边界强度时,可使用编码/解码目标块的至少一个至最多N个运动矢量。这里,N指示等于或大于1的正整数,诸如2、3、4等。
在运动矢量预测中,当运动矢量具有16像素(16-pel)单位、8像素(8-pel)单位、4像素(4-pel)单位、整数像素(整数-pel)单位、1/2像素(1/2-pel)单位、1/4像素(1/4-pel)单位、1/8像素(1/8-pel)单位、1/16像素(1/16-pel)单位、1/32像素(1/32-pel)单位和1/64像素(1/64-pel)单位中的至少一个时,可应用本发明的实施例。此外,在执行合并模式中,可针对每个像素单位可选地使用运动矢量。
可定义本发明的实施例的条带类型,并可根据条带类型应用本发明的实施例。
例如,当条带类型为T(三向预测)条带时,可通过使用至少三个运动矢量来产生预测块,并可通过计算至少三个预测块的加权和来用作编码/解码目标块的最终预测块。例如,当条带类型为Q(四向预测)条带时,可通过使用至少四个运动矢量来产生预测块,并可通过计算至少四个预测块的加权和来用作编码/解码目标块的最终预测块。
本发明的实施例可被应用到使用合并模式的帧间预测和运动补偿方法,以及使用运动矢量预测的帧间预测和运动补偿方法、使用跳过模式的帧间预测和运动补偿方法等。
本发明的实施例被应用到的块的形状可具有正方式形状或非正方形形状。
上面已12至图32描述了根据本发明的通过使用合并模式对视频进行编码和解码的方法。在下文中,将参照图33和图34详细描述根据本发明的对视频进行解码的方法、对视频进行编码的方法、对视频进行解码的设备、对视频进行编码的设备、以及比特流。
图33是示出根据本发明的用于对视频进行解码的方法的示图。
参照图33,在步骤S3301,可产生当前块的合并候选列表,其中,当前块的合并候选列表包括与多个参考画面列表中的每个参考画面列表相应的至少一个合并候选。
这里,与多个参考画面列表中的每个参考画面列表相应的合并候选可表示具有与参考画面列表LX相应的LX运动信息的合并候选。例如,存在具有L0运动信息的L0合并候选、具有L1运动信息的L1合并候选、具有L2运动信息的L2合并候选、具有L3运动信息的L3合并候选等。
同时,合并候选列表包括从当前块的空间邻近块推导的空间合并候选、从当前块的同位块推导的时间合并候选、通过修改空间合并候选而推导的修改的空间合并候选、通过修改时间合并候选而推导的修改的时间合并候选和具有预定义的运动信息值的合并候选中的至少一个。这里,具有预定义的运动信息值的合并候选可以是零合并候选。
在这种情况下,可从与当前块相邻的邻近块的子块来推导空间合并候选。此外,可从当前块的同位块的子块推导时间合并候选。
同时,合并候选列表还可包括通过使用从包括空间合并候选、时间合并候选、修改的空间合并候选和修改的时间合并候选的组中选择的至少两个合并候选而推导的组合的合并候选。
此外,在步骤S3302,可通过使用产生的合并候选列表来确定至少一条运动信息。
此外,在步骤S3303,可通过使用确定的至少一条运动信息产生当前块的预测块。
这里,在步骤S3303产生当前块的预测块的步骤可包括:根据当前块的帧间预测指示符产生多个时间预测块;通过将加权因子和偏移中的至少一个应用到产生的多个时间预测块来产生当前块的预测块。
在这种情况下,可在尺寸小于预定块的块中或在深度深于预定块的块中共享加权因子和偏移中的至少一个。
同时,可在尺寸小于预定块的块中或在深度深于预定块的块中共享合并候选列表。
此外,当当前块的尺寸小于预定块或者当前块的深度深于预定块时,可基于当前块的高层块产生合并候选列表。高层块的尺寸或深度等于预定块。
可通过将关于加权和的信息应用于基于多个合并候选或多个合并候选列表产生的多个预测块来产生当前块的预测块。
图34是示出根据本发明的用于对视频进行编码的方法的示图。
参照图34,在步骤S3401,可产生当前块的合并候选列表,其中,当前块的合并候选列表包括与多个参考画面列表中的每个参考画面列表相应的至少一个合并候选。
在步骤S3402,可通过使用产生的合并候选列表来确定至少一条运动信息。
此外,在步骤S3403,可通过使用确定的至少一条运动信息来产生当前块的预测块。
根据本发明的用于对视频进行解码的设备可包括帧间预测单元,其中,帧间预测单元产生当前块的合并候选列表,其中,当前块的合并候选列表包括与多个参考画面列表中的每个参考画面列表相应的至少一个合并候选,帧间预测单元通过使用合并候选列表来确定至少一条运动信息,并通过使用确定的至少一条运动信息来产生当前块的预测块。
根据本发明的用于对视频进行编码的设备可包括帧间预测单元,其中,帧间预测单元产生当前块的合并候选列表,其中,当前块的合并候选列表包括与多个参考画面列表中的每个参考画面列表相应的至少一个合并候选,帧间预测单元通过使用合并候选列表来确定至少一条运动信息,并通过使用确定的至少一条运动信息来产生当前块的预测块。
根据本发明的比特流可以是由用于对视频进行编码的方法产生的比特流,所述方法包括:产生当前块的合并候选列表,其中,当前块的合并候选列表包括与多个参考画面列表中的每个参考画面列表相应的至少一个合并候选;通过使用合并候选列表来确定至少一条运动信息,并过使用确定的至少一条运动信息来产生当前块的预测块。
在上述实施例中,基于具有一系列步骤或单元的流程图描述了所述方法,但本发明不限于所述步骤的顺序,而是,一些步骤可与其它步骤被同时执行,或者可与其它步骤按照不同顺序被执行。此外,本领域普通技术人员应该理解,流程图中的步骤不彼此相斥,并且在不影响本发明的范围的情况下,其它步骤可被添加到流程图中,或者一些步骤可从流程图被删除。
实施例包括示例的各种方面。针对各个方面的所有可能组合可不被描述,但本领域技术人员将能够认识到不同组合。因此,本发明可包括权利要求范围内的所有替换形式、修改形式和改变。
本发明的实施例可按照程序指令的形式来实施,其中,所述程序指令可由各种计算机组件来执行,并被记录在计算机可读记录介质上。计算机可读记录介质可包括单独的程序指令、数据文件、数据结构等,或者是程序指令、数据文件、数据结构等的组合。记录在计算机可读记录介质中的程序指令可被特别设计和构造用于本发明,或者对于计算机软件技术领域的普通技术人员而言是已知的。计算机可读记录介质的示例包括:磁记录介质(诸如硬盘、软盘和磁带);光学数据存储介质(诸如CD-ROM或DVD-ROM);磁光介质(诸如软光盘);以及被特别构造用于存储和实施程序指令的硬件装置(诸如只读存储器(ROM)、随机存取存储器(RAM)、闪存存储器等)。程序指令的示例不仅包括由编译器形成的机器语言代码,还包括可由计算机使用解释器实施的高级语言代码。硬件装置可被配置为由一个或更多个软件模块操作以进行根据本发明的处理,反之亦可。
虽然已根据特定术语(诸如详细元件)以及有限实施例和附图描述了本发明,但它们仅被提供用于帮助更通俗地理解本发明,本发明不限于上述实施例。本发明所属领域的技术人员将理解,可从上述描述做出各种修改和改变。
因此,本发明的精神不应受限于上述实施例,所附权利要求及其等同物的全部范围将落入本发明的范围和精神之内。
工业可用性
本发明可在用于对图像进行编码/解码的设备中被使用。
Claims (4)
1.一种用于对视频进行解码的方法,所述方法包括:
产生当前块的候选列表,其中,当前块的候选列表包括从当前块的空间邻近块推导的空间候选和从当前块的同位块推导的时间候选中的至少一个;
通过使用候选列表来确定运动信息;
基于确定的运动信息来产生多个预测块;以及
通过将加权因子和偏移应用到产生的所述多个预测块来产生当前块的最终预测块,
其中,加权因子是通过从加权因子集合包括的多个加权因子中指定应用于当前块的加权因子的索引信息推导出的,
其中,仅当当前块的尺寸大于或等于预定义值时从比特流获得所述索引信息,
其中,当前块是通过基于从比特流用信号发送的划分信息来划分编码树块而获得的,并且
其中,所述划分信息包括指示是否划分编码树块的划分标志。
2.如权利要求1所述的方法,其中,所述加权因子集合包括正加权因子和负加权因子。
3.一种用于对视频进行编码的方法,所述方法包括:
产生当前块的候选列表,其中,当前块的候选列表包括从当前块的空间邻近块推导的空间候选和从当前块的同位块推导的时间候选中的至少一个;
通过使用候选列表来确定运动信息;
基于确定的运动信息来产生多个预测块;以及
通过将加权因子和偏移应用到产生的所述多个预测块来产生当前块的最终预测块,
其中,从加权因子集合包括的多个加权因子中指定应用于当前块的加权因子的索引信息被编码,
其中,仅当当前块的尺寸大于或等于预定义值时,所述索引信息被编码到比特流中,
其中,当前块是通过基于从比特流用信号发送的划分信息来划分编码树块而获得的,并且
其中,所述划分信息包括指示是否划分编码树块的划分标志。
4.一种计算机可读介质,存储通过编码方法产生的比特流,所述方法包括:
产生当前块的候选列表,其中,当前块的候选列表包括从当前块的空间邻近块推导的空间候选和从当前块的同位块推导的时间候选中的至少一个;
通过使用候选列表来确定运动信息;
基于确定的运动信息来产生多个预测块;以及
通过将加权因子和偏移应用到产生的所述多个预测块来产生当前块的最终预测块,
其中,从加权因子集合包括的多个加权因子中指定应用于当前块的加权因子的索引信息被编码,
其中,仅当当前块的尺寸大于或等于预定义值时,所述索引信息被编码到比特流中,
其中,当前块是通过基于从比特流用信号发送的划分信息来划分编码树块而获得的,并且
其中,所述划分信息包括指示是否划分编码树块的划分标志。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20160088250 | 2016-07-12 | ||
KR10-2016-0088250 | 2016-07-12 | ||
PCT/KR2017/007481 WO2018012886A1 (ko) | 2016-07-12 | 2017-07-12 | 영상 부호화/복호화 방법 및 이를 위한 기록 매체 |
CN201780043622.4A CN109479141B (zh) | 2016-07-12 | 2017-07-12 | 图像编码/解码方法和用于所述方法的记录介质 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780043622.4A Division CN109479141B (zh) | 2016-07-12 | 2017-07-12 | 图像编码/解码方法和用于所述方法的记录介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116614638A true CN116614638A (zh) | 2023-08-18 |
Family
ID=60953183
Family Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310761221.XA Pending CN116614638A (zh) | 2016-07-12 | 2017-07-12 | 图像编码/解码方法和用于所述方法的记录介质 |
CN202310763172.3A Pending CN116614640A (zh) | 2016-07-12 | 2017-07-12 | 图像编码/解码方法和用于所述方法的记录介质 |
CN202310763526.4A Pending CN116614642A (zh) | 2016-07-12 | 2017-07-12 | 图像编码/解码方法和用于所述方法的记录介质 |
CN202310763153.0A Pending CN116614639A (zh) | 2016-07-12 | 2017-07-12 | 图像编码/解码方法和用于所述方法的记录介质 |
CN202310763268.XA Pending CN116614641A (zh) | 2016-07-12 | 2017-07-12 | 图像编码/解码方法和用于所述方法的记录介质 |
CN201780043622.4A Active CN109479141B (zh) | 2016-07-12 | 2017-07-12 | 图像编码/解码方法和用于所述方法的记录介质 |
Family Applications After (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310763172.3A Pending CN116614640A (zh) | 2016-07-12 | 2017-07-12 | 图像编码/解码方法和用于所述方法的记录介质 |
CN202310763526.4A Pending CN116614642A (zh) | 2016-07-12 | 2017-07-12 | 图像编码/解码方法和用于所述方法的记录介质 |
CN202310763153.0A Pending CN116614639A (zh) | 2016-07-12 | 2017-07-12 | 图像编码/解码方法和用于所述方法的记录介质 |
CN202310763268.XA Pending CN116614641A (zh) | 2016-07-12 | 2017-07-12 | 图像编码/解码方法和用于所述方法的记录介质 |
CN201780043622.4A Active CN109479141B (zh) | 2016-07-12 | 2017-07-12 | 图像编码/解码方法和用于所述方法的记录介质 |
Country Status (5)
Country | Link |
---|---|
US (3) | US11509930B2 (zh) |
JP (3) | JP6938612B2 (zh) |
KR (5) | KR102270228B1 (zh) |
CN (6) | CN116614638A (zh) |
WO (1) | WO2018012886A1 (zh) |
Families Citing this family (65)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102715635B1 (ko) * | 2016-03-28 | 2024-10-11 | 로즈데일 다이나믹스 엘엘씨 | 인터 예측 모드 기반 영상 처리 방법 및 이를 위한 장치 |
US10484703B2 (en) * | 2017-02-07 | 2019-11-19 | Mediatek Inc. | Adapting merge candidate positions and numbers according to size and/or shape of prediction block |
US10750181B2 (en) | 2017-05-11 | 2020-08-18 | Mediatek Inc. | Method and apparatus of adaptive multiple transforms for video coding |
CN116866571A (zh) * | 2017-10-20 | 2023-10-10 | 株式会社Kt | 视频信号处理方法及装置 |
US11240528B2 (en) * | 2018-01-30 | 2022-02-01 | Sharp Kabushiki Kaisha | Systems and methods for performing motion vector prediction for video coding using motion vector predictor origins |
KR20200097811A (ko) | 2018-02-22 | 2020-08-19 | 엘지전자 주식회사 | 영상 코딩 시스템에서 블록 분할 구조에 따른 영상 디코딩 방법 및 장치 |
KR20190110044A (ko) * | 2018-03-19 | 2019-09-27 | 주식회사 케이티 | 비디오 신호 처리 방법 및 장치 |
CN111937399B (zh) | 2018-04-03 | 2023-07-14 | 英迪股份有限公司 | 基于仿射模型的图像编码/解码方法和装置 |
WO2019194653A1 (ko) * | 2018-04-06 | 2019-10-10 | 가온미디어 주식회사 | 움직임 정보의 복합적 머지 모드 처리를 제공하는 영상 처리 방법, 그를 이용한 영상 복호화, 부호화 방법 및 그 장치 |
CN116668677A (zh) * | 2018-05-10 | 2023-08-29 | Lg电子株式会社 | 解码设备、编码设备和数据发送设备 |
US10798407B2 (en) * | 2018-06-01 | 2020-10-06 | Tencent America LLC | Methods and apparatus for inter prediction with a reduced above line buffer in video coding |
WO2019234578A1 (en) * | 2018-06-05 | 2019-12-12 | Beijing Bytedance Network Technology Co., Ltd. | Asymmetric weighted bi-predictive merges |
WO2019238008A1 (en) | 2018-06-11 | 2019-12-19 | Mediatek Inc. | Method and apparatus of bi-directional optical flow for video coding |
US11695967B2 (en) * | 2018-06-22 | 2023-07-04 | Op Solutions, Llc | Block level geometric partitioning |
CN110662059B (zh) | 2018-06-29 | 2021-04-20 | 北京字节跳动网络技术有限公司 | 使用查找表存储先前编码的运动信息并用其编码后续块的方法和装置 |
WO2020003270A1 (en) | 2018-06-29 | 2020-01-02 | Beijing Bytedance Network Technology Co., Ltd. | Number of motion candidates in a look up table to be checked according to mode |
KR20210024502A (ko) | 2018-06-29 | 2021-03-05 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | Hmvp 후보를 병합/amvp에 추가할 때의 부분/풀 프루닝 |
WO2020003261A1 (en) * | 2018-06-29 | 2020-01-02 | Beijing Bytedance Network Technology Co., Ltd. | Selection from multiple luts |
KR102646649B1 (ko) | 2018-06-29 | 2024-03-13 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | Lut에서의 모션 후보들의 검사 순서 |
CN115134599A (zh) | 2018-06-29 | 2022-09-30 | 抖音视界有限公司 | 更新查找表(lut)的条件 |
CN114845108A (zh) | 2018-06-29 | 2022-08-02 | 抖音视界(北京)有限公司 | 查找表的更新:fifo、约束的fifo |
CN110662063B (zh) | 2018-06-29 | 2020-12-15 | 北京字节跳动网络技术有限公司 | 视频处理方法、装置和计算机可读存储介质 |
WO2020003284A1 (en) | 2018-06-29 | 2020-01-02 | Beijing Bytedance Network Technology Co., Ltd. | Interaction between lut and amvp |
CN118632026A (zh) | 2018-06-30 | 2024-09-10 | 有限公司B1影像技术研究所 | 帧间预测方法和记录介质 |
KR20210018502A (ko) * | 2018-06-30 | 2021-02-17 | 광동 오포 모바일 텔레커뮤니케이션즈 코포레이션 리미티드 | 머지 모드 기반의 인터 예측 방법 및 장치 |
JP7181395B2 (ja) | 2018-07-02 | 2022-11-30 | 北京字節跳動網絡技術有限公司 | イントラ予測モードを有するルックアップテーブルおよび非隣接ブロックからのイントラモード予測 |
CN112544077B (zh) * | 2018-07-16 | 2023-12-08 | Lg电子株式会社 | 用于子块单元中的时间运动信息预测的帧间预测方法及其装置 |
US11539977B2 (en) | 2018-07-31 | 2022-12-27 | Hfi Innovation Inc. | Method and apparatus of merge with motion vector difference for video coding |
CN112585976A (zh) * | 2018-08-06 | 2021-03-30 | 韩国电子通信研究院 | 用于对图像进行编码/解码的方法和设备以及用于存储比特流的记录介质 |
EP3834416A4 (en) * | 2018-08-17 | 2022-08-17 | HFI Innovation Inc. | METHODS AND APPARATUS FOR VIDEO PROCESSING WITH BIDIRECTIONAL PREDICTION IN VIDEO CODING SYSTEMS |
US10924731B2 (en) * | 2018-08-28 | 2021-02-16 | Tencent America LLC | Complexity constraints on merge candidates list construction |
TWI820211B (zh) | 2018-09-12 | 2023-11-01 | 大陸商北京字節跳動網絡技術有限公司 | 取決於總數減去k的開始檢查hmvp候選的條件 |
BR112021005175A2 (pt) | 2018-09-21 | 2021-06-08 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | método de decodificação de vídeo, método de codificação de vídeo, aparelho de decodificação de vídeo e aparelho de codificação de vídeo |
GB2577318B (en) * | 2018-09-21 | 2021-03-10 | Canon Kk | Video coding and decoding |
US11284066B2 (en) * | 2018-10-10 | 2022-03-22 | Tencent America LLC | Method and apparatus for intra block copy in intra-inter blending mode and triangle prediction unit mode |
CN112840654B (zh) | 2018-10-12 | 2024-04-16 | 韦勒斯标准与技术协会公司 | 使用多假设预测的视频信号处理方法和装置 |
GB2595053B (en) | 2018-10-18 | 2022-07-06 | Canon Kk | Video coding and decoding |
KR20200054111A (ko) * | 2018-11-08 | 2020-05-19 | 광동 오포 모바일 텔레커뮤니케이션즈 코포레이션 리미티드 | 영상 신호 부호화/복호화 방법 및 이를 위한 장치 |
JP7391958B2 (ja) * | 2018-11-08 | 2023-12-05 | オッポ広東移動通信有限公司 | ビデオ信号符号化/復号方法及び前記方法に用いられる機器 |
JP7231729B2 (ja) * | 2018-11-13 | 2023-03-01 | 北京字節跳動網絡技術有限公司 | イントラブロックコピーのための履歴ベース動き候補リスト構築 |
KR20200056272A (ko) * | 2018-11-14 | 2020-05-22 | 에스케이텔레콤 주식회사 | 인터 예측 방법 및 이를 이용한 영상 복호화 장치 |
CN118200598A (zh) | 2018-11-14 | 2024-06-14 | Sk电信有限公司 | 帧间预测方法和发送比特流的方法 |
CN113056920B (zh) | 2018-11-22 | 2024-05-24 | 北京字节跳动网络技术有限公司 | 基于子块的帧间预测的协调方法 |
US10958900B2 (en) | 2018-12-06 | 2021-03-23 | Qualcomm Incorporated | Derivation of spatial-temporal motion vectors prediction in video coding |
CN118741099A (zh) | 2018-12-12 | 2024-10-01 | 数码士有限公司 | 使用当前图片参考的视频信号处理方法和设备 |
WO2020131659A2 (en) * | 2018-12-17 | 2020-06-25 | Interdigital Vc Holdings, Inc. | Mmvd and smvd combination with motion and prediction models |
CN112584177B (zh) | 2018-12-28 | 2022-05-31 | 杭州海康威视数字技术股份有限公司 | 一种编解码方法及其设备 |
WO2020143741A1 (en) | 2019-01-10 | 2020-07-16 | Beijing Bytedance Network Technology Co., Ltd. | Invoke of lut updating |
CN113383554B (zh) | 2019-01-13 | 2022-12-16 | 北京字节跳动网络技术有限公司 | LUT和共享Merge列表之间的交互 |
WO2020147772A1 (en) | 2019-01-16 | 2020-07-23 | Beijing Bytedance Network Technology Co., Ltd. | Motion candidates derivation |
KR20210119429A (ko) * | 2019-02-19 | 2021-10-05 | 주식회사 윌러스표준기술연구소 | 인트라 예측 기반 비디오 신호 처리 방법 및 장치 |
US10742972B1 (en) * | 2019-03-08 | 2020-08-11 | Tencent America LLC | Merge list construction in triangular prediction |
WO2020192611A1 (en) | 2019-03-22 | 2020-10-01 | Beijing Bytedance Network Technology Co., Ltd. | Interaction between merge list construction and other tools |
EP3935839A4 (en) * | 2019-04-09 | 2022-06-22 | Beijing Dajia Internet Information Technology Co., Ltd. | METHODS AND DEVICES FOR SIGNALING MERGE MODES IN VIDEO ENCODING |
WO2020222617A1 (ko) * | 2019-05-02 | 2020-11-05 | 주식회사 엑스리스 | 영상 신호 부호화/복호화 방법 및 이를 위한 장치 |
WO2020233513A1 (en) * | 2019-05-17 | 2020-11-26 | Beijing Bytedance Network Technology Co., Ltd. | Motion information determination and storage for video processing |
CN113924773A (zh) * | 2019-06-19 | 2022-01-11 | 韩国电子通信研究院 | 图像编码/解码方法和装置以及用于存储比特流的记录介质 |
CN113596478B (zh) * | 2019-06-21 | 2022-04-26 | 杭州海康威视数字技术股份有限公司 | 一种编解码方法、装置及其设备 |
US20220286688A1 (en) * | 2019-06-21 | 2022-09-08 | Vid Scale, Inc. | Precision refinement for motion compensation with optical flow |
US12081735B2 (en) | 2019-07-25 | 2024-09-03 | Wilus Institute Of Standards And Technology Inc. | Video signal processing method and device |
JP7481430B2 (ja) | 2019-08-13 | 2024-05-10 | 北京字節跳動網絡技術有限公司 | サブブロックに基づくインター予測における動き精度 |
JP7267885B2 (ja) * | 2019-09-20 | 2023-05-02 | Kddi株式会社 | 画像復号装置、画像復号方法及びプログラム |
WO2021052505A1 (en) | 2019-09-22 | 2021-03-25 | Beijing Bytedance Network Technology Co., Ltd. | Reference picture resampling in video processing |
US11399195B2 (en) * | 2019-10-30 | 2022-07-26 | Tencent America LLC | Range of minimum coding block size in video coding |
WO2023131250A1 (en) * | 2022-01-08 | 2023-07-13 | Beijing Bytedance Network Technology Co., Ltd. | Method, apparatus, and medium for video processing |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6711211B1 (en) | 2000-05-08 | 2004-03-23 | Nokia Mobile Phones Ltd. | Method for encoding and decoding video information, a motion compensated video encoder and a corresponding decoder |
CN1922889B (zh) * | 2004-02-27 | 2011-07-20 | 汤姆逊许可公司 | 使用加权预测的误差隐蔽技术 |
US8369406B2 (en) | 2005-07-18 | 2013-02-05 | Electronics And Telecommunications Research Institute | Apparatus of predictive coding/decoding using view-temporal reference picture buffers and method using the same |
KR101553850B1 (ko) * | 2008-10-21 | 2015-09-17 | 에스케이 텔레콤주식회사 | 동영상 부호화/복호화 장치 및 그를 위한 적응적 가중치를 사용하는 적응 중첩 블록 움직임 보상 방법 및 장치 |
KR102034004B1 (ko) * | 2010-10-08 | 2019-10-18 | 지이 비디오 컴프레션, 엘엘씨 | 블록 분할 및 블록 병합을 지원하는 픽처 코딩 |
US9648334B2 (en) | 2011-03-21 | 2017-05-09 | Qualcomm Incorporated | Bi-predictive merge mode based on uni-predictive neighbors in video coding |
JP5477340B2 (ja) * | 2011-05-31 | 2014-04-23 | 株式会社Jvcケンウッド | 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム |
WO2012177052A2 (ko) * | 2011-06-21 | 2012-12-27 | 한국전자통신연구원 | 인터 예측 방법 및 그 장치 |
PL3739884T3 (pl) | 2011-06-27 | 2021-11-22 | Samsung Electronics Co., Ltd. | Kodowanie i dekodowanie informacji o ruchu |
JP5786498B2 (ja) * | 2011-06-30 | 2015-09-30 | 株式会社Jvcケンウッド | 画像符号化装置、画像符号化方法及び画像符号化プログラム |
US9621888B2 (en) | 2011-09-09 | 2017-04-11 | Lg Electronics Inc. | Inter prediction method and apparatus therefor |
KR20130050407A (ko) * | 2011-11-07 | 2013-05-16 | 오수미 | 인터 모드에서의 움직임 정보 생성 방법 |
JP5900308B2 (ja) * | 2011-12-16 | 2016-04-06 | 株式会社Jvcケンウッド | 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム |
TWI658724B (zh) * | 2011-12-28 | 2019-05-01 | 日商Jvc建伍股份有限公司 | 動態影像解碼裝置、動態影像解碼方法及動態影像解碼程式 |
SG11201405038RA (en) * | 2012-04-24 | 2014-09-26 | Mediatek Inc | Method and apparatus of motion vector derivation for 3d video coding |
KR20140005099A (ko) * | 2012-07-02 | 2014-01-14 | 한국전자통신연구원 | 영상 부호화/복호화 방법 및 장치 |
CN110545421B (zh) | 2012-10-12 | 2022-11-22 | 韩国电子通信研究院 | 图像编码/解码方法和使用其的装置 |
US9800857B2 (en) * | 2013-03-08 | 2017-10-24 | Qualcomm Incorporated | Inter-view residual prediction in multi-view or 3-dimensional video coding |
US9491460B2 (en) * | 2013-03-29 | 2016-11-08 | Qualcomm Incorporated | Bandwidth reduction for video coding prediction |
US9716899B2 (en) * | 2013-06-27 | 2017-07-25 | Qualcomm Incorporated | Depth oriented inter-view motion vector prediction |
US9628795B2 (en) | 2013-07-17 | 2017-04-18 | Qualcomm Incorporated | Block identification using disparity vector in video coding |
US10368097B2 (en) * | 2014-01-07 | 2019-07-30 | Nokia Technologies Oy | Apparatus, a method and a computer program product for coding and decoding chroma components of texture pictures for sample prediction of depth pictures |
US10187657B2 (en) * | 2014-03-14 | 2019-01-22 | Samsung Electronics Co., Ltd. | Method and device for configuring merge candidate list for decoding and encoding of interlayer video |
CN108989815B9 (zh) * | 2014-03-19 | 2021-06-04 | 株式会社Kt | 针对多视图视频信号生成合并候选列表的方法及解码装置 |
KR20160001647A (ko) * | 2014-06-26 | 2016-01-06 | 주식회사 케이티 | 다시점 비디오 신호 처리 방법 및 장치 |
WO2016072775A1 (ko) * | 2014-11-06 | 2016-05-12 | 삼성전자 주식회사 | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
CN114584766A (zh) * | 2016-04-29 | 2022-06-03 | 英迪股份有限公司 | 解码和编码视频的方法以及传送比特流的方法 |
WO2017191891A1 (en) * | 2016-05-06 | 2017-11-09 | Samsung Electronics Co., Ltd. | Method and electronic device for coding a segment of an inter frame |
CN113473122B (zh) * | 2016-07-05 | 2024-08-20 | 株式会社Kt | 对视频进行解码或编码的方法和计算机可读介质 |
US10701366B2 (en) * | 2017-02-21 | 2020-06-30 | Qualcomm Incorporated | Deriving motion vector information at a video decoder |
KR102306562B1 (ko) * | 2017-11-27 | 2021-09-30 | 엘지전자 주식회사 | 영상 코딩 시스템에서 인터 예측에 따른 영상 디코딩 방법 및 장치 |
-
2017
- 2017-07-12 CN CN202310761221.XA patent/CN116614638A/zh active Pending
- 2017-07-12 JP JP2019500638A patent/JP6938612B2/ja active Active
- 2017-07-12 CN CN202310763172.3A patent/CN116614640A/zh active Pending
- 2017-07-12 CN CN202310763526.4A patent/CN116614642A/zh active Pending
- 2017-07-12 CN CN202310763153.0A patent/CN116614639A/zh active Pending
- 2017-07-12 US US16/301,318 patent/US11509930B2/en active Active
- 2017-07-12 CN CN202310763268.XA patent/CN116614641A/zh active Pending
- 2017-07-12 WO PCT/KR2017/007481 patent/WO2018012886A1/ko active Application Filing
- 2017-07-12 KR KR1020170088514A patent/KR102270228B1/ko active IP Right Grant
- 2017-07-12 CN CN201780043622.4A patent/CN109479141B/zh active Active
-
2021
- 2021-06-22 KR KR1020210081088A patent/KR102379174B1/ko active IP Right Grant
- 2021-09-01 JP JP2021142499A patent/JP2022008317A/ja active Pending
-
2022
- 2022-03-22 KR KR1020220035549A patent/KR102480907B1/ko active IP Right Grant
- 2022-10-26 US US17/973,835 patent/US11895329B2/en active Active
- 2022-12-20 KR KR1020220179498A patent/KR102591695B1/ko active IP Right Grant
-
2023
- 2023-09-25 JP JP2023159358A patent/JP2023164731A/ja active Pending
- 2023-10-16 KR KR1020230138091A patent/KR20230150240A/ko active IP Right Grant
- 2023-12-19 US US18/545,040 patent/US20240187644A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
KR20180007345A (ko) | 2018-01-22 |
CN116614642A (zh) | 2023-08-18 |
US11895329B2 (en) | 2024-02-06 |
KR102480907B1 (ko) | 2022-12-23 |
US20230058060A1 (en) | 2023-02-23 |
CN116614640A (zh) | 2023-08-18 |
KR20210080322A (ko) | 2021-06-30 |
KR102270228B1 (ko) | 2021-06-28 |
JP2022008317A (ja) | 2022-01-13 |
KR20230150240A (ko) | 2023-10-30 |
KR20230013012A (ko) | 2023-01-26 |
CN109479141B (zh) | 2023-07-14 |
CN116614641A (zh) | 2023-08-18 |
JP6938612B2 (ja) | 2021-09-22 |
KR102379174B1 (ko) | 2022-03-25 |
CN109479141A (zh) | 2019-03-15 |
US20240187644A1 (en) | 2024-06-06 |
KR102591695B1 (ko) | 2023-10-19 |
WO2018012886A1 (ko) | 2018-01-18 |
US11509930B2 (en) | 2022-11-22 |
KR20220041808A (ko) | 2022-04-01 |
JP2023164731A (ja) | 2023-11-10 |
CN116614639A (zh) | 2023-08-18 |
US20190200040A1 (en) | 2019-06-27 |
JP2019525572A (ja) | 2019-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109479141B (zh) | 图像编码/解码方法和用于所述方法的记录介质 | |
US12095999B2 (en) | Image encoding/decoding method and recording medium for same | |
CN109417629B (zh) | 图像编码/解码方法以及用于该方法的记录介质 | |
CN109804627B (zh) | 图像编码/解码方法和设备 | |
CN118158438A (zh) | 对图像进行解码的方法、对图像进行编码的方法以及用于发送通过对图像进行编码的方法生成的比特流的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |