CN110740320A - 视频编码方法和设备以及视频解码方法和设备 - Google Patents
视频编码方法和设备以及视频解码方法和设备 Download PDFInfo
- Publication number
- CN110740320A CN110740320A CN201911181685.3A CN201911181685A CN110740320A CN 110740320 A CN110740320 A CN 110740320A CN 201911181685 A CN201911181685 A CN 201911181685A CN 110740320 A CN110740320 A CN 110740320A
- Authority
- CN
- China
- Prior art keywords
- intra prediction
- prediction mode
- mode
- current block
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 76
- 238000005192 partition Methods 0.000 description 167
- 241000023320 Luma <angiosperm> Species 0.000 description 41
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 41
- 230000009466 transformation Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 13
- 239000000284 extract Substances 0.000 description 6
- 238000000638 solvent extraction Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 5
- 230000015654 memory Effects 0.000 description 5
- 238000013500 data storage Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/11—Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
提供了一种视频编码方法和设备以及视频解码方法和设备,所述视频解码方法包括以下步骤:基于使用与当前块邻近的块的可能性以及预测模式,确定参考帧内预测模式;基于参考帧内预测模式,确定用于当前块的多个候选帧内预测模式;从比特流获得包括关于当前块的帧内预测模式的信息的帧内预测数据;当所述帧内预测数据指示根据所述多个候选帧内预测模式之一来对当前块进行预测时,从所述多个候选帧内预测模式中选择将用于对当前块进行帧内预测的帧内预测模式;根据选择的帧内预测模式对当前块执行帧内预测。
Description
本申请是向中国知识产权局提交的申请日为2014年12月19日、申请号为201480075994.1、发明名称为“涉及帧内预测的视频编码方法和装置以及视频解码方法和装置”的申请的分案申请。
技术领域
本发明涉及通过帧内预测对视频进行编码和解码。
背景技术
随着用于再现和存储高分辨率或高质量视频内容的硬件的开发和提供,对于用于有效地对高分辨率或高质量视频内容进行编码或解码的视频编解码器的需求正在增加。根据传统的视频编解码器,基于具有预定尺寸的编码单元,根据受限的编码方法来对视频进行编码。
空间域的图像数据经由频率变换被变换为频域的系数。根据视频编解码器,将图像划分为具有预定尺寸的块,对每个块执行离散余弦变换(DCT),并以块为单位对频率系数进行编码,以进行频率变换的快速计算。与空间域的图像数据相比,频域的系数容易被压缩。具体地,由于根据经由视频编解码器的帧间预测或帧内预测的预测误差来表示空间域的图像像素值,因此当对预测误差执行频率变换时,大量数据可被变换为0。根据视频编解码器,可通过使用小量数据来代替连续并重复产生的数据以减少数据量。
发明内容
技术问题
提供了一种对关于当前块的帧内预测模式的信息进行编码的方法,其中,具有关于将在帧内预测中使用的高可用性的帧内预测模式被确定为候选帧内预测模式。此外,提供了一种对关于当前块的帧内预测模式的信息进行解码的方法,其中,具有关于将在帧内预测中使用的高可用性的帧内预测模式被确定为候选帧内预测模式。此外,提供了一种计算机可读记录介质,其中,计算机可读记录介质记录有包括编码方法或解码方法的程序。
技术方案
根据本发明的一方面,提供了一种视频解码方法,包括:基于当前块的邻近块的可用性和预测模式,确定参考帧内预测模式;基于参考帧内预测模式,确定用于当前块的多个候选帧内预测模式;从比特流获得包括关于当前块的帧内预测模式的信息的帧内预测数据;当所述帧内预测数据指示根据所述多个候选帧内预测模式之一来对当前块进行预测时,选择将在对当前块进行帧内预测时使用的帧内预测模式,其中,选择的帧内预测模式在所述多个候选帧内预测模式之中;根据选择的帧内预测模式对当前块执行帧内预测。
参考帧内预测模式可包括第一参考帧内预测模式和第二参考帧内预测模式,其中,第一参考帧内预测模式是基于当前块的左侧邻近块的可用性和预测模式确定的,第二参考帧内预测模式是基于当前块的上方邻近块的可用性和预测模式确定的,确定参考帧内预测模式的步骤可包括:在当前块的左侧邻近块不存在或者当前块的左侧邻近块基于帧间预测被预测时,将第一参考帧内预测模式确定为第一默认帧内预测模式,在当前块的左侧邻近块基于帧内预测被预测时,将第一参考帧内预测模式确定为在对当前块的左侧邻近块进行帧内预测时使用的帧内预测模式,在当前块的上方邻近块不存在或者当前块的上方邻近块基于帧间预测被预测时,将第二参考帧内预测模式确定为第一默认帧内预测模式,在当前块的上方邻近块基于帧内预测被预测时,将第二参考帧内预测模式确定为在对当前块的上方邻近块进行帧内预测时使用的帧内预测模式。
当第一参考帧内预测模式和第二参考帧内预测模式相同,并且第一参考帧内预测模式不指示第一默认帧内预测模式时,确定用于当前块的多个候选帧内预测模式的步骤可包括:将第一候选帧内预测模式确定为第一默认帧内预测模式,将第二候选帧内预测模式确定为第一参考帧内预测模式。
当第一参考帧内预测模式和第二参考帧内预测模式相同,并且第一参考帧内预测模式可指示第一默认帧内预测模式时,确定用于当前块的多个候选帧内预测模式的步骤可包括:将第一候选帧内预测模式确定为第一默认帧内预测模式,将第二候选帧内预测模式确定为第二默认帧内预测模式。
当第一参考帧内预测模式和第二参考帧内预测模式不同时,确定用于当前块的多个候选帧内预测模式的步骤可包括:将第一候选帧内预测模式确定为第一参考帧内预测模式和第二参考帧内预测模式中的具有较小索引值的帧内预测模式,将第二候选帧内预测模式确定为第一参考帧内预测模式和第二参考帧内预测模式中的具有较大索引值的帧内预测模式。
所述视频解码方法还可包括:当所述帧内预测数据指示基于不包括在所述多个候选帧内预测模式中的帧内预测模式之一对当前块进行预测时,基于所述帧内预测数据的索引值以及所述多个候选帧内预测模式的索引值,选择将在对当前块进行帧内预测时使用的帧内预测模式。
选择将在对当前块进行帧内预测时使用的帧内预测模式的步骤可包括:当通过从所述帧内预测数据的索引值减去2所获得的值小于表示第一候选帧内预测模式的索引值时,将当前块的帧内预测模式确定为与通过从所述帧内预测数据的索引值减去2所获得的值相应的帧内预测模式;当通过从所述帧内预测数据的索引值减去2所获得的值大于表示第一候选帧内预测模式的索引值,并且小于表示第二候选帧内预测模式的索引值时,将当前块的帧内预测模式确定为与通过从所述帧内预测数据的索引值减去1所获得的值相应的帧内预测模式,当通过从所述帧内预测数据的索引值减去2所获得的值大于表示第二候选帧内预测模式的索引值时,将当前块的帧内预测模式确定为与所述帧内预测数据的索引值相应的帧内预测模式。
根据本发明的另一方面,提供了一种视频解码设备,包括:候选帧内预测模式确定器,被配置为:基于当前块的邻近块的可用性和预测模式,确定参考帧内预测模式,基于参考帧内预测模式,确定用于当前块的多个候选帧内预测模式;帧内预测器,被配置为:从比特流获得包括关于当前块的帧内预测模式的信息的帧内预测数据,当所述帧内预测数据指示根据所述多个候选帧内预测模式之一来对当前块进行预测时,选择将在对当前块进行帧内预测时使用的帧内预测模式,其中,选择的帧内预测模式在所述多个候选帧内预测模式之中,根据选择的帧内预测模式对当前块执行帧内预测。
参考帧内预测模式可包括第一参考帧内预测模式和第二参考帧内预测模式,其中,第一参考帧内预测模式是基于当前块的左侧邻近块的可用性和预测模式确定的,第二参考帧内预测模式是基于当前块的上方邻近块的可用性和预测模式确定的,候选帧内预测模式确定器还可被配置为:在当前块的左侧邻近块不存在或者当前块的左侧邻近块基于帧间预测被预测时,将第一参考帧内预测模式确定为第一默认帧内预测模式,在当前块的左侧邻近块基于帧内预测被预测时,将第一参考帧内预测模式确定为在对当前块的左侧邻近块进行帧内预测时使用的帧内预测模式,在当前块的上方邻近块不存在或者当前块的上方邻近块基于帧间预测被预测时,将第二参考帧内预测模式确定为第一默认帧内预测模式,在当前块的上方邻近块基于帧间预测被预测时,将第二参考帧内预测模式确定为在对当前块的上方邻近块进行帧内预测时使用的帧内预测模式。
当第一参考帧内预测模式和第二参考帧内预测模式相同,并且第一参考帧内预测模式不指示第一默认帧内预测模式时,候选帧内预测模式确定器还可被配置为:将第一候选帧内预测模式确定为第一默认帧内预测模式,将第二候选帧内预测模式确定为第一参考帧内预测模式。
当第一参考帧内预测模式和第二参考帧内预测模式相同,并且第一参考帧内预测模式可指示第一默认帧内预测模式时,候选帧内预测模式确定器还可被配置为:将第一候选帧内预测模式确定为第一默认帧内预测模式,将第二候选帧内预测模式确定为第二默认帧内预测模式。
当第一参考帧内预测模式和第二参考帧内预测模式不同时,候选帧内预测模式确定器还可被配置为:将第一候选帧内预测模式确定为第一参考帧内预测模式和第二参考帧内预测模式中的具有较小索引值的帧内预测模式,将第二候选帧内预测模式确定为第一参考帧内预测模式和第二参考帧内预测模式中的具有较大索引值的帧内预测模式。
当所述帧内预测数据指示基于不包括在所述多个候选帧内预测模式中的帧内预测模式之一对当前块进行预测时,帧内预测器还可被配置为:基于所述帧内预测数据的索引值以及所述多个候选帧内预测模式的索引值,选择将在对当前块进行帧内预测时使用的帧内预测模式。
帧内预测器还可被配置为:当通过从所述帧内预测数据的索引值减去2所获得的值小于表示第一候选帧内预测模式的索引值时,将当前块的帧内预测模式确定为与通过从所述帧内预测数据的索引值减去2所获得的值相应的帧内预测模式;当通过从所述帧内预测数据的索引值减去2所获得的值大于表示第一候选帧内预测模式的索引值,并且小于表示第二候选帧内预测模式的索引值时,将当前块的帧内预测模式确定为与通过从所述帧内预测数据的索引值减去1所获得的值相应的帧内预测模式,当通过从所述帧内预测数据的索引值减去2所获得的值大于表示第二候选帧内预测模式的索引值时,将当前块的帧内预测模式确定为与所述帧内预测数据的索引值相应的帧内预测模式。
根据本发明的另一方面,提供了一种视频编码方法,包括:基于当前块的邻近块的可用性和预测模式,确定参考帧内预测模式;基于参考帧内预测模式,确定用于当前块的多个候选帧内预测模式;基于用于当前块的帧内预测模式以及所述多个候选帧内预测模式,确定是否根据所述多个候选帧内预测模式之一对当前块进行预测以及指示用于当前块的帧内预测模式的帧内预测数据。
根据本发明的另一方面,提供了一种视频编码设备,包括:候选帧内预测模式确定器,被配置为:基于当前块的邻近块的可用性和预测模式,确定参考帧内预测模式,基于参考帧内预测模式,确定用于当前块的多个候选帧内预测模式;帧内预测模式信息编码器,被配置为:基于用于当前块的帧内预测模式以及所述多个候选帧内预测模式,确定是否根据所述多个候选帧内预测模式之一对当前块进行预测以及指示用于当前块的帧内预测模式的帧内预测数据。
根据本发明的另一方面,提供了一种计算机可读记录介质,其中,计算机可读记录介质记录有用于通过使用计算机执行视频解码方法的程序。
根据本发明的另一方面,提供了一种计算机可读记录介质,其中,计算机可读记录介质记录有用于通过使用计算机执行视频编码方法的程序。
有益效果
具有关于将在对当前块的帧内预测中使用的高可用性的帧内预测模式可被确定为候选帧内预测模式,并且关于候选帧内预测模式的信息可被熵编码为短二进制符号串。因此,可有效地压缩关于当前块的帧内预测模式的信息。
附图说明
图1示出根据本发明的实施例的视频编码设备的框图。
图2示出根据本发明的实施例的视频解码设备的框图。
图3示出根据实施例的被参考以对帧内预测模式进行预测的邻近预测单元。
图4示出在基于根据树结构的编码单元进行视频编码中被参考以对帧内预测模式进行预测的预测单元(PU)的示例。
图5是示出根据本发明的实施例的视频编码方法的流程图。
图6示出根据本发明的实施例的视频解码方法的流程图。
图7示出根据本发明的实施例的基于树结构的编码单元的视频编码设备的框图。
图8示出根据本发明的实施例的基于树结构的编码单元的视频解码设备的框图。
图9示出根据本发明的实施例的编码单元的概念。
图10示出根据本发明的实施例的基于编码单元的图像编码器的框图。
图11示出根据本发明的实施例的基于编码单元的图像解码器的框图。
图12示出根据本发明的实施例的根据深度的较深层编码单元和分区。
图13示出根据本发明的实施例的编码单元和变换单元之间的关系。
图14示出根据本发明的实施例的根据深度的多条编码信息。
图15示出根据本发明的实施例的根据深度的较深层编码单元。
图16、图17和图18示出根据本发明的实施例的编码单元、预测单元和变换单元之间的关系。
图19示出根据表4的编码模式信息的编码单元、预测单元和变换单元之间的关系。
最佳实施方式
根据本发明的一方面,提供了一种视频解码方法,包括:基于当前块的邻近块的可用性和预测模式,确定参考帧内预测模式;基于参考帧内预测模式,确定用于当前块的多个候选帧内预测模式;从比特流获得包括关于当前块的帧内预测模式的信息的帧内预测数据;当所述帧内预测数据指示根据所述多个候选帧内预测模式之一来对当前块进行预测时,选择将在对当前块进行帧内预测时使用的帧内预测模式,其中,选择的帧内预测模式在所述多个候选帧内预测模式之中;根据选择的帧内预测模式对当前块执行帧内预测。
根据本发明的另一方面,提供了一种视频解码设备,包括:候选帧内预测模式确定器,被配置为:基于当前块的邻近块的可用性和预测模式,确定参考帧内预测模式,基于参考帧内预测模式,确定用于当前块的多个候选帧内预测模式;帧内预测器,被配置为:从比特流获得包括关于当前块的帧内预测模式的信息的帧内预测数据,当所述帧内预测数据指示根据所述多个候选帧内预测模式之一来对当前块进行预测时,选择将在对当前块进行帧内预测时使用的帧内预测模式,其中,选择的帧内预测模式在所述多个候选帧内预测模式之中,根据选择的帧内预测模式对当前块执行帧内预测。
根据本发明的另一方面,提供了一种计算机可读记录介质,其中,计算机可读记录介质记录有用于通过使用计算机执行视频解码方法或视频编码方法的程序。
具体实施方式
在下文中,参照图1至图6提供根据实施例的基于帧内预测模式下的预测技术的视频编码方法和视频解码方法。另外,参照图7至图19提供在根据实施例的基于树结构的编码单元的视频编码方法和视频解码方法中使用帧内预测模式下的预测技术的实施例。
在本说明书中,术语“预测块”是指预测单元。此外,术语“当前块”是指当前正被编码/解码的预测单元。此外,术语“邻近块”是指与当前块邻近的预测单元。将参照图16至图18详细描述预测单元。
首先,将参照图1至图6描述根据实施例的基于帧内预测模式下的预测技术的视频编码方法和视频解码方法。
图1示出根据本发明的实施例的视频编码设备10的框图。
视频编码设备10可通过帧内预测/帧间预测、变换、量化和熵编码来对空间域的视频数据进行编码。参照图1,将描述当视频编码设备10对作为由视频编码设备10执行的帧内预测的结果而产生的帧内预测模式信息进行编码时在视频编码设备10中发生的操作。
视频编码设备10包括候选帧内预测模式确定器12和帧内预测模式信息编码器14。
视频编码设备10可将视频的图像数据划分为多个数据单元,并可对每个数据单元进行编码。数据单元可被形成为方形、矩形或任意几何形状。本发明不限于预定尺寸的数据单元。为了便于描述,将描述针对作为一类数据单元的“块”的视频编码方法。然而,根据本发明的实施例的视频编码方法不限于针对“块”的视频编码方法,并可被应用于各种数据单元。
候选帧内预测模式确定器12基于当前块的邻近块的可用性和预测模式来确定参考帧内预测模式。
候选帧内预测模式确定器12可考虑当前块的邻近块的解码顺序,仅考虑当前块的邻近块之中的当前块的左侧邻近块和上方邻近块。然而,候选帧内预测模式确定器12除了可考虑当前块的左侧邻近块和上方邻近块之外,还可考虑其它邻近块。
参考帧内预测模式可包括第一参考帧内预测模式和第二参考帧内预测模式。
例如,当当前块的左侧邻近块不存在或者通过帧间预测被预测时,候选帧内预测模式确定器12可将第一参考帧内预测模式确定为第一默认帧内预测模式。第一默认帧内预测模式是当针对参考帧内预测模式和候选帧内预测模式无法确定帧内预测模式时主要应用于参考帧内预测模式和候选帧内预测模式的帧内预测模式。例如,第一默认帧内预测模式可被设置为DC模式。
相反,当当前块的左侧邻近块通过帧内预测被预测时,候选帧内预测模式确定器12可将第一参考帧内预测模式确定为在对当前块的左侧邻近块进行帧内预测时使用的帧内预测模式。
当当前块的上方邻近块不存在或者通过帧间预测被预测时,候选帧内预测模式确定器12可将第二参考帧内预测模式确定为第一默认帧内预测模式。
相反,当当前块的上方邻近块通过帧内预测被预测时,候选帧内预测模式确定器12可将第二参考帧内预测模式确定为在对当前块的上方邻近块进行帧内预测时使用的帧内预测模式。
候选帧内预测模式确定器12基于参考帧内预测模式确定针对当前块的多个候选帧内预测模式。候选帧内预测模式的数量可以是固定的。例如,候选帧内预测模式确定器12可确定两个候选帧内预测模式。
候选帧内预测模式确定器12根据第一参考帧内预测模式和第二参考帧内预测模式是彼此不同还是彼此相同来确定候选帧内预测模式。
例如,当第一参考帧内预测模式和第二参考帧内预测模式相同,并且第一参考帧内预测模式不是第一默认帧内预测模式时,候选帧内预测模式确定器12可将第一候选帧内预测模式确定为第一默认帧内预测模式,并可将第二候选帧内预测模式确定为第一参考帧内预测模式。
当第一参考帧内预测模式和第二参考帧内预测模式相同,并且第一参考帧内预测模式指示第一默认帧内预测模式时,候选帧内预测模式确定器12可将第一候选帧内预测模式确定为第一默认帧内预测模式,并可将第二候选帧内预测模式确定为第二默认帧内预测模式。当第一参考帧内预测模式和第二参考帧内预测模式都是第一默认帧内预测模式时,两个候选帧内预测模式必须被确定为不同的帧内预测模式,因此,第二候选帧内预测模式被确定为第二默认帧内预测模式。
当第一参考帧内预测模式和第二参考帧内预测模式不同时,候选帧内预测模式确定器12可将第一候选帧内预测模式确定为具有表示第一参考帧内预测模式的索引值和表示第二参考帧内预测模式的索引值之中较小的索引值的帧内预测模式,并可将第二候选帧内预测模式确定为具有表示第一参考帧内预测模式的索引值和表示第二参考帧内预测模式的索引值之中较大的索引值的帧内预测模式。
例如,当第一参考帧内预测模式是垂直模式(索引值为12),并且第二参考帧内预测模式是水平模式(索引值为24)时,第一候选帧内预测模式被确定为垂直模式,并且第二候选帧内预测模式被确定为水平模式。
基于在当前块中使用的帧内预测模式以及多个候选帧内预测模式,帧内预测模式信息编码器14确定是否根据多个候选帧内预测模式之一来对当前块进行预测,并确定指示在当前块中使用的帧内预测模式的帧内预测数据。因此,帧内预测数据可包括候选帧内预测标志和当前帧内预测数据,其中,候选帧内预测标志指示是否根据多个候选帧内预测模式之一来对当前块进行预测,当前帧内预测数据指示在当前块中使用的帧内预测模式。
可根据候选帧内预测标志的值来改变当前帧内预测数据的大小。具体地,当指示当前块已基于多个候选帧内预测模式之一被预测时,帧内预测模式信息编码器14将当前帧内预测数据表示为1比特。另一方面,当指示当前块已基于非候选帧内预测模式的帧内预测模式之一被预测时,帧内预测模式信息编码器14将当前帧内预测数据表示为至少2比特。
当当前块中使用的帧内预测模式是候选帧内预测模式时,帧内预测模式信息编码器14将帧内预测数据设置为指示当前块是根据候选帧内预测模式之一被预测的。
另一方面,当当前块中使用的帧内预测模式不是候选帧内预测模式时,帧内预测模式信息编码器14将帧内预测数据设置为指示当前块是根据非候选帧内预测模式的帧内预测模式之一被预测的。
例如,候选帧内预测标志可被设置为指示当前块是否根据候选帧内预测模式之一被预测。根据实施例,当候选帧内预测模式被使用时,候选帧内预测标志可指示1。当候选帧内预测模式不被使用时,候选帧内预测标志可指示0。
当根据候选帧内预测模式之一对当前块进行预测时,帧内预测模式信息编码器14可对帧内预测数据进行编码以指示在当前块中使用的帧内预测模式,其中,帧内预测模式在多个候选帧内预测模式之中。更具体地说,帧内预测模式信息编码器14可对帧内预测数据的当前帧内预测数据进行编码以指示在当前块中使用的帧内预测模式。
根据候选帧内预测模式的数量来确定指示在当前块中使用的帧内预测模式的数据的大小。例如,当候选帧内预测模式确定器12确定两个候选帧内预测模式时,当前帧内预测模式数据可被表示为1比特。
当帧内预测数据指示当前块根据非候选帧内预测模式的帧内预测模式被预测时,帧内预测模式信息编码器14可对帧内预测数据进行编码以指示在当前块中使用的帧内预测模式,其中,帧内预测模式在非候选帧内预测模式的帧内预测模式之中。更具体地,帧内预测模式信息编码器14可对帧内预测数据的当前帧内预测数据进行编码以指示在当前块中使用的帧内预测模式。
当指示当前块是基于非候选帧内预测模式的帧内预测模式被预测的时,帧内预测模式信息编码器14可根据候选帧内预测模式改变被分配给帧内预测模式的索引值,并可将修改后的索引值包括在帧内预测数据中。
表2示出包括在帧内预测数据中的候选帧内预测模式的改变后的索引值。
因此,根据实施例的视频编码设备10可对作为对视频的块进行帧内预测的结果而产生的信息进行编码,并输出该信息。
根据实施例的视频编码设备10可包括中央处理器(未示出),其中,中央处理器用于整体控制候选帧内预测模式确定器12和帧内预测模式信息编码器14。另外,候选帧内预测模式确定器12和帧内预测模式信息编码器14可分别由另外的处理器(未示出)驱动,并且视频编码设备10可通过处理器(未示出)的系统操作被整体驱动。另外,候选帧内预测模式确定器12和帧内预测模式信息编码器14可由根据实施例的视频编码设备10的外部处理器(未示出)来控制。
根据实施例的视频编码设备10可包括一个或更多个数据存储器(未示出),其中,所述一个或更多个数据存储器用于存储候选帧内预测模式确定器12和帧内预测模式信息编码器14的输入数据/输出数据。视频编码设备10可包括用于控制数据存储单元(未示出)的数据输入/输出的存储器控制器(未示出)。
根据实施例的视频编码设备10可通过与安装在视频编码设备10中的视频编码处理器或外部视频编码处理器联合操作来执行包括预测和变换的视频编码操作以输出视频编码结果。根据实施例的视频编码设备10中的内部视频编码处理器可包括这样的情况:视频编码设备10或中央计算装置或图形计算装置除了包括单独的处理器之外还包括用于执行基本视频编码操作的视频编码处理模块。
图2示出根据本发明的实施例的视频解码设备20的框图。
视频解码设备20可通过熵解码、反量化、逆变换或帧内预测/运动补偿来对由视频编码设备10编码的视频数据进行解码,并因此可重建与空间域的原始视频数据近似的视频数据。下面,将描述由视频解码设备20执行的从比特流解析用于帧内预测的符号并从解析出的符号重建帧内预测模式的处理。
根据实施例的视频解码设备20包括候选帧内预测模式确定器22和帧内预测器24。
视频解码设备20可接收包括编码的视频数据的比特流。
候选帧内预测模式确定器22基于当前块的邻近块的可用性和预测模式来确定参考帧内预测模式。候选帧内预测模式确定器22基于参考帧内预测模式确定针对当前块的多个候选帧内预测模式。
视频解码设备20的候选帧内预测模式确定器22根据由视频编码设备10的候选帧内预测模式确定器12同样执行的方法来确定候选帧内预测模式。因此,用于当前模式的候选帧内预测模式在视频编码设备10和视频解码设备20中是相同的。
帧内预测器24从比特流获得包括关于当前块的帧内预测模式的信息的帧内预测数据。帧内预测数据可包括候选帧内预测标志和当前帧内预测数据,其中,候选帧内预测标志指示当前块是否是根据候选帧内预测模式之一被预测的,当前帧内预测数据指示在当前块中使用的帧内预测模式。
当帧内预测数据指示当前块是根据候选帧内预测模式之一被预测时,帧内预测器24可选择将用于对当前块进行帧内预测的帧内预测模式,其中,帧内预测模式在多个候选帧内预测模式之中。
相反,当帧内预测数据指示当前块是根据未包括在候选帧内预测模式中的帧内预测模式之一被预测时,帧内预测器24可基于帧内预测数据和候选帧内预测模式的索引值,选择将用于对当前块进行帧内预测的帧内预测模式。
帧内预测器24可解析候选帧内预测标志,并因此确定是否根据候选帧内预测模式之一对当前块进行解码。
当帧内预测器24基于帧内预测数据选择帧内预测模式时,帧内预测器24可根据候选帧内预测模式改变帧内预测数据的值。
例如,当假设存在两个候选帧内预测模式,并且通过从帧内预测数据的索引值减去2而获得的值小于表示第一候选帧内预测模式的索引值时,帧内预测器24可将当前块的帧内预测模式确定为与通过从帧内预测数据的索引值减去2而获得的值相应的帧内预测模式。
当通过从帧内预测数据的索引值减去2而获得的值大于表示第一候选帧内预测模式的索引值,并且小于表示第二候选帧内预测模式的索引值时,帧内预测器24可将当前块的帧内预测模式确定为与通过从帧内预测数据的索引值减去1而获得的值相应的帧内预测模式。
当通过从帧内预测数据的索引值减去2而获得的值大于表示第二候选帧内预测模式的索引值时,帧内预测器24可将当前块的帧内预测模式确定为与帧内预测数据的索引值相应的帧内预测模式。
参照等式2和表2来描述根据候选帧内预测模式改变帧内预测数据的值的实施例。
帧内预测器24可通过解析帧内预测数据中包括的当前帧内预测数据来确定当前块的帧内预测模式。参照等式3来描述其实施例。
作为选择上述左侧参考帧内预测模式/第二参考帧内预测模式的具体示例,下面描述确定候选帧内预测模式的方法的实施例和通过解析帧内预测模式信息确定当前块的帧内预测模式信息的方法的实施例。
首先,确定当前块的邻近块的帧内预测模式。左侧预测块的帧内预测模式是intraPredModeA。由于当前预测块位于视频图像的左边界,因此不存在左侧预测块,或者当左侧预测块基于帧间预测模式被预测时,intraPredModeA被确定为DC模式。
上方预测块的帧内预测模式是intraPredModeB。由于当前预测块位于视频图像的上边界,因此不存在上方预测块,或者当上方预测块基于帧间预测模式被预测时,intraPredModeB被确定为DC模式。
在确定候选帧内预测模式时,intraPredModeA和intraPredModeB被用作参考值。
随后,基于intraPredModeA和intraPredModeB确定候选帧内预测模式。现在将描述通过使用等式1确定候选帧内预测模式的实施例。
if(intraPredModeA!=intraPredModeB)
predIntraPredMode0=min(intraPredModeA,intraPredModeB);
predIntraPredMode1=max(intraPredModeA,intraPredModeB);
if(intraPredModeA==intraPredModeB!=DC mode)
predIntraPredMode0=DC mode;
predIntraPredMode1=intraPredModeA;
if(intraPredModeA==intraPredModeB==DC mode)
predIntraPredMode0=DC mode;
predIntraPredMode1=Bilinear mode;[等式1]
predIntraPredMode0和predIntraPredMode1分别是指第一候选帧内预测模式和第二候选帧内预测模式。在实施例中,针对每个块确定两个候选帧内预测模式。min(A,B)指示输出A和B中的较小值的函数,max(A,B)指示输出A和B中的较大值的函数。
根据等式1,如果intraPredModeA和intraPredModeB彼此不同,则intraPredModeA和intraPredModeB之中的较小值被分配给predIntraPredMode0,intraPredModeA和intraPredModeB之中的较大值被分配给predIntraPredMode1。
如果intraPredModeA和intraPredModeB相同,并且intraPredModeA不为0,则DC模式被配置给predIntraPredMode0。此外,intraPredModeA被配置给predIntraPredMode1。
如果intraPredModeA和intraPredModeB相同,并且intraPredModeA为0,则DC模式被配置给predIntraPredMode0。此外,双线性模式被配置给predIntraPredMode1。
当predIntraPredMode0和predIntraPredMode1被确定时,通过解析intra_luma_pred_mode来确定当前块的帧内预测模式。下面参照等式2来描述确定帧内预测模式的方法的实施例。
if(intra_luma_pred_mode==0)
IntraLumaPredMode=predIntraPredMode0;
if(intra_luma_pred_mode==1)
IntraLumaPredMode=predIntraPredMode1;
else
if(intra_luma_pred_mode-2<predIntraPredMode0)
IntraLumaPredMode=intra_luma_pred_mode–2;
if(intra_luma_pred_mode-2>predIntraPredMode0&&intra_luma_pred_mode-2<predIntraPredMode1)
IntraLumaPredMode=intra_luma_pred_mode–1;
else
IntraLumaPredMode=intra_luma_pred_mode;[等式2]
intra_luma_pred_mode是指关于当前块的帧内预测模式信息。0和33之间的值被分配给intra_luma_pred_mode。IntraLumaPredMode是指当前块的帧内预测模式。
根据等式2,如果intra_luma_pred_mode为0,则IntraLumaPredMode被确定为由predIntraPredMode0指定的帧内预测模式。如果intra_luma_pred_mode为1,则IntraLumaPredMode被确定为由predIntraPredMode1指定的帧内预测模式。因此,当intra_luma_pred_mode为0或1时,可识别出使用候选帧内预测模式。
如果intra_luma_pred_mode不为0且不为1,则不使用候选帧内预测模式。另外,通过将intra_luma_pred_mode的值与predIntraPredMode0的值和predIntraPredMode1的值进行比较来确定IntraLumaPredMode。
如果通过从intra_luma_pred_mode减去2而获得的值小于predIntraPredMode0的值,则IntraLumaPredMode被确定为与通过从intra_luma_pred_mode的值减去2而获得的值相应的帧内预测模式。
如果通过从intra_luma_pred_mode减去2而获得的值大于predIntraPredMode0的值,并且小于predIntraPredMode1的值,则IntraLumaPredMode被确定为与通过从intra_luma_pred_mode的值减去1而获得的值相应的帧内预测模式。
如果通过从intra_luma_pred_mode减去2而获得的值大于predIntraPredMode1的值,则IntraLumaPredMode被确定为与intra_luma_pred_mode的值相应的帧内预测模式。
如上所述,可从用作为帧内预测模式信息的intra_luma_pred_mode获得作为当前块的帧内预测模式的IntraLumaPredMode。
当与IntraLumaPredMode相应的帧内预测模式被确定时,视频解码设备20根据确定的帧内预测模式对当前块进行预测。
表1示出与intra_luma_pred_mode的值相应的二进制符号串。表1的binIdx是指被分配给二进制符号串的每个二进制位(bin)的二进制位索引。二进制位是上下文自适应二进制算术编码(CABAC)的基本单元,并被表示为0和1。可基于表1中呈现的intra_luma_pred_mode和二进制符号串之间的关系来对intra_luma_pred_mode进行熵编码。
表1
[表1]
如果intra_luma_pred_mode的值为值2至33之一,则二进制符号串被表示为6比特。然而,如果intra_luma_pred_mode的值为0或1,则二进制符号串被表示为2比特。
与候选帧内预测模式相应的两个帧内预测模式被分配给intra_luma_pred_mode的0和1,因此,当基于包括在候选帧内预测模式中的帧内预测模式来对当前块进行预测时,针对当前块的帧内预测模式的intra_luma_pred_mode的二进制符号串的数据被表示为2比特。
因此,由于具有高可用性的帧内预测模式被确定为候选帧内预测模式,因此,关于帧内预测模式信息的数据可被有效地压缩。
在表1中,与intra_luma_pred_mode的值相应的二进制符号串可被划分为候选帧内预测模式标志(下面,被称为“mpm_flag”)和当前帧内预测模式信息,并可被解析。
参照表1,候选帧内预测模式标志与二进制符号串的二进制位索引为0的二进制位相应。如果候选帧内预测模式标志为1,则当前块的帧内预测模式可被确定为两个候选帧内预测模式之一。视频解码设备20可根据binIdx为1的二进制位(下面,“mpm_index”)的值,从候选帧内预测模式确定将用于对当前块进行预测的帧内预测模式。例如,如果mpm_index表示0,则第一候选帧内预测模式可被选为当前块的帧内预测模式。
如果候选帧内预测模式标志为1,则当前块的帧内预测模式可被确定为非候选帧内预测模式的帧内预测模式之一。视频解码设备20可根据binIdx为1至5的5个二进制位(下面,“Ipmode”)的值以及候选帧内预测模式的索引值来确定帧内预测模式。当前帧内预测模式信息可包括mpm_index和Ipmode。参照等式3,描述根据Ipmode的值对当前块进行预测的实施例。
下面的表2示出被分配给IntraLumaPredMode的值的帧内预测模式。参照表2描述了等式2的算法。
表2
[表2]
根据等式2,表2中的IntraLumaPredMode的索引值从表1中的intra_luma_pred_mode的索引值被推导。在视频编码过程中,作为候选帧内预测模式的帧内预测模式被分配为0和1,其余帧内预测模式被分配给intra_luma_pred_mode的2至32。因此,解码过程需要通过考虑候选帧内预测模式从intra_luma_pred_mode的索引值确定IntraLumaPredMode的处理。参照表3,描述在解码过程中确定IntraLumaPredMode的实施例。
表3
[表3]
predIntraPredMode0 | 5 | predIntraPredMode1 | 12 |
intra_luma_pred_mode | IntraLumaPredMode | intra_luma_pred_mode | IntraLumaPredMode |
0 | 5 | 17 | 17 |
1 | 12 | 18 | 18 |
2 | 0 | 19 | 19 |
3 | 1 | 20 | 20 |
4 | 2 | 21 | 21 |
5 | 3 | 22 | 22 |
6 | 4 | 23 | 23 |
7 | 6 | 24 | 24 |
8 | 7 | 25 | 25 |
9 | 8 | 26 | 26 |
10 | 9 | 27 | 27 |
11 | 10 | 28 | 28 |
12 | 11 | 29 | 29 |
13 | 13 | 30 | 30 |
14 | 14 | 31 | 31 |
15 | 15 | 32 | 32 |
16 | 16 |
参照表3,如果候选帧内预测模式为5和12,则指示候选帧内预测模式的predIntraPredMode0和predIntraPredMode1的值分别变为5和12。
如果指示帧内预测模式信息的intra_luma_pred_mode的值为0或1,则当前块的帧内预测模式被确定为候选帧内预测模式之一。参照表3,如果intra_luma_pred_mode的值为0或1,则IntraLumaPredMode的值分别变为5和12。
如果指示帧内预测模式信息的intra_luma_pred_mode的值为2至32之一,则通过使用等式2来确定IntraLumaPredMode的值。参照表3,当intra_luma_pred_mode为2至16之一时,(intra_luma_pred_mode-2)小于5(即,第一候选帧内预测模式),因此,IntraLumaPredMode的值被确定为与(intra_luma_pred_mode-2)相应的0至4。
当intra_luma_pred_mode的值在7至12之间时,(intra_luma_pred_mode-2)大于5(即,第一候选帧内预测模式),并且小于12(即,第二候选帧内预测模式),因此,IntraLumaPredMode的值被确定为与(intra_luma_pred_mode-1)相应的6至11。
当intra_luma_pred_mode的值在13至32之间时,(intra_luma_pred_mode-2)大于12(即,第二候选帧内预测模式),因此,IntraLumaPredMode的值被确定为与(intra_luma_pred_mode)相应的13至32。
参照等式3,描述从帧内预测数据确定当前块的帧内预测模式的方法的实施例。
在等式3中,mpm_flag表示帧内预测数据中的候选帧内预测模式标志。当基于非候选帧内预测模式的帧内预测模式来对当前块进行预测时,Ipmode表示指示当前块的帧内预测模式的信息。IntraLumaPredMode表示在如等式2对当前块进行帧内预测时实际使用的帧内预测模式的索引值。视频解码设备20将Ipmode与表示候选帧内预测模式的predIntraPredMode0和predIntraPredMode1进行比较,并根据比较的结果来改变Ipmode的值。随后,Ipmode的值被应用到true_ipmode。
当基于作为候选帧内预测模式的帧内预测模式来对当前块进行预测时,mpm_index表示指示候选帧内预测模式的索引值。
If(mpm_flag==0)
If(Ipmode<predIntraPredMode0)
IntraLumaPredMode=Ipmode;
If(Ipmode>=predIntraPredMode0)
Ipmode++;
If(Ipmode<predIntraPredMode1)
IntraLumaPredMode=Ipmode;
If(Ipmode>=predIntraPredMode1)
IntraLumaPredMode=Ipmode+1;
If(mpm_flag==1)
If(mpm_index==0)
IntraLumaPredMode=predIntraPredMode0;
If(mpm_index==1)
IntraLumaPredMode=predIntraPredMode1;[等式3]
如果mpm_flag为0,则视频解码设备20基于非候选帧内预测模式的帧内预测模式对当前块进行预测。根据等式3的结果,如果Ipmode小于predIntraPredMode0,则视频解码设备20确定IntraLumaPredMode和Ipmode具有相同值。然而,如果Ipmode等于或大于predIntraPredMode0,则视频解码设备20将Ipmode的值增加1,并将Ipmode与predIntraPredMode1进行比较。
如果Ipmode小于predIntraPredMode1,则确定IntraLumaPredMode和Ipmode具有相同值。然而,如果Ipmode等于或大于predIntraPredMode1,则确定IntraLumaPredMode具有通过将1与Ipmode的值相加而获得的值。
例如,当与候选帧内预测模式相应的帧内预测模式的索引值为5和12时,如果Ipmode为3,则将3应用到IntraLumaPredMode。如果Ipmode为8,则将9应用到IntraLumaPredMode。如果Ipmode为15,则将17应用到IntraLumaPredMode。
当mpm_flag为0时,视频解码设备20确定基于作为候选帧内预测模式的帧内预测模式来对当前块进行预测。当mpm_index为0时,视频解码设备20确定IntraLumaPredMode和predIntraPredMode0具有相同的值。当mpm_index为1时,视频解码设备20确定IntraLumaPredMode和predIntraPredMode1具有相同的值。
视频解码设备20根据由通过使用等式3确定的IntraLumaPredMode所指示的帧内预测模式来对当前块进行预测。
根据实施例,通过使用上述方法,关于帧内预测模式信息的数据被解析,并因此,当前块的帧内预测模式被确定。
根据实施例的视频解码设备20可包括中央处理器(未示出),其中,中央处理器总体控制候选帧内预测模式确定器22和帧内预测器24。此外,候选帧内预测模式确定器22和帧内预测器24分别由专门的处理器(未示出)来驱动,并且视频解码设备20可由处理器(未示出)的系统操作来总体驱动。此外,候选帧内预测模式确定器22和帧内预测器24可由根据实施例的视频解码设备20的外部处理器(未示出)来控制。
根据实施例,视频解码设备20可包括一个或更多个数据存储器(未示出),其中,所述一个或更多个数据存储器用于存储候选帧内预测模式确定器22和帧内预测器24的输入数据/输出数据。视频解码设备20可包括用于控制数据存储器(未示出)的数据输入/输出的存储器控制器(未示出)。
视频解码设备20可通过与安装在视频解码设备20中的视频解码处理器或外部视频解码处理器关联地操作来执行包括逆变换的视频解码操作,以通过视频解码重建视频。根据实施例的视频解码设备20中的内部视频解码处理器可包括这样的情况:视频解码设备20或中央计算装置或图形计算装置除了包括单独的处理器之外还包括用于执行基本视频解码操作的视频解码处理模块。
根据参照图1和图2描述的视频编码设备10和视频解码设备20,当通过从比特流解析块的符号来重建帧内预测模式时,解析包括帧内预测数据的块的符号,并随后,可基于解析出的符号中的当前块的帧内预测数据来重建当前帧内预测模式。因此,从比特流解析块的符号的处理和从解析出的符号重建帧内预测模式的处理可彼此分离。除非解析符号和重建符号的处理被分离,否则,符号在解析的同时必须被重建,并且符号被再次解析,也就是说,解析块符号和重建块符号的操作被重建,从而降低了解码处理的效率。因此,根据本实施例的视频编码设备10和视频解码设备20,在解析符号的处理期间,解析帧内预测模式的处理和重建帧内预测模式的处理被分离,因此,解码处理的效率可被提高。
如果候选帧内预测模式的数量根据即使存在多个候选帧内预测模式的情况而改变,则由于当帧内相关信息被解析时必须考虑根据候选帧内预测模式的数量的变量,因此解析处理变得复杂。然而,根据本实施例的视频解码设备20,当通过使用候选帧内预测模式对帧内预测模式进行预测时来假设候选帧内预测模式的常数,因此,可在不考虑在符号解析处理期间改变候选帧内预测模式的数量的情况下,解析帧内预测数据,从而降低了解析操作的复杂度。
以下,将描述可在根据实施例的视频编码设备10和视频解码设备20中实现的对帧内预测模式进行预测的各种实施例。
图3示出根据实施例的被参考以对帧内预测模式进行预测的块。
在基于根据树结构的编码单元的视频编码方法中,预测单元(PU)是用于按照每个编码单元(CU)执行预测的数据单元。根据本实施例的视频编码设备10和视频解码设备20不限于具有固定尺寸的PU,而是可对各种尺寸的PU执行预测。稍后将参照图7至图19描述基于根据树结构的编码单元的视频解码方法和PU。以下,将描述用于对PU的帧内预测模式进行预测的实施例,然而,上述实施例中可类似地应用于各种类型的块。
根据本实施例的视频编码设备10可根据左侧PU 32和上方PU 33的帧内预测模式的可用性确定参考帧内预测单元。
例如,如果当前块30位于图像的左边界并因此不存在左侧PU 32,或者如果左侧PU32基于帧间预测模式被预测,则可将第一参考帧内预测模式确定为第一默认帧内预测模式。如果左侧PU 32基于帧内预测模式被预测,则可将第一参考帧内预测模式确定为左侧PU32的帧内预测模式。
如果当前块30位于图像的上边界,并因此不存在上方PU 33,或者如果上方PU 33基于帧间预测模式被预测,则可将第二参考帧内预测模式确定为第一默认帧内预测模式。如果上方PU 33基于帧内预测模式被预测,则可将第二参考帧内预测模式确定为上方PU 33的帧内预测模式。
另外,通过将第一参考帧内预测模式与第二参考帧内预测模式进行比较来确定候选帧内预测模式。
可参考既非图3中示出的左侧PU 32又非上方PU 33的预测单元,根据这样的情况,可参考三个或更多个PU。
图4示出在基于根据树结构的编码单元的视频编码中将被参考以对帧内预测模式进行预测的PU的示例。不同于图3,图4示出在当前块40的左侧和上方的多个邻近块41、42、43、45、47和49。对此,下面描述当存在多个邻近块时确定参考帧内预测模式的方法。
为了对当前PU 40的帧内预测模式进行预测,可首先参考左侧PU 41和上方PU 42。如果存在与当前PU 40的左边界或上边界邻近的多个PU,则与当前PU 40中的左上样点邻近的左侧PU 41和上方PU 42的帧内预测模式可被优先参考。
如果左侧PU 41和上方PU 42的帧内预测模式彼此相同,则与当前PU 40邻近的邻近PU之中的除了左侧PU 41和上方PU 42之外的预定位置的邻近PU的帧内预测模式可被参考。例如,左上PU 45、右上PU 47和左下PU 49的帧内预测模式可被参考。如果左上PU 45、右上PU 47和左下PU 49的帧内预测模式之一与左侧PU 41和上方PU 42的帧内预测模式不同,则可采用左上PU 45、右上PU 47和左下PU 49的帧内预测模式之一作为候选帧内预测模式。
例如,第一等级候选帧内预测模式可以是左侧PU 41和上方PU 42的帧内预测模式。以预测顺序检测左上PU 45、右上PU 47和左下PU 49的帧内预测模式之中是否存在与左侧PU 41和上方PU 42的帧内预测模式不同的帧内预测模式,并且可采用首先检测到的帧内预测模式作为第二等级候选帧内预测模式。
作为另一示例,如果左侧PU 41和上方PU 42的帧内预测模式彼此相同,则按预定顺序来顺序地检测在除了左侧PU 41和上方PU 42之外的邻近PU 43、44、45、47和49的帧内预测模式之中是否存在与左侧PU 41和上方PU 42的帧内预测模式不同的帧内预测模式,并且可采用首先检测到的帧内预测模式作为第二等级候选帧内预测模式。
更具体地,从右上PU 47开始,将帧内预测模式与左侧PU 41和上方PU42的帧内预测模式进行比较,并可通过沿位于当前块PU 40的上方部分的邻近PU 47、44和45搜索是否存在具有与左侧PU 41和上方PU 42的帧内预测模式不同的帧内预测模式的PU来确定帧内预测模式。可采用首先检测到的帧内预测模式作为第二等级候选帧内预测模式。
在搜索到左上PU 45之后,如果不存在与左侧PU 41和上方PU 42的帧内预测模式不同的帧内预测模式,则可通过沿位于当前PU 40的左侧的邻近PU从左下PU 49开始向上搜索是否存在具有与左侧PU 41和上方PU 42的帧内预测模式不同的帧内预测模式的PU来确定帧内预测模式。可采用首先检测到的帧内预测模式作为第二等级候选帧内预测模式。
在上述实施例中,搜索从右上PU 47开始的位于当前PU的上方部分的邻近PU,随后,搜索从左下PU 49开始的位于当前PU的左侧的邻近PU,然而,上述搜索顺序可改变。
在第一参考帧内预测模式和第二参考帧内预测模式之一与当前帧内预测模式相同,并且第一参考帧内预测模式和第二参考帧内预测模式彼此相同的情况下,上面描述了确定多个不同候选帧内预测模式的各种实施例。
如上所述,本实施例的视频编码设备10和视频解码设备20可在存在与当前预测模式相同的第一参考帧内预测模式和第二参考帧内预测模式之一,并且第一参考帧内预测模式和第二参考帧内预测模式彼此不同或相同的情况下,通过使用总是彼此不同的多个候选帧内预测模式来对当前帧内预测模式进行预测。
因此,如果邻近左侧块和邻近上方块的帧内预测模式彼此相同,则视频编码设备10不需要对表示候选帧内预测模式的数量被改变的情况的信息进行编码,并可将关于是否基于候选帧内预测模式对当前块进行预测的信息和关于当前PU 30的帧内预测模式的信息编码为关于帧内预测模式的信息。
因此,根据本实施例的视频解码设备20在解析关于针对当前块的帧内预测的信息的处理期间,仅解析关于是否使用候选帧内预测模式的信息和关于当前PU 30的帧内预测模式的信息,并且不需要确定邻近左侧块和邻近上方块的帧内预测模式是否彼此相同。由于不需要确定邻近左侧块和邻近上方块的帧内预测模式是否彼此相同,因此不需要重建左侧块和上方块的帧内预测模式。此外,由于在解析符号和再次解析符号的处理期间从解析出的符号重建帧内预测模式的处理被跳过,因此可快速地执行解析帧内预测模式的处理。这样,包括解析并重建帧内预测模式的解码处理的效率可被提高。
此外,用于仅处理一个候选帧内预测模式的帧内预测模式的预测模式被跳过,因此,解码处理可被简化。
图5是示出根据本发明的实施例的视频编码方法的流程图。
在操作51,基于当前块的邻近块的可用性和预测模式来确定参考帧内预测模式。
根据实施例,如果当前块的左侧邻近块不存在或者当前块的左侧邻近块基于帧间预测被预测,则可将第一参考帧内预测模式确定为第一默认帧内预测模式。
另一方面,如果当前块的左侧邻近块基于帧内预测被预测,则可将第一参考帧内预测模式确定为在对当前块的左侧邻近块进行帧内预测时使用的帧内预测模式。
按照与确定第一参考帧内预测模式的上述方法相同的方法,如果当前块的上方邻近块不存在或者当前块的上方邻近块基于帧间预测被预测,则可将第二参考帧内预测模式确定为第一默认帧内预测模式。
另一方面,如果当前块的上方邻近块基于帧内预测被预测,则可将第二参考帧内预测模式确定为在对当前块的上方邻近块进行帧内预测时使用的帧内预测模式。
在操作52,基于参考帧内预测模式确定用于当前块的多个候选帧内预测模式。
当第一参考帧内预测模式和第二参考帧内预测模式相同,并且第一参考帧内预测模式不是第一默认帧内预测模式时,可将第一候选帧内预测模式确定为第一默认帧内预测模式,可将第二候选帧内预测模式确定为第一参考帧内预测模式。
当第一参考帧内预测模式和第二参考帧内预测模式相同,并且第一参考帧内预测模式指示第一默认帧内预测模式时,可将第一候选帧内预测模式确定为第一默认帧内预测模式,并且可将第二候选帧内预测模式确定为第二默认帧内预测模式。
当第一参考帧内预测模式和第二参考帧内预测模式不同时,可将第一候选帧内预测模式确定为第一参考帧内预测模式和第二参考帧内预测模式中的具有较小索引值的帧内预测模式。
另一方面,可将第二候选帧内预测模式确定为第一参考帧内预测模式和第二参考帧内预测模式中的具有较大索引值的帧内预测模式。
在操作53,基于用于当前块的帧内预测模式和多个候选帧内预测模式,确定是否根据多个候选帧内预测模式之一来对当前块进行预测以及指示用于当前块的帧内预测模式的帧内预测数据。
帧内预测数据可包括指示是否基于多个候选帧内预测模式之一对当前块进行预测的部分以及指示用于当前块的帧内预测模式的部分。
当基于多个候选帧内预测模式之一对当前块进行预测时,根据多个候选帧内预测模式的数量来确定指示用于当前块的帧内预测模式的数据的大小。
当基于非候选帧内预测模式的帧内预测模式对当前块进行预测时,根据候选帧内预测模式改变分配给帧内预测模式的索引值,并且改变后的索引值可被包括在帧内预测数据。
图6示出根据本发明的实施例的视频解码方法60的流程图。
在操作61,基于当前块的邻近块的可用性和预测模式确定参考帧内预测模式。
在操作62,基于参考帧内预测模式确定用于当前块的多个候选帧内预测模式。
在操作63,从比特流获得候选帧内预测标志,其中,候选帧内预测标志指示是否基于多个候选帧内预测模式之一对当前块进行预测。
在操作64,如果在操作63获得的候选帧内预测标志指示根据多个候选帧内预测模式之一对当前块进行预测,则从比特流获得候选选择索引。根据候选选择索引来从多个候选帧内预测模式之中选择将被用于对当前块进行帧内预测的帧内预测模式。
在操作65,根据选择的帧内预测模式来对当前块执行帧内预测。
与操作64和65不同,如果候选帧内预测标志指示基于不包括在候选帧内预测模式中的帧内预测模式之一对当前块进行预测,则从比特流获得帧内预测模式选择索引,并且可基于帧内预测模式选择索引选择将被用于对当前块进行帧内预测的帧内预测模式。
当基于帧内预测模式选择索引选择帧内预测模式时,可根据候选帧内预测模式来改变由帧内预测模式选择索引指示的值。
如上所述,根据实施例的视频编码设备10和根据另一实施例的视频解码设备20将划分的视频数据的块划分为树结构的编码单元,并且预测单元被用于针对编码单元进行帧内预测。以下,参照图7至图19,描述根据实施例的基于树结构的编码单元和变换单元的视频编码方法和设备以及视频解码方法和设备。
图7示出根据本发明的实施例的基于树结构的编码单元的视频编码设备100的框图。
涉及基于树结构的编码单元的视频预测的视频编码设备100包括最大编码单元划分器110、编码单元确定器120和输出单元130。在下文中,为了便于描述,涉及基于树结构的编码单元的视频编码设备100被称为“视频编码设备100”。
最大编码单元划分器110可基于图像的当前画面的最大编码单元来划分当前画面,其中,最大编码单元是具有最大尺寸的编码单元。如果当前画面大于最大编码单元,则可将当前画面的图像数据划分为至少一个最大编码单元。根据实施例的最大编码单元可以是尺寸为32×32、64×64、128×128、256×256等的数据单元,其中,数据单元的形状是宽度和长度为2的若干次方的正方形。图像数据可根据至少一个最大编码单元被输出到编码单元确定器120。
根据实施例的编码单元可由最大尺寸和深度表征。深度表示编码单元从最大编码单元被空间划分的次数,并且随着深度加深,根据深度的较深层编码单元可从最大编码单元被划分到最小编码单元。最大编码单元的深度可被定义为最高深度,最小编码单元的深度可被定义为最低深度。由于随着最大编码单元的深度加深,与每个深度相应的编码单元的尺寸减小,因此与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。
如上所述,当前画面的图像数据根据编码单元的最大尺寸被划分为最大编码单元,并且每个最大编码单元可包括根据深度被划分的较深层编码单元。由于根据深度对根据实施例的最大编码单元进行划分,因此可根据深度对包括在最大编码单元中的空间域的图像数据进行分层分类。
可预先确定编码单元的最大深度和最大尺寸,其中,所述最大深度和最大尺寸限制最大编码单元的高度和宽度被分层划分的总次数。
编码单元确定器120对通过根据深度对最大编码单元的区域进行划分而获得的至少一个划分区域进行编码,并且根据所述至少一个划分区域来确定用于输出最终编码结果的深度。也就是说,编码单元确定器120通过根据当前画面的最大编码单元以根据深度的较深层编码单元对图像数据进行编码,并选择具有最小编码误差的深度,来确定编码深度。将确定的编码深度和根据最大编码单元的图像数据输出到输出单元130。
基于与等于或低于最大深度的至少一个深度相应的较深层编码单元,对最大编码单元中的图像数据进行编码,并且对基于每个较深层编码单元对图像数据进行编码的结果进行比较。在对较深层编码单元的编码误差进行比较之后,可选择具有最小编码误差的深度。可针对每个最大编码单元选择至少一个编码深度。
随着编码单元根据深度而被分层地划分以及随着编码单元的数量增加,最大编码单元的尺寸被划分。另外,即使在一个最大编码单元中编码单元与同一深度相应,仍通过分别测量每个编码单元的图像数据的编码误差来确定是否将与同一深度相应的每个编码单元划分到更低深度。因此,即使当图像数据被包括在一个最大编码单元中时,编码误差仍可根据所述一个最大编码单元中的区域而不同,因此编码深度可根据图像数据中的区域而不同。因此,可在一个最大编码单元中确定一个或更多个编码深度,并且可根据至少一个编码深度的编码单元来对最大编码单元的图像数据进行划分。
因此,根据实施例的编码单元确定器120可确定包括在最大编码单元中的具有树结构的编码单元。根据实施例的“具有树结构的编码单元”包括当前最大编码单元中包括的所有较深层编码单元中的与确定为编码深度的深度相应的编码单元。可根据最大编码单元的同一区域中的深度来分层地确定编码深度的编码单元,并可在不同区域中独立地确定编码深度的编码单元。类似地,可独立于另一区域中的编码深度而确定当前区域中的编码深度。
根据实施例的最大深度是与从最大编码单元到最小编码单元的划分次数相关的索引。根据实施例的第一最大深度可表示从最大编码单元到最小编码单元的总划分次数。根据实施例的第二最大深度可表示从最大编码单元到最小编码单元的深度等级的总数。例如,当最大编码单元的深度是0时,对最大编码单元划分一次的编码单元的深度可被设置为1,对最大编码单元划分两次的编码单元的深度可被设置为2。这里,如果最小编码单元是最大编码单元被划分四次的编码单元,则存在深度0、1、2、3和4的深度等级,并因此第一最大深度可被设置为4,第二最大深度可被设置为5。
可根据最大编码单元执行预测编码和变换。根据最大编码单元,还基于根据等于最大深度的深度或小于最大深度的深度的较深层编码单元来执行预测编码和变换。
由于每当根据深度对最大编码单元进行划分时,较深层编码单元的数量增加,因此对随着深度加深而产生的所有较深层编码单元执行包括预测编码和变换的编码。在下文中,为了便于描述,在至少一个最大编码单元中,将基于当前深度的编码单元来描述预测编码和变换。
根据实施例的视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码,执行诸如预测编码、变换和熵编码的操作,此时,可针对所有操作使用相同的数据单元,或者可针对每个操作使用不同的数据单元。
例如,视频编码设备100不仅可选择用于对图像数据进行编码的编码单元,还可选择不同于编码单元的数据单元,以便对编码单元中的图像数据执行预测编码。
为了在最大编码单元中执行预测编码,可基于编码深度的编码单元(即,基于不再被划分的编码单元)来执行预测编码。以下,不再被划分且成为用于预测编码的基本单元的编码单元现在将被称为“预测单元”。通过划分预测单元而获得的分区可包括预测单元或通过对从预测单元的高度和宽度中选择的至少一个进行划分而获得的数据单元。分区是编码单元的预测单元被划分的数据单元,并且预测单元可以是具有与编码单元相同的尺寸的分区。
例如,当2N×2N(其中,N是正整数)的编码单元不再被划分并且成为2N×2N的预测单元时,分区的尺寸可以是2N×2N、2N×N、N×2N或N×N。分区类型的示例可选择性地包括通过对预测单元的高度或宽度进行对称地划分而获得的对称分区、通过对预测单元的高度或宽度进行非对称地划分(诸如,1:n或n:1)而获得的分区、通过对预测单元进行几何地划分而获得的分区、以及具有任意形状的分区。
预测单元的预测模式可以是帧内模式、帧间模式和跳过模式中的至少一个。例如,可对2N×2N、2N×N、N×2N或N×N的分区执行帧内模式和帧间模式。另外,可仅对2N×2N的分区执行跳过模式。可对编码单元中的一个预测单元独立地执行编码,从而选择具有最小编码误差的预测模式。
根据实施例的视频编码设备100不仅可基于用于对图像数据进行编码的编码单元还可基于与编码单元不同的数据单元,来对编码单元中的图像数据执行变换。为了在编码单元中执行变换,可基于具有小于或等于编码单元的尺寸的数据单元来执行变换。例如,变换单元可包括用于帧内模式的数据单元和用于帧间模式的变换单元。
以与根据树结构的编码单元类似的方式,编码单元中的变换单元可被递归地划分为更小尺寸的区域,因此,可基于根据变换深度的具有树结构的变换单元,对编码单元的残差数据进行划分。
还可在变换单元中设置变换深度,其中,变换深度指示通过对编码单元的高度和宽度进行划分而达到变换单元的划分次数。例如,在2N×2N的当前编码单元中,当变换单元的尺寸是2N×2N时,变换深度可以是0,当变换单元的尺寸是N×N时,变换深度可以是1,当变换单元的尺寸是N/2×N/2时,变换深度可以是2。也就是说,针对变换单元,可根据变换深度设置具有树结构的变换单元。
根据编码深度的编码信息不仅要求关于编码深度的信息,还要求与预测和变换相关的信息。因此,编码单元确定器120不仅可确定产生最小编码误差的编码深度,还可确定预测单元被划分成分区的分区模式、根据预测单元的预测类型以及用于变换的变换单元的尺寸。
随后将参照图7至图19详细描述根据实施例的最大编码单元中的根据树结构的编码单元以及确定预测单元/分区和变换单元的方法。
编码单元确定器120可通过使用基于拉格朗日乘数的率失真优化来测量根据深度的较深层编码单元的编码误差。
输出单元130在比特流中输出最大编码单元的图像数据和关于根据深度的编码模式的信息,其中,所述最大编码单元的图像数据基于由编码单元确定器120确定的至少一个编码深度而被编码。
编码的图像数据可与通过对图像的残差数据进行编码而获得的结果相应。
根据深度的编码模式信息可包括编码深度信息、预测单元的分区类型信息、预测模式信息和变换单元尺寸信息。
可通过使用根据深度的划分信息来定义编码深度信息,其中,根据深度的划分信息指定是否对更低深度而不是当前深度的编码单元执行编码。如果当前编码单元的当前深度是编码深度,则通过使用当前深度的编码单元来对当前编码单元进行编码,因此可将当前深度的划分信息定义为不将当前编码单元划分到更低深度。相反地,如果当前编码单元的当前深度不是编码深度,则必须对更低深度的编码单元执行编码,并因此可将当前深度的划分信息定义为将当前编码单元划分到更低深度的编码单元。
如果当前深度不是编码深度,则对被划分成更低深度的编码单元的编码单元执行编码。由于更低深度的至少一个编码单元存在于当前深度的一个编码单元中,因此对更低深度的每个编码单元重复执行编码,并因此可对具有相同深度的编码单元递归地执行编码。
由于针对一个最大编码单元确定树结构的编码单元,并且针对编码深度的编码单元必须确定至少一条编码模式信息,因此可针对一个最大编码单元确定至少一条编码模式信息。另外,由于根据深度对数据进行分层划分,因此最大编码单元的数据的编码深度可根据位置而不同,并且因此可针对数据设置编码深度和编码模式信息。
因此,根据实施例的输出单元130可将关于相应编码深度和编码模式的编码信息分配给包括在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。
根据实施例的最小单元是通过将构成最低编码深度的最小编码单元划分为4份而获得的正方形数据单元。可选择地,根据实施例的最小单元可以是可包括在最大编码单元中所包括的所有编码单元、预测单元、分区单元和变换单元中的最大正方形数据单元。
例如,通过输出单元130输出的编码信息可被分类为根据较深层编码单元的编码信息和根据预测单元的编码信息。根据较深层编码单元的编码信息可包括关于预测模式的信息和关于分区尺寸的信息。根据预测单元的编码信息可包括关于帧间模式期间的估计方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息、以及关于帧内模式期间的插值方法的信息。
关于根据画面、条带或GOP定义的编码单元的最大尺寸的信息和关于最大深度的信息可被插入到比特流的头、序列参数集或画面参数集中。
还可通过比特流的头、序列参数集或画面参数集来输出关于针对当前视频允许的变换单元的最大尺寸的信息、以及关于变换单元的最小尺寸的信息。输出单元130可对与以上参照图1至图6描述的参考信息、预测信息、单向预测信息和包括与预测相关的四个条带类型的条带类型信息进行编码,并输出这些信息。
根据视频编码设备100的最简单实施例,较深层编码单元可以是通过将更高深度的编码单元(更高一层)的高度或宽度划分成两份而获得的编码单元。也就是说,当当前深度的编码单元的尺寸是2N×2N时,更低深度的编码单元的尺寸是N×N。另外,尺寸为2N×2N的当前编码单元可最多包括四个尺寸为N×N的更低深度编码单元。
因此,视频编码设备100可基于考虑当前画面的特征而确定的最大编码单元的尺寸和最大深度,通过针对每个最大编码单元确定具有最优形状和最优尺寸的编码单元来形成具有树结构的编码单元。另外,由于可通过使用各种预测模式和变换中的任意一个对每个最大编码单元执行编码,因此可通过考虑各种图像尺寸的编码单元的特征来确定最优编码模式。
因此,如果以传统宏块对具有高分辨率或大数据量的图像进行编码,则每个画面的宏块的数量极度增加。因此,针对每个宏块产生的压缩信息的条数增加,因此难以发送压缩的信息,并且数据压缩效率降低。然而,通过使用根据实施例的视频编码设备,由于在考虑图像的尺寸的同时增加编码单元的最大尺寸,并同时在考虑图像的特征的同时调整编码单元,因此可提高图像压缩效率。
图7的视频编码设备100可执行以上参照图1描述的视频编码设备10的操作。
编码单元确定器120可根据在每个最大编码单元的具有树结构的每个编码单元,确定用于帧内预测的预测单元,并可对每个预测单元执行帧内预测。
输出单元130可执行视频编码设备10的候选帧内预测模式确定器12和帧内预测模式信息编码器14的操作。输出单元130可对帧内预测模式信息进行编码以在帧内预测模式下对每个预测单元执行预测。输出单元130可基于当前块的邻近块的可用性和预测模式确定参考帧内预测模式。输出单元130可基于参考帧内预测模式确定用于当前块的多个候选帧内预测模式。当基于多个候选帧内预测模式之一对当前块进行预测时,输出单元130可对指示用于当前块的帧内预测模式的帧内预测数据进行编码,其中,帧内预测模式在多个候选帧内预测模式之中。
输出单元130可针对每个画面确定候选帧内预测模式的数量。类似地,可针对每个条带、针对每个最大编码单元、针对每个编码单元或针对每个预测单元确定候选帧内预测模式的数量。实施例不限于此,可再次针对每个预定数据单元确定候选帧内预测模式的数量。
输出单元130可对表示候选帧内预测模式的数量的信息进行编码,其中,根据更新候选帧内预测模式的数量的数据单元的级,该信息是各种数据单元级(诸如,画面参数集(PPS)、条带参数集(SPS)、最大编码单元级、编码单元级、预测单元级等)的参数。然而,即使针对每个数据单元确定候选帧内预测模式的数量,则表示候选帧内预测模式的数量的信息不总被编码。
图8示出根据本发明的实施例的基于树结构的编码单元的视频解码设备200的框图。
根据实施例的涉及基于树结构的编码单元的视频预测的视频解码设备200包括接收器210、图像数据和编码信息提取器220以及图像数据解码器230。在下文中,为了便于描述,根据实施例的涉及基于树结构的编码单元的视频预测的视频解码设备200可被称为“视频解码设备200”。
用于由根据实施例的视频解码设备200进行的解码操作的各种术语(诸如编码单元、深度、预测单元、变换单元和各种类型的编码模式信息)的定义与参照图7和视频编码设备100描述的定义相同。
接收器210接收和解析编码视频的比特流。图像数据和编码信息提取器220从解析的比特流,针对每个编码单元提取编码的图像数据,并将提取的图像数据输出到图像数据解码器230,其中,编码单元具有根据每个最大编码单元的树结构。图像数据和编码信息提取器220可从关于当前画面的头、序列参数集或画面参数集提取关于当前画面的编码单元的最大尺寸的信息。
另外,图像数据和编码信息提取器220从解析的比特流,根据每个最大编码单元,提取关于具有树结构的编码单元的编码深度和编码模式信息。提取的编码深度和提取的编码模式信息被输出到图像数据解码器230。也就是说,比特流中的图像数据被划分为最大编码单元,使得图像数据解码器230针对每个最大编码单元对图像数据进行解码。
可针对一条或更多条编码深度信息设置根据每个最大编码单元的编码深度和编码模式信息,根据编码深度的编码模式信息可包括相应编码单元的分区类型信息、预测模式信息和变换单元尺寸信息。另外,根据深度的划分信息可被提取,作为编码深度信息。
由图像数据和编码信息提取器220提取的根据每个最大编码单元的编码深度和编码模式信息是这样的编码深度和编码模式:该编码深度和编码模式被确定为在编码器(诸如,视频编码设备100)根据每个最大编码单元对根据深度的每个较深层编码单元重复地执行编码时产生最小编码误差。因此,视频解码设备200可通过根据产生最小编码误差的编码方法对数据进行解码来重建图像。
由于关于编码深度和编码模式的编码信息可被分配给相应的编码单元、预测单元和最小单元中的预定数据单元,因此图像数据和编码信息提取器220可根据预定数据单元,提取编码深度和编码模式信息。如果相应最大编码单元的编码深度和编码模式信息根据每个预定数据单元被记录,则可将具有相同编码深度和编码模式信息的预定数据单元推断为是包括在同一最大编码单元中的数据单元。
图像数据解码器230基于根据每个最大编码单元的编码深度和编码模式信息,通过对每个最大编码单元中的图像数据进行解码来重建当前画面。也就是说,图像数据解码器230可基于针对包括在每个最大编码单元中的具有树结构的编码单元之中的每个编码单元的读取的分区类型、预测模式和变换单元,对编码的图像数据进行解码。解码处理可包括预测处理(包含帧内预测和运动补偿)和逆变换处理。
图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的分区类型和预测模式的信息,根据每个编码单元的分区和预测模式,执行帧内预测或运动补偿。
此外,为了对每个最大编码单元进行逆变换,图像数据解码器230可针对每个编码单元读取关于根据树结构的变换单元的信息,以基于每个编码单元的变换单元来执行逆变换。由于逆变换,可重建编码单元的空间域的像素值。
图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元的编码深度。如果划分信息指定图像数据在当前深度下不再被划分,则当前深度是编码深度。因此,图像数据解码器230可通过使用关于针对与当前深度相应的每个编码单元的预测单元的分区类型、预测模式和变换单元的尺寸的信息,对当前最大编码单元的图像数据进行解码。
也就是说,可通过观察被分配给编码单元、预测单元和最小单元中的预定数据单元的编码信息集来收集包含包括相同划分信息的编码信息的数据单元,并且收集的数据单元可被认为是将由图像数据解码器230以相同编码模式进行解码的一个数据单元。这样,可通过获取关于针对每个编码单元的编码模式的信息来对当前编码单元进行解码。
另外,图8的视频解码设备200可执行以上参照图2描述的视频解码设备20的操作。
图像数据解码器230可执行视频解码设备20的候选帧内预测模式确定器22和帧内预测单元24的操作。
当根据每个具有树结构的编码单元确定用于帧内预测的预测单元时,图像数据解码器230可从比特流解析用于针对每个预测单元对帧内预测模式进行预测的帧内预测数据。图像数据和编码信息提取器220可完成对包括帧内预测数据的块符号的解析,并随后可从解析出的信息重建当前帧内预测模式。可通过使用多个候选帧内预测模式来对当前块的帧内预测模式进行预测,其中,候选帧内预测模式的数量是固定的。图像数据解码器230可通过使用重建的当前帧内预测模式和残差数据来对当前预测单元执行帧内预测。
图像数据解码器230可基于当前块的邻近块的可用性和预测模式确定参考帧内预测模式。图像数据解码器230可基于参考帧内预测模式确定用于当前块的多个候选帧内预测模式。图像数据解码器230可基于包括与当前块的帧内预测模式的信息有关的帧内预测数据确定当前块的帧内预测模式,其中,该信息从比特流获得。更具体地,图像数据解码器230可通过对帧内预测数据进行熵解码来确定当前块的帧内预测模式。
图像数据和编码信息提取器220可针对每个画面重新确定候选帧内预测模式的数量。
图像数据和编码信息提取器220可从各种数据单元级(诸如比特流的PPS、SPS、最大编码单元级、编码单元级和预测单元级)的参数来解析表示候选帧内预测模式的数量的信息,其中,候选帧内预测模式的数量是固定的。在这种情况下,图像数据和编码信息提取器220可确定与由针对与解析出信息的级相应的每个数据单元的解析信息所表示的数量一样多的候选帧内预测模式。
然而,即使表示候选帧内预测模式的数量的信息不被解析,图像数据和编码信息提取器220也可更新用于每个条带、最大编码单元、编码单元或预测单元的候选帧内预测模式的数量。
因此,视频解码设备200可获得关于当针对每个最大编码单元递归地执行编码时产生最小编码误差的关于至少一个编码单元的信息,并可使用该信息对当前画面进行解码。也就是说,可对每个最大编码单元中被确定为最佳编码单元的具有树结构的编码单元进行解码。
因此,即使图像具有高分辨率或具有过大的数据量,也可通过使用利用从编码终端接收到的最佳编码模式信息根据图像特征自适应地确定的编码单元的尺寸和编码模式,对图像进行有效地解码和重建。
图9示出根据本发明的实施例的编码单元的概念。
编码单元的尺寸可被表示为宽度×高度,并且可以是64×64、32×32、16×16和8×8。64×64的编码单元可被划分为64×64、64×32、32×64或32×32的分区,32×32的编码单元可被划分为32×32、32×16、16×32或16×16的分区,16×16的编码单元可被划分为16×16、16×8、8×16或8×8的分区,8×8的编码单元可被划分为8×8、8×4、4×8或4×4的分区。
在视频数据310中,分辨率为1920×1080,编码单元的最大尺寸为64,最大深度为2。在视频数据320中,分辨率为1920×1080,编码单元的最大尺寸为64,最大深度为3。在视频数据330中,分辨率为352×288,编码单元的最大尺寸为16,最大深度为1。图9中示出的最大深度表示从最大编码单元到最小编码单元的划分总次数。
如果分辨率高或数据量大,则优选的是编码单元的最大尺寸较大,从而不仅提高编码效率,而且准确地反映图像的特征。因此,具有比视频数据330更高的分辨率的视频数据310和320的编码单元的最大尺寸可被选为64。
由于视频数据310的最大深度是2,因此由于通过对最大编码单元划分两次,深度加深至两层,因此视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元和长轴尺寸为32和16的编码单元。另一方面,由于视频数据330的最大深度是1,因此由于通过对最大编码单元划分一次,深度加深至一层,因此视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元和长轴尺寸为8的编码单元。
由于视频数据320的最大深度是3,因此由于通过对最大编码单元划分三次,深度加深至3层,因此视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元和长轴尺寸为32、16和8的编码单元。随着深度加深,可提高针对详细信息的表达能力。
图10示出根据本发明的实施例的基于编码单元的图像编码器400的框图。
根据实施例的图像编码器400包括视频编码设备100的编码单元确定器120的操作以便对图像数据进行编码。也就是说,帧内预测器410对当前帧405之中的帧内模式下的编码单元执行帧内预测,运动估计器420通过使用帧间模式下的当前帧405以及参考帧495来执行帧间预测和运动补偿。
从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430和量化器440被输出为量化后的变换系数。量化后的变换系数通过反量化器460和逆变换器470被重建为空间域中的数据,并且重建的空间域中的数据在通过去块单元480和环路滤波单元490后处理之后被输出为参考帧495。量化后的变换系数可通过熵编码器450被输出为比特流455。
为了将图像编码器400应用于根据实施例的视频编码设备100,图像编码器400的所有元件(即,帧内预测器410、运动估计器420、运动补偿器425、变换器430、量化器440、熵编码器450、反量化器460、逆变换器470、去块单元480和环路滤波单元490)可在考虑每个最大编码单元的最大深度的同时基于具有树结构的编码单元中的每个编码单元执行操作。
具体地,帧内预测器410、运动估计器420和运动补偿器425可在考虑当前最大编码单元的最大尺寸和最大深度的同时,确定具有树结构的编码单元中的每个编码单元的分区和预测模式,变换器430必须确定具有树结构的编码单元之中的每个编码单元中的变换单元的尺寸。
具体地,帧内预测器410可根据每个最大编码单元中的每个具有树结构的编码单元,确定用于帧内预测的预测单元,并可根据率失真优化确定用于每个预测单元的最佳帧内预测单元。此后,帧内预测器410可对每个预测单元执行帧内预测。
熵编码器450可确定由帧内预测器410确定的每个预测单元的候选帧内预测模式,并可通过使用候选帧内预测单元对帧内预测数据进行编码。
图11示出根据本发明的实施例的基于编码单元的图像解码器500的框图。
解析器510从比特流505解析将被解码的编码图像数据和解码所需的关于编码的信息。编码图像数据通过熵解码器520和反量化器530被输出为反量化的数据,并且反量化的数据通过逆变换器540被重建为空间域中的图像数据。
帧内预测器550针对空间域中的图像数据,对帧内模式下的编码单元执行帧内预测,并且运动补偿器560通过使用参考帧585对帧间模式下的编码单元执行运动补偿。
经过帧内预测器550和运动补偿器560的空间域中的图像数据可在通过去块单元570和环路滤波单元580后处理之后被输出为重建帧595。此外,通过去块单元570和环路滤波单元580后处理的图像数据可被输出为参考帧585。
为了在视频解码设备200的图像数据解码器230中对图像数据进行解码,图像解码器500可在解析器510之后对解析的符号执行操作。
为了将图像解码器500应用于视频解码设备200,图像解码器500的所有元件(即,解析器510、熵解码器520、反量化器530、逆变换器540、帧内预测器550、运动补偿器560、去块单元570和环路滤波单元580)可针对每个最大编码单元基于具有树结构的编码单元执行操作。
具体地,帧内预测器550和运动补偿器560必须确定用于每个具有树结构的编码单元的分区和预测模式,逆变换器540必须针对每个编码单元确定变换单元的尺寸。
具体地,当根据每个具有树结构的编码单元确定用于帧内预测的预测单元时,解析器510可从比特流解析用于根据每个预测单元在帧内预测模式下进行预测的帧内预测数据。熵解码器520完成对包括帧内预测数据的块符号的解析,并可从解析出的信息重建当前预测单元的帧内预测模式。帧内预测器550可通过过使用重建的当前帧内预测模式和残差数据对当前预测单元执行帧内预测。
图12示出根据本发明的实施例的根据深度的较深层编码单元和分区。
根据实施例的视频编码设备100和根据实施例的视频解码设备200使用分层编码单元以考虑图像的特征。可根据图像的特征自适应地确定编码单元的最大高度、最大宽度和最大深度,或可根据用户需求不同地设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来确定根据深度的较深层编码单元的尺寸。
在根据实施例的编码单元的分层结构600中,编码单元的最大高度和最大宽度均是64,最大深度是4。在此情况下,最大深度表示编码单元从最大编码单元到最小编码单元被划分的总次数。由于深度沿着编码单元的分层结构600的垂直轴加深,因此较深层编码单元的高度和宽度均被划分。另外,预测单元和分区沿着编码单元的分层结构600的水平轴被示出,其中,所述预测单元和分区是对每个较深层编码单元进行预测编码的基础。
也就是说,在编码单元的分层结构600中,编码单元610是最大编码单元,其中,深度为0,尺寸(即,高度乘宽度)为64×64。深度沿着垂直轴加深,存在尺寸为32×32和深度为1的编码单元620、尺寸为16×16和深度为2的编码单元630、尺寸为8×8和深度为3的编码单元640。
编码单元的预测单元和分区根据每个深度沿着水平轴被排列。也就是说,如果尺寸为64×64和深度为0的编码单元610是预测单元,则可将预测单元划分成包括在尺寸为64×64的编码单元610中的分区,即,尺寸为64×64的分区610、尺寸为64×32的分区612、尺寸为32×64的分区614或尺寸为32×32的分区616。
相同地,可将尺寸为32×32和深度为1的编码单元620的预测单元划分成包括在尺寸为32×32的编码单元620中的分区,即,尺寸为32×32的分区620、尺寸为32×16的分区622、尺寸为16×32的分区624和尺寸为16×16的分区626。
相同地,可将尺寸为16×16和深度为2的编码单元630的预测单元划分成包括在尺寸为16×16的编码单元630中的分区,即,尺寸为16×16的分区630、尺寸为16×8的分区632、尺寸为8×16的分区634和尺寸为8×8的分区636。
相同地,可将尺寸为8×8和深度为3的编码单元640的预测单元划分成包括在尺寸为8×8的编码单元640中的分区,即,尺寸为8×8的分区640、尺寸为8×4的分区642、尺寸为4×8的分区644和尺寸为4×4的分区646。
尺寸为4×4和深度为4的编码单元650是最小编码单元和最低深度的编码单元,编码单元650的预测单元可仅被设置为尺寸为4×4分区650。
为了确定最大编码单元610的最终深度,视频编码设备100的编码单元确定器120必须对包括在最大编码单元610中的分别与多个深度相应的多个编码单元执行编码。
随着深度加深,包括具有相同范围和相同尺寸的数据的根据深度的较深层编码单元的数量增加。例如,需要四个与深度2相应的编码单元来覆盖包括在与深度1相应的一个编码单元中的数据。因此,为了根据深度比较对相同数据进行编码的结果,必须通过使用与深度1相应的编码单元和四个与深度2相应的编码单元中的每个编码单元对数据进行编码。
为了根据多个深度之中的每个深度执行编码,可沿着编码单元的分层结构600的水平轴,通过对根据深度的编码单元的每个预测单元执行编码,来选择作为相应深度的代表性编码误差的最小编码误差。此外,随着深度沿着编码单元的分层结构600的垂直轴加深,可通过针对每个深度执行编码来比较根据深度的代表性编码误差,以搜索最小编码误差。在最大编码单元610中的产生最小编码误差的深度和分区可被选为最大编码单元610的编码深度和分区类型。
图13示出根据本发明的实施例的在编码单元和变换单元之间的关系。
根据实施例的视频编码设备100或根据实施例的视频解码设备200针对每个最大编码单元,根据具有小于或等于最大编码单元的尺寸的编码单元,对图像进行编码或解码。可基于不大于相应编码单元的数据单元,来选择用于在编码处理期间进行变换的变换单元的尺寸。
例如,在视频编码设备100或视频解码设备200中,当编码单元710的尺寸是64×64时,可通过使用尺寸为32×32的变换单元720来执行变换。
此外,可通过对小于64×64的尺寸为32×32、16×16、8×8和4×4的变换单元中的每一个执行变换,来对尺寸为64×64的编码单元710的数据进行编码,然后可选择针对原始图像具有最小编码误差的变换单元。
图14示出根据本发明的实施例的多条编码信息。
根据实施例的视频编码设备100的输出单元130可对与编码深度相应的每个编码单元的分区类型信息800、预测模式信息810以及变换单元尺寸信息820进行编码,并将分区类型信息800、预测模式信息810以及变换单元尺寸信息820作为编码模式信息来发送。
分区类型信息800指示关于通过划分当前编码单元的预测单元而获得的分区的形状的信息,其中,分区是用于对当前编码单元进行预测编码的数据单元。例如,可将尺寸为2N×2N的当前编码单元CU_0划分成以下分区中的任意一个:尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806和尺寸为N×N的分区808。在这种情况下,关于当前编码单元的分区类型信息800被设置为指示以下分区之一:尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806和尺寸为N×N的分区808。
预测模式信息810指示每个分区的预测模式。例如,预测模式信息810可指示对由分区类型信息800指示的分区执行的预测编码的模式,即,帧内模式812、帧间模式814或跳过模式816。
变换单元尺寸信息820指示当对当前编码单元执行变换时所基于的变换单元。例如,变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826和第二帧间变换单元828中的一个。
视频解码设备200的图像数据和编码信息提取器210可根据每个较深层编码单元,提取并使用用于解码的分区类型信息800、预测模式信息810和变换单元尺寸信息820。
图15示出根据本发明的实施例的根据深度的较深层编码单元。
划分信息可用来表示深度的改变。划分信息指定当前深度的编码单元是否被划分成更低深度的编码单元。
用于对深度为0和尺寸为2N_0×2N_0的编码单元900进行预测编码的预测单元910可包括以下分区类型的分区:尺寸为2N_0×2N_0的分区类型912、尺寸为2N_0×N_0的分区类型914、尺寸为N_0×2N_0的分区类型916和尺寸为N_0×N_0的分区类型918。仅示出了通过对称地划分预测单元而获得的分区类型912、914、916和918,但如上所述,分区类型不限于此,并且分区类型可包括非对称分区、具有预定形状的分区和具有几何形状的分区。
根据每种分区类型,对尺寸为2N_0×2N_0的一个分区、尺寸为2N_0×N_0的两个分区、尺寸为N_0×2N_0的两个分区和尺寸为N_0×N_0的四个分区重复地执行预测编码。可对尺寸为2N_0×2N_0、N_0×2N_0、2N_0×N_0和N_0×N_0的分区执行帧内模式和帧间模式下的预测编码。仅对尺寸为2N_0×2N_0的分区执行跳过模式下的预测编码。
如果在尺寸为2N_0×2N_0、2N_0×N_0和N_0×2N_0的分区类型912、914和916中的一个分区类型中编码误差最小,则可不将预测单元910划分到更低深度。
如果在尺寸为N_0×N_0的分区类型918中编码误差最小,则深度从0改变到1并执行划分(操作920),并对深度为2和尺寸为N_0×N_0的分区类型的编码单元930重复地执行编码来搜索最小编码误差。
用于对深度为1和尺寸为2N_1×2N_1(=N_0×N_0)的编码单元930进行预测编码的预测单元930可包括以下分区类型:尺寸为2N_1×2N_1的分区类型942、尺寸为2N_1×N_1的分区类型944、尺寸为N_1×2N_1的分区类型946以及尺寸为N_1×N_1的分区类型948。
如果在尺寸为N_1×N_1的分区类型948中编码误差最小,则深度从1改变到2并执行划分(在操作950),并对深度为2且尺寸为N_2×N_2的编码单元960重复执行编码来搜索最小编码误差。
当最大深度是d时,根据深度的较深层编码单元可被设置直到深度与d-1相应时,并且划分信息可被设置直到深度与d-2相应时。也就是说,当编码被执行直到在与d-2的深度相应的编码单元被划分之后深度是d-1(在操作970)时,用于对深度为d-1且尺寸为2N_(d-1)×2N_(d-1)的编码单元980进行预测编码的预测单元990可包括以下分区类型的分区:尺寸为2N_(d-1)×2N_(d-1)的分区类型992、尺寸为2N_(d-1)×N_(d-1)的分区类型994、尺寸为N_(d-1)×2N_(d-1)的分区类型996和尺寸为N_(d-1)×N_(d-1)的分区类型998。
可对尺寸为2N_(d-1)×2N_(d-1)的一个分区、尺寸为2N_(d-1)×N_(d-1)的两个分区、尺寸为N_(d-1)×2N_(d-1)的两个分区、尺寸为N_(d-1)×N_(d-1)的四个分区重复地执行预测编码,以搜索产生最小编码误差的分区类型。
即使尺寸为N_(d-1)×N_(d-1)的分区类型998具有最小编码误差时,由于最大深度是d,因此深度为d-1的编码单元CU_(d-1)也不再被划分到更低深度,构成当前最大编码单元900的编码单元的编码深度被确定为d-1,并且当前最大编码单元900的分区类型可被确定为N_(d-1)×N_(d-1)。此外,由于最大深度是d,因此不设置用于深度为d-1的编码单元952的划分信息。
数据单元999可以是用于当前最大编码单元的“最小单元”。根据实施例的最小单元可以是通过将具有最低编码深度的最小编码单元划分成4份而获得的正方形数据单元。通过重复地执行编码,根据实施例的视频编码设备100可通过比较根据编码单元900的深度的编码误差来选择具有最小编码误差的深度以确定编码深度,并将相应分区类型和预测模式设置为编码深度的编码模式。
这样,在所有深度0、1、…、d-1、d中对根据深度的最小编码误差进行比较,并且具有最小编码误差的深度可被确定为编码深度。编码深度、预测单元的分区类型和预测模式可作为编码模式信息被编码并发送。另外,由于编码单元必须从0的深度被划分到编码深度,因此仅将编码深度的划分信息设置为“0”,并且将除了编码深度以外的深度的划分信息设置为“1”。
根据实施例的视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元900的编码深度和预测单元信息,来对编码单元912进行解码。根据实施例的视频解码设备200可通过使用根据深度的编码模式信息,将划分信息为“0”的深度确定为编码深度,并且可使用例如关于相应深度的编码模式信息来进行解码。
图16、图17和图18示出根据本发明的实施例的在编码单元、预测单元和变换单元之间的关系。
编码单元1010是最大编码单元中的根据由视频编码设备100确定的编码深度的较深层编码单元。预测单元1060是根据编码深度的每个编码单元1010的预测单元的分区,变换单元1070是根据编码深度的每个编码单元的变换单元。
当在较深层编码单元1010中最大编码单元的深度是0时,编码单元1012和1054的深度是1,编码单元1014、1016、1018、1028、1050和1052的深度是2,编码单元1020、1022、1024、1026、1030、1032和1048的深度是3,编码单元1040、1042、1044和1046的深度是4。
可通过划分编码单元来获得在预测单元1060中的一些分区1014、1016、1022、1032、1048、1050、1052和1054。也就是说,分区1014、1022、1050和1054是尺寸为2N×N的分区类型,分区1016、1048和1052是尺寸为N×2N的分区类型,分区1032是尺寸为N×N的分区类型。较深层编码单元1010的预测单元和分区小于或等于每个编码单元。
按照小于编码单元1052的数据单元中的变换单元1070,对编码单元1052的图像数据执行变换或逆变换。另外,在尺寸和形状方面,变换单元1070中的编码单元1014、1016、1022、1032、1048、1050、1052和1054是不同于预测单元1060中的编码单元1014、1016、1022、1032、1048、1050、1052和1054的数据单元。也就是说,根据实施例的视频编码设备100和视频解码设备200可对同一编码单元中的单个数据单元执行帧内预测/运动估计/运动补偿/变换/逆变换。
因此,对最大编码单元的每个区域中的具有分层结构的每个编码单元递归地执行编码来确定最优编码单元,从而可获得根据递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、分区类型信息、预测模式信息和变换单元尺寸信息。下面的表4示出可由根据实施例的视频编码设备100和视频解码设备200设置的编码信息。
[表4]
根据实施例的视频编码设备100的输出单元130可输出关于具有树结构的编码单元的编码信息,根据实施例的视频解码设备200的图像数据和编码信息提取器220可从接收到的比特流提取关于具有树结构的编码单元的编码信息。
划分信息指定是否将当前编码单元划分成更低深度的编码单元。如果当前深度d的划分信息是0,则当前编码单元不再被划分成更低深度的深度是编码深度,从而可针对所述编码深度来定义分区类型信息、预测模式信息和变换单元尺寸信息。如果当前编码单元必须根据划分信息被进一步划分,则必须对更低深度的四个划分编码单元中的每一个独立地执行编码。
预测模式可以是帧内模式、帧间模式和跳过模式中的一种。可在所有分区类型中定义帧内模式和帧间模式,仅在尺寸为2N×2N的分区类型中定义跳过模式。
分区类型信息可指示通过对称地划分预测单元的高度或宽度而获得的尺寸为2N×2N、2N×N、N×2N和N×N的对称分区类型,以及通过非对称地划分预测单元的高度或宽度而获得的尺寸为2N×nU、2N×nD、nL×2N和nR×2N的非对称分区类型。可通过按1:3和3:1来划分预测单元的高度来分别获得尺寸为2N×nU和2N×nD的非对称分区类型,可通过按1:3和3:1来划分预测单元的宽度来分别获得尺寸为nL×2N和nR×2N的非对称分区类型。
可将变换单元的尺寸设置成帧内模式下的两种类型和帧间模式下的两种类型。也就是说,如果变换单元的划分信息是0,则变换单元的尺寸可以是2N×2N,即当前编码单元的尺寸。如果变换单元的划分信息是1,则可通过对当前编码单元进行划分来获得变换单元。另外,如果尺寸为2N×2N的当前编码单元的分区类型是对称分区类型,则变换单元的尺寸可以是N×N,如果当前编码单元的分区类型是非对称分区类型,则变换单元的尺寸可以是N/2×N/2。
根据实施例的关于具有树结构的编码单元的编码信息可被分配给编码深度的编码单元、预测单元和最小单元中的至少一个。编码深度的编码单元可包括包含相同编码信息的预测单元和最小单元中的至少一个。
因此,通过比较邻近数据单元的编码信息来确定邻近数据单元是否被包括在与编码深度相应的同一编码单元中。另外,通过使用数据单元的编码信息来确定相应编码深度的编码单元,并因此可推断出最大编码单元中的编码深度的分布。
因此,如果基于邻近数据单元的编码信息来对当前编码单元进行预测,则可直接参考并使用与当前编码单元邻近的较深层编码单元中的数据单元的编码信息。
在另一实施例中,如果基于邻近数据单元的编码信息来对当前编码单元进行预测,则可通过使用数据单元的编码信息来搜索与当前编码单元邻近的数据单元,并可参考搜索到的邻近编码单元以对当前编码单元进行预测。
图19示出根据表4的编码模式信息的编码单元、预测单元和变换单元之间的关系。
最大编码单元1300包括多个深度的编码单元1302、1304、1306、1312、1314、1316和1318。这里,由于编码单元1318是编码深度的编码单元,因此划分信息可被设置成0。可将尺寸为2N×2N的编码单元1318的分区类型信息设置成多个分区类型中的一种,其中,所述多个分区类型包括2N×2N1322、2N×N 1324、N×2N 1326、N×N 1328、2N×nU 1332、2N×nD1334、nL×2N1336和nR×2N 1338。
变换单元划分信息(TU尺寸标志)是一种类型的变换索引,与变换索引相应的变换单元的尺寸可根据编码单元的预测单元类型或分区类型而改变。
例如,当分区类型信息被设置为对称分区类型2N×2N 1322、2N×N 1324、N×2N1326和N×N 1328中的一种时,如果变换单元划分信息是0,则设置尺寸为2N×2N的变换单元1342,如果变换单元划分信息是1,则设置尺寸为N×N的变换单元1344。
当分区类型信息被设置成非对称分区类型2N×nU 1332、2N×nD 1334、nL×2N1336和nR×2N 1338中的一种时,如果变换单元划分信息(TU尺寸标志)是0,则设置尺寸为2N×2N的变换单元1352,如果变换单元划分信息是1,则设置尺寸为N/2×N/2的变换单元1354。
参照图19描述的变换单元划分信息(TU尺寸标志)是具有值0或1的标志,但是根据实施例的变换单元划分信息不限于具有1比特的标志,并且变换单元可在变换单元划分信息根据设置按照0、1、2、3…等的方式增加时被分层划分。变换单元划分信息可以是变换索引的示例。
在这种情况下,可通过使用根据实施例的变换单元划分信息以及变换单元的最大尺寸和变换单元的最小尺寸来表示实际上已使用的变换单元的尺寸。根据实施例的视频编码设备100可对最大变换单元尺寸信息、最小变换单元尺寸信息和最大变换单元划分信息进行编码。对最大变换单元尺寸信息、最小变换单元尺寸信息和最大变换单元划分信息进行编码的结果可被插入SPS。根据实施例的视频解码设备200可通过使用最大变换单元尺寸信息、最小变换单元尺寸信息和最大变换单元划分信息来对视频进行解码。
例如,(a)如果当前编码单元的尺寸是64×64并且最大变换单元尺寸是32×32,则(a-1)当TU尺寸标志为0时,变换单元的尺寸可以是32×32,(a-2)当TU尺寸标志为1时,变换单元的尺寸可以是16×16,(a-3)当TU尺寸标志为2时,变换单元的尺寸可以是8×8。
作为另一示例,(b)如果当前编码单元的尺寸是32×32并且最小变换单元尺寸是32×32,则(b-1)当TU尺寸标志为0时,变换单元的尺寸可以是32×32。这里,由于变换单元的尺寸不能够小于32×32,因此TU尺寸标志不能够被设置为除了0以外的值。
作为另一示例,(c)如果当前编码单元的尺寸是64×64并且最大TU尺寸标志为1,则TU尺寸标志可以是0或1。这里,TU尺寸标志不能够被设置为除了0或1以外的值。
因此,如果定义最大TU尺寸标志为“MaxTransformSizeIndex”,最小变换单元尺寸为“MinTransformSize”,当TU尺寸标志为0时的变换单元尺寸为“RootTuSize”,则可通过等式(1)来定义可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”:
CurrMinTuSize=max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex))
…(1)
与可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”相比,当TU尺寸标志为0时的变换单元尺寸“RootTuSize”可指示可在系统中选择的最大变换单元尺寸。也就是说,在等式(1)中,“RootTuSize/(2^MaxTransformSizeIndex)”指示当TU尺寸标志为0时,变换单元尺寸“RootTuSize”被划分了与最大TU尺寸标志相应的次数时的变换单元尺寸,“MinTransformSize”指示最小变换尺寸。因此,“RootTuSize/(2^MaxTransformSizeIndex)”和“MinTransformSize”中较小的值可以是可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”。
根据实施例,最大变换单元尺寸RootTuSize可根据预测模式的类型而改变。
例如,如果当前预测模式是帧间模式,则可通过使用以下的等式(2)来确定“RootTuSize”。在等式(2)中,“MaxTransformSize”指示最大变换单元尺寸,“PUSize”指示当前预测单元尺寸。
RootTuSize=min(MaxTransformSize,PUSize)……(2)
也就是说,如果当前预测模式是帧间模式,则当TU尺寸标志为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前预测单元尺寸中较小的值。
如果当前分区单元的预测模式是帧内模式,则可通过使用以下的等式(3)来确定“RootTuSize”。在等式(3)中,“PartitionSize”指示当前分区单元的尺寸:
RootTuSize=min(MaxTransformSize,PartitionSize)……(3)
也就是说,如果当前预测模式是帧内模式,则当TU尺寸标志为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前分区单元的尺寸之中较小的值。
然而,根据分区单元中的预测模式的类型而改变的当前最大变换单元尺寸“RootTuSize”仅是实施例,并且用于确定当前最大变换单元的因素不限于此。
根据基于以上参照图7至图19描述的树结构的视频编码方法,空间域的图像数据可在树结构的每个编码单元中被编码,根据基于树结构的编码单元的视频解码方法,按照对每个最大编码单元执行解码的方式来重建空间域的图像数据,使得由画面形成的视频和画面序列可被重建。重建的视频可由再现设备来再现,可存储在存储介质中,或可通过网络来发送。
上述实施例可被编写为计算机程序,并且可以以使用计算机可读记录介质执行程序的通用数字计算机来实现。计算机可读记录介质的示例包括磁存储介质(例如,ROM、软盘、硬盘等)和光学记录介质(例如,CD-ROM或DVD)等。
虽然已经参照本发明的示例性实施例具体示出和描述了本发明,但是本领域的普通技术人员将理解,在不脱离权利要求的精神和范围的情况下,可作出形式和细节上的各种改变。公开的实施例应仅被认为是说明性意义,而不是为了限制的目的。因此,本发明的范围不由本发明的详细说明来限定,而由权利要求来限定,该范围内的所有差异将被解释为被包括在本发明中。
Claims (4)
1.一种视频解码方法,包括:
基于当前块的邻近块的可用性和预测模式,确定参考帧内预测模式;
基于参考帧内预测模式,确定用于当前块的候选帧内预测模式;
从比特流获得指示候选帧内预测模式之一是否被选为当前块的帧内预测模式的候选帧内预测标志;
当所述候选帧内预测标志指示候选帧内预测模式之一被选为当前块的帧内预测模式时,从比特流获得指示候选帧内预测模式之中的当前块的帧内预测模式的当前帧内预测信息;
根据所述当前帧内预测信息从候选帧内预测模式之中选择当前块的帧内预测模式;
根据当前块的帧内预测模式对当前块执行帧内预测,
其中,
确定参考帧内预测模式的步骤包括:
基于当前块的左侧邻近块确定当前块的第一帧内预测模式;
基于当前块的上方邻近块确定当前块的第二帧内预测模式,
确定用于当前块的候选帧内预测模式的步骤包括:
在第一帧内预测模式和第二帧内预测模式相同,并且第一帧内预测模式是DC模式的情况下,将双线性模式和DC模式确定为候选帧内预测模式;
在第一帧内预测模式和第二帧内预测模式相同,并且第一帧内预测模式不是DC模式的情况下,将第一帧内预测模式和DC模式确定为候选帧内预测模式;
在第一帧内预测模式和第二帧内预测模式不同的情况下,将第一帧内预测模式和第二帧内预测模式确定为候选帧内预测模式。
2.一种视频解码设备,包括:
候选帧内预测模式确定器,被配置为:
基于当前块的邻近块的可用性和预测模式,确定参考帧内预测模式,
基于参考帧内预测模式,确定用于当前块的候选帧内预测模式;
帧内预测器,被配置为:
从比特流获得指示候选帧内预测模式之一是否被选为当前块的帧内预测模式的候选帧内预测标志,当所述候选帧内预测标志指示候选帧内预测模式之一被选为当前块的帧内预测模式时,从比特流获得指示候选帧内预测模式之中的当前块的帧内预测模式的当前帧内预测信息,
根据所述当前帧内预测信息从候选帧内预测模式之中选择当前块的帧内预测模式,
根据当前块的帧内预测模式对当前块执行帧内预测,
其中,
候选帧内预测模式确定器被配置为:
基于当前块的左侧邻近块确定当前块的第一帧内预测模式;
基于当前块的上方邻近块确定当前块的第二帧内预测模式,
候选帧内预测模式确定器被配置为:
在第一帧内预测模式和第二帧内预测模式相同,并且第一帧内预测模式是DC模式的情况下,将双线性模式和DC模式确定为候选帧内预测模式;
在第一帧内预测模式和第二帧内预测模式相同,并且第一帧内预测模式不是DC模式的情况下,将第一帧内预测模式和DC模式确定为候选帧内预测模式;
在第一帧内预测模式和第二帧内预测模式不同的情况下,将第一帧内预测模式和第二帧内预测模式确定为候选帧内预测模式。
3.一种视频编码方法,包括:
基于当前块的邻近块的可用性和预测模式,确定参考帧内预测模式;
基于参考帧内预测模式,确定用于当前块的候选帧内预测模式;
基于当前块的帧内预测模式以及当前块的候选帧内预测模式,确定指示是否根据候选帧内预测模式之一对当前块进行预测的候选帧内预测标志以及指示候选帧内预测模式之中的当前块的帧内预测模式的当前帧内预测信息;
输出包括候选帧内预测标志和当前帧内预测信息的比特流,
其中,
确定参考帧内预测模式的步骤包括:
基于当前块的左侧邻近块确定当前块的第一帧内预测模式;
基于当前块的上方邻近块确定当前块的第二帧内预测模式,
确定用于当前块的候选帧内预测模式的步骤包括:
在第一帧内预测模式和第二帧内预测模式相同,并且第一帧内预测模式是DC模式的情况下,将双线性模式和DC模式确定为候选帧内预测模式;
在第一帧内预测模式和第二帧内预测模式相同,并且第一帧内预测模式不是DC模式的情况下,将第一帧内预测模式和DC模式确定为候选帧内预测模式;
在第一帧内预测模式和第二帧内预测模式不同的情况下,将第一帧内预测模式和第二帧内预测模式确定为候选帧内预测模式。
4.一种视频编码设备,包括:
候选帧内预测模式确定器,被配置为:
基于当前块的邻近块的可用性和预测模式,确定参考帧内预测模式,
基于参考帧内预测模式,确定用于当前块的候选帧内预测模式;
帧内预测模式信息编码器,被配置为:
基于当前块的帧内预测模式以及当前块的候选帧内预测模式,确定指示是否根据候选帧内预测模式之一对当前块进行预测的候选帧内预测标志以及指示候选帧内预测模式之中的当前块的帧内预测模式的当前帧内预测信息,
输出包括候选帧内预测标志和当前帧内预测信息的比特流,
其中,
候选帧内预测模式确定器被配置为:
基于当前块的左侧邻近块确定当前块的第一帧内预测模式;
基于当前块的上方邻近块确定当前块的第二帧内预测模式,
候选帧内预测模式确定器被配置为:
在第一帧内预测模式和第二帧内预测模式相同,并且第一帧内预测模式是DC模式的情况下,将双线性模式和DC模式确定为候选帧内预测模式;
在第一帧内预测模式和第二帧内预测模式相同,并且第一帧内预测模式不是DC模式的情况下,将第一帧内预测模式和DC模式确定为候选帧内预测模式;
在第一帧内预测模式和第二帧内预测模式不同的情况下,将第一帧内预测模式和第二帧内预测模式确定为候选帧内预测模式。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361918151P | 2013-12-19 | 2013-12-19 | |
US61/918,151 | 2013-12-19 | ||
CN201480075994.1A CN106031176B (zh) | 2013-12-19 | 2014-12-19 | 涉及帧内预测的视频编码方法和装置以及视频解码方法和装置 |
PCT/KR2014/012572 WO2015093890A1 (ko) | 2013-12-19 | 2014-12-19 | 인트라 예측을 수반한 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480075994.1A Division CN106031176B (zh) | 2013-12-19 | 2014-12-19 | 涉及帧内预测的视频编码方法和装置以及视频解码方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110740320A true CN110740320A (zh) | 2020-01-31 |
CN110740320B CN110740320B (zh) | 2022-07-05 |
Family
ID=53403143
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911181685.3A Active CN110740320B (zh) | 2013-12-19 | 2014-12-19 | 视频编码方法和设备以及视频解码方法和设备 |
CN201480075994.1A Active CN106031176B (zh) | 2013-12-19 | 2014-12-19 | 涉及帧内预测的视频编码方法和装置以及视频解码方法和装置 |
CN201911181548.XA Active CN110708544B (zh) | 2013-12-19 | 2014-12-19 | 视频编码方法和设备以及视频解码方法和设备 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480075994.1A Active CN106031176B (zh) | 2013-12-19 | 2014-12-19 | 涉及帧内预测的视频编码方法和装置以及视频解码方法和装置 |
CN201911181548.XA Active CN110708544B (zh) | 2013-12-19 | 2014-12-19 | 视频编码方法和设备以及视频解码方法和设备 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10257538B2 (zh) |
KR (1) | KR102317682B1 (zh) |
CN (3) | CN110740320B (zh) |
MY (1) | MY181411A (zh) |
WO (1) | WO2015093890A1 (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10827186B2 (en) * | 2016-08-25 | 2020-11-03 | Intel Corporation | Method and system of video coding with context decoding and reconstruction bypass |
KR20230152835A (ko) * | 2017-10-18 | 2023-11-03 | 삼성전자주식회사 | 비디오 복호화 방법 및 장치, 비디오 부호화 방법 및 장치 |
CN116405673A (zh) * | 2017-12-22 | 2023-07-07 | 数码士有限公司 | 视频信号处理方法和设备 |
CN108322743B (zh) * | 2018-02-28 | 2020-01-31 | 中南大学 | 一种基于模式依赖特性的不可分二次变换模式的帧内快速选择方法 |
WO2019172676A1 (ko) | 2018-03-08 | 2019-09-12 | 삼성전자 주식회사 | 비디오 복호화 방법 및 장치, 비디오 부호화 방법 및 장치 |
EP3787287A4 (en) * | 2018-04-24 | 2022-04-13 | Samsung Electronics Co., Ltd. | VIDEO ENCODING METHOD AND APPARATUS, AND VIDEO DECODING METHOD AND APPARATUS |
CN118018725A (zh) * | 2018-05-10 | 2024-05-10 | 三星电子株式会社 | 视频编码方法和设备以及视频解码方法和设备 |
KR20210027486A (ko) | 2018-08-27 | 2021-03-10 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 인트라 예측 방법 및 장치 |
KR20200063092A (ko) | 2018-11-27 | 2020-06-04 | 주식회사 엑스리스 | 영상 신호 부호화/복호화 방법 및 이를 위한 장치 |
CN113347436B (zh) * | 2019-06-21 | 2022-03-08 | 杭州海康威视数字技术股份有限公司 | 预测模式的解码、编码方法及装置 |
CN112188193A (zh) * | 2019-07-01 | 2021-01-05 | 富士通株式会社 | 视频编码方法及装置、电子设备 |
CN112543332B (zh) * | 2020-05-26 | 2021-08-17 | 腾讯科技(深圳)有限公司 | 视频解码方法、视频编码方法及相关设备 |
CN116711304A (zh) * | 2020-12-28 | 2023-09-05 | Oppo广东移动通信有限公司 | 预测方法、编码器、解码器以及存储介质 |
WO2023128649A1 (ko) * | 2021-12-29 | 2023-07-06 | 엘지전자 주식회사 | 영상 인코딩/디코딩 방법 및 장치, 그리고 비트스트림을 저장한 기록 매체 |
CN118451707A (zh) * | 2021-12-29 | 2024-08-06 | Lg电子株式会社 | 图像编码/解码方法和装置及存储比特流的记录介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110243229A1 (en) * | 2008-09-22 | 2011-10-06 | Sk Telecom. Co., Ltd | Apparatus and method for image encoding/decoding using predictability of intra-prediction mode |
CN102907100A (zh) * | 2010-05-17 | 2013-01-30 | Sk电信有限公司 | 使用帧内块和帧间块相混合的编码块的视频编码/解码设备及其方法 |
WO2013085282A1 (ko) * | 2011-12-05 | 2013-06-13 | 엘지전자 주식회사 | 인트라 예측 방법 및 장치 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006005438A (ja) * | 2004-06-15 | 2006-01-05 | Sony Corp | 画像処理装置およびその方法 |
KR101452860B1 (ko) * | 2009-08-17 | 2014-10-23 | 삼성전자주식회사 | 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치 |
US8588303B2 (en) * | 2010-03-31 | 2013-11-19 | Futurewei Technologies, Inc. | Multiple predictor sets for intra-frame coding |
KR101756442B1 (ko) * | 2010-11-29 | 2017-07-11 | 에스케이텔레콤 주식회사 | 인트라예측모드의 중복성을 최소화하기 위한 영상 부호화/복호화 방법 및 장치 |
KR20120070479A (ko) * | 2010-12-21 | 2012-06-29 | 한국전자통신연구원 | 화면 내 예측 방향 정보 부호화/복호화 방법 및 그 장치 |
HUE038712T2 (hu) | 2011-06-28 | 2018-11-28 | Samsung Electronics Co Ltd | Eljárás video dekódolására intra predikcióval |
EP2728872A4 (en) * | 2011-07-01 | 2016-05-11 | Samsung Electronics Co Ltd | VIDEO CODING METHOD WITH INTRAPRADICATION ON THE BASIS OF A TEST PROCESS FOR UNIFORM REFERENCE POSSIBILITY, VIDEO DECODING METHOD AND DEVICE THEREFOR |
-
2014
- 2014-12-19 KR KR1020167012047A patent/KR102317682B1/ko active IP Right Grant
- 2014-12-19 CN CN201911181685.3A patent/CN110740320B/zh active Active
- 2014-12-19 CN CN201480075994.1A patent/CN106031176B/zh active Active
- 2014-12-19 WO PCT/KR2014/012572 patent/WO2015093890A1/ko active Application Filing
- 2014-12-19 CN CN201911181548.XA patent/CN110708544B/zh active Active
- 2014-12-19 MY MYPI2016001136A patent/MY181411A/en unknown
-
2016
- 2016-06-17 US US15/185,153 patent/US10257538B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110243229A1 (en) * | 2008-09-22 | 2011-10-06 | Sk Telecom. Co., Ltd | Apparatus and method for image encoding/decoding using predictability of intra-prediction mode |
CN102907100A (zh) * | 2010-05-17 | 2013-01-30 | Sk电信有限公司 | 使用帧内块和帧间块相混合的编码块的视频编码/解码设备及其方法 |
WO2013085282A1 (ko) * | 2011-12-05 | 2013-06-13 | 엘지전자 주식회사 | 인트라 예측 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
CN106031176A (zh) | 2016-10-12 |
US10257538B2 (en) | 2019-04-09 |
CN110708544A (zh) | 2020-01-17 |
CN110740320B (zh) | 2022-07-05 |
WO2015093890A1 (ko) | 2015-06-25 |
MY181411A (en) | 2020-12-21 |
KR102317682B1 (ko) | 2021-10-26 |
CN110708544B (zh) | 2022-07-05 |
US20160295237A1 (en) | 2016-10-06 |
CN106031176B (zh) | 2019-12-13 |
KR20160099534A (ko) | 2016-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110708544B (zh) | 视频编码方法和设备以及视频解码方法和设备 | |
JP6665225B2 (ja) | ビデオ復号化方法とその装置、ビデオ符号化方法とその装置 | |
CN104581165B (zh) | 用于对视频进行解码的方法和设备 | |
US9485510B2 (en) | Method and apparatus for coding video and method and apparatus for decoding video, using intra prediction | |
CN104811699B (zh) | 对视频数据进行解码的方法 | |
CN106803957B (zh) | 对视频进行解码的设备 | |
CN104780373B (zh) | 用于确定运动矢量的设备 | |
TWI517679B (zh) | 利用統一的可獲性檢查以畫面內預測做視訊編碼的方法與裝置以及利用統一的可獲性檢查以畫面內預測做視訊解碼的方法與裝置 | |
CN113810688B (zh) | 视频编码方法、视频解码方法以及计算机可读介质 | |
US20170339403A1 (en) | Method and device for encoding/decoding video using intra prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |