CN105264889A - 用于生成帧内预测样本的方法、设备和系统 - Google Patents

用于生成帧内预测样本的方法、设备和系统 Download PDF

Info

Publication number
CN105264889A
CN105264889A CN201480032315.2A CN201480032315A CN105264889A CN 105264889 A CN105264889 A CN 105264889A CN 201480032315 A CN201480032315 A CN 201480032315A CN 105264889 A CN105264889 A CN 105264889A
Authority
CN
China
Prior art keywords
prediction mode
intra prediction
infra
angle
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201480032315.2A
Other languages
English (en)
Other versions
CN105264889B (zh
Inventor
克里斯托弗·詹姆斯·罗斯沃恩
沃洛迪米尔·科勒斯尼科夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of CN105264889A publication Critical patent/CN105264889A/zh
Application granted granted Critical
Publication of CN105264889B publication Critical patent/CN105264889B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

公开了一种用于生成针对4:2:2色度格式所配置的视频位流的色度通道的帧内预测样本的方法。根据针对色度通道的帧内预测模式来确定(1104)帧内预测角度,其中该帧内预测模式是多个水平帧内预测模式其中之一。调整由于4:2:2色度格式所引起的帧内预测角度(1108~1118)。在调整后的角度超过预定值的情况下,修改(1122)水平帧内预测模式和垂直帧内预测模式之间的变化阈值,其中修改后的变化阈值被配置成将调整后的帧内预测角度从多个帧内预测模式其中之一转换至垂直帧内预测模式。根据调整后的帧内预测角度和变化阈值来使用垂直帧内预测模式生成(1126)帧内预测样本。

Description

用于生成帧内预测样本的方法、设备和系统
技术领域
本发明通常涉及数字视频信号处理,尤其涉及用于生成视频数据的视频帧的帧内预测样本的方法、设备和系统。本发明还涉及包括记录有用于生成视频数据的视频帧的帧内预测样本的计算机程序的计算机可读介质的计算机程序产品。
背景技术
当前存在包括用于传输和存储视频数据的应用程序的许多视频编码用的应用程序。还开发了许多视频编码标准并且其它视频编码标准当前正在开发中。视频编码标准化的最新进展已导致形成被称为“视频编码联合小组”(JCT-VC)的组。该视频编码联合小组(JCT-VC)包括:已知为视频编码专家组(VCEG)的国际电信联盟(ITU)的电信标准化部门(ITU-T)的研究组16、问题6(SG16/Q6)的成员;以及还已知为运动图片专家组(MPEG)的国际标准化组织/国际电工委员会联合技术委员会1/小组委员会29/工作组11(ISO/IECJTC1/SC29/WG11)的成员。
视频编码联合小组(JCT-VC)的目标是产生新的视频编码标准以显著优于目前现有的已知为“H.264/MPEG-4AVC”的视频编码标准。以多个方式测量在视频编码标准的情况下的性能。使用视频编码标准中所存在的或针对视频编码标准所提出的算法的复杂度的度量来估计向视频编码标准引入特定算法的增加成本或节省成本。复杂度的一个简单度量是视频编码标准的软件实现的运行时间。视频编码标准的用以紧凑地表示未经压缩的视频数据的实现的能力的度量已知为“编码效率”。视频编码标准的实现通常向解压缩后的图像数据引入失真。这已知为“有损”压缩并且使得能够实现更高的编码效率。结果,编码效率的度量必须考虑失真的度量(例如,PSNR)vs.压缩视频数据所用的位率的度量(“位流”)这两者。该H.264/MPEG-4AVC标准本身是针对诸如MPEG-4和ITU-TH.263等的以前的视频编码标准的大幅改进。已将开发中的新视频编码标准命名为“高效率视频编码(HEVC)”。高效率视频编码(HEVC)的进一步开发的目的是引入视频数据中所存在的色度信息的不同表示(已知为“色度格式”)的支持。视频编码联合小组(JCT-VC)还考虑由于针对高效率视频编码(HEVC)所提出的技术而产生的、在对该标准的实现进行缩放从而以高分辨率实时或以高帧频进行工作的情况下产生困难的实现挑战。高效率视频编码(HEVC)中所存在的算法的复杂度影响实现、例如影响硬件实现的电路大小。
利用特定视频编码标准可实现的编码效率的一个方面是可用预测方法的特性。对于意图用于二维视频帧的压缩序列的视频编码标准,存在帧内预测和帧间预测这两种预测。帧内预测方法使得能够根据视频帧的一部分来预测同一视频帧的其它部分的内容。帧内预测方法通常产生具有定向纹理的块,其中帧内预测模式指定纹理的方向并且使用帧内的邻接样本作为用以产生该纹理的基础。帧间预测方法使得能够根据先前视频帧中的块来预测视频帧内的块的内容。可以将先前视频帧称为“参考帧”。由于不存在可用于参考的先前帧,因此视频帧序列内的第一个视频帧通常对该帧内的所有块使用帧内预测。后续视频帧可以使用对块进行预测所根据的一个或多个先前视频帧。为了实现最高编码效率,通常使用产生最接近原始视频数据的预测块的预测方法。预测块和原始视频数据之间的其余差异已知为“残余(residue)”。可以将残余的有损表示(已知为“残差(residual)”)存储在位流中。残差中的损耗量影响从位流解码得到的视频数据与原始视频数据相比的失真并且影响位流的大小。
用于表示视频数据的“色度格式”指定视频数据的亮度通道和多个色度通道之间的样本高宽比(aspectratio)。该高宽比针对各色度格式暗示亮度和色度的同位置块大小之间的固定关系。该固定关系还影响同位置块的亮度通道和色度通道所使用的可用变换大小。在使用“4:2:2”色度格式来表示视频数据的情况下,在亮度样本和色度样本之间存在非正方形关系。
针对“4:2:2”色度格式的色度通道中所使用的非正方形块大小的一个结果是与亮度通道相比,帧内预测操作的定向纹理在色度通道中发生失真。该失真导致针对色度通道的预测块的精度下降。为了对该失真进行补偿,需要增加针对色度通道的残差的大小。该增加导致通过视频编码标准的实现所实现的编码效率不期望地下降。
发明内容
本发明的目的是大致克服或至少改进现有配置的一个或多个缺点。
根据本发明的一个方面,提供一种用于生成针对4:2:2色度格式所配置的视频位流的色度通道的帧内预测样本的方法,所述方法包括以下步骤:根据针对所述色度通道的帧内预测模式来确定帧内预测角度,其中所述帧内预测模式是多个水平帧内预测模式其中之一;调整由于所述4:2:2色度格式所引起的所述帧内预测角度;在调整后的帧内预测角度超过预定值的情况下,修改水平帧内预测模式和垂直帧内预测模式之间的变化阈值,其中修改后的变化阈值被配置成将调整后的帧内预测角度从所述多个水平帧内预测模式其中之一转换至垂直帧内预测模式;以及根据调整后的帧内预测角度和所述变化阈值来使用垂直帧内预测模式生成帧内预测样本。
根据本发明的另一方面,提供一种用于生成针对4:2:2色度格式所配置的视频位流的色度通道的帧内预测样本的系统,所述系统包括:存储器,用于存储数据和计算机程序;处理器,其连接至所述存储器,以执行所述计算机程序,所述计算机程序包括用于进行以下操作的指令:根据针对所述色度通道的帧内预测模式来确定帧内预测角度,其中所述帧内预测模式是多个水平帧内预测模式其中之一;调整由于所述4:2:2色度格式所引起的所述帧内预测角度;在调整后的帧内预测角度超过预定值的情况下,修改水平帧内预测模式和垂直帧内预测模式之间的变化阈值,其中修改后的变化阈值被配置成将调整后的帧内预测角度从所述多个水平帧内预测模式其中之一转换至垂直帧内预测模式;以及根据调整后的帧内预测角度和所述变化阈值来使用垂直帧内预测模式生成帧内预测样本。
根据本发明的又一方面,提供一种用于生成针对4:2:2色度格式所配置的视频位流的色度通道的帧内预测样本的设备,所述设备包括以下部件:用于根据针对所述色度通道的帧内预测模式来确定帧内预测角度的部件,其中所述帧内预测模式是多个水平帧内预测模式其中之一;用于调整由于所述4:2:2色度格式所引起的所述帧内预测角度的部件;用于在调整后的帧内预测角度超过预定值的情况下,修改水平帧内预测模式和垂直帧内预测模式之间的变化阈值的部件,其中修改后的变化阈值被配置成将调整后的帧内预测角度从所述多个水平帧内预测模式其中之一转换至垂直帧内预测模式;以及用于根据调整后的帧内预测角度和所述变化阈值来使用垂直帧内预测模式生成帧内预测样本的部件。
根据本发明的还一方面,提供一种包括计算机程序的计算机可读介质,所述计算机程序用于生成针对4:2:2色度格式所配置的视频位流的色度通道的帧内预测样本,所述计算机程序包括以下代码:用于根据针对所述色度通道的帧内预测模式来确定帧内预测角度的代码,其中所述帧内预测模式是多个水平帧内预测模式其中之一;用于调整由于所述4:2:2色度格式所引起的所述帧内预测角度的代码;用于在调整后的帧内预测角度超过预定值的情况下,修改水平帧内预测模式和垂直帧内预测模式之间的变化阈值的代码,其中修改后的变化阈值被配置成将调整后的帧内预测角度从所述多个水平帧内预测模式其中之一转换至垂直帧内预测模式;以及用于根据调整后的帧内预测角度和所述变化阈值来使用垂直帧内预测模式生成帧内预测样本的代码。
根据本发明的还一方面,提供一种用于生成针对4:2:2色度格式所配置的视频位流的色度通道的帧内预测样本的方法,所述方法包括以下步骤:根据针对所述色度通道的帧内预测模式来确定帧内预测角度,其中所述帧内预测模式是多个水平帧内预测模式其中之一;调整由于所述4:2:2色度格式所引起的所述帧内预测角度;在所述视频位流是针对4:2:2色度格式所配置的情况下,修改水平帧内预测模式和垂直帧内预测模式之间的变化阈值,其中修改后的变化阈值被配置成将调整后的帧内预测角度从所述多个水平帧内预测模式其中之一转换至垂直帧内预测模式;以及根据调整后的帧内预测角度和所述变化阈值来使用垂直帧内预测模式生成帧内预测样本。
根据本发明的还一方面,提供一种用于生成针对4:2:2色度格式所配置的视频位流的色度通道的帧内预测样本的系统,所述系统包括:存储器,用于存储数据和计算机程序;处理器,其连接至所述存储器,以执行所述计算机程序,所述计算机程序包括包括用于进行以下操作的指令:根据针对所述色度通道的帧内预测模式来确定帧内预测角度,其中所述帧内预测模式是多个水平帧内预测模式其中之一;调整由于所述4:2:2色度格式所引起的所述帧内预测角度;在所述视频位流是针对4:2:2色度格式所配置的情况下,修改水平帧内预测模式和垂直帧内预测模式之间的变化阈值,其中修改后的变化阈值被配置成将调整后的帧内预测角度从所述多个水平帧内预测模式其中之一转换至垂直帧内预测模式;以及根据调整后的帧内预测角度和所述变化阈值来使用垂直帧内预测模式生成帧内预测样本。
根据本发明的还一方面,提供一种用于生成针对4:2:2色度格式所配置的视频位流的色度通道的帧内预测样本的设备,所述设备包括以下部件:用于根据针对所述色度通道的帧内预测模式来确定帧内预测角度的部件,其中所述帧内预测模式是多个水平帧内预测模式其中之一;用于调整由于所述4:2:2色度格式所引起的所述帧内预测角度的部件;用于在所述视频位流是针对4:2:2色度格式所配置的情况下,修改水平帧内预测模式和垂直帧内预测模式之间的变化阈值的部件,其中修改后的变化阈值被配置成将调整后的帧内预测角度从所述多个水平帧内预测模式其中之一转换至垂直帧内预测模式;以及用于根据调整后的帧内预测角度和所述变化阈值来使用垂直帧内预测模式生成帧内预测样本的部件。
根据本发明的还一方面,提供一种包括计算机程序的计算机可读介质,所述计算机程序用于生成针对4:2:2色度格式所配置的视频位流的色度通道的帧内预测样本,所述计算机程序包括以下代码:用于根据针对所述色度通道的帧内预测模式来确定帧内预测角度的代码,其中所述帧内预测模式是多个水平帧内预测模式其中之一;用于调整由于所述4:2:2色度格式所引起的所述帧内预测角度的代码;用于在所述视频位流是针对4:2:2色度格式所配置的情况下,修改水平帧内预测模式和垂直帧内预测模式之间的变化阈值的代码,其中修改后的变化阈值被配置成将调整后的帧内预测角度从所述多个水平帧内预测模式其中之一转换至垂直帧内预测模式;以及用于根据调整后的帧内预测角度和所述变化阈值来使用垂直帧内预测模式生成帧内预测样本的代码。
根据本发明的还一方面,提供一种用于生成视频位流的色度通道的帧内预测样本的方法,所述方法包括以下步骤:对所述视频位流的色度格式进行解码;在确定角度参数之前调整帧内预测模式,其中所述调整依赖于解码后的色度格式;根据调整后的帧内预测模式来确定所述角度参数;使用所确定的角度参数来生成参考样本;以及使用所确定的角度参数和所生成的参考样本来生成帧内预测样本。
根据本发明的还一方面,提供一种用于生成视频位流的色度通道的帧内预测样本的系统,所述系统包括:存储器,用于存储数据和计算机程序;处理器,其连接至所述存储器,以执行所述计算机程序,所述计算机程序包括用于进行以下操作的指令:对所述视频位流的色度格式进行解码;在确定角度参数之前调整帧内预测模式,其中所述调整依赖于解码后的色度格式;根据调整后的帧内预测模式来确定所述角度参数;使用所确定的角度参数来生成参考样本;以及使用所确定的角度参数和所生成的参考样本来生成帧内预测样本。
根据本发明的还一方面,提供一种用于生成视频位流的色度通道的帧内预测样本的设备,所述设备包括以下部件:用于对所述视频位流的色度格式进行解码的部件;用于在确定角度参数之前调整帧内预测模式的部件,其中所述调整依赖于解码后的色度格式;用于根据调整后的帧内预测模式来确定所述角度参数的部件;用于使用所确定的角度参数来生成参考样本的部件;以及用于使用所确定的角度参数和所生成的参考样本来生成帧内预测样本的部件。
根据本发明的还一方面,提供一种包括计算机程序的计算机可读介质,所述计算机程序用于生成视频位流的色度通道的帧内预测样本,所述计算机程序包括以下代码:用于对所述视频位流的色度格式进行解码的代码;用于在确定角度参数之前调整帧内预测模式的代码,其中所述调整依赖于解码后的色度格式;用于根据调整后的帧内预测模式来确定所述角度参数的代码;用于使用所确定的角度参数来生成参考样本的代码;以及用于使用所确定的角度参数和所生成的参考样本来生成帧内预测样本的代码。
还公开了其它方面。
附图说明
现在将参考以下的附图和附录来说明本发明的至少一个实施例,其中:
图1是示出视频编码和解码系统的示意框图;
图2A和2B构成可以实践图1的视频编码和解码系统的其中一个或这两者的通用计算机系统的示意框图;
图3是示出视频编码器的功能模块的示意框图;
图4是示出视频解码器的功能模块的示意框图;
图5A和5B示意性示出用于表示帧数据的色度格式;
图6示意性示出将编码树单位(CTB)子分割成多个编码单位(CU)、预测单位(PU)和变换单位(TU);
图7示意性示出定向帧内预测模式;
图8A示意性示出针对示例的帧内预测方向的帧内预测处理;
图8B示意性示出针对另一示例的帧内预测方向的帧内预测处理;
图9A示意性示出被配置为使用4:2:2色度格式的帧的亮度样本网格上的帧内预测的预测单位(PU);
图9B示意性示出图9A的被配置为使用4:2:2色度格式的帧的色度样本网格上的帧内预测的预测单位(PU);
图10是示出图4的帧内预测模块的功能模块的示意框图;
图11是示出图3的视频编码器或图4的视频解码器中的用于生成帧内预测样本的方法的示意框图;
图12示出用于将帧内预测模式转换成帧内预测角度和反转角度的表,其中对帧内预测角度和反转角度进行了量化;
图13示出用于将帧内预测模式转换成帧内预测角度和反转角度的表,其中对帧内预测角度和反转角度、以及由块类型所确定的水平帧内预测模式和垂直帧内预测模式之间的边界进行了量化;
图14示出用于将帧内预测模式转换成帧内预测角度和反转角度的表,其中对帧内预测角度和反转角度进行了替代量化;
图15示出用于将帧内预测模式转换成帧内预测角度和反转角度的表,其中对帧内预测角度和反转角度、以及由块类型所确定的水平帧内预测模式和垂直帧内预测模式之间的边界进行了替代量化;
附录A示出符合图12的用于生成帧内预测样本的方法的示例;
附录B示出符合图13的用于生成帧内预测样本的方法的示例;
附录C示出符合图14的用于生成帧内预测样本的方法的示例;以及
附录D示出符合图15的用于生成帧内预测样本的方法的示例。
具体实施方式
在任一个或多个附图中参考具有相同附图标记的步骤和/或特征的情况下,除非出现相反意图,否则这些步骤和/或特征为了本说明书的目的而具有相同的功能或操作。
图1是示出视频编码和解码系统100的功能模块的示意框图。系统100可以将使得改进了颜色通道可用的变换逻辑的选择的技术用于残差四叉树变换选择。颜色通道可以包括系统100所支持的所有色度格式所用的任意色度通道。系统100包括源装置110和目的地装置130。通信信道120用于从源装置110向目的地装置130通信编码视频信息。源装置110和目的地装置130分别可以包括移动电话手机,其中在这种情况下,通信信道120是无线信道。可选地,源装置110和目的地装置130可以包括视频会议设备,其中在这种情况下,通信信道120通常是诸如因特网接线等的有线信道。此外,源装置110和目的地装置130可以包括范围宽的任意装置,其中这些装置包括支持空中电视广播的装置、有线电视应用、因特网视频应用以及在一些存储介质或文件服务器上捕获编码视频的应用。
如图1所示,源装置110包括视频源112、视频编码器114和发送器116。视频源112通常包括诸如摄像传感器等的所拍摄视频帧数据的源、存储在非瞬态记录介质上的先前拍摄到的视频序列、或者来自远程摄像传感器的视频提供。可以包括摄像传感器作为视频源112的源装置110的示例包括智能电话、视频摄录机和网络视频照相机等。视频编码器114将来自视频源112的所拍摄帧数据转换成编码视频数据并且以下将参考图3来进一步说明。该编码视频数据通常由发送器116经由通信信道120作为编码视频数据(或“编码视频信息”)进行发送。还可以将该编码视频数据存储在诸如“闪速(Flash)”存储器或硬盘驱动器等的一些存储装置中,直到随后经由通信信道120进行发送为止。
目的地装置130包括接收器132、视频解码器134和显示装置136。接收器132从通信信道120接收编码视频数据并将所接收到的视频数据传递至视频解码器134。然后视频解码器134将解码后的帧数据输出至显示装置136。显示装置136的示例包括诸如智能电话、平板计算机和计算机监视器或者单机型电视机等内的阴极射线管和液晶显示器。还可以将源装置110和目的地装置130各自的功能嵌入单个装置中。
尽管以上说明了示例装置,但源装置110和目的地装置130各自通常经由硬件组件和软件组件的组合可以配置在通用计算系统内。图2A示出如下的这种计算机系统200,其中该计算机系统200包括:计算机模块201;诸如键盘202、鼠标指示器装置203、扫描器226、可被配置为视频源112的照相机227、以及麦克风280等的输入装置;以及包括打印机215、可被配置为显示装置136的显示装置214、以及扬声器217等的输出装置。计算机模块201可以使用外部调制器-解调器(调制解调器)收发器装置216来经由接线221与通信网络220进行通信。可以表示通信信道120的通信网络220可以是广域网(WAN),诸如因特网、蜂窝远程通信网络或私有WAN等。在接线221是电话线的情况下,调制解调器216可以是传统的“拨号上网”调制解调器。可选地,在接线221是高容量(例如,线缆)接线的情况下,调制解调器216可以是宽带调制解调器。还可以使用无线调制解调器来进行向通信网络220的无线连接。收发器装置216可以提供发送器116和接收器132的功能,并且通信信道120可以嵌入接线221中。
计算机模块201通常包括至少一个处理器单元205和存储器单元206。例如,存储器单元206可以具有半导体随机存取存储器(RAM)和半导体只读存储器(ROM)。计算机模块201还包括多个输入/输出(I/O)接口,其中这多个输入/输出(I/O)接口包括:音频-视频接口207,其连接至视频显示器214、扬声器217和麦克风280;I/O接口213,其连接至键盘202、鼠标203、扫描器226、照相机227以及可选的操纵杆或其它人机接口装置(未示出);以及外部调制解调器216和打印机215所用的接口208。在一些实现中,调制解调器216可以内置于计算机模块201内,例如内置于接口208内。计算机模块201还具有本地网络接口211,其中该本地网络接口211允许计算机系统200经由接线223连接至已知为局域网(LAN)的局域通信网络222。如图2A所示,局域通信网络222还可以经由接线224连接至广域网220,其中该局域通信网络222通常包括所谓的“防火墙”装置或具有相似功能的装置。本地网络接口211可以包括以太网(EthernetTM)电路卡、蓝牙(BluetoothTM)无线配置或IEEE802.11无线配置;然而,对于接口211,可以实践多种其它类型的接口。本地网络接口211还可以提供发送器116和接收器132的功能,并且通信信道120也可以嵌入局域通信网络222中。
I/O接口208和213可以提供串行连接和并行连接中的任一个或这两者,其中前者通常根据通用串行总线(USB)标准来实现并且具有相应的USB连接器(未示出)。设置有存储装置209,并且存储装置209通常包括硬盘驱动器(HDD)210。还可以使用诸如软盘驱动器和磁带驱动器(未示出)等的其它存储装置。通常设置有光盘驱动器212以用作数据的非易失性源。可以使用例如光盘(例如,CD-ROM、DVD、蓝光盘(Blu-rayDiscTM))、USB-RAM、便携式外部硬盘驱动器和软盘等的便携式存储器装置作为向计算机系统200的数据的适当源。通常,HDD210、光盘驱动器212、网络220和222中的任意还可被配置为用作视频源112、或者用作为了经由显示器214进行再现所要存储的解码视频数据的目的地。
计算机模块201的组件205~213通常经由互连总线204并且以得到相关领域技术人员已知的计算机系统200的传统操作模式的方式进行通信。例如,处理器205使用接线218连接至系统总线204。同样,存储器206和光盘驱动器212通过接线219连接至系统总线204。可以实践所述配置的计算机的示例包括IBM-PC和兼容机、SunSPARCstation、AppleMacTM或相似的计算机系统。
在适当或期望的情况下,可以使用计算机系统200来实现视频编码器114和视频解码器134以及以下所述的方法,其中可以将视频编码器114和视频解码器134以及要说明的图11的处理作为在计算机系统200内可执行的一个或多个软件应用程序233来实现。特别地,利用在计算机系统200内执行的软件233中的指令231(参见图2B)来实现视频编码器114、视频解码器134和所述方法的步骤。可以将软件指令231形成为各自用于进行一个或多个特定任务的一个或多个代码模块。还可以将软件分割成两个单独部分,其中第一部分和相应的代码模块进行所述方法,并且第二部分和相应的代码模块管理第一部分和用户之间的用户界面。
例如,可以将软件存储在包括以下所述的存储装置的计算机可读介质中。将软件从计算机可读介质载入计算机系统200,然后由计算机系统200来执行。记录有这种软件或计算机程序的计算机可读介质是计算机程序产品。优选地,在计算机系统200中使用该计算机程序产品实现了用于实现视频编码器114、视频解码器134和所述方法的有利设备。
通常将软件233存储在HDD210或存储器206中。将该软件从计算机可读介质载入计算机系统200,并且由计算机系统200来执行。因而,例如,可以将软件233存储在光盘驱动器212所读取的光学可读盘存储介质(例如,CD-ROM)225上。
在一些示例中,将应用程序233以编码在CD-ROM225上并且经由相应的驱动器212进行读取的方式供给至用户,或者可选地,可以由用户从网络220或222读取应用程序233。此外,还可以将软件从其它计算机可读介质载入计算机系统200。计算机可读存储介质是指将所记录的指令和/或数据提供至计算机系统200以供执行和/或处理的任何非瞬态有形存储介质。这种存储介质的示例包括软盘、磁带、CD-ROM、DVD、蓝光盘、硬盘驱动器、ROM或集成电路、USB存储器、磁光盘、或者诸如PCMCIA卡等的计算机可读卡,而与这些装置在计算机模块201的内部还是外部无关。还可以参与将软件、应用程序、指令和/或视频数据或编码视频数据提供至计算机模块401的瞬态或非有形计算机可读传输介质的示例包括:无线电或红外线传输通道及向着其它计算机或联网装置的网络接线、以及包括电子邮件发送和网站上所记录的信息等的因特网或内联网。
可以执行上述的应用程序233的第二部分和相应的代码模块来实现要渲染或呈现在显示器214上的一个或多个图形用户界面(GUI)。通过典型地对键盘202和鼠标203进行操作,计算机系统200的用户和应用程序可以以在功能上可适用的方式对界面进行操作,以将控制命令和/或输入提供至与这些GUI相关联的应用程序。还可以实现在功能上可适用的其它形式的用户界面,诸如利用经由扬声器217所输出的语音提示和经由麦克风280所输入的用户声音命令的音频界面等。
图2B是处理器205和“存储器”234的详细示意框图。存储器234表示图2A中的计算机模块201可以访问的(包括HDD209和半导体存储器206的)所有存储器模块的逻辑聚合。
在初始对计算机模块201通电的情况下,执行上电自检(power-onself-test,POST)程序250。通常将POST程序250存储在图2A的半导体存储器206的ROM249中。有时将诸如存储有软件的ROM249等的硬件装置称为固件。POST程序250检查计算机模块201内的硬件以确保适当工作,并且通常检查处理器205、存储器234(209,206)和通常还存储在ROM249中的基本输入-输出系统软件(BIOS)模块251,以进行正确操作。一旦POST程序250成功运行,BIOS251启动图2A的硬盘驱动器210。启动硬盘驱动器210使得经由处理器205执行驻留在硬盘驱动器210上的引导装入程序252。这样将操作系统253载入RAM存储器206,其中在该RAM存储器206上,操作系统253开始工作。操作系统253是处理器205可执行的系统级应用程序,以实现包括处理器管理、存储器管理、装置管理、存储管理、软件应用程序接口和通用用户界面等的各种高级功能。
操作系统253管理存储器234(209,206),以确保计算机模块201上运行的各处理或应用程序具有在不会与分配至其它处理的内存冲突的情况下执行的充足内存。此外,必须适当使用图2A的计算机系统200中可用的不同类型的存储器,以使得各处理可以高效地运行。因此,聚合存储器234并不意图例示如何分配存储器的特定区段(除非另外说明),而是提供计算机系统200可访问的存储器的概述图以及如何使用该存储器。
如图2B所示,处理器205包括多个功能模块,其中这多个功能模块包括控制单元239、运算逻辑单元(ALU)240和有时称为高速缓冲存储器的本地或内部存储器248。高速缓冲存储器248在寄存器区段中通常包括多个存储寄存器244~246。一个或多个内部总线241从功能上使这些功能模块相互连接。处理器205通常还具有用于使用接线218来经由系统总线204与外部装置进行通信的一个或多个接口242。存储器234使用接线219连接至总线204。
应用程序233包括可以包含条件分支指令和循环指令的指令序列231。程序233还可以包括执行程序233时所使用的数据232。将指令231和数据232分别存储在存储器位置228、229、230和235、236、237中。根据指令231和存储器位置228~230的相对大小,如存储器位置230中示出的指令所描述的,可以将特定指令存储在单个存储器位置中。可选地,如存储器位置228和229中示出的指令段所描述的,可以将指令分割成各自被存储在单独的存储器位置的多个部分。
通常,向处理器205赋予一组指令,其中在该处理器205内执行该组指令。处理器205等待下一输入,其中处理器205通过执行另一组指令来对该下一输入作出反应。可以从多个源中的一个或多个源提供各输入,其中该输入包括一个或多个输入装置202、203所生成的数据、从外部源经由网络220、202其中之一所接收到的数据、从存储装置206、209其中之一所检索到的数据或者从插入相应的读取器212内的存储介质225所检索到的数据(所有这些均在图2A中示出)。执行一组指令在一些情况下可能会导致输出数据。执行还可能涉及将数据或变量存储至存储器234。
视频编码器114、视频解码器134和所述方法可以使用存储器234内的相应存储器位置255、256、257中所存储的输入变量254。视频编码器114、视频解码器134和所述方法产生存储器234内的相应存储器位置262、263、264中所存储的输出变量261。可以将中间变量258存储在存储器位置259、260、266和267中。
参考图2B的处理器205,寄存器244、245、246、运算逻辑单元(ALU)240和控制单元239一起工作以进行微操作序列,其中这些微操作序列是针对构成程序233的指令集中的每个指令进行“提取、解码和执行”周期所需的。各提取、解码和执行周期包括以下操作:
(a)提取操作,用于从存储器位置228、229、230提取或读取指令231;
(b)解码操作,其中在该解码操作中,控制单元239判断提取了哪个指令;以及
(c)执行操作,其中在该执行操作中,控制单元239和/或ALU240执行该指令。
之后,可以执行针对下一指令的进一步提取、解码和执行周期。同样,可以进行存储周期,其中在该存储周期中,控制单元239将值存储至或写入存储器位置232。
要说明的图11的处理中的各步骤或子处理与程序233的一个或多个区段相关联,并且通常通过处理器205中的寄存器部244、245、247、ALU240和控制单元239一起工作以针对程序233的所述区段的指令集中的每个指令进行提取、解码和执行周期,来进行该步骤或子处理。
图3是示出视频编码器114的功能模块的示意框图。图4是示出视频解码器134的功能模块的示意框图。如图2A和2B所示,可以使用通用计算机系统200来实现视频编码器114和视频解码器134,其中可以利用计算机系统200内的专用硬件、利用计算机系统200内可执行的软件(诸如驻留在硬盘驱动器205上并且由处理器205控制其执行的软件应用程序233的一个或多个软件代码模块等)、或者可选地由计算机系统200内可执行的专用硬件和软件的组合来实现各种功能模块。可选地,可以在诸如进行所述方法的功能或子功能的一个或多个集成电路等的专用硬件中实现视频编码器114、视频解码器134和所述方法。这种专用硬件可以包括图形处理器、数字信号处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者一个或多个微处理器和关联存储器。特别地,视频编码器114包括模块320~346,并且视频解码器134包括模块420~434,其中这些模块各自可被实现为软件应用程序233的一个或多个软件代码模块。
尽管图3的视频编码器114是高效率视频编码(HEVC)视频编码流水线的示例,但还可以使用其它视频编解码器来进行这里所述的处理阶段。视频编码器114接收诸如一系列帧(各帧包括一个或多个颜色通道)等的所拍摄帧数据。各帧针对各颜色通道包括一个样本网格。使用诸如推荐ITU-RBT.709(“YUV”)等的“颜色空间”来表示颜色信息,尽管其它颜色空间也是可以的。在使用诸如YUV颜色空间的颜色空间的情况下,颜色通道包括亮度颜色通道(“Y”)和两个色度颜色通道(“U”和“V”)。此外,根据图像的采样或者通过应用滤波以对所拍摄帧数据进行重采样,在所拍摄帧数据的各颜色通道的样本网格中可能包括不同的信息量。存在已知为“色度格式”的若干可能的采样方法,其中将参考图5A和5B来说明这些采样方法中的一些方法。
视频编码器114将诸如帧数据310等的所拍摄帧数据的各帧分割成通常被称为“编码树块”(CTB)的区域。各编码树块(CTB)包括将帧的一部分子分割成“编码单位”(CU)的集合的层级四叉树子分割。编码树块(CTB)通常占据64×64个亮度样本的区域,尽管诸如16×16或32×32等的其它大小也是可以的。在一些情况下,可以使用诸如128×128个亮度样本等的编码树块(CTB)所用的甚至更大的大小。可以通过分割将编码树块(CTB)子分割成四个大小相等的区域以创建新的层级。可以递归地应用分割,从而得到四叉树层级。由于编码树块(CTB)的边尺寸始终是2的幂并且四叉树分割始终使宽度和高度减半,因此区域的边尺寸也始终为2的幂。在不进行区域的进一步分割的情况下,认为在该区域内存在“编码单位”(CU)。在编码树块的顶级(或者通常为“最高级”)不进行分割的情况下,占据整个编码树块的区域包含通常被称为“最大编码单位”(LCU)的一个编码单位(CU)。针对各编码单位还存在诸如被8×8个亮度样本所占据的区域等的最小大小,尽管其它最小大小也是可以的。通常将最小大小的编码单位称为“最小编码单位”(SCU)。作为该四叉树层级的结果,编码树块(CTB)整体被一个或多个编码单位(CU)所占据。
视频编码器114针对各编码单位(CU)产生通常被称为“预测单位”(PU)的数据样本的一个或多个阵列。各编码单位(CU)中的预测单位(PU)的各种配置均是可以的,其中要求是预测单位(PU)没有重叠并且编码单位(CU)整体被一个或多个预测单位(PU)所占据。预测单位(PU)没有重叠并且编码单位(CU)整体被一个或多个预测单位(PU)所占据这一要求确保了预测单位(PU)覆盖整个帧区域。
视频编码器114通过从多路复用器模块340输出预测单位(PU)382来进行工作。差模块344输出预测单位(PU)382和来自帧数据310的编码树块(CTB)的编码单位(CU)的空间域内的数据样本的相应2D阵列之间的差,其中该差已知为“残差样本阵列”360。在变换模块320中可以将该残差样本阵列360变换成频域。来自差模块344的残差样本阵列360被变换模块320接收到,其中该变换模块320通过应用“正变换”将残差样本阵列360从空间表示转换(或“编码”)为频域表示。变换模块320创建变换系数。变换系数在编码单位(CU)的层级子分割中被配置为针对变换单位(TU)的各变换的残差变换阵列362。将编码单位(CU)子分割成一个或多个变换单位(TU)。可以将子分割后的编码单位(CU)称为“残差四叉树”或“残差四叉树(RQT)”。编码单位(CU)的残差数据向残差四叉树(RQT)的子分割是在变换控制模块346的控制下所进行的。
变换控制模块346可以根据“率失真标准”针对当前的编码单位(CU)的残差四叉树中的变换单位(TU)的各种可能配置测试编码位流312中所需的位率。率失真标准是编码位流312的位率或其局部区域与帧缓冲器332中所存储的帧和所拍摄帧数据间的失真或差之间的可接受权衡的度量。在一些配置中,率失真标准仅考虑亮度的率和失真,因而编码决定仅基于亮度通道的特性来进行。通常,残差四叉树(RQT)在亮度和色度之间是共用的,并且色度信息的量与亮度相比相对较小,因而在率失真标准中仅考虑亮度是适当的。在仅需进行色度特有的决定的情况下,率失真标准可以扩展至考虑色度位成本和率成本,或者可选地,基于针对亮度的率失真标准决定,可以引入规则或“启发法”以根据色度作出合理决定。因而,变换控制模块346可以选择变换单位(TU)的配置作为残差四叉树。所选择的配置被配置为根据一组可能的变换单位(TU)来对当前的编码单位(CU)的残差样本阵列360进行编码。利用一组分割变换标志386来指定编码单位(CU)的残差四叉树(RQT)的结构。以下将参考图5A和5B来进一步论述残差四叉树(RQT)。
残差四叉树的一组可能的变换单位(TU)依赖于可用的变换大小和编码单位(CU)大小。残差四叉树可以得到编码位流312的较低位率,由此实现更高的编码效率。较大大小的变换单位(TU)得到将较大的变换用于亮度和色度这两者。通常,较大的变换提供残差样本阵列的样本数据(或“残差能量”)分散在该残差样本阵列内的更紧凑表示。较小的变换单位(TU)提供残差样本阵列的残差能量局限于该残差样本阵列的特定区域的更紧凑表示。因而,残差四叉树的许多可能结构提供用于在开发中的高效率视频编码(HEVC)标准中实现残差样本阵列360的高编码效率的有用方式。
对于开发中的高效率视频编码(HEVC)标准,使用改进的离散余弦变换(DCT)来实现残差样本阵列360向频域表示的转换,其中修改DCT以使用偏移和相加来实现。根据所支持的变换大小,残差样本阵列360和变换系数362的各种大小均是可以的。在开发中的高效率视频编码(HEVC)标准中,针对具有诸如32×32、16×16、8×8和4×4等的大小的数据样本的2D阵列进行变换。因而,视频编码器114可利用变换大小的预定集合。此外,变换大小的集合在亮度通道和色度通道之间可能有所不同。
二维变换通常被配置为“可分离的”,从而能够实现为沿一个方向(例如,沿着行)在数据样本的2D阵列上进行工作的1D变换的第一集合。在该1D变换的第一集合之后是沿另一方向(例如,沿着列)在从1D变换的第一集合输出的数据样本的2D阵列上进行工作的1D变换的第二集合。通常将宽度和高度相同的变换称为“正方形变换”。还可以使用宽度和高度不同的附加变换,并且这些附加变换通常被称为“非正方形变换”。可以将行方向和列方向的一维变换组合到诸如4×4变换模块或8×8变换模块等的特定硬件或软件模块中。
尽管可能并不经常使用维度更大的变换,但这些更大维度的变换需要实现更大量的电路。因此,开发中的高效率视频编码(HEVC)标准定义32×32个亮度样本的最大变换大小。针对开发中的高效率视频编码(HEVC)标准所定义的变换实现的集成性还引入了优先减少所支持的非正方形变换大小的数量。非正方形变换大小通常需要针对各非正方形变换实现全新的硬件、或者需要附加选择逻辑以使得能够将各种1D变换逻辑重配置成特定非正方形变换大小。另外,非正方形变换大小通过引入附加方法以针对所支持的各非正方形变换大小进行变换和逆变换、并且增加复杂度以实现附加变换大小的所需缓冲器管理功能,还可能增加了软件实现的复杂度。
向亮度通道和色度通道这两者应用变换。针对变换单位(TU)在亮度通道和色度通道的处理之间存在差异,并且以下将参考图5A和5B来进行论述。各残差四叉树占据一个编码单位(CU),并且被定义为编码单位(CU)向着在残差四叉树层级的各叶节点处包含一个变换单位(TU)的层级的四叉树分解,其中各变换单位(TU)能够利用所支持的变换大小的特定变换。与编码树块(CTB)相似,需要编码单位(CU)整体被一个或多个变换单位(TU)占据。在残差四叉树层级的各等级处,“编码块标志值”用信号通知(在不存在进一步分割的情况下)在当前层级等级中在各颜色通道中可能存在变换,或者用信号通知较低层级可能包含由此得到的变换单位(TU)中的至少一个变换。在编码块标志值为0的情况下,已知当前或较低的层级等级处的所有残差系数为零,因而针对残差四叉树的(当前层级等级或较低层级等级)的任何变换单位(TU)的相应颜色通道,均无需进行变换。在编码块标志值为1的情况下,如果不对当前区域进行进一步子分割,则区域包含需要至少一个非零残差系数的变换。如果对当前区域进行进一步子分割,则编码块标志值为1表示如此得到的各子分割区域可以包括非零残差系数。这样,针对各颜色通道,0个或更多个变换可以覆盖从无直至编码单位(CU)整体的编码单位(CU)的区域的一部分。针对各颜色通道存在单独的编码块标志值。由于存在仅具有一个可能的编码块标志值的情况,因此无需对各编码块标志值进行编码。
然后将变换系数362输入至缩放和量化模块322,其中在该缩放和量化模块322中,根据所确定的量化参数384对变换系数362的数据样本值进行缩放和量化以产生残差数据阵列364。根据所确定的量化参数384的值,该缩放和量化导致精度损失。所确定的量化参数384的值越高导致从残差系数中丢失的信息越多。丢失后的信息以降低来自视频解码器134的输出的可视质量为代价提高了视频编码器114所实现的压缩。所确定的量化参数384可以在对帧数据310的各帧进行编码期间改变。可选地,所确定的量化参数384可以针对帧数据310的一部分固定。在另一替代例中,所确定的量化参数384可以针对帧数据310的整个帧固定。所确定的量化参数384的其它改变也是可以的,诸如以单独值量化不同的残差系数等。
将残差数据阵列364和所确定的量化参数384视为向着逆缩放模块326的输入。逆缩放模块326反转缩放和量化模块322所进行的缩放以产生作为残差数据阵列364的重新缩放版本的重新缩放数据阵列366。还将残差数据阵列364、所确定的量化参数384和分割变换标志386视为向着熵编码器模块324的输入。熵编码器模块324将残差数据阵列364的值编码在编码位流312(或“视频位流”)中。由于缩放和量化模块322所引起的精度损失,因此重新缩放数据阵列366与阵列363中的原始值不相同。然后将来自逆缩放模块326的重新缩放数据阵列366输出至逆变换模块328。逆变换模块328进行从频域向着空间域的逆变换,以产生重新缩放变换系数阵列366的空间域表示368。空间域表示368与视频解码器134处所产生的空间域表示大致相同。然后,将空间域表示368输入至求和模块342。
运动估计模块338通过将帧数据310与来自(通常配置在存储器206内的)帧缓冲器模块332中所存储的帧的一个或多个集合中的先前帧数据进行比较,来产生运动矢量374。帧的这些集合已知为“参考图片列表”。然后将这些运动矢量374输入至运动补偿模块334,其中该运动补偿模块334考虑到源自于运动矢量374的空间偏移,通过对帧缓冲器模块332中所存储的数据样本进行滤波来产生帧间预测的预测单位(PU)376。尽管图3没有示出,但也将运动矢量374作为句法元素传递至熵编码器模块324以编码在编码位流312中。帧内预测模块336使用从求和模块342获得的样本370来产生帧内预测的预测单位(PU)378,其中该求和模块342对来自多路复用器模块340的预测单位(PU)382和多路复用器369的空间域输出进行求和。帧内预测模块336还产生帧内预测模式380,其中该帧内预测模式380被发送至熵编码器324以编码在编码位流312中。
可以使用帧内预测或帧间预测方法来生成预测单位(PU)。帧内预测方法利用与先前进行了解码的预测单位(PU)邻接(通常位于该预测单位的上方和左方)的数据样本,从而在该预测单位(PU)内生成参考数据样本。被称为“帧内预测模式”的各种方向的帧内预测都是可以的。帧间预测方法利用运动矢量以参考来自所选择的参考帧中的块。运动估计模块338和运动补偿模块334在精度为亮度样本的八分之一(1/8)的运动矢量372上进行工作,从而使得能够进行帧数据310中的帧之间的运动的精确建模。根据由此得到的编码位流312的期望位率和由于帧内预测或帧间预测方法而引入的图像质量失真量之间的率失真权衡来判断使用帧内预测和帧间预测方法中的哪个方法。如果使用帧内预测,则还根据率失真权衡来从一组可能的帧内预测模式中选择一个帧内预测模式。多路复用器模块340根据通过率失真算法所作出的决定,来选择来自帧内预测模块336的帧内预测的参考样本378或来自运动补偿块334的帧间预测的预测单位(PU)376。
求和模块342产生总和370,其中将该总和370输入至去块滤波器模块330。去块滤波器模块330沿着块边界进行滤波,从而产生写入存储器206内所配置的帧缓冲器模块332的去块样本372。帧缓冲器模块332是具有用以保持来自一个或多个过去帧的数据作为参考图片列表的一部分以供将来参考的充足容量的缓冲器。
对于开发中的高效率视频编码(HEVC)标准,将熵编码器324所产生的编码位流312描绘成网络抽象层(NAL)单位。通常,帧的各片包含在一个NAL单位中。熵编码器324通过进行上下文自适应二进制算术编码(CABAC)算法将统称为“句法元素”的残差数据阵列364、帧内预测模式380、运动矢量和其它参数编码在编码位流312中。将句法元素一起组成“句法结构”。分组可以包含用以描述层级结构的递归。除诸如帧内预测模式等的序数值或者诸如运动矢量等的整数值以外,句法元素例如还包括用以表示四叉树分割的标志。
尽管参考高效率视频编码(HEVC)视频解码流水线来描述图4的视频解码器134,但其它的视频编解码器也可以采用模块420~434的处理阶段。还可以从存储器206、硬盘驱动器210、CD-ROM、蓝光(Blu-rayTM)盘或其它计算机可读存储介质读取编码视频信息。可选地,可以从诸如连接至通信网络220的服务器或射频接收器等的外部源接收编码视频信息。
如从图4看出,将诸如编码位流312等的所接收到的视频数据输入至视频解码器134。可以从存储器206、硬盘驱动器210、CD-ROM、蓝光(Blu-rayTM)盘或其它计算机可读存储介质读取编码位流312。可选地,可以从诸如连接至通信网络220的服务器或射频接收器等的外部源来接收编码位流312。编码位流312包含表示要解码的所拍摄帧数据的编码句法元素。
将编码位流312输入至熵解码器模块420,其中该熵解码器模块420从编码位流312中提取句法元素,并且将这些句法元素的值传递至视频解码器134中的其它块。熵解码器模块420应用上下文自适应二进制算术编码(CABAC)算法以从编码位流312解码句法元素。使用解码后的句法元素来在视频解码器134内重建参数。参数包括零以上的残差数据阵列450、运动矢量452、预测模式454和分割变换标志468。将残差数据阵列450传递至逆缩放模块421,将运动矢量452传递至运动补偿模块434,并且将预测模式454传递至帧内预测模块426和多路复用器428。逆缩放模块421对残差系数数据进行逆缩放以创建采用变换系数的形式的重建数据455。逆缩放模块421将重建数据455输出至逆变换模块422。逆变换模块422应用“逆变换”以将重建数据455(即,变换系数)从频域表示转换(或“解码”)为空间域表示,从而经由多路复用器模块423输出残差样本阵列456。逆变换模块422进行与逆变换模块328相同的操作。逆变换模块422被配置为根据分割变换标志468所指定的残差四叉树来进行变换。逆变换模块422所进行的变换是从对符合开发中的高效率视频编码(HEVC)标准的编码位流312进行解码所需的变换大小的预定集合中所选择的。
运动补偿模块434将来自熵解码器模块420的运动矢量452与来自存储器206内所配置的帧缓冲器块432的参考帧数据460相组合使用,以产生作为输出解码帧数据的预测的针对预测单位(PU)的帧间预测的预测单位(PU)462。在预测模式454表示使用帧内预测对当前编码单位进行编码的情况下,帧内预测模块426使用在空间上邻接预测单位(PU)的样本和还由预测模式454供给的预测方向来产生针对预测单位(PU)的帧内预测的预测单位(PU)464。根据从求和模块424输出的总和458来获得在空间上邻接的样本。多路复用器模块428根据当前预测模式454来选择针对预测单位(PU)466的帧内预测的预测单位(PU)464或帧间预测的预测单位(PU)462。利用求和模块424将从多路复用器模块428输出的预测单位(PU)466与来自逆缩放和变换模块422的残差样本阵列456相加,以产生总和458,然后将该总和458分别输入至去块滤波器模块430和帧内预测模块426。去块滤波器模块430沿着诸如变换单位(TU)边界等的数据块边界进行滤波以使可见的伪影平滑化。将去块滤波器模块430的输出写入存储器206内所配置的帧缓冲器模块432。帧缓冲器模块432提供用以保持一个或多个解码帧以供将来参考的充足存储量。还将解码帧412从帧缓冲器模块432输出至诸如显示装置136(例如,采用显示装置214的形式)等的显示装置。
图5A示出使用4:2:0色度格式进行编码后的帧部分500的样本网格。图5B示出使用4:2:2色度格式进行编码后的帧部分510。将色度格式作为配置参数指定到视频编码器114,并且视频编码器114将“chroma_format_idc”句法元素编码到指定该色度格式的编码位流312中。视频解码器134从编码位流312解码“chroma_format_idc”句法元素以确定使用中的色度格式。例如,在4:2:0色度格式在使用中的情况下,chroma_format_idc的值为一(1),在4:2:2色度格式在使用中的情况下,chroma_format_idc的值为二(2),并且在4:4:4色度格式在使用中的情况下,chroma_format_idc的值为三(3)。在图5A和5B中,使用“×”符号来例示诸如亮度样本位置501等的亮度样本位置,并且使用“○”符号来例示诸如色度样本位置502等的色度样本位置。通过在所示出的点处对帧部分500进行采样,在应用4:2:0色度格式的情况下,针对各颜色通道获得样本网格。在各亮度样本位置×处,对亮度通道(“Y”)进行采样,并且在各色度样本位置○处,对色度通道(“U”和“V”)这两者进行采样。如图5A所示,针对各色度样本位置,存在亮度样本位置的2×2排列。
通过对帧部分510中所示出的亮度样本位置处的亮度样本和色度样本位置处的色度样本进行采样,在应用4:2:2色度格式的情况下,针对各颜色通道获得样本网格。针对帧部分510进行与针对帧部分500相同的数据样本向颜色通道的分配。与帧部分500相反,在帧部分510中存在两倍多的色度样本位置。在帧部分510中,色度样本位置每隔一个亮度样本位置进行配置。因此,在图5B中,针对各色度样本位置,存在2×1亮度样本位置的排列。
以上以亮度样本为单位说明了变换单位的各种容许尺寸。因而,通过针对亮度通道应用的变换所覆盖的区域将具有与变换单位尺寸相同的尺寸。由于变换单位还对色度通道进行编码,因此针对各色度通道所应用的变换将具有根据使用中的特定色度格式而改变的尺寸。例如,在4:2:0色度格式在使用中的情况下,16×16变换单位(TU)将针对亮度通道使用16×16变换并且针对各色度通道将使用8×8变换。
“残差四叉树”(RQT)定义从“根节点”开始的层级,从而覆盖包含该层级的各“叶节点”处的一个或多个变换单位(TU)的区域。在非叶节点处,采用已知为“四叉树分割”的分割来将该区域分割成四个大小相等的“子区域”。各变换单位(TU)具有通常被描述为包含变换单位(TU)的区域在亮度样本网格上的尺寸的关联大小(或“变换大小”),尽管该区域还可被描述为在色度样本网格上的尺寸。该大小依赖于编码单位(CU)大小和变换深度。变换深度为零的变换单位(TU)的大小等于相应的编码单位(CU)的大小。变换深度的各递增使得存在于残差四叉树中的给定变换深度处的变换单位(TU)的尺寸(即,边宽度和高度)减半。由于帧包括亮度通道和色度通道,因此编码单位(CU)占据亮度样本网格和色度样本网格这两者上的区域,因而各变换单位(TU)包括描述亮度样本网格上的亮度样本和色度样本网格上的色度样本这两者的信息。各变换单位(TU)的信息的性质依赖于视频编码器114或视频解码器134的处理阶段。在向变换模块320的输入以及逆缩放和变换模块422的输出处,残差样本阵列360和456分别包含空间域中的各变换单位(TU)的信息。由于亮度通道和色度通道之间的处理差异,因而可以将残差样本阵列360和456进一步分割成“色度残差样本阵列”和“亮度残差样本阵列”。在来自缩放和量化模块322的输出以及逆缩放和变换模块422的输入处,残差数据阵列364和450分别包含频域中的各变换单位(TU)的信息。由于亮度通道和色度通道之间的处理差异,因而可以将残差阵列364和450进一步分割成“色度残差数据阵列”和“亮度残差数据阵列”。
图6示意性示出将编码树块(CTB)602子分割成多个编码单位(CU)、预测单位(PU)和变换单位(TU)。四叉树层级描述将诸如编码树块(CTB)602等的编码树块(CTB)分割成一个或多个编码单位(CU)。该四叉树层级由编码位流312中所存在的一个或多个“分割编码单位标志”(或“split_cu_flag”句法元素)来定义。
在图6中,将编码树块(CTB)602分割成大小相等的正方形区域,其中没有进一步对这些正方形区域各自进行子分割。结果,编码树块(CTB)602包含诸如编码单位(CU)604等的四个编码单位(CU)。各编码单位(CU)包括一个或多个预测单位(PU)以及一个或多个变换单位(TU)。
编码单位(CU)向一个或多个预测单位(PU)的分解被称为“分区”,并且通常由编码位流312中所存在的“分区模式”(或“part_mode”句法元素)来指定。该分区模式可以指定单个预测单位(PU)占据整个编码单位(CU)、或者多个非重叠预测单位(PU)占据整个编码单位(CU)。例如,如从图6看出,编码单位(CU)604包括将编码单位(CU)604的区域分割成诸如预测单位(PU)608等的四个正方形预测单位(PU)的分区606。
各帧内预测的预测单位(PU)具有运动矢量并且各帧内预测的预测单位(PU)具有方向。结果,由于不同的运动矢量、方向或者不同的运动矢量和方向的组合,因此在邻接的预测单位(PU)之间的边界处有可能存在视觉不连续。对于给定分区,如此得到的一个或多个预测单位(PU)或者全部经过了帧内预测或者全部经过了帧间预测、而不是经过了帧内预测和帧间预测的组合。
编码单位(CU)向一个或多个变换单位(TU)的分解是被称为“残差四叉树”(RQT)的四叉树分解。残差四叉树(RQT)通常由编码位流312中所存在的一个或多个“分割变换标志”(或“split_transform_flag”句法元素)来指定。例如,编码单位(CU)604包括将编码单位(CU)604的区域分割成四个大小相等的区域的残差四叉树(RQT)610。没有进一步对这四个大小相等的区域各自进行子分割,从而得到诸如变换单位(TU)612等的四个变换单位(TU)。各变换单位(TU)包括针对亮度通道和针对各色度通道的变换。在视频编码器114和视频解码器134是针对4:2:0色度格式所配置的情况下,针对亮度通道和针对各色度通道的变换边界(或“边缘”)与变换单位(TU)边界对准。作为对比,在视频编码器114和视频解码器134是针对4:2:2色度格式所配置的并且针对各色度通道使用正方形变换的情况下,针对各色度通道存在附加变换边界。在变换的边界处,可能看到不连续。这些不连续导致解码帧412的感知质量与帧数据310相比下降。缩放和量化块322以及逆缩放模块421所应用的量化参数在变换单位(TU)之间可能发生改变。因此,在空间上邻接的变换可能应用了不同的量化参数。通常,由于变换块边缘伪影增加,因此应用于邻接变换的量化参数和这些量化参数的差异越大会导致视觉质量越差。
开发中的高效率视频编码(HEVC)标准定义三十五(35)个帧内预测模式。在这三十五(35)个帧内预测模式中,一个帧内预测模式已知为“DC”模式,一个帧内预测模式为“平面”模式,并且三十三(33)个帧内预测模式已知为定向模式。
图7示意性示出所有的定向(或“角度”)帧内预测模式。在图7中使用箭头示出诸如帧内预测方向704等的三十三个可能的帧内预测方向各自。各个帧内预测方向还列举了诸如与帧内预测方向704相对应的在图7中标记为702的帧内预测模式二(2)等的帧内预测模式。定向帧内预测模式分配有帧内预测模式二(2)~三十四(34)。针对DC模式和平面模式预约帧内预测模式零(0)和一(1)。尽管图7的箭头全部示出从中心点发出的帧内预测方向,但帧内预测的实际“方向”是相反的、即从图7所示的方向起转动了一百八十(180)度。帧内预测的方向由于如下的所述帧内预测方法1100而转动了一百八十(180)度,其中该帧内预测方法1100取预测单位(PU)的(位于上方和左方的)参考样本,并且使用这些参考样本来创建占据预测单位(PU)的各样本的纹理。图7所示的发生转动的方向是为了在一幅图中例示三十三个帧内预测方向各自时提供清晰而示出的。帧内预测模式二(2)~十七(17)主要在水平方向上,并且已知为水平帧内预测模式712。帧内预测模式十八(18)~三十四(34)主要在垂直方向上,并且已知为垂直帧内预测模式710。可以认为存在将水平帧内预测模式712与垂直帧内预测模式710分开的阈值。注意,帧内预测模式十八(18)与45度的角度相对应,因而不是占主导的水平方向或垂直方向。然而,按照惯例,在高效率视频编码(HEVC)标准中,帧内预测模式十八(18)被视为在垂直方向占主导的范畴中。将帧内预测模式十八(18)视为在垂直方向占主导范畴中是不会对预测样本产生影响的任意选择,这是因为与垂直或水平范畴无关地,帧内预测模式十八(18)的角度参数和反转角度的相应值将产生相同的预测样本。利用角度参数(或“intraPredangle”)来指定各角度。
角度参数是负三十二(-32)~正三十二(+32)的整数。角度参数可被解释为沿着针对垂直帧内预测模式的横轴或针对水平帧内预测模式的纵轴的偏移。例如,角度参数706具有值30,并且沿着包括所有的水平帧内预测模式712的纵轴而存在。如图7所示,帧内预测模式2的角度参数为三十二(32)。在两个轴之间存在对称,并且在各轴内,在正角度参数和负角度参数之间存在对称。这两个对称使得能够简化硬件实现和软件实现。作为这些对称的结果,可以使用角度参数的缩小集合[0,2,5,9,13,17,21,26,32]来合成在所有的水平帧内预测模式和垂直帧内预测模式内所使用的所有范围的角度参数。
以下将参考图11来详细说明视频编码器114或视频解码器134中的用于生成帧内预测样本的方法1100。图8A示意性示出如视频编码器114中的帧内预测模块336或视频解码器134中的帧内预测模块426所进行的、针对示例帧内预测方向的帧内预测方法1100。帧内预测方法1100用于利用预测样本来填充诸如预测单位(PU)802等的预测单位(PU),并且以下将进行详细说明。预测样本是使用参考样本所生成的。在图8A中,参考样本包括“上方”参考样本804、“左方”参考样本806和“左上方”参考样本808(统称为“参考样本”)。左上方参考样本808通常包括在上方参考样本804和左方参考样本806这两者中。上方参考样本804、左方参考样本806和左上方参考样本808通常是从视频编码器114中的总和370或者视频解码器134中的总和458所获得的。总和370和总和485通常输出帧的先前解码样本。通常利用“邻接样本”来填充上方参考样本804、左方参考样本806和左上方参考样本808。邻接样本是从总和370或者总和458所获得的,并且根据图8A所示的参考样本的定位来相对于预测单位(PU)802在空间上进行配置。根据预测单位(PU)802在帧中以及在该帧中的先前解码后的预测单位(PU)上的位置,可能并非所有的邻接样本都是可用的。对于不可用的邻接样本,作为代替,可以利用默认样本值来填充参考样本内的相应样本。这些默认样本值可以是根据可用的其它邻接样本所确定的、或者各自可以是恒定值。
定向帧内预测模式具有预测样本将是具有特定方向的并且是根据诸如参考样本804等的参考样本所确定的纹理。在选择定向帧内预测模式的情况下,将来自参考样本缓冲器的样本以横跨方式沿着帧内预测的方向复制到预测单位(PU)中。例如,帧内预测方向810使得针对预测单位(PU)802产生具有右上方向的纹理。该纹理是通过沿着帧内预测的方向横跨预测单位(PU)802复制参考样本内的诸如参考样本812等的各参考样本所产生的,这样使得向预测样本(例如,预测样本814)分配了与相应的参考样本相对应的值。为了清楚,图8A仅示出几个参考样本和预测样本之间的关系,然而生成了预测单位(PU)中的所有预测样本。由于支持三十三(33)个定向帧内预测模式的细粒度,因此需要对预测单位内的样本值进行插值以产生平滑纹理。平滑纹理使得针对相应的变换单位(TU)需要较小的残差,因而得到较大的编码效率。帧内预测处理由视频编码器114和视频解码器134这两者来进行。视频编码器114从一组帧内预测模式中选择针对预测单位(PU)的一个帧内预测模式,并且将所选择的帧内预测模式编码到编码位流312中。视频编码器114可以在所有可能的帧内预测模式中进行搜索以实现最高编码效率、或者可以在可能的帧内预测模式的子集中进行搜索,从而以损害编码效率为代价来选择减少时间量。视频编码器114使用熵编码器324来将所选择的帧内预测模式编码在编码位流312中。视频解码器134使用熵解码器420来根据编码位流312确定所选择的帧内预测模式。
对于帧内预测模式二十六(26)~三十四(34),仅需要上方参考样本(例如,804)。对于帧内预测模式二(2)~十(10),仅需要左方参考样本(例如,806)。对于帧内预测模式十一(11)~二十五(25),需要上方参考样本(例如,804)和左方参考样本(例如,806)这两者。对于帧内预测模式十一(11)~二十五(25),定义命名为“反转角度”或“invAngle”的附加参数。对于垂直方向占主导的帧内预测模式,反转角度控制左方参考样本的填充,并且对于水平方向占主导的帧内预测模式,反转角度控制上方参考样本的填充(例如,804)。在定义反转角度的情况下,反转角度的值分别是针对帧内预测模式十一~二十五的[-4096,-1638,-910,-630,-482,-390,-315,-256,-315,-390,-482,-630,-910,-1638,-4096]其中之一。从反转角度值的列表可看到帧内预测模式十八(18)处的对称。实现可以使用该对称来降低复杂度。期望降低复杂度,其中这种复杂度的降低在编码效率方面引入可忽略的损失(或并未引入损失)。此外,尽管反转角度值的范围为-256~-4096,但仅定义八(8)个离散值。反转角度用于通过改变访问各个邻接样本的间距,来控制利用邻接样本向参考样本缓冲器的填充。在确定用于访问各邻接样本的偏移的情况下,向反转角度应用八(8)个位的右移。由于此,反转角度值-256得到利用邻接样本来填充参考样本。反转角度值-4096得到利用每第十六个邻接样本来填充参考样本。
对于占主导的垂直帧内预测模式,填充左方参考样本,仿佛左方参考样本是上方参考样本的延伸一样,其中将左方邻接样本沿帧内预测的相反方向(即,图8所示的方向)投影到上方参考样本的延长线上。对于占主导的水平帧内预测模式,填充上方参考样本,仿佛上方参考样本是左方参考样本的延伸一样,其中将上方邻接样本沿帧内预测的相反方向(即,图8A所示的方向)投影到左方参考样本的延长线上。
图8B示意性示出针对使用反转角度来填充上方参考样本的示例帧内预测方向822的帧内预测方法1100。在图8B的示例中,帧内预测方向822是水平方向占主导的帧内预测方向,但具有右下方向(例如,图7的帧内预测模式十四(14))。使用诸如上方邻接样本816等的上方邻接样本820来根据反转角度填充上方参考样本804(例如,上方参考样本818)。反转角度值依赖于帧内预测模式,并且对于帧内预测模式十四(14),反转角度值将为-630。对于该反转角度,将在上方参考样本804中填充上方邻接样本820中的每第二个或第三个上方邻接样本。
图9A和9B示意性示出使用4:2:2色度格式的视频数据中的帧的亮度样本网格900和色度样本网格910各自上的帧内预测的预测单位(PU)901。在亮度样本网格900上,如图9A的箭头所示,预测单位(PU)901占据8×8的样本区域并且帧内预测模式是十八(18),从而得到角度参数为负三十二(-32)。在亮度样本网格900上,该角度参数得到有效角度为四十五(45)度。然而,在色度样本网格900上,相同的角度参数得到该有效角度水平伸展为二十二点五(22.5)度。该水平伸展是由于色度样本网格910上的各色度样本的1×2的大小所引起的。
给定角度参数跨亮度样本网格900和色度样本网格910的有效角度之间的差异导致编码效率降低。由于视频数据经常包括跨亮度通道和色度通道而相互关联的特征并且这是帧内预测的常用方案,因此编码效率降低。
图10是示出视频解码器134的帧内预测模块426的功能模块的示意框图。视频编码器114的帧内预测模块336以与视频解码器134的帧内预测模块426相同的方式进行工作,因而针对图10的功能模块的说明还适用于帧内预测模块336。图10的功能模块可以由计算机系统200内的专用硬件、由在计算机系统200内可执行的软件(诸如驻留在硬盘驱动器205上的并且由处理器205控制其执行的软件应用程序233的一个或多个软件代码模块等)、或者可选地由专用硬件和在计算机系统200内可执行的软件的组合来实现。
总和458是从求和模块424所接收到的,并且是残差和根据邻接块的预测的总和。邻接样本缓冲器1002提供用以将左方邻接样本保持在左方邻接缓冲器1004中并将上方邻接样本保持在上方邻接缓冲器1006中的充足存储量。总和458是在区块滤波器模块430所进行的环内滤波之前产生的。左方邻接缓冲器1004输出左方邻接样本1020并且上方邻接缓冲器1006输出上方邻接样本1022。参考样本生成器模块1008根据角度参数1024和反转角度1026生成整体作为参考样本1028的左方参考样本(例如,806)和上方参考样本(例如,804)。参考样本生成器模块1008可以通过从邻接样本缓冲器1002复制邻接样本来生成参考样本。该复制操作可以根据图8A和8B的描述进行工作。参考样本块生成器1008区分垂直方向占主导的帧内预测模式(即,predModeIntra等于或大于18)和水平方向占主导的帧内预测模式(即,predModeIntra小于18)。值18(十八)定义水平方向占主导的帧内预测模式和垂直方向占主导的帧内预测模式之间的阈值。由于DC模式和平面模式未被视为具有方向,因此单独处理这两个模式。样本块生成器1010使用参考样本1028、角度参数1024和预测模式454来采用帧内预测样本的阵列的形式生成帧内预测的预测单位(PU)464。与参考样本块生成器1008相同,参考样本块生成器1010将(如预测模式454所提供的)帧内预测模式与阈值十八(18)进行比较,以区分垂直方向占主导的帧内预测模式(即,predModeIntra等于或大于十八(18))和水平方向占主导的帧内预测模式(即,predModeIntra小于十八(18))。
对于角度参数和反转角度(在定义了反转角度的情况下)的任何给定值,针对垂直方向占主导的帧内预测模式而利用参考样本块生成器1008访问左方参考样本和上方参考样本是针对水平方向占主导的帧内预测模式的访问的转置。可以使用该对称以通过使用这两个情况之间的阈值控制转置运算的操作来降低参考样本生成的复杂度。
参考样本块生成器1010通过从参考样本1028复制样本以产生帧内预测的预测单位(PU)464来进行工作。例如,帧内预测模式十八(18)得到角度参数为负三十二(-32)。角度参数为负三十二(-32)使得将来自参考样本1028的各参考样本以对角右下模式复制到预测单位(PU)中。由此根据角度参数来利用参考样本的副本填充预测单位(PU)中的各位置,以产生包含纹理的样本块。
对于角度参数的任何给定值,参考样本块生成器1010针对垂直方向占主导的帧内预测模式的输出是参考样本块生成器1010针对水平方向占主导的帧内预测模式的输出的(沿着由帧内预测模式十八(18)所定义的轴的)置换。可以利用该对称以通过使用这两个情况之间的阈值控制转置运算的操作来降低复杂度。
可以通过利用角度参数的值中所存在的对称来降低样本块生成器1010的复杂度。由于帧内预测的预测单位(PU)464中的各样本仅依赖于参考样本1028和角度参数1024,因此样本块生成器1010的平行实现是可能的。
由于样本块生成器1010的平行实现使得(例如,如利用针对各时钟周期产生的样本数量所测量到的)“吞吐量”能够足以支持采用所支持的最大帧频的实时操作,因此这些平行实现对于更高分辨率而言是有利的。
通常,平行实现存在使逻辑重复而导致电路大小增大的缺点。简化平行的操作以降低向样本块生成器1010的实现添加平行性的增加成本是有益的。
以下将参考图11~13来说明降低向样本块生成器101的实现添加平行性的增加成本的配置。控制逻辑1012使用预测模式454产生角度参数1024和反转角度1025,并且以下将参考图11~13来进行说明。
图11是示出针对色度样本阵列的4:2:2色度格式所配置的视频编码器114或视频解码器134中的、用于生成帧内预测样本的方法1100的示意框图。方法1100可用于生成诸如编码位流312等的视频位流的色度通道的帧内预测样本。方法1100针对帧内预测的预测单位(PU)产生样本阵列,并且将参考图10和11来进行说明。方法1100可被实现为视频编码器114或视频解码器134的例如可被实现为硬件或软件的一部分。将通过如下示例来说明方法1100:方法1100被实现为驻留在硬盘驱动器210上并且由处理器205控制其执行的软件应用程序223的一个或多个代码模块。
方法1100从确定步骤1102开始,其中在该步骤1102中,使用处理器205来选择帧内预测模式。如以下将说明的,选择步骤1102的操作在视频编码器114和视频解码器134之间有所不同。
步骤1104~1126在视频编码器114和视频解码器134之间具有相同的操作。如图11所示,步骤1130表示用于根据帧内预测模式确定角度参数和反转角度的整体步骤1104~1122。步骤1130中的步骤1106~1122具体用于调整由于在4:2:2色度格式在使用中的情况下的色度通道处理所引起的帧内预测角度。步骤1130中的步骤1106~1122调整角度参数1024以及水平帧内预测模式和垂直帧内预测模式之间的阈值(或“变化阈值”)。该调整使得针对色度样本网格的帧内预测能够与针对亮度样本网格的帧内预测一致地进行工作。(如利用“predModeIntra”所列举的)水平帧内预测模式和垂直帧内预测模式之间的变化阈值表示如图7所示的水平方向占主导的帧内预测模式和垂直方向占主导的帧内预测模式之间的边界。变化阈值针对亮度样本网格(并且针对除4:2:2以外的色度格式在使用中的情况下的色度通道)具有值十八(18)。针对4:2:2色度格式在使用中的情况下的色度通道,变化阈值具有值十五(15)。步骤1130中的步骤1106~1122被配置为在调整后的角度超过预定值的情况下,修改变化阈值。修改后的变化阈值被配置为将调整后的帧内预测模式从多个水平帧内预测模式其中之一转换至垂直帧内预测模式。
在视频编码器114中,在步骤1102中,使用处理器205来选择要将哪个帧内预测模式用于预测单位(PU)。在步骤1102中所选择的帧内预测模式可以是多个水平帧内预测模式其中之一。通常,在步骤1102中,处理器205选择与输入帧数据310上的同位置块相比给出最低失真的帧内预测模式。所选择的帧内编码模式由熵编码器324编码在编码位流312中,并且可以存储在存储器206和/或HDD210中。在视频解码器134中,在步骤1102中,通过使用熵解码器420来确定帧内预测模式以从编码位流312解码句法元素。
在确定步骤1104中,使用处理器205来针对色度通道的帧内预测模式确定由帧内预测角度参数和反转角度表示的帧内预测角度。该角度参数是根据图8所确定的。可以将所确定的角度参数和反转角度存储在存储器206和/或HDD210中。
然后,在色度4:2:2测试的步骤1105中,使用处理器205来判断要生成的预测样本的块是否是针对色度通道并且该色度通道是否正使用4:2:2色度格式。如果判断为“是”,则控制进入测试步骤1106。否则,控制进入生成参考样本的步骤1124。
然后,在测试步骤1106中,使用处理器205来判断在步骤1102中所选择的帧内预测模式的主导方向是垂直方向还是水平方向。测试步骤1106将帧内预测模式predModeIntra与阈值十八(18)进行比较,并且如果predModeIntra大于或等于该阈值,则主导方向是垂直方向;否则,主导方向是水平方向。
如果帧内预测模式的主导方向是垂直方向,则控制进入使角度减半的步骤1108。如果帧内预测模式的主导方向是水平方向,则控制进入使角度加倍的步骤1112。在以下的步骤1108、1110、1112和1114中,方法1100用于调整由于4:2:2色度格式所引起的帧内预测角度。根据所选择的帧内预测模式的主导方向来调整帧内预测角度。对于垂直方向占主导的帧内预测模式,减小步骤1104中确定的角度参数以对色度样本网格进行补偿。在使角度减半的步骤1108中,使用处理器205来通过使步骤1104中所确定的角度参数减半(例如,通过进行1个位的右移)来使帧内预测角度减半。另外,对于帧内预测模式十八(18)~二十五(25)(其中,定义了反转角度),步骤1108使反转角度加倍。步骤1108得到最密切符合在亮度样本网格上所实现的角度的新角度。例如,步骤1108可以将角度参数从[0,2,5,9,13,17,21,26,32]映射到[0,1,2,4,6,8,10,13,16],并且可以将反转角度从[-256,-315,-390,-482,-630,-910,-1638,-4096]映射到[-512,-630,-780,-964,-1260,-1820,-3276,-8192]。可选地,可以始终对角度参数进行向下量化并且对反转角度参数进行向上量化,反之亦然。
将通过使角度减半的步骤1108所得到的角度参数应用于如以下所述的生成参考样本的步骤1124和生成帧内预测样本的步骤1126的一个缺点是现在存在角度参数和反转角度的附加可能值。这些附加可能值导致步骤1124和1126的复杂度增加。因而,诸如参考图10的样本块生成器1010所述等的提供步骤1126所用的平行实现的配置的复杂度将增加以支持附加可能值。
方法1100继续进行对角度进行量化的步骤1110,其中在该步骤1110中,使用处理器205来将步骤1108中所确定的减半角度参数量化为最接近该角度参数的预先存在的值。此外,在步骤1110中,使用处理器205来将反转角度量化为最接近该反转角度的预先存在的值。
对于帧内预测模式二十五(25),在步骤1110中,将角度参数从负二(-2)调整为负一(-1),并且将反转角度从-4096加倍为-8192。然后,步骤1112可以将角度参数从负一(-1)调整为零(0)。在这种情况下,由于帧内预测模式二十五(25)变为与帧内预测模式二十六(26)(完全垂直的帧内预测)相同,因此不再针对帧内预测模式二十五(25)定义反转角度。帧内预测模式二十六(26)不需要如参考图8B所述的、用于使用反转角度来生成参考样本的机制。
在一个配置中,可以将使角度减半的步骤1108和对角度进行量化的步骤1110组合成单个表查找操作以降低复杂度。例如,组合后的步骤1108和1110可以将角度参数从[0,2,5,9,13,17,21,26,32]映射到[0,0,2,5,5,9,9,13,17],并且可以将反转角度从[-256,-315,-390,-482,-630,-910,-1638,-4096]映射到[-482,-630,-910,-910,-1638,-1638,-4096,N/A]。
其它配置可能由于角度参数的减半期间的四舍五入差异而产生不同的映射。由于角度参数的减半期间的四舍五入差异而产生不同映射的配置通过量化产生不同的输出,但保持仅将预先存在的值用于角度参数和反转角度的性质。
对于水平方向占主导的帧内预测模式,增加角度参数以对色度样本网格进行补偿。在使角度加倍的步骤1112中,使用处理器205来通过使骤1104中所确定的角度参数加倍(例如,通过进行1个位的左移)来使帧内预测角度加倍。步骤1112得到紧密符合在亮度样本网格上所实现的角度的新角度。再次地,将来自使角度加倍的步骤1112的角度参数应用于生成参考样本的步骤1124和生成帧内预测样本的步骤1126的一个缺点是现在存在角度参数和反转角度的附加可能值。附加可能值导致步骤1124和1126中的复杂度增加。再次地,因而,诸如参考图10的样本块生成器1010所述等的提供步骤1126的平行实现的配置的复杂度将增加以支持附加可能值。然后,在对角度进行量化的步骤1110中,使用处理器205来将步骤1112中所确定的加倍角度参数量化为最接近该角度参数的预先存在的值。此外,在步骤1114中,使用处理器205来将反转角度量化为最接近该反转角度的现有值。
使角度参数加倍的另一缺点是角度参数的容许范围为正/负三十二(+/-32)并且使角度参数加倍使得落在容许范围外的值。该容许范围确定了左方参考样本的程度。
增加左方参考样本(例如,806)的大小使得使用在空间上离预测单位(PU)相当远的样本来进行帧内预测。所使用的样本将不期望与预测单位(PU)的内容相关联,因而不会促成编码效率。相反,可以进行角度参数和反转角度的调整。
方法1100继续进行角度参数超过最大值的测试步骤1116,其中在该步骤1116中,使用处理器205来判断(加倍之后的)角度参数是否大于三十二(32)。可选地,在步骤1116中,处理器205可以测试角度参数是否大于加倍之前的十六(16),从而产生与测试(加倍之后的)角度参数是否大于三十二(32)相等的结果。
在步骤1116中超过最大角度参数的情况与水平方向占主导的帧内预测模式二(2)~五(5)相对应,并且控制处理进入调整角度的步骤1118。在调整角度的步骤1118中,使用处理器205来将角度参数设置为三十二(32)并且将反转角度设置为负二百五十六(-256)。在不满足步骤1116的条件的情况下,控制进入角度参数为最小值以下的测试步骤1120。
可以将使角度加倍的步骤1112、对角度进行量化的步骤1114以及步骤1116和1118组合成单个表查找操作以降低复杂度。例如,组合后的步骤1112和1114可以将角度参数从[0,2,5,9,13,17,21,26,32]映射到[0,5,9,17,26,32,32,32,32],并且可以将反转角度从[-256,-315,-390,-482,-630,-910,-1638,-4096]映射到[-256,-256,-256,-256,-315,-482,-910,-1638]。
其它配置可能由于反转角度的减半期间的四舍五入差异而产生不同的映射。由于反转角度的减半期间的四舍五入差异而产生不同的映射的配置通过量化产生不同的输出,但保持了仅将预先存在的值用于角度参数和反转角度的性质。例如,一些配置可以始终对角度参数进行向下量化并且对反转角度参数进行向上量化,反之亦然。
在角度参数为最小值以下的测试步骤1120中,使用处理器205来测试(加倍之后的)角度参数是否低于负三十二(-32)。可选地,步骤1120还可以测试角度参数是否小于加倍之前的十六16,从而产生与测试(加倍之后的)角度参数是否低于负三十二(-32)相等的结果。满足超过低阈值的条件的情况与水平方向占主导的帧内预测模式十五(15)~十七(17)相对应。如果超过低阈值,则方法1100进入调整角度和方向的步骤1122。否则,方法进入步骤1124。
在步骤1122中,使用处理器205来调整角度参数、反转角度和阈值。步骤1122将角度参数和反转角度设置成与帧内预测模式十八(18)~二十(20)的角度参数和反转角度相对应。步骤1122还将阈值从十八(18)调整为十五(15)。帧内预测模式十八(18)~二十(20)是垂直方向占主导的,因而调整后的阈值使得帧内预测模式十五(15)、十六(16)和十七(17)的方向从水平方向占主导改变为垂直方向占主导。
如上所述,变化阈值表示水平方向占主导的帧内预测模式和垂直方向占主导的帧内预测模式之间的边界。变化阈值针对亮度样本网格(以及针对在除4:2:2以外的色度格式在使用中的情况下的色度通道)具有值十八(18)。针对4:2:2色度格式在使用中的色度通道,变化阈值具有值十五(15)。同样如上所述,如果调整后的帧内预测角度参数的大小超过预定值(例如,32),则可以修改变化阈值。
在生成参考样本的步骤1124中,参考样本生成器1008在处理器205的执行下,使用角度参数和反转角度(在定义了反转角度的情况下)生成参考样本。还可以使用调整后的阈值来生成参考样本。
然后,在生成帧内预测样本的步骤1126中,样本块生成器1010在处理器205的执行下用于使用角度参数1024和步骤1124中所确定的参考样本来采用帧内预测样本的阵列的形式生成预测单位(PU)464。在步骤1126中,根据在步骤1118和1122中的任意步骤中调整后的帧内预测角度并且根据上述的变化阈值,使用垂直帧内预测模式来生成帧内预测样本。
图12示出用于将帧内预测模式(predModeIntra)转换成帧内预测角度(intraPredAngle)和反转角度(invAngle)的表,其中对帧内预测角度和反转角度进行了量化。图12的表符合来自图11的步骤1130(省略了步骤1120和1122)的结果(即,输入至步骤1124的角度参数值和反转角度值)。可以可选地利用使用图12的表进行工作的表查找来替换步骤1130(除步骤1120和1122以外),以确定帧内预测模式的角度参数和反转角度。针对符合图12的配置的示例“工作草案”文本包括在附录A中。
图13示出用于将帧内预测模式(predModeIntra)转换成帧内预测角度(intraPredAngle)和反转角度(invAngle)的表,其中对帧内预测角度和反转角度、以及由块类型所确定的水平帧内预测模式和垂直帧内预测模式之间的边界或阈值进行了量化。图13的表符合来自图11的步骤1130的结果(即,输入至步骤1124的角度参数值和反转角度值)。可以利用使用图13的表进行工作的表查找来替换步骤1130,以确定帧内预测模式的角度参数和反转角度。针对符合图13的配置的示例“工作草案”文本包括在附录B中。
图14示出将帧内预测模式(predModeIntra)转换成帧内预测角度(intraPredAngle)和反转角度(invAngle)的表,其中对帧内预测角度和反转角度进行了替代量化。图14的表符合来自图11的步骤1130(省略了步骤1120和1122但具有使角度减半的步骤1108中的替代映射)的结果(即,输入至步骤1124的角度参数值和反转角度值)。替代映射将角度参数[0,2,5,9,13,17,21,26,32]映射到角度参数[0,2,2,5,5,9,9,13,17](假定利用正/负对称性,列出角度参数的正值,然而替代映射可以明确地扩展为包括负角度参数)。在方法1100的一个配置中,可以利用使用图14的表进行工作的表查找来替换步骤1130(除步骤1120和1122以外),以确定帧内预测模式的角度参数和反转角度。针对符合图14的配置的示例“工作草案”文本包括在附录C中。
图15示出用于将帧内预测模式(predModeIntra)转换成帧内预测角度(intraPredAngle)和反转角度(invAngle)的表,其中对帧内预测角度和反转角度、以及由块类型所确定的水平帧内预测模式和垂直帧内预测模式之间的边界或阈值进行了替代量化。图15的表符合来自具有使角度减半的步骤1108中的替代映射的图11的步骤1130的结果(即,输入至步骤1124的角度参数值和反转角度值)。替代映射将角度参数[0,2,5,9,13,17,21,26,32]映射到角度参数[0,2,2,5,5,9,9,13,17](假定利用正/负对称性,列出角度参数的正值,然而替代映射可以明确地扩展为包括负角度参数)。在方法1100的一个配置中,可以利用使用图13的表进行工作的表查找来替换步骤1130,以确定帧内预测模式的角度参数和反转角度。针对符合图15的配置的示例“工作草案”文本包括在附录D中。
符合图14的表和图15的表中的任意表的配置具有定义反转角度的帧内预测模式的范围(即,帧内预测模式十一~二十五)在亮度通道的情况与具有4:2:2色度格式的的情况之间、或者在非4:2:2色度格式情况之间相同的优点。符合图14的表和图15的表中的任意表的配置使得不必引入条件检查以判断是否应将反转角度应用在生成参考样本的步骤1124中。
符合图12~15的表中的任何表的配置具有以下优点:仅需要单个表查找来确定任何帧内预测模式的角度参数和反转角度,并且不需要进一步的中间(或“调整后”)参数。
在一个配置中,在确定角度参数和反转角度之前,可以将帧内预测模式重新映射到调整后的帧内预测模式。在方法1100的步骤1104~1126中使用调整后的帧内预测模式。将帧内预测模式重新映射到调整后的帧内预测模式引入了通过重新映射操作所产生的中间(或“调整后”)帧内预测模式。将帧内预测模式重新映射到调整后的帧内预测模式还引入了用以将帧内预测模式重新映射到调整后的帧内预测模式的附加表,并且需要附加表查找以进行重新映射(例如,作为步骤1102的一部分)。在将帧内预测模式重新映射到调整后的帧内预测模式的配置中,不需要对角度参数和反转角度进行进一步调整,因而不需要步骤1105~1122。
这里所述的配置允许视频编码器114和视频解码器134的、用以在维持帧内预测的预测单位(PU)的高编码效率的同时支持复杂度降低的4:2:2色度格式的实现。
产业上的可利用性
所述的配置适用于计算机和数据处理行业,特别适用于对诸如视频信号等的信号进行编码或解码的数字信号处理。
前述仅说明本发明的一些实施例,并且可以在没有背离本发明的范围和精神的情况下对本发明进行修改和/或改变,其中这些实施例仅是示例性而非限制性的。
在本说明书的上下文中,词语“包括”意味着“主要但未必仅包括”或“具有”或“包含”,而不是“仅由…组成”。词语“包括(comprising)”的诸如“comprise”和“comprises”等的词尾变化具有相应的变化含义。
附录A
生成帧内预测样本的实现
8.4.4.2.6在INTRA_ANGULAR2的范围内的帧内预测模式的规格。
INTRA_ANGULAR34
向该处理输入:
–帧内预测模式predModeIntra,
–邻接样本p[x][y],其中x=-1、y=-1..nTbS*2–1以及x=0..nTbS*2–1、y=-1,
–指定变换块大小的变量nTbS,
–指定当前块的颜色分量的变量cIdx。
该处理的输出是预测样本predSamples[x][y],其中x,y=0..nTbS–1。
图8-2示出总共33个帧内角度,并且表8-4指定predModeIntra和角度参数intraPredAngle之间的映射表。
图8-2–帧内预测角度定义(提供信息)
表8-4–intraPredAngle的规格
表8-5进一步指定predModeIntra和反转角度参数invAngle之间的映射表。
表8-5–invAngle的规格
–如果在ChromaArrayType不等于2或cIdx等于0的情况下predModeIntra等于或大于18、或者如果在ChromaArrayType等于2且cIdx不等于0的情况下predModeIntra等于或大于15,则以下有序步骤适用:
1.如下所述指定参考样本阵列ref[x]:
–以下适用:
ref[x]=p[-1+x][-1],其中:x=0..nTbS(8-47)
–如果intraPredAngle小于0,则如下所述扩展主参考样本阵列:
–在(nTbS*intraPredAngle)>>5小于-1的情况下,
ref[x]=p[-1][-1+((x*invAngle+128)>>8)],
其中,x=-1..(nTbS*intraPredAngle)>>5(8-48)
–否则,
ref[x]=p[-1+x][-1],其中:x=nTbS+1..2*nTbS(8-49)
2.如下所述推导预测样本predSamples[x][y](其中,x,y=0..nTbS-1)的值:
a.如下所述推导指标变量iIdx和倍增因数iFact:
iIdx=((y+1)*intraPredAngle)>>5(8-50)
iFact=((y+1)*intraPredAngle)&31(8-51)
b.根据iFact的值,以下适用:
–如果iFact不等于0,则如下所述推导预测样本predSamples[x][y]的值:
predSamples[x][y]=((32-iFact)*ref[x+iIdx+1]+iFact*ref[x+iIdx+2]+16)>>5
(8-52)
–否则,如下所述推导预测样本predSamples[x][y]的值:
predSamples[x][y]=ref[x+iIdx+1](8-53)
c.在predModeIntra等于26(垂直方向)、cIdx等于0并且nTbS小于32的情况下,以下滤波适用,其中x=0、y=0..nTbS-1:
predSamples[x][y]=Clip1Y(p[x][-1]+((p[-1][y]-p[-1][-1])>>1))
(8-54)
–否则,以下有序步骤适用:
1.如下所述指定参考样本阵列ref[x]:
–以下适用:
ref[x]=p[-1][-1+x],其中:x=0..nTbS(8-55)
–如果intraPredAngle小于0,则如下所述扩展主参考样本阵列:
–在(nTbS*intraPredAngle)>>5小于-1的情况下,
ref[x]=p[-1+((x*invAngle+128)>>8)][-1],
其中,x=-1..(nTbS*intraPredAngle)>>5(8-56)
–否则,
ref[x]=p[-1][-1+x],其中:x=nTbS+1..2*nTbS(8-57)
2.如下所述推导预测样本predSamples[x][y](其中,x,y=0..nTbS-1)的值:
a.如下所述推导指标变量iIdx和倍增因数iFact:
iIdx=((x+1)*intraPredAngle)>>5(8-58)
iFact=((x+1)*intraPredAngle)&31(8-59)
b.根据iFact的值,以下适用:
–如果iFact不等于0,则如下所述推导预测样本predSamples[x][y]的值:
predSamples[x][y]=((32-iFact)*ref[y+iIdx+1]+iFact*ref[y+iIdx+2]+16)>>5
(8-60)
–否则,如下所述推导预测样本predSamples[x][y]的值:
predSamples[x][y]=ref[y+iIdx+1](8-61)
c.在predModeIntra等于0(水平方向)、cIdx等于0并且nTbS小于32的情况下,以下滤波适用,其中x=0..nTbS-1,y=0:
predSamples[x][y]=Clip1Y(p[-1][y]+((p[x][-1]-p[-1][-1])>>1))
(8-62)
结束附录A
附录B
生成帧内预测样本的替代实现
8.4.4.2.6在INTRA_ANGULAR2的范围内的帧内预测模式的规格。
INTRA_ANGULAR34
向该处理输入:
–帧内预测模式predModeIntra,
–邻接样本p[x][y],其中x=-1、y=-1..nTbS*2–1以及x=0..nTbS*2–1、y=-1,
–指定变换块大小的变量nTbS,
–指定当前块的颜色分量的变量cIdx。
该处理的输出是预测样本predSamples[x][y],其中x,y=0..nTbS–1。
图8-2示出总共33个帧内角度,并且表8-4指定predModeIntra和角度参数intraPredAngle之间的映射表。
图8-2–帧内预测角度定义(提供信息)
表8-4–intraPredAngle的规格
表8-5进一步指定predModeIntra和反转角度参数invAngle之间的映射表。
表8-5–invAngle的规格
–如果在ChromaArrayType不等于2或cIdx等于0的情况下predModeIntra等于或大于18、或者如果在ChromaArrayType等于2且cIdx不等于0的情况下predModeIntra等于或大于15,则以下有序步骤适用:
3.如下所述指定参考样本阵列ref[x]:
–以下适用:
ref[x]=p[-1+x][-1],其中:x=0..nTbS(8-47)
–如果intraPredAngle小于0,则如下所述扩展主参考样本阵列:
–在(nTbS*intraPredAngle)>>5小于-1的情况下,
ref[x]=p[-1][-1+((x*invAngle+128)>>8)],
其中,x=-1..(nTbS*intraPredAngle)>>5(8-48)
–否则,
ref[x]=p[-1+x][-1],其中:x=nTbS+1..2*nTbS(8-49)
4.如下所述推导预测样本predSamples[x][y](其中,x,y=0..nTbS-1)的值:
a.如下所述推导指标变量iIdx和倍增因数iFact:
iIdx=((y+1)*intraPredAngle)>>5(8-50)
iFact=((y+1)*intraPredAngle)&31(8-51)
b.根据iFact的值,以下适用:
–如果iFact不等于0,则如下所述推导预测样本predSamples[x][y]的值:
predSamples[x][y]=((32-iFact)*ref[x+iIdx+1]+iFact*ref[x+iIdx+2]+16)>>5
(8-52)
–否则,如下所述推导预测样本predSamples[x][y]的值:
predSamples[x][y]=ref[x+iIdx+1](8-53)
c.在predModeIntra等于26(垂直方向)、cIdx等于0并且nTbS小于32的情况下,以下滤波适用,其中x=0、y=0..nTbS-1:
predSamples[x][y]=Clip1Y(p[x][-1]+((p[-1][y]-p[-1][-1])>>1))
(8-54)
–否则,以下有序步骤适用:
3.如下所述指定参考样本阵列ref[x]:
–以下适用:
ref[x]=p[-1][-1+x],其中:x=0..nTbS(8-55)
–如果intraPredAngle小于0,则如下所述扩展主参考样本阵列:
–在(nTbS*intraPredAngle)>>5小于-1的情况下,
ref[x]=p[-1+((x*invAngle+128)>>8)][-1],
其中,x=-1..(nTbS*intraPredAngle)>>5(8-56)
–否则,
ref[x]=p[-1][-1+x],其中:x=nTbS+1..2*nTbS(8-57)
4.如下所述推导预测样本predSamples[x][y](其中,x,y=0..nTbS-1)的值:
d.如下所述推导指标变量iIdx和倍增因数iFact:
iIdx=((x+1)*intraPredAngle)>>5(8-58)
iFact=((x+1)*intraPredAngle)&31(8-59)
e.根据iFact的值,以下适用:
–如果iFact不等于0,则如下所述推导预测样本predSamples[x][y]的值:
predSamples[x][y]=((32-iFact)*ref[y+iIdx+1]+iFact*ref[y+iIdx+2]+16)>>5
(8-60)
–否则,如下所述推导预测样本predSamples[x][y]的值:
predSamples[x][y]=ref[y+iIdx+1](8-61)
f.在predModeIntra等于0(水平方向)、cIdx等于0并且nTbS小于32的情况下,以下滤波适用,其中x=0..nTbS-1,y=0:
predSamples[x][y]=Clip1Y(p[-1][y]+((p[x][-1]-p[-1][-1])>>1))
(8-62)
结束附录B
附录C
生成帧内预测样本的实现
8.4.4.2.6在INTRA_ANGULAR2的范围内的帧内预测模式的规格。
INTRA_ANGULAR34
向该处理输入:
–帧内预测模式predModeIntra,
–邻接样本p[x][y],其中x=-1、y=-1..nTbS*2–1以及x=0..nTbS*2–1、y=-1,
–指定变换块大小的变量nTbS,
–指定当前块的颜色分量的变量cIdx。
该处理的输出是预测样本predSamples[x][y],其中x,y=0..nTbS–1。
图8-2示出总共33个帧内角度,并且表8-4指定predModeIntra和角度参数intraPredAngle之间的映射表。
图8-2–帧内预测角度定义(提供信息)
表8-4–intraPredAngle的规格
表8-5进一步指定predModeIntra和反转角度参数invAngle之间的映射表。
表8-5–invAngle的规格
–如果在ChromaArrayType不等于2或cIdx等于0的情况下predModeIntra等于或大于18、或者如果在ChromaArrayType等于2且cIdx不等于0的情况下predModeIntra等于或大于15,则以下有序步骤适用:
5.如下所述指定参考样本阵列ref[x]:
–以下适用:
ref[x]=p[-1+x][-1],其中:x=0..nTbS(8-47)
–如果intraPredAngle小于0,则如下所述扩展主参考样本阵列:
–在(nTbS*intraPredAngle)>>5小于-1的情况下,
ref[x]=p[-1][-1+((x*invAngle+128)>>8)],
其中,x=-1..(nTbS*intraPredAngle)>>5(8-48)
–否则,
ref[x]=p[-1+x][-1],其中:x=nTbS+1..2*nTbS(8-49)
6.如下所述推导预测样本predSamples[x][y](其中,x,y=0..nTbS-1)的值:
a.如下所述推导指标变量iIdx和倍增因数iFact:
iIdx=((y+1)*intraPredAngle)>>5(8-50)
iFact=((y+1)*intraPredAngle)&31(8-51)
b.根据iFact的值,以下适用:
–如果iFact不等于0,则如下所述推导预测样本predSamples[x][y]的值:
predSamples[x][y]=((32-iFact)*ref[x+iIdx+1]+iFact*ref[x+iIdx+2]+16)>>5
(8-52)
–否则,如下所述推导预测样本predSamples[x][y]的值:
predSamples[x][y]=ref[x+iIdx+1](8-53)
c.在predModeIntra等于26(垂直方向)、cIdx等于0并且nTbS小于32的情况下,以下滤波适用,其中x=0、y=0..nTbS-1:
predSamples[x][y]=Clip1Y(p[x][-1]+((p[-1][y]-p[-1][-1])>>1))
(8-54)
–否则,以下有序步骤适用:
5.如下所述指定参考样本阵列ref[x]:
–以下适用:
ref[x]=p[-1][-1+x],其中:x=0..nTbS(8-55)
–如果intraPredAngle小于0,则如下所述扩展主参考样本阵列:
–在(nTbS*intraPredAngle)>>5小于-1的情况下,
ref[x]=p[-1+((x*invAngle+128)>>8)][-1],
其中,x=-1..(nTbS*intraPredAngle)>>5(8-56)
–否则,
ref[x]=p[-1][-1+x],其中:x=nTbS+1..2*nTbS(8-57)
6.如下所述推导预测样本predSamples[x][y](其中,x,y=0..nTbS-1)的值:
g.如下所述推导指标变量iIdx和倍增因数iFact:
iIdx=((x+1)*intraPredAngle)>>5(8-58)
iFact=((x+1)*intraPredAngle)&31(8-59)
h.根据iFact的值,以下适用:
–如果iFact不等于0,则如下所述推导预测样本predSamples[x][y]的值:
predSamples[x][y]=((32-iFact)*ref[y+iIdx+1]+iFact*ref[y+iIdx+2]+16)>>5
(8-60)
–否则,如下所述推导预测样本predSamples[x][y]的值:
predSamples[x][y]=ref[y+iIdx+1](8-61)
i.在predModeIntra等于0(水平方向)、cIdx等于0并且nTbS小于32的情况下,以下滤波适用,其中x=0..nTbS-1,y=0:
predSamples[x][y]=Clip1Y(p[-1][y]+((p[x][-1]-p[-1][-1])>>1))
(8-62)
结束附录C
附录D
生成帧内预测样本的替代实现
8.4.4.2.6在INTRA_ANGULAR2的范围内的帧内预测模式的规格。
INTRA_ANGULAR34
向该处理输入:
–帧内预测模式predModeIntra,
–邻接样本p[x][y],其中x=-1、y=-1..nTbS*2–1以及x=0..nTbS*2–1、y=-1,
–指定变换块大小的变量nTbS,
–指定当前块的颜色分量的变量cIdx。
该处理的输出是预测样本predSamples[x][y],其中x,y=0..nTbS–1。
图8-2示出总共33个帧内角度,并且表8-4指定predModeIntra和角度参数intraPredAngle之间的映射表。
图8-2–帧内预测角度定义(提供信息)
表8-4–intraPredAngle的规格
表8-5进一步指定predModeIntra和反转角度参数invAngle之间的映射表。
表8-5–invAngle的规格
–如果在ChromaArrayType不等于2或cIdx等于0的情况下predModeIntra等于或大于18、或者如果在ChromaArrayType等于2且cIdx不等于0的情况下predModeIntra等于或大于15,则以下有序步骤适用:
7.如下所述指定参考样本阵列ref[x]:
–以下适用:
ref[x]=p[-1+x][-1],其中:x=0..nTbS(8-47)
–如果intraPredAngle小于0,则如下所述扩展主参考样本阵列:
–在(nTbS*intraPredAngle)>>5小于-1的情况下,
ref[x]=p[-1][-1+((x*invAngle+128)>>8)],
其中,x=-1..(nTbS*intraPredAngle)>>5(8-48)
–否则,
ref[x]=p[-1+x][-1],其中:x=nTbS+1..2*nTbS(8-49)
8.如下所述推导预测样本predSamples[x][y](其中,x,y=0..nTbS-1)的值:
a.如下所述推导指标变量iIdx和倍增因数iFact:
iIdx=((y+1)*intraPredAngle)>>5(8-50)
iFact=((y+1)*intraPredAngle)&31(8-51)
b.根据iFact的值,以下适用:
–如果iFact不等于0,则如下所述推导预测样本predSamples[x][y]的值:
predSamples[x][y]=((32-iFact)*ref[x+iIdx+1]+iFact*ref[x+iIdx+2]+16)>>5
(8-52)
–否则,如下所述推导预测样本predSamples[x][y]的值:
predSamples[x][y]=ref[x+iIdx+1](8-53)
c.在predModeIntra等于26(垂直方向)、cIdx等于0并且nTbS小于32的情况下,以下滤波适用,其中x=0、y=0..nTbS-1:
predSamples[x][y]=Clip1Y(p[x][-1]+((p[-1][y]-p[-1][-1])>>1))
(8-54)
–否则,以下有序步骤适用:
7.如下所述指定参考样本阵列ref[x]:
–以下适用:
ref[x]=p[-1][-1+x],其中:x=0..nTbS(8-55)
–如果intraPredAngle小于0,则如下所述扩展主参考样本阵列:
–在(nTbS*intraPredAngle)>>5小于-1的情况下,
ref[x]=p[-1+((x*invAngle+128)>>8)][-1],
其中,x=-1..(nTbS*intraPredAngle)>>5(8-56)
–否则,
ref[x]=p[-1][-1+x],其中:x=nTbS+1..2*nTbS(8-57)
8.如下所述推导预测样本predSamples[x][y](其中,x,y=0..nTbS-1)的值:
d.如下所述推导指标变量iIdx和倍增因数iFact:
iIdx=((x+1)*intraPredAngle)>>5(8-58)
iFact=((x+1)*intraPredAngle)&31(8-59)
e.根据iFact的值,以下适用:
–如果iFact不等于0,则如下所述推导预测样本predSamples[x][y]的值:
predSamples[x][y]=((32-iFact)*ref[y+iIdx+1]+iFact*ref[y+iIdx+2]+16)>>5
(8-60)
–否则,如下所述推导预测样本predSamples[x][y]的值:
predSamples[x][y]=ref[y+iIdx+1](8-61)
f.在predModeIntra等于0(水平方向)、cIdx等于0并且nTbS小于32的情况下,以下滤波适用,其中x=0..nTbS-1,y=0:
predSamples[x][y]=Clip1Y(p[-1][y]+((p[x][-1]-p[-1][-1])>>1))
(8-62)
结束附录D

Claims (22)

1.一种用于生成针对4:2:2色度格式所配置的视频位流的色度通道的帧内预测样本的方法,所述方法包括以下步骤:
根据针对所述色度通道的帧内预测模式来确定帧内预测角度,其中所述帧内预测模式是多个水平帧内预测模式其中之一;
调整由于所述4:2:2色度格式所引起的帧内预测角度;
在调整后的帧内预测角度超过预定值的情况下,修改水平帧内预测模式和垂直帧内预测模式之间的变化阈值,其中修改后的变化阈值被配置成将调整后的帧内预测角度从所述多个水平帧内预测模式其中之一转换至垂直帧内预测模式;以及
根据调整后的帧内预测角度和所述变化阈值来使用垂直帧内预测模式生成帧内预测样本。
2.根据权利要求1所述的方法,其中,还包括以下步骤:从所述多个水平帧内预测模式中选择所述帧内预测模式。
3.根据权利要求2所述的方法,其中,对多个帧内预测模式各自进行搜索,以选择所述帧内预测模式。
4.根据权利要求2所述的方法,其中,对多个帧内预测模式的子集进行搜索,以选择所述帧内预测模式。
5.根据权利要求1所述的方法,其中,还包括以下步骤:判断所选择的帧内预测模式的主导方向是水平方向还是垂直方向。
6.根据权利要求5所述的方法,其中,根据所选择的帧内预测模式的主导方向来调整所述帧内预测角度。
7.根据权利要求1所述的方法,其中,还包括以下步骤:使所述帧内预测角度减半。
8.根据权利要求1所述的方法,其中,还包括以下步骤:使所述帧内预测角度加倍。
9.根据权利要求1所述的方法,其中,还包括以下步骤:对调整后的帧内预测角度进行量化。
10.一种用于生成针对4:2:2色度格式所配置的视频位流的色度通道的帧内预测样本的系统,所述系统包括:
存储器,用于存储数据和计算机程序;
处理器,其连接至所述存储器,以执行所述计算机程序,所述计算机程序包括用于进行以下操作的指令:
根据针对所述色度通道的帧内预测模式来确定帧内预测角度,其中所述帧内预测模式是多个水平帧内预测模式其中之一;
调整由于所述4:2:2色度格式所引起的帧内预测角度;
在调整后的帧内预测角度超过预定值的情况下,修改水平帧内预测模式和垂直帧内预测模式之间的变化阈值,其中修改后的变化阈值被配置成将调整后的帧内预测角度从所述多个水平帧内预测模式其中之一转换至垂直帧内预测模式;以及
根据调整后的帧内预测角度和所述变化阈值来使用垂直帧内预测模式生成帧内预测样本。
11.一种用于生成针对4:2:2色度格式所配置的视频位流的色度通道的帧内预测样本的设备,所述设备包括以下部件:
用于根据针对所述色度通道的帧内预测模式来确定帧内预测角度的部件,其中所述帧内预测模式是多个水平帧内预测模式其中之一;
用于调整由于所述4:2:2色度格式所引起的帧内预测角度的部件;
用于在调整后的帧内预测角度超过预定值的情况下、修改水平帧内预测模式和垂直帧内预测模式之间的变化阈值的部件,其中修改后的变化阈值被配置成将调整后的帧内预测角度从所述多个水平帧内预测模式其中之一转换至垂直帧内预测模式;以及
用于根据调整后的帧内预测角度和所述变化阈值来使用垂直帧内预测模式生成帧内预测样本的部件。
12.一种包括计算机程序的计算机可读介质,所述计算机程序用于生成针对4:2:2色度格式所配置的视频位流的色度通道的帧内预测样本,所述计算机程序包括以下代码:
用于根据针对所述色度通道的帧内预测模式来确定帧内预测角度的代码,其中所述帧内预测模式是多个水平帧内预测模式其中之一;
用于调整由于所述4:2:2色度格式所引起的帧内预测角度的代码;
用于在调整后的帧内预测角度超过预定值的情况下、修改水平帧内预测模式和垂直帧内预测模式之间的变化阈值的代码,其中修改后的变化阈值被配置成将调整后的帧内预测角度从所述多个水平帧内预测模式其中之一转换至垂直帧内预测模式;以及
用于根据调整后的帧内预测角度和所述变化阈值来使用垂直帧内预测模式生成帧内预测样本的代码。
13.一种用于生成针对4:2:2色度格式所配置的视频位流的色度通道的帧内预测样本的方法,所述方法包括以下步骤:
根据针对所述色度通道的帧内预测模式来确定帧内预测角度,其中所述帧内预测模式是多个水平帧内预测模式其中之一;
调整由于所述4:2:2色度格式所引起的帧内预测角度;
在所述视频位流是针对4:2:2色度格式所配置的情况下,修改水平帧内预测模式和垂直帧内预测模式之间的变化阈值,其中修改后的变化阈值被配置成将调整后的帧内预测角度从所述多个水平帧内预测模式其中之一转换至垂直帧内预测模式;以及
根据调整后的帧内预测角度和所述变化阈值来使用垂直帧内预测模式生成帧内预测样本。
14.一种用于生成针对4:2:2色度格式所配置的视频位流的色度通道的帧内预测样本的系统,所述系统包括:
存储器,用于存储数据和计算机程序;
处理器,其连接至所述存储器,以执行所述计算机程序,所述计算机程序包括用于进行以下操作的指令:
根据针对所述色度通道的帧内预测模式来确定帧内预测角度,其中所述帧内预测模式是多个水平帧内预测模式其中之一;
调整由于所述4:2:2色度格式所引起的帧内预测角度;
在所述视频位流是针对4:2:2色度格式所配置的情况下,修改水平帧内预测模式和垂直帧内预测模式之间的变化阈值,其中修改后的变化阈值被配置成将调整后的帧内预测角度从所述多个水平帧内预测模式其中之一转换至垂直帧内预测模式;以及
根据调整后的帧内预测角度和所述变化阈值来使用垂直帧内预测模式生成帧内预测样本。
15.一种用于生成针对4:2:2色度格式所配置的视频位流的色度通道的帧内预测样本的设备,所述设备包括以下部件:
用于根据针对所述色度通道的帧内预测模式来确定帧内预测角度的部件,其中所述帧内预测模式是多个水平帧内预测模式其中之一;
用于调整由于所述4:2:2色度格式所引起的帧内预测角度的部件;
用于在所述视频位流是针对4:2:2色度格式所配置的情况下、修改水平帧内预测模式和垂直帧内预测模式之间的变化阈值的部件,其中修改后的变化阈值被配置成将调整后的帧内预测角度从所述多个水平帧内预测模式其中之一转换至垂直帧内预测模式;以及
用于根据调整后的帧内预测角度和所述变化阈值来使用垂直帧内预测模式生成帧内预测样本的部件。
16.一种包括计算机程序的计算机可读介质,所述计算机程序用于生成针对4:2:2色度格式所配置的视频位流的色度通道的帧内预测样本,所述计算机程序包括以下代码:
用于根据针对所述色度通道的帧内预测模式来确定帧内预测角度的代码,其中所述帧内预测模式是多个水平帧内预测模式其中之一;
用于调整由于所述4:2:2色度格式所引起的帧内预测角度的代码;
用于在所述视频位流是针对4:2:2色度格式所配置的情况下、修改水平帧内预测模式和垂直帧内预测模式之间的变化阈值的代码,其中修改后的变化阈值被配置成将调整后的帧内预测角度从所述多个水平帧内预测模式其中之一转换至垂直帧内预测模式;以及
用于根据调整后的帧内预测角度和所述变化阈值来使用垂直帧内预测模式生成帧内预测样本的代码。
17.一种用于生成视频位流的色度通道的帧内预测样本的方法,所述方法包括以下步骤:
对所述视频位流的色度格式进行解码;
在确定角度参数之前调整帧内预测模式,其中所述调整依赖于解码后的色度格式;
根据调整后的帧内预测模式来确定所述角度参数;
使用所确定的角度参数来生成参考样本;以及
使用所确定的角度参数和所生成的参考样本来生成帧内预测样本。
18.根据权利要求17所述的方法,其中,所述调整改变垂直帧内预测模式和水平帧内预测模式之间的阈值存在的帧内预测模式,其中针对4:2:2色度格式所配置的视频位流的阈值得到帧内预测模式15~34是垂直帧内预测模式。
19.根据权利要求17所述的方法,其中,所述色度格式是4:2:2色度格式。
20.一种用于生成视频位流的色度通道的帧内预测样本的系统,所述系统包括:
存储器,用于存储数据和计算机程序;
处理器,其连接至所述存储器,以执行所述计算机程序,所述计算机程序包括用于进行以下操作的指令:
对所述视频位流的色度格式进行解码;
在确定角度参数之前调整帧内预测模式,其中所述调整依赖于解码后的色度格式;
根据调整后的帧内预测模式来确定所述角度参数;
使用所确定的角度参数来生成参考样本;以及
使用所确定的角度参数和所生成的参考样本来生成帧内预测样本。
21.一种用于生成视频位流的色度通道的帧内预测样本的设备,所述方法包括以下部件:
用于对所述视频位流的色度格式进行解码的部件;
用于在确定角度参数之前调整帧内预测模式的部件,其中所述调整依赖于解码后的色度格式;
用于根据调整后的帧内预测模式来确定所述角度参数的部件;
用于使用所确定的角度参数来生成参考样本的部件;以及
用于使用所确定的角度参数和所生成的参考样本来生成帧内预测样本。
22.一种包括计算机程序的计算机可读介质,所述计算机程序用于生成视频位流的色度通道的帧内预测样本,所述计算机程序包括以下代码:
用于对所述视频位流的色度格式进行解码的代码;
用于在确定角度参数之前调整帧内预测模式的代码,其中所述调整依赖于解码后的色度格式;
用于根据调整后的帧内预测模式来确定所述角度参数的代码;
用于使用所确定的角度参数来生成参考样本的代码;以及
用于使用所确定的角度参数和所生成的参考样本来生成帧内预测样本。
CN201480032315.2A 2013-04-05 2014-04-04 用于生成帧内预测样本的方法、设备和系统 Active CN105264889B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
AU2013202653 2013-04-05
AU2013202653A AU2013202653A1 (en) 2013-04-05 2013-04-05 Method, apparatus and system for generating intra-predicted samples
PCT/AU2014/000367 WO2014161043A1 (en) 2013-04-05 2014-04-04 Method, apparatus and system for generatiing intra- predicted samples

Publications (2)

Publication Number Publication Date
CN105264889A true CN105264889A (zh) 2016-01-20
CN105264889B CN105264889B (zh) 2018-09-11

Family

ID=51657333

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480032315.2A Active CN105264889B (zh) 2013-04-05 2014-04-04 用于生成帧内预测样本的方法、设备和系统

Country Status (7)

Country Link
US (1) US20160050422A1 (zh)
EP (1) EP2982108B1 (zh)
JP (3) JP6351706B2 (zh)
KR (1) KR20150135519A (zh)
CN (1) CN105264889B (zh)
AU (2) AU2013202653A1 (zh)
WO (1) WO2014161043A1 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105681812A (zh) * 2016-03-30 2016-06-15 腾讯科技(深圳)有限公司 Hevc帧内编码处理方法和装置
CN108337510A (zh) * 2017-12-22 2018-07-27 西安思丹德信息技术有限公司 一种基于h264标准的低延时编解码方法及图像数据传输方法
CN109982075A (zh) * 2019-03-21 2019-07-05 南京威翔科技有限公司 一种基于fpga的帧内预测通用角度方法
CN111758256A (zh) * 2018-02-23 2020-10-09 佳能株式会社 用于线性分量样本预测的新样本集和新下采样方案
CN112154661A (zh) * 2018-07-02 2020-12-29 腾讯美国有限责任公司 用于视频解码的方法和装置
CN112449753A (zh) * 2018-07-16 2021-03-05 高通股份有限公司 利用广角帧内预测的位置相关帧内预测组合
CN112840654A (zh) * 2018-10-12 2021-05-25 韦勒斯标准与技术协会公司 使用多假设预测的视频信号处理方法和装置
CN113170118A (zh) * 2019-03-24 2021-07-23 华为技术有限公司 视频译码中进行色度帧内预测的方法及装置
CN115243041A (zh) * 2018-05-03 2022-10-25 Lg电子株式会社 图像编码和解码方法及解码装置、存储介质和发送方法
CN112449753B (zh) * 2018-07-16 2024-06-21 高通股份有限公司 利用广角帧内预测的位置相关帧内预测组合

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10715833B2 (en) * 2014-05-28 2020-07-14 Apple Inc. Adaptive syntax grouping and compression in video data using a default value and an exception value
US9762919B2 (en) * 2014-08-28 2017-09-12 Apple Inc. Chroma cache architecture in block processing pipelines
CN107409208B (zh) * 2015-03-27 2021-04-20 索尼公司 图像处理装置、图像处理方法以及计算机可读存储介质
WO2017023829A1 (en) * 2015-07-31 2017-02-09 Stc.Unm System and methods for joint and adaptive control of rate, quality, and computational complexity for video coding and video delivery
CN109155857B (zh) * 2016-03-11 2023-05-30 数字洞察力有限公司 视频编码方法以及装置
EP3442232A4 (en) * 2016-04-06 2019-12-04 KT Corporation METHOD AND APPARATUS FOR PROCESSING VIDEO SIGNAL
KR20230070062A (ko) * 2016-10-04 2023-05-19 주식회사 비원영상기술연구소 영상 데이터 부호화/복호화 방법 및 장치
JP6565885B2 (ja) * 2016-12-06 2019-08-28 株式会社Jvcケンウッド 画像符号化装置、画像符号化方法及び画像符号化プログラム、並びに画像復号化装置、画像復号化方法及び画像復号化プログラム
JP6680260B2 (ja) 2017-04-28 2020-04-15 株式会社Jvcケンウッド 画像符号化装置、画像符号化方法及び画像符号化プログラム、並びに画像復号化装置、画像復号化方法及び画像復号化プログラム
US10951908B2 (en) 2017-05-24 2021-03-16 Lg Electronics Inc. Method and device for decoding image according to intra prediction in image coding system
GB2567862A (en) * 2017-10-27 2019-05-01 Sony Corp Image data encoding and decoding
JP7256293B2 (ja) 2019-04-23 2023-04-11 北京字節跳動網絡技術有限公司 符号化映像における二次変換の使用
EP3987800A4 (en) * 2019-06-24 2023-03-29 Sharp Kabushiki Kaisha SYSTEMS AND METHODS FOR PERFORMING INTRA PREDICTION CODING IN VIDEO CODING
KR102452870B1 (ko) * 2019-06-25 2022-10-07 닛폰 호소 교카이 인트라 예측 장치, 화상 복호 장치, 및 프로그램
KR20220031059A (ko) 2019-08-06 2022-03-11 엘지전자 주식회사 컬러 포멧에 따라 결정된 예측 모드 타입에 기반하여 분할 모드를 결정하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법
US11432006B2 (en) * 2020-08-14 2022-08-30 Tencent America LLC Chroma mode video coding
US11140394B1 (en) * 2020-08-27 2021-10-05 Tencent America LLC Adaptive chroma intra mode coding in video compression

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101019437A (zh) * 2004-07-15 2007-08-15 高通股份有限公司 基于帧内预测方向的h.264空间错误隐藏
US20080152005A1 (en) * 2006-12-22 2008-06-26 Qualcomm Incorporated Systems and methods for efficient spatial intra predictabilty determination (or assessment)
US20100014001A1 (en) * 2008-07-16 2010-01-21 Sony Corporation, A Japanese Corporation Simple next search position selection for motion estimation iterative search
US20100014588A1 (en) * 2008-07-16 2010-01-21 Sony Corporation, A Japanese Corporation Speculative start point selection for motion estimation iterative search

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012176405A1 (ja) * 2011-06-20 2012-12-27 株式会社Jvcケンウッド 画像符号化装置、画像符号化方法及び画像符号化プログラム、並びに画像復号装置、画像復号方法及び画像復号プログラム
JP5614381B2 (ja) * 2011-06-23 2014-10-29 株式会社Jvcケンウッド 画像符号化装置、画像符号化方法、及び画像符号化プログラム、並びに、送信装置、送信方法、及び送信プログラム
KR101668583B1 (ko) * 2011-06-23 2016-10-21 가부시키가이샤 제이브이씨 켄우드 화상 인코딩 장치, 화상 인코딩 방법 및 화상 인코딩 프로그램, 및 화상 디코딩 장치, 화상 디코딩 방법 및 화상 디코딩 프로그램
JP5995448B2 (ja) * 2012-01-19 2016-09-21 シャープ株式会社 画像復号装置、および画像符号化装置
GB2501535A (en) * 2012-04-26 2013-10-30 Sony Corp Chrominance Processing in High Efficiency Video Codecs
US20140198855A1 (en) * 2013-01-14 2014-07-17 Qualcomm Incorporated Square block prediction
WO2014115283A1 (ja) * 2013-01-24 2014-07-31 シャープ株式会社 画像復号装置、および画像符号化装置
CN109379600B (zh) * 2013-03-29 2023-04-11 Jvc 建伍株式会社 图像解码装置以及图像解码方法
BR112015025113B1 (pt) * 2013-04-05 2023-03-21 Mitsubishi Electric Corporation Dispositivo de decodificação de imagem a cores, e, método de decodificação de imagem a cores

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101019437A (zh) * 2004-07-15 2007-08-15 高通股份有限公司 基于帧内预测方向的h.264空间错误隐藏
US20080152005A1 (en) * 2006-12-22 2008-06-26 Qualcomm Incorporated Systems and methods for efficient spatial intra predictabilty determination (or assessment)
US20100014001A1 (en) * 2008-07-16 2010-01-21 Sony Corporation, A Japanese Corporation Simple next search position selection for motion estimation iterative search
US20100014588A1 (en) * 2008-07-16 2010-01-21 Sony Corporation, A Japanese Corporation Speculative start point selection for motion estimation iterative search

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BROSS B, 等: "High Efficiency Video Coding(HEVC) text specification draft 8", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING(JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11;10TH MEETING》 *

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105681812B (zh) * 2016-03-30 2019-11-19 腾讯科技(深圳)有限公司 Hevc帧内编码处理方法和装置
CN105681812A (zh) * 2016-03-30 2016-06-15 腾讯科技(深圳)有限公司 Hevc帧内编码处理方法和装置
CN108337510A (zh) * 2017-12-22 2018-07-27 西安思丹德信息技术有限公司 一种基于h264标准的低延时编解码方法及图像数据传输方法
US12010319B2 (en) 2018-02-23 2024-06-11 Canon Kabushiki Kaisha Sample sets and new down-sampling schemes for linear component sample prediction
CN111758256A (zh) * 2018-02-23 2020-10-09 佳能株式会社 用于线性分量样本预测的新样本集和新下采样方案
CN111758256B (zh) * 2018-02-23 2024-05-14 佳能株式会社 用于线性分量样本预测的新样本集和新下采样方案
US11849119B2 (en) 2018-02-23 2023-12-19 Canon Kabushiki Kaisha Sample sets and new down-sampling schemes for linear component sample prediction
CN115243041A (zh) * 2018-05-03 2022-10-25 Lg电子株式会社 图像编码和解码方法及解码装置、存储介质和发送方法
CN115243041B (zh) * 2018-05-03 2024-06-04 Lg电子株式会社 图像编码和解码方法及解码装置、存储介质和发送方法
CN112154661B (zh) * 2018-07-02 2023-04-14 腾讯美国有限责任公司 一种用于视频编码、解码的方法和相关装置
US11930167B2 (en) 2018-07-02 2024-03-12 Tencent America LLC Wide-angle intra prediction
CN112154661A (zh) * 2018-07-02 2020-12-29 腾讯美国有限责任公司 用于视频解码的方法和装置
CN112449753A (zh) * 2018-07-16 2021-03-05 高通股份有限公司 利用广角帧内预测的位置相关帧内预测组合
CN112449753B (zh) * 2018-07-16 2024-06-21 高通股份有限公司 利用广角帧内预测的位置相关帧内预测组合
CN112840654A (zh) * 2018-10-12 2021-05-25 韦勒斯标准与技术协会公司 使用多假设预测的视频信号处理方法和装置
CN112840654B (zh) * 2018-10-12 2024-04-16 韦勒斯标准与技术协会公司 使用多假设预测的视频信号处理方法和装置
CN109982075A (zh) * 2019-03-21 2019-07-05 南京威翔科技有限公司 一种基于fpga的帧内预测通用角度方法
CN113170118A (zh) * 2019-03-24 2021-07-23 华为技术有限公司 视频译码中进行色度帧内预测的方法及装置
US11871033B2 (en) 2019-03-24 2024-01-09 Huawei Technologies Co., Ltd. Method and apparatus for chroma intra prediction in video coding
CN113170118B (zh) * 2019-03-24 2024-03-01 华为技术有限公司 视频译码中进行色度帧内预测的方法及装置

Also Published As

Publication number Publication date
KR20150135519A (ko) 2015-12-02
JP2016518761A (ja) 2016-06-23
EP2982108B1 (en) 2019-02-06
CN105264889B (zh) 2018-09-11
AU2013202653A1 (en) 2014-10-23
AU2015271953B2 (en) 2017-10-19
US20160050422A1 (en) 2016-02-18
EP2982108A1 (en) 2016-02-10
JP6351706B2 (ja) 2018-07-04
JP2019213206A (ja) 2019-12-12
AU2015271953A1 (en) 2016-01-21
EP2982108A4 (en) 2017-03-22
JP6563079B2 (ja) 2019-08-21
WO2014161043A1 (en) 2014-10-09
JP2018157587A (ja) 2018-10-04

Similar Documents

Publication Publication Date Title
CN105264889A (zh) 用于生成帧内预测样本的方法、设备和系统
CN114173115B (zh) 进行帧内预测的编码器、解码器和对应方法
CN104685872A (zh) 对编码单位的变换单位编码和解码的方法、设备和系统
JP2023103292A (ja) エンコーダ、デコーダ、および対応するイントラ予測方法
CN104782125A (zh) 对编码单位的变换单位编码和解码的方法、设备和系统
CN105532000A (zh) 用于对视频数据进行编码和解码的方法、设备和系统
CN104221288A (zh) 对编码视频数据的变换单位的子集编码和解码的方法、设备和系统
CN113545063A (zh) 使用线性模型进行帧内预测的方法及装置
JP2023504332A (ja) 符号化ツリーユニットを符号化および復号化するための方法、装置およびシステム
KR20210139446A (ko) 인트라 스무딩을 위한 방법 및 장치
KR20210058938A (ko) 픽처 인코딩 및 디코딩을 위한 방법 및 디바이스
JP2023504333A (ja) 符号化ツリーユニットを符号化および復号化するための方法、装置およびシステム
TWI823023B (zh) 用於編碼與解碼視訊樣本區塊的方法、設備以及系統
JP2024513873A (ja) 切り替え可能な補間フィルタを用いる幾何学的分割
RU2809841C2 (ru) Способ и устройство для внутрикадрового предсказания с использованием линейной модели
RU2803063C2 (ru) Кодер, декодер и соответствующие способы, которые используются для процесса преобразования

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant