CN109716771B - 用于视频译码的线性模型色度帧内预测 - Google Patents

用于视频译码的线性模型色度帧内预测 Download PDF

Info

Publication number
CN109716771B
CN109716771B CN201780055869.8A CN201780055869A CN109716771B CN 109716771 B CN109716771 B CN 109716771B CN 201780055869 A CN201780055869 A CN 201780055869A CN 109716771 B CN109716771 B CN 109716771B
Authority
CN
China
Prior art keywords
block
video data
samples
linear prediction
chroma
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780055869.8A
Other languages
English (en)
Other versions
CN109716771A (zh
Inventor
张凯
陈建乐
张莉
马尔塔·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN109716771A publication Critical patent/CN109716771A/zh
Application granted granted Critical
Publication of CN109716771B publication Critical patent/CN109716771B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Color Television Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明揭示一种解码视频数据的方法,所述方法包含:接收第一视频数据块的明度样本的经编码块;解码明度样本的所述经编码块以产生经重建构明度样本;及使用针对所述第一视频数据块的所述经重建构明度样本及两个或多于两个线性预测模型来预测所述第一视频数据块的色度样本。

Description

用于视频译码的线性模型色度帧内预测
本申请案要求2016年9月15日申请的第62/395,145号美国临时申请案的权益,所述申请案的全部内容以引用的方式并入本文中。
技术领域
本发明涉及视频译码。
背景技术
数字视频能力可并入到广泛范围的装置中,包括数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、便携式或台式计算机、平板计算机、电子书阅读器、数字摄像机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、所谓的“智能型电话”、视频电话会议装置、视频流装置及其类似者。数字视频装置实施视频译码技术,例如由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分高级视频译码(AVC)所定义的标准、高效率视频译码(HEVC)标准、ITU-T H.265/高效率视频译码(HEVC)及此些标准的扩展中描述的那些视频译码技术。视频装置可通过实施此类视频译码技术来更有效地发射、接收、编码、解码及/或存储数字视频信息。
视频译码技术包含空间(图片内)预测及/或时间(图片间)预测以减少或移除视频序列中固有的冗余。对于基于块的视频译码,视频切片(例如,视频图片或视频图片的一部分)可分割成视频块,视频块也可被称作译码树单元(CTU)、译码单元(CU)及/或译码节点。图片的经帧内译码(I)切片中的视频块使用关于同一图片中相邻块中的参考样本的空间预测来编码。图片的帧间译码(P或B)切片中的视频块可使用关于同一图片中的相邻块中的参考样本的空间预测或关于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。
空间或时间预测导致待译码块的预测性块。残余数据表示待译码的原始块与预测性块之间的像素差。根据指向形成预测性块的参考样本的块的运动向量及指示经译码块与预测性块之间的差异的残余数据来编码经帧间译码块。帧内译码块是根据帧内译码模式及残余数据编码。为进行进一步压缩,可将残余数据从像素域变换到变换域,从而导致残余变换系数,可接着量化所述残余变换系数。最初布置于二维阵列中的经量化变换系数可经扫描以便产生变换系数的一维向量,且熵译码可经应用以达成甚至更多压缩。
发明内容
一般来说,本发明描述用于增强型线性模型色度内预测的技术。本发明描述包含使用两个或多于两个线性预测模型来预测明度样本的对应块的色度样本的技术。在其它实例中,明度样本块可使用多个降频取样滤波器中的一个来进行降频取样。所述经降频取样的明度样本可接着用以使用线性模型预测技术来预测对应色度样本。在其它实例中,色度样本可使用线性模型预测及角预测的组合来进行预测。
在本发明的一个实例中,一种解码视频数据的方法包括接收第一视频数据块的明度样本的经编码块,解码明度样本的所述经编码块以产生经重建构明度样本,及使用所述第一视频数据块的所述经重建构明度样本及两个或多于两个线性预测模型来预测所述第一视频数据块的色度样本。
在本发明的另一实例中,一种编码视频数据的方法包括编码第一视频数据块的明度样本的块,重建构明度样本的所述经编码块以产生经重建构明度样本,及使用所述第一视频数据块的所述经重建构样本及两个或多于两个线性预测模型来预测所述第一视频数据块的色度样本。
在本发明的另一实例中,一种经配置以解码视频数据的设备包括:经配置以接收第一视频数据块的存储器,及一或多个处理器,其经配置以接收所述第一视频数据块的明度样本的经编码块,解码明度样本的所述经编码块以产生经重建构明度样本,及使用所述第一视频数据块的所述经重建构明度样本及两个或多于两个线性预测模型来预测所述第一视频数据块的色度样本。
在本发明的另一实例中,一种经配置以编码视频数据的设备包括:经配置以接收第一视频数据块的存储器,及一或多个处理器,其经配置以编码第一视频数据块的明度样本的块,重建构明度样本的所述经编码块以产生经重建构明度样本,及使用所述第一视频数据块的所述经重建构样本及两个或多于两个线性预测模型来预测所述第一视频数据块的色度样本。
在本发明的另一实例中,一种经配置以解码视频数据的设备包括:用于接收第一视频数据块的明度样本的经编码块的装置,用于解码明度样本的所述经编码块以产生经重建构明度样本的装置,及用于使用所述第一视频数据块的所述经重建构明度样本及两个或多于两个线性预测模型来预测所述第一视频数据块的色度样本的装置。
在另一实例中,本发明描述一种存储指令的计算机可读存储媒体,所述指令在执行时使得经配置以解码视频数据的一或多个处理器进行以下操作:接收所述第一视频数据块的明度样本的经编码块,解码明度样本的所述经编码块以产生经重建构明度样本,及使用所述第一视频数据块的所述经重建构明度样本及两个或多于两个线性预测模型来预测所述第一视频数据块的色度样本。
在一个实例中,译码视频数据的方法包括确定第一视频数据块的明度样本,及使用所述第一视频数据块的所述明度样本及两个或多于两个预测模型而预测所述第一视频数据块的色度样本。在一个实例中,用于译码视频数据的装置包括存储视频数据的存储器,及包括一或多个处理器的视频译码器,所述一或多个处理器经配置以:确定第一视频数据块的明度样本,及使用所述第一视频数据块的所述明度样本及两个或多于两个预测模型而预测所述第一视频数据块的色度样本。
在一个实例中,一种译码视频数据的方法包括确定第一视频数据块的明度样本;确定用以预测所述第一视频数据块的色度样本的预测模型;确定多个降频取样滤波器中用以对所述明度样本进行降频取样的一者;使用所述所确定的降频取样滤波器来对所述明度样本进行降频取样以产生经降频取样的明度样本;及使用所述第一视频数据块的所述经降频取样的明度样本及所述预测模型而预测所述第一视频数据块的色度样本。
在一个实例中,一种译码视频数据的方法包括确定所述视频数据的当前色度块是否使用线性模型译码;在视频数据的所述当前色度块使用线性模型译码情况下,使用所述线性模型译码视频数据的所述当前色度块;在视频数据的所述当前色度块并非使用线性模型译码情况下,所述方法进一步包括确定线性模式角预测在所述当前块确定为不使用所述线性模型译码时是否被启用;在启用了线性模式角预测情况下将角模式预测型样及线性模型预测型样应用于所述当前色度块的样本;及确定针对所述当前色度块的所述样本的最终线性模式角预测为所述所应用的角模式预测型样与线性模型预测型样的经加权和。
在一个实例中,一种用于译码视频数据的装置包括存储视频数据的存储器以及包括一或多个处理器的视频译码器,所述一或多个处理器经配置以确定所述视频数据的当前色度块是否使用线性模型译码;在视频数据的所述当前色度块使用线性模型译码情况下,使用所述线性模型译码视频数据的所述当前色度块;在视频数据的所述当前色度块并非使用线性模型译码情况下,所述一或多个处理器经进一步配置以确定线性模式角预测在所述当前块确定为不使用所述线性模型时是否被启用;在启用了线性模式角预测情况下将角模式预测型样及线性模型预测型样应用于所述当前色度块的样本;及确定针对所述当前色度块的所述样本的最终线性模式角预测为所述所应用的角模式预测型样与线性模型预测型样的经加权和。
在一个实例中,一种译码视频数据的方法包括相对于当前块视频数据确定使用线性模型译码模式译码的相邻色度块的数目,及基于使用所述线性模型译码模式译码的视频数据的相邻色度块的所确定数目动态地改变用以指示线性模型译码模式的特定类型的码字。
在一个实例中,一种用于译码视频数据的装置包括存储视频数据的存储器及包括一或多个处理器的视频译码器,所述一或多个处理器经配置以相对于当前块视频数据确定使用线性模型译码模式译码的相邻色度块的数目,及基于使用所述线性模型译码模式译码的视频数据的相邻色度块的所确定数目动态地改变用以指示线性模型译码模式的特定类型的码字。
在一个实例中,一种译码视频数据的方法包括:确定所述视频数据的当前色度块的大小,比较所述当前色度块的所述大小与阈值,在所述当前色度块的所述大小满足所述阈值时应用多个线性模型模式中的线性模型模式,且在所述当前色度块的所述大小并不满足所述阈值时不应用多个线性模型模式中的所述线性模型模式。
在一个实例中,一种用于译码视频数据的装置包括存储视频数据的存储器,及包括一或多个处理器的视频译码器,所述一或多个处理器经配置以确定所述视频数据的当前色度块的大小,比较所述当前色度块的所述大小与阈值,当所述当前色度块的所述大小满足所述阈值时应用多个线性模型模式中的线性模型模式,且在所述当前色度块的所述大小不满足所述阈值时不应用多个线性模型模式中的所述线性模型模式。
在一个实例中,一种经配置以译码视频数据的装置包括用于执行本发明中所描述的方法的任何组合的装置。在另一实例中,一种计算机可读媒体编码有指令,所述指令在执行时使得经配置以译码视频数据的装置的一或多个处理器执行本发明中所描述的方法的任何组合。在另一实例中,可执行本发明中所描述的技术的任何组合。
在以下随附图式及描述中阐述一或多个实例的细节。其它特征、目标及优点将从描述及图式以及权利要求书显而易见。
附图说明
图1为说明实例视频编码及解码系统的框图,所述视频编码及解码系统可利用用于描述于本发明中的多模型线性模型色度内预测的技术。
图2为说明实例视频编码器的框图,所述视频编码器可实施用于描述于本发明中的多模型线性模型色度内预测的技术。
图3为实例视频解码器的框图,所述视频解码器可实施用于描述于本发明中的多模式线性模型色度内预测的技术。
图4为用于导出用于线性模型色度内预测的模型参数α及模型参数β的样本的实例位置的概念图。
图5为明度(Y)分量与色度(C)分量之间的线性回归的实例的图形。
图6为明度样本降频取样的实例的概念图。
图7A到7E为根据本发明的实例的对相邻样本进行分类的图形。
图8A到8D为根据本发明的实例的用以导出线性模型的相邻色度样本的概念图。
图9为根据本发明的实例的相邻样本分类的概念图。
图10为根据本发明的实例的用于分类成2个群组的相邻经译码明度样本的两个线性模型的概念图。
图11为根据本发明的实例的将两个线性模型中的一个线性模型即模型1应用于当前块的所有像素的概念图。
图12为根据本发明的实例的将两个线性模型中的一个线性模型即模型2应用于当前块的所有像素的概念图。
图13为根据本发明的实例的预测过程的概念图。
图14A到14C为根据本发明的实例的明度子取样滤波器的概念图。
图15为根据本发明的实例的以LM角预测(LAP)模式发信的流程图。
图16为根据本发明的实例的LAP的框图。
图17为当前块的相邻块的概念图。
图18为说明本发明的实例编码方法的流程图。
图19为说明本发明的实例编码方法的流程图。
图20为说明用于编码当前块的实例方法的流程图。
图21为说明用于解码视频数据的当前块的实例方法的流程图。
具体实施方式
本发明涉及视频编码解码器中的横越分量的预测,且更特定来说涉及用于线性模型(LM)色度帧内预测的技术。在本发明的一个实例中,描述多模型LM(MMLM)技术。当将MMLM用于色度内预测时,视频译码器(例如,视频编码器或视频解码器)可将一个以上线性模型用于从明度分量的对应块(例如,译码单元(CU)或预测单元(PU))预测色度分量的块。当前块的相邻明度样本及相邻色度样本可分类成若干个群组,且每一群组可用作训练集合以导出独立线性模型。在一个实例中,对应明度块的样本可进一步基于用于分类相邻样本的相同规则而分类。视频译码器可取决于分类而将每一线性模型应用于当前明度块的数个部分,以获得部分预测的色度块。来自多个线性模型的部分预测色度块可经组合以获得最终经预测色度块。
在本发明的另一实例中,描述用于多滤波器LM模式的技术。当使用多滤波器LM(MFLM)色度预测技术时,视频译码器在视频数据并非呈4:4:4格式情况下可使用一个以上明度降频取样滤波器。即,如果色度块相较于明度值经子取样(即,视频数据并非4:4:4),那么视频译码器出于横越分量色度内预测的目的对明度块进行子取样。以此方式,在明度样本与色度样本之间存在1:1相关。本发明的MFLM技术可另外应用于界定于当前由联合视频探索团队(JVET)开发的联合探索性模型(JEM-3.0)的实例中的降频取样滤波器。
在本发明的另一实例中,描述用于LM角预测模式的技术。当使用LM角预测(LAP)时,某类型的角预测(例如,角预测可包含定向DC平面预测或其它非横越分量帧内预测),且某类型的LM预测可组合在一起以获得对色度块的最终预测。使用本文中所描述的多模型LM(MMLM)色度预测(有或无多滤波器LM(MFLM)情况下)及/或LM角预测(LAP)预测技术(无论单独或组合)在编码时间轻微增高(例如,104%编码时间)情况下可个别地引起明度分量及色度分量上的大约0.4%及3.5%的位速率失真(BD-速率)译码增益。
图1为说明实例视频编码及解码系统10的框图,所述视频编码及解码系统可利用用于描述于本发明中的线性模型色度内预测的技术。如图1中所展示,系统10包含源装置12,其产生待在稍后时间由目的地装置14解码的经编码视频数据。详言之,源装置12经由计算机可读媒体16将视频数据提供到目的地装置14。源装置12及目的地装置14可包括广泛范围的装置中的任一者,包含台式计算机、笔记型(即,便携式)计算机、平板计算机、机顶盒、例如所谓的“智能型”电话的电话手机、所谓的“智能型”板、电视、摄像机、显示装置、数字媒体播放器、视频游戏控制台、视频流发射装置或类似者。在一些情况下,源装置12及目的地装置14可能经装备以用于无线通信。
目的地装置14可经由计算机可读媒体16接收待解码的经编码视频数据。计算机可读媒体16可包括能够将经编码视频数据从源装置12移动到目的地装置14的任一类型的媒体或装置。在一个实例中,计算机可读媒体16可包括通信媒体以使源装置12能够实时地将经编码视频数据直接发射到目的地装置14。可根据通信标准例如无线通信协议调制经编码视频数据,且将其发射到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如,射频(RF)频谱或一或多个物理发射线。通信媒体可形成基于包的网络(例如局域网、广域网或例如因特网的全球网络)的一部分。通信媒体可包含路由器、交换器、基站,或可用于促进从源装置12到目的地装置14的通信的任何其它装备。
在一些实例中,经编码数据可从输出接口22输出到配置为存储装置的计算机可读媒体16。类似地,可由输入接口28从存储装置存取经编码数据。存储装置可包含多种分散式或本地存取式数据存储媒体中的任一者,例如,硬盘机、Blu-ray光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器,或用于存储经编码视频数据的任何其它合适数字存储媒体。在再一实例中,存储装置可对应于文件服务器或可存储由源装置12产生的经编码视频的另一中间存储装置。目的地装置14可经由流发射或下载自存储装置存取存储的视频数据。文件服务器可为能够存储经编码视频数据且将那个经编码视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包含网页服务器(例如,用于网站)、FTP服务器、网络附加存储(NAS)装置或本地磁盘机。目的地装置14可经由包含因特网连接的任何标准数据连接而存取经编码的视频数据。此连接可包含适合于存取存储于文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、缆线数据机等)或两个的组合。来自存储装置的经编码视频数据的发射可为流发射、下载发射,或其组合。
本发明的技术不必限于无线应用或设定。所述技术可应用于视频译码以支持多种多媒体应用中的任一个,例如,空中电视广播、有线电视发射、卫星电视发射、因特网流发射视频发射(例如,经由HTTP的动态自适应流发射(DASH))、经编码到数据存储媒体上的数字视频、存储于数据存储媒体上的数字视频的解码或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频发射以支持应用,例如,视频流发射、视频播放、视频广播及/或视频电话的应用。
在图1的实例中,源装置12包含视频源18、视频编码器20及输出接口22。目的地装置14包含输入接口28、视频解码器30及显示装置32。根据本发明,源装置12的视频编码器20及/或目的地装置14的视频解码器30可经配置以应用针对描述于本发明中的增强型线性模型色度内预测的技术。在其它实例中,源装置12及目的地装置14可包含其它组件或布置。举例来说,源装置12可从外部视频源18(例如外部摄像机)接收视频数据。同样地,目的地装置14可与外部显示装置介接,而非包含集成式显示装置。
图1的所说明系统10仅为一个实例。针对本发明中描述的增强型线性模型色度内预测的技术可通过任何数字视频编码及/或解码装置执行。尽管本发明的技术通常由视频编码装置执行,但所述技术也可由视频编码器/解码器(通常被称为“CODEC”)执行。此外,本发明的技术也可由视频预处理器执行。源装置12及目的地装置14仅为源装置12产生经译码视频数据用于发射到目的地装置14的此些译码装置的实例。在一些实例中,装置12、14可以大体上对称的方式操作,使得装置12、14中的每一者包含视频编码及解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频传播,以用于(例如)视频流发射、视频播放、视频广播或视频电话。
源装置12的视频源18可包含视频俘获装置,例如视频摄像机、含有先前俘获的视频的视频存档及/或用于从视频内容提供者接收视频的视频馈入接口。作为另一替代,视频源18可产生基于计算机图形的数据作为源视频,或实况视频、经存档视频及计算机产生的视频的组合。在一些情况下,如果视频源18为视频摄像机,那么源装置12及目的地装置14可形成所谓的摄像机电话或视频电话。然而,如上文所提及,本发明所描述的技术一般可适用于视频译码,且可应用于无线及/或有线应用。在每一情况下,俘获、预先俘获或计算机产生的视频可由视频编码器20编码。经编码视频信息可接着由输出接口22输出到计算机可读媒体16上。
计算机可读媒体16可包含暂时性媒体,例如无线广播或有线网络发射;或存储媒体(即,非暂时性存储媒体),例如硬盘、随身盘、紧密光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器(未展示)可从源装置12接收经编码视频数据,且(例如)经由网络发射提供经编码视频数据到目的地装置14。类似地,媒体产生设施(例如光盘冲压设施)的计算装置可从源装置12接收经编码视频数据且生产含有经编码视频数据的光盘。因此,在各种实例中,可理解计算机可读媒体16包含各种形式的一或多个计算机可读媒体。
目的地装置14的输入接口28从计算机可读媒体16接收信息。计算机可读媒体16的信息可包含由视频编码器20定义的也由视频解码器30使用的语法信息,其包含描述块及其它经译码单元的特性及/或处理的语法元素。显示装置32将经解码视频数据显示给用户,且可包括多种显示装置中的任一者,例如,阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器20及视频解码器30可根据视频译码标准操作,例如,也被称作ITU-TH.265的高效率视频译码(HEVC)标准。在其它实例中,视频编码器20及视频解码器可根据包含由JVET当前开发的标准的将来视频译码标准操作。替代地,视频编码器20及视频解码器30可根据其它专属或行业标准(例如ITU-T H.264标准,替代地被称作MPEG-4第10部分“高级视频译码(AVC)”)或此些标准的扩展而操作。然而,本发明的技术不限于任何特定译码标准,且可应用于将来视频译码标准。视频译码标准的其它实例包含MPEG-2及ITU-T H.263。尽管在图1中未展示,但在一些方面中,视频编码器20及视频解码器30可各自与音频编码器及解码器集成,且可包含适当MUX-DEMUX单元或其它硬件及软件以处置共同数据流或单独数据流中的音频及视频两者的编码。如果适用,那么MUX-DEMUX单元可遵照ITU H.223多路复用器协议或例如用户数据报协议(UDP)的其它协议。
视频编码器20及视频解码器30各自可被实施为多种合适编码器或解码器电路中的任一者,其可包含固定功能及/或可编程处理电路系统,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当所述技术部分以软件实施时,装置可将用于软件的指令存储于合适的非暂时性计算机可读媒体中,且在硬件中使用一或多个处理器执行指令以执行本发明的技术。视频编码器20及视频解码器30中的每一者可包含于一或多个编码器或解码器中,编码器或解码器中的任一者可集成为各别装置中的组合式编码器/解码器(CODEC)的部分。
大体来说,根据ITU-T H.265,可将视频图片划分成可包含明度样本及色度样本两者的一连串译码树单元(CTU)(或最大译码单元(LCU))。替代地,CTU可包含单色数据(即,仅明度样本)。位流内的语法数据可定义CTU的大小,CTU就像素的数目来说为最大译码单元。切片包含按译码次序的数个连续CTU。视频图片可分割成一或多个切片。每一CTU可根据四分树而分裂成译码单元(CU)。大体来说,四分树数据结构每CU包含一个节点,其中根节点对应于CTU。如果CU分裂成四个子CU,那么对应于所述CU的节点包含四个叶节点,所述四个叶节点中的每一者对应于所述子CU中的一者。
四分树数据结构中的每一节点可提供对应CU的语法数据。举例来说,所述四分树中的节点可包含分裂旗标,从而指示对应于所述节点的CU是否分裂成子CU。针对CU的语法元素可经递回地定义,且可取决于所述CU是否分裂成子CU。如果CU未经进一步分裂,那么其可被称作叶CU。在本发明中,即使不存在原始叶CU的明显分裂,叶CU的四个子CU仍将被称作叶CU。举例来说,如果16×16大小的CU未进一步分裂,那么四个8×8子CU也将被称作叶CU,尽管所述16×16CU从未分裂。
除CU不具有大小区别外,CU具有与H.264标准的宏块类似的用途。举例来说,CTU可分裂成四个子节点(也被称作子CU),且每一子节点又可为父节点且可分裂成另外四个子节点。被称作四分树的叶节点的最终的未分裂子节点包括译码节点,所述译码节点也被称作叶CU。与经译码位流相关联的语法数据可定义可分裂CTU的最大次数(其被称作最大CU深度),且也可定义译码节点的最小大小。因此,位流也可定义最小译码单元(SCU)。本发明使用术语“块”来指HEVC情形下的CU、预测单元(PU)或变换单元(TU)中的任一者,或其它标准的情形下的类似数据结构(例如,H.264/AVC中的宏块及其子块)。
CU包含译码节点以及与所述译码节点相关联的预测单元(PU)及变换单元(TU)。CU的大小对应于译码节点的大小,且大体上为正方形形状。CU的大小范围可为8×8个像素达至最大大小为例如64×64像素或大于64×64像素的CTU的大小。每一CU可含有一或多个PU及一或多个TU。与CU相关联的语法数据可描述例如将CU分割成一或多个PU。分割模式可在CU经跳过或直接模式编码、帧内预测模式编码或是帧间预测模式编码之间不同。PU可分割成非正方形形状。与CU相关联的语法数据也可描述(例如)根据四分树将CU分割成一或多个TU。TU可为正方形或非正方形(例如,矩形)形状。
HEVC标准允许根据TU进行变换,所述变换对于不同CU可不同。TU通常基于针对经分割CTU界定的给定CU内的PU(或CU的分区)的大小而设定大小,但可能并非总是此情况。TU相较于PU(或例如在帧内预测的情况下CU的分区)通常大小相同或大小较小。在一些实例中,可使用被称为“残余四分树”(RQT)的四分树结构而将对应于CU的残余样本再分为较小单元。可将RQT的叶节点称作变换单元(TU)。与TU相关联的像素差值可经变换以产生可加以量化的变换系数。
叶CU在使用帧间预测时可包含一或多个预测单元(PU)。大体来说,PU表示对应于所述对应CU的全部或一部分的空间区域,且可包含用于针对PU检索及/或产生参考样本的数据。此外,PU包含与预测有关的数据。当CU经帧间模式编码时,CU的一或多个PU可包含界定例如一或多个运动向量的运动信息的数据,或PU可经跳过模式译码。界定PU的运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量指向的参考图片,及/或运动向量的参考图片列表(例如,列表0或列表1)。
叶CU也可经帧内模式预测。一般来说,帧内预测可涉及使用帧内模式来预测叶CU(或其分区)。视频译码器可选择到叶CU的一组相邻的先前译码像素以用以预测叶CU(或其分区)。
叶CU也可包含一或多个变换单元(TU)。如上文所论述,可使用RQT(也称作TU四分树结构)来指定所述变换单元。举例来说,分裂旗标可指示叶CU是否分裂成四个变换单元。接着,可将每一TU进一步分裂为其它若干子TU。当TU未进一步分裂时,可将其称作叶TU。大体来说,对于帧内译码来说,属于叶CU的所有叶TU共享相同的帧内预测模式。即,通常应用同一帧内预测模式来计算叶CU的所有TU的预测值。对于帧内译码,视频编码器可使用帧内预测模式将每一叶TU的残余值计算为CU的对应于所述TU的部分与原始块之间的差。TU不必限于PU的大小。因此,TU可大于或小于PU。对于帧内译码,CU的分区或CU自身可与CU的对应叶TU并置。在一些实例中,叶TU的最大大小可对应于对应叶CU的大小。
此外,叶CU的TU也可与各别四分树数据结构(被称作残余四分树(RQT))相关联。即,叶CU可包含指示所述叶CU如何被分割成TU的四分树。TU四分树的根节点大体对应于叶CU,而CU四分树的根节点大体对应于CTU(或LCU)。将RQT的未被分裂的TU称作叶TU。一般来说,除非另有指出,否则本发明分别使用术语CU及TU来指叶CU及叶TU。
视频序列通常包含以随机存取点(RAP)图片开始的一系列视频帧或图片。视频序列可包含序列参数集(SPS)中的语法数据,所述序列参数集(SPS)包含视频序列的特性。图片的每一切片可包含描述所述各别切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块进行操作,以便编码视频数据。视频块可对应于CU内的译码节点。视频块可具有固定或变化的大小,且可根据指定译码标准而大小不同。
作为实例,可针对各种大小的PU执行预测。假定特定CU的大小为2N×2N,那么可对2N×2N或N×N的PU大小执行帧内预测,且可对2N×2N、2N×N、N×2N或N×N的对称PU大小执行帧间预测。也可针对2N×nU、2N×nD、nL×2N及nR×2N的PU大小执行帧间预测的不对称分割。在不对称分割中,CU的一个方向未分割,而另一方向分割成25%及75%。CU的对应于25%分割的部分由“n”继之以“上(Up)”、“下(Down)”、“左(Left)”或“右(Right)”的指示来指示。因此,例如,“2N×nU”指水平地以顶部的2N×0.5N PU及底部的2N×1.5N PU分割的2N×2N CU。
在本发明中,“N×N”及“N乘N”可经互换地使用以指视频块的依据垂直及水平尺寸的像素尺寸,例如,16×16像素或16乘16。一般来说,16×16块在垂直方向上将具有16个像素(y=16)且在水平方向上将具有16个像素(x=16)。同样地,N×N块通常在垂直方向上具有N个像素且在水平方向上具有N个像素,其中N表示非负整数值。可按行及列来布置块中的像素。此外,块未必需要在水平方向上具有与垂直方向上相同的数目个像素。举例来说,块可包括N×M个像素,其中M未必等于N。
在使用CU的PU的帧内预测性或帧间预测性译码之后,视频编码器20可计算CU的TU的残余数据。PU可包括描述在空间域(也被称作像素域)中产生预测性像素数据的方法或模式的语法数据,且TU可包括在对残余视频数据应用变换(例如离散余弦变换(DCT)、整数变换、小波变换或在概念上类似的变换)之后变换域中的系数。所述残余数据可对应于未经编码的图片的像素与对应于PU的预测值之间的像素差。视频编码器20可形成TU以包含表示CU的残余数据的经量化变换系数。即,视频编码器20可计算残余数据(以残余块的形式)、变换残余块以产生变换系数的块,且接着量化变换系数以形成经量化变换系数。视频编码器20可形成包含经量化变换系数的TU,以及其它语法信息(例如,TU的分裂信息)。
如上文所提及,在任何变换以产生变换系数后,视频编码器20可执行变换系数的量化。量化通常指变换系数经量化以可能减少用以表示变换系数的数据的量从而提供进一步压缩的过程。所述量化过程可减小与所述系数中的一些或所有相关联的位深度。举例来说,可在量化期间将n位值降值舍位到m位值,其中n大于m。
在量化之后,视频编码器可扫描变换系数,从而从包含经量化变换系数的二维矩阵产生一维向量。所述扫描可经设计以将较高能量(且因此较低频率)系数置于阵列前部,及将较低能量(且因此较高频率)系数置于阵列后部。在一些实例中,视频编码器20可利用预定义扫描次序来扫描经量化的变换系数以产生可经熵编码的串行化向量。在其它实例中,视频编码器20可执行自适应扫描。在扫描经量化变换系数以形成一维向量之后,视频编码器20可(例如)根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法来对一维向量进行熵编码。视频编码器20也可熵编码与经编码的视频数据相关联的供视频解码器30用于解码视频数据的语法元素。
为执行CABAC,视频编码器20可将上下文模型内的上下文指派到待发射的符号。所述上下文可能涉及(例如)符号的相邻值是否为非零。为执行CAVLC,视频编码器20可选择用于待发射的符号的可变长度码。可建构VLC中的码字,使得相对较短码对应于更有可能的符号,而较长码对应于较不可能的符号。以此方式,相对于(例如)针对待发射的每一符号使用相等长度码字,使用VLC可达成位节省。概率确定可基于经指派到符号的上下文。
大体来说,视频解码器30执行尽管与由视频编码器20执行的过程互逆但与其大体上类似的过程,以解码经编码数据。举例来说,视频解码器30反量化且反变换所接收TU的系数以再现残余块。视频解码器30使用发信预测模式(帧内预测或帧间预测)以形成经预测块。接着视频解码器30(在逐像素基础上)使经预测块与残余块组合以再现原始块。可执行额外处理,例如执行解块过程以减少沿块边界的视觉假影。另外,视频解码器30可以尽管与视频编码器20的CABAC编码过程互逆但与其大体上类似的方式使用CABAC解码语法元素。
视频编码器20可进一步(例如)在图片标头、块标头、切片标头中将语法数据(例如基于块的语法数据)、基于图片的语法数据及基于序列的语法数据发送到视频解码器30,或发送其它语法数据例如序列参数集(SPS)、图片参数集(PPS)或视频参数集(VPS)到视频解码器30。
图2为说明视频编码器20的实例的框图,所述视频编码器可实施用于描述于本发明中的增强型线性模型色度内预测的技术。视频编码器20可执行视频切片内的视频块的帧内译码及帧间译码。帧内译码依赖于空间预测以减小或移除给定视频帧或图片内的视频的空间冗余。帧间译码依赖于时间预测以缩减或移除视频序列的邻近帧或图片内的视频的时间冗余。帧内模式(I模式)可指若干基于空间的译码模式中的任一者。例如单向预测(P模式)或双向预测(B模式)的帧间模式可指若干基于时间的译码模式中的任一者。
如图2中所示,视频编码器20接收待编码的视频图帧内的当前视频块。在图2的实例中,视频编码器20包含模式选择单元40、参考图片存储器64(其也可被称作经解码图片缓冲器(DPB))、视频数据存储器65、求和器50、变换处理单元52、量化单元54及熵编码单元56。模式选择单元40又包含运动补偿单元44、运动估计单元42、帧内预测单元46及分割单元48。为了视频块重建构,视频编码器20也包含反量化单元58、反变换单元60及求和器62。也可包含解块滤波器(图2中未展示)以对块边界滤波以从重建构的视频移除方块效应假影。如果需要,解块滤波器将通常滤波求和器62的输出。除了解块滤波器外,也可使用额外滤波器(回路中或回路后)。为简洁起见未展示此类滤波器,但如果需要,此类滤波器可对求和器50的输出进行滤波(作为回路内滤波器)。
如图2中所展示,视频编码器20接收视频数据且将所接收视频数据存储于视频数据存储器85中。视频数据存储器65可存储待由视频编码器20的组件编码的视频数据。可例如从视频源18获得存储于视频数据存储器65中的视频数据。参考图片存储器64可为存储参考视频数据以用于由视频编码器20编码视频数据(例如以帧内或帧间译码模式)的参考图片存储器。视频数据存储器65及参考图片存储器64可由多种存储器装置中的任一者形成,例如动态随机存取存储器(DRAM),包含同步DRAM(SDRAM)、磁阻式RAM(MRAM)、电阻式RAM(RRAM)或其它类型的存储器装置。视频数据存储器65及参考图片存储器64可由相同的存储器装置或单独存储器装置来提供。在各种实例中,视频数据存储器65可与视频编码器20的其它组件一起在芯片上,或相对于那些组件在芯片外。
在编码过程期间,视频编码器20接收待译码的视频帧或切片。可将帧或切片划分成多个视频块。运动估计单元42及运动补偿单元44执行所接收视频块相对于一或多个参考帧中的一或多个块的帧间预测性编码以提供时间预测。帧内预测单元46可替代地执行所接收视频块相对于与待译码块相同的帧或切片中的一或多个相邻块的帧内预测性编码以提供空间预测。视频编码器20可执行多个译码遍次,(例如)以选择用于每一视频数据块的适当译码模式。
此外,分割单元48可基于对先前译码遍次中的先前分割方案的评估而将视频数据的块分割成子块。举例来说,分割单元48可初始地将帧或切片分割成CTU,且基于位率-失真分析(例如,位率-失真最佳化)来将所述CTU中的每一者分割成子CU。模式选择单元40可进一步产生指示将CTU分割为子CU的四分树数据结构。四分树的叶节点CU可包含一或多个PU及一或多个TU。
模式选择单元40可(例如)基于误差结果而选择预测模式(帧内或帧间)中的一者,且将所得经预测块提供到求和器50以产生残余数据,且提供到求和器62以重建构用作参考帧的经编码块。在可能的帧内预测模式当中,模式选择单元40可确定以根据本发明的技术来使用线性模型色度帧内预测模式。模式选择单元40也将语法元素(例如,运动向量、帧内模式指示符、分区信息及其它此类语法信息)提供到熵编码单元56。
运动估计单元42及运动补偿单元44可高度集成,但出于概念目的而单独说明。由运动估计单元42执行的运动估计为产生运动向量的过程,所述运动向量估计视频块的运动。举例来说,运动向量可指示在当前视频帧或图片内的视频块的PU相对于在参考图片(或其它经译码单元)内的预测性块相对于在所述当前图片(或其它经译码单元)内正经译码的当前块的位移。预测性块为依据像素差被发现紧密地匹配于待译码块的块,所述像素差可通过绝对差和(SAD)、平方差和(SSD)或其它差度量予以确定。在一些实例中,视频编码器20可计算存储于参考图片存储器64中的参考图片的次整数像素位置的值。举例来说,视频编码器20可内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可执行相对于全像素位置及分数像素位置的运动搜寻且输出具有分数像素精确度的运动向量。
运动估计单元42通过将PU的位置与参考图片的预测性块的位置比较而计算经帧间译码切片中的视频块的PU的运动向量。参考图片可从第一参考图片列表(列表0)或第二参考图片列表(列表1)选择,所述列表中的每一者识别存储于参考图片存储器64中的一或多个参考图片。运动估计单元42将经计算运动向量发送到熵编码单元56及运动补偿单元44。
由运动补偿单元44执行的运动补偿可涉及基于由运动估计单元42确定的运动向量提取或产生预测性块。再次,在一些实例中,运动估计单元42与运动补偿单元44可在功能上集成。在接收到当前视频块的PU的运动向量之后,运动补偿单元44可在参考图片列表中的一者中定位运动向量所指向的预测性块。求和器50通过从正经译码的当前视频块的像素值减去预测性块的像素值来形成残余视频块,从而形成像素差值,如下文所论述。一般来说,运动估计单元42相对于明度分量而执行运动估计,且运动补偿单元44将基于所述明度分量所计算的运动向量用于色度分量与明度分量两者。模式选择单元40也可产生与视频块及视频切片相关联的语法元素以供视频解码器30在解码视频切片的视频块中使用。
作为由运动估计单元42及运动补偿单元44执行的帧间预测的替代,帧内预测单元46可对当前块进行帧内预测,如上文所描述。详细来说,帧内预测单元46可确定待用以编码当前块的帧内预测模式。在一些实例中,帧内预测单元46可(例如)在单独的编码遍次期间使用各种帧内预测模式来编码当前块,且帧内预测单元46(或在一些实例中,模式选择单元40)可从所测试的模式选择待使用的适当帧内预测模式。
举例来说,帧内预测单元46可使用对于各种所测试的帧内预测模式的速率-失真分析来计算速率-失真值,且在所测试的模式当中选择具有最佳速率-失真特性的帧内预测模式。速率失真分析大体上确定经编码块与原始未编码块(其经编码以产生经编码块)之间的失真(或误差)量,以及用以产生经编码块的位率(即,位的数目)。帧内预测单元46可根据各种经编码块的失真及速率来计算比率以确定哪一帧内预测模式展现所述块的最佳速率-失真值。
在针对块选择帧内预测模式之后,帧内预测单元46可将指示用于块的所选帧内预测模式的信息提供到熵编码单元56。熵编码单元56可编码指示所述所选择帧内预测模式的信息。视频编码器20可在经发射位流中包含以下各者:配置数据,其可包含多个帧内预测模式索引表及多个经修改帧内预测模式索引表(也被称作码字映射表);各种块的编码上下文的定义;及待用于所述上下文中的每一者的最可能帧内预测模式、帧内预测模式索引表及经修改帧内预测模式索引表的指示。
如下文将更详细地解释,帧内预测单元46可经配置以执行本发明中描述的增强型线性模型色度帧内预测技术。
视频编码器20通过从正被译码的原始视频块减去来自模式选择单元40的预测数据而形成残余视频块。求和器50表示执行此减法运算的一或多个组件。变换处理单元52将变换(例如离散余弦变换(DCT)或概念上类似的变换)应用于残余块,从而产生包括残余变换系数值的视频块。替代DCT,可使用小波变换、整数变换、子频带变换、离散正弦变换(DST)或其它类型的变换。在任何情况下,变换处理单元52将变换应用于残余块,从而产生变换系数块。所述转换可将残余信息从像素域转换到变换域,例如,频域。变换处理单元52可将所得变换系数发送到量化单元54。量化单元54量化变换系数以进一步减少位速率。所述量化过程可减小与所述系数中的一些或所有相关联的位深度。可通过调整量化参数来修改量化程度。
在量化之后,熵编码单元56熵译码经量化变换系数。举例来说,熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵译码技术。在基于上下文的熵译码的情况下,上下文可基于相邻块。在由熵编码单元56进行熵译码之后,可将经编码位流发射到另一装置(例如,视频解码器30),或加以存档以供稍后发射或检索。
反量化单元58及反变换单元60各别地应用反量化及反变换以重建构像素域中的残余块。特定来说,求和器62将经重建构残余块添加到由运动补偿单元44或帧内预测单元46较早产生的运动补偿预测块,以产生用于存储于参考图片存储器64中的经重建构的视频块。所述经重建构的视频块可由运动估计单元42及运动补偿单元44使用作为参考块以对后续视频帧中的块进行帧间译码。
以此方式,图2的视频编码器20表示视频编码器的实例,所述视频编码器经配置以编码第一视频数据块的明度样本的块,重建构明度样本的经编码块以产生经重建构明度样本,及使用第一视频数据块的经重建构样本及两个或多于两个线性预测模型来预测第一视频数据块的色度样本。
在一个实例中,一种译码视频数据的方法包括确定第一视频数据块的明度样本;确定用以预测所述第一视频数据块的色度样本的预测模型;确定用以对所述明度样本进行降频取样的多个降频取样滤波器中的一个;使用所述所确定的降频取样滤波器来对所述明度样本进行降频取样以产生经降频取样的明度样本;及使用所述第一视频数据块的所述经降频取样的明度样本及所述预测模型而预测所述第一视频数据块的色度样本。
在一个实例中,一种译码视频数据的方法包括确定所述视频数据的当前色度块是否使用线性模型译码;在视频数据的所述当前色度块使用线性模型译码情况下,使用所述线性模型译码所述当前视频数据色度块;在视频数据的所述当前色度块并非使用线性模型译码情况下,所述方法进一步包括确定线性模式角预测在所述当前块确定为不使用所述线性模型译码时被是否启用;在启用了线性模式角预测情况下将角模式预测型样及线性模型预测型样应用于所述当前色度块的样本;及确定针对所述当前色度块的所述样本的最终线性模式角预测为所述所应用的角模式预测型样与线性模型预测型样的经加权和。
在一个实例中,一种用于译码视频数据的装置包括存储视频数据的存储器以及包括一或多个处理器的视频译码器,所述一或多个处理器经配置以确定所述视频数据的当前色度块是否使用线性模型译码;在视频数据的所述当前色度块使用线性模型译码情况下,使用所述线性模型译码视频数据的所述当前色度块;在视频数据的所述当前色度块并非使用线性模型译码情况下,所述一或多个处理器经进一步配置以确定线性模式角预测在所述当前块确定为不使用所述线性模型时是否被启用;在启用了线性模式角预测情况下将角模式预测型样及线性模型预测型样应用于所述当前色度块的样本;及确定针对所述当前色度块的所述样本的最终线性模式角预测为所述所应用的角模式预测型样与线性模型预测型样的经加权和。
在一个实例中,一种译码视频数据的方法包括相对于当前块视频数据确定使用线性模型译码模式译码的相邻色度块的数目,及基于使用所述线性模型译码模式译码的视频数据的相邻色度块的所确定数目动态地改变用以指示线性模型译码模式的特定类型的码字。
在一个实例中,一种用于译码视频数据的装置包括存储视频数据的存储器及包括一或多个处理器的视频译码器,所述一或多个处理器经配置以相对于当前块视频数据确定使用线性模型译码模式译码的相邻色度块的数目,及基于使用所述线性模型译码模式译码的视频数据的相邻色度块的所确定数目动态地改变用以指示线性模型译码模式的特定类型的码字。
在一个实例中,一种译码视频数据的方法包括:确定所述视频数据的当前色度块的大小,比较所述当前色度块的所述大小与阈值,在所述当前色度块的所述大小满足所述阈值时应用多个线性模型模式中的线性模型模式,且在所述当前色度块的所述大小并不满足所述阈值时不应用多个线性模型模式中的所述线性模型模式。
在一个实例中,一种用于译码视频数据的装置包括存储视频数据的存储器,及包括一或多个处理器的视频译码器,所述一或多个处理器经配置以确定所述视频数据的当前色度块的大小,比较所述当前色度块的所述大小与阈值,当所述当前色度块的所述大小满足所述阈值时应用多个线性模型模式中的线性模型模式,且在所述当前色度块的所述大小不满足所述阈值时不应用多个线性模型模式中的所述线性模型模式。
图3为说明视频解码器30的实例的框图,所述视频解码器可实施用于本发明中描述的增强型线性模型色度内预测的技术。在图3的实例中,视频解码器30包含熵解码单元70、运动补偿单元72、帧内预测单元74、反量化单元76、反变换单元78、参考图片存储器82、视频数据存储器85及求和器80。在一些实例中,视频解码器30可执行大体上互逆于关于视频编码器20(图2)所描述的编码遍次的解码遍次。运动补偿单元72可基于从熵解码单元70接收的运动向量产生预测数据,而帧内预测单元74可基于从熵解码单元70接收的帧内预测模式指示符产生预测数据。
在解码过程期间,视频解码器30从视频编码器20接收表示经编码视频切片的视频块及相关联语法元素的经编码视频位流。视频解码器30将所接收的经编码视频位流存储于视频数据存储器85中。视频数据存储器85可存储待由视频解码器30的组件解码的视频数据,例如经编码视频位流。存储于视频数据存储器85中的视频数据可(例如)经由计算机可读媒体16从存储媒体或从本地视频源(例如摄像机)或通过存取物理数据存储媒体获得。视频数据存储器85可形成存储来自经编码视频位流的经编码视频数据的经译码图片缓冲器(CPB)。参考图片存储器82可为参考图片存储器,其存储参考视频数据以用于例如以帧内译码模式或帧间译码模式由视频解码器30解码视频数据。视频数据存储器85及参考图片存储器82可通过例如DRAM、SDRAM、MRAM、RRAM或其它类型的存储器装置的多种存储器装置中的任一者来形成。视频数据存储器85及参考图片存储器82可由相同的存储器装置或单独存储器装置来提供。在各种实例中,视频数据存储器85可与视频解码器30的其它组件一起在芯片上,或相对于那些组件在芯片外。
视频解码器30的熵解码单元70熵解码位流以产生经量化系数、运动向量或帧内预测模式指示符及其它语法元素。熵解码单元70将运动向量及其它语法元素转递到运动补偿单元72。视频解码器30可在视频切片层级及/或视频块层级接收语法元素。
当视频切片经译码为经帧内译码(I)切片时,帧内预测单元74可基于发信帧内预测模式及来自当前帧或图片的先前经解码块的数据来产生用于当前视频切片的视频块的预测数据。当视频块译码为经帧间译码(即,B或P)切片时,运动补偿单元72基于接收自熵解码单元70的运动向量及其它语法元素产生针对当前视频切片的视频块的预测性块。可由参考图片列表中的一者内的参考图片中的一者产生预测性块。视频解码器30可基于存储于参考图片存储器82中的参考图片使用默认建构技术来建构参考帧列表即列表0及列表1。
运动补偿单元72通过剖析运动向量及其它语法元素来确定当前视频切片的视频块的预测信息,且使用所述预测信息产生正经解码的当前视频块的预测性块。举例来说,运动补偿单元72使用所接收语法元素中的一些来确定用于译码视频切片的视频块的预测模式(例如,帧内或帧间预测)、帧间预测切片类型(例如,B切片或P切片)、所述切片的参考图片列表中的一或多者的建构信息、所述切片的每一经帧间编码视频块的运动向量、所述切片的每一经帧间译码视频块的帧间预测状态及用以解码当前视频切片中的视频块的其它信息。
运动补偿单元72也可执行基于内插滤波器的内插。运动补偿单元72可使用如由视频编码器20在编码视频块期间使用的内插滤波器来计算参考块的子整数像素的内插值。在此情况下,运动补偿单元72可根据接收的语法元素确定由视频编码器20使用的内插滤波器且使用所述内插滤波器来产生预测性块。
如下文将更详细地解释,帧内预测单元74可经配置以执行本发明中描述的增强型线性模型色度内预测技术。
反量化单元76反量化(即,解量化)位流中所提供且由熵解码单元70解码的经量化的变换系数。反量化过程可包含使用视频解码器30针对视频切片中的每一视频块计算的量化参数QPY以确定应应用的量化程度及同样反量化程度。
反变换单元78将反变换(例如,反DCT、反整数变换或在概念上类似的反变换过程)应用于变换系数,以便在像素域中产生残余块。
在运动补偿单元72基于运动向量及其它语法元素产生当前视频块的预测性块后,视频解码器30通过对来自反变换单元78的残余块与由运动补偿单元72产生的对应预测性块求和而形成经解码的视频块。求和器80表示执行此求和运算的所述组件。必要时,也可应用解块滤波器来对经解码块进行滤波以便移除块效应假影。也可使用其它滤波器(在译码回路内或在译码回路之后)使像素转变平滑,或另外改良视频质量。接着将给定帧或图片中的经解码的视频块存储于参考图片存储器82中,所述参考图片存储器存储用于后续运动补偿的参考图片。参考图片存储器82也存储经解码视频以用于稍后在显示装置(例如,图1的显示装置32)上呈现。
以此方式,图3的视频解码器30表示视频解码器的实例,所述视频解码器经配置以接收第一视频数据块的明度样本的经编码块,解码明度样本的经编码块以产生经重建构明度样本,及使用第一视频数据块的经重建构明度样本及两个或多于两个线性预测模型来预测第一视频数据块的色度样本。
在一个实例中,一种译码视频数据的方法包括确定第一视频数据块的明度样本;确定用以预测所述第一视频数据块的色度样本的预测模型;确定多个降频取样滤波器中用以对所述明度样本进行降频取样的一者;使用所述所确定的降频取样滤波器来对所述明度样本进行降频取样以产生经降频取样的明度样本;及使用所述第一视频数据块的所述经降频取样的明度样本及所述预测模型而预测所述第一视频数据块的色度样本。
在一个实例中,一种译码视频数据的方法包括确定所述视频数据的当前色度块是否使用线性模型译码;在视频数据的所述当前色度块使用线性模型译码情况下,使用所述线性模型译码视频数据的所述当前色度块;在视频数据的所述当前色度块并非使用线性模型译码情况下,所述方法进一步包括确定线性模式角预测在所述当前块确定为不使用所述线性模型译码时是否被启用;在启用了线性模式角预测情况下将角模式预测型样及线性模型预测型样应用于所述当前色度块的样本;及确定针对所述当前色度块的所述样本的最终线性模式角预测为所述所应用的角模式预测型样与线性模型预测型样的经加权和。
在一个实例中,一种用于译码视频数据的装置包括存储视频数据的存储器以及包括一或多个处理器的视频译码器,所述一或多个处理器经配置以确定所述视频数据的当前色度块是否使用线性模型译码;在视频数据的所述当前色度块使用线性模型译码情况下,使用所述线性模型译码视频数据的所述当前色度块;在视频数据的所述当前色度块并非使用线性模型译码情况下,所述一或多个处理器经进一步配置以确定线性模式角预测在所述当前块确定为不使用所述线性模型时是否被启用;在启用了线性模式角预测情况下将角模式预测型样及线性模型预测型样应用于所述当前色度块的样本;及确定针对所述当前色度块的所述样本的最终线性模式角预测为所述所应用的角模式预测型样与线性模型预测型样的经加权和。
在一个实例中,一种译码视频数据的方法包括相对于当前块视频数据确定使用线性模型译码模式译码的相邻色度块的数目,及基于使用所述线性模型译码模式译码的视频数据的相邻色度块的所确定数目动态地改变用以指示线性模型译码模式的特定类型的码字。
在一个实例中,一种用于译码视频数据的装置包括存储视频数据的存储器及包括一或多个处理器的视频译码器,所述一或多个处理器经配置以相对于当前块视频数据确定使用线性模型译码模式译码的相邻色度块的数目,及基于使用所述线性模型译码模式译码的视频数据的相邻色度块的所确定数目动态地改变用以指示线性模型译码模式的特定类型的码字。
在一个实例中,一种译码视频数据的方法包括:确定所述视频数据的当前色度块的大小,比较所述当前色度块的所述大小与阈值,在所述当前色度块的所述大小满足所述阈值时应用多个线性模型模式中的线性模型模式,且在所述当前色度块的所述大小并不满足所述阈值时不应用多个线性模型模式中的所述线性模型模式。
在一个实例中,一种用于译码视频数据的装置包括存储视频数据的存储器,及包括一或多个处理器的视频译码器,所述一或多个处理器经配置以确定所述视频数据的当前色度块的大小,比较所述当前色度块的所述大小与阈值,当所述当前色度块的所述大小满足所述阈值时应用多个线性模型模式中的线性模型模式,且在所述当前色度块的所述大小不满足所述阈值时不应用多个线性模型模式中的所述线性模型模式。
线性模型(LM)色度内预测是在陈等人的“CE6.a.4:由重构建明度样本进行的色度帧内预测(CE6.a.4:Chroma intra prediction by reconstructed luma samples)”(ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG1的关于视频译码的联合合作小组(JCT-VC))第五次会议:日内瓦,2011年3月16日到23日,JCTVC-E266)中对于JCT-VC来提议,所述文献可在http://phenix.int-evry.fr/jct/doc_end_user/documents/5_Geneva/wg11/JCTVC- E0266-v4.zip.获得。LM模式也已对于JVET提议,且描述于陈等人的“联合探索测试模型3的 算法描述(Algorithm Description of Joint Exploration Test Model 3)”的章节2.2.4(ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11的关于视频译码的联合合作小组(JVET))第 三次会议:瑞士日内瓦,2016年5月26日到6月1日,JVET-C1001))中,且所述文献可在 http://phenix.int-evry.fr/jvet/doc_end_user/documents/3_Geneva/wg11/JVET- C1001-v3.zip处获得。LM模式假设,视频块的明度分量与色度分量之间存在线性关系。当根据LM模式译码视频数据时,视频编码器20(例如,帧内预测单元46)及视频解码器30(例如,帧内预测单元74)可经配置以通过利用线性回归方法来分析视频数据块的相邻经重建构像素以确定明度样本与色度样本之间的关系。当使用LM模式时,视频编码器20及视频解码器30可经配置以从同一块的经重建构明度值预测色度值(例如,Cr及Cb色度样本两者)如下。
PredC[x,y]=α·RecL'[x,y]+β (1)
其中PredC指示块中色度样本的预测,且RecL指示块中经重建构明度样本。参数α及β从相邻于当前块的致因性重建构样本导出。
在一些实例中,色度分量的取样比率为明度分量与色度分量在YUV420取样(例如,也称为4:2:0色度子取样)中在垂直方向上具有0.5像素相位差的取样比率的一半。经重建构明度样本在垂直方向上经降频取样,且在水平方向上进行子取样以使色度信号的大小及相位(即,块中色度分量的预期数目)匹配如下:
RecL'[x,y]=(RecL[2x,2y]+RecL[2x,2y+1])>>1 (2)
其中>>为逻辑右移。
LM的一个实例利用经降频取样的明度分量与致因性色度分量的致因性重建构数据之间的线性最小二乘法解以导出线性模型参数α及β。举例来说,模型参数α及β可导出如下:
Figure BDA0001992032740000221
Figure BDA0001992032740000222
其中RecC(i)及RecL'(i)指示相邻于目标块的经重建构色度样本及降频取样明度样本,且I指示相邻数据的样本的总数。
图4为说明用于导出模型参数α及模型参数β的样本的位置的概念图。如图4中所说明,仅标记为戈瑞(gray)环的剩余及以上致因性样本涉及于计算模型参数α及模型参数β中以保持总样本数目I为2的幂数。对于目标N×N色度块,当左侧及上方致因性样本两者都可用时,所涉及样本的总数目I为2N;当仅剩余样本或上方致因性样本可用时,涉及样本的总数目为N。
图5为明度(Y)分量与色度(C)分量之间的线性回归的实例的图形。如图5中所说明,根据一个实例,可使用线性回归方法解算明度分量与色度分量之间的线性关系。在图5中,概念图上的点对应于一对样本Rec′L[x,y],Recc[x,y])。
图6为说明JEM3.0中明度样本降频取样的实例的概念图。在图6的实例中,三角形符号表示经降频取样的明度值,而圆形符号表示原始经重建构明度样本(即,在任何降频取样之前)。线表示原始明度样本中的哪些用以根据每一特定降频取样滤波器产生经降频取样的明度值。在一个实例中,JVET将更复杂的明度样本降频取样滤波器用于JEM3.0中的LM模式,如本发明的图6中所说明,其中
Rec′L[x,y]=(2·RecL[2x,2y]+2·RecL[2x,2y+1]+RecL[2x-1,2y]+RecL[2x+1,2y]+RecL[2x-1,2y+1]+RecL[2x+1,2y+1]+4)>>3
当样本位于图片边界处时,二分接头滤波器可如以上等式(2)中一般予以应用。
LM色度预测的先前技术将单一线性回归模型用于从经重建构明度值预测色度值。然而,此方法可具有针对某些视频序列的缺点。举例来说,明度样本与色度样本之间的关系越过所有可能明度值可能并非线性的。因此,在一些实例中,LM色度预测可将非所要量的失真引入经解码视频中。此情形对于具有广泛范围的明度值的视频数据块可尤其为真。本发明描述用于执行LM色度预测的技术,包含用于明度子取样的技术;及组合式LM色度预测及角预测模式。本发明的技术可改良使用LM色度预测模式编码及解码的视频数据的视觉质量。
在一些实例中,本发明描述多个明度子取样滤波器的概念。在一个实例中,当启用LM色度预测模式时,一或多组降频取样滤波器可进一步在序列参数集(SPS)、图片参数集(PPS)或切片标头中予以发信。在一个实例中,可引入补充增强信息(SEI)消息语法以描述降频取样滤波器。在一个实例中,可在不发信情况下界定默认降频取样滤波器,例如,6分接头滤波器[1,2,1;1,2,1]。在一个实例中,视频编码器20可在一个PU/CU/最大CU中发信用于LM预测模式中的滤波器的索引。在一个实例中,滤波器分接头的使用可在不发信情况下在运作中导出。举例来说,视频解码器30可经配置以在无显式发信情况下从经编码视频位流及/或译码模式的特性确定滤波器分接头的使用。
如下文将进一步详细地描述,本发明描述多模型LM(MMLM)方法、多滤波器LM(MFLM)方法及LM角预测(LAP)方法,所述方法中的每一者可单独或组合地利用。
在一个实例中,当利用MMLM方法时,视频编码器20及视频解码器30可经配置以将一个以上线性模型(例如,多个线性模型)用于单一块/译码单元(CU)/变换单元(TU)以从块的明度分量预测块的色度分量。视频编码器20及视频解码器30可经配置以使用相邻明度样本及相邻色度样本来导出多个线性模型。
当前块的相邻明度样本及相邻色度样本可基于样本的值来分类成若干群组。每一群组用作训练集合以导出不同线性模型(即,特定α及β针对每一特定群组而导出)。在一个实例中,此外,视频编码器20及视频解码器30经配置以基于针对相邻样本的分类的相同规则来对对应当前明度块(即,对应于当前色度块的明度块)的样本分类。
在一个实例中,视频编码器20及视频解码器30经配置以将每一线性模型应用于对应经分类明度样本以便获得部分经预测色度块。视频编码器20及视频解码器30经配置以组合从每一线性模型获得的每一部分预测色度块以获得最终经预测色度块。在另一实例中,视频编码器20及视频解码器30可经配置以将每一线性模型应用于当前块的所有明度样本以获得多个经预测色度块。视频编码器20及视频解码器30可接着将加权平均值应用于多个经预测色度块中的每一者以获得最终经预测色度块。
在一些实例中,视频编码器20及视频解码器30可经配置以要求群组中分类之后的样本的数目大于或等于特定数目(例如,每分类群组至少2个样本)。在一个实例中,一个分类群组中样本的最少数目经预定义,且相同值用于所有块大小。在另一实例中,一个分类群组中样本的最少数目可为变量,且可取决于当前块的大小,及/或可取决于其它特征(例如,所述分类群组包含最少数目个样本可取决于相邻块的预测模式)。如果群组中样本的数目小于针对某块界定的最小值,那么其它群组中的样本可改变到此群组(例如,可组合来自相邻分类群组的样本)。举例来说,具有最多样本的群组中的样本可改变到具有小于块的所界定最小数目的样本的群组。
在一个实例中,具有最多样本的群组(命名为群组A)中的样本可改变到具有低于块的所界定最小数目的样本的群组(被命名为群组B),如果所述样本为距群组B中的现有样本最近的样本。在一个实例中,“最近”可指像素位置上最近。在另一实例中,“最近”可指最接近强度(例如,色度或明度值)。在另一实例中,块的所界定最小数目可取决于译码块的宽度及/或高度。
在一个实例中,相邻明度及色度样本的分类可基于样本的强度(例如,相邻样本的明度及/或色度值)及/或相邻明度及/或色度样本的位置。在一个实例中,视频编码器20可经配置以发信语法元素到视频解码器30,所述语法元素指示待使用的分类方法。
在一个实例中,类别的数目可经预定义且针对所有视频序列固定。在一个实例中,视频编码器20可经配置而在PPS、SPS及/或切片标头中的一或多者中在经编码视频位流中将类别的数目发信到视频解码器30。在一个实例中,类别的数目可取决于块大小,(例如)当前明度/色度块的宽度及/或高度。MMLM的M类别的实例给定如下:
Figure BDA0001992032740000241
在以上实例中,T1-TM-1为针对每一分类群组的阈值位准,且因此每一对应线性模型的阈值位准为Predc[x,y]=αM·Rec′L[x,y]+βM。在以上实例中,阈值可定义为明度样本的值。具有在两个连续阈值之间的值的相邻明度样本(Rec′L[x,y])(例如,Tm-1<Rec′L[x,y]≤Tm)经分类成第m群组(其中m是从1到M(包含))。在一个实例中,T-1可定义为负值,例如-1。通过(T1…TM-1)指明的(M-1)阈值可从视频编码器20发信到视频解码器30。在其它实例中,阈值可经预定义并存储于视频编码器20及视频解码器30中的每一者处。
在一个实例中,视频编码器20及视频解码器30可经配置以取决于以下各者来计算阈值:相邻经译码明度/色度样本的全部或部分子集,及/或当前块中的经译码明度样本。
图7A到7E为根据本发明的实例的描绘相邻样本到多个群组的分类以及每一群组的线性模型的确定的图形。相邻样本到两个群组的分类说明于图7A中,相邻样本到三个群组的分类说明于图7B中,且相邻样本到两个或多于两个的非连续群组的分类说明于图7C到7E中。在一些实例中,阈值的定义或计算可依据不同M值(例如,取决于群组的数目且因此取决于线性模型的数目的不同阈值)而不同。
在一个实例中,如图7A中所说明,当M等于2时,相邻样本可分类成两个群组。其中Rec′L[x,y]≤阈值的相邻样本可分类成群组1;而其中Rec′L[x,y]>阈值的相邻样本可分类成群组2。视频编码器20及视频解码器30可经配置以导出两个线性模型(一个线性模型用于每一群组)如下:
Figure BDA0001992032740000251
在根据图7A的一个实例(即,其中两个群组经分类)中,视频编码器20及视频解码器30可经配置以计算阈值为相邻译码(也被表明为“经重建构”)明度样本的平均值。如上文所论述,视频编码器20及视频解码器30可经配置以在色度分量经子取样(例如,使用不同于4:4:4的色度子取样格式)情况下对经重建构明度样本进行降频取样。在另一实例中,视频编码器20及视频解码器30可经配置以计算阈值为相邻经译码明度样本的中位值。在另一实例中,视频编码器20及视频解码器30可经配置以计算阈值为minV与maxV的平均值,其中minV及maxV分别为相邻经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样)的最小值及最大值。在另一实例中,视频编码器20及视频解码器30可经配置以计算阈值为相邻经译码明度样本与当前块的经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样)的平均值。在另一实例中,视频编码器20及视频解码器30可经配置以计算阈值为相邻经译码明度样本及当前块中经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样)的中位值。在另一实例中,视频编码器20及视频解码器30可经配置以计算阈值为minV与maxV的平均值,其中minV及maxV分别为相邻经译码明度样本及当前块中经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样)的最小值及最大值。
在一个实例中,如图7B中所说明,当M等于3时,相邻样本可分类成三个群组。其中Rec′L[x,y]≤阈值1的相邻样本(例如,明度样本)可被分类成群组1;其中阈值1<Rec′L[x,y]≤阈值2的相邻样本可分类成群组2,且其中Rec′L[x,y]>阈值2的相邻样本可分类成群组3。视频编码器20及视频解码器30可经配置以导出三个线性模型为:
Figure BDA0001992032740000261
在一个实例中,视频编码器20及视频解码器30可经配置以针对在M等于2时的情况使用上文所描述的方法而计算阈值。视频编码器20及视频解码器30可经进一步配置以计算阈值1(例如,如图7B中所展示)为minV与阈值的平均值。视频编码器20及视频解码器30可经配置以计算阈值2(例如,如图7B中所展示)为maxV与阈值的平均值。minV及maxV的值可分别为相邻经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样)的最小值及最大值。
在另一实例中,视频编码器20及视频解码器30可经配置以计算阈值1为sumV的1/3,且阈值2可计算为sumV的2/3,其中sumV为相邻经译码明度样本(在并非呈4:4:4格式情况下可经降频取样)的累积总和值。
在另一实例中,视频编码器20及视频解码器30可经配置以计算阈值1为S[N/3]与S[N/3+1]之间的值,且阈值2可计算为S[2*N/3]与S[2*N/3+1]之间的值。在此实例中,N可为相邻经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样)的总数。S[0],S[1],…S[N-2],S[N-1]可为相邻经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样)的递升归类序列。
在另一实例中,视频编码器20及视频解码器30可经配置以使用上文针对M等于2时的情况描述的任何方法来计算阈值。视频编码器20及视频解码器30可经进一步配置以计算阈值1为minV与阈值的平均值。视频编码器20及视频解码器30可经配置以计算阈值2为maxV与阈值的平均值。在此实例中,minV与maxV的值可分别为以下两者的最小值及最大值:相邻经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样),及当前块中的经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样)。
在另一实例中,视频编码器20及视频解码器30可经进一步配置以计算阈值1为sumV的1/3。视频编码器20及视频解码器30可经配置以计算阈值2为sumV的2/3。在此实例中,sumV可为以下两者的经累积总和值:相邻经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样),及当前块中的经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样)。
在另一实例中,视频编码器20及视频解码器30可经配置以计算阈值1为S[N/3]与S[N/3+1]之间的值,且阈值2可经计算为S[2*N/3]及S[2*N/3+1]之间的值。在此实例中,N可为以下各者的总数:相邻经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样),及当前块中的经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样)。S[0],S[1],…S[N-2],S[N-1]可为以下各者的递升归类序列:相邻经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样),及当前块中的经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样)。
在一个实例中,每一群组的经导出线性关系(在图7A到7E中表示为线)可为连续分段的,如图7A及图7B中可看出,其中针对邻近群组的线性模型在各种阈值下引起相同值,如以下等式(8)及(9)中所展示:
α1·Rec'L[x,y]+β1=α2·Rec'L[x,y]+β2 若Rec'L[x,y]=阈值 (8)
在图7A中,且
Figure BDA0001992032740000271
在图7B中。
在另一实例中,每一群组的经导出线性关系可为非连续分段的,如图7C及图7E中一般,其中邻近群组的线性模型在各种阈值下并不引起相同值,如以下等式(10)及(11)中所展示
α1·Rec'L[x,y]+β1≠α2·Rec'L[x,y]+β2 若Rec'L[x,y]=阈值 (10)
在图7C中,且
Figure BDA0001992032740000272
在图7E中。
为了将不连续分段线性模型(例如,展示于图7C中的非连续分段线性模型)转换成连续分段线性模型,视频编码器20及视频解码器30可经配置以产生在两个阈值之间的过渡区。过渡区中的线性模型的片段连接原始线性模型。在此情况下,非连续的两个模型关系在转换之后引起三个模型关系(如图7D中所展示)。视频编码器20及视频解码器30可经配置以基于用于分类的原始阈值的值以及相邻样本的值及/或当前块样本的值来导出过渡区的边界(图7D中为Zo到Z1)。
在具有过渡区的实例中,线性模型可定义如下:
Figure BDA0001992032740000273
如果Rec'L[x,y]是在过渡区[Z0,Z1]中。
在一个实例中,
s=Z1-Z01=Z1-Rec'L[x,y],ω2=s-ω1
在一个实例中,
s=2n=Z1-Z01=Z1-Rec'L[x,y],ω2=s-ω1
Figure BDA0001992032740000281
经转换的连续分段线性模型可用以替换非连续的连续分段线性模型,或可经插入作为额外LM预测模式。
通过本发明的MMLM技术,更多相邻的明度及/或色度样本可用以相对于较早LM预测模式技术导出线性模型。图8A展示用于LM模式的先前实例中的相邻色度样本。相同相邻色度样本可用于本发明的MMLM技术。图8B到8D为根据本发明的实例的用以在MMLM模式中导出线性模型的相邻色度样本的其它实例群组的概念图。在图8B到8D中,更多相邻样本用以相对于图8A以MMLM导出线性模型。图8A到8D中的黑点表示用以根据本发明的MMLM技术导出两个或多于两个线性模型的相邻色度样本。块外部的白点展示未使用的其它相邻色度样本。帧内部的白点表示待进行预测的块的色度样本。对应经降频取样的明度样本也可用以导出线性模型。
图9为根据本发明的MMLM技术的一个实例的相邻样本分类的概念图。图9说明当前块及相邻块中具有经译码相邻色度样本及对应经译码明度样本(Rec'L,其在并非呈4:4:4格式的情况下可经降频取样)的4×4当前译码色度块(Recc)。根据一个实例,在MMLM模式中,视频编码器20及视频解码器30可经配置以将相邻经译码明度样本分类成数个群组。在图9的实例中,相邻经译码明度样本经分类成两个群组。Rec′L[x,y]≤阈值的相邻明度样本可分类成群组1;而Rec′L[x,y]>阈值的相邻样本可分类成群组2。在此实例中,例如,阈值可为17。视频编码器20及视频解码器30可经配置以根据对应相邻明度样本的分类对相邻色度样本进行分类。即,对应色度样本经分类到与同一位置中的对应明度样本相同的群组中。
如图9中所展示,当前块中的明度样本及相邻明度样本两者中的每一者具有以每一圆描绘的相关联明度值。小于或等于阈值(在此情况下17)的相邻明度值着色为黑色(群组1)。大于阈值的明度值保持为白色,即,未经着色(群组2)。相邻色度样本基于相同位置中对应明度样本的分类而分类成群组1及群组2。
图10为经分类成2个群组的相邻经译码明度样本的两个线性模型的概念图。在相邻样本经分类成两个群组(例如,如图9中所展示)之后,视频编码器20及视频解码器30可经配置以分离地导出关于两个群组的两个独立线性模型,如图10中所描绘。在此实例中,两个线性模型可针对两个类别获得如下
Figure BDA0001992032740000291
线性模型的参数可以与上文所描述的方式相同的方式来导出,其中参数使用针对所述模型的特定分类群组的样本而针对每一线性模型来导出。
图11为将两个线性模型中的一个线性模型即模型1应用于当前块的所有像素的概念图。图12为将两个线性模型中的另一线性模型即模型2应用于当前块的所有像素的概念图。在一个实例中,视频编码器20及视频解码器30可经配置以如图11及图12中所展示将模型1或模型2中的一者分别应用于对应于当前经译码色度块的降频取样明度块的所有样本(Rec'L),以获得当前块的经预测色度样本(Predc)。在一个实例中,视频编码器20及视频解码器30可经配置以通过两个模型并行地形成经预测色度块。接着,最终预测可通过基于针对每一位置的群组分类(即,基于每一色度位置处每一明度值的群组分类)从两个经预测块选择特定经预测色度样本来获得。
在另一实例中,视频编码器20及视频解码器30可经配置以应用模型1及模型2两者到对应于当前经译码色度块的经降频取样明度块的所有样本(Rec'L),以获得当前块的经预测色度样本的两个版本(Predc)。视频编码器20及视频解码器30经进一步配置以计算经预测色度样本的两个版本的加权平均值。两个预测块(模型1或模型2)的加权平均值可被视为当前色度块的最终预测块。可使用任何加权。作为一个实例,可使用0.5/0.5加权。
图13为根据本发明的MMLM技术的另一实例预测技术的概念图。如图13中所说明,视频编码器20及视频解码器30可首先对当前块中的经重建构明度样本(Rec'L)进行分类。视频编码器20及视频解码器30可经进一步配置以将第一线性模型(例如,图10的模型1)应用于第一分类群组(通过图13中的黑圆表示)中的明度样本。视频编码器20及视频解码器30可经进一步配置以将第二线性模型(例如,图10的模型2)应用于第二分类群组(通过图13中的白圆表示)中的明度样本。
在图13的实例中,经译码明度样本(在并非呈4:4:4格式的情况下经降频取样)可取决于样本的强度(例如,值)分类成两个群组。具有低于或等于阈值的值(例如,Rec′L[x,y]≤阈值的明度样本可分类成群组1,而具有大于阈值的值(例如,Rec′L[x,y]>阈值)的明度样本可分类成群组2。在此实例中,阈值可为17,所述阈值使用相邻经译码明度样本来计算,如上文所描述。在一个实例中,当前块中经重建构明度样本的分类方法与用于经译码相邻明度样本的分类方法相同。
如图13中所说明,视频编码器20及视频解码器30可经配置以将模型1应用于第一分类器群组(黑圆)中当前块中的经译码明度样本(在并未呈4:4:4格式情况下经降频取样)以导出当前块中的对应经预测色度样本。同样,视频编码器20及视频解码器30可经配置以将模型2应用于第二分类群组(白圆)中当前块中的经译码明度样本(在并未呈4:4:4格式情况下经降频取样)以导出当前块中的对应经预测色度样本。因此,当前块中经预测的色度样本根据两个线性模型而导出。当存在更多群组时,更多线性模型可用以获得经预测色度样本。
在一个实例中,视频编码器20可对明度样本应经分类成的群组的数目发信到视频解码器30中。如果数目为1,那么利用原始LM模式。在另一实例中,具有不同数目个群组的LM模式可被视为不同LM模式。举例来说,LM-MM1模式包含1个群组,LM-MM2模式包含2个群组,且LM-MM3模式包含3个群组。LM-MM1可相同于原始LM模式,而LM-MM2及LM-MM3可根据本发明的技术执行。在又一实例中,视频解码器30可在视频编码器20不发信群组的数目的情况下导出群组的数目。
在本发明的另一实例中,描述多滤波器LM(MFLM)模式。在MFLM模式中,一个以上明度降频取样滤波器可在视频数据并非呈4:4:4色度子取样格式的情况下界定。举例来说,可使用除界定于JEM-3.0中的降频取样滤波器(展示于本发明的图6中)外的额外降频取样滤波器。滤波器可呈如下形式:
Rec′L[x,y]=a·RecL[2x,2y]+b·RecL[2x,2y+1]+c·RecL[2x-1,2y]+d·RecL[2x+1,2y]+e·RecL[2x-1,2y+1]+f·RecL[2x+1,2y+1]+g, (12)
其中滤波器权重a、b、c、d、e、f、g为实数。
或,
Rec′L[x,y]=(a·RecL[2x,2y]+b·RecL[2x,2y+1]+c·RecL[2x-1,2y]+d·RecL[2x+1,2y]+e·RecL[2x-1,2y+1]+f·RecL[2x+1,2y+1]+g)/h, (13)
其中滤波器权重a、b、c、d、e、f、g、h为整数。
Rec′L[x,y]=(a·RecL[2x,2y]+b·RecL[2x,2y+1]+c·RecL[2x-1,2y]+d·RecL[2x+1,2y]+e·RecL[2x-1,2y+1]+f·RecL[2x+1,2y+1]+g)>>h, (14)
其中滤波器权重a、b、c、d、e、f、g、h为整数。
图14A到C为根据本发明的实例的明度子取样滤波器的概念图。在图14A到14C的实例中,三角形符号表示经降频取样的明度值,而圆形符号表示原始经重建构明度样本(即,在任何降频取样之前)。线表示原始明度样本中的哪些用以根据每一特定降频取样滤波器产生经降频取样的明度值。针对描绘于图14A到14C中的各种降频取样滤波器的等式展示如下:
(a)Rec′L[x,y]=(RecL[2x,2y]+RecL[2x+1,2y]+1)>>1;
(b)Rec′L[x,y]=(RecL[2x+1,2y]+RecL[2x+1,2y+1]+1)>>1;
(c)Rec′L[x,y]=(RecL[2x,2y]+RecL[2x,2y+1]+1)>>1;
(d)Rec′L[x,y]=(RecL[2x,2y+1]+RecL[2x+1,2y+1]+1)>>1;
(e)Rec′L[x,y]=(RecL[2x,2y]+RecL[2x+1,2y+1]+1)>>1;
(f)Rec′L[x,y]=(RecL[2x,2y+1]+RecL[2x+1,2y]+1)>>1;
(g)Rec′L[x,y]=(RecL[2x,2y]+RecL[2x,2y+1]+RecL[2x-1,2y]+RecL[2x-1,2y+1]+2)>>2;
(h)Rec′L[x,y]=(RecL[2x,2y]+RecL[2x,2y+1]+RecL[2x+1,2y]+RecL[2x+1,2y+1]+2)>>2;
(i)Rec′L[x,y]=(2·RecL[2x,2y]+RecL[2x+1,2y]+RecL[2x-1,2y]+2)>>2;
(j)Rec′L[x,y]=(2·RecL[2x,2y+1]+RecL[2x+1,2y+1]+RecL[2x-1,2y+1]+2)>>2;
(k)Rec′L[x,y]=(RecL[2x-1,2y]+RecL[2x-1,2y+1]+1)>>1;
(l)Rec′L[x,y]=(RecL[2x,2y+1]+RecL[2x-1,2y+1]+1)>>1;
(m)Rec′L[x,y]=(RecL[2x-1,2y]+RecL[2x,2y+1]+1)>>1;
(n)Rec′L[x,y]=(RecL[2x,2y]+RecL[2x-1,2y+1]+1)>>1;
(o)Rec′L[x,y]=(RecL[2x,2y]+RecL[2x-1,2y]+1)>>1;
(p)Rec′L[x,y]=(2·RecL[2x+1,2y]+RecL[2x+1,2y]+RecL[2x+1,2y+1]+2)>>2;
(q)Rec′L[x,y]=(2·RecL[2x+1,2y+1]+RecL[2x,2y+1]+RecL[2x+1,2y]+2)>>2;
(r)Rec′L[x,y]=(5·RecL[2x,2y+1]+RecL[2x-1,2y+1]+RecL[2x+1,2y+1]+RecL[2x,2y]+4)>>3;
如果视频序列并非呈4:4:4色度子取样格式(即,非色度子取样),那么视频编码器20及视频解码器30可经配置以使用原始LM模式(例如,单一模型LM模式)及展示于图14A到14C中滤波器中的一或多者(或除界定于JEM-3.0中且展示于图6中的那些滤波器外的滤波器的任何集合)来执行MFLM。此外,本发明的MFLM技术可结合上文所描述的MMLM技术使用。
在一些实例中,视频编码器20及视频解码器30可经预先配置以使用若干候选降频取样滤波器例如5个滤波器中的一者。视频编码器20可确定最佳滤波器以用于给定视频序列(例如,基于位速率失真测试),且在经编码视频位流中将滤波器索引发信到视频解码器30。滤波器索引可在以下各语法元素层级发信:序列层级(例如,VPS/SPS中)、图片层级(例如,PPS中)、切片层级(例如,切片标头或切片片段标头中)、译码树单元层级(CTU中)、译码单元层级(CU中)、预测单元层级(PU中)、变换单元层级(TU中)或任何其它层级。
在一个实例中,五个候选滤波器可展示如下:
滤波器0:Rec′L[x,y]=(2·RecL[2x,2y]+2·RecL[2x,2y+1]+RecL[2x-1,2y]+RecL[2x+1,2y]+RecL[2x-1,2y+1]+RecL[2x+1,2y+1]+4)>>3,
滤波器1:Rec′L[x,y]=(RecL[2x,2y]+RecL[2x,2y+1]+RecL[2x+1,2y]+RecL[2x+1,2y+1]+2)>>2;
滤波器2:Rec′L[x,y]=(RecL[2x,2y]+RecL[2x+1,2y]+1)>>1;
滤波器3:Rec′L[x,y]=(RecL[2x+1,2y]+RecL[2x+1,2y+1]+1)>>1;
滤波器4:Rec′L[x,y]=(RecL[2x,2y+1]+RecL[2x+1,2y+1]+1)>>1;
滤波器1为JEM-3.0中的原始6分接头滤波器。
具有不同滤波器的LM模式可被视为不同LM模式,例如LM-MF0、LM-MF1、LM-MF2、LM-MF3及LM-MF4。在以上实例中,LM-MF0相同于原始LM模式。在另一实例中,视频解码器30可在视频编码器20不发信降频取样滤波器情况下导出降频取样滤波器。经滤波结果可经削减到有效明度值范围。
图15为根据本发明的实例的以LM角预测(LAP)模式发信的流程图。通过LM角预测(LAP),一些种类的角预测(可包含定向DC平面或其它非横越分量帧内预测)可与LM预测技术组合,包含本发明的MMLM技术,以获得色度块的最终预测。如果当前色度块通过惯例帧内预测而非以任何LM模式而译码,那么例如命名为LAP_flag的旗标的语法元素可经传信。假定当前色度块的预测模式为模式X,则X可为某种类的角帧内预测(包含平面模式及DC模式)。请注意,如果当前色度块作为DM模式发信,那么当前色度块也被视为角模式,此是由于其相同于对应明度块的某种类的角预测模式。
发信LAP预测模式的实例说明于图15中。视频解码器30可确定LM模式是否用以编码当前色度块(120)。如果是,那么视频解码器30继续使用由视频编码器20使用的LM模式来解码当前色度块(124)。如果否,那么视频解码器30读取并剖析LAP_flag(122)。如果LAP_flag指示将使用LAP预测模式(例如,LAP_flag==1),那么视频解码器30使用LAP预测模式来解码当前色度块(128)。如果LAP_flag指示不使用LAP预测模式(例如,LAP_flag==0),那么视频解码器30使用角预测来解码当前色度块(126)。
通过LAP,两个预测型样首先针对色度块产生,且接着将两个预测型样组合在一起。一个预测型样可以若干角预测模式中的一者(例如,角形模式X)来产生。其它预测可通过一种LM模式例如上述LM-MM2模式来产生。
图16为根据本发明的实例的LAP的框图。如图16中所说明,在LAP的一个实例中,首先针对当前块中每一样本的预测可通过角预测模式X产生,其表明为P1(x,y)。接着,当前块中每一样本的预测可通过LM-MM2模式来产生,其表明为P2(x,y)。接着,最终LM-角预测可计算为
P(x,y)=w1(x,y)×P1(x,y)+w2(x,y)×P2(x,y), (15)
其中(x,y)表示块中样本的座标,且w1(x,y)及w2(x,y)为实数。在一个实例中,w1及w2可具有值0.5。在等式(15)中,w1(x,y)及w2(x,y)可满足:
w1(x,y)+w2(x,y)=1。 (16)
在另一实例中,
P(x,y)=(w1(x,y)×P1(x,y)+w2(x,y)×P2(x,y)+a)/b, (17)
其中w1(x,y)、w2(x,y)、a及b为整数。
在等式(17)中,w1(x,y)及w2(x,y)可满足:
w1(x,y)+w2(x,y)=b。 (18)
在另一实例中,
P(x,y)=(w1(x,y)×P1(x,y)+w2(x,y)×P2(x,y)+a)>>b, (19)
其中w1(x,y)、w2(x,y)、a及b为整数。
在等式(17)中,w1(x,y)及w2(x,y)可满足:
w1(x,y)+w2(x,y)=2b。 (20)
在一个实例中,w1(x,y)及w2(x,y)对于不同(x,y)可不同。在另一实例中,w1(x,y)及w2(x,y)对于所有(x,y)可保持不改变。在一个实例中,对于所有(x,y)来说,
P(x,y)=(P1(x,y)+P2(x,y)+1)>>1。 (21)
对于所有(x,y)。
在一个实例中,LAP_flag可使用CABAC来译码。译码内容脉络可取决于相邻块的经译码/解码LAP_flag。举例来说,对于LAP_flag可存在三个内容脉络:LAPctx[0]、LAPctx[1]及LAPctx[2]。图17为当前块的相邻块的概念图。变量ctx计算为ctx=LAP_flag_A+LAP_flag_B,其中LAP_flag_A及LAP_flag_B分别为相邻块A及B或相邻块A1及B1的LAP_flags,如图17中所说明。在一个实例中,P(x,y)可经削减到有效色度值范围。
使用本发明的所提议方法,相较于JEM-3.0中指定的LM模式可存在更多类型的所使用LM模式。本发明进一步描述有效方式以译码用于特定块的色度内预测模式。一般来说,视频编码器20及视频解码器30可经配置以取决于相邻块的色度内预测模式及/或当前块的其它信息而译码所使用的LM预测模式(包含可能的MMLM、MFLM或经组合的MMLM及MFLM模式)。视频编码器20及视频解码器30可经配置以译码所使用的LM预测模式,使得待使用的最可能模式通过用以指定模式的最小码字来译码。以此方式,更少位可用以指示LM模式。哪些模式通过最小码字指定可基于相邻块的色度内预测模式及/或当前块的其它信息为自适应性的。
在一个实例中,例如LM、LM-MM2(2个线性模型)、LM-MM3(3个线性模型)、LM-MF1、LM-MF2、LM-MF3及LM-MF4的一些LM模式为候选LM模式。模式LM-MFX可指示使用明度降频取样滤波器的特定子集的特定LM模式。LM-MF模式可使用单一线性模型LM模式或根据本发明的技术的MMLM。在此实例中,存在7个候选LM模式,且非LM模式经附加以表示当前块通过角模式且非LM模式译码的情况。如果发信了非LM,那么角模式如在JEM-3.0中一般发信,或以任何其它方法发信。所提议的LM模式发信方法不限于如所描述的特定LM预测模式。译码方法(包含码字映射及二进制化等)可应用于任何其它种类的LM模式或色度内预测模式发信。视频编码器20及视频解码器30首先译码DM_flag。如果色度预测模式并非DM模式,那么调用所提议LM_coding()模块以指示当前色度预测模式。如果LM_coding()模块译码非LM模式,那么Chroma_intra_mode_coding()模块经调用以译码角色度预测模式。例示性译码逻辑如下。
Figure BDA0001992032740000341
Figure BDA0001992032740000351
为了发信8个可能模式(包括非LM模式),具有不同码字或二进制化的8个符号即0,1,…,6,7可用以表示8个可能模式。具有较小数字的符号不应具有长于具有较大数字的符号的码长度的码长度(以位计)。符号可以任何方式来二进制化,例如固定长度码、一元码、经截短一元码、指数哥伦布码等。每一符号的另一例示性二进制化是如下:
0:00
1:01
2:100
3:101
4:1100
5:1101
6:1110
7:1111
在另一实例中,每一符号的码字是如下:
0:0
1:100
2:101
3:1100
4:1101
5:1110
6:11110
7:11111
在一个实例中,视频编码器20及视频解码器30可经配置以执行符号与模式之间的默认映射,即,经译码值与译码模式之间的映射。举例来说,默认映射列表可为:
0:LM
1:LM-MM2
2:LM-MM3
3:LM-MF1
4:LM-MF2
5:LM-MF3
6:LM-MF4
7:非LM
根据一个实例,映射可为固定的。在另一实例中,映射可根据相邻块的经解码信息及/或当前块的经解码信息而为动态的。在一个实例中,模式非LM的符号可取决于表明为K的以LM模式译码的相邻色度块的数目而插入到映射列表中。在一个实例中,相邻色度块可界定为用于合并候选列表构造过程中的五个块,即,如图17中所展示的A0、A1、B0、B1及B2。接着,符号映射列表可为:
-如果K==0,那么0:LM,1:非-LM,2:LM-MM2,3:LM-MM3,4:LM-MF1,5:LM-MF2,6:LM-MF3,7:LM-MF4;
-如果0<K<=3,那么0:LM,1:LM-MM2,2:LM-MM3,3:非-LM,4:LM-MF1,5:LM-MF2,6:LM-MF3,7:LM-MF4;
-如果K>3,那么0:LM,1:LM-MM2,2:LM-MM3,3:LM-MF1,4:LM-MF2,5:LM-MF3,6:LM-MF4,7:非-LM;
在另一实例中,模式非LM的符号可取决于并非以表明为K'的以LM模式译码的相邻色度块的数目插入到映射列表中。接着,符号映射列表可为:
-如果K'==5,那么0:LM,1:非-LM,2:LM-MM2,3:LM-MM3,4:LM-MF1,5:LM-MF2,6:LM-MF3,7:LM-MF4;
-如果2<=K'<5,那么0:LM,1:LM-MM2,2:LM-MM3,3:非-LM,4:LM-MF1,5:LM-MF2,6:LM-MF3,7:LM-MF4;
-如果K'<=2,那么0:LM,1:LM-MM2,2:LM-MM3,3:LM-MF1,4:LM-MF2,5:LM-MF3,6:LM-MF4,7:非-LM;
在另一实例中,模式非LM的符号可取决于表明为K'的并非以帧内模式而且并非以LM模式译码的相邻色度块的数目而插入到映射列表中。接着,符号映射列表可为:
-如果K'>=3,那么0:LM,1:非-LM,2:LM-MM2,3:LM-MM3,4:LM-MF1,5:LM-MF2,6:LM-MF3,7:LM-MF4;
-如果2<=K'<3,那么0:LM,1:LM-MM2,2:LM-MM3,3:非-LM,4:LM-MF1,5:LM-MF2,6:LM-MF3,7:LM-MF4;
-如果1<=K'<2,那么0:LM,1:LM-MM2,2:LM-MM3,3:LM-MF1,4:LM-MF2,5:非-LM,6:LM-MF3,7:LM-MF4;
-如果K'==0,那么0:LM,1:LM-MM2,2:LM-MM3,3:LM-MF1,4:LM-MF2,5:LM-MF3,6:LM-MF4,7:非-LM;
在另一实例中,模式非LM的符号可取决于表明为K'的并非以帧内模式而且并非以LM模式译码的相邻色度块的数目而插入到映射列表中。接着,符号映射列表可为:
-如果K'>=3,那么0:LM,1:非-LM,2:LM-MM2,3:LM-MM3,4:LM-MF1,5:LM-MF2,6:LM-MF3,7:LM-MF4;
-如果1<=K'<3,那么0:LM,1:LM-MM2,2:LM-MM3,3:非-LM,4:LM-MF1,5:LM-MF2,6:LM-MF3,7:LM-MF4;
-如果K==0,那么0:LM,1:LM-MM2,2:LM-MM3,3:LM-MF1,4:LM-MF2,5:非-LM,6:LM-MF3,7:LM-MF4;
在另一实例中,模式非LM的符号可取决于表明为K'的并非以帧内模式而且并非以LM模式译码的相邻色度块的数目而插入到映射列表中。接着,符号映射列表可为:
-如果K'>=3,那么0:LM,1:非-LM,2:LM-MM2,3:LM-MM3,4:LM-MF1,5:LM-MF2,6:LM-MF3,7:LM-MF4;
-如果2<=K'<3,那么0:LM,1:LM-MM2,2:LM-MM3,3:非-LM,4:LM-MF1,5:LM-MF2,6:LM-MF3,7:LM-MF4;
-如果K'<2,那么0:LM,1:LM-MM2,2:LM-MM3,3:LM-MF1,4:LM-MF2,5:LM-MF3,6:LM-MF4,7:非-LM;
在另一实例中,模式非LM的符号可取决于表明为K'的并非以帧内模式而且并非以LM模式译码的相邻色度块的数目而插入到映射列表中。接着,符号映射列表可为:
-如果K'>=3,那么0:LM,1:非-LM,2:LM-MM2,3:LM-MM3,4:LM-MF1,5:LM-MF2,6:LM-MF3,7:LM-MF4;
-如果1<=K'<3,那么0:LM,1:LM-MM2,2:LM-MM3,3:非-LM,4:LM-MF1,5:LM-MF2,6:LM-MF3,7:LM-MF4;
-如果K'==0,那么0:LM,1:LM-MM2,2:LM-MM3,3:LM-MF1,4:LM-MF2,5:LM-MF3,6:LM-MF4,7:非-LM;
在一些实例中,使用本发明的LM可取决于块大小。在一个实例中,如果当前色度块的大小为M×N,那么LM-X在M×N<=T情况下并不适用。T可为固定数字,或T值可从视频编码器20发信到视频解码器30。LM-X可为任何所提议的新LM模式,例如LM-MM2、LM-MM3、LM-MF1、LM-MF2、LM-MF3及LM-MF4。
在另一实例中,如果当前色度块的大小为M×N,那么LM-X在M+N<=T情况下并不适用。T可为固定数字,或T值可从视频编码器20发信到视频解码器30。LM-X可为任何所提议的新LM模式,例如LM-MM2、LM-MM3、LM-MF1、LM-MF2、LM-MF3及LM-MF4。
在再一实例中,如果当前色度块的大小为M×N,那么LM-X在Min(M,N)<=T情况下并不适用。T可为固定数字,或T值可从视频编码器20发信到视频解码器30。LM-X可为任何所提议的新LM模式,例如LM-MM2、LM-MM3、LM-MF1、LM-MF2、LM-MF3及LM-MF4。
在再一实例中,如果当前色度块的大小为M×N,那么LM-X在Max(M,N)<=T情况下并不适用。T可为固定数字,或T值可从视频编码器20发信到视频解码器30。LM-X可为任何所提议的新LM模式,例如LM-MM2、LM-MM3、LM-MF1、LM-MF2、LM-MF3及LM-MF4。
使用所提议的LAP可取决于块大小。在一个实例中,LAP在M×N<=T情况下并不适用。T可为固定数字,或T值可从视频编码器20发信到视频解码器30。在另一实例中,LAP在M+N<=T情况下并不适用。在再一实例中,LAP在Min(M,N)<=T情况下并不适用。在再一实例中,LAP在Max(M,N)<=T情况下并不适用。举例来说,T可为整数,例如4、5、6、7、8、9、10、11、12、13、14、15、16……等。
图18为说明本发明的实例编码方法的流程图。图18的技术可通过视频编码器20的一或多个组件执行。
在本发明的一个实例中,视频编码器20可经配置以编码第一视频数据块的明度样本的块(132),重建构明度样本的经编码块以产生经重建构明度样本(134),及使用第一视频数据块的经重建构明度样本及两个或多于两个线性预测模型来预测第一视频数据块的色度样本(136)。
在本发明的另一实例中,视频编码器20可经配置以使用来自视频数据的相邻于第一视频数据块的块的明度样本及色度样本来确定两个或多于两个线性预测模型中的每一者的参数。在一个实例中,视频编码器20可经配置以将大于第一阈值的经重建构明度样本分类为处于多个样本群组的第一样本群组中,将小于或等于第一阈值的经重建构明度样本分类为在多个样本群组的第二样本群组中,将两个或多于两个线性预测模型中的第一线性预测模型应用于第一样本群组中的经重建构明度样本,将两个或模型线性预测模型中的第二线性预测模型应用于第二样本群组中的经重建构明度样本,所述第二线性预测模型不同于第一线性预测模型,且基于所应用的第一线性预测模型及所应用的第二线性预测模型而确定第一视频数据块中的经预测色度样本。在一个实例中,第一阈值取决于相邻经译码明度样本及色度样本。
在本发明的另一实例中,视频编码器20可经配置以对经重建构明度样本进行降频取样。在本发明的另一实例中,视频编码器20可经配置以确定多个降频取样滤波器中的一者以用以对经重建构明度样本进行降频取样,使用所确定的降频取样滤波器对经重建构明度样本进行降频取样来产生经将降频取样的明度样本,且使用经降频取样的明度样本及两个或多于两个线性预测模型来预测第一视频数据块的色度样本。
在本发明的另一实例中,视频编码器20可经配置以确定第二视频数据块的色度样本是否是使用两个或多于两个线性预测模型中的线性预测模型进行译码。在第二视频数据块的色度样本并非是使用线性预测模型进行译码的情况下,视频编码器20可经配置以确定启用线性模式角预测模式,将角模式预测型样应用于第二视频数据块的色度样本以产生第一经预测的色度值,将线性模型预测型样应用于第二视频数据块的对应明度样本以产生第二经预测色度值,且通过确定第一经预测色度值与第二经预测色度值的加权平均值来确定第二视频数据块的具有经预测色度值的最终块。
在本发明的另一实例中,视频编码器20可经配置以相对于第一视频数据块确定使用线性预测模型译码模式译码的相邻色度块的数目,且基于使用线性预测模型译码模式译码的视频数据的相邻色度块的所确定数目而动态地改变用以指示线性预测模型译码模式的特定类型的码字。在一个实例中,视频编码器20可经配置以基于使用线性预测模型译码模式译码的视频数据的相邻色度块的数目为零而使用第一符号映射列表,基于使用线性预测模型译码模式译码的视频数据的相邻色度块的数目低于阈值而使用第二符号映射列表,基于使用线性预测模型译码模式译码的视频数据的相邻色度块的数目大于阈值而使用第三符号映射列表。
图19为说明本发明的实例编码方法的流程图。图19的技术可通过视频解码器30的一或多个组件来执行。
在本发明的一个实例中,视频解码器30可经配置以接收第一视频数据块的明度样本的经编码块(142),解码明度样本的经编码块以产生经重建构明度样本(144),及使用第一视频数据块的经重建构明度样本及两个或多于两个线性预测模型来预测第一视频数据块的色度样本(146)。
在本发明的另一实例中,视频解码器30可经配置以使用来自视频数据的相邻于第一视频数据块的块的明度样本及色度样本来确定两个或多于两个线性预测模型中的每一者的参数。在一个实例中,视频解码器30可经配置以将大于第一阈值的经重建构明度样本分类为处于多个样本群组的第一样本群组中,将小于或等于第一阈值的经重建构明度样本分类为在多个样本群组的第二样本群组中,将两个或多于两个线性预测模型中的第一线性预测模型应用于第一样本群组中的经重建构明度样本,将两个或模型线性预测模型中的第二线性预测模型应用于第二样本群组中的经重建构明度样本,所述第二线性预测模型不同于第一线性预测模型,且基于所应用的第一线性预测模型及所应用的第二线性预测模型而确定第一视频数据块中的经预测色度样本。在一个实例中,第一阈值取决于相邻经译码明度样本及色度样本。
在本发明的另一实例中,视频解码器30可经配置以对经重建构明度样本进行降频取样。在本发明的另一实例中,视频解码器30可经配置以确定多个降频取样滤波器中的一者以用以对经重建构明度样本进行降频取样,使用所确定的降频取样滤波器对经重建构明度样本进行降频取样以产生经降频取样的明度样本,及使用经降频取样明度样本及两个或多于两个线性预测模型而预测第一视频数据块的色度样本。
在本发明的另一实例中,视频解码器30可经配置以确定第二视频数据块的色度样本是否是使用两个或多于两个线性预测模型的线性预测模型进行译码。在第二视频数据块的色度样本并非是使用线性预测模型进行译码的情况下,视频解码器30可经配置以确定启用线性模式角预测模式,将角形模式预测型样应用于第二视频数据块的色度样本以产生第一经预测色度值,将线性模型预测型样应用于第二视频数据块的对应明度样本以产生第二经预测色度值,且通过确定第一经预测色度值与第二经预测色度值的加权平均值来确定第二视频数据块的具有经预测色度值的最终块。
在本发明的另一实例中,视频解码器30可经配置以相对于第一视频数据块确定使用线性预测模型译码模式译码的相邻色度块的数目,且基于使用线性预测模型译码模式译码的视频数据的相邻色度块的所确定数目而动态地改变用以指示线性预测模型译码模式的特定类型的码字。在一个实例中,视频编码器20可经配置以基于使用线性预测模型译码模式译码的视频数据的相邻色度块的数目为零而使用第一符号映射列表,基于使用线性预测模型译码模式译码的视频数据的相邻色度块的数目低于阈值而使用第二符号映射列表,基于使用线性预测模型译码模式译码的视频数据的相邻色度块的数目大于阈值而使用第三符号映射列表。
图20为说明用于编码当前块的实例方法的流程图。当前块可包括当前CU或当前CU的一部分。尽管关于视频编码器20(图1及2)加以描述,但应理解,其它装置可经配置以执行类似于图20的方法的方法。
在此实例中,视频编码器20初始地预测当前块(150)。举例来说,视频编码器20可计算当前块的一或多个预测单元(PU)。视频编码器20可接着计算当前块的残余块,(例如)以产生变换单元(TU)(152)。为了计算残余块,视频编码器20可计算当前块的原始未经译码块与经预测块之间的差。视频编码器20可接着变换并量化残余块的系数(154)。接着,视频编码器20可扫描残余块的经量化变换系数(156)。在扫描期间或在扫描之后,视频编码器20可对系数进行熵编码(158)。举例来说,视频编码器20可使用CAVLC或CABAC来编码系数。视频编码器20可接着输出用于块的系数的熵译码数据(160)。
图21为说明用于解码视频数据的当前块的实例方法的流程图。当前块可包括当前CU或当前CU的一部分。尽管关于视频解码器30(图1及3)加以描述,但应理解,其它装置可经配置以执行类似于图21的方法的方法。
视频解码器30可例如使用帧内或帧间预测模式来预测当前块(200)以计算当前块的经预测块。视频解码器30也可接收当前块的熵译码数据,例如针对对应于当前块的残余块的系数的熵译码数据(202)。视频解码器30可熵解码熵译码数据以再现残余块的系数(204)。视频解码器30接着可反扫描经再现的系数(206)以产生经量化变换系数的块。视频解码器30可接着对系数进行反量化及反变换以产生残余块(208)。视频解码器30可最终通过组合经预测块及残余块来解码当前块(210)。
以下内容概述上文所论述的本发明的实例。使用多模型方法、多滤波器方法及LM角预测的LM预测的上述实例可个别地或以任何组合应用。在译码块/译码单元(CU)/变换单元(TU)中的明度分量与色度分量之间存在一个以上线性模型。当前块的相邻明度样本及色度样本可分类成若干个群组,且每一群组可用作训练集合以导出线性模型(即,特定α及β针对特定群组导出)。在一个实例中,样本的分类可基于样本的强度或位置。在另一实例中,分类方法可从编码器发信到解码器。
在一个实例中,如图7A中所展示,相邻样本可分类成两个群组。其中Rec′L[x,y]≤阈值的相邻样本可分类成群组1;而其中Rec′L[x,y]>阈值的相邻样本可分类成群组2。在一个实例中,阈值可取决于相邻经译码明度/色度样本及当前块中的经译码明度样本而计算。在一个实例中,阈值可计算为相邻经译码明度样本(其在并未呈4:4:4格式情况下可经降频取样)的平均值。在另一实例中,阈值可计算为相邻经译码明度样本(其在并未呈4:4:4格式情况下可经降频取样)的中位值。在再一实例中,阈值可计算为minV与maxV的平均值,其中minV与maxV分别为相邻经译码明度样本(其在并未呈4:4:4格式情况下可经降频取样)的最小值及最大值。在另一实例中,阈值可计算为相邻经译码明度样本与当前块中的经译码明度样本(其在并未呈4:4:4格式情况下可经降频取样)的平均值。在另一实例中,阈值可计算为相邻经译码明度样本与当前块中经译码明度样本(其在并未呈4:4:4格式情况下可经降频取样)的中位值。在另一实例中,阈值可经计算为minV与maxV的平均值,其中minV及maxV分别为相邻经译码明度样本及当前块中经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样)的最小值及最大值。在一个实例中,阈值可从编码器20发信到解码器30。
在一个实例中,如图7B中所说明,相邻样本可分类成三个群组。其中Rec′L[x,y]≤阈值1的相邻样本可分类成群组1;其中阈值1<Rec′L[x,y]≤阈值2的相邻样本可分类成群组2;且其中Rec′L[x,y]>阈值2的相邻样本可分类成群组3。在一个实例中,阈值1及阈值2可取决于相邻经译码明度/色度样本及当前块中的经译码明度样本来计算。在一个实例中,可首先如上文所描述计算阈值。接着,可将阈值1计算为minV与阈值的平均值。可将阈值2计算为maxV与阈值的平均值。minV及maxV可分别为相邻经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样)的最小值及最大值。在另一实例中,阈值1可计算为sumV的1/3。阈值2可计算为sumV的2/3。sumV可为相邻经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样)的累积总和值。在另一实例中,阈值1可计算为S[N/3]与S[N/3+1]之间的值。阈值2可计算为S[2*N/3]与S[2*N/3+1]。N可为相邻经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样)的总数。S[0],S[1],…S[N-2],S[N-1]可为相邻经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样)的递升归类序列。在另一实例中,可首先如上文所描述计算阈值。接着,可将阈值1计算为minV与阈值的平均值。可将阈值2计算为maxV与阈值的平均值。minV及maxV可分别为相邻经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样)及当前块中经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样)的最小值及最大值。在另一实例中,阈值1可计算为sumV的1/3。阈值2可计算为sumV的2/3。sumV可为相邻经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样)及当前块中经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样)的累积总和值。在另一实例中,阈值1可计算为S[N/3]与S[N/3+1]之间的值。阈值2可计算为S[2*N/3]与S[2*N/3+1]。N可为以下各者的总数:相邻经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样),及当前块中的经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样)。S[0],S[1],…S[N-2],S[N-1]可为以下各者的递升归类序列:相邻经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样),及当前块中的经译码明度样本(其在并非呈4:4:4格式情况下可经降频取样)。在一个实例中,阈值1及阈值2可从编码器20发信到解码器30。在一个实例中,更多相邻样本可用以导出以上线性模型,例如如在展示于图8A到8D中的实例中一般。
在一个实例中,MMLM中导出的模型1或模型2可应用于当前块中的所有像素,如分别在图11及12中所说明。在另一实例中,当前块中的像素可首先进行分类,接着像素中的一些进行选择以应用模型1而其它像素选择应用模型2,如图13中所说明。在一个实例中,可要求,分类方法对于经译码相邻明度样本且对于当前块中的经译码明度样本应相同。
在一个实例中,如图13中所说明,群组1中当前块中的经译码明度样本(在并非呈4:4:4格式情况下经降频取样)可应用模型1以导出当前块中的对应经预测色度样本,而群组2中当前块中的经译码明度样本(在并非呈4:4:4格式情况下经降频取样)可应用模型2以导出当前块中的对应经预测色度样本。以此方式,当前块中经预测色度样本可根据两个线性模型导出。当存在更多群组时,更多线性模型可用以获得经预测色度样本。
在一个实例中,群组中分类之后的样本的数目可被要求为大于特定数目,例如2或3。在一个实例中,如果群组中样本的数目小于特定数目,那么其它群组中的样本可改变到此群组。举例来说,具有最多样本的群组中的样本可改变到具有小于特定数目的样本的群组。在一个实例中,具有最多样本的群组(命名为群组A)中的样本可改变到具有少于特定数目的样本的群组(命名为群组B),如果所述样本是到群组B中现有样本的最近样本。“最近”可指像素位置上最近。或“最接近”可到强度上最接近。在一个实例中,编码器20可发信样本应被分类成的群组的数目到解码器30中。如果数目为1,那么其为原始LM模式。在另一实例中,LM模式在不同数目个群组情况下可被视为不同LM模式,例如,1个群组情况下为LM-MM1,2个群组情况下为LM-MM2,且3个群组情况下为LM-MM3。LM-MM1相同于原始LM模式。在另一实例中,解码器30可在编码器20不发信群组的数目的情况下导出群组的数目。
在一个实例中,在并非呈4:4:4格式情况下可存在一个以上明度降频取样滤波器,而非界定于JEM-3.0中的降频取样滤波器,如图6中所说明。在一个实例中,滤波器可是呈如下形式:
a.Rec′L[x,y]=a·RecL[2x,2y]+b·RecL[2x,2y+1]+c·RecL[2x-1,2y]+d·RecL[2x+1,2y]+e·RecL[2x-1,2y+1]+f·RecL[2x+1,2y+1]+g,
其中a、b、c、d、e、f、g为实数。
b.Rec′L[x,y]=(a·RecL[2x,2y]+b·RecL[2x,2y+1]+c·RecL[2x-1,2y]+d·RecL[2x+1,2y]+e·RecL[2x-1,2y+1]+f·RecL[2x+1,2y+1]+g)/h,
其中a、b、c、d、e、f、g、h为整数。
c.Rec′L[x,y]=(a·RecL[2x,2y]+b·RecL[2x,2y+1]+c·RecL[2x-1,2y]+d·RecL[2x+1,2y]+e·RecL[2x-1,2y+1]+f·RecL[2x+1,2y+1]+g)>>h,
其中a、b、c、d、e、f、g、h为整数。
举例来说,可能滤波器的实例说明于图14A到14C中,例如以下可能滤波器:
a.Rec′L[x,y]=(RecL[2x,2y]+RecL[2x+1,2y]+1)>>1;
b.Rec′L[x,y]=(RecL[2x+1,2y]+RecL[2x+1,2y+1]+1)>>1;
c.Rec′L[x,y]=(RecL[2x,2y]+RecL[2x,2y+1]+1)>>1;
d.Rec′L[x,y]=(RecL[2x,2y+1]+RecL[2x+1,2y+1]+1)>>1;
e.Rec′L[x,y]=(RecL[2x,2y]+RecL[2x+1,2y+1]+1)>>1;
f.Rec′L[x,y]=(RecL[2x,2y+1]+RecL[2x+1,2y]+1)>>1;
g.Rec′L[x,y]=(RecL[2x,2y]+RecL[2x,2y+1]+RecL[2x-1,2y]+RecL[2x-1,2y+1]+2)>>2;
h.Rec′L[x,y]=(RecL[2x,2y]+RecL[2x,2y+1]+RecL[2x+1,2y]+RecL[2x+1,2y+1]+2)>>2;
i.Rec′L[x,y]=(2·RecL[2x,2y]+RecL[2x+1,2y]+RecL[2x-1,2y]+2)>>2;
j.Rec′L[x,y]=(2·RecL[2x,2y+1]+RecL[2x+1,2y+1]+RecL[2x-1,2y+1]+2)>>2;
k.Rec′L[x,y]=(RecL[2x-1,2y]+RecL[2x-1,2y+1]+1)>>1;
l.Rec′L[x,y]=(RecL[2x,2y+1]+RecL[2x-1,2y+1]+1)>>1;
m.Rec′L[x,y]=(RecL[2x-1,2y]+RecL[2x,2y+1]+1)>>1;
n.Rec′L[x,y]=(RecL[2x,2y]+RecL[2x-1,2y+1]+1)>>1;
o.Rec′L[x,y]=(RecL[2x,2y]+RecL[2x-1,2y]+1)>>1;
p.Rec′L[x,y]=(2·RecL[2x+1,2y]+RecL[2x+1,2y]+RecL[2x+1,2y+1]+2)>>2;
q.Rec′L[x,y]=(2·RecL[2x+1,2y+1]+RecL[2x,2y+1]+RecL[2x+1,2y]+2)>>2;
r.Rec′L[x,y]=(5·RecL[2x,2y+1]+RecL[2x-1,2y+1]+RecL[2x+1,2y+1]+RecL[2x,2y]+4)>>3;
在一个实例中,如果序列并非呈4:4:4格式,那么LM模式可通过除界定于JEM-3.0中且展示于本发明的图6中的滤波器外的任何降频取样滤波器操作。在一个实例中,解码器30可在编码器20不发信降频取样滤波器情况下导出降频取样滤波器。在实例中,经滤波结果可削减到有效色度值范围。角预测的类型及LM预测的类型可组合在一起以获得最终预测。命名为LAP_flag的旗标可在当前色度块通过帧内预测而非以任何LM模式译码情况下进行发信。在一个实例中,如果当前色度块的预测模式为模式X,那么X可为一类型的角帧内预测(包含平面模式及DC模式)。应注意,如果当前色度块作为DM模式发信,那么其也被视为角模式,此是由于其相同于对应明度块的一类型的角预测模式。在一个实例中,两个预测型样可针对色度块首先产生,且接着组合在一起。一个预测型样可通过角模式X产生。举例来说,其它预测可通过一类型的LM模式例如LM-MM2模式产生。
如图16中所说明,首先,针对当前块中每一样本的预测可通过表明为P1(x,y)的角预测模式X产生。接着,当前块中每一样本的预测可通过LM-MM2模式来产生,其表明为P2(x,y)。接着,最终LM角预测可计算为P(x,y)=w1(x,y)×P1(x,y)+w2(x,y)×P2(x,y),其中(x,y)表示样本在块中的座标,且w1(x,y)及w2(x,y)为实数。w1(x,y)及w2(x,y)可满足w1(x,y)+w2(x,y)=1。在另一实例中,最终LM-角预测可计算为:P(x,y)=(w1(x,y)×P1(x,y)+w2(x,y)×P2(x,y)+a)/b,
其中w1(x,y)、w2(x,y)、a及b为整数,且w1(x,y)及w2(x,y)可满足w1(x,y)+w2(x,y)=b。
在另一实例中,最终LM-角预测可计算为P(x,y)=(w1(x,y)×P1(x,y)+w2(x,y)×P2(x,y)+a)>>b,
其中w1(x,y)、w2(x,y)、a及b为整数,且w1(x,y)及w2(x,y)可满足:w1(x,y)+w2(x,y)=2b。在一个实例中,w1(x,y)及w2(x,y)对于不同(x,y)可不同。在另一实例中,w1(x,y)及w2(x,y)对于所有(x,y)可不改变。在一个实例中,对于所有(x,y)来说,P(x,y)=(P1(x,y)+P2(x,y)+1)>>1。
在一个实例中,LAP_flag可通过CABAC来译码。译码内容脉络可取决于相邻块的经译码/解码LAP_flag。举例来说,对于LAP_flag可存在三个内容脉络:LAPctx[0]、LAPctx[1]及LAPctx[2]。变量ctx可计算为ctx=LAP_flag_A+LAP_flag_B,其中LAP_flag_A及LAP_flag_B分别为相邻块A及B的LAP_flag,如图17中所说明。在一个实例中,P(x,y)可经削减到有效色度值范围。在一个实例中,LM模式的译码可取决于相邻块的色度内预测模式。在一个实例中,例如LM、LM-MM2、LM-MM3、LM-MF1、LM-MF2、LM-MF3及LM-MF4的一些LM模式可为候选LM模式。在此实例中,存在7个候选LM模式,且非LM模式经附加以表示当前块通过角形模式、非LM模式译码的情况。如果发信了非LM,那么角模式可如在JEM-3.0中一般发信,或以任何其它非LM方法发信。
在实例译码逻辑中,DM_flag可首先经译码。如果色度预测模式并非DM模式,那么可调用所提议LM_coding()模块以指示当前色度预测模式。如果LM_coding()模块译码非LM模式,那么Chroma_intra_mode_coding()模块可经调用以译码角色度预测模式。
Figure BDA0001992032740000461
在一个实例中,为了发信可能的N个模式(包含非LM),具有不同码字或称为二进制化的N个符号(0,1,…,6,7)可用以表示N个可能模式。具有较小数字的符号可能不具有长于具有较大数字的符号的码长度的码长度。符号可以任何方式二进制化,例如固定长度码、一元码、截短的一元码、指数哥伦布码等。在一个实例中,可存在符号与模式之间的默认映射。在一个实例中,映射可为固定的,或根据经解码相邻块为动态的。
在一个实例中,模式非LM的符号可取决于表明为K的以LM模式译码的相邻色度块的数目而插入到映射列表中。在一个实例中,符号映射列表可为:
如果K==0,那么0:LM,1:非-LM,2:LM-MM2,3:LM-MM3,4:LM-MF1,5:LM-MF2,6:LM-MF3,7:LM-MF4;
如果0<K<=3,那么0:LM,1:LM-MM2,2:LM-MM3,3:非-LM,4:LM-MF1,5:LM-MF2,6:LM-MF3,7:LM-MF4;
如果K>3,那么0:LM,1:LM-MM2,2:LM-MM3,3:LM-MF1,4:LM-MF2,5:LM-MF3,6:LM-MF4,7:非-LM;
在一个实例中,模式非LM的符号可取决于表明为K'的并未以LM模式译码的相邻色度块的数目而插入到映射列表中,且符号映射列表可为:
如果K'==5,那么0:LM,1:非-LM,2:LM-MM2,3:LM-MM3,4:LM-MF1,5:LM-MF2,6:LM-MF3,7:LM-MF4;
如果2<=K'<5,那么0:LM,1:LM-MM2,2:LM-MM3,3:非-LM,4:LM-MF1,5:LM-MF2,6:LM-MF37:LM-MF4;
如果K'<=2,那么0:LM,1:LM-MM2,2:LM-MM3,3:LM-MF1,4:LM-MF2,5:LM-MF3,6:LM-MF4,7:非-LM;
在一个实例中,模式非LM的符号可取决于表明为K'的并未以LM模式译码的相邻色度块的数目而插入到映射列表中,且符号映射列表可为:
如果K'==5,则0:LM,1:非-LM,2:LM-MM2,3:LM-MM3,4:LM-MF1,5:LM-MF2,6:LM-MF3,7:LM-MF4;
如果2<=K'<5,则0:LM,1:LM-MM2,2:LM-MM3,3:非-LM,4:LM-MF1,5:LM-MF2,6:LM-MF3,7:LM-MF4;
如果K'<=2,则0:LM,1:LM-MM2,2:LM-MM3,3:LM-MF1,4:LM-MF2,5:LM-MF3,6:LM-MF4,7:非-LM;
在一个实例中,所提议LM改良的使用可取决于块大小。在一个实例中,如果当前色度块的大小为M×N,那么LM-X在M×N<=T情况下可能并不适用,其中T可为固定数目或可从编码器20发信到解码器30。举例来说,LM-X可为任何LM模式,例如LM-MM2、LM-MM3、LM-MF1、LM-MF2、LM-MF3及LM-MF4。在一个实例中,LM-X在M+N<=T情况下可能并不适用,其中T可为固定数字,或可从编码器20发信到解码器30。举例来说,LM-X可为任何LM模式,例如LM-MM2、LM-MM3、LM-MF1、LM-MF2、LM-MF3及LM-MF4。在一个实例中,LM-X在Min(M,N)<=T情况下可能并不适用,其中T可为固定数字,或可从编码器20发信到解码器30。举例来说,LM-X可为任何LM模式,例如LM-MM2、LM-MM3、LM-MF1、LM-MF2、LM-MF3及LM-MF4。在另一实例中,LM-X在Max(M,N)<=T情况下可能并不适用。T可为固定数字,或可从编码器20发信到解码器30。LM-X可为任何LM模式,例如LM-MM2、LM-MM3、LM-MF1、LM-MF2、LM-MF3及LM-MF4。在一个实例中,LAP在M×N<=T情况下可能并不适用,其中T可为固定数字或可从编码器20发信到解码器30。在一个实例中,LAP在M+N<=T情况下可能并不适用,其中T可为固定数字或可从编码器20发信到解码器30。在另一实例中,LAP在Min(M,N)<=T情况下可能并不适用,其中T可为固定数字或可从编码器20发信到解码器30。在一个实例中,LAP在Max(M,N)<=T情况下可能并不适用,其中T可为固定数字或可从编码器20发信到解码器30。
应认识到,取决于实例,本文中所描述的技术中的任一者的某些动作或事件可以不同序列被执行、可被添加、合并或完全省去(例如,并非所有所描述动作或事件为实践所述技术所必要)。此外,在某些实例中,可例如经由多线程处理、中断处理或多个处理器同时而非顺序执行动作或事件。
在一或多个实例中,所描述功能可以硬件、软件、固件或其任何组合来实施。如果以软件实施,那么所述功能可作为一或多个指令或程序代码而存储于计算机可读媒体上或经由计算机可读媒体进行发射,且通过基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体(其对应于例如数据存储媒体的有形媒体)或通信媒体,所述通信媒体包含(例如)根据通信协议促进计算机程序从一处传送到另一处的任何媒体。以此方式,计算机可读媒体通常可对应于(1)为非暂时性的有形计算机可读存储媒体,或(2)例如信号或载波的通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本发明中所描述的技术的指令、码及/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。
通过实例而非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储器、磁盘存储器或其它磁性存储装置、快闪存储器或可用于存储呈指令或数据结构形式的所要程序代码且可由计算机存取的任何其它媒体。并且,任何连接被恰当地称为计算机可读媒体。举例来说,如果使用同轴缆线、光缆、双绞线、数字订户线(DSL)或无线技术(例如红外线、无线电及微波)从网站、服务器或其它远端源发射指令,那么同轴缆线、光缆、双绞线、DSL或无线技术(例如红外线、无线电及微波)包含于媒体的定义中。然而,应理解,计算机可读存储媒体及数据存储媒体不包含连接、载波、信号或其它暂时性媒体,而实情为是针对非暂时性有形存储媒体。如本文中所使用,磁盘及光盘包含紧密光盘(CD)、雷射光盘、光学光盘、数字影音光盘(DVD)、软盘和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘使用雷射以光学方式再现数据。以上各者的组合也应包含于计算机可读媒体的范畴内。
指令可由一或多个处理器执行,所述一或多个处理器是例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它等效的集成或离散逻辑电路。因此,如本文中所使用的术语“处理器”可指前述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,本文中所描述的功能性可提供于经配置用于编码及解码的专用硬件及/或软件模块内,或并入组合式编码解码器中。此外,所述技术可完全实施于一或多个电路或逻辑元件中。
本发明的技术可实施于广泛的多种装置或设备中,所述装置或设备包含无线手持机、集成电路(IC)或IC集合(例如,芯片组)。在本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但未必要求由不同硬件单元来实现。确切来说,如上文所描述,可将各种单元组合于编码解码器硬件单元中,或通过互操作性硬件单元(包含如上文所描述的一或多个处理器)的集合结合合适软件及/或固件来提供所述单元。
各种实例已予以了描述。此些及其它实例是在以下权利要求书的范畴内。

Claims (27)

1.一种解码视频数据的方法,所述方法包括:
接收第一视频数据块的明度样本的经编码块;
解码明度样本的所述经编码块以产生经重建构明度样本;
将大于第一阈值的经重建构明度样本分类为处于多个样本群组中的第一样本群组中;
将低于所述第一阈值的经重建构明度样本分类为处于所述多个样本群组中的第二样本群组中;及
通过以下操作来预测所述第一视频数据块的色度样本:
将两个或多于两个线性预测模型中的第一线性预测模型应用于所述第一样本群组中的经重建构明度样本;
将所述两个或多于两个线性预测模型中的第二线性预测模型应用于所述第二样本群组中的经重建构明度样本,所述第二线性预测模型不同于所述第一线性预测模型;及
基于所应用的第一线性预测模型及所应用的第二线性预测模型而确定所述第一视频数据块中的经预测色度样本。
2.根据权利要求1所述的方法,其进一步包括:
使用来自相邻于所述第一视频数据块的视频数据块的明度样本及色度样本来确定所述两个或多于两个线性预测模型中的每一者的参数。
3.根据权利要求1所述的方法,其中所述第一阈值是取决于相邻经译码明度样本及色度样本。
4.根据权利要求1所述的方法,其进一步包括:
对所述经重建构明度样本进行降频取样。
5.根据权利要求1所述的方法,其进一步包括:
确定多个降频取样滤波器中的一个以用以对所述经重建构明度样本进行降频取样;
使用所述确定的降频取样滤波器对所述经重建构明度样本进行降频取样以产生经降频取样的明度样本;及
使用所述经降频取样的明度样本及所述两个或多于两个线性预测模型来预测所述第一视频数据块的色度样本。
6.根据权利要求1所述的方法,其进一步包括:
确定第二视频数据块的色度样本是否是使用所述两个或多于两个线性预测模型中的线性预测模型进行译码,所述第二视频数据块与所述第一视频数据块不同;
在所述第二视频数据块的所述色度样本并非是使用所述线性预测模型进行译码的情况下,所述方法进一步包括:
确定线性模式角预测模式经启用;
将角模式预测型样应用于所述第二视频数据块的所述色度样本以产生第一经预测色度值;
将线性模型预测型样应用于所述第二视频数据块的对应明度样本以产生第二经预测色度值;及
通过确定所述第一经预测色度值与所述第二经预测色度值的加权平均值而确定所述第二视频数据块的具有经预测色度值的最终块。
7.根据权利要求1所述的方法,其进一步包括:
相对于所述第一视频数据块确定使用线性预测模型译码模式译码的相邻色度块的数目;及
基于使用所述线性预测模型译码模式译码的所述视频数据的相邻色度块的所确定数目而动态地改变用以指示所述线性预测模型译码模式的特定类型的码字。
8.根据权利要求7所述的方法,其中动态地改变所述码字包括:
基于使用所述线性预测模型译码模式译码的所述视频数据的相邻色度块的所述数目为零而使用第一符号映射列表;
基于使用所述线性预测模型译码模式译码的所述视频数据的相邻色度块的所述数目低于阈值而使用第二符号映射列表;及
基于使用所述线性预测模型译码模式译码的所述视频数据的相邻色度块的所述数目大于所述阈值而使用第三符号映射列表。
9.一种编码视频数据的方法,所述方法包括:
编码第一视频数据块的明度样本的块;
重建构明度样本的经编码块以产生经重建构明度样本;
将大于第一阈值的经重建构明度样本分类为处于多个样本群组中的第一样本群组中;
将低于所述第一阈值的经重建构明度样本分类为处于所述多个样本群组中的第二样本群组中;及
通过以下操作来预测所述第一视频数据块的色度样本:
将两个或多于两个线性预测模型中的第一线性预测模型应用于所述第一样本群组中的经重建构明度样本;
将所述两个或多于两个线性预测模型中的第二线性预测模型应用于所述第二样本群组中的经重建构明度样本,所述第二线性预测模型不同于所述第一线性预测模型;及
基于所应用的第一线性预测模型及所应用的第二线性预测模型而确定所述第一视频数据块中的经预测色度样本。
10.根据权利要求9所述的方法,其进一步包括:
使用来自相邻于所述第一视频数据块的视频数据块的明度样本及色度样本来确定所述两个或多于两个线性预测模型中的每一者的参数。
11.根据权利要求9所述的方法,其中所述第一阈值是取决于相邻经译码明度样本及色度样本。
12.根据权利要求9所述的方法,其进一步包括:
对所述经重建构明度样本进行降频取样。
13.根据权利要求9所述的方法,其进一步包括:
确定多个降频取样滤波器中的一者以用以对所述经重建构明度样本进行降频取样;
使用所述确定的降频取样滤波器对所述经重建构明度样本进行降频取样以产生经降频取样的明度样本;及
使用所述经降频取样的明度样本及所述两个或多于两个线性预测模型来预测所述第一视频数据块的色度样本。
14.根据权利要求9所述的方法,其进一步包括:
确定第二视频数据块的色度样本是否是使用所述两个或多于两个线性预测模型中的线性预测模型进行译码,所述第二视频数据块与所述第一视频数据块不同;
在所述第二视频数据块的所述色度样本并非是使用所述线性预测模型进行译码的情况下,所述方法进一步包括:
确定线性模式角预测模式经启用;
将角模式预测型样应用于所述第二视频数据块的所述色度样本以产生第一经预测色度值;
将线性模型预测型样应用于所述第二视频数据块的对应明度样本以产生第二经预测色度值;及
通过确定所述第一经预测色度值与所述第二经预测色度值的加权平均值而确定所述第二视频数据块的具有经预测色度值的最终块。
15.根据权利要求9所述的方法,其进一步包括:
相对于所述第一视频数据块确定使用线性预测模型译码模式译码的相邻色度块的数目;及
基于使用所述线性预测模型译码模式译码的所述视频数据的相邻色度块的所确定数目而动态地改变用以指示所述线性预测模型译码模式的特定类型的码字。
16.根据权利要求15所述的方法,其中动态地改变所述码字包括:
基于使用所述线性预测模型译码模式译码的所述视频数据的相邻色度块的所述数目为零而使用第一符号映射列表;
基于使用所述线性预测模型译码模式译码的所述视频数据的相邻色度块的所述数目低于阈值而使用第二符号映射列表;及
基于使用所述线性预测模型译码模式译码的所述视频数据的相邻色度块的所述数目大于所述阈值而使用第三符号映射列表。
17.一种经配置以解码视频数据的设备,所述设备包括:
存储器,其经配置以接收第一视频数据块;及
一或多个处理器,其经配置以:
接收所述第一视频数据块的明度样本的经编码块;
解码明度样本的所述经编码块以产生经重建构明度样本;
将大于第一阈值的经重建构明度样本分类为处于多个样本群组中的第一样本群组中;
将低于所述第一阈值的经重建构明度样本分类为处于所述多个样本群组中的第二样本群组中;及
通过以下操作来预测所述第一视频数据块的色度样本:
将两个或多于两个线性预测模型中的第一线性预测模型应用于所述第一样本群组中的经重建构明度样本;
将所述两个或多于两个线性预测模型中的第二线性预测模型应用于所述第二样本群组中的经重建构明度样本,所述第二线性预测模型不同于所述第一线性预测模型;及
基于所应用的第一线性预测模型及所应用的第二线性预测模型而确定所述第一视频数据块中的经预测色度样本。
18.根据权利要求17所述的设备,其中所述一或多个处理器经进一步配置以:
使用来自相邻于所述第一视频数据块的视频数据块的明度样本及色度样本来确定所述两个或多于两个线性预测模型中的每一个的参数。
19.根据权利要求17所述的设备,其中所述第一阈值是取决于相邻经译码明度样本及色度样本。
20.根据权利要求17所述的设备,其中所述一或多个处理器经进一步配置以:
对所述经重建构明度样本进行降频取样。
21.根据权利要求17所述的设备,其中所述一或多个处理器经进一步配置以:
确定多个降频取样滤波器中的一个以用以对所述经重建构明度样本进行降频取样;
使用所述确定的降频取样滤波器对所述经重建构明度样本进行降频取样以产生经降频取样的明度样本;及
使用所述经降频取样的明度样本及所述两个或多于两个线性预测模型来预测所述第一视频数据块的色度样本。
22.根据权利要求17所述的设备,其中所述一或多个处理器经进一步配置以:
确定第二视频数据块的色度样本是否是使用所述两个或多于两个线性预测模型中的线性预测模型而译码,所述第二视频数据块与所述第一视频数据块不同;
在所述第二视频数据块的所述色度样本并非是使用所述线性预测模型进行译码的情况下,所述一或多个处理器经进一步配置以:
确定线性模式角预测模式经启用;
将角模式预测型样应用于所述第二视频数据块的所述色度样本以产生第一经预测色度值;
将线性模型预测型样应用于所述第二视频数据块的对应明度样本以产生第二经预测色度值;及
通过确定所述第一经预测色度值与所述第二经预测色度值的加权平均值而确定所述第二视频数据块的具有经预测色度值的最终块。
23.根据权利要求17所述的设备,其中所述一或多个处理器经进一步配置以:
相对于所述第一视频数据块确定使用线性预测模型译码模式译码的相邻色度块的数目;及
基于使用所述线性预测模型译码模式译码的所述视频数据的相邻色度块的所确定数目而动态地改变用以指示所述线性模型译码模式的特定类型的码字。
24.根据权利要求23所述的设备,其中为了动态地改变所述码字,所述一或多个处理器经进一步配置以:
基于使用所述线性预测模型译码模式译码的所述视频数据的相邻色度块的所述数目为零而使用第一符号映射列表;
基于使用所述线性预测模型译码模式译码的所述视频数据的相邻色度块的所述数目低于阈值而使用第二符号映射列表;及
基于使用所述线性预测模型译码模式译码的所述视频数据的相邻色度块的所述数目大于所述阈值而使用第三符号映射列表。
25.一种经配置以编码视频数据的设备,所述设备包括:
存储器,其经配置以接收第一视频数据块;及
一或多个处理器,其经配置以:
编码第一视频数据块的明度样本的块;
重建构明度样本的所述经编码块以产生经重建构明度样本;
将大于第一阈值的经重建构明度样本分类为处于多个样本群组中的第一样本群组中;
将低于所述第一阈值的经重建构明度样本分类为处于所述多个样本群组中的第二样本群组中;及
通过以下操作来预测所述第一视频数据块的色度样本:
将两个或多于两个线性预测模型中的第一线性预测模型应用于所述第一样本群组中的经重建构明度样本;
将所述两个或多于两个线性预测模型中的第二线性预测模型应用于所述第二样本群组中的经重建构明度样本,所述第二线性预测模型不同于所述第一线性预测模型;及
基于所应用的第一线性预测模型及所应用的第二线性预测模型而确定所述第一视频数据块中的经预测色度样本。
26.一种经配置以解码视频数据的设备,所述设备包括:
用于接收第一视频数据块的明度样本的经编码块的装置;
用于解码明度样本的所述经编码块以产生经重建构明度样本的装置;
用于将大于第一阈值的经重建构明度样本分类为处于多个样本群组中的第一样本群组中的装置;
用于将低于所述第一阈值的经重建构明度样本分类为处于所述多个样本群组中的第二样本群组中的装置;及
用于通过以下操作来预测所述第一视频数据块的色度样本的装置:
将两个或多于两个线性预测模型中的第一线性预测模型应用于所述第一样本群组中的经重建构明度样本;
将所述两个或多于两个线性预测模型中的第二线性预测模型应用于所述第二样本群组中的经重建构明度样本,所述第二线性预测模型不同于所述第一线性预测模型;及
基于所应用的第一线性预测模型及所应用的第二线性预测模型而确定所述第一视频数据块中的经预测色度样本。
27.一种存储指令的计算机可读存储媒体,所述指令在执行时使得经配置以对视频数据进行解码的一或多个处理器:
接收第一视频数据块的明度样本的经编码块;
解码明度样本的所述经编码块以产生经重建构明度样本;
将大于第一阈值的经重建构明度样本分类为处于多个样本群组中的第一样本群组中;
将低于所述第一阈值的经重建构明度样本分类为处于所述多个样本群组中的第二样本群组中;及
通过以下操作来预测所述第一视频数据块的色度样本:
将两个或多于两个线性预测模型中的第一线性预测模型应用于所述第一样本群组中的经重建构明度样本;
将所述两个或多于两个线性预测模型中的第二线性预测模型应用于所述第二样本群组中的经重建构明度样本,所述第二线性预测模型不同于所述第一线性预测模型;及
基于所应用的第一线性预测模型及所应用的第二线性预测模型而确定所述第一视频数据块中的经预测色度样本。
CN201780055869.8A 2016-09-15 2017-09-15 用于视频译码的线性模型色度帧内预测 Active CN109716771B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662395145P 2016-09-15 2016-09-15
US62/395,145 2016-09-15
US15/705,029 2017-09-14
US15/705,029 US10652575B2 (en) 2016-09-15 2017-09-14 Linear model chroma intra prediction for video coding
PCT/US2017/051821 WO2018053293A1 (en) 2016-09-15 2017-09-15 Linear model chroma intra prediction for video coding

Publications (2)

Publication Number Publication Date
CN109716771A CN109716771A (zh) 2019-05-03
CN109716771B true CN109716771B (zh) 2022-06-28

Family

ID=61560710

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780055869.8A Active CN109716771B (zh) 2016-09-15 2017-09-15 用于视频译码的线性模型色度帧内预测

Country Status (10)

Country Link
US (1) US10652575B2 (zh)
EP (1) EP3513559B1 (zh)
JP (1) JP7044765B2 (zh)
KR (1) KR102534901B1 (zh)
CN (1) CN109716771B (zh)
BR (1) BR112019004544A2 (zh)
ES (1) ES2884375T3 (zh)
SG (1) SG11201900967XA (zh)
TW (1) TWI776818B (zh)
WO (1) WO2018053293A1 (zh)

Families Citing this family (129)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018056603A1 (ko) * 2016-09-22 2018-03-29 엘지전자 주식회사 영상 코딩 시스템에서 조도 보상 기반 인터 예측 방법 및 장치
EP3451663A1 (en) * 2017-08-31 2019-03-06 Thomson Licensing Pools of transforms for local selection of a set of transforms in video coding
JP2021005741A (ja) * 2017-09-14 2021-01-14 シャープ株式会社 画像符号化装置及び画像復号装置
WO2019131349A1 (ja) * 2017-12-25 2019-07-04 シャープ株式会社 画像復号装置、画像符号化装置
GB2591379B (en) * 2018-01-03 2023-02-15 Beijing Bytedance Network Tech Co Ltd Single-line cross component linear model prediction mode
WO2020053805A1 (en) * 2018-09-12 2020-03-19 Beijing Bytedance Network Technology Co., Ltd. Single-line cross component linear model prediction mode
WO2019143551A1 (en) * 2018-01-16 2019-07-25 Vid Scale, Inc. Adaptive frame packing for 360-degree video coding
GB2571314A (en) * 2018-02-23 2019-08-28 Canon Kk Methods and devices for linear component sample prediction using a double classification
GB2571313B (en) * 2018-02-23 2022-09-21 Canon Kk New sample sets and new down-sampling schemes for linear component sample prediction
CN118301330A (zh) * 2018-03-25 2024-07-05 有限公司B1影像技术研究所 图像编码/解码方法、存储介质和传输比特流的方法
WO2019194500A1 (ko) * 2018-04-01 2019-10-10 엘지전자 주식회사 인트라 예측에 기반한 영상 코딩 방법 및 그 장치
US11190790B2 (en) * 2018-04-01 2021-11-30 Lg Electronics Inc. Parallel processing method for color component of video signal, and device therefor
KR102481051B1 (ko) * 2018-04-24 2022-12-23 에이치에프아이 이노베이션 인크. 비디오 코딩에서의 제한된 선형 모델 파라미터 도출을 위한 방법 및 장치
US10609402B2 (en) 2018-05-02 2020-03-31 Tencent America LLC Method and apparatus for prediction and transform for small blocks
JP2019213096A (ja) * 2018-06-06 2019-12-12 Kddi株式会社 画像復号装置、画像符号化装置、画像処理システム、画像復号方法及びプログラム
JP2020005258A (ja) * 2018-06-29 2020-01-09 財團法人工業技術研究院Industrial Technology Research Institute ビデオ復号化方法、ビデオデコーダー、ビデオ符号化方法及びビデオエンコーダー
EP3588962A1 (en) * 2018-06-29 2020-01-01 Industrial Technology Research Institute Video decoding method, video decoder, video encoding method and video encoder
CN110662065A (zh) * 2018-06-29 2020-01-07 财团法人工业技术研究院 图像数据解码方法及解码器、图像数据编码方法及编码器
EP3815370B1 (en) 2018-07-12 2024-07-31 Huawei Technologies Co., Ltd. Intra-prediction using a cross-component linear model in video coding
JP7461925B2 (ja) * 2018-07-16 2024-04-04 華為技術有限公司 ビデオ符号器、ビデオ復号器、並びに対応する符号化及び復号化方法
CA3109014C (en) * 2018-08-09 2024-04-09 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Video image component prediction method and apparatus, and computer storage medium
BR112021002191A2 (pt) * 2018-08-09 2021-05-04 Guangdong Oppo Mobile Telecommunications Corp., Ltd. método para prever um componente de cor de vídeo, aparelho para prever um componente de cor de vídeo e dispositivo para prever um componente de cor de vídeo
CN116347109A (zh) * 2018-08-17 2023-06-27 北京字节跳动网络技术有限公司 一种处理视频数据的方法和装置
CN110858903B (zh) * 2018-08-22 2022-07-12 华为技术有限公司 色度块预测方法及装置
CN110876061B (zh) * 2018-09-03 2022-10-11 华为技术有限公司 色度块预测方法及装置
CN110881126B (zh) * 2018-09-05 2024-01-30 华为技术有限公司 色度块预测方法以及设备
JP7227361B2 (ja) * 2018-09-20 2023-02-21 エルジー エレクトロニクス インコーポレイティド 映像コーディングシステムにおけるcclm予測に基づく映像デコーディング方法及びその装置
WO2020056767A1 (zh) * 2018-09-21 2020-03-26 Oppo广东移动通信有限公司 视频图像分量的预测方法、装置及计算机存储介质
WO2020060256A1 (ko) 2018-09-22 2020-03-26 엘지전자 주식회사 영상 코딩 시스템에서 cclm 예측을 사용하는 영상 디코딩 방법 및 그 장치
GB2577338A (en) * 2018-09-24 2020-03-25 Sony Corp Data encoding and decoding
EP3850853A4 (en) * 2018-10-05 2022-08-10 Huawei Technologies Co., Ltd. INTRA-PREDICTION METHOD AND DEVICE
CN116708770B (zh) * 2018-10-08 2024-03-26 北京达佳互联信息技术有限公司 对视频信号进行解码的方法、计算装置和存储介质
CN113068030B (zh) * 2018-10-12 2023-01-03 Oppo广东移动通信有限公司 视频图像分量预测方法及装置、计算机存储介质
US10939118B2 (en) * 2018-10-26 2021-03-02 Mediatek Inc. Luma-based chroma intra-prediction method that utilizes down-sampled luma samples derived from weighting and associated luma-based chroma intra-prediction apparatus
US20220078405A1 (en) * 2018-11-05 2022-03-10 Interdigital Vc Holdings, Inc. Simplifications of coding modes based on neighboring samples dependent parametric models
WO2020094067A1 (en) 2018-11-06 2020-05-14 Beijing Bytedance Network Technology Co., Ltd. Simplified parameter derivation for intra prediction
US11197005B2 (en) 2018-11-08 2021-12-07 Qualcomm Incorporated Cross-component prediction for video coding
CA3085391C (en) 2018-11-23 2023-10-24 Lg Electronics Inc. Method for decoding image on basis of cclm prediction in image coding system, and device therefor
KR20200061309A (ko) * 2018-11-23 2020-06-02 인텔렉추얼디스커버리 주식회사 영상 성분 간 예측 방법과 그를 이용한 영상 부호화 및 복호화 방법 및 장치
CN113170122B (zh) 2018-12-01 2023-06-27 北京字节跳动网络技术有限公司 帧内预测的参数推导
WO2020115282A1 (en) * 2018-12-07 2020-06-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder amd methods for enhancing a robustness for calculation of cross-component linear model parameters
US12022059B2 (en) * 2018-12-07 2024-06-25 Beijing Dajia Internet Information Technology Co., Ltd. Video coding using multi-resolution reference picture management
JP7317965B2 (ja) 2018-12-07 2023-07-31 北京字節跳動網絡技術有限公司 コンテキストベースのイントラ予測
US11095921B2 (en) * 2018-12-18 2021-08-17 Tencent America LLC Method and apparatus for video encoding or decoding
GB2580078A (en) * 2018-12-20 2020-07-15 Canon Kk Piecewise modeling for linear component sample prediction
GB2580192A (en) * 2018-12-20 2020-07-15 Canon Kk Piecewise modeling for linear component sample prediction
CN113396591A (zh) * 2018-12-21 2021-09-14 Vid拓展公司 针对用于基于模板的视频译码的改进的线性模型估计的方法、架构、装置和系统
WO2020125796A1 (en) * 2018-12-22 2020-06-25 Beijing Bytedance Network Technology Co., Ltd. Two step cross-component prediction mode based on multiple parameter
KR20200081327A (ko) * 2018-12-27 2020-07-07 인텔렉추얼디스커버리 주식회사 영상 부/복호화 방법 및 장치
WO2020137904A1 (ja) * 2018-12-28 2020-07-02 ソニー株式会社 情報処理装置、情報処理方法及び情報処理プログラム
CN115665407B (zh) * 2018-12-31 2023-08-04 华为技术有限公司 用于帧内预测的分量间线性建模方法和装置
CN116614633A (zh) * 2019-01-02 2023-08-18 Oppo广东移动通信有限公司 解码预测方法、装置及计算机存储介质
EP3895421A4 (en) 2019-01-09 2022-06-15 Beijing Dajia Internet Information Technology Co., Ltd. VIDEO CODING USING AN INTER-COMPONENT LINEAR MODEL
WO2020143825A1 (en) * 2019-01-11 2020-07-16 Beijing Bytedance Network Technology Co., Ltd. Size dependent cross-component linear model
CN109451306B (zh) * 2019-01-16 2020-08-11 北京数码视讯软件技术发展有限公司 色度分量的最佳预测模式的选择方法、装置及电子设备
WO2020150535A1 (en) * 2019-01-17 2020-07-23 Beijing Dajia Internet Information Technology Co., Ltd. Methods and apparatus of linear model derivation for video coding
WO2020149770A1 (en) * 2019-01-18 2020-07-23 Huawei Technologies Co., Ltd. Method and apparatus of local illumination compensation for predictive coding
WO2020156526A1 (en) 2019-02-01 2020-08-06 Beijing Bytedance Network Technology Co., Ltd. Interactions between in-loop reshaping and inter coding tools
CN113396582B (zh) 2019-02-01 2024-03-08 北京字节跳动网络技术有限公司 环路整形和调色板模式之间的相互作用
CN113439437B (zh) * 2019-02-22 2023-11-24 北京字节跳动网络技术有限公司 用于帧内预测的邻近样点选择
BR112021015017B1 (pt) 2019-02-24 2022-07-26 Bytedance Inc. Método e aparelho para codificar dados de vídeo, e, mídia de armazenamento
US20200288159A1 (en) 2019-03-08 2020-09-10 Qualcomm Incorporated Combined residual coding in video coding
WO2020181471A1 (zh) * 2019-03-11 2020-09-17 Oppo广东移动通信有限公司 帧内预测方法、装置及计算机存储介质
CN113994665A (zh) * 2019-03-12 2022-01-28 北京达佳互联信息技术有限公司 采用多模型线性模型的视频编码
CN113574889B (zh) 2019-03-14 2024-01-12 北京字节跳动网络技术有限公司 环路整形信息的信令和语法
CN113676732B (zh) 2019-03-18 2023-06-20 Oppo广东移动通信有限公司 图像分量预测方法、编码器、解码器以及存储介质
EP3925216A4 (en) 2019-03-23 2022-06-15 Beijing Bytedance Network Technology Co., Ltd. RESTRICTIONS ON ADAPTIVE LOOP FILTER PARAMETER SETS
CN113767631B (zh) * 2019-03-24 2023-12-15 北京字节跳动网络技术有限公司 用于帧内预测的参数推导中的条件
EP3930329A4 (en) * 2019-03-25 2022-07-20 Guangdong Oppo Mobile Telecommunications Corp., Ltd. IMAGE COMPONENT PREDICTION METHOD, ENCODER, DECODER AND COMPUTER STORAGE MEDIA
CN115720268A (zh) * 2019-03-26 2023-02-28 北京字节跳动网络技术有限公司 用于帧间预测的参数推导
CN113796086B (zh) * 2019-04-25 2023-06-06 寰发股份有限公司 编码或解码视频数据的方法和装置
CN111866510A (zh) 2019-04-30 2020-10-30 华为技术有限公司 视频序列的帧内预测方法及装置
WO2020224629A1 (en) 2019-05-08 2020-11-12 Beijing Bytedance Network Technology Co., Ltd. Conditions for applicability of cross-component coding
WO2020236038A1 (en) * 2019-05-21 2020-11-26 Huawei Technologies Co., Ltd. Method and apparatus of cross-component prediction
EP3973709A4 (en) * 2019-05-22 2023-02-01 Nokia Technologies Oy METHOD, APPARATUS AND COMPUTER PROGRAM PRODUCT FOR VIDEO CODING AND DECODING
CN113875244A (zh) * 2019-05-22 2021-12-31 北京字节跳动网络技术有限公司 利用多行的线性模型模式参数推导
US12028534B2 (en) 2019-06-03 2024-07-02 Lg Electronics Inc. Video or image coding based on mapped luma component and scaled chroma component
KR20210142008A (ko) * 2019-06-17 2021-11-23 엘지전자 주식회사 루마 맵핑 및 크로마 스케일링 기반 비디오 또는 영상 코딩
US11949872B2 (en) 2019-06-17 2024-04-02 Lg Electronics Inc. Luma mapping-based video or image coding
WO2020256399A1 (ko) * 2019-06-17 2020-12-24 엘지전자 주식회사 루마 샘플들의 맵핑 및 크로마 샘플들의 스케일링 기반 비디오 또는 영상 코딩
CN114175651A (zh) 2019-06-20 2022-03-11 Lg电子株式会社 基于亮度映射和色度缩放的视频或图像编码
CN117278749A (zh) 2019-06-20 2023-12-22 Lg电子株式会社 图像解码和编码方法、数据的发送方法及存储介质
CN118018730A (zh) * 2019-06-20 2024-05-10 Lg电子株式会社 解码和编码设备以及发送用于图像的数据的设备
JP7297950B2 (ja) 2019-06-24 2023-06-26 エルジー エレクトロニクス インコーポレイティド ルママッピング基盤ビデオまたは映像コーディング
KR20220003115A (ko) * 2019-06-24 2022-01-07 엘지전자 주식회사 루마 맵핑 및 크로마 스케일링 기반 비디오 또는 영상 코딩
CN114270830B (zh) 2019-06-24 2023-07-18 Lg电子株式会社 基于亮度样本的映射和色度样本的缩放的视频或图像编码
ES2975857T3 (es) 2019-06-25 2024-07-16 Guangdong Oppo Mobile Telecommunicationscorp Ltd Método y dispositivo de predicción de componente de imagen, y medio de almacenamiento informático
US11330298B2 (en) * 2019-06-25 2022-05-10 Qualcomm Incorporated Simplified intra chroma mode coding in video coding
KR20220011182A (ko) 2019-06-25 2022-01-27 에스지 디제이아이 테크놀러지 코., 엘티디 비디오 이미지 처리 방법, 장치 및 저장 매체
TWI747339B (zh) * 2019-06-27 2021-11-21 聯發科技股份有限公司 視訊編解碼之方法和裝置
CN117278748A (zh) 2019-07-05 2023-12-22 Lg电子株式会社 图像解码和编码方法、存储介质及数据的发送方法
KR20220004767A (ko) 2019-07-05 2022-01-11 엘지전자 주식회사 루마 맵핑 기반 비디오 또는 영상 코딩
CN114303368A (zh) 2019-07-05 2022-04-08 Lg电子株式会社 基于亮度映射和色度缩放的视频或图像编码
KR102660738B1 (ko) 2019-07-07 2024-04-26 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 크로마 잔차 스케일링의 시그널링
US11528504B2 (en) * 2019-07-11 2022-12-13 Qualcomm Incorporated Motion vector prediction with motion information collecting buffer
US11399199B2 (en) * 2019-08-05 2022-07-26 Qualcomm Incorporated Chroma intra prediction units for video coding
CN112437298A (zh) * 2019-08-26 2021-03-02 北京三星通信技术研究有限公司 编解码方法及装置
CN114303382A (zh) * 2019-09-01 2022-04-08 北京字节跳动网络技术有限公司 视频编解码中预测权重的对准
JP7324940B2 (ja) 2019-09-19 2023-08-10 北京字節跳動網絡技術有限公司 ビデオコーディングにおけるスケーリングウインドウ
MX2022002916A (es) 2019-09-19 2022-04-06 Beijing Bytedance Network Tech Co Ltd Derivacion de posiciones de muestra de referencia en codificacion de video.
KR20220066041A (ko) 2019-09-20 2022-05-23 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 크로마 스케일링의 루마 매핑
WO2021063419A1 (en) * 2019-10-05 2021-04-08 Beijing Bytedance Network Technology Co., Ltd. Downsampling filter type for chroma blending mask generation
WO2021068922A1 (en) 2019-10-10 2021-04-15 Beijing Bytedance Network Technology Co., Ltd. Deblocking of blocks coded in geometry partition mode
WO2021068955A1 (en) 2019-10-12 2021-04-15 Beijing Bytedance Network Technology Co., Ltd. Use and signaling of refining video coding tools
MX2022004200A (es) 2019-10-13 2022-05-02 Beijing Bytedance Network Tech Co Ltd Interaccion entre remuestreo de imagen de referencia y herramientas de codificacion de video.
WO2021110116A1 (en) * 2019-12-04 2021-06-10 Beijing Bytedance Network Technology Co., Ltd. Prediction from multiple cross-components
WO2021129866A1 (en) 2019-12-27 2021-07-01 Beijing Bytedance Network Technology Co., Ltd. Signaling of slice types in video pictures headers
CN114902661A (zh) * 2019-12-30 2022-08-12 华为技术有限公司 用于跨分量线性模型预测的滤波方法和装置
EP4087252A4 (en) * 2019-12-31 2023-01-25 Guangdong Oppo Mobile Telecommunications Corp., Ltd. TRANSFORMATION METHOD, ENCODER, DECODER AND STORAGE MEDIUM
WO2021177735A1 (ko) * 2020-03-04 2021-09-10 인텔렉추얼디스커버리 주식회사 비디오 코딩 방법 및 장치, 그리고 비트스트림을 저장한 기록 매체
WO2021086237A2 (en) * 2020-04-01 2021-05-06 Huawei Technologies Co., Ltd. Method and apparatus of sample fetching and padding for downsampling filtering for cross-component linear model prediction
US11146801B1 (en) * 2020-06-30 2021-10-12 Tencent America LLC Cross component intra prediction mode
US11638019B2 (en) * 2020-07-29 2023-04-25 Alibaba Group Holding Limited Methods and systems for prediction from multiple cross-components
CN117256149A (zh) * 2021-04-16 2023-12-19 北京达佳互联信息技术有限公司 使用多模型线性模型的视频编解码
CN113329228B (zh) * 2021-05-27 2024-04-26 杭州网易智企科技有限公司 视频编码方法、解码方法、装置、电子设备及存储介质
WO2022260374A1 (ko) * 2021-06-07 2022-12-15 현대자동차주식회사 개선된 크로스 컴포넌트 선형 모델 예측을 이용하는 비디오 코딩방법 및 장치
EP4364417A1 (en) * 2021-06-28 2024-05-08 Nokia Technologies Oy An apparatus and a method for video coding and decoding
WO2023084155A1 (en) * 2021-11-15 2023-05-19 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
WO2023089230A2 (en) * 2021-11-16 2023-05-25 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
WO2023116706A1 (en) * 2021-12-21 2023-06-29 Mediatek Inc. Method and apparatus for cross component linear model with multiple hypotheses intra modes in video coding system
WO2023116704A1 (en) * 2021-12-21 2023-06-29 Mediatek Inc. Multi-model cross-component linear model prediction
WO2023133312A1 (en) * 2022-01-10 2023-07-13 Beijing Dajia Internet Information Technology Co., Ltd Method and apparatus for cross-component prediction for video coding
WO2023195708A1 (ko) * 2022-04-03 2023-10-12 엘지전자 주식회사 영상 인코딩/디코딩 방법 및 장치, 그리고 비트스트림을 저장한 기록 매체
WO2023200933A1 (en) * 2022-04-13 2023-10-19 Innopeak Technology, Inc. Cross-component model adjustment for video coding
US20230388540A1 (en) * 2022-05-27 2023-11-30 Tencent America LLC Signaling of downsampling filters for chroma from luma intra prediction mode
US20240015279A1 (en) * 2022-07-11 2024-01-11 Tencent America LLC Mixed-model cross-component prediction mode
WO2024071523A1 (ko) * 2022-09-26 2024-04-04 현대자동차주식회사 개선된 크로스 컴포넌트 선형 모델 예측을 이용하는 비디오 코딩을 위한 방법 및 장치
WO2024074752A1 (en) * 2022-10-06 2024-04-11 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
WO2024074129A1 (en) * 2022-10-07 2024-04-11 Mediatek Inc. Method and apparatus of inheriting temporal neighbouring model parameters in video coding system

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011083599A1 (ja) * 2010-01-07 2011-07-14 株式会社 東芝 動画像符号化装置及び動画像復号化装置
CN102204251A (zh) * 2008-10-03 2011-09-28 高通股份有限公司 使用大于4×4和8×8的变换的视频译码
CN103141100A (zh) * 2010-10-01 2013-06-05 高通股份有限公司 用于视频译码的帧内平滑滤波器
WO2013102293A1 (en) * 2012-01-04 2013-07-11 Mediatek Singapore Pte. Ltd. Improvements of luma-based chroma intra prediction
CN103650512A (zh) * 2011-07-12 2014-03-19 英特尔公司 基于亮度的色度帧内预测
CN104272739A (zh) * 2012-04-26 2015-01-07 索尼公司 用于不同颜色取样格式的基于模式的系数扫描和对角变换
CN104602009A (zh) * 2010-07-31 2015-05-06 M&K控股株式会社 帧内预测解码设备
CN104871537A (zh) * 2013-03-26 2015-08-26 联发科技股份有限公司 色彩间帧内预测的方法
KR20150105184A (ko) * 2014-03-06 2015-09-16 삼성전자주식회사 영상 복호화 방법 및 그 장치, 영상 부호화 방법 및 그 장치
CN105379266A (zh) * 2013-07-19 2016-03-02 高通股份有限公司 停用帧内预测滤波
WO2016115981A1 (en) * 2015-01-22 2016-07-28 Mediatek Singapore Pte. Ltd. Method of video coding for chroma components
CN105874799A (zh) * 2014-01-11 2016-08-17 高通股份有限公司 用于3d视频译码的基于块的高级残差预测

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3208101B2 (ja) * 1996-11-07 2001-09-10 松下電器産業株式会社 画像符号化方法および画像符号化装置並びに画像符号化プログラムを記録した記録媒体
WO2013155662A1 (en) * 2012-04-16 2013-10-24 Mediatek Singapore Pte. Ltd. Methods and apparatuses of simplification for intra chroma lm mode
US10397607B2 (en) * 2013-11-01 2019-08-27 Qualcomm Incorporated Color residual prediction for video coding

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102204251A (zh) * 2008-10-03 2011-09-28 高通股份有限公司 使用大于4×4和8×8的变换的视频译码
WO2011083599A1 (ja) * 2010-01-07 2011-07-14 株式会社 東芝 動画像符号化装置及び動画像復号化装置
CN104602009A (zh) * 2010-07-31 2015-05-06 M&K控股株式会社 帧内预测解码设备
CN103141100A (zh) * 2010-10-01 2013-06-05 高通股份有限公司 用于视频译码的帧内平滑滤波器
CN103650512A (zh) * 2011-07-12 2014-03-19 英特尔公司 基于亮度的色度帧内预测
WO2013102293A1 (en) * 2012-01-04 2013-07-11 Mediatek Singapore Pte. Ltd. Improvements of luma-based chroma intra prediction
CN104272739A (zh) * 2012-04-26 2015-01-07 索尼公司 用于不同颜色取样格式的基于模式的系数扫描和对角变换
CN104871537A (zh) * 2013-03-26 2015-08-26 联发科技股份有限公司 色彩间帧内预测的方法
CN105379266A (zh) * 2013-07-19 2016-03-02 高通股份有限公司 停用帧内预测滤波
CN105874799A (zh) * 2014-01-11 2016-08-17 高通股份有限公司 用于3d视频译码的基于块的高级残差预测
KR20150105184A (ko) * 2014-03-06 2015-09-16 삼성전자주식회사 영상 복호화 방법 및 그 장치, 영상 부호화 방법 및 그 장치
WO2016115981A1 (en) * 2015-01-22 2016-07-28 Mediatek Singapore Pte. Ltd. Method of video coding for chroma components

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Chroma Intra Prediction Based on Inter-Channel Correlation for HEVC;Xingyu Zhang;《IEEE Transactions on Image Processing ( Volume: 23, Issue: 1, Jan. 2014)》;20131101;摘要、第1-7页 *
Clustered linear regression;BERTAN ARI ET AL;《KNOWLEDGE-BASED SYSTEMS,vol. 15, no. 3, 1 March 2002 (2002-03-01),pages 169-175,XP055433429,AMSTERDAM, NL ISSN:0950-7051,DOI:10.1016/S0950一7051(01)00154-X》;20020301;全文 *
高效视频编码;沈燕飞等;《计算机学报》;20131115(第11期);全文 *

Also Published As

Publication number Publication date
JP7044765B2 (ja) 2022-03-30
SG11201900967XA (en) 2019-04-29
KR102534901B1 (ko) 2023-05-19
JP2019530330A (ja) 2019-10-17
BR112019004544A2 (pt) 2019-05-28
EP3513559A1 (en) 2019-07-24
ES2884375T3 (es) 2021-12-10
US20180077426A1 (en) 2018-03-15
CN109716771A (zh) 2019-05-03
TWI776818B (zh) 2022-09-11
EP3513559B1 (en) 2021-08-04
WO2018053293A1 (en) 2018-03-22
TW201817236A (zh) 2018-05-01
US10652575B2 (en) 2020-05-12
KR20190046852A (ko) 2019-05-07

Similar Documents

Publication Publication Date Title
CN109716771B (zh) 用于视频译码的线性模型色度帧内预测
JP7284137B2 (ja) クワッドツリーを用いるブロック情報の符号化/復号化方法及びその方法を使用する装置
CN113612997B (zh) 针对视频译码使用与位置相关的预测组合的改进视频帧内预测
TWI782904B (zh) 合併用於視訊寫碼之用於多類別區塊之濾波器
JP5922244B2 (ja) ビデオコーディングにおいて適応ループフィルタとマージされたサンプル適応オフセット
JP5833249B2 (ja) ビデオコーディングのための適応的な中心帯域オフセットフィルタ
JP6293756B2 (ja) スケーラブルビデオ符号化における変換基準の調整
KR102301450B1 (ko) 비디오 정보의 스케일러블 코딩을 위한 디바이스 및 방법
US20150071357A1 (en) Partial intra block copying for video coding
KR102182441B1 (ko) 비디오 코딩에서 hevc 확장들을 위한 다중 계층들의 저복잡도 지원
JP2018078569A (ja) ビデオコード化のためのlcuベースの適応ループフィルタ処理
JP6199371B2 (ja) ビデオ・コーディングのためのインタ・レイヤ・テクスチャ予測
JP2015530040A (ja) スケーラブルビデオコード化における代替変換
EP3020194A1 (en) Intra motion compensation extensions
JP7423647B2 (ja) 異なるクロマフォーマットを使用した三角予測ユニットモードでのビデオコーディング
WO2014025698A1 (en) Weighted difference prediction under the framework of generalized residual prediction
JP6224851B2 (ja) 低複雑度符号化および背景検出のためのシステムおよび方法
CN111149361B (zh) 具有在用于视频译码的随机存取配置中的未来参考帧的自适应图片群组结构
JP2024501465A (ja) 固定されたフィルタを用いる適応ループフィルタ
CN110892724A (zh) 视频译码中的经改进帧内预测

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40000966

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant