CN114205592A - 视频序列的帧内预测方法及装置 - Google Patents

视频序列的帧内预测方法及装置 Download PDF

Info

Publication number
CN114205592A
CN114205592A CN202111510040.7A CN202111510040A CN114205592A CN 114205592 A CN114205592 A CN 114205592A CN 202111510040 A CN202111510040 A CN 202111510040A CN 114205592 A CN114205592 A CN 114205592A
Authority
CN
China
Prior art keywords
coding tree
chroma
chroma coding
mode
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111510040.7A
Other languages
English (en)
Other versions
CN114205592B (zh
Inventor
赵寅
杨海涛
陈建乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN202111510040.7A priority Critical patent/CN114205592B/zh
Publication of CN114205592A publication Critical patent/CN114205592A/zh
Application granted granted Critical
Publication of CN114205592B publication Critical patent/CN114205592B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本申请实施例公开了一种视频序列的帧内预测方法,包括:获取色度编码树节点的尺寸和划分方式;根据色度编码树节点的尺寸和划分方式,确定色度编码树节点包含的色度编码单元是否允许使用跨分量线性模型帧内预测CCLM;根据色度编码单元是否允许使用CCLM,确定色度编码单元的预测模式;根据色度编码单元的预测模式对色度编码单元进行处理,以得到色度编码单元的预测像素。本申请实施例还公开了一种帧内预测装置及解码器。采用本申请实施例有利于降低色度编码单元的处理延时,提高了硬件解码器的吞吐率。

Description

视频序列的帧内预测方法及装置
本申请要求于2019年4月30日递交中国知识产权局、申请号为201910370987.9,发明名称为“视频序列的帧内预测方法及装置”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及视频编解码技术领域,尤其涉及一种视频序列的帧间预测方法及装置。
背景技术
在H.265视频编码标准中,一帧图像被分割成互不重叠的编码树单元(codingtree unit,CTU),CTU的尺寸可设置为64*64或者其他值。尺寸为64*64的CTU为包含64*64个像素的矩形像素点阵,该矩阵像素点阵包括64列,每列包括64个像素,每个像素包含亮度分量或/和色度分量。
H.265基于四叉树(quad-tree,QT)划分方式,以CTU为四叉树的根节点,将CTU递归划分成若干个叶节点。一个节点对应于一个图像区域,如果节点不继续划分,则节点称为叶节点,它对应的图像区域形成一个CU;如果节点继续划分,则节点对应的图像区域划分成四个相同尺寸的区域,每个区域对应一个节点。一个节点是否划分由码流中这个节点对应的划分标志位确定。根节点的深度为0,子节点的深度为父节点的深度+1。
对尺寸为64*64的CTU节点(深度为0),根据它对应的划分标志位,可选择不划分,成为1个尺寸为64*64的CU,或者选择划分为4个尺寸为32*32的节点(深度为1)。这4个尺寸为32*32的节点中的每一个节点,又可以根据它对应的划分标志位,选择继续划分或者不划分;如果对一个尺寸为32*32的节点继续划分,则产生四个尺寸为16*16的节点(深度为2)。以此类推,直到所有节点都不再划分,这样一个CTU就被划分成一组CU。
VTM参考软件在四叉树划分的基础上,增加了二叉树(binary tree,BT)划分方式和三叉树(ternary tree,TT)划分方式。
多用途视频编码测试模型(versatile video coding test model,VTM)中使用了QT级联BT和TT的划分方式,称为四叉树+多类型树(Quad-tree plus Multi-type Tree,QT-MTT)方式,即第一级编码树上的节点只能使用QT划分成子节点,第一级编码树的叶节点为第二级编码树的根节点;第二级编码树上的节点可使用水平二分、竖直二分、水平三分、竖直三分这四种划分方式中的一种划分为子节点;第二级编码树的叶节点为编码单元。
当解析到一个节点为叶节点后,此叶节点为一个CU,进一步解析CU对应的编码信息(包括CU的预测模式、变换系数等信息,例如H.265中的coding_unit()语法结构体),然后按照这些编码信息对CU进行预测、反量化、反变换、环路滤波等解码处理,产生这个CU对应的重建图像。QT-MTT这样灵活的编码树结构使得CTU能够根据图像局部特点划分成合适大小的一组CU。
一种CTU划分成一组CU的划分方式对应于一个编码树。VTM中,对帧内图像(Ipicture)允许采用分离树结构。此时,从编码树上的某一节点A开始,节点A的亮度块采用亮度编码树划分,亮度编码树的叶节点为亮度CU,其中只包含亮度像素;节点A的色度块采用色度编码树划分,色度编码树的叶节点为色度CU,其中只包含色度像素。
在VTM5(即VTM软件第5版本)中,对帧内图像可使用分离树结构。对使用分离树结构的帧内图像,尺寸为128*128的编码树节点采用四叉树划分方式可划分为4个尺寸为64*64的节点,每个尺寸为64*64节点均包含亮度像素和色度像素。尺寸为64*64的节点采用分离树结构,即尺寸为64*64节点的亮度块通过亮度编码树划分,尺寸为64*64节点的色度块通过色度编码树划分。亮度编码树和色度编码树采用的划分方式可能不同,如尺寸为64*64节点的亮度块可采用四叉树划分方式而色度块可采用水平二分划分方式。在YUV4:2:0格式下,因为色度的水平和竖直采样率为亮度的一半,所以尺寸为M*N的节点对应于(M/2)*(N/2)个色度像素。
然而,在帧内图像采用分离树结构的情况下,可能会造成色度处理延时较长,降低了硬件解码器的吞吐率。
发明内容
本申请实施例提供一种视频序列的帧内预测方法及装置,采用本发明实施例降低了色度处理延时,提高了硬件解码器的吞吐率。其中,视频序列(video sequence)包括一幅或者多幅图像(picture)。
为表述简洁,本发明各实施例中节点的尺寸和形状即指节点对应的图像区域的尺寸和形状。本发明各实施例中,节点的宽和高均以节点对应的亮度像素的个数来表示。
第一方面,本发明实施例提供一种视频序列的帧内预测方法,包括:
获取色度编码树节点的尺寸和划分方式;根据色度编码树节点的尺寸和划分方式,确定色度编码树节点包含的色度编码单元是否允许使用跨分量线性模型帧内预测CCLM;根据色度编码单元是否允许使用CCLM,确定色度编码单元的预测模式;根据色度编码单元的预测模式对色度编码单元进行处理,以得到色度编码单元的预测像素。根据色度编码树节点的尺寸和划分方式确定是否允许色度编码树节点包含的色度块使用CCLM,从而降低了使用CCLM的色度编码单元的处理时延,提高了硬件解码器的吞吐率。
在一种可行的实施例中,色度编码树节点的尺寸为M*N,根据色度编码树节点的尺寸和划分方式,确定色度编码树节点包含的色度编码单元是否允许使用CCLM,包括:
当M和N均等于预设阈值T1时,若色度编码树节点的划分方式满足第一预设条件,则确定色度编码单元允许使用CCLM;若色度编码树节点的划分方式不满足第一预设条件,则确定色度编码单元不允许使用CCLM;其中,第一预设条件包括:不划分或者四叉树划分方式。
在一种可行的实施例中,色度编码树节点的尺寸为M*N,根据所述色度编码树节点的尺寸和划分方式,确定色度编码树节点包含的色度编码单元是否允许使用CCLM,还包括:
当M等于T1且N等于T1/2时,若色度编码树节点的划分方式满足第二预设条件,则确定色度编码单元允许使用CCLM;若色度编码树节点的划分方式不满足第二预设条件,则确定色度编码单元不允许使用CCLM;其中,第二预设条件包括:不划分或者竖直二分方式。
在一种可行的实施例中,根据色度编码树节点的尺寸和划分方式,确定色度编码树节点包含的色度编码单元是否允许使用CCLM,包括:
根据色度编码树节点的尺寸和划分方式、色度编码树节点对应的亮度编码树节点的划分方式以及亮度编码树节点的亮度块不划分时对应是否采用帧内子块划分ISP模型,确定色度编码树节点包含的色度编码单元是否允许使用CCLM。
在一种可行的实施例中,色度编码树节点的尺寸为M*N,根据所述色度编码树节点的尺寸和划分方式、色度编码树节点对应的亮度编码树节点的划分方式,确定色度编码树节点包含的色度编码单元是否允许使用CCLM,包括:
当色度编码树节点满足第三预设条件时,确定色度编码单元不允许使用CCLM;
当色度编码树节点不满足所述第三预设条件,且M等于T1、N等于T1时,若色度编码树节点的划分方式满足第一预设条件,则确定色度编码单元允许使用CCLM;若色度编码树节点的划分方式不满足第一预设条件,则确定色度编码单元不允许使用CCLM;其中,第一预设条件包括:不划分或者四叉树划分方式。
在一种可行的实施例中,色度编码树节点的尺寸为M*N,根据色度编码树节点的尺寸和划分方式、色度编码树节点对应的亮度编码树节点的划分方式以及亮度编码树节点不划分时对应的亮度块是否采用帧内子块划分ISP模型,确定色度编码树节点包含的色度编码单元是否允许使用CCLM,包括:
当色度编码树节点满足第三预设条件中的任一条件时,确定色度编码单元不允许使用CCLM;当色度编码树节点不满足第三预设条件,且N=T1、M=T1/2时,若色度编码树节点的划分方式满足第二预设条件,则确定色度编码单元允许使用CCLM;若色度编码树节点的划分方式不满足第二预设条件,则确定色度编码单元不允许使用CCLM;其中,第二预设条件包括:不划分或者竖直二分方式。
在一种可行的实施例中,所述第三预设条件包括以下条件1-条件13中的一种或者任意多种的组合,其中,条件1-条件13分别为:
条件1:色度编码树节点对应的亮度编码树节点的划分方式为不划分且亮度编码树节点的亮度块使用ISP模式,其中,亮度编码树节点的尺寸为T1*T1;
条件2:色度编码树节点对应的亮度编码树节点的划分方式为不划分且该亮度编码树节点的亮度块采用ISP模式且色度编码树节点划分为子节点,其中,色度编码树节点的尺寸、亮度编码树节点的尺寸和亮度块的尺寸均为T1*T1;
条件3:色度编码树节点对应的亮度编码树节点的划分方式为不划分且该亮度编码树节点的亮度块采用水平ISP模式且色度编码树节点采用竖直二分方式、竖直三分方式、四叉树划分方式中的一种划分为子节点;其中,色度编码树节点尺寸、亮度编码树节点的尺寸及亮度块的尺寸均为T1*T1;
条件4:色度编码树节点对应的亮度编码树节点的划分方式为不划分且该亮度编码树节点的亮度块采用水平ISP模式且色度编码树节点采用水平三分方式、竖直二分方式、竖直三分方式、四叉树划分方式中的一种划分为子节点;其中,色度编码树节点尺寸、亮度编码树节点的尺寸及亮度块的尺寸均为T1*T1;
条件5:色度编码树节点对应的亮度编码树节点的划分方式为不划分且该亮度编码树节点的亮度块采用水平ISP预测模式且色度编码树节点采用竖直二分方式、竖直三分方式、水平三分方式中的一种划分为子节点;其中,亮度编码树节点的尺寸为T1*T1,色度编码树节点尺寸为T1*(T1/2);
条件6:色度编码树节点对应的亮度编码树节点的划分方式为不划分且该亮度编码树节点的亮度块采用竖直ISP模式且色度编码树节点采用水平二分方式、水平三分方式、四叉树划分方式中的一种划分为子节点;其中,色度编码树节点尺寸、亮度编码树节点的尺寸均为T1*T1;
条件7:色度编码树节点对应的亮度编码树节点的划分方式为不划分且该亮度编码树节点的亮度块采用竖直ISP预测模式且色度编码树节点采用竖直三分方式、水平二分方式、水平三分方式、四叉树划分方式中的一种划分为子节点;其中,色度编码树节点尺寸、亮度编码树节点的尺寸及亮度块的尺寸均为T1*T1;
条件8:色度编码树节点对应的亮度编码树节点的划分方式为不划分且该亮度编码树节点的亮度块采用竖直ISP模式且色度编码树节点采用水平二分方式、水平三分方式、竖直三分方式中的一种划分为子节点;其中,亮度编码树节点的尺寸及亮度块的尺寸均为T1*T1,色度编码树节点尺寸为T1*(T1/2);
条件9:色度编码树节点对应的亮度编码树节点采用水平二分方式划分为子节点;其中,亮度编码树节点的尺寸为T1*T1;
条件10:色度编码树节点对应的亮度编码树节点采用竖直二分方式划分为子节点;其中,亮度编码树节点的尺寸为T1*T1;
条件11:色度编码树节点对应的亮度编码树节点采用水平三分方式划分为子节点;其中,亮度编码树节点的尺寸为T1*T1;
条件12:色度编码树节点对应的亮度编码树节点采用竖直三分方式划分子节点;其中,亮度编码树节点的尺寸为T1*T1;
条件13:色度编码树节点对应的亮度编码树节点使用的划分方式为不划分和四叉树划分之外的划分方式;其中,亮度编码树节点的尺寸为T1*T1。
在此需要说明的是,色度编码树节点划分为子节点具体是指色度编码树节点采用水平二分方式、竖直二分方式、水平三分方式、竖直三分方式和四叉树划分方式中的一种划分为子节点。
在一种可行的实施例中,第三预设条件包括:
色度编码树节点对应的亮度编码树节点的划分方式为不划分且亮度编码树节点的亮度块使用ISP预测模式;其中,亮度编码树节点的尺寸和亮度块的尺寸均为T1*T1。
在一种可行的实施例中,第三预设条件包括:
色度编码树节点对应的亮度编码树节点的划分方式为不划分且亮度编码树节点的亮度块采用ISP模式且色度编码树节点划分为子节点,其中,色度编码树节点的尺寸、亮度编码树节点的尺寸和亮度块的尺寸均为T1*T1。
在一种可行的实施例中,第三预设条件包括上述条件1和条件13。
在一种可行的实施例中,第三预设条件包括上述条件2和条件13。
在一种可行的实施例中,第三预设条件包括:
色度编码树节点对应的亮度编码树节点的划分方式为不划分且亮度编码树节点的亮度块采用ISP模式且色度编码树节点划分为子节点,或者亮度编码树节点的划分方式为水平二分方式和竖直二分方式中的一种、其中,色度编码树节点的尺寸、亮度编码树节点的尺寸和亮度块的尺寸均为T1*T1。
在一种可行的实施例中,第三预设条件包括上述条件3、条件5、条件6、条件8和条件13。
在一种可行的实施例中,第三预设条件包括上述条件4、条件5、条件7、条件8和条件13。
在一种可行的实施例中,第三预设条件包括上述条件3、条件5、条件7、条件8、条件9、条件10、条件11和条件12。
在一个可行的实施例中,预设阈值T1等于64。
第二方面,本发明实施例提供一种视频序列的帧内预测方法,包括:
解析码流,得到第一标识和第二标识,第一标识用于指示是否对视频序列中的帧内图像采用分离树结构,第二标识用于指示是否允许视频序列中的色度块使用CCLM;
若第一标识指示对视频序列中的帧内图像采用分离树结构,且第二标识指示允许视频序列中的色度块使用CCLM,则执行如第一方面及第一方面的各种实施例所述的视频序列的帧内预测方法。
第三方面,本发明实施例提供一种视频序列的帧内预测装置,包括:
获取单元,用于获取色度编码树节点的尺寸和划分方式;
确定单元,用于根据色度编码树节点的尺寸和划分方式,确定色度编码树节点包含的色度编码单元是否允许使用CCLM;并根据色度编码单元是否允许使用CCLM,确定色度编码单元的预测模式;
预测单元,用于根据色度编码单元的预测模式对色度编码单元进行处理,以得到色度编码单元的预测像素。
在一种可行的实施例中,色度编码树节点的尺寸为M*N,在根据色度编码树节点的尺寸和划分方式,确定色度编码树节点包含的色度编码单元是否允许使用CCLM的方面,确定单元具体用于:
当M和N均等于预设阈值T1时,若色度编码树节点的划分方式满足第一预设条件,则确定色度编码单元允许使用CCLM;若色度编码树节点的划分方式不满足第一预设条件,则确定色度编码单元不允许使用CCLM;其中,第一预设条件包括:不划分或者四叉树划分方式。
在一种可行的实施例中,色度编码树节点的尺寸为M*N,在根据色度编码树节点的尺寸和划分方式,确定色度编码树节点包含的色度编码单元是否允许使用CCLM的方面,确定单元具体用于:
当M等于T1且N等于T1/2时,若色度编码树节点的划分方式满足第二预设条件,则确定色度编码单元允许使用CCLM;若色度编码树节点的划分方式不满足第二预设条件,则确定色度编码单元不允许使用CCLM;其中,第二预设条件包括:不划分或者竖直二分方式。
在一种可行的实施例中,在根据色度编码树节点的尺寸和划分方式,确定色度编码树节点包含的色度编码单元是否允许使用跨分量线性模型帧内预测CCLM的方面,确定单元具体用于:
根据色度编码树节点的尺寸和划分方式、色度编码树节点对应的亮度编码树节点的划分方式以及亮度编码树节点不划分时对应的亮度块是否采用ISP模型,确定色度编码树节点包含的色度编码单元是否允许使用CCLM。
在一种可行的实施例中,色度编码树节点的尺寸为M*N,在根据色度编码树节点的尺寸和划分方式、色度编码树节点对应的亮度编码树节点的划分方式以及亮度编码树节点不划分时对应的亮度块是否采用帧内子块划分ISP模型,确定色度编码树节点包含的色度编码单元是否允许使用CCLM的方面,确定单元具体用于:
当色度编码树节点满足第三预设条件时,确定色度编码单元不允许使用CCLM;当色度编码树节点不满足第三预设条件,且M等于T1、N等于T1时,若色度编码树节点的划分方式满足第一预设条件,则确定色度编码单元允许使用CCLM;若色度编码树节点的划分方式不满足第一预设条件,则确定色度编码单元不允许使用CCLM;其中,第一预设条件包括:不划分或者四叉树划分方式。
在一种可行的实施例中,色度编码树节点的尺寸为M*N,在根据色度编码树节点的尺寸和划分方式、色度编码树节点对应的亮度编码树节点的划分方式以及亮度编码树节点不划分时对应的亮度块是否采用帧内子块划分ISP模型,确定色度编码树节点包含的色度编码单元是否允许使用CCLM的方面,确定单元具体用于:
当色度编码树节点满足第三预设条件中的任一条件时,确定色度编码单元不允许使用CCLM;当色度编码树节点不满足第三预设条件,且N=T1、M=T1/2时,若色度编码树节点的划分方式满足第二预设条件,则确定色度编码单元允许使用CCLM;若色度编码树节点的划分方式不满足第二预设条件,则确定色度编码单元不允许使用CCLM;其中,第二预设条件包括:不划分或者竖直二分方式。
在一种可行的实施例中,第三预设条件包括第一方面中的条件1、条件2、条件3、条件4、条件5、条件6、条件7、条件8、条件9、条件10、条件11、条件12和条件13中的一条或者多条。
在一种可行的实施例中,第三预设条件包括:
色度编码树节点对应的亮度编码树节点的划分方式为不划分且亮度编码树节点的亮度块使用ISP预测模式,其中,亮度编码树节点的尺寸和亮度块的尺寸均为T1*T1。
在一种可行的实施例中,第三预设条件包括:
色度编码树节点对应的亮度编码树节点的划分方式为不划分且亮度编码树节点的亮度块采用ISP模式且色度编码树节点划分为子节点,其中,色度编码树节点的尺寸、亮度编码树节点的尺寸和亮度块的尺寸均为T1*T1。
在一种可行的实施例中,第三预设条件包括第一方面中的条件1和条件13。
在一种可行的实施例中,第三预设条件包括第一方面中的条件2和条件13。
在一种可行的实施例中,第三预设条件包括:
色度编码树节点对应的亮度编码树节点的划分方式为不划分且亮度编码树节点的亮度块采用ISP模式且色度编码树节点划分为子节点,或者亮度编码树节点的划分方式为水平二分方式和竖直二分方式中的一种,其中,色度编码树节点的尺寸、亮度编码树节点的尺寸和亮度块的尺寸均为T1*T1。
在一种可行的实施例中,第三预设条件包括第一方面中的条件3、条件5、条件6、条件8和条件13。
在一种可行的实施例中,第三预设条件包括第一方面中的条件4、条件5、条件7、条件8和条件13。
在一种可行的实施例中,第三预设条件包括第一方面中的条件3、条件5、条件7、条件8、条件9、条件10、条件11和条件12。
在一个可行的实施例中,预设阈值T1等于64。
第四方面,本发明实施例提供一种视频序列的帧内预测装置,包括:
解码单元,用于解析码流,得到第一标识和第二标识,第一标识用于指示是否对视频序列中的帧内图像采用分离树结构,第二标识用于指示是否允许视频序列中的色度块使用CCLM;
预测单元,用于若第一标识指示对视频序列中的帧内图像采用分离树结构,且第二标识指示允许视频序列中的色度块使用CCLM,则执行如第一方面视频序列的帧内预测方法的部分或全部。
第五方面,本发明实施例提供一种解码设备,包括:相互耦合的非易失性存储器和处理器,所述处理器调用存储在所述存储器中的程序代码以执行第一方面或第二方面的任意一种方法的部分或全部步骤。
第六方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储了程序代码,其中,所述程序代码包括用于执行第一方面或第二方面的任意一种方法的部分或全部步骤的指令。
应当理解的是,本申请的第二至第六方面与本发明的第一方面的技术方案一致,各方面及对应的可行实施方式所取得的有益效果相似,不再赘述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为CTU的划分方式示意图;
图2为色度块和亮度块的一种划分方式示意图;
图3为色度块和亮度块的另一种划分方式示意图;
图4为本发明实施例中一种视频编码及解码系统的示意性框图;
图5a为本发明实施例中一种视频编码器的示意性框图;
图5b为本发明实施例中一种视频解码器的示意性框图;
图5c为本发明实施例中一种编码装置或解码装置实例的框图;
图6为本发明实施例中提供的一种视频序列的帧内预测方法的流程示意图;
图7为本发明实施例中提供的一种视频序列的帧内预测方法的流程示意图;
图8为本发明实施例中提供的一种帧内预测装置的结构示意图;
图9为本发明实施例中提供的一种帧内预测装置的结构示意图。
具体实施方式
下面结合附图对本申请的实施例进行描述。
在此首先对本发明中涉及的术语进行说明。
编码树单元(coding tree unit,CTU):一幅图像由多个CTU构成,一个CTU通常对应于一个方形图像区域,包含这个图像区域中的亮度像素和色度像素(或者也可以只包含亮度像素,或者也可以只包含色度像素);CTU中还包含语法元素,这些语法元素指示如何将CTU划分成至少一个编码单元(coding unit,CU),以及解码每个编码单元得到重建图像的方法。
CU:通常对应于一个尺寸为A×B的矩形区域,包含A×B亮度像素和它对应的色度像素,A为矩形的宽,B为矩形的高,A和B可以相同也可以不同,A和B的取值通常为2的整数次幂,例如256、128、64、32、16、8、4。一个CU可通过解码处理解码得到一个A×B的矩形区域的重建图像,解码处理通常包括预测、反量化、反变换等处理,产生预测图像和残差,预测图像和残差叠加后得到重建图像。
四叉树:一种树状结构,一个节点可划分为四个子节点。H265视频编码标准采用基于四叉树的CTU划分方式:CTU作为根节点,每个节点对应于一个方形的区域;一个节点可以不再划分(此时它对应的区域为一个CU),或者将这个节点划分成四个下一层级的节点,即把这个方形区域划分成四个尺寸相同的方形区域(其长、宽各为划分前区域长、宽的一半),每个区域对应于一个节点。如图1中的(a)图所示。
二叉树:一种树状结构,一个节点可划分成两个子节点。现有采用二叉树的编码方法中,一个二叉树结构上的节点可以不划分,或者把此节点划分成两个下一层级的节点。划分成两个节点的方式有两种:1)水平二分,将节点对应的区域划分成上、下两个相同尺寸的区域,每个区域对应于一个节点,如图1中的(b)图所示;或者2)竖直二分,将节点对应的区域划分成左、右两个尺寸相同的区域,每个区域对应于一个节点,如图1中的(c)图所示。
三叉树:一种树状结构,一个节点可划分成三个子节点。现有采用三叉树的编码方法中,一个三叉树结构上的节点可以不划分,或者把此节点划分成三个下一层级的节点。划分成三个节点的方式有两种:1)水平三分,将节点对应的区域划分成上、中、下三个区域,每个区域对应于一个节点,其中上、中、下三个区域的高分别为节点高的1/4、1/2、1/4,如图1中的(d)图所示;或者2)竖直三分,将节点对应的区域划分成左、中、右三个区域,每个区域对应于一个节点,其中左、中、右三个区域的宽分别为节点高的1/4、1/2、1/4,如图1中的(f)图所示。
多用途视频编码测试模型(versatile video coding test model,VTM):JVET组织开发的H.266/多用途视频编码(versatile video coding,VVC)标准编解码器参考软件。
跨分量线性模型帧内预测(cross-component linear model intra prediction,CCLM)是一种通过亮度重建像预测色度的方法,比如VTM5中的CCLM技术。它通过当前色度块周围的重建亮度像素和重建色度像素估算线性模型参数α和β,并将当前色度块对应的重建亮度像素下采样后通过线性模型得到当前色度块的预测像素,如公式1所示:
predC(i,j)=α*rec'L(i,j)+β (1)
其中,α和β为线性模型系数,predC(i,j)为(i,j)位置上的色度像素的预测值,rec'L(i,j)为当前色度块对应亮度重建块下采样至色度分量分辨率后(i,j)位置上的亮度重建像素值。需要注意的是,对于YUV4:2:0格式的视频,亮度分量的分辨率是色度分量分辨率的4倍(宽高各两倍),为了得到与色度块同分辨率的亮度块,需要将亮度分量按照色度分量相同的下采样方法下采样至色度分辨率,再进行使用。
帧内子块划分(intra sub-partition,ISP)是一种基于子块划分的帧内预测技术,例如VTM5中的ISP技术。当使用ISP模式时,一个亮度块将水平划分或竖直划分为多个(如2个或4个)相同大小的亮度子块,每个亮度子块依次解码重建。如果色度块使用普通帧内预测模式(如角度预测,平面预测,直流预测等模式),则色度块的帧内预测只使用色度块周围的重建像素,因此色度块的帧内预测与亮度块的帧内预测可以并行处理,色度块执行预测处理相对于对应区域的亮度块执行预测处理的最大延时(简称色度处理延时)为包含0个亮度像素的区域的帧内预测及重建的处理时间。在单一树下,一个CU包含亮度和色度像素,色度像素使用CCLM时需要依赖对应位置的亮度重建像素,如果将亮度块拆分成多个子区域依次进行处理,则一个亮度子区域进行帧内预测并叠加上残差之后就得到该亮度子区域的重建像素,对应位置的色度子区域就可以利用该亮度子区域的重建像素进行CCLM预测,因此在帧内图像采用分离树结构的情况下,如果色度块使用CCLM预测,可能会造成色度处理延时较长的问题。
例如,尺寸为64*64的节点的亮度块采用四叉树划分(如图2中的(a)图所示)时,产生的四个亮度节点的处理顺序依次为节点0、节点1、节点2、节点3。当尺寸为64*64的节点的色度块采用如图2中的(b)图所示的竖直二分方式划分产生2个色度节点时,如果色度节点0使用CCLM预测,则,色度节点0需要等待亮度节点2完成重建后才能获得CCLM预测所需要的亮度重建像素值,色度处理延时为3个尺寸为32*32的亮度区域(即3072个亮度像素)的处理时间。又例如,当尺寸为64*64的节点的色度块采用如图2中的(c)图所示的水平二叉树划分产生2个色度节点且上侧尺寸为64*32的节点的色度块继续采用水平二叉树划分为两个节点时,如果色度节点0使用CCLM预测,则色度节点0需要等待亮度节点1完成重建后才能获得所有CCLM预测需要的亮度重建像素值,色度处理延时为2个尺寸为32*32的亮度区域(即2048个亮度像素)的处理时间。
当尺寸为64*64的节点的色度块采用某些划分时,色度节点执行CCLM的处理延时不超过1个尺寸为32*32的亮度区域的处理时间。例如,当尺寸为64*64的节点的亮度块采用四叉树划分方式进行划分时,如果对应的色度块也采用四叉树划分方式进行划分,如图2中的(d)图所示,则色度节点0在亮度节点0完成重建之后可以执行CCLM,色度节点1在亮度节点1完成重建之后可以执行CCLM,依此类推。又例如,如果尺寸为64*64的节点的色度块不划分,如图2中的(e)图所示,则色度块可拆分成四个区域p0、p1、p2、p3依次完成帧内预测,色度区域p0在亮度节点0完成重建之后可以执行CCLM,色度区域p1在亮度节点1完成重建之后可以执行CCLM,以此类推。又例如,如果尺寸为64*64的节点的色度块先使用水平二分,上侧尺寸为64*32的色度节点使用竖直二分方式进行划分,下侧尺寸为64*32的色度节点不划分,如图2中的(f)图所示,则色度节点0、1、2的色度处理延时均为一个尺寸为32*32的亮度区域的处理延时,因为色度节点0在亮度节点0完成重建之后可以执行CCLM,色度节点1在亮度节点1完成重建之后可以执行CCLM,色度节点2的区域p0在亮度节点2完成重建之后可以执行CCLM,色度节点2的区域p1在亮度节点3完成重建之后可以执行CCLM。
另一方面,在帧内图像采用分离树结构的情况下,当尺寸为64*64的亮度块不划分且该亮度块使用ISP模式时,也可能导致色度处理延时超过1个尺寸为32*32的亮度区域的处理时间。例如,当尺寸为64*64节点的亮度块采用竖直ISP模式划分为四个亮度子块时,如图3中的(a)图所示,如果尺寸为64*64节点的色度块采用水平二分方式进行划分,如图3中的(b)图所示,则色度节点0在4个亮度子块完成重建之后才可以执行CCLM,色度处理延时为4个尺寸为32*32的亮度区域的处理时间。类似的,当尺寸为64*64节点的亮度块采用水平ISP模式划分为四个亮度子块时,如图3中的(e)图所示,如果尺寸为64*64节点的色度块采用竖直二分,如图3中的(f)图所示,则色度节点0在4个亮度子块完成重建之后才可以执行CCLM,色度处理延时为4个尺寸为32*32的亮度区域的处理时间。
当尺寸为64*64的节点的色度块采用某些划分时,即使尺寸为64*64的亮度块不划分且该亮度块使用ISP模式,色度节点执行CCLM的处理延时也不超过1个尺寸为32*32的亮度区域的处理时间。例如,当尺寸为64*64的节点的亮度块采用竖直ISP模式时,如果尺寸为64*64的节点的色度块不划分,如图3中的(d)图所示,或者如果尺寸为64*64的节点的色度块采用竖直二分得到尺寸为32*64节点且该节点使用竖直二分或不划分,如图3中的(c)提所示,则色度处理延时为1个尺寸为16*64的亮度区域的处理时间,这也可以认为近似等于1个32*32亮度区域的处理时间(两者均对应1024个亮度像素)。更具体的,当尺寸为64*64的节点的色度块不划分时,色度块可以竖直拆分成四个子区域,每个子区域在对应的尺寸为16*64的亮度子块完成重建之后就可以开始执行CCLM。如果尺寸为64*64的节点的色度块采用竖直二分得到尺寸为32*64的节点且该节点使用竖直二分时,则每个尺寸为16*64的色度节点在对应的尺寸为16*64的亮度子块完成重建之后就可以开始执行CCLM;尺寸为32*64的节点不划分时,也可以竖直拆分成2个尺寸为16*64的子区域,每个子区域在对应的尺寸为16*64的亮度子块完成重建之后就可以开始执行CCLM。类似的,当尺寸为64*64的节点的亮度块采用水平ISP模式时,如果尺寸为64*64的节点的色度块不划分,如图3中的(h)图所示,或者如果尺寸为64*64的节点的色度块采用水平二分得到尺寸为64*32的节点且该节点使用水平二分或不划分,如图3中的(g)所示,则色度处理延时为1个尺寸为64*16的亮度区域的处理时间,等于1个尺寸为32*32的亮度区域的处理时间。
图4为本申请实施例中所描述的一种实例的视频译码系统4的框图。如本文所使用,术语“视频译码器”一般是指视频编码器和视频解码器两者。在本申请中,术语“视频译码”或“译码”可一般地指代视频编码或视频解码。视频译码系统1的视频编码器100和视频解码器300用于根据本申请提出的多种新的帧间预测模式中的任一种所描述的各种方法实例来预测当前经译码图像块或其子块的运动信息,例如运动矢量,使得预测出的运动矢量最大程度上接近使用运动估算方法得到的运动矢量,从而编码时无需传送运动矢量差值,从而进一步的改善编解码性能。
如图4中所示,视频译码系统1包含源装置10和目的地装置30。源装置10产生经编码视频数据。因此,源装置10可被称为视频编码装置。目的地装置30可对由源装置10所产生的经编码的视频数据进行解码。因此,目的地装置30可被称为视频帧内预测装置。源装置10、目的地装置30或两个的各种实施方案可包含一或多个处理器以及耦合到所述一或多个处理器的存储器。所述存储器可包含但不限于RAM、ROM、EEPROM、快闪存储器或可用于以可由计算机存取的指令或数据结构的形式存储所要的程序代码的任何其它媒体,如本文所描述。
源装置10和目的地装置30可以包括各种装置,包含桌上型计算机、移动计算装置、笔记型(例如,膝上型)计算机、平板计算机、机顶盒、例如所谓的“智能”电话等电话手持机、电视机、相机、显示装置、数字媒体播放器、视频游戏控制台、车载计算机或其类似者。
目的地装置30可经由链路50从源装置10接收经编码视频数据。链路50可包括能够将经编码视频数据从源装置10移动到目的地装置30的一或多个媒体或装置。在一个实例中,链路50可包括使得源装置10能够实时将经编码视频数据直接发射到目的地装置30的一或多个通信媒体。在此实例中,源装置10可根据通信标准(例如无线通信协议)来调制经编码视频数据,且可将经调制的视频数据发射到目的地装置30。所述一或多个通信媒体可包含无线和/或有线通信媒体,例如射频(RF)频谱或一或多个物理传输线。所述一或多个通信媒体可形成基于分组的网络的一部分,基于分组的网络例如为局域网、广域网或全球网络(例如,因特网)。所述一或多个通信媒体可包含路由器、交换器、基站或促进从源装置10到目的地装置30的通信的其它设备。
在另一实例中,可将经编码数据从输出接口140输出到存储装置40。类似地,可通过输入接口340从存储装置40存取经编码数据。存储装置40可包含多种分布式或本地存取的数据存储媒体中的任一者,例如硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器,或用于存储经编码视频数据的任何其它合适的数字存储媒体。
在另一实例中,存储装置40可对应于文件服务器或可保持由源装置10产生的经编码视频的另一中间存储装置。目的地装置30可经由流式传输或下载从存储装置40存取所存储的视频数据。文件服务器可为任何类型的能够存储经编码的视频数据并且将经编码的视频数据发射到目的地装置30的服务器。实例文件服务器包含网络服务器(例如,用于网站)、FTP服务器、网络附接式存储(NAS)装置或本地磁盘驱动器。目的地装置30可通过任何标准数据连接(包含因特网连接)来存取经编码视频数据。这可包含无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器等),或适合于存取存储在文件服务器上的经编码视频数据的两者的组合。经编码视频数据从存储装置40的传输可为流式传输、下载传输或两者的组合。
本申请的运动矢量预测技术可应用于视频编解码以支持多种多媒体应用,例如空中电视广播、有线电视发射、卫星电视发射、串流视频发射(例如,经由因特网)、用于存储于数据存储媒体上的视频数据的编码、存储在数据存储媒体上的视频数据的解码,或其它应用。在一些实例中,视频译码系统1可用于支持单向或双向视频传输以支持例如视频流式传输、视频回放、视频广播和/或视频电话等应用。
图4中所说明的视频译码系统1仅为实例,并且本申请的技术可适用于未必包含编码装置与帧内预测装置之间的任何数据通信的视频译码设置(例如,视频编码或视频解码)。在其它实例中,数据从本地存储器检索、在网络上流式传输等等。视频编码装置可对数据进行编码并且将数据存储到存储器,和/或视频帧内预测装置可从存储器检索数据并且对数据进行解码。在许多实例中,由并不彼此通信而是仅编码数据到存储器和/或从存储器检索数据且解码数据的装置执行编码和解码。
在图4的实例中,源装置10包含视频源120、视频编码器100和输出接口140。在一些实例中,输出接口140可包含调节器/解调器(调制解调器)和/或发射器。视频源120可包括视频捕获装置(例如,摄像机)、含有先前捕获的视频数据的视频存档、用以从视频内容提供者接收视频数据的视频馈入接口,和/或用于产生视频数据的计算机图形系统,或视频数据的此些来源的组合。
视频编码器100可对来自视频源120的视频数据进行编码。在一些实例中,源装置10经由输出接口140将经编码视频数据直接发射到目的地装置30。在其它实例中,经编码视频数据还可存储到存储装置40上,供目的地装置30以后存取来用于解码和/或播放。
在图4的实例中,目的地装置30包含输入接口340、视频解码器300和显示装置330。在一些实例中,输入接口340包含接收器和/或调制解调器。输入接口340可经由链路30和/或从存储装置40接收经编码视频数据。显示装置330可与目的地装置30集成或可在目的地装置30外部。一般来说,显示装置330显示经解码视频数据。显示装置330可包括多种显示装置,例如,液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或其它类型的显示装置。
尽管图4中未图示,但在一些方面,视频编码器100和视频解码器300可各自与音频编码器和解码器集成,且可包含适当的多路复用器-多路分用器单元或其它硬件和软件,以处置共同数据流或单独数据流中的音频和视频两者的编码。在一些实例中,如果适用的话,那么MUX-DEMUX单元可符合ITU H.223多路复用器协议,或例如用户数据报协议(UDP)等其它协议。
视频编码器100和视频解码器300各自可实施为例如以下各项的多种电路中的任一者:一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、硬件或其任何组合。如果部分地以软件来实施本申请,那么装置可将用于软件的指令存储在合适的非易失性计算机可读存储媒体中,且可使用一或多个处理器在硬件中执行所述指令从而实施本申请技术。前述内容(包含硬件、软件、硬件与软件的组合等)中的任一者可被视为一或多个处理器。视频编码器100和视频解码器300中的每一者可包含在一或多个编码器或解码器中,所述编码器或解码器中的任一者可集成为相应装置中的组合编码器/解码器(编码解码器)的一部分。
本申请可大体上将视频编码器100称为将某些信息“发信号通知”或“发射”到例如视频解码器300的另一装置。术语“发信号通知”或“发射”可大体上指代用以对经压缩视频数据进行解码的语法元素和/或其它数据的传送。此传送可实时或几乎实时地发生。替代地,此通信可经过一段时间后发生,例如可在编码时在经编码位流中将语法元素存储到计算机可读存储媒体时发生,帧内预测装置接着可在所述语法元素存储到此媒体之后的任何时间检索所述语法元素。
视频编码器100和视频解码器300可根据例如高效视频编码(HEVC)等视频压缩标准或其扩展来操作,并且可符合HEVC测试模型(HM)。或者,视频编码器100和视频解码器300也可根据其它业界标准来操作,所述标准例如是ITU-T H.264、H.265标准,或此类标准的扩展。然而,本申请的技术不限于任何特定编解码标准。
图5a示出用于实现本申请(公开)技术的视频编码器100的实例的示意性/概念性框图。在图5a的实例中,视频编码器100包括残差计算单元204、变换处理单元206、量化单元208、逆量化单元210、逆变换处理单元212、重构单元214、缓冲器216、环路滤波器单元220、经解码图片缓冲器(decoded picture buffer,DPB)230、预测处理单元260和熵编码单元270。预测处理单元260可以包含帧间预测单元244、帧内预测单元254和模式选择单元262。帧间预测单元244可以包含运动估计单元和运动补偿单元(未图示)。图5a所示的视频编码器100也可以称为混合型视频编码器或根据混合型视频编解码器的视频编码器。
例如,残差计算单元204、变换处理单元206、量化单元208、预测处理单元260和熵编码单元270形成编码器100的前向信号路径,而例如逆量化单元210、逆变换处理单元212、重构单元214、缓冲器216、环路滤波器220、经解码图片缓冲器(decoded picture buffer,DPB)230、预测处理单元260形成编码器的后向信号路径,其中编码器的后向信号路径对应于解码器的信号路径(参见图5b中的视频解码器300)。
编码器100通过例如输入202,接收图片201或图片201的块203,例如,形成视频或视频序列的图片序列中的图片。图片块203也可以称为当前图片块或待编码图片块,图片201可以称为当前图片或待编码图片(尤其是在视频编码中将当前图片与其它图片区分开时,其它图片例如同一视频序列亦即也包括当前图片的视频序列中的先前经编码和/或经解码图片)。
分割
编码器100的实施例可以包括分割单元(图5a中未绘示),用于将图片201分割成多个例如块203的块,通常分割成多个不重叠的块。分割单元可以用于对视频序列中所有图片使用相同的块大小以及定义块大小的对应栅格,或用于在图片或子集或图片群组之间更改块大小,并将每个图片分割成对应的块。
在一个实例中,视频编码器100的预测处理单元260可以用于执行上述分割技术的任何组合。
如图片201,块203也是或可以视为具有亮度值(采样值)的采样点的二维阵列或矩阵,虽然其尺寸比图片201小。换句话说,块203可以包括,例如,一个采样阵列(例如黑白图片201情况下的亮度阵列)或三个采样阵列(例如,彩色图片情况下的一个亮度阵列和两个色度阵列)或依据所应用的色彩格式的任何其它数目和/或类别的阵列。块203的水平和垂直方向(或轴线)上采样点的数目定义块203的尺寸。
如图5a所示的编码器100用于逐块编码图片201,例如,对每个块203执行编码和预测。
残差计算
残差计算单元204用于基于图片块203和预测块265(下文提供预测块265的其它细节)计算残差块205,例如,通过逐样本(逐像素)将图片块203的样本值减去预测块265的样本值,以在样本域中获取残差块205。
变换
变换处理单元206用于在残差块205的样本值上应用例如离散余弦变换(discretecosine transform,DCT)或离散正弦变换(discrete sine transform,DST)的变换,以在变换域中获取变换系数207。变换系数207也可以称为变换残差系数,并在变换域中表示残差块205。
变换处理单元206可以用于应用DCT/DST的整数近似值,例如为HEVC/H.265指定的变换。与正交DCT变换相比,这种整数近似值通常由某一因子按比例缩放。为了维持经正变换和逆变换处理的残差块的范数,应用额外比例缩放因子作为变换过程的一部分。比例缩放因子通常是基于某些约束条件选择的,例如,比例缩放因子是用于移位运算的2的幂、变换系数的位深度、准确性和实施成本之间的权衡等。例如,在视频解码器300侧通过例如逆变换处理单元212为逆变换(以及在编码器100侧通过例如逆变换处理单元212为对应逆变换)指定具体比例缩放因子,以及相应地,可以在编码器100侧通过变换处理单元206为正变换指定对应比例缩放因子。
量化
量化单元208用于例如通过应用标量量化或向量量化来量化变换系数207,以获取经量化变换系数209。经量化变换系数209也可以称为经量化残差系数209。量化过程可以减少与部分或全部变换系数207有关的位深度。例如,可在量化期间将n位变换系数向下舍入到m位变换系数,其中n大于m。可通过调整量化参数(quantization parameter,QP)修改量化程度。例如,对于标量量化,可以应用不同的标度来实现较细或较粗的量化。较小量化步长对应较细量化,而较大量化步长对应较粗量化。可以通过量化参数(quantizationparameter,QP)指示合适的量化步长。例如,量化参数可以为合适的量化步长的预定义集合的索引。例如,较小的量化参数可以对应精细量化(较小量化步长),较大量化参数可以对应粗糙量化(较大量化步长),反之亦然。量化可以包含除以量化步长以及例如通过逆量化210执行的对应的量化或逆量化,或者可以包含乘以量化步长。根据例如HEVC的一些标准的实施例可以使用量化参数来确定量化步长。一般而言,可以基于量化参数使用包含除法的等式的定点近似来计算量化步长。可以引入额外比例缩放因子来进行量化和反量化,以恢复可能由于在用于量化步长和量化参数的等式的定点近似中使用的标度而修改的残差块的范数。在一个实例实施方式中,可以合并逆变换和反量化的标度。或者,可以使用自定义量化表并在例如比特流中将其从编码器通过信号发送到解码器。量化是有损操作,其中量化步长越大,损耗越大。
逆量化单元210用于在经量化系数上应用量化单元208的逆量化,以获取经反量化系数211,例如,基于或使用与量化单元208相同的量化步长,应用量化单元208应用的量化方案的逆量化方案。经反量化系数211也可以称为经反量化残差系数211,对应于变换系数207,虽然由于量化造成的损耗通常与变换系数不相同。
逆变换处理单元212用于应用变换处理单元206应用的变换的逆变换,例如,逆离散余弦变换(discrete cosine transform,DCT)或逆离散正弦变换(discrete sinetransform,DST),以在样本域中获取逆变换块213。逆变换块213也可以称为逆变换经反量化块213或逆变换残差块213。
重构单元214(例如,求和器214)用于将逆变换块213(即经重构残差块213)添加至预测块265,以在样本域中获取经重构块215,例如,将经重构残差块213的样本值与预测块265的样本值相加。
可选地,例如线缓冲器216的缓冲器单元216(或简称“缓冲器”216)用于缓冲或存储经重构块215和对应的样本值,用于例如帧内预测。在其它的实施例中,编码器可以用于使用存储在缓冲器单元216中的未经滤波的经重构块和/或对应的样本值来进行任何类别的估计和/或预测,例如帧内预测。
例如,编码器100的实施例可以经配置以使得缓冲器单元216不只用于存储用于帧内预测254的经重构块215,也用于环路滤波器单元220(在图5a中未示出),和/或,例如使得缓冲器单元216和经解码图片缓冲器单元230形成一个缓冲器。其它实施例可以用于将经滤波块221和/或来自经解码图片缓冲器230的块或样本(图5a中均未示出)用作帧内预测254的输入或基础。
环路滤波器单元220(或简称“环路滤波器”220)用于对经重构块215进行滤波以获取经滤波块221,从而顺利进行像素转变或提高视频质量。环路滤波器单元220旨在表示一个或多个环路滤波器,例如去块滤波器、样本自适应偏移(sample-adaptive offset,SAO)滤波器或其它滤波器,例如双边滤波器、自适应环路滤波器(adaptive loop filter,ALF),或锐化或平滑滤波器,或协同滤波器。尽管环路滤波器单元220在图5a中示出为环内滤波器,但在其它配置中,环路滤波器单元220可实施为环后滤波器。经滤波块221也可以称为经滤波的经重构块221。经解码图片缓冲器230可以在环路滤波器单元220对经重构编码块执行滤波操作之后存储经重构编码块。
编码器100(对应地,环路滤波器单元220)的实施例可以用于输出环路滤波器参数(例如,样本自适应偏移信息),例如,直接输出或由熵编码单元270或任何其它熵编码单元熵编码后输出,例如使得视频解码器300可以接收并应用相同的环路滤波器参数用于解码。
经解码图片缓冲器(decoded picture buffer,DPB)230可以为存储参考图片数据供视频编码器100编码视频数据之用的参考图片存储器。DPB 230可由多种存储器设备中的任一个形成,例如动态随机存储器(dynamic random access memory,DRAM)(包含同步DRAM(synchronous DRAM,SDRAM)、磁阻式RAM(magnetoresistive RAM,MRAM)、电阻式RAM(resistive RAM,RRAM))或其它类型的存储器设备。可以由同一存储器设备或单独的存储器设备提供DPB 230和缓冲器216。在某一实例中,经解码图片缓冲器(decoded picturebuffer,DPB)230用于存储经滤波块221。经解码图片缓冲器230可以进一步用于存储同一当前图片或例如先前经重构图片的不同图片的其它先前的经滤波块,例如先前经重构和经滤波块221,以及可以提供完整的先前经重构亦即经解码图片(和对应参考块和样本)和/或部分经重构当前图片(和对应参考块和样本),例如用于帧间预测。在某一实例中,如果经重构块215无需环内滤波而得以重构,则经解码图片缓冲器(decoded picture buffer,DPB)230用于存储经重构块215。
预测处理单元260,也称为块预测处理单元260,用于接收或获取块203(当前图片201的当前块203)和经重构图片数据,例如来自缓冲器216的同一(当前)图片的参考样本和/或来自经解码图片缓冲器230的一个或多个先前经解码图片的参考图片数据231,以及用于处理这类数据进行预测,即提供可以为经帧间预测块245或经帧内预测块255的预测块265。
模式选择单元262可以用于选择预测模式(例如帧内或帧间预测模式)和/或对应的用作预测块265的预测块245或255,以计算残差块205和重构经重构块215。
模式选择单元262的实施例可以用于选择预测模式(例如,从预测处理单元260所支持的那些预测模式中选择),所述预测模式提供最佳匹配或者说最小残差(最小残差意味着传输或存储中更好的压缩),或提供最小信令开销(最小信令开销意味着传输或存储中更好的压缩),或同时考虑或平衡以上两者。模式选择单元262可以用于基于码率失真优化(rate distortion optimization,RDO)确定预测模式,即选择提供最小码率失真优化的预测模式,或选择相关码率失真至少满足预测模式选择标准的预测模式。
下文将详细解释编码器100的实例(例如,通过预测处理单元260)执行的预测处理和(例如,通过模式选择单元262)执行的模式选择。
如上文所述,编码器100用于从(预先确定的)预测模式集合中确定或选择最好或最优的预测模式。预测模式集合可以包括例如帧内预测模式和/或帧间预测模式。
帧内预测模式集合可以包括35种不同的帧内预测模式,例如,如DC(或均值)模式和平面模式的非方向性模式,或如H.265中定义的方向性模式,或者可以包括67种不同的帧内预测模式,例如,如DC(或均值)模式和平面模式的非方向性模式,或如正在发展中的H.266中定义的方向性模式。
(可能的)帧间预测模式集合取决于可用参考图片(即,例如前述存储在DBP 230中的至少部分经解码图片)和其它帧间预测参数,例如取决于是否使用整个参考图片或只使用参考图片的一部分,例如围绕当前块的区域的搜索窗区域,来搜索最佳匹配参考块,和/或例如取决于是否应用如半像素和/或四分之一像素内插的像素内插。
除了以上预测模式,也可以应用跳过模式和/或直接模式。
预测处理单元260可以进一步用于将块203分割成较小的块分区或子块,例如,通过迭代使用四叉树(quad-tree,QT)分割、二进制树(binary-tree,BT)分割或三叉树(triple-tree,TT)分割,或其任何组合,以及用于例如为块分区或子块中的每一个执行预测,其中模式选择包括选择分割的块203的树结构和选择应用于块分区或子块中的每一个的预测模式。
帧间预测单元244可以包含运动估计(motion estimation,ME)单元(图5a中未示出)和运动补偿(motion compensation,MC)单元(图5a中未示出)。运动估计单元用于接收或获取图片块203(当前图片201的当前图片块203)和经解码图片231,或至少一个或多个先前经重构块,例如,一个或多个其它/不同先前经解码图片231的经重构块,来进行运动估计。例如,视频序列可以包括当前图片和先前经解码图片31,或换句话说,当前图片和先前经解码图片31可以是形成视频序列的图片序列的一部分,或者形成该图片序列。
例如,编码器100可以用于从多个其它图片中的同一或不同图片的多个参考块中选择参考块,并向运动估计单元(图5a中未示出)提供参考图片和/或提供参考块的位置(X、Y坐标)与当前块的位置之间的偏移(空间偏移)作为帧间预测参数。该偏移也称为运动向量(motion vector,MV)。
运动补偿单元用于获取,例如接收帧间预测参数,并基于或使用帧间预测参数执行帧间预测来获取帧间预测块245。由运动补偿单元(图5a中未示出)执行的运动补偿可以包含基于通过运动估计(可能执行对子像素精确度的内插)确定的运动/块向量取出或生成预测块。内插滤波可从已知像素样本产生额外像素样本,从而潜在地增加可用于编码图片块的候选预测块的数目。一旦接收到用于当前图片块的PU的运动向量,运动补偿单元246可以在一个参考图片列表中定位运动向量指向的预测块。运动补偿单元246还可以生成与块和视频条带相关联的语法元素,以供视频解码器300在解码视频条带的图片块时使用。
帧内预测单元254用于获取,例如接收同一图片的图片块203(当前图片块)和一个或多个先前经重构块,例如经重构相邻块,以进行帧内估计。例如,编码器100可以用于从多个(预定)帧内预测模式中选择帧内预测模式。
编码器100的实施例可以用于基于优化标准选择帧内预测模式,例如基于最小残差(例如,提供最类似于当前图片块203的预测块255的帧内预测模式)或最小码率失真(例如……)。
帧内预测单元254进一步用于基于如所选择的帧内预测模式的帧内预测参数确定帧内预测块255。在任何情况下,在选择用于块的帧内预测模式之后,帧内预测单元254还用于向熵编码单元270提供帧内预测参数,即提供指示所选择的用于块的帧内预测模式的信息。在一个实例中,帧内预测单元254可以用于执行下文描述的帧内预测技术的任意组合。
熵编码单元270用于将熵编码算法或方案(例如,可变长度编码(variable lengthcoding,VLC)方案、上下文自适应VLC(context adaptive VLC,CAVLC)方案、算术编码方案、上下文自适应二进制算术编码(context adaptive binary arithmetic coding,CABAC)、基于语法的上下文自适应二进制算术编码(syntax-based context-adaptive binaryarithmetic coding,SBAC)、概率区间分割熵(probability interval partitioningentropy,PIPE)编码或其它熵编码方法或技术)应用于经量化残差系数209、帧间预测参数、帧内预测参数和/或环路滤波器参数中的单个或所有上(或不应用),以获取可以通过输出272以例如经编码比特流21的形式输出的经编码图片数据21。可以将经编码比特流传输到视频解码器300,或将其存档稍后由视频解码器300传输或检索。熵编码单元270还可用于熵编码正被编码的当前视频条带的其它语法元素。
视频编码器100的其它结构变型可用于编码视频流。例如,基于非变换的编码器100可以在没有针对某些块或帧的变换处理单元206的情况下直接量化残差信号。在另一实施方式中,编码器100可具有组合成单个单元的量化单元208和逆量化单元210。
图5b为本发明实施例中一种视频解码器的示意性框图。视频解码器300的熵解码器303对位流进行熵解码以产生经量化的系数和一些语法元素。熵解码器303将语法元素转发到预测处理单元308。视频解码器300可接收在视频条带层级和/或图像块层级处的语法元素。本申请中,在一种示例下,这里的语法元素可以包括与色度编码树节点相关的帧内预测数据,该帧间预测数据可以包括第一标识qtbtt_dual_tree_intra_flag和第二标识sps_cclm_enabled_flag,第一标识用于指示是否对视频序列中的帧内图像采用分离树结构,第二标识用于指示是否允许视频序列中的色度块采用CCLM;可选的,还可以包括色度编码树节点的尺寸和划分标志位,划分标志位可取不同的值表示色度编码树节点采用不同的划分方式。可选的,还可以包括其他语法元素。
熵解码器303对码流进行熵解码,得到第一标识qtbtt_dual_tree_intra_flag和第二标识sps_cclm_enabled_flag;若第一标识指示对帧内图像采用分离树结构,且第二标识指示允许对视频序列中的色度块采用CCLM,则熵解码器303继续从码流中解析出色度编码树节点的尺寸和划分标志位,帧内预测器309基于划分标识位确定色度编码树节点的划分方式,并根据色度编码树节点的尺寸及划分方式确定色度编码树节点包含的色度编码单元是否允许使用CCLM;熵解码器303从码流中解析出色度编码单元的第一索引CuPreMode,若该第一索引的值等于MODE_INTRA,则熵解码器303继续从码流中解析出第三标识pcm_flag,若该第三标识指示色度编码单元不使用PCM模式,则熵解码器303从码流中解析出第二索引intra_chroma_pred_mode;帧内预测器309根据第二索引intra_chroma_pred_mode及色度编码单元对应的亮度编码单元预测模式确定色度编码单元的预测模式,然后根据色度编码单元的预测模式对色度编码单元进行帧内预测,得到色度编码单元的预测像素;熵解码器303还解析码流得到色度编码单元的残差信息。
反量化器304和反变换器305对色度编码单元的残差信息进行处理,得到色度编码单元的重建残差。
在帧内预测器309产生用于色度编码单元的预测像素之后,视频解码器300通过将来自反变换器305的重建残差与由帧内预测器310产生的预测像素求和以得到重建像素的色度编码单元,即经解码图像块。求和器311表示执行此求和操作的组件。在需要时,还可使用环路滤波器(在解码环路中或在解码环路之后)来使像素转变平滑或者以其它方式改进视频质量。滤波器单元306可以表示一或多个环路滤波器,例如去块滤波器、自适应环路滤波器(ALF)以及样本自适应偏移(SAO)滤波器。尽管在图5b中将滤波器单元306示出为环路内滤波器,但在其它实现方式中,可将滤波器单元306实施为环路后滤波器。在一种示例下,滤波器单元306适用于重建块以减小块失真,并且该结果作为经解码视频流输出。并且,还可以将给定帧或图像中的经解码图像块存储在经解码图像缓冲器307中,经解码图像缓冲器307存储用于后续运动补偿的参考图像。经解码图像缓冲器307可为存储器的一部分,其还可以存储经解码视频,以供稍后在显示装置(例如图4的显示装置330)上呈现,或可与此类存储器分开。
应当理解的是,视频解码器300的其它结构变化可用于解码经编码视频位流。例如,视频解码器300可以不经滤波器单元306处理而生成输出视频流;或者,对于某些图像块或者图像帧,视频解码器300的熵解码器303没有解码出经量化的系数,相应地不需要经反量化器304和反变换器305处理。
图5c是根据一示例性实施例的可用作图4中的源装置10和目的地装置30中的任一个或两个的装置500的简化框图。装置500可以实现本申请的技术,可以采用包含多个计算设备的计算系统的形式,或采用例如移动电话、平板计算机、膝上型计算机、笔记本电脑、台式计算机等单个计算设备的形式。
装置500中的处理器502可以为中央处理器。或者,处理器502可以为现有的或今后将研发出的能够操控或处理信息的任何其它类型的设备或多个设备。如图所示,虽然可以使用例如处理器502的单个处理器实践所揭示的实施方式,但是使用一个以上处理器可以实现速度和效率方面的优势。
在一实施方式中,装置500中的存储器504可以为只读存储器(Read Only Memory,ROM)设备或随机存取存储器(random access memory,RAM)设备。任何其他合适类型的存储设备都可以用作存储器504。存储器504可以包括代码和由处理器502使用总线512访问的数据506。存储器504可进一步包括操作系统508和应用程序510,应用程序510包含至少一个准许处理器502执行本文所描述的方法的程序。例如,应用程序510可以包括应用1到N,应用1到N进一步包括执行本文所描述的方法的视频编码应用。装置500还可包含采用从存储器514形式的附加存储器,该从存储器514例如可以为与移动计算设备一起使用的存储卡。因为视频通信会话可能含有大量信息,这些信息可以整体或部分存储在从存储器514中,并按需要加载到存储器504用于处理。
装置500还可包含一或多个输出设备,例如显示器518。在一个实例中,显示器518可以为将显示器和可操作以感测触摸输入的触敏元件组合的触敏显示器。显示器518可以通过总线512耦合于处理器502。除了显示器518还可以提供其它准许用户对装置500编程或以其它方式使用装置500的输出设备,或提供其它输出设备作为显示器518的替代方案。当输出设备是显示器或包含显示器时,显示器可以以不同方式实现,包含通过液晶显示器(liquid crystal display,LCD)、阴极射线管(cathode-ray tube,CRT)显示器、等离子显示器或发光二极管(light emitting diode,LED)显示器,如有机LED(organic LED,OLED)显示器。
装置500还可包含图像感测设备520或与其连通,图像感测设备520例如为相机或为现有的或今后将研发出的可以感测图像的任何其它图像感测设备520,所述图像例如为运行装置500的用户的图像。图像感测设备520可以放置为直接面向运行装置500的用户。在一实例中,可以配置图像感测设备520的位置和光轴以使其视野包含紧邻显示器518的区域且从该区域可见显示器518。
装置500还可包含声音感测设备522或与其连通,声音感测设备522例如为麦克风或为现有的或今后将研发出的可以感测装置500附近的声音的任何其它声音感测设备。声音感测设备522可以放置为直接面向运行装置500的用户,并可以用于接收用户在运行装置500时发出的声音,例如语音或其它发声。
虽然图5c中将装置500的处理器502和存储器504绘示为集成在单个单元中,但是还可以使用其它配置。处理器502的运行可以分布在多个可直接耦合的机器中(每个机器具有一个或多个处理器),或分布在本地区域或其它网络中。存储器504可以分布在多个机器中,例如基于网络的存储器或多个运行装置500的机器中的存储器。虽然此处只绘示单个总线,但装置500的总线512可以由多个总线形成。进一步地,从存储器514可以直接耦合至装置500的其它组件或可以通过网络访问,并且可包括单个集成单元,例如一个存储卡,或多个单元,例如多个存储卡。因此,可以以多种配置实施装置500。
需要指出的是,图5a所示的编码器、图5b所示的解码器和图5c所示的装置可执行如下图6和图7所示方法实施例的部分或全部。
参见图6、图6为本发明实施例提供的一种视频序列的帧内预测方法的流程示意图。如图6所示,该方法包括:
S601、获取色度编码树节点的尺寸和划分方式。
具体地,解析码流中相应的语法元素,得到色度编码树的节点的尺寸和划分方式。其中,色度编码树节点的划分方式可以包括不划分、四叉树划分、水平二分方式、水平三分方式、竖直二分方式、竖直三分方式中的至少一种。当然还可以为其他的划分方式,本发明不做限定。
在此需要说明的是,本发明实施例中视频序列的格式可以为YUV4:2:0格式、YUV4:2:2格式或YUV4:2:4格式。
S602、根据色度编码树节点的尺寸和划分方式,确定色度编码树节点包含的色度编码单元是否允许使用CCLM。
色度编码树节点包含的色度编码单元为色度编码树节点对应的图像区域中的色度编码单元。如果色度编码树节点不划分,则色度编码树节点包含一个色度编码单元。如果色度编码树节点划分为子节点,则色度编码树节点包含的色度编码单元为色度编码树节点下属的所有编码树叶节点对应的色度编码单元。
在一种可行的实施例中,色度编码树节点的尺寸为M*N,根据色度编码树节点的尺寸和划分方式,确定色度编码树节点包含的色度编码单元是否允许使用CCLM,包括:
当M和N均等于预设阈值T1时,若色度编码树节点的划分方式满足第一预设条件,则确定色度编码单元允许使用CCLM;若色度编码树节点的划分方式不满足第一预设条件,则确定色度编码单元不允许使用CCLM;其中,第一预设条件包括:不划分或者四叉树划分方式;阈值T1例如64或32。
当M等于T1,且N等于T1/2时,若色度编码树节点的划分方式满足第二预设条件,则确定色度编码单元允许使用CCLM;若色度编码树节点的划分方式不满足第二预设条件,则确定色度编码单元不允许使用CCLM;其中,第二预设条件包括:不划分或者竖直二分方式。
更具体的,当第一预设条件为不划分或者四叉树的划分方式时,“若色度编码树节点的划分方式满足第一预设条件”即为“若色度编码树节点的划分方式为不划分或四叉树划分方式”。当第二预设条件为不划分或者竖直二分方式时,“若色度编码树节点的划分方式满足第二预设条件”即为“若色度编码树节点的划分方式为不划分或者竖直二分方式”。在另一种可行的实施例中,第一预设条件还可以为不划分或者四叉树划分方式或者水平二分方式。在另一种可行的实施例中,第二预设条件还可以为不划分或者竖直二分方式或者水平二分方式。
如果当前色度编码树节点不进行划分,进一步解析当前色度编码树节点包含的色度编码单元的编码模式信息并完成解码重建。否则,按照当前色度编码树节点的划分方式将当前色度编码树节点划分为多个节点。
在此需要说明的是,在帧内图像采用分离树结构的情况下,尺寸为T1*(T1/2)的色度编码树节点仅能由尺寸为T1*T1的色度编码树节点使用水平二分方式划分得到,因此“色度编码树节点的尺寸为T1*(T1/2)”等价于该色度编码树节点的父节点(即尺寸为T1*T1的色度编码树节点)的划分方式为水平二分方式。
举例说明,假设色度编码树节点的尺寸为64*64,当尺寸为64*64的亮度块采用四叉树划分方式进行划分时,如图2中的(a)图所示。如果色度编码树节点的划分方式为四叉树划分方式,即色度编码树节点的色度块采用四叉树划分方式,如图2中的(d)图所示,则色度节点0在亮度节点0完成重建之后可以执行CCLM,色度节点1在亮度节点1完成重建之后可以执行CCLM,依次类推。再比如,如果色度编码树节点的划分方式为不划分,即色度编码树节点的色度块不划分,如图2中的(e)图所示,色度块可拆分成四个区域p0,p1,p2和p3,依次完成帧内预测。色度区域p0在亮度节点0完成重建后可执行CCLM,色度区域p1在亮度节点1完成重建之前可执行CCLM,以此类推。
如果尺寸为64*64的色度编码树节点的色度块先采用水平二分方式进行划分,然后上侧尺寸为64*32的色度节点采用竖直二分的方式进行划分,下侧尺寸为64*32的色度节点不划分,如图2中的(f)图所示,则色度节点0在亮度节点0完成重建之后执行CCLM,色度节点1在亮度节点1完成重建之后执行CCLM,色度节点2的区域p0在亮度节点2完成重建之后执行CCLM,色度节点2的区域p1在亮度节点3完成重建之后执行CCLM。因此当尺寸为64*64的色度块不划分或者采用四叉树划分方式进行划分时,或者,尺寸为64*32的色度块不划分或采用竖直二分的方式进行划分,色度节点执行CCLM的处理延时不超过1个尺寸为32*32的亮度区域的处理时间。
本实施例中,尺寸为T1*T1的亮度编码树节点可使用的划分方式可以限制为仅包括不划分和四叉树划分方式。这种限制可以通过限制在分离树情况下I帧图像的最大二叉树节点大小(如VTM5中的MaxBtSizeY)不能超过T1/2且最大三叉树节点大小(如VTM5中的MaxTtSizeY)不能超过T1/2来实现。
进一步的,色度编码树节点对应的亮度编码树节点包含的尺寸为T1*T1的亮度编码单元不使用ISP模式。
在一个可行的实施例中,在根据色的编码树的尺寸和划分方式确定该色度编码树包含的色度编码单元允许使用CCLM之外,还根据色度编码树节点对应的亮度编码树节点的划分方式确定色度编码树节点包含的色度编码单元是否允许使用CCLM。
在一个可行的实施例中,根据色度编码树节点的尺寸和划分方式,确定所述色度编码树节点包含的色度编码单元是否允许使用跨分量线性模型帧内预测CCLM,包括:
根据色度编码树节点的尺寸和划分方式、该色度编码树节点对应的亮度编码树节点的划分方式及亮度编码树节点不划分时对应的亮度块是否采用帧内子块划分ISP模型,确定色度编码树节点包含的色度编码单元是否允许使用CCLM。亮度编码树节点不划分时对应一个亮度编码单元,因此亮度编码树节点不划分时对应的亮度块即为亮度编码树节点对应的亮度编码单元中的亮度块。
色度编码树节点对应的亮度编码树节点为色度编码树所在分离树中的亮度编码树中尺寸为T1*T1的亮度编码树节点。例如,VVC draft 5中帧内图像使用分离树时,64*64的编码树节点通过分离树进行划分,分离树中包含一个亮度编码树和一个色度编码树。如果T1设置为64,则在这种情况下,色度编码树节点对应的亮度编码树节点为色度编码树所在分离树的亮度编码树的根节点。
在一个可行的实施例中,色度编码树节点的尺寸为M*N,根据色度编码树节点的尺寸和划分方式、该色度编码树节点对应的亮度编码树节点的划分方式及亮度编码树节点不划分时对应的亮度块是否采用帧内子块划分ISP模型,确定色度编码树节点包含的色度编码单元是否允许使用CCLM,包括:
当色度编码树节点满足第三预设条件中的任一条件时,确定色度编码单元不允许使用CCLM;
当色度编码树节点不满足第三预设条件,且M等于T1、N等于T1时,若色度编码树节点的划分方式满足第一预设条件,则确定色度编码单元允许使用CCLM;若色度编码树节点的划分方式不满足第一预设条件,则确定色度编码单元不允许使用CCLM;其中,所述第一预设条件包括:不划分或者四叉树划分方式;
当色度编码树节点不满足第三预设条件,且M等于T1、N等于T1/2时,若色度编码树节点的划分方式满足二预设条件,则确定色度编码单元允许使用CCLM;若色度编码树节点的划分方式不满足第二预设条件,则确定色度编码单元不允许使用CCLM;其中,所述第二预设条件包括:不划分或者竖直二分方式。
在一个实施例中,第三预设条件包括以下条件1-条件13中的一种或者任意多种的组合,其中,条件1-条件13分别为:
条件1:色度编码树节点对应的亮度编码树节点的划分方式为不划分且该亮度编码树节点的亮度块使用ISP模型,其中,亮度编码树节点的尺寸为T1*T1(亮度编码树节点和色度编码树节点属于同一分离树,即亮度编码树节点的左上角坐标与色度编码树根节点的左上角坐标相同);
条件2:色度编码树节点对应的亮度编码树节点的划分方式为不划分且该亮度编码树节点的亮度块采用ISP模式,且色度编码树节点划分为子节点,其中,色度编码树节点的尺寸、亮度编码树节点的尺寸和亮度块的尺寸均为T1*T1;
条件3:色度编码树节点对应的亮度编码树节点的划分方式为不划分且该亮度编码树节点的亮度块采用水平ISP模式且色度编码树节点采用竖直二分方式、竖直三分方式、四叉树划分方式中的一种划分为子节点;其中,色度编码树节点尺寸、亮度编码树节点的尺寸及亮度块的尺寸均为T1*T1;
条件4:色度编码树节点对应的亮度编码树节点的划分方式为不划分且该亮度编码树节点的亮度块采用水平ISP模式且色度编码树节点采用水平三分方式、竖直二分方式、竖直三分方式、四叉树划分方式中的一种划分为子节点;其中,色度编码树节点尺寸、亮度编码树节点的尺寸及所述亮度块的尺寸均为T1*T1;
条件5:色度编码树节点对应的亮度编码树节点的划分方式为不划分且该亮度编码树节点的亮度块采用水平ISP预测模式且色度编码树节点采用竖直二分方式、竖直三分方式、水平三分方式中的一种划分为子节点;其中,亮度编码树节点的尺寸为T1*T1,色度编码树节点尺寸为T1*(T1/2);
条件6:色度编码树节点对应的亮度编码树节点的划分方式为不划分且该亮度编码树节点的亮度块采用竖直ISP模式且色度编码树节点采用水平二分方式、水平三分方式、四叉树划分方式中的一种划分为子节点;其中,色度编码树节点尺寸、亮度编码树节点的尺寸均为T1*T1;和
条件7:色度编码树节点对应的亮度编码树节点的划分方式为不划分、且该亮度编码树节点的亮度块采用竖直ISP预测模式且色度编码树节点采用竖直三分方式、水平二分方式、水平三分方式、四叉树划分方式中的一种划分为子节点;其中,色度编码树节点尺寸、亮度编码树节点的尺寸及亮度块的尺寸均为T1*T1;
条件8:色度编码树节点对应的亮度编码树节点的划分方式为不划分且该亮度编码树节点的亮度块采用竖直ISP模式且色度编码树节点采用水平二分方式、水平三分方式、竖直三分方式中的一种划分为子节点;其中,亮度编码树节点的尺寸及所述亮度块的尺寸均为T1*T1,色度编码树节点尺寸为T1*(T1/2);
条件9:色度编码树节点对应的亮度编码树节点采用水平二分方式划分为子节点;其中,该亮度编码树节点的尺寸为T1*T1;
条件10:色度编码树节点对应的亮度编码树节点采用竖直二分方式划分为子节点;其中,该亮度编码树节点的尺寸为T1*T1;
条件11:色度编码树节点对应的亮度编码树节点采用水平三分方式划分为子节点;其中,该亮度编码树节点的尺寸为T1*T1;
条件12:色度编码树节点对应的亮度编码树节点采用竖直三分方式划分为子节点;其中,该亮度编码树节点的尺寸为T1*T1;
条件13:色度编码树节点对应的亮度编码树节点使用的划分方式为不划分和四叉树划分之外的划分方式;其中,该亮度编码树节点的尺寸为T1*T1。
需要指出的是,亮度编码树节点使用的划分方式为不划分和四叉树划分之外的划分方式是指亮度编码树节点使用的划分方式不为不划分或四叉树划分。
在此需要说明的是,在四叉树-多类型树(quad-tree plus multi-type tree,QT-MTT)结构下,一个节点最多允许的划分方式包括不划分、水平二分方式、竖直二分方式、水平三分方式、竖直三分方式和四叉树划分方式,因此条件3中“色度编码树节点采用竖直二分方式、竖直三分方式、四叉树划分方式中一种划分为子节点”在QT-MTT结构下可等价描述为“色度编码树节点采用的划分方式不为不划分、水平二分方式或者水平三分方式”。
在一个可行的实施例中,在将色度编码树节点对应的亮度编码树节点采用的划分方式限定为不划分和四叉树划分的前提下,第三预设条件包括上述条件1-9中的至少一项。
在此需要说明的是,色度编码树节点划分为子节点具体是指色度编码树节点采用水平二分方式、竖直二分方式、水平三分方式、竖直三分方式和四叉树划分方式中的一种划分为子节点。
在一个可行的实施例中,第三预设条件包括:
色度编码树节点对应的亮度编码树节点的划分方式为不划分且该亮度编码树节点的亮度块使用ISP预测模式;其中,亮度编码树节点的尺寸为T1*T1。
在一个可行的实施例中,第三预设条件包括:
色度编码树节点对应的亮度编码树节点的划分方式为不划分且该亮度编码树节点的亮度块采用ISP模式且色度编码树节点划分为子节点,其中,色度编码树节点的尺寸、亮度编码树节点的尺寸和亮度块的尺寸均为T1*T1。
在一个可行的实施例中,第三预设条件包括:
色度编码树节点对应的亮度编码树节点的划分方式为不划分且该亮度编码树节点的亮度块采用ISP模式且色度编码树节点划分为子节点,或者亮度编码树节点的划分方式为水平二分方式和竖直二分方式中的一种,其中,色度编码树节点的尺寸、亮度编码树节点的尺寸和亮度块的尺寸均为T1*T1。
在一个可行的实施例中,第三预设条件包括上述条件1-13中的一条或者多条。
在一个可行的实施例中,第三预设条件包括上述条件1或条件13。
在一个可行的实施例中,第三预设条件包括上述条件2或条件13。
在一个可行的实施例中,第三预设条件包括上述条件3、条件5、条件6、条件8和条件13。
在一个可行的实施例中,第三预设条件包括上述条件4、条件5、条件7、条件8和条件13。
在一个可行的实施例中,第三预设条件包括上述条件4、条件5、条件7、条件8、条件9、条件10、条件11和条件12。
在一个可能的实施例中,T1可以等于64,即若色度编码树节点的尺寸为T1*T1,则实际上该色度编码树节点的尺寸为64*64;若色度编码树节点尺寸为T1*(T1/2),则实际上该色度编码树节点尺寸为64*32;若亮度编码树节点尺寸为T1*T1,则实际上该亮度编码树节点尺寸为64*64;若亮度编码树节点的亮度块尺寸为T1*T1,则实际上该色度编码树节点尺寸为64*64。
在一个可行的实施例中,在根据色度编码树节点的尺寸和划分方式确定色度编码树节点包含的色度编码单元允许使用CCLM之后,再判断色度编码单元是否满足上述第三预设条件来进一步确定色度编码树节点包含的色度编码单元是否允许使用CCLM。
S603、根据色度编码单元是否允许使用CCLM,获取该色度编码单元的预测模式。
其中,色度编码单元的预测模式包括直接模式、平面模式(planar mode)、直流模式(DC mode)、角度模式(angular mode)、CCLM模式、脉冲编码调制(pulse-codemodulation,PCM)模式、帧内块拷贝(intra block copy,IBC)模式。
具体地,根据从语法表中解析色度编码单元的语法元素CuPredMode。如果色度编码单元的CuPredMode值等于MODE_INTRA,则解析得到pcm_flag,该pcm_flag用于指示色度编码单元是否使用PCM模式。若根据pcm_flag确定色度编码单元不使用PCM模式,则进一步解析语法元素intra_chroma_pred_mode。
若色度编码单元不允许使用CCLM模式时,则可根据下表1,由语法元素intra_chroma_pred_mode和该色度编码单元对应的亮度帧内预测模式IntraPredModeY确定色度编码单元的预测模式。
Figure BDA0003405387820000261
表1
若色度编码单元允许使用CCLM模式时,则可根据下表2,由语法元素intra_chroma_pred_mode和该色度编码单元对应的亮度帧内预测模式IntraPredModeY确定色度编码单元的预测模式。
Figure BDA0003405387820000262
Figure BDA0003405387820000271
表2
其中,xCb和xCr表示色度编码单元的左上角坐标(以对应的亮度像素个数为单位),cbWidth和cbHeight分别表示色度编码单元的宽和高(以对应的亮度像素个数为单位),intra_chroma_pred_mode[xCb][yCb]表示色度编码单元的帧内预测模式编号,IntraPredModeY[xCb+cbWidth/2][yCb+cbHeight/2]表示坐标位置(xCb+cbWidth/2,yCb+cbHeight/2)的亮度帧内预测模式,通过查表1或表2可以得到色度编码单元的帧内预测模式IntraPredModeC[xCb][yCb]。
S604、根据色度编码单元的预测模式对色度编码单元进行帧内预测,得到色度编码单元的预测像素。
在一个可行的实施例中,从码流解析出第一标识qtbtt_dual_tree_intra_flag和第二标识sps_cclm_enabled_flag,其中,第一标识用于指示是否对帧内图像采用分离树结构,第二标识用于是否允许对视频序列中的色度块使用CCLM。比如若第一标识的取值为第一值(比如1或true),则第一标识用于指示对视频序列中的帧内图像采用分离树结构;若一标识的取值为第二值(比如0或false),则第一标识用于指示不对视频序列中的帧内图像采用分离树结构;若第二标识的取值为第一值(比如1或true),则第二标识用于指示允许对视频序列中的色度块采用CCLM,若第二标识的取值为第二值(比如0或false),则第二标识用于指示不允许对视频序列中的色度块采用CCLM。
当第一标识的取值和第二标识的取值均为第一值时,采用本发明的帧内预测方法进行色度编码单元的帧内预测操作。
可以看出,在本发明实施例的方案中,根据色度编码树节点的尺寸和划分方式确定是否允许色度编码树节点包含的色度编码单元使用CCLM,从而降低了使用CCLM的色度编码单元的处理时延,提高了硬件解码器的吞吐率。
参见图7,图7为本发明实施例提供的一种解码方法的流程示意图。如图7所示,该方法包括:
S701、解析码流,得到色度编码树节点的尺寸和划分方式。
具体地,视频解码单元解码码流,得到相应的语法元素,进而根据该语法元素确定色度编码树节点的尺寸和划分方式。
S702、根据色度编码树节点的尺寸和划分方式,确定该色度编码树节点包含的色度编码单元是否允许使用跨分量线性模型帧内预测CCLM。
S703、根据色度编码单元是否允许使用CCLM,确定色度编码单元的预测方式。
S704、根据色度编码单元的预测方式对该色度编码单元进行处理,得到色度编码单元的预测像素。
需要指出的是,步骤S701-S704的具体描述可参见图6所示实施例中的步骤S601-S604的相关描述,在此不再叙述。
S705、获取色度编码单元的重建残差,并根据色度编码单元的重建残差和色度编码单元的预测像素得到重建像素的色度编码单元。
具体地,其中,残差信息包括编码块标志位、变换系数,还可能包括水平变换类型和竖直变换类型(比如DCT-2,DCT-7,DCT-8)等。
具体地,解析码流,若解析出色度编码单元的残差信息,则对色度编码单元的残差信息进行反量化处理和反变换处理,得到色度编码单元的重建残差;若未解析出色度编码单元的残差信息,则确定色度编码单元的重建残差为0。其中,残差信息包括编码块标志位、变换系数,还可能包括水平变换类型和竖直变换类型(比如DCT-2,DCT-7,DCT-8)等。将色度编码单元的重建残差和色度编码单元的预测像素进行相加,并将相加的结果钳制在预设的数值范围(比如0到255,或者0到1023)内从而得到色度编码单元的重建像素。
可以看出,在本发明实施例的方案中,根据色度编码树节点的尺寸和划分方式确定是否允许色度编码树节点包含的色度编码单元使用CCLM,从而降低了使用CCLM的色度编码单元的处理时延,提高了硬件解码器的吞吐率,进而提高了视频解码的效率。
参见图8,图8为本发明实施例提供的一种帧内预测装置的结构示意图。如图8所示,该帧内预测装置800包括:
获取单元801,用于获取色度编码树节点的尺寸和划分方式;
确定单元802,用于根据色度编码树节点的尺寸和划分方式,确定色度编码树节点包含的色度编码单元是否允许使用CCLM;并根据色度编码单元是否允许使用CCLM,确定色度编码单元的预测模式;
预测单元803,用于根据色度编码单元的预测模式对色度编码单元进行处理,以得到色度编码单元的预测像素。
在一种可行的实施例中,色度编码树节点的尺寸为M*N,在根据色度编码树节点的尺寸和划分方式,确定色度编码树节点包含的色度编码单元是否允许使用CCLM的方面,确定单元802具体用于:
当M和N均等于预设阈值T1时,若色度编码树节点的划分方式满足第一预设条件,则确定色度编码单元允许使用CCLM;若色度编码树节点的划分方式不满足第一预设条件,则确定色度编码单元不允许使用CCLM;其中,第一预设条件包括:不划分或者四叉树划分方式。
在一种可行的实施例中,色度编码树节点的尺寸为M*N,在根据色度编码树节点的尺寸和划分方式,确定色度编码树节点包含的色度编码单元是否允许使用CCLM的方面,确定单元802具体用于:
当M等于T1且N等于T1/2时,若色度编码树节点的划分方式满足第二预设条件,则确定色度编码单元允许使用CCLM;若色度编码树节点的划分方式不满足第二预设条件,则确定色度编码单元不允许使用CCLM;其中,第二预设条件包括:不划分或者竖直二分方式。
在一种可行的实施例中,在根据色度编码树节点的尺寸和划分方式,确定色度编码树节点包含的色度编码单元是否允许使用跨分量线性模型帧内预测CCLM的方面,确定单元802具体用于:
根据色度编码树节点的尺寸和划分方式、色度编码树节点对应的亮度编码树节点的划分方式以及亮度编码树节点不划分时对应的亮度块是否采用ISP模型,确定色度编码树节点包含的色度编码单元是否允许使用CCLM。
在一种可行的实施例中,色度编码树节点的尺寸为M*N,在根据色度编码树节点的尺寸和划分方式、色度编码树节点对应的亮度编码树节点的划分方式以及亮度编码树节点不划分时对应的亮度块是否采用帧内子块划分ISP模型,确定色度编码树节点包含的色度编码单元是否允许使用CCLM的方面,确定单元802具体用于:
当色度编码树节点满足第三预设条件时,确定色度编码单元不允许使用CCLM;
当色度编码树节点不满足第三预设条件,且M等于T1、N等于T1时,若色度编码树节点的划分方式满足第一预设条件,则确定色度编码单元允许使用CCLM;若色度编码树节点的划分方式不满足第一预设条件,则确定色度编码单元不允许使用CCLM;其中,第一预设条件包括:不划分或者四叉树划分方式。
在一种可行的实施例中,色度编码树节点的尺寸为M*N,在根据色度编码树节点的尺寸和划分方式、色度编码树节点对应的亮度编码树节点的划分方式以及亮度编码树节点不划分时对应的亮度块是否采用帧内子块划分ISP模型,确定色度编码树节点包含的色度编码单元是否允许使用CCLM的方面,确定单元802具体用于:
当色度编码树节点满足第三预设条件中的任一条件时,确定色度编码单元不允许使用CCLM;当色度编码树节点不满足第三预设条件,且N=T1、M=T1/2时,若色度编码树节点的划分方式满足第二预设条件,则确定色度编码单元允许使用CCLM;若色度编码树节点的划分方式不满足第二预设条件,则确定色度编码单元不允许使用CCLM;其中,第二预设条件包括:不划分或者竖直二分方式。
在一种可行的实施例中,第三预设条件包括图6所示示例中的条件1、条件2、条件3、条件4、条件5、条件6、条件7、条件8、条件9、条件10、条件11、条件12和条件13中的一条或者多条。
在一种可行的实施例中,第三预设条件包括:
色度编码树节点对应的亮度编码树节点的划分方式为不划分且亮度编码树节点的亮度块使用ISP预测模式,其中,亮度编码树节点的尺寸和亮度块的尺寸均为T1*T1。
在一种可行的实施例中,第三预设条件包括:
色度编码树节点对应的亮度编码树节点的划分方式为不划分且亮度编码树节点的亮度块采用ISP模式且色度编码树节点划分为子节点,其中,色度编码树节点的尺寸、亮度编码树节点的尺寸和亮度块的尺寸均为T1*T1。
在一种可行的实施例中,第三预设条件包括图6所示示例中的条件1和条件13。
在一种可行的实施例中,第三预设条件包括图6所示示例中的条件2和条件13。
在一种可行的实施例中,第三预设条件包括:
色度编码树节点对应的亮度编码树节点的划分方式为不划分、四叉树划分方式、水平二分方式和竖直二分方式中的一种;其中,亮度编码树节点的尺寸为T1*T1,或者
色度编码树节点对应的亮度编码树节点的划分方式为不划分且亮度编码树节点的亮度块采用ISP模式且色度编码树节点划分为子节点,或者亮度编码树节点的划分方式为水平二分方式和竖直二分方式中的一种,其中,色度编码树节点的尺寸、亮度编码树节点的尺寸和亮度块的尺寸均为T1*T1。
在一种可行的实施例中,第三预设条件包括图6所示示例中的条件3、条件5、条件6、条件8和条件13。
在一种可行的实施例中,第三预设条件包括图6所示示例中的条件4、条件5、条件7、条件8和条件13。
在一种可行的实施例中,第三预设条件包括图6所示示例中的条件3、条件5、条件7、条件8、条件9、条件10、条件11和条件12。
在一个可行的实施例中,预设阈值T1等于64。
需要说明的是,上述各单元(获取单元801、确定单元802和预测单元803)用于执行上述方法的相关步骤。具体地,获取单元801用于执行步骤S601和S701的相关内容,确定单元802用于执行步骤S602、S603、S702和S703的相关内容,预测单元803用于执行步骤S604和S704的相关内容。换句话说,获取单元801用于实现图5b中的熵解码器303和帧内预测器309的相关功能,确定单元802和预测单元803用于实现图5b中的帧内预测器309的相关功能。
在本实施例中,帧内预测装置800是以单元的形式来呈现。这里的“单元”可以指特定应用集成电路(application-specific integrated circuit,ASIC),执行一个或多个软件或固件程序的处理器和存储器,集成逻辑电路,和/或其他可以提供上述功能的器件。
参见图9,图9为本发明实施例提供一种视频序列的帧内预测装置的结构示意图。如图9所示,该帧内预测装置900包括:
解码单元901,用于解析码流,得到第一标识和第二标识,第一标识用于指示是否对视频序列中帧内图像采用分离树结构,第二标识用于指示是否允许视频序列中的色度块使用CCLM;
预测单元902,用于若第一标识指示对视频序列中的帧内图像采用分离树结构,且第二标识指示允许视频序列中的色度块使用CCLM,则执行如图6所示的视频序列的帧内预测方法的部分或全部。
需要说明的是,上述各单元(解码单元901和预测单元903)用于执行上述方法的相关步骤。换句话说,解码单元901用于实现图5b中的熵解码器303的相关功能,预测单元902用于实现图5b中的帧内预测器309的相关功能。
本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时包括上述方法实施例中记载的任何一种视频序列的帧内预测方法的部分或全部步骤。
本领域技术人员能够领会,结合本文公开描述的各种说明性逻辑框、模块和算法步骤所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件来实施,那么各种说明性逻辑框、模块、和步骤描述的功能可作为一或多个指令或代码在计算机可读媒体上存储或传输,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体,其对应于有形媒体,例如数据存储媒体,或包括任何促进将计算机程序从一处传送到另一处的媒体(例如,根据通信协议)的通信媒体。以此方式,计算机可读媒体大体上可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)通信媒体,例如信号或载波。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本申请中描述的技术的指令、代码和/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。
作为实例而非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可用来存储指令或数据结构的形式的所要程序代码并且可由计算机存取的任何其它媒体。并且,任何连接被恰当地称作计算机可读媒体。举例来说,如果使用同轴缆线、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源传输指令,那么同轴缆线、光纤缆线、双绞线、DSL或例如红外线、无线电和微波等无线技术包含在媒体的定义中。但是,应理解,所述计算机可读存储媒体和数据存储媒体并不包括连接、载波、信号或其它暂时媒体,而是实际上针对于非暂时性有形存储媒体。如本文中所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘利用激光以光学方式再现数据。以上各项的组合也应包含在计算机可读媒体的范围内。
可通过例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路等一或多个处理器来执行指令。因此,如本文中所使用的术语“处理器”可指前述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。另外,在一些方面中,本文中所描述的各种说明性逻辑框、模块、和步骤所描述的功能可以提供于经配置以用于编码和解码的专用硬件和/或软件模块内,或者并入在组合编解码器中。而且,所述技术可完全实施于一或多个电路或逻辑元件中。
本申请的技术可在各种各样的装置或设备中实施,包含无线手持机、集成电路(IC)或一组IC(例如,芯片组)。本申请中描述各种组件、模块或单元是为了强调用于执行所揭示的技术的装置的功能方面,但未必需要由不同硬件单元实现。实际上,如上文所描述,各种单元可结合合适的软件和/或固件组合在编码解码器硬件单元中,或者通过互操作硬件单元(包含如上文所描述的一或多个处理器)来提供。
以上所述,仅为本申请示例性的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (18)

1.一种视频序列的帧内预测方法,其特征在于,包括:
确定所述色度编码树节点包含的色度编码单元是否允许使用跨分量线性模型帧内预测CCLM;
根据所述色度编码单元是否允许使用CCLM,确定所述色度编码单元的预测模式;
根据所述色度编码单元的预测模式对所述色度编码单元进行处理,以得到所述色度编码单元的预测像素;
其中若所述色度编码树节点的划分方式满足第一预设条件或第二预设条件,则确定所述色度编码单元允许使用CCLM;其中,所述第一预设条件包括:不划分或者四叉树划分方式;所述第二预设条件包括:不划分或者竖直二分方式。
2.根据权利要求1所述的方法,其特征在于,所述色度编码树节点的尺寸为M*N,
且所述M和N均等于预设阈值T1时,若所述色度编码树节点的划分方式满足所述第一预设条件,则确定所述色度编码单元允许使用CCLM。
3.根据权利要求1所述的方法,其特征在于,所述色度编码树节点的尺寸为M*N,
且所述M等于预设阈值T1且N等于T1/2时,若所述色度编码树节点的划分方式满足所述第二预设条件,则确定所述色度编码单元允许使用CCLM。
4.根据权利要求1所述的方法,其特征在于,所述确定所述色度编码树节点包含的色度编码单元是否允许使用跨分量线性模型帧内预测CCLM,包括:
根据所述色度编码树节点的尺寸和划分方式、所述色度编码树节点对应的亮度编码树节点的划分方式,确定所述色度编码树节点包含的色度编码单元是否允许使用CCLM。
5.根据权利要求1所述的方法,其特征在于,所述确定所述色度编码树节点包含的色度编码单元是否允许使用跨分量线性模型帧内预测CCLM,包括:
当所述色度编码树节点满足第三预设条件时,确定所述色度编码单元不允许使用CCLM。
6.根据权利要求5所述的方法,其特征在于,所述第三预设条件包括:
条件1:所述色度编码树节点对应的亮度编码树节点的划分方式为不划分、所述亮度编码树节点的亮度块采用ISP模式,且所述色度编码树节点划分为子节点,其中,所述色度编码树节点的尺寸、所述亮度编码树节点的尺寸和所述亮度块的尺寸均为T1*T1;或者
条件2:所述色度编码树节点对应的亮度编码树节点使用的划分方式为不划分和四叉树划分之外的划分方式;其中,所述亮度编码树节点的尺寸为T1*T1。
7.根据权利要求5所述的方法,其特征在于,所述第三预设条件包括:
所述色度编码树节点对应的亮度编码树节点的划分方式为不划分且所述亮度编码树节点的亮度块采用ISP模式且所述色度编码树节点划分为子节点,或者所述亮度编码树节点的划分方式为水平二分方式和竖直二分方式中的一种,其中,所述色度编码树节点的尺寸、所述亮度编码树节点的尺寸和所述亮度块的尺寸均为T1*T1。
8.根据权利要求2-3,6-7任一项所述的方法,其特征在于,所述预设阈值T1等于64。
9.一种视频序列的帧内预测的方法,其特征在于,包括:
解析码流,得到第一标识和第二标识,所述第一标识用于指示是否对所述视频序列中的帧内图像采用分离树结构,所述第二标识用于指示是否允许所述视频序列中的色度块使用跨分量线性模型帧内预测CCLM;
若所述第一标识指示对所述视频序列中的帧内图像采用分离树结构,且第二标识指示允许所述视频序列中的色度块使用CCLM,则执行如权利要求1-8任一项所述的方法。
10.一种视频序列的帧内预测装置,其特征在于,包括:
确定单元,用于确定所述色度编码树节点包含的色度编码单元是否允许使用跨分量线性模型帧内预测CCLM;并根据所述色度编码单元是否允许使用CCLM,确定所述色度编码单元的预测模式;
预测单元,用于根据所述色度编码单元的预测模式对所述色度编码单元进行处理,以得到所述色度编码单元的预测像素;
其中若所述色度编码树节点的划分方式满足第一预设条件或第二预设条件,则所述确定单元,用于确定所述色度编码单元允许使用CCLM;其中,所述第一预设条件包括:不划分或者四叉树划分方式;所述第二预设条件包括:不划分或者竖直二分方式。
11.根据权利要求10所述的装置,其特征在于,所述色度编码树节点的尺寸为M*N,且所述M和N均等于预设阈值T1,若所述色度编码树节点的划分方式满足所述第一预设条件,则确定所述色度编码单元允许使用CCLM。
12.根据权利要求10所述的装置,其特征在于,所述色度编码树节点的尺寸为M*N,
且所述M等于预设阈值T1且N等于T1/2,若所述色度编码树节点的划分方式满足所述第二预设条件,则确定所述色度编码单元允许使用CCLM。
13.根据权利要求10所述的装置,其特征在于,所述确定单元具体用于:
根据所述色度编码树节点的尺寸和划分方式、所述色度编码树节点对应的亮度编码树节点的划分方式,确定所述色度编码树节点包含的色度编码单元是否允许使用CCLM。
14.根据权利要求10所述的装置,其特征在于,所述确定单元具体用于:
当所述色度编码树节点满足第三预设条件时,确定所述色度编码单元不允许使用CCLM。
15.根据权利要求14所述的装置,其特征在于,所述第三预设条件包括:
条件1:所述色度编码树节点对应的亮度编码树节点的划分方式为不划分、所述亮度编码树节点的亮度块采用ISP模式,且所述色度编码树节点划分为子节点,其中,所述色度编码树节点的尺寸、所述亮度编码树节点的尺寸和所述亮度块的尺寸均为T1*T1;或者
条件2:所述色度编码树节点对应的亮度编码树节点使用的划分方式为不划分和四叉树划分之外的划分方式;其中,所述亮度编码树节点的尺寸为T1*T1。
16.根据权利要求14所述的装置,其特征在于,所述第三预设条件包括:
所述色度编码树节点对应的亮度编码树节点的划分方式为不划分且所述亮度编码树节点的亮度块采用ISP模式且所述色度编码树节点划分为子节点,或者所述亮度编码树节点的划分方式为水平二分方式和竖直二分方式中的一种,其中,所述色度编码树节点的尺寸、所述亮度编码树节点的尺寸和所述亮度块的尺寸均为T1*T1。
17.根据权利要求11-12,15-16任一项所述的装置,其特征在于,所述预设阈值T1等于64。
18.一种视频序列的帧内预测装置,其特征在于,包括:
解码单元,用于解析码流,得到第一标识和第二标识,所述第一标识用于指示是否对所述视频序列中的帧内图像采用分离树结构,所述第二标识用于指示是否允许所述视频序列中的色度块使用跨分量线性模型帧内预测CCLM;
预测单元,用于若所述第一标识指示对所述视频序列中的帧内图像采用分离树结构,且第二标识指示允许所述视频序列中的色度块使用CCLM,则执行如权利要求1-8任一项所述的方法。
CN202111510040.7A 2019-04-30 2020-03-27 视频序列的帧内预测方法及装置 Active CN114205592B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111510040.7A CN114205592B (zh) 2019-04-30 2020-03-27 视频序列的帧内预测方法及装置

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN201910370987.9A CN111866510A (zh) 2019-04-30 2019-04-30 视频序列的帧内预测方法及装置
CN2019103709879 2019-04-30
CN202111510040.7A CN114205592B (zh) 2019-04-30 2020-03-27 视频序列的帧内预测方法及装置
CN202080001612.6A CN112042195B (zh) 2019-04-30 2020-03-27 视频序列的帧内预测方法及装置
PCT/CN2020/081672 WO2020220884A1 (zh) 2019-04-30 2020-03-27 视频序列的帧内预测方法及装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN202080001612.6A Division CN112042195B (zh) 2019-04-30 2020-03-27 视频序列的帧内预测方法及装置

Publications (2)

Publication Number Publication Date
CN114205592A true CN114205592A (zh) 2022-03-18
CN114205592B CN114205592B (zh) 2023-10-20

Family

ID=72965849

Family Applications (5)

Application Number Title Priority Date Filing Date
CN201910370987.9A Pending CN111866510A (zh) 2019-04-30 2019-04-30 视频序列的帧内预测方法及装置
CN202111509992.7A Active CN114205591B (zh) 2019-04-30 2020-03-27 视频序列的帧内预测方法及装置
CN202111521205.0A Pending CN114245132A (zh) 2019-04-30 2020-03-27 视频序列的帧内预测方法及装置
CN202111510040.7A Active CN114205592B (zh) 2019-04-30 2020-03-27 视频序列的帧内预测方法及装置
CN202080001612.6A Active CN112042195B (zh) 2019-04-30 2020-03-27 视频序列的帧内预测方法及装置

Family Applications Before (3)

Application Number Title Priority Date Filing Date
CN201910370987.9A Pending CN111866510A (zh) 2019-04-30 2019-04-30 视频序列的帧内预测方法及装置
CN202111509992.7A Active CN114205591B (zh) 2019-04-30 2020-03-27 视频序列的帧内预测方法及装置
CN202111521205.0A Pending CN114245132A (zh) 2019-04-30 2020-03-27 视频序列的帧内预测方法及装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202080001612.6A Active CN112042195B (zh) 2019-04-30 2020-03-27 视频序列的帧内预测方法及装置

Country Status (10)

Country Link
US (1) US20220053194A1 (zh)
EP (1) EP3955575A4 (zh)
JP (2) JP7348307B2 (zh)
KR (1) KR20220003022A (zh)
CN (5) CN111866510A (zh)
AU (2) AU2020264569B2 (zh)
BR (1) BR112021021679A2 (zh)
CA (1) CA3135596A1 (zh)
MX (1) MX2021013320A (zh)
WO (1) WO2020220884A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7203241B2 (ja) 2019-03-08 2023-01-12 北京字節跳動網絡技術有限公司 映像処理における再整形情報の信号伝達
AU2020263199B2 (en) 2019-04-23 2023-10-19 Beijing Bytedance Network Technology Co., Ltd. Methods for cross component dependency reduction
BR112021021661A2 (pt) * 2019-05-08 2021-12-21 Beijing Bytedance Network Tech Co Ltd Método e aparelho para processar dados de vídeo, e, meios de armazenamento e de gravação legíveis por computador não transitórios
CN113994697A (zh) 2019-06-22 2022-01-28 北京字节跳动网络技术有限公司 色度残差缩放的语法元素
JP6899053B2 (ja) * 2019-06-24 2021-07-07 Kddi株式会社 画像復号装置、画像復号方法及びプログラム
EP3977738A4 (en) 2019-07-07 2022-08-17 Beijing Bytedance Network Technology Co., Ltd. SIGNALING OF CHROMA RESIDUAL SCALE
CN114615494A (zh) * 2020-12-04 2022-06-10 咪咕文化科技有限公司 一种图像处理方法、装置及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018116802A1 (ja) * 2016-12-22 2018-06-28 シャープ株式会社 画像復号装置、画像符号化装置、及び画像予測装置
US20180288446A1 (en) * 2014-11-11 2018-10-04 Mediatek Singapore Pte. Ltd. Method of Video Coding Using Separate Coding Tree for Luma and Chroma
CN109510987A (zh) * 2017-09-15 2019-03-22 华为技术有限公司 编码树节点划分方式的确定方法、装置及编码设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10939105B2 (en) * 2016-03-25 2021-03-02 Panasonic Intellectual Property Management Co., Ltd. Methods and apparatuses for encoding and decoding video using signal dependent adaptive quantization
WO2017205700A1 (en) * 2016-05-25 2017-11-30 Arris Enterprises Llc Binary, ternary and quad tree partitioning for jvet coding of video data
US10419757B2 (en) * 2016-08-31 2019-09-17 Qualcomm Incorporated Cross-component filter
JP2021010046A (ja) * 2017-10-06 2021-01-28 シャープ株式会社 画像符号化装置及び画像復号装置
US10819977B2 (en) * 2018-07-05 2020-10-27 Tencent America LLC Methods and apparatus for multiple line intra prediction in video compression
KR20200083321A (ko) * 2018-12-28 2020-07-08 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
EP3941065A4 (en) * 2019-03-15 2022-05-18 Lg Electronics Inc. METHOD AND DEVICE FOR SIGNALING INFORMATION ON CHROMA FORMAT

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180288446A1 (en) * 2014-11-11 2018-10-04 Mediatek Singapore Pte. Ltd. Method of Video Coding Using Separate Coding Tree for Luma and Chroma
WO2018116802A1 (ja) * 2016-12-22 2018-06-28 シャープ株式会社 画像復号装置、画像符号化装置、及び画像予測装置
CN109510987A (zh) * 2017-09-15 2019-03-22 华为技术有限公司 编码树节点划分方式的确定方法、装置及编码设备

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
EDOUARD FRANÇOIS: "JVET-N0390,AHG16/non-CE3: Study of CCLM restrictions in case of separate luma/chroma tree", 《JVET-N0390》 *
FANGDONG CHEN: "JVET-N0164-v3,CE3-related: Size restriction for CCLM", 《JVET-N0164-V3》 *
T.ZHOU: "CE3-2.1:Intra chroma partitioning and prediction", 《JVET-N0137》 *
周建同等: "视频编码的技术基础及发展方向", 《电信科学》 *

Also Published As

Publication number Publication date
AU2024201621A1 (en) 2024-03-28
MX2021013320A (es) 2022-01-24
EP3955575A1 (en) 2022-02-16
CN114205591A (zh) 2022-03-18
EP3955575A4 (en) 2022-06-22
CA3135596A1 (en) 2020-11-05
CN111866510A (zh) 2020-10-30
WO2020220884A1 (zh) 2020-11-05
CN114245132A (zh) 2022-03-25
CN112042195A (zh) 2020-12-04
JP2022531280A (ja) 2022-07-06
AU2020264569A1 (en) 2021-12-02
KR20220003022A (ko) 2022-01-07
JP7348307B2 (ja) 2023-09-20
JP2023169238A (ja) 2023-11-29
BR112021021679A2 (pt) 2021-12-21
CN112042195B (zh) 2021-12-10
US20220053194A1 (en) 2022-02-17
CN114205592B (zh) 2023-10-20
AU2020264569B2 (en) 2023-12-14
CN114205591B (zh) 2024-04-09

Similar Documents

Publication Publication Date Title
CN112789863B (zh) 帧内预测方法及设备
CN112042195B (zh) 视频序列的帧内预测方法及装置
CN112868232B (zh) 使用插值滤波器进行帧内预测的方法和装置
CN112789858B (zh) 帧内预测方法及设备
CN112673626B (zh) 各分割约束元素之间的关系
KR102616713B1 (ko) 이미지 예측 방법, 장치 및 시스템, 디바이스 및 저장 매체
US11917152B2 (en) Position dependent spatial varying transform for video coding
WO2020041306A1 (en) Intra prediction method and device
JP2021536689A (ja) ピクチャパーティショニング方法及び機器
CN110868590A (zh) 图像划分方法及装置
CN112055211B (zh) 视频编码器及qp设置方法
KR20210024092A (ko) 비디오 코딩에서의 경계 블록 파티셔닝
RU2801327C2 (ru) Способ и устройство внутреннего прогнозирования для видеопоследовательности
CN112913243A (zh) 帧内预测方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant