CN116491118A - 视频编解码方法与系统、及视频编码器与视频解码器 - Google Patents

视频编解码方法与系统、及视频编码器与视频解码器 Download PDF

Info

Publication number
CN116491118A
CN116491118A CN202080107399.7A CN202080107399A CN116491118A CN 116491118 A CN116491118 A CN 116491118A CN 202080107399 A CN202080107399 A CN 202080107399A CN 116491118 A CN116491118 A CN 116491118A
Authority
CN
China
Prior art keywords
intra
component
current block
prediction
prediction mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080107399.7A
Other languages
English (en)
Inventor
王凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN202311100947.5A priority Critical patent/CN116962684A/zh
Publication of CN116491118A publication Critical patent/CN116491118A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本申请提供一种视频编解码方法与系统、及视频编码器与视频解码器,在确定当前块在第一分量下的初始优帧内预测模式为导出模式时,获得当前块对应的第二分量在帧内预测时所使用的至少两种帧内预测模式;根据第二分量下的至少两种帧内预测模式,确定当前块在第一分量下的目标帧内预测模式;使用该目标帧内预测模式,对当前块进行第一分量帧内预测,实现对当前块在第一分量下的帧内预测模式的简单高效地确定。

Description

视频编解码方法与系统、及视频编码器与视频解码器 技术领域
本申请涉及视频编解码技术领域,尤其涉及一种视频编解码方法与系统、及视频编码器与视频解码器。
背景技术
数字视频技术可以并入多种视频装置中,例如数字电视、智能手机、计算机、电子阅读器或视频播放器等。随着视频技术的发展,视频数据所包括的数据量较大,为了便于视频数据的传输,视频装置执行视频压缩技术,以使视频数据更加有效的传输或存储。
目前通过空间预测或时间预测来减少或消除视频数据中的冗余信息,以实现视频数据的压缩。预测方法包括帧间预测和帧内预测,其中帧内预测是基于同一帧图像中已经解码出的相邻块来预测当前块。
在对当前块进行预测时,通常分别是对该当前块的亮度分量和色度分量进行预测,分别获得对应的亮度预测块和/或色度预测块,没有较好的利用二者之间的关联,不能简单高效地对色度分量进行预测。
发明内容
本申请实施例提供了一种视频编解码方法与系统、及视频编码器与视频解码器,实现当前块对应的第二分量下包括两种帧内预测模式时,根据第二分量下的两种帧内预测模式简单高效地确定当前块在第一分量下的帧内预测模式。
第一方面,本申请提供了一种视频编码方法,包括:
获得当前块,该当前块包括第一分量;
确定当前块在第一分量下的初始帧内预测模式;
在确定初始帧内预测模式为导出模式时,获得当前块对应的第二分量下的至少两种帧内预测模式;
根据第二分量下的至少两种帧内预测模式,确定当前块在第一分量下的目标帧内预测模式;
使用目标帧内预测模式,对当前块进行第一分量帧内预测,获得当前块在第一分量下的最终预测值。
第二方面,本申请实施例提供一种视频解码方法,包括:
解析码流,得到当前块,以及当前块对应的第二分量下的至少两种帧内预测模式,当前块包括第一分量;
确定当前块在第一分量下的初始帧内预测模式;
在初始帧内预测模式为导出模式时,根据第二分量下的至少两种帧内预测模式,确定当前块在第一分量下的目标帧内预测模式;
使用目标帧内预测模式,对当前块进行第一分量帧内预测,获得当前块在第一分量下的最终预测值。
第三方面,本申请提供了一种视频编码器,用于执行上述第一方面或其各实现方式中的方法。具体地,该编码器包括用于执行上述第一方面或其各实现方式中的方法的功能单元。
第四方面,本申请提供了一种视频解码器,用于执行上述第二方面或其各实现方式中的方法。具体地,该解码器包括用于执行上述第二方面或其各实现方式中的方法的功能单元。
第五方面,提供了一种视频编码器,包括处理器和存储器。该存储器用于存储计算机程序,该处理器用于调用并运行该存储器中存储的计算机程序,以执行上述第一方面或其各实现方式中的方法。
第六方面,提供了一种视频解码器,包括处理器和存储器。该存储器用于存储计算机程序,该处理器用于调用并运行该存储器中存储的计算机程序,以执行上述第二方面或其各实现方式中的方法。
第七方面,提供了一种视频编解码系统,包括视频编码器和视频解码器。视频编码器用于执行上述第一方面或其 各实现方式中的方法,视频解码器用于执行上述第二方面或其各实现方式中的方法。
第八方面,提供了一种芯片,用于实现上述第一方面至第二方面中的任一方面或其各实现方式中的方法。具体地,该芯片包括:处理器,用于从存储器中调用并运行计算机程序,使得安装有该芯片的设备执行如上述第一方面至第二方面中的任一方面或其各实现方式中的方法。
第九方面,提供了一种计算机可读存储介质,用于存储计算机程序,该计算机程序使得计算机执行上述第一方面至第二方面中的任一方面或其各实现方式中的方法。
第十方面,提供了一种计算机程序产品,包括计算机程序指令,该计算机程序指令使得计算机执行上述第一方面至第二方面中的任一方面或其各实现方式中的方法。
第十一方面,提供了一种计算机程序,当其在计算机上运行时,使得计算机执行上述第一方面至第二方面中的任一方面或其各实现方式中的方法。
基于以上技术方案,在视频编解码的帧内预测过程中,当确定当前块在第一分量下的初始帧内预测模式为导出模式时,通过第二分量下的至少两种帧内预测模式来确定当前块在第一分量下的目标帧内预测模式,进而简单高效地确定出当前块在第一分量下的目标帧内预测模式。例如,直接将第二分量下的至少两种帧内预测模式作为目标帧内预测模式,不仅实现对当前块在第一分量下的目标帧内预测的简单高效地确定,使用至少两种帧内预测模式对当前块进行第一分量预测时,还可以实现对复杂纹理的准确预测,从而提升帧内预测的质量,提升压缩性能。另外,根据第二分量下的帧内预测模式来导出当前块在第一分量下的帧内预测模式,可以利用通道间的相关性,进而减少了第一分量的模式信息在码流中的传输,进而有效地提高了编码效率。
附图说明
图1为本申请实施例涉及的一种视频编解码系统100的示意性框图;
图2是本申请实施例提供的视频编码器200的示意性框图;
图3是本申请实施例提供的解码框架300的示意性框图;
图4A是GPM在正方形的块上的64种模式的权重图;
图4B是AWP在正方形的块上的56种模式的权重图;
图5为本申请实施例涉及的参考像素示意图;
图6为本申请实施例涉及的多参考行帧内预测方法的示意图;
图7是H.264的9种帧内预测模式示意图;
图8是HEVC的35种帧内预测模式示意图;
图9是VVC的67种帧内预测模式示意图;
图10是AVS3的66种帧内预测模式示意图;
图11A是本申请实施例亮度块的帧内预测的一种原理示意图;
图11B是本申请实施例涉及的帧内预测模式的一种存储方式的示意图;
图12为本申请实施例提供的视频编码方法400的一种流程示意图;
图13为本申请实施例涉及的第一分量与第二分量的划分示意图;
图14为本申请实施例提供的视频编码方式500的另一流程示意图;
图15为本申请实施例提供的视频编码方式600的另一流程示意图;
图16为本申请实施例提供的视频解码方法700的一种流程示意图;
图17为本申请实施例提供的视频解码方法800的一种流程示意图;
图18为本申请实施例提供的视频解码方法900的一种流程示意图;
图19是本申请实施例提供的视频编码器10的示意性框图;
图20是本申请实施例提供的视频解码器20的示意性框图;
图21是本申请实施例提供的电子设备30的示意性框图;
图22是本申请实施例提供的视频编解码系统40的示意性框图。
具体实施方式
本申请可应用于图像编解码领域、视频编解码领域、硬件视频编解码领域、专用电路视频编解码领域、实时视频编解码领域等。例如,本申请的方案可结合至音视频编码标准(audio video coding standard,简称AVS),例如,H.264/音视频编码(audio video coding,简称AVC)标准,H.265/高效视频编码(high efficiency video coding,简称HEVC)标准以及H.266/多功能视频编码(versatile video coding,简称VVC)标准。或者,本申请的方案可结合至其它专属或行业标准而操作,所述标准包含ITU-TH.261、ISO/IECMPEG-1Visual、ITU-TH.262或ISO/IECMPEG-2Visual、ITU-TH.263、ISO/IECMPEG-4Visual,ITU-TH.264(还称为ISO/IECMPEG-4AVC),包含可分级视频编解码(SVC)及多视图视频编解码(MVC)扩展。应理解,本申请的技术不限于任何特定编解码标准或技术。
为了便于理解,首先结合图1对本申请实施例涉及的视频编解码系统进行介绍。
图1为本申请实施例涉及的一种视频编解码系统100的示意性框图。需要说明的是,图1只是一种示例,本申请实施例的视频编解码系统包括但不限于图1所示。如图1所示,该视频编解码系统100包含编码设备110和解码设备120。其中编码设备用于对视频数据进行编码(可以理解成压缩)产生码流,并将码流传输给解码设备。解码设备对编码设备编码产生的码流进行解码,得到解码后的视频数据。
本申请实施例的编码设备110可以理解为具有视频编码功能的设备,解码设备120可以理解为具有视频解码功能的设备,即本申请实施例对编码设备110和解码设备120包括更广泛的装置,例如包含智能手机、台式计算机、移动计算装置、笔记本(例如,膝上型)计算机、平板计算机、机顶盒、电视、相机、显示装置、数字媒体播放器、视频游戏控制台、车载计算机等。
在一些实施例中,编码设备110可以经由信道130将编码后的视频数据(如码流)传输给解码设备120。信道130可以包括能够将编码后的视频数据从编码设备110传输到解码设备120的一个或多个媒体和/或装置。
在一个实例中,信道130包括使编码设备110能够实时地将编码后的视频数据直接发射到解码设备120的一个或多个通信媒体。在此实例中,编码设备110可根据通信标准来调制编码后的视频数据,且将调制后的视频数据发射到解码设备120。其中通信媒体包含无线通信媒体,例如射频频谱,可选的,通信媒体还可以包含有线通信媒体,例如一根或多根物理传输线。
在另一实例中,信道130包括存储介质,该存储介质可以存储编码设备110编码后的视频数据。存储介质包含多种本地存取式数据存储介质,例如光盘、DVD、快闪存储器等。在该实例中,解码设备120可从该存储介质中获取编码后的视频数据。
在另一实例中,信道130可包含存储服务器,该存储服务器可以存储编码设备110编码后的视频数据。在此实例中,解码设备120可以从该存储服务器中下载存储的编码后的视频数据。可选的,该存储服务器可以存储编码后的视频数据且可以将该编码后的视频数据发射到解码设备120,例如web服务器(例如,用于网站)、文件传送协议(FTP)服务器等。
一些实施例中,编码设备110包含视频编码器112及输出接口113。其中,输出接口113可以包含调制器/解调器(调制解调器)和/或发射器。
在一些实施例中,编码设备110除了包括视频编码器112和输入接口113外,还可以包括视频源111。
视频源111可包含视频采集装置(例如,视频相机)、视频存档、视频输入接口、计算机图形系统中的至少一个, 其中,视频输入接口用于从视频内容提供者处接收视频数据,计算机图形系统用于产生视频数据。
视频编码器112对来自视频源111的视频数据进行编码,产生码流。视频数据可包括一个或多个图像(picture)或图像序列(sequence of pictures)。码流以比特流的形式包含了图像或图像序列的编码信息。编码信息可以包含编码图像数据及相关联数据。相关联数据可包含序列参数集(sequence parameter set,简称SPS)、图像参数集(picture parameter set,简称PPS)及其它语法结构。SPS可含有应用于一个或多个序列的参数。PPS可含有应用于一个或多个图像的参数。语法结构是指码流中以指定次序排列的零个或多个语法元素的集合。
视频编码器112经由输出接口113将编码后的视频数据直接传输到解码设备120。编码后的视频数据还可存储于存储介质或存储服务器上,以供解码设备120后续读取。
在一些实施例中,解码设备120包含输入接口121和视频解码器122。
在一些实施例中,解码设备120除包括输入接口121和视频解码器122外,还可以包括显示装置123。
其中,输入接口121包含接收器及/或调制解调器。输入接口121可通过信道130接收编码后的视频数据。
视频解码器122用于对编码后的视频数据进行解码,得到解码后的视频数据,并将解码后的视频数据传输至显示装置123。
显示装置123显示解码后的视频数据。显示装置123可与解码设备120整合或在解码设备120外部。显示装置123可包括多种显示装置,例如液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器或其它类型的显示装置。
此外,图1仅为实例,本申请实施例的技术方案不限于图1,例如本申请的技术还可以应用于单侧的视频编码或单侧的视频解码。
下面对本申请实施例涉及的视频编码框架进行介绍。
图2是本申请实施例提供的视频编码器200的示意性框图。应理解,该视频编码器200可用于对图像进行有损压缩(lossy compression),也可用于对图像进行无损压缩(lossless compression)。该无损压缩可以是视觉无损压缩(visually lossless compression),也可以是数学无损压缩(mathematically lossless compression)。
该视频编码器200可应用于亮度色度(YCbCr,YUV)格式的图像数据上。例如,YUV比例可以为4:2:0、4:2:2或者4:4:4,Y表示明亮度(Luma),Cb(U)表示蓝色色度,Cr(V)表示红色色度,U和V表示为色度(Chroma)用于描述色彩及饱和度。例如,在颜色格式上,4:2:0表示每4个像素有4个亮度分量,2个色度分量(YYYYCbCr),4:2:2表示每4个像素有4个亮度分量,4个色度分量(YYYYCbCrCbCr),4:4:4表示全像素显示(YYYYCbCrCbCrCbCrCbCr)。
例如,该视频编码器200读取视频数据,针对视频数据中的每帧图像,将一帧图像划分成若干个编码树单元(coding tree unit,CTU),在一些例子中,CTB可被称作“树型块”、“最大编码单元”(Largest Coding unit,简称LCU)或“编码树型块”(coding tree block,简称CTB)。每一个CTU可以与图像内的具有相等大小的像素块相关联。每一像素可对应一个亮度(luminance或luma)采样及两个色度(chrominance或chroma)采样。因此,每一个CTU可与一个亮度采样块及两个色度采样块相关联。一个CTU大小例如为128×128、64×64、32×32等。一个CTU又可以继续被划分成若干个编码单元(Coding Unit,CU)进行编码,CU可以为矩形块也可以为方形块。CU可以进一步划分为预测单元(prediction Unit,简称PU)和变换单元(transform unit,简称TU),进而使得编码、预测、变换分离,处理的时候更灵活。在一种示例中,CTU以四叉树方式划分为CU,CU以四叉树方式划分为TU、PU。
视频编码器及视频解码器可支持各种PU大小。假定特定CU的大小为2N×2N,视频编码器及视频解码器可支持2N×2N或N×N的PU大小以用于帧内预测,且支持2N×2N、2N×N、N×2N、N×N或类似大小的对称PU以用于帧间预测。视频编码器及视频解码器还可支持2N×nU、2N×nD、nL×2N及nR×2N的不对称PU以用于帧间预测。
[根据细则91更正 27.12.2021] 在一些实施例中,如图2所示,该视频编码器200可包括:预测单元210、残差单元220、变换/量化单元230、 反变换/量化单元240、重建单元250、环路滤波单元260、解码图像缓存270和熵编码单元280。需要说明的是,视频编码器200可包含更多、更少或不同的功能组件。
可选的,在本申请中,当前块(current block)可以称为当前编码单元(CU)或当前预测单元(PU)等。预测块也可称为预测图像块或图像预测块,重建图像块也可称为重建块或图像重建图像块。
[根据细则91更正 27.12.2021] 在一些实施例中,预测单元210包括帧间预测单元211和帧内估计单元212。由于视频的一个帧中的相邻像素之间存在很强的相关性,在视频编解码技术中使用帧内预测的方法消除相邻像素之间的空间冗余。由于视频中的相邻帧之间存在着很强的相似性,在视频编解码技术中使用帧间预测方法消除相邻帧之间的时间冗余,从而提高编码效率。
帧间预测单元211可用于帧间预测,帧间预测可以参考不同帧的图像信息,帧间预测使用运动信息从参考帧中找到参考块,根据参考块生成预测块,用于消除时间冗余;帧间预测所使用的帧可以为P帧和/或B帧,P帧指的是向前预测帧,B帧指的是双向预测帧。运动信息包括参考帧所在的参考帧列表,参考帧索引,以及运动矢量。运动矢量可以是整像素的或者是分像素的,如果运动矢量是分像素的,那么需要再参考帧中使用插值滤波做出所需的分像素的块,这里把根据运动矢量找到的参考帧中的整像素或者分像素的块叫参考块。有的技术会直接把参考块作为预测块,有的技术会在参考块的基础上再处理生成预测块。在参考块的基础上再处理生成预测块也可以理解为把参考块作为预测块然后再在预测块的基础上处理生成新的预测块。
目前最常用的帧间预测方法包括:VVC视频编解码标准中的几何划分模式(geometric partitioning mode,GPM),以及AVS3视频编解码标准中的角度加权预测(angular weighted prediction,AWP)。这两种帧内预测模式在原理上有共通之处。
传统的单向预测只找一个与当前块大小相同的参考块。传统的双向预测使用两个与当前块大小相同的参考块,且预测块每个点的像素值为两个参考块对应位置的平均值,即每一个参考块的所有点都占50%的比例。双向加权预测使得两个参考块的比例可以不同,如第一个参考块中所有点都占75%的比例,第二个参考块中所有点都占25%的比例。但同一个参考块中的所有点的比例都相同。而GPM或AWP也使用两个与当前块大小相同的参考块,但某些像素位置100%使用第一个参考块对应位置的像素值,某些像素位置100%使用第二个参考块对应位置的像素值,而在交界区域,按一定比例使用这两个参考块对应位置的像素值。具体这些权重如何分配,由GPM或AWP的模式决定。也可以认为GPM或AWP使用两个与当前块大小不相同的参考块,即各取所需的一部分作为参考块。即将权重不为0的部分作为参考块,而将权重为0的部分剔除出来。
图4A是GPM在正方形的块上的64种模式的权重图,其中黑色表示第一个参考块对应位置的权重值为0%,白色表示第一个参考块对应位置的权重值为100%,灰色区域则按颜色深浅的不同表示第一个参考块对应位置的权重值为大于0%小于100%的某一个权重值。第二个参考块对应位置的权重值则为100%减去第一个参考块对应位置的权重值。
图4B是AWP在正方形的块上的56种模式的权重图。黑色表示第一个参考块对应位置的权重值为0%,白色表示第一个参考块对应位置的权重值为100%,灰色区域则按颜色深浅的不同表示第一个参考块对应位置的权重值为大于0%小于100%的某一个权重值。第二个参考块对应位置的权重值则为100%减去第一个参考块对应位置的权重值。
GPM和AWP的权重导出方法不同。GPM根据每种模式确定角度及偏移量,而后计算出每个模式的权重矩阵。AWP首先做出一维的权重的线,然后使用类似于帧内角度预测的方法将一维的权重的线铺满整个矩阵。
早先的编解码技术中只存在矩形的划分方式,无论是CU、PU还是TU的划分。而GPM和AWP在没有划分的情况下实现了预测的非矩形的划分效果。GPM和AWP使用了2个参考块的权重的蒙版(mask),即上述的权重图。这个蒙版确定了两个参考块在产生预测块时的权重,或者可以简单地理解为预测块的一部分位置来自于第一个参考块一部分位置来自于第二个参考块,而过渡区域(blending area)用两个参考块的对应位置加权得到,从而使过渡更平滑。GPM和AWP没有按划分线把当前块划分成两个CU或PU,于是在预测之后的残差的变换、量化、反变换、反量化等也都是将当前块作为一个整体来处理。
[根据细则91更正 27.12.2021] 帧内估计单元212只参考同一帧图像的信息,预测当前码图像块内的像素信息,用于消除空间冗余。帧内预测所使用的帧可以为I帧。例如图5所示,白色的4×4块是当前块,当前块左边一行和上面一列的灰色的像素为当前块的参考像素,帧内预测使用这些参考像素对当前块进行预测。这些参考像素可能已经全部可得,即全部已经编解码。也可能有部分不可得,比如当前块是整帧的最左侧,那么当前块的左边的参考像素不可得。或者编解码当前块时,当前块左下方的部分还没有编解码,那么左下方的参考像素也不可得。对于参考像素不可得的情况,可以使用可得的参考像素或某些值或某些方法进行填充,或者不进行填充。
在一些实施例中,帧内预测方法还包括多参考行帧内预测方法(multiple reference line,MRL),图6所示,MRL可以使用更多的参考像素从而提高编码效率。
帧内预测有多种预测模式,如图7所示,是H.264中对4×4的块进行帧内预测的9种模式。其中模式0是将当前块上面的像素按竖直方向复制到当前块作为预测值;模式1是将左边的参考像素按水平方向复制到当前块作为预测值;模式2(DC)是将A~D和I~L这8个点的平均值作为所有点的预测值,模式3至模式8是分别按某一个角度将参考像素复制到当前块的对应位置。因为当前块某些位置不能正好对应到参考像素,可能需要使用参考像素的加权平均值,或者说是插值的参考像素的分像素。
如图8所示,HEVC使用的帧内预测模式有平面模式(Planar)、DC和33种角度模式,共35种预测模式。
如图9所示,VVC使用的帧内模式有Planar、DC和65种角度模式,共67种预测模式。
如图10所示,AVS3使用的帧内模式有DC、Plane、Bilinear和63种角度模式,共66种预测模式。
在一些实施例中,帧内预测模式还包括一些改进模式,如改进参考像素的分像素插值,对预测像素进行滤波等。如AVS3中的多组合帧内预测滤波(multiple intra prediction filter,MIPF),可以对不同的块大小使用不同的滤波器产生预测值,具体是对同一个块内的不同位置的像素,与参考像素较近的像素使用一种滤波器产生预测值,与参考像素较远的像素使用另一种滤波器产生预测值。如AVS3中的帧内预测滤波(intra prediction filter,IPF),对预测值可以使用参考像素进行滤波。
需要说明的是,随着角度模式的增加,帧内预测将会更加精确,也更加符合对高清以及超高清数字视频发展的需求。
残差单元220可基于CU的像素块及CU的PU的预测块来产生CU的残差块。举例来说,残差单元220可产生CU的残差块,使得残差块中的每一采样具有等于以下两者之间的差的值:CU的像素块中的采样,及CU的PU的预测块中的对应采样。
变换/量化单元230可量化变换系数。变换/量化单元230可基于与CU相关联的量化参数(QP)值来量化与CU的TU相关联的变换系数。视频编码器200可通过调整与CU相关联的QP值来调整应用于与CU相关联的变换系数的量化程度。
反变换/量化单元240可分别将逆量化及逆变换应用于量化后的变换系数,以从量化后的变换系数重建残差块。
重建单元250可将重建后的残差块的采样加到预测单元210产生的一个或多个预测块的对应采样,以产生与TU相关联的重建图像块。通过此方式重建CU的每一个TU的采样块,视频编码器200可重建CU的像素块。
环路滤波单元260可执行消块滤波操作以减少与CU相关联的像素块的块效应。
在一些实施例中,环路滤波单元260包括去块滤波单元和样点自适应补偿/自适应环路滤波(SAO/ALF)单元,其中去块滤波单元用于去方块效应,SAO/ALF单元用于去除振铃效应。
[根据细则91更正 27.12.2021] 解码图像缓存270可存储重建后的像素块。帧间预测单元211可使用含有重建后的像素块的参考图像来对其它图像的PU执行帧间预测。另外,帧内估计单元212可使用解码图像缓存270中的重建后的像素块来对在与CU相同的图像中的其它PU执行帧内预测。
[根据细则91更正 27.12.2021] 熵编码单元280可接收来自变换/量化单元230的量化后的变换系数。熵编码单元280可对量化后的变换系数执行 一个或多个熵编码操作以产生熵编码后的数据。
图3是本申请实施例提供的解码框架300的示意性框图。
如图3所示,视频解码器300包含:熵解码单元310、预测单元320、反量化/变换单元330、重建单元340、环路滤波单元350及解码图像缓存360。需要说明的是,视频解码器300可包含更多、更少或不同的功能组件。
视频解码器300可接收码流。熵解码单元310可解析码流以从码流提取语法元素。作为解析码流的一部分,熵解码单元310可解析码流中的经熵编码后的语法元素。预测单元320、反量化/变换单元330、重建单元340及环路滤波单元350可根据从码流中提取的语法元素来解码视频数据,即产生解码后的视频数据。
[根据细则91更正 27.12.2021] 在一些实施例中,预测单元320包括帧内估计单元322和帧间预测单元321。
[根据细则91更正 27.12.2021] 帧内估计单元322可执行帧内预测以产生PU的预测块。帧内估计单元322可使用帧内预测模式以基于空间相邻PU的像素块来产生PU的预测块。帧内估计单元322还可根据从码流解析的一个或多个语法元素来确定PU的帧内预测模式。
[根据细则91更正 27.12.2021] 帧间预测单元321可根据从码流解析的语法元素来构造第一参考图像列表(列表0)及第二参考图像列表(列表1)。此外,如果PU使用帧间预测编码,则熵解码单元310可解析PU的运动信息。帧间预测单元322可根据PU的运动信息来确定PU的一个或多个参考块。帧间预测单元321可根据PU的一个或多个参考块来产生PU的预测块。
反量化/变换单元330可逆量化(即,解量化)与TU相关联的变换系数。反量化/变换单元330可使用与TU的CU相关联的QP值来确定量化程度。
在逆量化变换系数之后,反量化/变换单元330可将一个或多个逆变换应用于逆量化变换系数,以便产生与TU相关联的残差块。
重建单元340使用与CU的TU相关联的残差块及CU的PU的预测块以重建CU的像素块。例如,重建单元340可将残差块的采样加到预测块的对应采样以重建CU的像素块,得到重建图像块。
环路滤波单元350可执行消块滤波操作以减少与CU相关联的像素块的块效应。
视频解码器300可将CU的重建图像存储于解码图像缓存360中。视频解码器300可将解码图像缓存360中的重建图像作为参考图像用于后续预测,或者,将重建图像传输给显示装置呈现。
[根据细则91更正 27.12.2021] 视频编解码的基本流程如下:在编码端,将一帧图像划分成块,针对当前块,预测单元210使用帧内预测或帧间预测产生当前块的预测块。残差单元220可基于预测块与当前块的原始块计算残差块,即预测块和当前块的原始块的差值,该残差块也可称为残差信息。该残差块经由变换/量化单元230变换与量化等过程,可以去除人眼不敏感的信息,以消除视觉冗余。可选的,经过变换/量化单元230变换与量化之前的残差块可称为时域残差块,经过变换/量化单元230变换与量化之后的时域残差块可称为频率残差块或频域残差块。熵编码单元280接收到变化量化单元230输出的量化后的变化系数,可对该量化后的变化系数进行熵编码,输出码流。例如,熵编码单元280可根据目标上下文模型以及二进制码流的概率信息消除字符冗余。
在解码端,熵解码单元310可解析码流得到当前块的预测信息、量化系数矩阵等,预测单元320基于预测信息对当前块使用帧内预测或帧间预测产生当前块的预测块。反量化/变换单元330使用从码流得到的量化系数矩阵,对量化系数矩阵进行反量化、反变换得到残差块。重建单元340将预测块和残差块相加得到重建块。重建块组成重建图像,环路滤波单元350基于图像或基于块对重建图像进行环路滤波,得到解码图像。编码端同样需要和解码端类似的操作获得解码图像。该解码图像也可以称为重建图像,重建图像可以为后续的帧作为帧间预测的参考帧。
需要说明的是,编码端确定的块划分信息,以及预测、变换、量化、熵编码、环路滤波等模式信息或者参数信息等在必要时携带在码流中。解码端通过解析码流及根据已有信息进行分析确定与编码端相同的块划分信息,预测、变换、量化、熵编码、环路滤波等模式信息或者参数信息,从而保证编码端获得的解码图像和解码端获得的解码图像相 同。
上述是基于块的混合编码框架下的视频编解码器的基本流程,随着技术的发展,该框架或流程的一些模块或步骤可能会被优化,本申请适用于该基于块的混合编码框架下的视频编解码器的基本流程,但不限于该框架及流程。
上文对本申请实施例涉及的视频编码系统、视频编码器、视频解码以及帧内预测模式进行介绍。在此基础上,下面结合具体的实施例对本申请实施例提供的技术方案进行详细描述。
本申请实施例的视频编码器可以用于不同格式的图像块,例如YUV格式、YcbCr格式、RGB格式等。上述各格式的图像块均包括第一分量和第二分量,例如YUV格式的图像块的第二分量可以是Y分量,即亮度分量,第一分量可以是U、V分量,即色度分量。其中,第二分量相比于第一分量重要,例如人眼对亮度比色度更敏感,因而视频编解码对Y分量相比于U、V分量更关注一些。例如一些常用的YUV格式中YUV比例为4:2:0,其中U、V分量的像素数都小于Y分量,YUV4:2:0的一个块中的Y、U、V的像素比是4:1:1。那么图像块的色度分量下的一些编解码模式的决策可以依据在亮度分量下的编解码模式的信息。
其他格式的图像块,如RGB格式等,图像块在第一分量下的一些编解码模式的决策也可以依据该图像块在第二分量下的编解码模式的信息。本申请实施例主要以YUV格式为例,但是本申请并不限制于某个特殊的格式。
本申请对图像块的第二分量进行帧内预测时,采用图像块在第二分量下的至少两种帧内预测模式进行预测,以实现对复杂纹理的准确预测。例如第二分量为亮度分量,本申请对复杂亮度纹理的块采用至少两种帧内预测模式进行预测,以实现对复杂亮度纹理块的准确预测。
图像块在第二分量下的至少两种帧内预测模式包括但不限于上面所提到的DC、Planar、Plane、Bilinear和角度预测模式等帧内预测模式,还包括改进预测模式,如MIPF,IPF等。
使用图像块在第二分量下的至少两种帧内预测模式对第二分量进行帧内预测的过程是,使用至少两种帧内模式中的每一种帧内预测模式对第二分量进行预测,得到每一种帧内预测模式对应的预测块,再将每一种帧内预测模式对应的预测块进行处理,得到该图像块在第二分量下的最终预测块。例如,可以将每一种帧内预测模式对应的预测块进行相加后,取平均值作为该图像块在第二分量下的最终预测块。例如,确定一个权重矩阵,即第二权重矩阵,根据该第二权重矩阵,对每一种帧内预测模式对应的预测块进行加权运算,得到该图像块在第二分量下的最终预测块。例如,假设第二分量为亮度分量,如图11A所示,对于亮度块包括的至少两种帧内预测模式为第一帧内预测模式和第二帧内预测模式,使用第一帧内预测模式对亮度块进行帧内预测,得到第一预测块,使用第二帧内预测模式对亮度块进行帧内预测,得到第二预测块,采用第二权重矩阵对第一预测块和第二预测块进行加权运算,得到亮度块的最终预测块。
在一种示例中,本申请还可以针对第二分量中的每一个像素点,使得不同的帧内预测模式进行预测,得到每一个像素点的不同帧内预测模式的预测值,再根据第二权重矩阵中每个像素点对应的权重值,将每一个像素点的不同帧内预测模式的预测值进行加权运算,得到每一个像素点在第二分量下的最终预测值,每一个像素点在第二分量下的最终预测值构成该图像块在第二分量下的最终预测块。这样不需要等到每个预测块都得出来再进行加权,进而不需要额外的存储空间来存储第一预测块和第二预测块,可以节约视频编码器的存储资源。
由上述可知,同一个图像块在第一分量下的一些编解码模式的决策可以依据该图像块在第二分量下的编解码模式的信息。也就是说,在一些情况下,图像块在第一分量下的帧内编码模式的决策可以依据图像块在第二分量下的帧内预测模式的信息。
基于此,下面结合图12对编码端进行介绍。
图12为本申请实施例提供的视频编码方法400的一种流程示意图,本申请实施例应用于图1和图2所示视频编码器。如图12所示,本申请实施例的方法包括:
S401、获得当前块,当前块包括第一分量。
在视频编码过程中,视频编码器接收视频流,该视频流由一系列图像帧组成,针对视频流中的每一帧图像进行视频编码,为了便于描述,本申请将当前待编码的一帧图像记为目标图像帧。视频编码器对该目标图像帧进行块划分,得到当前块。
在块划分时,传统方法划分后的块既包含了当前块位置的第一分量(例如色度分量),又包含了当前块位置的第二分量(例如亮度分量)。而分离树技术(dual tree)可以划分单独分量块,例如单独的亮度块和单独的色度块,如图13所示,当前块(也称为当前图像块)中相同位置的亮度块划分成了4个亮度编码单元,而色度块没有进行划分,其中亮度块可以理解为只包含当前块位置的亮度分量,色度块理解为只包含当前块位置的色度分量。这样相同位置的亮度分量和色度分量可以属于不同的块,划分可以有更大的灵活性。如果分离树用在CU划分中,那么有的CU既包含第一分量又包含第二分量,有的CU只包含第一分量,有的CU只包含第二分量。
在一些实施例中,本申请实施例的当前块只包括第一分量,例如只包括色度分量,可以理解为色度块。
在一些实施例中,该当前块即包括第一分量又包括第二分量,例如即包括色度分量又包括亮度分量。
S402、确定当前块在第一分量下的初始帧内预测模式。
以第一分量为色度分量,第二分量为亮度分量为例。
对色度的帧内预测模式,可以单独选择色度的帧内预测模式,还可以根据同一个块或同位置或相邻块的亮度帧内预测模式导出。以AVS3的帧内色度预测模式为例,表1为AVS3的《亮度预测块帧内预测模式》所示的多种模式,表2为AVS3的《色度预测块帧内预测模式》所示的多种模式:
表1
IntraLumaPredMode 帧内预测模式
0 Intra_Luma_DC
1 Intra_Luma_Plane
2 Intra_Luma_Bilinear
3~11 Intra_Luma_Angular
12 Intra_Luma_Vertical
13~23 Intra_Luma_Angular
24 Intra_Luma_Horizontal
25~32 Intra_Luma_Angular
33 Intra_Luma_PCM
34~65 Intra_Luma_Angular
其中,IntraLumaPredMode为亮度分量帧内预测的模式号,Intra_Luma_DC为帧内亮度预测的DC模式,Intra_Luma_Plane为帧内亮度预测的Plane(平面)模式,Intra_Luma_Bilinear为帧内亮度预测的Bilinear(双线性)模式,Intra_Luma_Vertical为帧内亮度预测的垂直模式,Intra_Luma_Horizontal为帧内亮度预测的垂直模式,Intra_Luma_PCM为帧内亮度预测的PCM模式,Intra_Luma_Angular为帧内亮度预测的角度模式。
表2
IntraChromaPredMode 帧内预测模式
0 Intra_Chroma_DM(IntraLumaPredMode的值不等于33)
0 Intra_Chroma_PCM(IntraLumaPredMode的值等于33)
1 Intra_Chroma_DC
2 Intra_Chroma_Horizontal
3 Intra_Chroma_Vertical
4 Intra_Chroma_Bilinear
5 Intra_Chroma_TSCPM
6 Intra_Chroma_TSCPM_L
7 Intra_Chroma_TSCPM_T
8 Intra_Chroma_PMC
9 Intra_Chroma_PMC_L
10 Intra_Chroma_PMC_T
其中,IntraChromaPredMode为色度分量帧内预测的模式号,Intra_Chroma_DM为帧内色度预测的DM模式,DM模式为一种导出模式,即帧内色度预测模式使用DM模式时,将对应的帧内亮度预测模式作为帧内色度预测模式。例如对应的帧内亮度预测模式是角度模式,那么帧内色度预测模式也为该角度模式。除了DM模式以外,帧内色度预测模式还有DC模式(Intra_Chroma_DC),水平模式(Intra_Chroma_Horizontal),垂直模式(Intra_Chroma_Vertical),双线性(Bilinear)模式、PCM模式,以及跨分量的预测模式等。
色度分量对应的DC模式、Bilinear模式、水平模式和垂直模式跟亮度分量对应的DC模式、Bilinear模式、水平模式和垂直模式相同。这样的模式设计使得色度帧内预测既可以使用和亮度帧内预测相同的预测模式。这里IntraLumaPredMode的值等于33指对应的亮度预测块使用PCM模式,如果亮度预测块使用PCM模式,且IntraChromaPredMode为0,那么色度分量在帧内预测时也使用PCM模式。
视频编码器在对色度分量进行帧内预测时,会尝试表2中各种可能的帧内预测模式,例如DM模式、DC模式(Intra_Chroma_DC),水平模式(Intra_Chroma_Horizontal),垂直模式(Intra_Chroma_Vertical),双线性(Bilinear)模式、PCM模式,以及跨分量的预测模式(TSCPM、PMC,VVC里的CCLM)等。视频编码器选择失真代价最小的帧内预测模式作为当前块在色度分量下的初始帧内预测模式。
若视频编码器确定当前块在色度分量下的初始帧内预测模式不是DM模式,例如为DC模式或垂直模式,则视频编码器将确定的初始帧内编码模式的模式信息写入到码流中,解码器解码色度帧内预测的模式信息确定色度帧内预测的模式。
若视频编码器确定当前块在色度分量下的初始帧内预测模式为DM模式,则执行如下步骤S403。
S403、在初始帧内预测模式为导出模式时,获得当前块对应的第二分量下的至少两种帧内预测模式。
该导出模式用于指示当前块在第一分量下的帧内预测模式由当前块对应的第二分量下的帧内预测模式导出,例如当前块在第一分量下使用与第二分量下的帧内预测模式相同的预测模式,或者根据第二分量下的帧内预测模式确定当前块在第一分量下的帧内预测模式。
本申请实施例所述的当前块对应的第二分量包括如下两种情况,第一种情况是,当前块即包括第一分量又包括第二分量,此时,当前块对应的第二分量为该当前块所包括的第二分量;第二种情况是,当前块只包括第一分量不包括第二分量,例如第一分量为色度分量,则当前块可以理解为色度块,当前块与原始待编码图像帧中的一个或多个像素点对应,该一个或多个像素点对应的第二分量即为当前块对应的第二分量。
若当前块即包括第一分量又包括第二分量,由于同一个块里第二分量下的帧内预测模式可以从当前块的模式信息里直接得到的,当前块在第二分量下的帧内预测模式已经确定且已保存在当前块的模式信息中时,当前块进行第二分量帧内预测时所使用的至少两种帧内预测模式直接可以从当前块的模式信息中获得。
由于编码器在当前块对应的第二分量编码时,将第二分量在编码时使用的至少两种帧内预测模式的模式信息进行存储。因此,若当前块只包括第一分量不包括第二分量,编码器可以获得存储的第二分量下的至少两种帧内预测模式。
其中,第二分量下的至少两种帧内预测模式中的各帧内预测模式均不相同。
第二分量在帧内预测时所使用的至少两种帧内预测模式包括但不限于上面所提到的DC、Planar、Plane、Bilinear和角度模式等帧内预测模式,还包括改进的帧内预测模式,如MIPF,IPF等。为了便于描述,本申请将DC、Planar、Plane、Bilinear和角度模式等帧内预测模式称为基本帧内预测模式,将MIPF,IPF等称为改进帧内预测模式。基本帧内预测模式是可以不依赖于其他帧内预测模式独立生成预测块的帧内预测模式,即确定了参考像素和基本帧内预测模式,就可以确定预测块。而改进帧内预测模式不能独立生成预测块,它们需要依赖于基本帧内预测模式才能确定预测块。比如某一种角度预测模式可以根据参考像素确定生成预测块,而MIPF可以在这个角度预测模式的基础上对不同位置的像素使用不同的滤波器生成或确定预测块。
在一种实现方式中,第二分量下的至少两种帧内预测模式均为基本帧内预测模式。即本申请的第二分量使用2个不同的基本帧内预测模式,例如第一帧内预测模式和第二帧内预测模式。可选的,改进帧内预测模式可能分别与第一帧内预测模式和第二帧内预测模式组合。可选的,使用至少两种基本帧内预测模式得到第二分量下的最终预测块后,可以进一步使用改进帧内预测模式对最终预测块进行改进,得到更新的最终预测块。
在一种实现方式中,第二分量下的至少两种帧内预测模式为基本帧内预测模式和改进帧内预测模式的组合。例如,第二分量下的至少两种帧内预测模式为第一帧内预测模式和第二帧内预测模式,第一帧内预测模式为某一种角度帧内预测模式,第二帧内预测模式为改进帧内预测模式,如IPF。或者第一帧内预测模式和第二帧内预测模式都使用了同一种角度预测模式,但是第一帧内预测模式使用了某种改进帧内预测模式的某一种选择;而第二帧内预测模式使用了这种改进帧内预测模式的另一种选择。可选的,在使用第一帧内预测模式和第二帧内预测模式得到第二分量下的最终预测块之后,可以进一步使用改进帧内预测模式对最终预测块进行改进,得到更新的最终预测块。
在一种实现方式中,第二分量下的至少两种帧内预测模式均为改进帧内预测模式的组合。
S404、根据第二分量下的至少两种帧内预测模式,确定当前块在第一分量下的目标帧内预测模式。
S405、使用目标帧内预测模式,对当前块进行第一分量帧内预测,获得当前块在第一分量下的最终预测块。
在本申请实施例的一些实施例中,目标帧内预测模式包括至少两种帧内预测模式,此时,上述S404中根据第二分量下的至少两种帧内预测模式,确定当前块在第一分量下的目标帧内预测模式的方法包括但不限于如下几种:
方式一,将第二分量下的至少两种帧内预测模式,作为目标帧内预测模式。例如,第二分量下的至少两种帧内预测模式包括第一帧内预测模式和第二帧内预测模式,则将第一帧内预测模式和第二帧内预测模式作为目标帧内预测模式。
方式二,根据第二分量下的至少两种帧内预测模式,导出目标帧内预测模式。例如第一分量使用比第二分量更大间隙的角度,也就是说几个第二分量下的帧内预测模式均可能导出第一分量下的同一个帧内预测模式,比如第二分量下的一个接近水平的模式(如AVS3中的模式号11对应的帧内预测模式)可以导出第一分量下的水平模式。基于此,根据第二分量下的至少两种帧内预测模式导出当前块在第一分量下的至少两种帧内预测模式,例如,第二分量下的第 一帧内预测模式导出当前块在第一分量下的第三帧内预测模式,第二分量下的第二帧内预测模式导出当前块在第一分量下的第四帧内预测模式。
当目标帧内预测模式包括至少两种帧内预测模式时,此时上述S405包括:
S405-A1、使用当前块在第一分量下的至少两种帧内预测模式中每一种帧内预测模式对当前块进行第一分量帧内预测,获得每一种帧内预测模式对应的预测块。
S405-A2、根据每一种帧内预测模式对应的预测块,获得当前块在第一分量下的最终预测块。
以当前块在第一分量下的至少两种帧内预测模式包括2种帧内预测模式,例如第一帧内预测模式和第二帧内预测模式。
在一种实现方式中,使用第一帧内预测模式对当前块进行第一分量帧内预测,得到当前块在第一分量下的第一预测块,使用第二帧内预测模式对当前块进行第一分量帧内预测,得到当前块在第一分量下的第二预测块。按照预设的运算规则,对第一预测块和第二预测块进行运算,得到当前块在第一分量下的最终预测块,例如,按照1:1的比例,即将第一预测块和第二预测块的平均值作为当前块在第一分量下的最终预测块。
在一种实现方式中,针对第一分量中的每一个像素点,使用第一帧内预测模式对该像素点进行预测,得到该像素点在第一分量下的第一预测值,使用第二帧内预测模式对该像素点进行预测,得到该像素点在第一分量下的第二预测值。按照预设的运算规则,对第一预测值和第二预测值进行运算,得到该像素点在第一分量下的最终预测值,例如将第一预测值和第二预测值的平均值作为该像素点在第一分量下的最终预测值。采用同样的方法,可以获得第一分量中每一个像素点在第一分量下的最终预测值,进而构成该当前块在第一分量下的最终预测块。
在一种实现方式中,上述S405-A2包括S405-A21和S405-A22:
S405-A21、确定第一权重矩阵;
S405-A22、根据第一权重矩阵,对每一种帧内预测模式对应的预测块进行加权运算,得到当前块在第一分量下的最终预测块。
在该实现方式中,通过确定第一权重矩阵,根据该第一权重矩阵,对每一种帧内预测模式对应的预测块进行加权运算,得到当前块在第一分量下的最终预测块。例如,继续以当前块在第一分量下的至少两种帧内预测模式为第一帧内预测模式和第二帧内预测模式为例,使用第一帧内预测模式对当前块进行第一分量帧内预测,得到第一预测块,使得第二帧内预测模式对当前块进行第一分量帧内预测,得到第二预测块。对于第一分量中的每一个像素点,获得该像素点在第一预测块中对应的第一预测值,在第二预测块中对应的第二预测值,以及在第一权重矩阵中对应的权重值,使用该权重值对第一预测值和第二预测值进行加权运算,得到该像素点的最终预测值。采用同样的方法,可以获得第一分量中每一个像素点的最终预测值,进而得到当前块在第一分量下的最终预测块。
在一种可能的实现方式中,上述第一权重矩阵中的各权重值为预设值,例如均为1,表示每一种帧内预测模式对应的权重值均为1。
在一种可能的实现方式中,根据权重矩阵导出模式,导出第一权重矩阵。其中权重矩阵导出模式可以理解为导出权重矩阵的模式,每种权重矩阵导出模式对一个给定长度和宽度的块可以导出一个权重矩阵,不同权重矩阵导出模式对同样大小的块可以导出不同的权重矩阵。如AVS3的AWP有56种权重矩阵导出模式,VVC的GPM有64种权重矩阵导出模式。该示例中,根据权重矩阵导出模式,导出第一权重矩阵的过程与第二权重矩阵的导出过程基本一致,例如第二分量为亮度分量,亮度分量下的第二权重矩阵的导出过程可以参照如下S905的描述,在此不再赘述。需要说明的是,参照S905中的方式导出第一权重矩阵时,可以根据第一分量的编码信息对S905中的相关参数进行修改,进而导出第一权重矩阵。
在一种可能的实现方式中,第一权重矩阵由第二分量下的权重矩阵(即第二权重矩阵)推导出,此时上述S405-A21包括:
S405-A211、获得当前块在第二分量下的第二权重矩阵;
S405-A212、根据第二权重矩阵获得第一权重矩阵。
在一种示例中,第二权重矩阵包括至少两个不同的权重值。例如,最小权重值是0,最大权重值是8,则该第二权重矩阵中有的点的权重值0,有的点的权重值为8,有的点为的权重值为0至8中的任意值,例如为2。
在一种示例中,第二权重矩阵中的所有权重值均相同。例如最小权重值为0,最大权重值为8,则第二权重矩阵中所有点的权重值为位于最小权重值与最大权重值之间的一数值,例如为4。
在一种示例中,第二权重矩阵中的每一个权重值所对应像素点在第二分量下的预测值由第二分量下的至少两个帧内预测模式预测得到。例如,第二分量包括两种帧内预测模式,对于第二权重矩阵设置一个最小权重值和最大权重值的限制,例如设置最小权重值为0,最大权重值为8,设置9个档,即0~8。其中0表示当前块中的该像素点在第二分量下的预测值完全由一个帧内预测模式导出的预测值得到,8表示当前块中的该像素点在第二分量下的预测值完全由另一个帧内预测模式导出的预测值得到。该第二权重矩阵中的每一个权重值均大于0且小于8,例如设置第二权重矩阵中的最小权重值为1,最大权重值为7。可选的,该第二权重矩阵中至少有两个权重值不同。
在一种示例中,第二分量下的至少两种帧内预测模式包括N种帧内预测模式,N为大于或等于2的正整数,第二权重矩阵包括N种不同的权重值,第i种权重值指示第i种权重值对应像素点在第二分量下的预测值完全由第i种帧内预测模式得到,i为大于或等于2且小于或等于N的正整数。例如N为2,即第二分量使用2种帧内预测模式进行预测,假设为第一帧内预测模式和第二帧内预测模式,则第二权重矩阵包括两种权重值,其中一个权重值表示对应像素点在第二分量下的预测值完全由第一帧内预测模式预测得到,另一个权重表示对应像素点在第二分量下的预测值完全由第二帧内预测模式预测得到。可选的,上述2种权重值分别是0和1。
在一种示例中,第二分量下的至少两种帧内预测模式包括第一帧内预测模式和第二帧内预测模式,第二权重矩阵:包括最大权重值(例如8)、最小权重值(例如0)和至少一个中间权重值,其中,最大权重值用于指示对应像素点在第二分量下的预测值完全由第一帧内预测模式预测得到;最小权重值用于指示对应像素点在第二分量下的预测值完全由第二帧内预测模式预测得到;中间权重值用于指示对应像素点在第二分量下的预测值由第一帧内预测模式和第二帧内预测模式预测得到。可选的,最大权重值或最小权重值组成的区域可以叫做过渡区域(blending area)。
在一种示例中,第二权重矩阵包括多种权重值,权重值变化的位置构成一条直线或曲线。例如,第二权重矩阵只有2种权重值的情况下,权重值变化的位置构成一条直线或曲线,或第二权重矩阵有3种以上权重值的情况下,过渡区域中权重值相同的位置构成一条直线或曲线。可选的,上述构成的直线全是水平直线或是竖直直线,可选的,上述构成的直线不全是水平直线或竖直直线。
在一种示例中,第二权重矩阵为AWP模式或GPM模式对应的权重矩阵。即使用本申请方案的编解码标准或编解码器中使用了GPM或AWP其一,则本申请可以基于与GPM或AWP确定权重矩阵相同的逻辑来确定第二权重矩阵。如AVS3帧间预测使用了AWP,若本申请应用到AVS3中,则本申请可以使用与AWP确定权重矩阵相同的方法来确定第二权重矩阵。可选的,本申请可以复用AWP的权重矩阵,例如AWP的权重矩阵有56种,假设本申请帧内预测中使用64种权重矩阵,这64种权重矩阵中有56种和AWP的权重矩阵相同,比如前56种和AWP的权重矩阵相同,剩余的8种权重矩阵每一个权重矩阵都只有一种权重值,该权重值分别为1,2,……,7,8。对这8种权重矩阵,总的权重值为16,即权重值为1表示1:15加权,权重值为2表示2:14加权。这样在64种权重矩阵的模式号进行二值化时,可以都使用6个比特的码字。基于此,本申请实施例的第二权重矩阵可能为AWP模式对应的权重矩阵。可选的,若本申请应用到AVS3中,而AVS3帧间预测使用了GPM,则本申请实施例的可以复用GPM的权重矩阵,此时,上述第二权重矩阵可能为GPM对应的权重矩阵。
另外,由于帧内预测利用了空域上的相关性,它使用的是当前块周边已重建的像素作为参考像素。空域上距离越近相关性越强,距离越远相关性越差。因此在复用GPM模式对应的权重矩阵或AWP模式对应的权重矩阵时,若某种 权重矩阵使得一个预测块使用后得到的像素位置距离参考像素较远,则本申请可以不使用该权重矩阵。
需要说明的是,第二权重矩阵除了通过上述方法获得外,还可以通过其他的方法获得,本申请实施例对此不做限制。
获得第二权重矩阵后,执行上述S405-A212根据第二权重矩阵获得第一权重矩阵,本申请中根据第二权重矩阵获得第一权重矩阵的方式包括但不限于如下几种:
方式一,若当前块在第二分量下所包括的像素点总数与当前块在第一分量下所包括的像素点总数相同,则将第二权重矩阵作为第一权重矩阵。
方式二,若当前块在第一分量下所包括的像素点总数小于当前块在第二分量下所包括的像素点数,则对第二权重矩阵进行下采样,得到第一权重矩阵。例如,根据当前块在第一分量下所包括的像素点总数与当前块在第二分量下所包括的像素点数,对第二权重矩阵进行下采样,得到第一权重矩阵。
根据上述方法获得第一权重矩阵后,执行S405-A22根据第一权重矩阵,对每一种帧内预测模式对应的预测块进行加权运算,得到当前块在第一分量下的最终预测块。
在一种示例中,假设当前块在第一分量下包括第一帧内预测模式和第二帧内预测模式,则根据如下公式(1)得到当前块在第一分量下的最终预测块:
其中,C表示第一分量,predMatrixSawpC[x][y]为第一分量中的像素点[x][y]在第一分量下的最终预测值,predMatrixC0[x][y]为像素点[x][y]在当前块在第一分量下的第一预测块中对应的第一预测值,predMatrixC1[x][y]为像素点[x][y]在当前块在第一分量下的第二预测块中对应的第二预测值,AwpWeightArrayC[x][y]为predMatrixC0[x][y]在第一权重矩阵中对应的权重值,2 n为预设的权重之和,n为正整数,其中第一预测块为使用第一帧内预测模式预测得到,第二预测块为使用第二帧内预测模式得到。
在一种实施例中,第一分量包括第一子分量和第二子分量。
针对第一子分量,上述步骤S405-A1包括:使用当前块在第一分量下的至少两种帧内预测模式中每一种帧内预测模式对当前块进行第一子分量帧内预测,获得当前块在第一子分量下关于每一种帧内预测模式的预测块。对应的,上述S405-A22包括:根据第一权重矩阵,对当前块在第一子分量下关于每一种帧内预测模式的预测块进行加权运算,得到当前块在第一子分量下的最终预测块;
例如,使用第一帧内预测模式对当前块进行第一子分量帧内预测,得到当前块在第一子分量下的第一预测块,使得第二帧内预测模式对当前块进行第一分量帧内预测,得到当前块在第一子分量下的第二预测块。接着,根据第一权重矩阵,对当前块在第一子分量下的第一预测块和第二预测块进行加权运算,得到当前块在第一子分量下的最终预测块。
在一种具体的示例中,根据如下公式(2)得到当前块在第一子分量下的最终预测块:
其中,A为第一子分量,predMatrixSawpA[x][y]为第一子分量中的像素点[x][y]在第一子分量下的最终预测值,predMatrixA0[x][y]为像素点[x][y]在当前块在第一子分量下的第一预测块中对应的第一预测值,predMatrixA1[x][y]为像素点[x][y]在当前块在第一子分量下的第二预测块中对应的第二预测值,AwpWeightArrayAB[x][y]为predMatrixA0[x][y]在第一权重矩阵AwpWeightArrayAB中对应的权重值,2 n为预设的权重之和,n为正整数。例如n=1、2、3等正整数。
针对第二子分量,上述步骤S405-A1包括:使用当前块在第一分量下的至少两种帧内预测模式中每一种帧内预测模式对当前块进行第二子分量帧内预测,获得当前块在第二子分量下关于每一种帧内预测模式的预测块。对应的,上 述S405-A22包括:根据第一权重矩阵,对当前块在第二子分量下关于每一种帧内预测模式的预测块进行加权运算,得到当前块在第二子分量下的最终预测块;
例如,使用第一帧内预测模式对当前块进行第二子分量帧内预测,得到当前块在第二子分量下的第一预测块,使得第二帧内预测模式对当前块进行第二分量帧内预测,得到当前块在第二子分量下的第二预测块。接着,根据第一权重矩阵,对当前块在第二子分量下的第一预测块和第二预测块进行加权运算,得到当前块在第二子分量下的最终预测块。
在一种具体的示例中,根据如下公式(3)得到当前块在第二子分量下的最终预测块:
其中,B为第二子分量,predMatrixSawpB[x][y]为第二子分量中的像素点[x][y]在第二子分量下的最终预测值,predMatrixB0[x][y]为像素点[x][y]在当前块在第二分量下的第一预测块中对应的第一预测值,predMatrixB1[x][y]为像素点[x][y]在当前块在第二分量下的第二预测块中对应的第二预测值,AwpWeightArrayAB[x][y]为predMatrixB0[x][y]在第一权重矩阵中对应的权重值,2 n为预设的权重之和,n为正整数。
本申请当当前块对应的第二分量使用至少两种帧内预测模式进行预测时,在确定当前块在第一分量下的初始帧内预测模式为导出模式,则采用上述实施例描述的方法,根据第二分量下的至少两种帧内预测模式,得到当前块在第一分量下的至少两种帧内预测模式,并使用当前块在第一分量下的至少两种帧内预测模式对当前块进行第一分量帧内预测,不仅实现对当前块在第一分量下的帧内预测模式的简单高效确定,并且可以实现对复杂纹理的准确预测,进而提高视频编码的效率。另外,由于本申请当前块在第一分量下的至少两种帧内预测模式是通过第二分量下的至少两种帧内预测模式导出的,在后续的码流中不需要携带当前块在第一分量下的至少两种帧内预测模式的模式信息,进而降低了开销。
由于本申请采用至少两种帧内预测模式生成至少两个预测块,再根据权重矩阵进行加权得到最终预测块。相比于传统根据1个帧内预测模式生成1个预测块来说,复杂度会有所增加。为了降低复杂度对整个系统的影响,同时考虑压缩性能和复杂度的权衡,可以限制本申请对一些大小的块不使用,即本申请的当前块的大小满足预设条件:
预设条件包括如下任意一种或多种:
条件1,当前块的宽度大于或等于第一预设宽度TH1,且当前块的高度大于或等于第一预设高度TH2;例如,TH1和TH2可以为8,16,32等,可选的,TH1可以等于TH2,比如,设置当前块的高度大于等于8,且宽度大于等于8。
条件2,当前块的像素数大于或等于第一预设数量TH3;TH3的值可以是8,16,32等。
条件3,当前块的宽度小于或等于第二预设宽度TH4,且当前块的高度大于或等于第二预设高度TH5;TH4和TH5的值可以是8,16,32等,TH4可以等于TH5。
条件4,当前块的长宽比为第一预设比值;例如,第一预设比值为如下任意一个:1:1,1:2,2:1,4:1,1:4。
条件5,当前块的大小不为第二预设值;例如,第二预设值为如下任意一个:16×32、32×32、16×64和64×16。
条件6、当前块的高度大于或等于第三预设高度,当前块的宽度大于或等于第三预设宽度,且当前块的宽度与高度之比小于或等于第三预设值,且当前块的高度与宽度之比小于或等于第三预设值。比如当前块的高度大于等于8,且宽度大于等于8,且高度与宽度之比小于等于4,且宽度与高度之比小于等于4。
本申请实施例的方法,对于正方形的块或近似正方形的块,例如1:1或1:2的块进行预测时,其预测效果较明显,而对于瘦长形的块,例如长宽比16:1或32:1的块进行预测时,其预测效果不明显,因此,为了降低复杂度对整个系统的影响,同时考虑压缩性能和复杂度的权衡,本申请主要针对满足上述预设条件的正方形块或近似正方形的块进行帧内预测。
在一些实施例中,本申请实施例当前块在第一分量下的目标帧内预测模式还可能包括一种帧内预测模式,此时,上述S404包括但不限于如下几种方式:
方式一,将第二分量下的至少两种帧内预测模式中的一个帧内预测模式,作为目标帧内预测模式。例如第二分量包括第一帧内预测模式和第二帧内预测模式,则固定将第一帧内预测模式作为目标帧内预测模式,或者,固定将第二帧内预测模式作为目标帧内预测模式。
方式二,根据第二分量下的至少两种帧内预测模式导出一种帧内预测模式,将该导出的一种帧内预测模式作为目标帧内预测模式。例如,第一分量使用比第二分量更大间隙的角度,也就是说几个亮度帧内预测模式均可能导出同一个色度帧内预测模式。
方式三,根据当前块的第一像素点位置所对应的第二分量下的帧内预测模式,确定目标帧内预测模式。第一像素点位置例如为当前块的右下角某个点或中间某个点的位置。
方式三的一种可能的方式,若第一像素点位置对应的第二分量下的预测块完全由一个帧内预测模式预测得到,则将一个帧内预测模式作为目标帧内预测模式。
方式三的一种可能的方式,若第一像素点位置对应的第二分量下的预测块由多个帧内预测模式预测得到,则将多个帧内预测模式中权重值最大的帧内预测模式作为目标帧内预测模式。
方式三的一种可能的方式,将第一像素点位置对应的最小单元中所存储的第二分量下的帧内预测模式,作为目标帧内预测模式。其中,若第一像素点位置对应的第二分量下的预测块完全由一种帧内预测模式预测得到,则最小单元中存储该一种帧内预测模式的模式信息。若第一像素点位置对应的第二分量下的预测块由多种帧内预测模式预测得到,则最小单元存储多种帧内预测模式中对应的权重值最大的帧内预测模式的模式信息。
也就是说,本申请的帧内预测中同样可以保存帧内预测模式等信息以供后续编解码的块参考。当前帧的后续编解码的块可以根据相邻的位置关系使用前面已编解码的块,如相邻块的帧内预测模式。色度块(编码单元)可以根据位置使用前面已编解码的亮度块(编码单元)的帧内预测模式。注意这里存储的这些信息是为后续编解码的块参考的,因为同一个块(编码单元)里面的编码模式信息是可以直接获得的,但是不同块(编码单元)里面的编码模式信息是不能直接获得的,所以需要存储下来。后续编解码的块根据位置去读取这些信息。当前帧的每个块所使用的帧内预测模式的存储方法通常将一个固定大小的矩阵,如4X4的矩阵,作为一个最小单元,每个最小单元单独存储一个帧内预测模式。这样每编解码一个块,它的位置对应的那些最小单元就可以把这个块的帧内预测模式存储下来。如图11B所示,一个16X16的块使用了帧内预测模式5,那么这个块对应的所有的4X4个最小单元中存储的帧内预测模式均为5。对YUV格式来说一般只存储亮度的帧内预测模式。
举例说明,若第二分量下的至少两种帧内预测模式包括第一帧内预测模式和第二帧内预测模式,则最小单元中保存帧内预测模式的方式包括:
一种方法是,一部分最小单元选择保存第一帧内预测模式,一部分最小单元选择保存第二帧内预测模式。一种具体的实现是使用与GPM或AWP类似的方法。如果采用本申请技术的编解码标准或编解码器中使用了GPM或AWP其一,那么本申请可以使用与GPM或AWP相似的逻辑,可以复用部分相同的逻辑。如AVS3帧间预测使用了AWP,那么在AVS3中可以使用与AWP保存2个不同运动信息相似的逻辑来保存第二分量下的2个不同的帧内预测模式。即如果一个最小单元对应的位置只使用了第一帧内预测模式来确定预测块,那么这个最小单元保存第一帧内预测模式;如果一个最小单元对应的位置只使用了第二帧内预测模式来确定预测块,那么这个最小单元保存第二帧内预测模式;如果一个最小单元对应的位置既使用了第一帧内预测模式来确定预测块又使用了第二帧内预测模式来确定预测块,那么根据一定的判断方法选择其中一个进行保存,例如保存第一帧内预测模式和第二预测模式中权重大的一个。
另一种方法是,对整个当前块所对应的所有最小单元均只选择同一个帧内预测模式进行保存。例如根据第二权重矩阵的导出模式确定当前块的所有最小单元是保存第一帧内预测模式还是保存第二帧内预测模式,假设本申请的第二 权重矩阵的导出模式和AWP的权重矩阵导出模式相同,其中AWP包括56种权重矩阵导出模式,具体参照图4B所示。如下表3所示,如果第二权重矩阵的导出模式的模式号对应的是0,则表示当前块的所有最小单元均保存第一帧内预测模式,如果矩阵导出模式的模式号对应的是1,则表示当前块的所有最小单元均保存第二帧内预测模式。
表3
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 1 0 0 0
1 0 0 1 1 1 0 1
1 1 0 1 1 1 0 1
基于上述描述,本申请第二分量下的帧内预测模式按照位置保存在对应的最小单元中,这样在确定当前块在第一分量下的目标帧内预测模式时,可以将第一像素点位置对应的最小单元所存储的在第二分量下的帧内预测模式,作为当前块在第一分量下的目标帧内预测模式。
在一些实施例中,若本申请的当前块只包括第一分量而不包括第二分量,例如只包括色度分量而不包括亮度分量,即本申请的当前块为色度块,此时可以通过如下方式确定出当前块在第一分量下的目标帧内预测模式:例如根据已有方式确定出当前块在第一分量下的目标帧内预测模式,例如,根据一个位置找到第二分量下的帧内预测模式,将该找到的第二分量下的帧内预测模式作为当前块在第一分量下的目标帧内预测模式。该目标帧内预测模式包括一种帧内预测模式。
图14为本申请实施例提供的视频编码方式500的另一流程示意图,本申请实施例以第一分量包括至少两种帧内预测模式为例。如图14所示,包括:
S501、获得当前块,当前块包括第一分量和第二分量。例如获得目标图像帧,并对目标图像帧进行块划分,得到当前块,可选的,该当前块还包括第二分量。
S502、确定当前块在第二分量下的至少两种帧内预测模式,以及第二权重矩阵。
在编码端,当编码器确定当前块在第二分量下的至少两种帧内预测模式和第二权重矩阵时,会尝试全部或部分的不同帧内预测模式与不同的权重矩阵的组成,根据各组合的编码代价,将编码代价最小的组合所对应的至少两种帧内预测模式作为当前块在第二分量下的至少两种帧内预测模式,以及将该组合对应的权重矩阵作为第二权重矩阵。
以当前块在第二分量下的至少两种帧内预测模式包括第一帧内预测模式和第二帧内预测模式为例。上述全部可能的情况,包括第一帧内预测模式所有可能的模式、第二帧内预测模式所有可能的模式与权重矩阵导出模式所有可能的模式的组合。假设本申请所有可用的帧内预测模式有66种,第一个帧内预测模式有66种可能,由于第第二帧内预测模式与第一帧内预测模式不同,因此第二帧内预测模式有65种可能。假设权重矩阵导出模式有56种(以AWP为例),那么本神可能使用任意2种不同的帧内预测模式以及任意一种权重矩阵导出模式进行组合,共66×65×56种可能的组合。
在一种可能的方式中,对所有的可能的组合进行率失真优化(rate distortion optimization,简称RDO),确定代价最小的一个组合,将该组合对应的两种帧内预测模式确定为第一帧内预测模式和第二帧内预测模式,将该组合对应的权重矩阵作为第二权重矩阵。
在另一种可能的方式中,对上述所有可能的组合进行初选,如使用绝对误差和(sum of absolute difference,简称SAD),和变换后再绝对值求和(sum of absolute transformed difference,SATD)等作为近似的代价进行初选,确定设 定数量的候选第一帧内预测模式、第二帧内预测模式、权重矩阵导出模式的组合,再进行RDO细选,确定代价最小的一个第一帧内预测模式、第二帧内预测模式、权重矩阵导出模式的组合。可以在初选时使用一些快速算法减少尝试的次数,比如说一个帧内角度预测模式造成代价很大时,与它相邻的几个帧内预测模式都不再尝试等。
上述初选和细选时都会根据第一帧内预测模式确定第一预测块,根据第二帧内预测模式确定第二预测块,根据权重矩阵导出模式导出权重矩阵,根据第一预测块、第二预测块和权重矩阵确定最终预测块。SAD和SATD初选时使用当前块和预测块来确定SAD和SATD。
可选的,编码器也可以先对当前块的纹理进行分析,比如使用梯度进行分析。利用分析的数据帮助初选。比如当前块的纹理中哪一个方向的纹理较强,上述初选时就多选择近似方向的帧内预测模式进行尝试。比如当前块的纹理中哪一个方向的纹理较弱,上述初选时就少选择或不选择近似方向的帧内预测模式进行尝试。
上述所述的编码代价包括第一帧内预测模式、第二帧内预测模式、权重矩阵导出模式在码流中占用的码字的代价,预测残差进行变换量化熵编码等在码流中要传输的各种标志以及量化系数的代价,以及重建块的失真的代价等。
进一步的,编码器将上述确定的当前块在第二分量下的第一帧内预测模式、第二帧内预测模式和第二权重矩阵导出模式的信息按照语法(syntax)写入码流。
S503、使用当前块在第二分量下的至少两种帧内预测模式对当前块进行第二分量帧内预测,得到当前块在第二分量下的每一种帧内预测模式对应的预测块。
S504、根据第二权重矩阵,对当前块在第二分量下的每一种帧内预测模式对应的预测块进行加权处理,得到当前块在第二分量下的最终预测块。
S505、确定当前块在第一分量下的初始帧内预测模式。
S506、在确定当前块在第一分量下的初始帧内预测模式为导出模式时,获得当前块在第二分量下的至少两种帧内预测模式。
S507、根据当前块在第二分量下的至少两种帧内预测模式,确定当前块在第一分量下的至少两种帧内预测模式。例如,直接将当前块在第二分量下的至少两种帧内预测模式作为当前块在第一分量下的至少两种帧内预测模式。
S508、根据第二权重矩阵得到第一权重矩阵。例如,若当前块在第二分量下所包括的像素点总数与当前块在第一分量下所包括的像素点总数相同,则将第二权重矩阵作为第一权重矩阵,若当前块在第一分量下所包括的像素点总数小于当前块在第二分量下所包括的像素点数,则对第二权重矩阵进行下采样,得到第一权重矩阵。或者,根据权重矩阵导出模式,导出第一权重矩阵。
需要说明的是,上述S507与上述S508执行过程没有先后顺序。
S509、使用当前块在第一分量下的至少两种帧内预测模式对当前块进行第一分量帧内预测,得到当前块在第一分量下的每一种帧内预测模式对应的预测块。
S510、根据第一权重矩阵,对当前块在第一分量下的每一种帧内预测模式对应的预测块进行加权处理,得到当前块在第一分量下的最终预测块。
S511、生成码流,所述码流中携带加权预测标识,该加权预测标识用于指示所述第二分量下的预测块是否采用所述至少两种帧内预测模式进行预测。
可选的,该码流中还携带当前块在第二分量下的至少两种帧内预测模式的模式信息。
可选的,该码流中还携带第二权重矩阵的导出模式的模式信息。
可选的,在码流中携带当前块在第一分量下的导出模式的模式信息。
可选的,若第一权重矩阵是根据权重矩阵导出模式确定的,则码流中可以携带第一权重矩阵的导出模式的模式信息。
在一些实施例中,在确定当前块进行第二分量时使用所述至少两种帧内预测模式进行预测,则确定当前块在第一 分量下的初始帧内预测模式为导出模式,例如DM模式。此时,在确定当前块在第一分量下的帧内预测模式为所述导出模式时,在码流中不携带所述导出模式的模式信息。
编码器得到当前块的最终预测块后,执行后续的处理包括量化系数的解码,反变换、反量化确定残差块,以及残差块和预测块组合成重建块,以及后续的环路滤波等。
本申请对第一分量和第二分量均可以通过至少两种帧内预测模式进行预测,可以得到更复杂的预测块,从而能够提升帧内预测的质量,从而提升压缩性能。相比于现有技术既可以进行复杂纹理的预测,又利用通道间的相关性减少了模式信息在码流中的传输,有效地提高了编码效率。
图15为本申请实施例提供的视频编码方式600的另一流程示意图,本申请实施例以第一分量为色度分量,第二分量为亮度分量,当前块在亮度分量下的至少两种帧内预测模式包括第一帧内预测模式和第二帧内预测模式为例,色度分量包括2种帧内预测模式。如图15所示,包括:
S601、获得当前块,当前块包括色度分量和亮度分量。
S602、确定当前块在亮度分量下的第一帧内预测模式和第二帧内预测模式,以及第二权重矩阵。
S603、使用第一帧内预测模式对当前块进行亮度分量帧内预测,得到当前块在亮度分量下的第一预测块,使用第二帧内预测模式对当前块进行亮度分量帧内预测,得到当前块在亮度分量下的第二预测块。
S604、根据第二权重矩阵,对当前块在亮度分量下的第一预测块和第二预测块进行加权运算,得到当前块在亮度分量下的最终预测块。
S605、确定当前块在色度分量下的初始帧内预测模式。
S606、在确定当前块在色度分量下的初始帧内预测模式为导出模式时,获得当前块在亮度分量下的第一帧内预测模式和第二帧内预测模式。
S607、将当前块在亮度分量下的第一帧内预测模式和第二帧内预测模式,确定为当前块在色度分量下的第一帧内预测模式和第二帧内预测模式。
S608、根据当前块在亮度分量下的第二权重矩阵得到当前块在色度分量下的第一权重矩阵。
S609、使用第一帧内预测模式对当前块进行色度分量帧内预测,得到当前块在色度分量下的第一预测块,使用第二帧内预测模式对当前块进行色度分量帧内预测,得到当前块在色度分量下的第二预测块。
S610、根据第一权重矩阵,对当前块在色度分量下的第一预测块和第二预测块进行加权运算,得到当前块在色度分量下的最终预测块。
S611、生成码流,所述码流中携带加权预测标识,所述加权预测标识用于指示所述当前块在亮度分量下的预测块是否采用所述至少两种帧内预测模式进行预测。
可选的,该码流中还携带当前块在亮度分量下的至少两种帧内预测模式的模式信息。
可选的,在码流中携带当前块在色度分量下的导出模式的模式信息。
在一些实施例中,在确定所述当前块的亮度分量使用所述至少两种帧内预测模式进行预测时,则确定当前块在色度分量下的帧内预测模式为所述导出模式。
此时,在确定当前块在色度分量下的帧内预测模式为所述导出模式时,在码流中不携带所述导出模式的模式信息。
编码器得到当前块的最终预测块后,执行后续的处理包括量化系数的解码,反变换、反量化确定残差块,以及残差块和预测块组合成重建块,以及后续的环路滤波等。
上文对本申请实施例涉及的视频编码方法进行了描述,在此基础上,下面针对解码端,对本申请涉及的视频解码方法进行描述。
图16为本申请实施例提供的视频解码方法700的一种流程示意图,如图16所示,本申请实施例的方法包括:
S701、解析码流,得到当前块,以及当前块对应的第二分量下的至少两种帧内预测模式,当前块包括第一分量。
本申请的码流中携带有当前块对应的第二分量下的在帧内预测时所使用的至少两种帧内预测模式的模式信息,解析码流可以获得当前块对应的第二分量下的至少两种帧内预测模式的模式信息,进而获得当前块对应的第二分量下的在帧内预测时所使用的至少两种帧内预测模式。
在一些实施例中,本申请的当前块的大小满足预设条件:
预设条件包括如下任意一种:
条件1,当前块的宽度大于或等于第一预设宽度TH1,且当前块的高度大于或等于第一预设高度TH2;例如,TH1和TH2可以为8,16,32等,可选的,TH1可以等于TH2,比如,设置当前块的高度大于等于8,且宽度大于等于8。
条件2,当前块的像素数大于或等于第一预设数量TH3;TH3的值可以是8,16,32等。
条件3,当前块的宽度小于或等于第二预设宽度TH4,且当前块的高度大于或等于第二预设高度TH5;TH4和TH5的值可以是8,16,32等,TH4可以等于TH5。
条件4,当前块的长宽比为第一预设比值;例如,第一预设比值为如下任意一个:1:1,1:2,2:1,4:1,1:4。
条件5,当前块的大小为第二预设比值;例如,第二预设值为如下任意一个:16×32、32×32、16×64和64×16。
条件6、当前块的高度大于或等于第三预设高度,当前块的宽度大于或等于第三预设宽度,且当前块的宽度与高度之比小于或等于第三预设值,且当前块的高度与宽度之比小于或等于第三预设值。比如当前块的高度大于等于8,且宽度大于等于8,且高度与宽度之比小于或等于4,且宽度与高度之比小于或等于4。
S702、确定当前块在第一分量下的初始帧内预测模式。
具体是,若码流中携带的当前块在第一分量下的初始帧内预测模式不是导出模式时,则采用码流携带的初始帧内预测模式对当前块进行第一分量帧内预测。若码流中携带的当前块在第一分量下的初始帧内预测模式是导出模式时,执行S703。若码流中没有携带当前块在第一分量下的初始帧内预测模式的模式信息,则默认当前块在第一分量下的初始帧内预测模式是导出模式,执行S703。
S703、在初始帧内预测模式为导出模式时,根据当前块对应的第二分量下的至少两种帧内预测模式,确定当前块在第一分量下的目标帧内预测模式。
在一些实施例中,目标帧内预测模式包括至少两种帧内预测模式,此时,上述S703包括但不限于如下几种:
方式一,将第二分量下的至少两种帧内预测模式,作为目标帧内预测模式。方式二,根据第二分量下的至少两种
帧内预测模式,导出目标帧内预测模式。
在一些实施例中,目标帧内预测模式还可能包括一种帧内预测模式,此时,上述S404包括但不限于如下几种方式:
方式一,将第二分量下的至少两种帧内预测模式中的一个帧内预测模式,作为目标帧内预测模式。例如第二分量包括第一帧内预测模式和第二帧内预测模式,则固定将第一帧内预测模式作为目标帧内预测模式,或者,固定将第二帧内预测模式作为目标帧内预测模式。
方式二,根据第二分量下的至少两种帧内预测模式导出一种帧内预测模式,将该导出的一种帧内预测模式作为目标帧内预测模式。例如,第一分量使用比第二分量更大间隙的角度,也就是说几个亮度帧内预测模式均可能导出同一个色度帧内预测模式。
方式三,根据当前块的第一像素点位置所对应的第二分量下的帧内预测模式,确定目标帧内预测模式。
方式三的一种可能的方式,若第一像素点位置对应的第二分量下的预测块完全由一个帧内预测模式预测得到,则将该一个帧内预测模式作为目标帧内预测模式。
方式三的一种可能的方式,若第一像素点位置对应的第二分量下的预测块由多个帧内预测模式预测得到,则将多 个帧内预测模式中权重值最大的帧内预测模式作为目标帧内预测模式。
方式三的一种可能的方式,将第一像素点位置对应的最小单元中所存储的第二分量下的帧内预测模式,作为目标帧内预测模式。其中,若第一像素点位置对应的第二分量下的预测块完全由一种帧内预测模式预测得到,则最小单元中存储一种帧内预测模式的模式信息。若第一像素点位置对应的第二分量下的预测块由多种帧内预测模式预测得到,则最小单元存储多种帧内预测模式中对应的权重值最大的帧内预测模式的模式信息。
S704、使用目标帧内预测模式,对当前块进行第一分量帧内预测,得到当前块在第一分量下的最终预测块。
在当前块在第一分量下的目标帧内预测模式包括至少两种帧内预测模式时,此时上述S704包括:
S704-A1、使用当前块在第一分量下的至少两种帧内预测模式中每一种帧内预测模式对当前块进行第一分量帧内预测,获得每一种帧内预测模式对应的预测块。
S704-A2、根据每一种帧内预测模式对应的预测块,确定当前块在第一分量下的最终预测块。
在一种实现方式中,上述S704-A2包括S704-A21和S704-A22:
S704-A21、确定第一权重矩阵;
S704-A22、根据第一权重矩阵,对每一种帧内预测模式对应的预测块进行加权运算,得到当前块在第一分量下的最终预测块。
在一种可能的实现方式中,根据权重矩阵导出模式,导出第一权重矩阵。
在一种可能的实现方式中,第一权重矩阵由第二分量下的权重矩阵(即第二权重矩阵)推动出,此时上述S704-A21包括:
S704-A211、获得当前块在第二分量下的第二权重矩阵;
S704-A212、根据第二权重矩阵获得第一权重矩阵。
在一种示例中,第二权重矩阵包括至少两个不同的权重值。例如,最小权重值是0,最大权重值是8,则该第二权重矩阵中有的点的权重值0,有的点的权重值为8,有的点为的权重值为0至8中的任意值,例如为2。
在一种示例中,第二权重矩阵中的所有权重值均相同。例如最小权重值为0,最大权重值为8,则第二权重矩阵中所有点的权重值为位于最小权重值与最大权重值之间的一数值,例如为4。
在一种示例中,第二权重矩阵中的每一个权重值所对应像素点在第二分量下的预测值由第二分量下的至少两个帧内预测模式预测得到。
在一种示例中,第二分量下的至少两种帧内预测模式包括N种帧内预测模式,N为大于或等于2的正整数,第二权重矩阵包括N种不同的权重值,第i种权重值指示第i种权重值对应像素点在第二分量下的预测值完全由第i种帧内预测模式得到,i为大于或等于2且小于或等于N的正整数。
在一种示例中,第二分量下的至少两种帧内预测模式包括第一帧内预测模式和第二帧内预测模式,第二权重矩阵:包括最大权重值(例如8)、最小权重值(例如0)和至少一个中间权重值,其中,最大权重值用于指示对应像素点在第二分量下的预测值完全由第一帧内预测模式预测得到;最小权重值用于指示对应像素点在第二分量下的预测值完全由第二帧内预测模式预测得到;中间权重值用于指示对应像素点在第二分量下的预测值由第一帧内预测模式和第二帧内预测模式预测得到。可选的,最大权重值或最小权重值组成的区域可以叫做过渡区域(blending area)。
在一种示例中,第二权重矩阵包括多种权重值,权重值变化的位置构成一条直线或曲线。
在一种示例中,第二权重矩阵为AWP模式或GPM模式对应的权重矩阵。
在获得第二权重矩阵后,执行上述S704-A212根据第二权重矩阵获得第一权重矩阵,本申请中根据第二权重矩阵获得第一权重矩阵的方式包括但不限于如下几种:
方式一,若当前块在第二分量下所包括的像素点总数与当前块在第一分量下所包括的像素点总数相同,则将第二权重矩阵作为第一权重矩阵。
方式二,若当前块在第一分量下所包括的像素点总数小于当前块在第二分量下所包括的像素点数,则对第二权重矩阵进行下采样,得到所述第一权重矩阵。例如,根据当前块在第一分量下所包括的像素点总数与当前块在第二分量下所包括的像素点数,对第二权重矩阵进行下采样,得到第一权重矩阵。
在一种实施例中,第一分量包括第一子分量和第二子分量。
针对第一子分量,上述步骤S704-A1包括:使用当前块在第一分量下的至少两种帧内预测模式中每一种帧内预测模式对当前块进行第一子分量帧内预测,获得当前块在第一子分量下关于每一种帧内预测模式的预测块。对应的,上述S704-A22包括:根据第一权重矩阵,对当前块在第一子分量下关于每一种帧内预测模式的预测块进行加权运算,得到当前块在第一子分量下的最终预测块;
例如,使用第一帧内预测模式对当前块进行第一子分量帧内预测,得到当前块在第一子分量的第一预测块,使得第二帧内预测模式对当前块进行第一分量帧内预测,得到当前块在第一子分量下的第二预测块。接着,根据第一权重矩阵,对当前块在第一子分量下的第一预测块和第二预测块进行加权运算,得到当前块在第一子分量下的最终预测块。
在一种具体的示例中,根据上述公式(2)得到当前块在第一子分量下的最终预测块:
针对第二子分量,上述步骤S704-A1包括:使用当前块在第一分量下的至少两种帧内预测模式中每一种帧内预测模式对当前块进行第二子分量帧内预测,获得当前块在第二子分量下关于每一种帧内预测模式的预测块。对应的,上述S704-A22包括:根据第一权重矩阵,对当前块在第二子分量下关于每一种帧内预测模式的预测块进行加权运算,得到当前块在第二子分量下的最终预测块;
例如,使用第一帧内预测模式对当前块进行第二子分量帧内预测,得到当前块在第二子分量下的第一预测块,使得第二帧内预测模式对当前块进行第二分量帧内预测,得到当前块在第二子分量下的第二预测块。接着,根据第一权重矩阵,对当前块在第二子分量下的第一预测块和第二预测块进行加权运算,得到当前块在第二子分量下的最终预测块。
在一种具体的示例中,根据上述公式(3)得到当前块在第二子分量下的最终预测块。
其中解码端的部分步骤与上述编码端的相同,参照上述编码端的描述,在此不再赘述。
解码器得到当前块的最终预测块后,执行后续的处理包括量化系数的解码,反变换、反量化确定残差块,以及残差块和预测块组合成重建块,以及后续的环路滤波等。
图17为本申请实施例提供的视频解码方法800的一种流程示意图,如图17所示,本申请实施例的方法包括:
S801、解析码流,判断当前块是否进行帧内预测,当前块包括第一分量和第二分量。
S802、若确定当前块进行帧内预测,则解析加权预测标识,其中加权预测标识用于指示第二分量下的预测块是否采用所述至少两种帧内预测模式进行预测得到。
S803、若该加权预测标识用于指示第二分量下的预测块采用至少两种帧内预测模式进行预测得到,则解析当前块进行第二分量帧内预测时所使用的至少两种帧内预测模式和第二权重矩阵的导出模式信息。
S804、使用当前块在第二分量下的至少两种帧内预测模式对当前块进行第二分量预测,得到当前块在第二分量下的每一种帧内预测模式对应的预测块。
S805、根据第二权重矩阵的导出模式信息,获得第二权重矩阵。
需要说明的是,上述S804与上述S805执行过程没有先后顺序。
S806、根据第二权重矩阵,对当前块在第二分量下的每一种帧内预测模式对应的预测块进行加权处理,得到当前块在第二分量下的最终预测块。
S807、确定当前块在第一分量下的初始帧内预测模式,具体是,若码流中携带的当前块在第一分量下的初始帧内预测模式不是导出模式时,则采用码流携带的当前块在第一分量下的初始帧内预测模式对第一分量进行帧内预测。若 码流中携带的当前块在第一分量下的初始帧内预测模式是导出模式时,执行S808。若码流中没有携带当前块在第一分量下的初始帧内预测模式的模式信息,则默认当前块在第一分量下的初始帧内预测模式是导出模式,执行S808。
S808、在初始帧内预测模式为导出模式时,根据当前块在第二分量下的至少两种帧内预测模式,确定当前块在第一分量下的至少两种帧内预测模式。例如,直接将第二分量下的至少两种帧内预测模式作为当前块在第一分量下的至少两种帧内预测模式。
S809、根据第二权重矩阵,确定第一权重矩阵,例如,若当前块在第二分量下所包括的像素点总数与当前块在第一分量下所包括的像素点总数相同,则将第二权重矩阵作为第一权重矩阵,若当前块在第一分量下所包括的像素点总数小于当前块在第二分量下所包括的像素点数,则对第二权重矩阵进行下采样,得到第一权重矩阵。
需要说明的是,上述S808与上述S809执行过程没有先后顺序。
S810、使用当前块在第一分量下的至少两种帧内预测模式对当前块进行第一分量帧内预测,得到当前块在第一分量下的每一种帧内预测模式对应的预测块。
S811、根据第一权重矩阵,对当前块在第一分量下的每一种帧内预测模式对应的预测块进行加权处理,得到当前块在第一分量下的最终预测块。
图18为本申请实施例提供的视频解码方法900的一种流程示意图,本申请实施例以第一分量为色度分量,第二分量为亮度分量,亮度分量下的至少两种帧内预测模式包括第一帧内预测模式和第二帧内预测模式为例,色度分量包括2种帧内预测模式。如图18所示,本申请实施例的方法包括:
S901、解析码流,判断当前块是否进行帧内预测,当前块包括亮度分量和色度分量。
S902、若确定当前块进行帧内预测,则解析加权预测标识,其中加权预测标识用于指示亮度分量对应的预测块是否采用2种帧内预测模式进行预测。
在一种示例中,将本申请的技术叫做SAWP(Spatial Angular Weighted Prediction,空域角度加权预测),可以在码流中携带一个序列级的标志(flag)来确定当前块是否使用SAWP技术。比如:序列头定义见表4。
表4
其中,sawp_enable_flag为空域角度加权预测允许标志,为二值变量。值为‘1’表示可使用空域角度加权预测;值为‘0’表示不应使用空域角度加权预测。SawpEnableFlag的值等于sawp_enable_flag。如果码流中不存在sawp_enable_flag,SawpEnableFlag的值为0。
可选的,可以有一个帧级的标志来确定当前待解码帧是否使用SAWP技术,如可以配置帧内帧(如I帧)使用SAWP技术,帧间帧(如B帧、P帧)不使用SAWP技术。或者可以配置帧内帧不使用SAWP技术,帧间帧使用SAWP技术。或者可以配置某些帧间帧使用SAWP技术,某些帧间帧不适用SAWP技术。
可选的,可以有一个帧级以下、CU级以上(如tile、slice、patch、LCU等)的标志来确定这一区域是否使用SAWP技术。
例如,解码器执行如下程序:
其中,intra_cu_flag为帧内预测标识,sawp_flag为加权预测标识,为二值变量,值为‘1’表示应进行空域角度加权预测,即亮度分量包括至少两种帧内预测模式;值为‘0’表示不应进行空域角度加权预测,即亮度分量不包括至少两种帧内预测模式。SawpFlag的值等于sawp_flag的值。如果码流中不存在sawp_flag,则SawpFlag的值为0。
具体的,解码器解码当前块,如果确定当前块使用帧内预测,则解码当前块的SAWP使用标志(即sawp_flag的值)。否则不需要解码当前块的SAWP使用标志。可选的,如果当前块使用SAWP,那么不需要处理DT、IPF相关的信息,因为它们与SAWP互斥。
S903、若该加权预测标识用于指示亮度分量采用2种帧内预测模式进行预测,则解析当前块进行亮度分量帧内预测时所使用的第一帧内预测模式、第二帧内预测模式和第二权重矩阵的导出模式信息。
若该加权预测标识用于指示亮度分量采用2种帧内预测模式进行预测,则解码器解析当前块进行亮度分量帧内预测时所使用的第一帧内预测模式、第二帧内预测模式和第二权重矩阵的导出模式信息。
在一些实施例中,解码器执行如下程序,得到当前块在亮度分量下的第一帧内预测模式、第二帧内预测模式的模式信息:
其中,sawp_idx为第二权重矩阵的导出模式信息,SawpIdx的值等于sawp_idx的值。如果位流中不存在sawp_idx,SawpIdx的值等于0,intra_luma_pred_mode0为当前块在亮度分量下的第一帧内预测模式的模式信息,intra_luma_pred_mode1为当前块在亮度分量下的第二帧内预测模式的模式信息。
本步骤中sawp_idx解析方法和awp_idx相同。intra_luma_pred_mode0的解析方法与intra_luma_pred_mode相同,intra_luma_pred_mode1的解析方法与intra_luma_pred_mode相同。可选的,因为AVS3的MPM只有2个,如果intra_luma_pred_mode0和intra_luma_pred_mode1均使用了MPM,如果intra_luma_pred_mode0使用了其中一个,那么intra_luma_pred_mode1不需要再去解析是MPM的第一个还是第二个模式,intra_luma_pred_mode1默认使用另一个。
在一些实施例中,解码器执行如下程序,得到当前块在亮度分量下的第一帧内预测模式、第二帧内预测模式的模式信息和第二权重矩阵的导出模式信息:
具体的,解码器解码当前块,如果当前块使用帧内预测,解码当前块的DT、IPF的使用标志,以及当前方法中每个预测单元唯一的亮度预测模式intra_luma_pred_mode。如果当前块没有使用DT也没有使用IPF,那么解码当前块的SAWP使用标志。如果当前块使用SAWP,那么需要解码第二权重矩阵的导出模式和intra_luma_pred_mode1,将intra_luma_pred_mode作为当前块在亮度分量下的第一帧内预测模式的模式信息,将intra_luma_pred_mode1作为当前块在亮度分量下的第二帧内预测模式的模式信息。
分别根据intra_luma_pred_mode0和intra_luma_pred_mode1确定IntraLumaPredMode0和IntraLumaPredMode1,查表1可以得到当前块在亮度分量下的第一帧内预测模式和第二帧内预测模式。
需要说明的是,由于AVS3的第一个版本只支持34种帧内预测模式,例如图8所示,如果索引从0开始的话,则第34种模式是PCM模式。而AVS3第二个版本中加入了更多的帧内预测模式,扩展到66种帧内预测模式,如图10所示。第二个版本为了与第一个版本兼容,并没有改变原有的intra_luma_pred_mode的解码方法,而是如果intra_luma_pred_mode大于1,需要再增加一个标志位,即eipm_pu_flag。
其中eipm_pu_flag为帧内亮度预测模式扩展标志,为二值变量。当值为‘1’表示应使用帧内角度预测扩展模式;值为‘0’表示不使用帧内亮度预测扩展模式。EipmPuFlag的值等于eipm_pu_flag的值。如果码流中不存在eipm_pu_flag,则EipmPuFlag的值等于0。
所以如果是对应AVS3第二个版本的文本描述,上面的语法intra_luma_pred_mode,intra_luma_pred_mode0,intra_luma_pred_mode1均应加入eipm_pu_flag,eipm_pu_flag0,eipm_pu_flag1的描述。而IntraLumaPredMode0根据intra_luma_pred_mode0和eipm_pu_flag0确定,IntraLumaPredMode1根据intra_luma_pred_mode1和eipm_pu_flag1确定。
S904、使用第一帧内预测模式对当前块进行亮度分量帧内预测,得到当前块在亮度分量下的第一预测块,使用第二帧内预测模式对当前块进行亮度分量帧内预测,得到当前块在亮度分量下的第二预测块。
S905、根据第二权重矩阵的导出模式信息,获得第二权重矩阵。
例如,解码器执行如下程序得到当前块在亮度分量下的第二权重矩阵:
其中,M和N是当前块的宽度和高度,AwpWeightArrayY为亮度分量Y的第二权重矩阵,其中,参考权重ReferenceWeights[x]可以根据如下程序得到:
需要说明的是,上述S904与上述S905执行过程没有先后顺序。
S906、根据第二权重矩阵,对当前块在亮度分量下的第一预测块和第二预测块进行加权运算,得到当前块在亮度分量下的最终预测块。
在一种示例中,根据如下公式(4),得到当前块在亮度分量下的最终预测块:
其中,Y为亮度分量,predMatrixSawpY[x][y]为亮度分量中的像素点[x][y]在亮度分量下的最终预测值,predMatrixY0[x][y]为像素点[x][y]在当前块在亮度分量下的第一预测块中对应的第一预测值,predMatrixY1[x][y]为像素点[x][y]在当前块在亮度分量下的第二预测块中对应的第二预测值,AwpWeightArrayY[x][y]为predMatrixY0[x][y]在第二权重矩阵AwpWeightArrayY中对应的权重值。
S907、确定当前块在色度分量下的初始帧内预测模式,具体是,若码流中携带的当前块在色度分量下的初始帧内预测模式不是导出模式时,则采用码流携带的当前块在色度分量下的初始帧内预测模式对当前块进行色度分量帧内预测。若码流中携带的当前块在色度分量下的初始帧内预测模式是导出模式时,执行S908。
若码流中没有携带当前块在色度分量下的初始帧内预测模式的模式信息,则默认当前块在色度分量下的初始帧内预测模式是导出模式,执行S908。
在一些实施例中,本申请在确定当前块在色度分量下的帧内预测模式的IntraChromaPredMode时,执行如下过程:
1)如果当前块的SawpFlag为1,(即当前块使用本申请的技术方案),isRedundant等于0。跳到第3)步。否则进入第2)步。
2)如果当前块中PredBlockOrder的值为0的预测块的亮度预测模式IntraLumaPredMode等于0、2、12或24,则isRedundant等于1;否则isRedundant等于0。
3)如果tscpm_enable_flag的值等于‘1’或pmc_enable_flag的值等于‘1’,且intra_chroma_pred_mode的值等于1,则IntraChromaPredMode等于(5+IntraChromaEnhancedMode+3*IntraChromaPmcFlag);
4)否则,
·如果tscpm_enable_flag的值等于‘1’且intra_chroma_pred_mode的值不等于0,则intra_chroma_pred_mode的值减1;
·如果isRedundant等于0,IntraChromaPredMode等于intra_chroma_pred_mode;否则,依次执行以下操作:
如果IntraLumaPredMode等于0,则predIntraChromaPredMode等于1;如果IntraLumaPredMode等于2,则predIntraChromaPredMode等于4;如果IntraLumaPredMode等于12,则predIntraChromaPredMode等于3;如果IntraLumaPredMode等于24,则predIntraChromaPredMode等于2。
如果intra_chroma_pred_mode的值等于0,则IntraChromaPredMode等于0;否则,如果intra_chroma_pred_mode的值小于predIntraChromaPredMode,则IntraChromaPredMode等于intra_chroma_pred_mode; 否则IntraChromaPredMode等于intra_chroma_pred_mode加1。
a)根据IntraChromaPredMode的值,查表2得到当前块在色度分量下的帧内预测模式。
如果当前块的SawpFlag为1且IntraChromaPredMode等于0,当前块在色度分量下的帧内预测模式为Intra_Chroma_DM,而不是PCM。
本申请中,若当前块在第一分量下使用至少两种帧内预测模式来确定预测块,此时后续的当前块在第一分量下的帧内预测模式不会再出现冗余的模式,在帧内色度预测模式的二值化时不需要检查和去除冗余模式,即不需要执行上述第2)步。
S908、在确定当前块在色度分量下的初始帧内预测模式为导出模式时,将当前块在亮度分量下的第一帧内预测模式和第二帧内预测模式,确定为当前块在色度分量下的第一帧内预测模式和第二帧内预测模式。
S909、根据第二权重矩阵,确定第一权重矩阵。
例如,若当前块在亮度分量下与当前块在色度分量下所包括的像素点总数相同,则将第二权重矩阵作为第一权重矩阵。
若当前块在色度分量下所包括的像素点总数小于当前块在亮度分量下所包括的像素点数,则对第二权重矩阵进行下采样,得到第一权重矩阵。
例如,YUV4:2:0,则解码器执行如下程序得到第一权重矩阵:
其中,AwpWeightArrayUV为第一权重矩阵,AwpWeightArrayY为第二权重矩阵。
需要说明的是,上述S908与上述S908执行过程没有先后顺序。
S910、使用第一帧内预测模式对当前块进行色度分量帧内预测,得到当前块在色度分量下的第一预测块,使用第二帧内预测模式对当前块进行色度分量帧内预测,得到当前块在色度分量下的第二预测块。
S911、根据第一权重矩阵,对当前块在色度分量下的第一预测块和第二预测块进行加权运算,得到当前块在色度分量下的最终预测块。
例如,色度分量包括U分量和V分量,则可以根据如下公式(5)确定出当前块在U分量下的最终预测预测块:
其中,predMatrixSawpU[x][y]为U分量中的像素点[x][y]在U分量下的最终预测值,predMatrixU0[x][y]为像素点[x][y]在当前块下U分量下的第一预测块中对应的第一预测值,predMatrixU1[x][y]为像素点[x][y]在当前块下U分量下的第二预测块中对应的第二预测值,AwpWeightArrayUV[x][y]为predMatrixU0[x][y]在第一权重矩阵AwpWeightArrayUV中对应的权重值。
根据如下公式(6)确定出当前块在V分量下的最终预测预测块:
其中,predMatrixSawpV[x][y]为V分量中的像素点[x][y]在V分量下的最终预测值,predMatrixV0[x][y]为像素点[x][y]在当前块在V分量下的第一预测块中对应的第一预测值,predMatrixV1[x][y]为像素点[x][y]在当前块在V分量下的第二预测块中对应的第二预测值,AwpWeightArrayUV[x][y]为predMatrixV0[x][y]在第一权重矩阵AwpWeightArrayUV中对应的权重值。
最后解码器,执行后续的处理包括量化系数的解码,反变换、反量化确定残差块,以及残差块和预测块组合成重建块,以及后续的环路滤波等。
应理解,图12、图14至图18仅为本申请的示例,不应理解为对本申请的限制。
以上结合附图详细描述了本申请的优选实施方式,但是,本申请并不限于上述实施方式中的具体细节,在本申请的技术构思范围内,可以对本申请的技术方案进行多种简单变型,这些简单变型均属于本申请的保护范围。例如,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本申请对各种可能的组合方式不再另行说明。又例如,本申请的各种不同的实施方式之间也可以进行任意组合,只要其不违背本申请的思想,其同样应当视为本申请所公开的内容。
还应理解,在本申请的各种方法实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。另外,本申请实施例中,术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系。具体地,A和/或B可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
上文结合图14至图18,详细描述了本申请的方法实施例,下文结合图19至图21,详细描述本申请的装置实施例。
图19是本申请实施例提供的视频编码器10的示意性框图。
如图19所示,视频编码器10包括:
第一获取单元11,用于获得当前块,所述当前块包括第一分量;
第一确定单元12,用于确定所述当前块在所述第一分量下的初始帧内预测模式;
第二获取单元13,用于在初始帧内预测模式为导出模式时,获得当前块对应的第二分量下的至少两种帧内预测模式;
第二确定单元14,用于根据所述第二分量下的至少两种帧内预测模式,确定所述当前块在第一分量下的目标帧内预测模式;
预测单元15,用于使用所述目标帧内预测模式,对所述当前块进行所述第一分量帧内预测,获得所述当前块在所述第一分量下的最终预测块。
在一些实施例中,所述目标帧内预测模式包括至少两种帧内预测模式。
在一种示例中,上述第二确定单元14,具体用于将所述第二分量下的至少两种帧内预测模式,作为所述当前块在所述第一分量下的目标帧内预测模式。
在一种示例中,上述第二确定单元14,具体用于根据所述第二分量下的至少两种帧内预测模式,导出所述当前块在所述第一分量下的目标帧内预测模式。
此时,预测单元15,具体用于使用所述当前块在所述第一分量下的至少两种帧内预测模式中每一种帧内预测模式对所述当前块进行第一分量帧内预测,获得所述每一种帧内预测模式对应的预测块;根据所述每一种帧内预测模式对应的预测块,获得所述当前块在所述第一分量下的最终预测块。
在一些实施例中,预测单元15,具体用于确定第一权重矩阵;根据所述第一权重矩阵,对所述每一种帧内预测模式对应的预测块进行加权运算,得到所述当前块在所述第一分量下的最终预测块。
在一些实施例中,预测单元15,具体用于根据权重矩阵导出模式,导出第一权重矩阵。
在一些实施例中,预测单元15,具体用于获得当前块在所述第二分量下的第二权重矩阵:若所述当前块在第二分量下所包括的像素点总数与所述当前块在第一分量下所包括的像素点总数相同,则将所述第二权重矩阵作为所述第一权重矩阵;若当前块在第一分量下所包括的像素点总数小于当前块在第二分量下所包括的像素点数,则对第二权重矩阵进行下采样,得到第一权重矩阵。
在一些实施例中,预测单元15,具体用于根据所述当前块在第一分量下所包括的像素点总数与所述当前块在第二分量下所包括的像素点数,对所述第二权重矩阵进行下采样,得到所述第一权重矩阵。
可选的,所述第二权重矩阵包括至少两个不同的权重值。
可选的,所述第二权重矩阵中的所有权重值均相同。
可选的,所述第二权重矩阵中的每一个权重值所对应的像素点在所述第二分量下的预测值由所述第二分量下的至少两个帧内预测模式预测得到。
可选的,所述第二分量下的至少两种帧内预测模式包括N种帧内预测模式,所述N为大于或等于2的正整数,所述第二权重矩阵包括N种不同的权重值,第i种权重值指示所述第i种权重值对应的像素点在所述第二分量下的预测值完全由第i种帧内预测模式得到,所述i为大于或等于2且小于或等于所述N的正整数。
可选的,
所述第二分量下的至少两种帧内预测模式包括第一帧内预测模式和第二帧内预测模式,所述第二权重矩阵:包括最大权重值、最小权重值和至少一个中间权重值,
所述最大权重值用于指示对应像素点在所述第二分量下的预测值完全由第一帧内预测模式预测得到;所述最小权重值用于指示对应像素点在所述第二分量下的预测值完全由第二帧内预测模式预测得到;所述中间权重值用于指示对应像素点在所述第二分量下的预测值由所述第一帧内预测模式和所述第二帧内预测模式预测得到。
可选的,所述第二权重矩阵包括多种权重值,权重值变化的位置构成一条直线或曲线。
可选的,所述第二权重矩阵为所述AWP模式或所述GPM模式对应的权重矩阵。
在一些实施例中,所述目标帧内预测模式包括一种帧内预测模式。
在一种示例中,第二确定单元14,具体用于将所述第二分量下的至少两种帧内预测模式中的一个帧内预测模式,作为所述目标帧内预测模式。
在一种示例中,第二确定单元14,具体用于根据所述当前块的第一像素点位置所对应的第二分量下的帧内预测模式,确定所述目标帧内预测模式。
在一种示例中,第二确定单元14,具体用于若所述第一像素点位置对应的第二分量下的预测值完全由一个帧内预测模式预测得到,则将所述一个帧内预测模式作为所述目标帧内预测模式;若所述第一像素点位置对应的第二分量下的预测值由多个帧内预测模式预测得到,则将所述多个帧内预测模式中权重值最大的帧内预测模式作为所述目标帧内预测模式。
在一种示例中,第二确定单元14,具体用于将所述第一像素点位置对应的最小单元中所存储的所述第二分量下的帧内预测模式,作为所述目标帧内预测模式。
可选的,若所述第一像素点位置对应的所述第二分量下的预测值完全由一种帧内预测模式预测得到,则所述最小单元中存储所述一种帧内预测模式的模式信息;若所述第一像素点位置对应的所述第二分量下的预测值由多种帧内预测模式预测得到,则所述最小单元存储所述多种帧内预测模式中对应的权重值最大的帧内预测模式的模式信息。
在一些实施例中,所述第一分量包括第一子分量和第二子分量,此时预测单元15,具体用于使用所述当前块在所述第一分量下的至少两种帧内预测模式中每一种帧内预测模式对所述当前块进行所述第一子分量帧内预测,获得所述当前块在所述第一子分量下关于所述每一种帧内预测模式的预测块;使用所述当前块在所述第一分量下的至少两种帧内预测模式中每一种帧内预测模式对所述当前块进行所述第二子分量进行预测,获得所述当前块在所述第二子分量下关于所述每一种帧内预测模式的预测块。
[根据细则91更正 27.12.2021] 在一种示例中,预测单元15,具体用于根据所述第一权重矩阵,对所述当前块在所述第一子分量下关于所述每一种帧内预测模式的预测块进行加权运算,得到所述当前块在所述第一子分量下的最终预测块;根据所述第一权重矩 阵,对所述当前块在所述第二子分量下关于所述每一种帧内预测模式的预测块进行加权运算,得到所述当前块在所述第二子分量下的最终预测块。
在一种示例中,预测单元15,具体用于根据如下公式得到所述当前块在所述第一子分量下的最终预测块:
predMatrixSawpA[x][y]=(predMatrixA0[x][y]*AwpWeightArrayAB[x][y]+predMatrixA1[x][y]*(2 n-AwpWeightArrayAB[x][y])+2 n-1)>>n;
其中,所述A为第一子分量,所述predMatrixSawpA[x][y]为所述第一子分量中的像素点[x][y]在所述第一子分量下的最终预测值,所述predMatrixA0[x][y]为像素点[x][y]在所述当前块在所述第一子分量下的第一预测块中对应的第一预测值,所述predMatrixA1[x][y]为像素点[x][y]在所述当前块在所述第一子分量下的第二预测块中对应的第二预测值,所述AwpWeightArrayAB[x][y]为predMatrixA0[x][y]在所述第一权重矩阵AwpWeightArrayAB中对应的权重值,2 n为预设的权重之和,n为正整数。
在一种示例中,预测单元15,具体用于
根据如下公式得到所述当前块在所述第二子分量下的最终预测块:
predMatrixSawpB[x][y]=(predMatrixB0[x][y]*AwpWeightArrayAB[x][y]+predMatrixB1[x][y]*(2 n-AwpWeightArrayAB[x][y])+2 n-1)>>n;
其中,所述B为第二子分量,所述predMatrixSawpB[x][y]为所述第二子分量中的像素点[x][y]在所述第二子分量下的最终预测值,所述predMatrixB0[x][y]为像素点[x][y]在所述当前块在所述第二子分量下的第一预测块中对应的第一预测值,所述predMatrixB1[x][y]为像素点[x][y]在所述当前块在所述第二子分量下的第二预测块中对应的第二预测值,所述AwpWeightArrayAB[x][y]为所述predMatrixB0[x][y]在所述第一权重矩阵AwpWeightArrayAB中对应的权重值,2 n为预设的权重之和,n为正整数。
在一种示例中,预测单元15,还用于生成码流,所述码流中携带加权预测标识,所述加权预测标识用于指示所述第二分量下的预测块是否采用所述至少两种帧内预测模式进行预测。
在一些实施例中,第一确定单元12,具体用于在确定所述第二分量下的预测块使用所述至少两种帧内预测模式进行预测时,则确定所述当前块在所述第一分量下的所述初始帧内预测模式为所述导出模式。
在一些实施例中,所述码流中还携带第二分量下的至少两种帧内预测模式的模式信息。
在一些实施例中,所述码流中还携带所述第二权重矩阵的导出模式信息。
在一些实施例中,所述当前块的大小满足预设条件。
所述预设条件包括如下任意一种或多种:
条件1,所述当前块的宽度大于或等于第一预设宽度TH1,且所述当前块的高度大于或等于第一预设高度TH2;
条件2,所述当前块的像素数大于或等于第一预设数量TH3;
条件3,所述当前块的宽度小于或等于第二预设宽度TH4,且所述当前块的高度大于或等于第二预设高度TH5;
条件4,所述当前块的长宽比为第一预设比值;
条件5,所述当前块的大小为第二预设比值;
条件6、所述当前块的高度大于或等于第三预设高度,所述当前块的宽度大于或等于第三预设宽度,且当前块的宽度与高度之比小于或等于第三预设值,且当前块的高度与宽度之比小于或等于第三预设值。
可选的,所述第一预设比值为如下任意一个:1:1、2:1、1:2、1:4、4:。
可选的,所述第二预设值为如下任意一个:16×32、32×32、16×64和64×16。
可选的,所述第一分量为亮度分量,所述第二分量为色度分量。
可选的,所述色度分量为UV分量,所述第一子分量为U分量,所述第二子分量为V分量。
应理解,装置实施例与方法实施例可以相互对应,类似的描述可以参照方法实施例。为避免重复,此处不再赘述。 具体地,图19所示的视频编码器10可以执行本申请实施例的方法,并且视频编码器10中的各个单元的前述和其它操作和/或功能分别为了实现方法400、500和600等各个方法中的相应流程,为了简洁,在此不再赘述。
图20是本申请实施例提供的视频解码器20的示意性框图。
如图20所示,该视频解码器20可包括:
解析单元21,用于解析码流,得到当前块,以及所述当前块对应的第二分量下的至少两种帧内预测模式,所述当前块包括第一分量;
第一确定单元22,用于确定所述当前块在所述第一分量下的初始帧内预测模式;
第二确定单元23,用于在确定所述初始帧内预测模式为导出模式时,根据所述第二分量下的至少两种帧内预测模式,确定所述当前块在所述第一分量下的目标帧内预测模式;
预测单元24,用于使用所述目标帧内预测模式,对所述当前块进行所述第一分量帧内预测,获得所述当前块在所述第一分量下的最终预测块。
在一些实施例中,所述码流中携带加权预测标识,所述加权预测标识用于指示所述第二分量下的预测块是否采用所述至少两种帧内预测模式进行预测。
可选的,所述码流中携带所述当前块在所述第一分量下的初始帧内预测模式的模式信息。
第一确定单元22,具体用于在所述码流中携带所述加权预测标识,且不携带所述当前块在所述第一分量下的初始帧内预测模式的模式信息时,则确定所述当前块在所述第一分量下的初始帧内预测模式为所述导出模式。
在一些实施例中,所述目标帧内预测模式包括至少两种帧内预测模式。
在一种示例中,第二确定单元23,具体用于将所述第二分量下的至少两种帧内预测模式,作为目标帧内预测模式。
在一种示例中,第二确定单元23,具体用于根据所述第二分量下的至少两种帧内预测模式,导出目标帧内预测模式。
此时,预测单元24,具体用于使用所述当前块在所述第一分量下的至少两种帧内预测模式中每一种帧内预测模式对所述当前块进行所述第一分量帧内预测,获得所述每一种帧内预测模式对应的预测块;根据所述每一种帧内预测模式对应的预测块,确定所述当前块在所述第一分量下的最终预测块。
在一些实施例中,预测单元24,具体用于确定第一权重矩阵;根据所述第一权重矩阵,对所述每一种帧内预测模式对应的预测块进行加权运算,得到所述当前块在所述第一分量下的最终预测块。
在一些实施例中,预测单元24,具体用于根据权重矩阵导出模式,确定第一权重矩阵。
在一些实施例中,预测单元24,具体用于获得当前块在所述第二分量下的第二权重矩阵;若所述当前块在第二分量下所包括的像素点总数与所述当前块在第一分量下所包括的像素点总数相同,则将所述第二权重矩阵作为所述第一权重矩阵;若所述当前块在第一分量下所包括的像素点总数小于所述当前块在第二分量下所包括的像素点数,则对所述第二权重矩阵进行下采样,得到所述第一权重矩阵。
在一些实施例中,预测单元24,具体用于从所述码流中获得所述第二权重矩阵的导出模式信息;根据所述第二权重矩阵的导出模式信息,获得所述第二权重矩阵。
在一些实施例中,预测单元24,具体用于根据所述当前块在第一分量下所包括的像素点总数与所述当前块在第二分量下所包括的像素点数,对所述第二权重矩阵进行下采样,得到所述第一权重矩阵。
可选的,所述第二权重矩阵包括至少两个不同的权重值。
可选的,所述第二权重矩阵中的所有权重值均相同。
可选的,所述第二权重矩阵中的每一个权重值所对应像素点在所述第二分量下的预测值由所述第二分量下的至少两个帧内预测模式预测得到。
可选的,所述第二分量下的至少两种帧内预测模式包括N种帧内预测模式,所述N为大于或等于2的正整数,所述第二权重矩阵包括N种不同的权重值,第i种权重值指示所述第i种权重值对应像素点在所述第二分量下的预测值完全由第i种帧内预测模式得到,所述i为大于或等于2且小于或等于所述N的正整数。
可选的,所述第二分量下的至少两种帧内预测模式包括第一帧内预测模式和第二帧内预测模式,所述第二权重矩阵:包括最大权重值、最小权重值和至少一个中间权重值,所述最大权重值用于指示对应像素点在所述第二分量下的预测值完全由第一帧内预测模式预测得到;所述最小权重值用于指示对应像素点的在所述第二分量下的预测值完全由第二帧内预测模式预测得到;所述中间权重值用于指示对应像素点在所述第二分量下的预测值由所述第一帧内预测模式和所述第二帧内预测模式预测得到。
可选的,所述第二权重矩阵包括多种权重值,权重值变化的位置构成一条直线或曲线。
可选的,所述第二权重矩阵为所述AWP模式或所述GPM模式对应的权重矩阵。
在一些实施例中,所述目标帧内预测模式包括一种帧内预测模式。
在一种示例中,第二确定单元23,具体用于将所述第二分量下的至少两种帧内预测模式中的一个帧内预测模式,作为所述目标帧内预测模式。
在一种示例中,第二确定单元23,具体用于根据所述当前块的第一像素点位置所对应的第二分量下的帧内预测模式,确定所述目标帧内预测模式。
在一种示例中,第二确定单元23,具体用于若所述第一像素点位置对应的第二分量下的预测值完全由一个帧内预测模式预测得到,则将所述一个帧内预测模式作为所述目标帧内预测模式;若所述第一像素点位置对应的第二分量下的预测值由多个帧内预测模式预测得到,则将所述多个帧内预测模式中权重值最大的帧内预测模式作为所述目标帧内预测模式。
在一种示例中,第二确定单元23,具体用于将所述第一像素点位置对应的最小单元中所存储的所述第二分量下的帧内预测模式,作为所述目标帧内预测模式。
可选的,若所述第一像素点位置对应的所述第二分量下的预测值完全由一种帧内预测模式预测得到,则所述最小单元中存储所述一种帧内预测模式的模式信息;若所述第一像素点位置对应的所述第二分量下的预测值由多种帧内预测模式预测得到,则所述最小单元存储所述多种帧内预测模式中对应的权重值最大的帧内预测模式的模式信息。
在一些实施例中,所述第一分量包括第一子分量和第二子分量,预测单元24,具体用于使用所述当前块在所述第一分量下的至少两种帧内预测模式中每一种帧内预测模式对所述当前块进行所述第一子分量帧内预测,获得所述当前块在所述第一子分量下关于所述每一种帧内预测模式的预测块;使用所述当前块在所述第一分量下的至少两种帧内预测模式中每一种帧内预测模式对所述当前块进行所述第二子分量帧内预测,获得所述当前块在所述第二子分量下关于所述每一种帧内预测模式的预测块。
在一些实施例中,预测单元24,具体用于根据所述第一权重矩阵,对所述当前块在所述第一子分量下关于所述每一种帧内预测模式的预测块进行加权运算,得到所述当前块在所述第一子分量的最终预测块;根据所述第一权重矩阵,对所述第二子分量关于所述每一种帧内预测模式的预测块进行加权运算,得到所述当前块在所述第二子分量下的最终预测块。
在一些实施例中,预测单元24,具体用于根据如下公式得到所述当前块在所述第一子分量下的最终预测块:
predMatrixSawpA[x][y]=(predMatrixA0[x][y]*AwpWeightArrayAB[x][y]+predMatrixA1[x][y]*(2 n-AwpWeightArrayAB[x][y])+2 n-1)>>n;
其中,所述A为第一子分量,所述predMatrixSawpA[x][y]为所述第一子分量中的像素点[x][y]在所述第一子分量 下的最终预测值,所述predMatrixA0[x][y]为像素点[x][y]在所述当前块在所述第一子分量下的第一预测块中对应的第一预测值,所述predMatrixA1[x][y]为像素点[x][y]在所述当前块在所述第一子分量下的第二预测块中对应的第二预测值,所述AwpWeightArrayAB[x][y]为predMatrixA0[x][y]在所述第一权重矩阵AwpWeightArrayAB中对应的权重值,2 n为预设的权重之和,n为正整数。
在一些实施例中,预测单元24,具体用于根据如下公式得到所述当前块在所述第二子分量下的最终预测块:
predMatrixSawpB[x][y]=(predMatrixB0[x][y]*AwpWeightArrayAB[x][y]+predMatrixB1[x][y]*(2 n-AwpWeightArrayAB[x][y])+2 n-1)>>n;
其中,所述B为第二子分量,所述predMatrixSawpB[x][y]为所述第二子分量中的像素点[x][y]在所述第二子分量下的最终预测值,所述predMatrixB0[x][y]为像素点[x][y]在所述当前块在所述第二子分量下的第一预测块中对应的第一预测值,所述predMatrixB1[x][y]为像素点[x][y]在所述当前块在所述第二子分量的第二预测块中对应的第二预测值,所述AwpWeightArrayAB[x][y]为所述predMatrixB0[x][y]在所述第一权重矩阵AwpWeightArrayAB中对应的权重值,2 n为预设的权重之和,n为正整数。
在一些实施例中,所述当前块的大小满足预设条件。
所述预设条件包括如下任意一种或多种:
条件1,所述当前块的宽度大于或等于第一预设宽度TH1,且所述当前块的高度大于或等于第一预设高度TH2;
条件2,所述当前块的像素数大于或等于第一预设数量TH3;
条件3,所述当前块的宽度小于或等于第二预设宽度TH4,且所述当前块的高度大于或等于第二预设高度TH5;
条件4,所述当前块的长宽比为第一预设比值;
条件5,所述当前块的大小为第二预设比值;
条件6、所述当前块的高度大于或等于第三预设高度,所述当前块的宽度大于或等于第三预设宽度,且所述当前块的宽度与高度之比小于或等于第三预设值,且所述当前块的高度与宽度之比小于或等于第三预设值。
可选的,所述第一预设比值为如下任意一个:1:1、2:1、1:2、1:4、4:1。
可选的,所述第二预设值为如下任意一个:16×32、32×32、16×64和64×16。
可选的,所述第一分量为亮度分量,所述第二分量为色度分量。
可选的,所述色度分量为UV分量,所述第一子分量为U分量,所述第二子分量为V分量。
应理解,装置实施例与方法实施例可以相互对应,类似的描述可以参照方法实施例。为避免重复,此处不再赘述。具体地,图20所示的视频解码器20可以对应于执行本申请实施例的方法700或800或900中的相应主体,并且视频解码器20中的各个单元的前述和其它操作和/或功能分别为了实现方法700或800或900等各个方法中的相应流程,为了简洁,在此不再赘述。
上文中结合附图从功能单元的角度描述了本申请实施例的装置和系统。应理解,该功能单元可以通过硬件形式实现,也可以通过软件形式的指令实现,还可以通过硬件和软件单元组合实现。具体地,本申请实施例中的方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路和/或软件形式的指令完成,结合本申请实施例公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。可选地,软件单元可以位于随机存储器,闪存、只读存储器、可编程只读存储器、电可擦写可编程存储器、寄存器等本领域的成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法实施例中的步骤。
图21是本申请实施例提供的电子设备30的示意性框图。
如图32所示,该电子设备30可以为本申请实施例所述的视频编码器,或者视频解码器,该电子设备30可包括:
存储器33和处理器32,该存储器33用于存储计算机程序34,并将该程序代码34传输给该处理器32。换言之, 该处理器32可以从存储器33中调用并运行计算机程序34,以实现本申请实施例中的方法。
例如,该处理器32可用于根据该计算机程序34中的指令执行上述方法200中的步骤。
在本申请的一些实施例中,该处理器32可以包括但不限于:
通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等等。
在本申请的一些实施例中,该存储器33包括但不限于:
易失性存储器和/或非易失性存储器。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DR RAM)。
在本申请的一些实施例中,该计算机程序34可以被分割成一个或多个单元,该一个或者多个单元被存储在该存储器33中,并由该处理器32执行,以完成本申请提供的方法。该一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述该计算机程序34在该电子设备30中的执行过程。
如图32所示,该电子设备30还可包括:
收发器33,该收发器33可连接至该处理器32或存储器33。
其中,处理器32可以控制该收发器33与其他设备进行通信,具体地,可以向其他设备发送信息或数据,或接收其他设备发送的信息或数据。收发器33可以包括发射机和接收机。收发器33还可以进一步包括天线,天线的数量可以为一个或多个。
应当理解,该电子设备30中的各个组件通过总线系统相连,其中,总线系统除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。
图22是本申请实施例提供的视频编解码系统40的示意性框图。
如图22所示,该视频编解码系统40可包括:视频编码器41和视频解码器42,其中视频编码器41用于执行本申请实施例涉及的视频编码方法,视频解码器42用于执行本申请实施例涉及的视频解码方法。
本申请还提供了一种计算机存储介质,其上存储有计算机程序,该计算机程序被计算机执行时使得该计算机能够执行上述方法实施例的方法。或者说,本申请实施例还提供一种包含指令的计算机程序产品,该指令被计算机执行时使得计算机执行上述方法实施例的方法。
当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时,全部或部分地产生按照本申请实施例该的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如数字视频光盘(digital video disc,DVD))、或者 半导体介质(例如固态硬盘(solid state disk,SSD))等。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,该单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。例如,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
以上该,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以该权利要求的保护范围为准。

Claims (75)

  1. 一种视频编码方法,其特征在于,包括:
    获得当前块,所述当前块包括第一分量;
    确定所述当前块在所述第一分量下的初始帧内预测模式;
    在所述初始帧内预测模式为导出模式时,获得所述当前块对应的第二分量下的至少两种帧内预测模式;
    根据所述第二分量下的至少两种帧内预测模式,确定所述当前块在所述第一分量下的目标帧内预测模式;
    使用所述目标帧内预测模式,对所述当前块进行所述第一分量帧内预测,获得所述当前块在所述第一分量下的最终预测块。
  2. 根据权利要求1所述的方法,其特征在于,所述目标帧内预测模式包括至少两种帧内预测模式。
  3. 根据权利要求2所述的方法,其特征在于,所述根据所述第二分量下的至少两种帧内预测模式,确定所述当前块在所述第一分量下的目标帧内预测模式,包括:
    将所述第二分量下的至少两种帧内预测模式,作为所述当前块在所述第一分量下的目标帧内预测模式。
  4. 根据权利要求2所述的方法,其特征在于,所述根据所述第二分量下的至少两种帧内预测模式,确定所述当前块在所述第一分量下的目标帧内预测模式,包括:
    根据所述第二分量下的至少两种帧内预测模式,导出所述当前块在所述第一分量下的目标帧内预测模式。
  5. 根据权利要求2所述的方法,其特征在于,所述使用所述目标帧内预测模式,对所述当前块进行所述第一分量帧内预测,获得所述当前块在所述第一分量下的最终预测块,包括:
    使用所述当前块在所述第一分量下的至少两种帧内预测模式中每一种帧内预测模式对所述当前块进行第一分量帧内预测,获得所述每一种帧内预测模式对应的预测块;
    根据所述每一种帧内预测模式对应的预测块,获得所述当前块在所述第一分量下的最终预测块。
  6. 根据权利要求5所述的方法,其特征在于,所述根据所述每一种帧内预测模式对应的预测块,获得所述当前块在所述第一分量下的最终预测块,包括:
    确定第一权重矩阵;
    根据所述第一权重矩阵,对所述每一种帧内预测模式对应的预测块进行加权运算,得到所述当前块在所述第一分量下的最终预测块。
  7. 根据权利要求6所述的方法,其特征在于,所述确定第一权重矩阵,包括:
    根据权重矩阵导出模式导出所述第一权重矩阵。
  8. 根据权利要求6所述的方法,其特征在于,所述确定第一权重矩阵,包括:
    获得当前块在所述第二分量下的第二权重矩阵;
    若所述当前块在第二分量下所包括的像素点总数与所述当前块在第一分量下所包括的像素点总数相同,则将所述第二权重矩阵作为所述第一权重矩阵;
    若所述当前块在第一分量下所包括的像素点总数小于所述当前块在第二分量下所包括的像素点数,则对所述第二权重矩阵进行下采样,得到所述第一权重矩阵。
  9. 根据权利要求8所述的方法,其特征在于,所述对所述第二权重矩阵进行下采样,得到所述第一权重矩阵,包括:
    根据所述当前块在第一分量下所包括的像素点总数与所述当前块在第二分量下所包括的像素点数,对所述第二权重矩阵进行下采样,得到所述第一权重矩阵。
  10. 根据权利要求8所述的方法,其特征在于,所述第二权重矩阵包括至少两个不同的权重值。
  11. 根据权利要求8所述的方法,其特征在于,所述第二权重矩阵中的所有权重值均相同。
  12. 根据权利要求8所述的方法,其特征在于,所述第二权重矩阵中的每一个权重值所对应的像素点在所述第二分量下的预测值由所述第二分量下的至少两个帧内预测模式预测得到。
  13. 根据权利要求8所述的方法,其特征在于,所述第二分量下的至少两种帧内预测模式包括N种帧内预测模式,所述N为大于或等于2的正整数,所述第二权重矩阵包括N种不同的权重值,第i种权重值指示所述第i种权重值对应的像素点在所述第二分量下的预测值完全由第i种帧内预测模式得到,所述i为大于或等于2且小于或等于所述N的正整数。
  14. 根据权利要求8所述的方法,其特征在于,所述第二分量下的至少两种帧内预测模式包括第一帧内预测模式和第二帧内预测模式,所述第二权重矩阵:包括最大权重值、最小权重值和至少一个中间权重值,
    所述最大权重值用于指示对应像素点在所述第二分量下的预测值完全由第一帧内预测模式预测得到;所述最小权重值用于指示对应像素点在所述第二分量下的预测值完全由第二帧内预测模式预测得到;所述中间权重值用于指示对应像素点在所述第二分量下的预测值由所述第一帧内预测模式和所述第二帧内预测模式预测得到。
  15. 根据权利要求8所述的方法,其特征在于,所述第二权重矩阵包括多种权重值,权重值变化的位置构成一条直线或曲线。
  16. 根据权利要求8所述的方法,其特征在于,所述第二权重矩阵为AWP模式或GPM模式对应的权重矩阵。
  17. 根据权利要求1所述的方法,其特征在于,所述目标帧内预测模式包括一种帧内预测模式。
  18. 根据权利要求17所述的方法,其特征在于,所述根据所述第二分量下的至少两种帧内预测模式,确定所述当前块在所述第一分量下的目标帧内预测模式,包括:
    将所述第二分量下的至少两种帧内预测模式中的一个帧内预测模式,作为所述目标帧内预测模式。
  19. 根据权利要求17所述的方法,其特征在于,所述根据所述第二分量下的至少两种帧内预测模式,确定所述当前块在所述目标帧内预测模式,包括:
    根据所述当前块的第一像素点位置所对应的第二分量下的帧内预测模式,确定所述目标帧内预测模式。
  20. 根据权利要求19所述的方法,其特征在于,所述根据所述当前块的第一像素点位置所对应的第二分量下的帧内预测模式,确定所述目标帧内预测模式,包括:
    若所述第一像素点位置对应的第二分量下的预测值完全由一个帧内预测模式预测得到,则将所述一个帧内预测模式作为所述目标帧内预测模式;
    若所述第一像素点位置对应的第二分量下的预测值由多个帧内预测模式预测得到,则将所述多个帧内预测模式中权重值最大的帧内预测模式作为所述目标帧内预测模式。
  21. 根据权利要求19所述的方法,其特征在于,所述根据所述当前块的第一像素点位置所对应的第二分量下的帧内预测模式,确定所述目标帧内预测模式,包括:
    将所述第一像素点位置对应的最小单元中所存储的所述第二分量下的帧内预测模式,作为所述目标帧内预测模式。
  22. 根据权利要求21所述的方法,其特征在于,若所述第一像素点位置对应的所述第二分量下的预测值完全由一种帧内预测模式预测得到,则所述最小单元中存储所述一种帧内预测模式的模式信息;
    若所述第一像素点位置对应的所述第二分量下的预测值由多种帧内预测模式预测得到,则所述最小单元存储所述多种帧内预测模式中对应的权重值最大的帧内预测模式的模式信息。
  23. 根据权利要求6所述的方法,其特征在于,所述第一分量包括第一子分量和第二子分量,所述使用所述当前块在所述第一分量下的至少两种帧内预测模式中每一种帧内预测模式对所述第一分量进行预测,获得所述每一种帧内预测模式对应的预测块,包括:
    使用所述当前块在所述第一分量下的至少两种帧内预测模式中每一种帧内预测模式对所述当前块进行所述第一子分量帧内预测,获得所述当前块在所述第一子分量下关于所述每一种帧内预测模式的预测块;
    使用所述当前块在所述第一分量下的至少两种帧内预测模式中每一种帧内预测模式对所述当前块进行所述第二子分量进行预测,获得所述当前块在所述第二子分量下关于所述每一种帧内预测模式的预测块。
  24. 根据权利要求23所述的方法,其特征在于,所述根据所述第一权重矩阵,对所述每一种帧内预测模式对应的预测块进行加权运算,所述当前块在所述第一分量下的最终预测块,包括:
    根据所述第一权重矩阵,对所述当前块块在所述第一子分量下关于所述每一种帧内预测模式的预测块进行加权运算,得到所述当前块在所述第一子分量下的最终预测块;
    根据所述第一权重矩阵,对所述当前块块在所述第二子分量下关于所述每一种帧内预测模式的预测块进行加权运算,得到所述当前块在所述第二子分量下的最终预测块。
  25. 根据权利要求24所述的方法,其特征在于,所述当前块在所述第一分量下的至少两种帧内预测模式包括第一帧内预测模式和第二帧内预测模式,所述根据所述第一权重矩阵,对所述当前块在所述第一子分量下关于所述每一种帧内预测模式的预测块进行加权运算,得到所述当前块在所述第一子分量下的最终预测块,包括:
    根据如下公式得到所述当前块在所述第一子分量下的最终预测块:
    predMatrixSawpA[x][y]=(predMatrixA0[x][y]*AwpWeightArrayAB[x][y]+predMatrixA1[x][y]*(2 n-AwpWeightArrayAB[x][y])+2 n-1)>>n;
    其中,所述A为第一子分量,所述predMatrixSawpA[x][y]为所述第一子分量中的像素点[x][y]在所述第一子分量下的最终预测值,所述predMatrixA0[x][y]为像素点[x][y]在所述当前块在所述第一子分量下的第一预测块中对应的第一预测值,所述predMatrixA1[x][y]为像素点[x][y]在所述当前块在所述第一子分量下的第二预测块中对应的第二预测值,所述AwpWeightArrayAB[x][y]为predMatrixA0[x][y]在所述第一权重矩阵AwpWeightArrayAB中对应的权重值,2 n为预设的权重之和,n为正整数。
  26. 根据权利要求25所述的方法,其特征在于,所述根据所述第一权重矩阵,对所述当前块在所述第二子分量下关于所述每一种帧内预测模式的预测块进行加权运算,得到所述当前块在所述第二子分量下的最终预测块,包括:
    根据如下公式得到所述当前块在所述第二子分量下的最终预测块:
    predMatrixSawpB[x][y]=(predMatrixB0[x][y]*AwpWeightArrayAB[x][y]+predMatrixB1[x][y]*(2 n-AwpWeightArrayAB[x][y])+2 n-1)>>n;
    其中,所述B为第二子分量,所述predMatrixSawpB[x][y]为所述第二子分量中的像素点[x][y]在所述第二子分量下的最终预测值,所述predMatrixB0[x][y]为像素点[x][y]在所述当前块在所述第二子分量下的第一预测块中对应的第一预测值,所述predMatrixB1[x][y]为像素点[x][y]在所述当前块在所述第二子分量下的第二预测块中对应的第二预测值,所述AwpWeightArrayAB[x][y]为所述predMatrixB0[x][y]在所述第一权重矩阵AwpWeightArrayAB中对应的权重值,2 n为预设的权重之和,n为正整数。
  27. 根据权利要求8所述的方法,其特征在于,所述方法还包括:
    生成码流,所述码流中包括加权预测标识,所述加权预测标识用于指示所述第二分量下的预测块是否采用所述至少两种帧内预测模式进行预测。
  28. 根据权利要求27所述的方法,其特征在于,所述确定所述当前块在所述第一分量下的初始帧内预测模式,包括:
    在确定所述第二分量使用所述至少两种帧内预测模式进行预测时,则确定所述当前块在所述第一分量下的所述初始帧内预测模式为所述导出模式。
  29. 根据权利要求27所述的方法,其特征在于,所述码流中还包括所述第二分量下的至少两种帧内预测模式的模式信息。
  30. 根据权利要求27所述的方法,其特征在于,所述码流中还包括所述第二权重矩阵的导出模式信息。
  31. 根据权利要求1所述的方法,其特征在于,所述当前块的大小满足预设条件。
  32. 根据权利要求31所述的方法,其特征在于,所述预设条件包括如下任意一种或多种:
    条件1,所述当前块的宽度大于或等于第一预设宽度TH1,且所述当前块的高度大于或等于第一预设高度TH2;
    条件2,所述当前块的像素数大于或等于第一预设数量TH3;
    条件3,所述当前块的宽度小于或等于第二预设宽度TH4,且所述当前块的高度大于或等于第二预设高度TH5;
    条件4,所述当前块的长宽比为第一预设比值;
    条件5,所述当前块的大小为第二预设比值;
    条件6、所述当前块的高度大于或等于第三预设高度,所述当前块的宽度大于或等于第三预设宽度,且所述当前块的宽度与高度之比小于或等于第三预设值,且所述当前块的高度与宽度之比小于或等于第三预设值。
  33. 根据权利要求32所述的方法,其特征在于,所述第一预设比值为如下任意一个:1:1、2:1、1:2、1:4、4:1。
  34. 根据权利要求32所述的方法,其特征在于,所述第二预设值为如下任意一个:16×32、32×32、16×64和64×16。
  35. 根据权利要求23所述的方法,其特征在于,所述第一分量为亮度分量,所述第二分量为色度分量。
  36. 根据权利要求35所述的方法,其特征在于,所述第一子分量为U分量,所述第二子分量为V分量。
  37. 一种视频解码方法,其特征在于,包括:
    解析码流,得到当前块,以及所述当前块对应的第二分量下的至少两种帧内预测模式,所述当前块包括第一分量;
    确定所述当前块在所述第一分量下的初始帧内预测模式;
    在确定所述初始帧内预测模式为导出模式时,根据所述第二分量下的至少两种帧内预测模式,确定所述当前块在所述第一分量下的目标帧内预测模式;
    使用所述目标帧内预测模式,对所述当前块进行所述第一分量帧内预测,获得所述当前块在所述第一分量下的最终预测块。
  38. 根据权利要求37所述的方法,其特征在于,所述码流中携带加权预测标识,所述加权预测标识用于指示所述第二分量下的预测块是否采用所述至少两种帧内预测模式进行预测。
  39. 根据权利要求38所述的方法,其特征在于,所述码流中携带所述当前块在所述第一分量下的初始帧内预测模式的模式信息。
  40. 根据权利要求38所述的方法,其特征在于,所述确定所述当前块在所述第一分量下的初始帧内预测模式,包括:
    在所述码流中携带所述加权预测标识,且不携带所述当前块在所述第一分量下的初始帧内预测模式的模式信息时,则确定所述当前块在所述第一分量下的初始帧内预测模式为所述导出模式。
  41. 根据权利要求37所述的方法,其特征在于,所述目标帧内预测模式包括至少两种帧内预测模式。
  42. 根据权利要求41所述的方法,其特征在于,所述根据所述第二分量下的至少两种帧内预测模式,确定所述当前块在所述第一分量下的目标帧内预测模式,包括:
    将所述第二分量下的至少两种帧内预测模式,作为所述目标帧内预测模式。
  43. 根据权利要求41所述的方法,其特征在于,所述根据所述第二分量下的至少两种帧内预测模式,确定所述当前块在所述第一分量下的目标帧内预测模式,包括:
    根据所述第二分量下的至少两种帧内预测模式,导出所述目标帧内预测模式。
  44. 根据权利要求41所述的方法,其特征在于,所述使用所述目标帧内预测模式,对所述当前块进行所述第一分 量帧内预测,包括:
    使用所述当前块在所述第一分量下的至少两种帧内预测模式中每一种帧内预测模式对所述当前块进行所述第一分量帧内预测,获得所述每一种帧内预测模式对应的预测块;
    根据所述每一种帧内预测模式对应的预测块,确定所述当前块在所述第一分量下的最终预测块。
  45. 根据权利要求44所述的方法,其特征在于,所述根据所述每一种帧内预测模式对应的预测块,确定所述当前块在所述第一分量下的最终预测块,包括:
    确定第一权重矩阵;
    根据所述第一权重矩阵,对所述每一种帧内预测模式对应的预测块进行加权运算,得到所述当前块块在所述第一分量下的最终预测块。
  46. 根据权利要求45所述的方法,其特征在于,所述确定第一权重矩阵,包括:
    根据权重矩阵导出模式导出所述第一权重矩阵。
  47. 根据权利要求45所述的方法,其特征在于,所述确定第一权重矩阵,包括:
    获得当前块在所述第二分量下的第二权重矩阵;
    若所述当前块在第二分量下所包括的像素点总数与所述当前块在第一分量下所包括的像素点总数相同,则将所述第二权重矩阵作为所述第一权重矩阵;
    若所述当前块在第一分量下所包括的像素点总数小于所述当前块在第二分量下所包括的像素点数,则对所述第二权重矩阵进行下采样,得到所述第一权重矩阵。
  48. 根据权利要求47所述的方法,其特征在于,获得当前块在所述第二分量下的第二权重矩阵,包括:
    从所述码流中获得所述第二权重矩阵的导出模式信息;
    根据所述第二权重矩阵的导出模式信息,获得所述第二权重矩阵。
  49. 根据权利要求47所述的方法,其特征在于,所述对所述第二权重矩阵进行下采样,得到所述第一权重矩阵,包括:
    根据所述当前块在第一分量下所包括的像素点总数与所述当前块在第二分量下所包括的像素点数,对所述第二权重矩阵进行下采样,得到所述第一权重矩阵。
  50. 根据权利要求47所述的方法,其特征在于,所述第二权重矩阵包括至少两个不同的权重值。
  51. 根据权利要求47所述的方法,其特征在于,所述第二权重矩阵中的所有权重值均相同。
  52. 根据权利要求47所述的方法,其特征在于,所述第二权重矩阵中的每一个权重值所对应像素点在所述第二分量下的预测值由所述第二分量下的至少两个帧内预测模式预测得到。
  53. 根据权利要求47所述的方法,其特征在于,所述第二分量下的至少两种帧内预测模式包括N种帧内预测模式,所述N为大于或等于2的正整数,所述第二权重矩阵包括N种不同的权重值,第i种权重值指示所述第i种权重值对应像素点在所述第二分量下的预测值完全由第i种帧内预测模式得到,所述i为大于或等于2且小于或等于所述N的正整数。
  54. 根据权利要求47所述的方法,其特征在于,所述第二分量下的至少两种帧内预测模式包括第一帧内预测模式和第二帧内预测模式,所述第二权重矩阵:包括最大权重值、最小权重值和至少一个中间权重值,
    所述最大权重值用于指示对应像素点在所述第二分量下的预测值完全由第一帧内预测模式预测得到;所述最小权重值用于指示对应像素点的在所述第二分量下的预测值完全由第二帧内预测模式预测得到;所述中间权重值用于指示对应像素点在所述第二分量下的预测值由所述第一帧内预测模式和所述第二帧内预测模式预测得到。
  55. 根据权利要求47所述的方法,其特征在于,所述第二权重矩阵包括多种权重值,权重值变化的位置构成一条直线或曲线。
  56. 根据权利要求47所述的方法,其特征在于,所述第二权重矩阵为AWP模式或GPM模式对应的权重矩阵。
  57. 根据权利要求37所述的方法,其特征在于,所述目标帧内预测模式包括一种帧内预测模式。
  58. 根据权利要求57所述的方法,其特征在于,所述根据所述第二分量下的至少两种帧内预测模式,确定所述当前块在所述第一分量下的目标帧内预测模式,包括:
    将所述第二分量下的至少两种帧内预测模式中的一个帧内预测模式,作为所述目标帧内预测模式。
  59. 根据权利要求57所述的方法,其特征在于,所述根据所述第二分量下的至少两种帧内预测模式,确定所述当前块在所述第一分量下的目标帧内预测模式,包括:
    根据所述当前块的第一像素点位置所对应的第二分量下的帧内预测模式,确定所述目标帧内预测模式。
  60. 根据权利要求59所述的方法,其特征在于,所述根据所述当前块的第一像素点位置所对应的第二分量下的帧内预测模式,确定所述目标帧内预测模式,包括:
    若所述第一像素点位置对应的第二分量下的预测值完全由一个帧内预测模式预测得到,则将所述一个帧内预测模式作为所述目标帧内预测模式;
    若所述第一像素点位置对应的第二分量下的预测值由多个帧内预测模式预测得到,则将所述多个帧内预测模式中权重值最大的帧内预测模式作为所述目标帧内预测模式。
  61. 根据权利要求60所述的方法,其特征在于,所述根据所述当前块的第一像素点位置所对应的第二分量下的帧内预测模式,确定所述目标帧内预测模式,包括:
    将所述第一像素点位置对应的最小单元中所存储的所述第二分量下的帧内预测模式,作为所述目标帧内预测模式。
  62. 根据权利要求61所述的方法,其特征在于,若所述第一像素点位置对应的所述第二分量下的预测值完全由一种帧内预测模式预测得到,则所述最小单元中存储所述一种帧内预测模式的模式信息;
    若所述第一像素点位置对应的所述第二分量下的预测值由多种帧内预测模式预测得到,则所述最小单元存储所述多种帧内预测模式中对应的权重值最大的帧内预测模式的模式信息。
  63. 根据权利要求45所述的方法,其特征在于,所述第一分量包括第一子分量和第二子分量,所述使用所述当前块在所述第一分量下的至少两种帧内预测模式中每一种帧内预测模式对所述第一分量进行预测,获得所述每一种帧内预测模式对应的预测块,包括:
    使用所述当前块在所述第一分量下的至少两种帧内预测模式中每一种帧内预测模式对所述当前块进行所述第一子分量帧内预测,获得所述当前块在所述第一子分量下关于所述每一种帧内预测模式的预测块;
    使用所述当前块在所述第一分量下的至少两种帧内预测模式中每一种帧内预测模式对所述当前块进行所述第二子分量帧内预测,获得所述当前块在所述第二子分量下关于所述每一种帧内预测模式的预测块。
  64. 根据权利要求63所述的方法,其特征在于,所述根据所述第一权重矩阵,对所述每一种帧内预测模式对应的预测块进行加权运算,得到所述当前块在所述第一分量下的最终预测块,包括:
    根据所述第一权重矩阵,对所述当前块在所述第一子分量下关于所述每一种帧内预测模式的预测块进行加权运算,得到所述当前块在所述第一子分量的最终预测块;
    根据所述第一权重矩阵,对所述第二子分量关于所述每一种帧内预测模式的预测块进行加权运算,得到所述当前块在所述第二子分量下的最终预测块。
  65. 根据权利要求64所述的方法,其特征在于,所述当前块在所述第一分量下的至少两种帧内预测模式包括第一 帧内预测模式和第二帧内预测模式,所述根据所述第一权重矩阵,对所述当前块在所述第一子分量下关于所述每一种帧内预测模式的预测块进行加权运算,得到所述当前块在所述第一子分量下的最终预测块,包括:
    根据如下公式得到所述当前块在所述第一子分量下的最终预测块:
    predMatrixSawpA[x][y]=(predMatrixA0[x][y]*AwpWeightArrayAB[x][y]+predMatrixA1[x][y]*(2 n-AwpWeightArrayAB[x][y])+2 n-1)>>n;
    其中,所述A为第一子分量,所述predMatrixSawpA[x][y]为所述第一子分量中的像素点[x][y]在所述第一子分量下的最终预测值,所述predMatrixA0[x][y]为像素点[x][y]在所述当前块在所述第一子分量下的第一预测块中对应的第一预测值,所述predMatrixA1[x][y]为像素点[x][y]在所述当前块在所述第一子分量下的第二预测块中对应的第二预测值,所述AwpWeightArrayAB[x][y]为predMatrixA0[x][y]在所述第一权重矩阵AwpWeightArrayAB中对应的权重值,2 n为预设的权重之和,n为正整数。
  66. 根据权利要求65所述的方法,其特征在于,所述根据所述第一权重矩阵,对所述当前块在所述第二子分量下关于所述每一种帧内预测模式的预测块进行加权运算,得到所述当前块在所述第二子分量下的最终预测块,包括:
    根据如下公式得到所述当前块在所述第二子分量下的最终预测块:
    predMatrixSawpB[x][y]=(predMatrixB0[x][y]*AwpWeightArrayAB[x][y]+predMatrixB1[x][y]*(2 n-AwpWeightArrayAB[x][y])+2 n-1)>>n;
    其中,所述B为第二子分量,所述predMatrixSawpB[x][y]为所述第二子分量中的像素点[x][y]在所述第二子分量下的最终预测值,所述predMatrixB0[x][y]为像素点[x][y]在所述当前块在所述第二子分量下的第一预测块中对应的第一预测值,所述predMatrixB1[x][y]为像素点[x][y]在所述当前块在所述第二子分量的第二预测块中对应的第二预测值,所述AwpWeightArrayAB[x][y]为所述predMatrixB0[x][y]在所述第一权重矩阵AwpWeightArrayAB中对应的权重值,2 n为预设的权重之和,n为正整数。
  67. 根据权利要求37所述的方法,其特征在于,所述当前块的大小满足预设条件。
  68. 根据权利要求67所述的方法,其特征在于,所述预设条件包括如下任意一种或多种:
    条件1,所述当前块的宽度大于或等于第一预设宽度TH1,且所述当前块的高度大于或等于第一预设高度TH2;
    条件2,所述当前块的像素数大于或等于第一预设数量TH3;
    条件3,所述当前块的宽度小于或等于第二预设宽度TH4,且所述当前块的高度大于或等于第二预设高度TH5;
    条件4,所述当前块的长宽比为第一预设比值;
    条件5,所述当前块的大小为第二预设比值;
    条件6、所述当前块的高度大于或等于第三预设高度,所述当前块的宽度大于或等于第三预设宽度,且所述当前块的宽度与高度之比小于或等于第三预设值,且所述当前块的高度与宽度之比小于或等于第三预设值。
  69. 根据权利要求68所述的方法,其特征在于,所述第一预设比值为如下任意一个:1:1、2:1、1:2、1:4、4:1。
  70. 根据权利要求68所述的方法,其特征在于,所述第二预设值为如下任意一个:16×32、32×32、16×64和64×16。
  71. 根据权利要求63所述的方法,其特征在于,所述第一分量为亮度分量,所述第二分量为色度分量。
  72. 根据权利要求71所述的方法,其特征在于,所述色度分量为UV分量,所述第一子分量为U分量,所述第二子分量为V分量。
  73. 一种视频编码器,其特征在于,包括:
    第一获取单元,用于获得当前块,所述当前块包括第一分量;
    第一确定单元,用于确定所述当前块在所述第一分量下的初始帧内预测模式;
    第二获取单元,用于在所述初始帧内预测模式为导出模式时,获得所述当前块对应的第二分量至少两种帧内预测模式;
    第二确定单元,用于根据所述第二分量下的至少两种帧内预测模式,确定所述当前块在所述第一分量下的目标帧内预测模式;
    预测单元,用于使用所述目标帧内预测模式,对所述当前块进行所述第一分量帧内预测,获得所述当前块在所述第一分量下的最终预测块。
  74. 一种视频解码器,其特征在于,包括:
    解析单元,用于解析码流,得到当前块,以及所述当前块对应的第二分量下的至少两种帧内预测模式,所述当前块包括第一分量;
    第一确定单元,用于确定所述当前块在所述第一分量下的初始帧内预测模式;
    第二确定单元,用于在确定所述初始帧内预测模式为导出模式时,根据所述第二分量下的至少两种帧内预测模式,确定所述当前块在所述第一分量下的目标帧内预测模式;
    预测单元,用于使用所述目标帧内预测模式,对所述当前块进行所述第一分量帧内预测,获得所述当前块在所述第一分量下的最终预测块。
  75. 一种视频编解码系统,其特征在于,包括:
    根据权利要求73所述的视频编码器;
    以及根据权利要求74所述的视频解码器。
CN202080107399.7A 2020-12-03 2020-12-03 视频编解码方法与系统、及视频编码器与视频解码器 Pending CN116491118A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311100947.5A CN116962684A (zh) 2020-12-03 2020-12-03 视频编解码方法与系统、及视频编码器与视频解码器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2020/133677 WO2022116105A1 (zh) 2020-12-03 2020-12-03 视频编解码方法与系统、及视频编码器与视频解码器

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202311100947.5A Division CN116962684A (zh) 2020-12-03 2020-12-03 视频编解码方法与系统、及视频编码器与视频解码器

Publications (1)

Publication Number Publication Date
CN116491118A true CN116491118A (zh) 2023-07-25

Family

ID=81852811

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202080107399.7A Pending CN116491118A (zh) 2020-12-03 2020-12-03 视频编解码方法与系统、及视频编码器与视频解码器
CN202311100947.5A Pending CN116962684A (zh) 2020-12-03 2020-12-03 视频编解码方法与系统、及视频编码器与视频解码器

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202311100947.5A Pending CN116962684A (zh) 2020-12-03 2020-12-03 视频编解码方法与系统、及视频编码器与视频解码器

Country Status (7)

Country Link
US (1) US20230319267A1 (zh)
JP (1) JP2024503192A (zh)
KR (1) KR20230111256A (zh)
CN (2) CN116491118A (zh)
MX (1) MX2023005929A (zh)
WO (1) WO2022116105A1 (zh)
ZA (1) ZA202306216B (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103369315B (zh) * 2012-04-06 2016-08-24 华为技术有限公司 色度分量的帧内预测模式的编码、解码方法、设备及系统
US11190799B2 (en) * 2017-06-21 2021-11-30 Lg Electronics Inc. Intra-prediction mode-based image processing method and apparatus therefor
CN115022632A (zh) * 2017-10-18 2022-09-06 韩国电子通信研究院 图像编码/解码方法和装置以及存储有比特流的记录介质
CN111373755B (zh) * 2017-11-16 2024-04-26 英迪股份有限公司 图像编码/解码方法和装置以及存储比特流的记录介质
CN110719478B (zh) * 2018-07-15 2023-02-07 北京字节跳动网络技术有限公司 跨分量帧内预测模式导出

Also Published As

Publication number Publication date
WO2022116105A1 (zh) 2022-06-09
KR20230111256A (ko) 2023-07-25
CN116962684A (zh) 2023-10-27
ZA202306216B (en) 2024-04-24
US20230319267A1 (en) 2023-10-05
MX2023005929A (es) 2023-05-29
JP2024503192A (ja) 2024-01-25

Similar Documents

Publication Publication Date Title
CN110999291B (zh) 用于划分视频数据的帧间预测片段中的视频块的系统和方法
US20220141495A1 (en) Video signal processing method and device
EP2774360B1 (en) Differential pulse code modulation intra prediction for high efficiency video coding
US20180288441A1 (en) Filter information sharing among color components
US20220141465A1 (en) Method and device for processing video signal
US11979554B2 (en) Intra prediction-based video signal processing method and device
US20210321136A1 (en) Video signal processing method and apparatus using multiple transform kernel
KR20210125088A (ko) 매트릭스 기반 인트라 예측 및 2차 변환 코어 선택을 조화시키는 인코더, 디코더 및 대응 방법
US11870995B2 (en) Method and device for processing video signal by using cross-component linear model
US20230199209A1 (en) Chroma coding enhancement in cross-component sample adaptive offset
CN116783889A (zh) 跨分量样本自适应偏移中的编解码增强
US20240007662A1 (en) Coding enhancement in cross-component sample adaptive offset
CN117426088A (zh) 视频编解码方法、设备、系统、及存储介质
US20230336785A1 (en) Coding enhancement in cross-component sample adaptive offset
US20230319315A1 (en) Coding enhancement in cross-component sample adaptive offset
KR20180019547A (ko) 영상 코딩 시스템에서 필터 뱅크를 이용한 영상 필터링 방법 및 장치
CN117981307A (zh) 视频编解码方法、设备、系统、及存储介质
CN116491118A (zh) 视频编解码方法与系统、及视频编码器与视频解码器
WO2023122968A1 (zh) 帧内预测方法、设备、系统、及存储介质
US20240137546A1 (en) Coding enhancement in cross-component sample adaptive offset
WO2023236113A1 (zh) 视频编解码方法、装置、设备、系统及存储介质
WO2024007128A1 (zh) 视频编解码方法、装置、设备、系统、及存储介质
WO2023122969A1 (zh) 帧内预测方法、设备、系统、及存储介质
US11240535B2 (en) Method and device for filtering image in image coding system
CN117121485A (zh) 视频编解码方法与系统、及视频编解码器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination