WO2021185008A1 - 编码方法、解码方法、编码器、解码器以及电子设备 - Google Patents

编码方法、解码方法、编码器、解码器以及电子设备 Download PDF

Info

Publication number
WO2021185008A1
WO2021185008A1 PCT/CN2021/076059 CN2021076059W WO2021185008A1 WO 2021185008 A1 WO2021185008 A1 WO 2021185008A1 CN 2021076059 W CN2021076059 W CN 2021076059W WO 2021185008 A1 WO2021185008 A1 WO 2021185008A1
Authority
WO
WIPO (PCT)
Prior art keywords
chrominance component
block
target
prediction block
component prediction
Prior art date
Application number
PCT/CN2021/076059
Other languages
English (en)
French (fr)
Inventor
杨宁
Original Assignee
Oppo广东移动通信有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oppo广东移动通信有限公司 filed Critical Oppo广东移动通信有限公司
Priority to PCT/CN2021/081132 priority Critical patent/WO2021185257A1/zh
Publication of WO2021185008A1 publication Critical patent/WO2021185008A1/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Definitions

  • a processor adapted to implement computer instructions
  • an embodiment of the present application provides a computer-readable storage medium that stores computer instructions.
  • the computer instructions When the computer instructions are read and executed by a processor of a computer device, the computer device executes the above-mentioned The method in any one of one aspect to the second aspect or each of its implementations.
  • Fig. 21 is a schematic block diagram of an encoder according to an embodiment of the present application.
  • the inter-frame prediction unit 170 can be used for inter-frame prediction.
  • the inter-frame prediction can refer to the image information of different frames, and use motion estimation to search for the motion vector information that best matches the image block to be encoded to eliminate temporal redundancy;
  • the frame may be a P frame and/or B frame.
  • the P frame refers to the forward predicted frame
  • the B frame refers to the bidirectional predicted frame.
  • the non-angle mode has remained relatively stable, with average mode and plane mode; the angle mode has been increasing with the evolution of digital video coding and decoding standards.
  • the H.264/AVC standard has only 8 angle prediction modes and 1 non-angle prediction mode; H.265/HEVC has expanded to 33 angle prediction modes and 2 non-angle prediction modes model.
  • the intra-frame prediction mode is further expanded, and there are 67 traditional prediction modes and non-traditional prediction modes for luma blocks.
  • the non-traditional prediction mode may include a matrix weighted intra-frame prediction (MIP) mode.
  • the traditional prediction modes include: a planar mode of mode number 0, a DC mode of mode number 1, and angular prediction modes of mode number 2 to mode number 66.
  • FIG. 7 is a schematic block diagram of a decoding framework 200 provided by an embodiment of the present application.
  • P C represents the prediction of the target chrominance component pixel values of the block
  • P 'C represent temporary prediction value of the chroma component prediction pixels in the block
  • (2x, 2y) represents a chrominance component in said temporary
  • >> represents the right shift operator
  • x represents the xth column of the target chrominance component prediction block
  • y represents the yth row of the target chrominance component prediction block .
  • the target image frame in the target image sequence into a plurality of image blocks, the plurality of image blocks include a target image block, and the target image block includes a target luminance component block and a target chrominance component block;
  • the encoder obtains a flag bit and the target image block, the target image block includes a target luminance component block and a target chrominance component block, and the flag bit is used to identify whether to use the cross-component prediction technology; It is used to indicate that when the cross-component prediction technology is used, the optimal prediction mode is used to perform intra-frame prediction on the target luminance component block to obtain the target luminance component prediction block.
  • the encoder uses the filter corresponding to the optimal prediction mode to down-sample the temporary chrominance component prediction block to obtain the target chrominance component when the optimal prediction mode meets the specific directivity. Prediction block; that is, in the cross-component prediction mode, different directivities of the target image block correspond to different filters.
  • the UV component has a coding gain
  • the BD-rate of the U component and the BD-rate of the V component have gains of 0.05% and 0.19%, respectively.
  • Tong A is a 4K test video
  • Tong B is a 1080P test video
  • Tong C is a 720p test video.
  • a negative BD-rate means that the performance of the test result has been improved.
  • BD-rate represents the difference in code rate under the same PSNR. The smaller the BD-rate, the better the performance of the encoding algorithm.
  • Bjorgard's incremental signal-to-noise power ratio (The delta peak signal-to-noise rate, BD-PSNR) is used to measure the performance of the encoding algorithm.
  • BDPSNR represents the difference in PSNR at the same bit rate. The larger the BD-PSNR, the better the performance of the encoding algorithm.
  • the encoder first performs intra-frame prediction on the target luma component block, and obtains the luma component reconstruction block.
  • the encoder obtains the reference samples of the linear model according to the adjacent reconstructed samples of the target image block and the prediction mode of the target chrominance component block.
  • P C represents chroma component prediction value of the prediction target block of pixels, with Represents the two sampling results obtained by down-sampling using the two three-tap filters with two different coefficients
  • P′ C represents the predicted value of the pixel in the temporary chrominance component prediction block
  • MAX( ⁇ ) represents the maximum Value operation
  • (2x, 2y) represents the pixel located in the 2xth column and 2yth row of the temporary chrominance component prediction block
  • >> represents the right shift operator
  • x represents the xth column of the target chrominance component prediction block Column
  • y represents the yth row of the target chrominance component prediction block.
  • two two-tap filters with the same coefficient are used to downsample the temporary chrominance component prediction block, and the maximum value of the two obtained sampling results is determined Is the target chrominance component prediction block; on the non-left boundary of the temporary chrominance component prediction block, two filters with three taps and two different coefficients are used to downsample the temporary chrominance component prediction block, And the maximum value of the obtained two sampling results is determined as the target chrominance component prediction block.
  • P C represents chroma component prediction value of the prediction target block of pixels, with Represents the two sampling results obtained by down-sampling using the two three-tap filters with two different coefficients
  • P′ C represents the predicted value of the pixel in the temporary chrominance component prediction block
  • MAX( ⁇ ) represents the maximum Value operation
  • (2x, 2y) represents the pixel located in the 2xth column and 2yth row of the temporary chrominance component prediction block
  • >> represents the right shift operator
  • x represents the xth column of the target chrominance component prediction block Column
  • y represents the yth row of the target chrominance component prediction block.
  • FIG. 19 is another schematic diagram of down-sampling using a three-tap filter with two different coefficients according to an embodiment of the present application.
  • the prediction unit 520 is specifically configured to:
  • the target chrominance component prediction block is determined based on the following formula:
  • the optimal prediction mode is a diagonal mode; the prediction unit 620 is specifically configured to:
  • the prediction unit 620 is specifically configured to:
  • RAM static random access memory
  • SRAM static random access memory
  • DRAM dynamic random access memory
  • DRAM synchronous dynamic random access memory
  • DDR SDRAM Double Data Rate Synchronous Dynamic Random Access Memory
  • Enhanced SDRAM, ESDRAM Synchronous Link Dynamic Random Access Memory
  • SLDRAM Direct Rambus RAM
  • the electronic device 700 may be an encoding terminal, an encoder, or an encoding framework involved in an embodiment of the present application; the computer-readable storage medium 720 stores a first computer instruction; it is loaded and executed by the processor 710 The first computer instruction stored in the computer-readable storage medium 720 is used to implement the corresponding steps in the encoding method provided by the embodiment of the present application; in other words, the first computer instruction in the computer-readable storage medium 720 is loaded and executed by the processor 710 The corresponding steps are not repeated here in order to avoid repetition.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本申请实施例提供一种编码方法、解码方法、编码器、解码器以及电子设备。所述编码方法包括:利用线性模型,对目标亮度分量重建块进行计算,得到暂时色度分量预测块;利用目标亮度分量块的最佳预测模式对应的滤波器,对所述暂时色度分量预测块进行降采样,得到目标色度分量预测块;对所述目标色度分量块和所述目标色度分量预测块,得到目标色度分量残差块;对所述目标色度分量残差块进行编码,得到码流。本申请利用所述最佳预测模式对应的滤波器,对所述暂时色度分量预测块进行降采样,能够考虑到目标亮度分量块的主要特征信息,进而,能够提高该目标图像块的压缩效果。此外,还能够避免传输用于标识滤波器的标志位,能够降低压缩效率。

Description

编码方法、解码方法、编码器、解码器以及电子设备 技术领域
本申请实施例涉及图像编解码技术领域,并且更具体地,涉及编码方法、解码方法、编码器、解码器以及电子设备。
背景技术
数字视频压缩技术主要是将庞大的数字影像视频数据进行压缩,以便于传输以及存储等。随着互联网视频的激增以及人们对视频清晰度的要求越来越高,尽管已有的数字视频压缩标准能够实现视频解压缩,但目前仍然需要追求更好的数字视频压缩技术,以提升压缩性能。
发明内容
本申请实施例提供一种编码方法、解码方法、编码器、解码器以及电子设备,能够提升编码器的压缩性能。
一方面,提供了一种编码方法,所述编码方法包括:
将目标图像序列中的目标图像帧划分为多个图像块,所述多个图像块包括目标图像块,所述目标图像块包括目标亮度分量块和目标色度分量块;
利用最佳预测模式,对所述目标亮度分量块进行帧内预测,得到所述目标亮度分量预测块;
基于所述目标亮度分量预测块和所述目标亮度分量块的残差块,得到目标亮度分量重建块;
利用线性模型,对所述目标亮度分量重建块进行计算,得到暂时色度分量预测块;所述暂时色度分量预测块的大小与所述目标亮度分量预测块的大小相同;
利用所述最佳预测模式对应的滤波器,对所述暂时色度分量预测块进行降采样,得到目标色度分量预测块;
对所述目标色度分量块和所述目标色度分量预测块,得到目标色度分量残差块;
对所述目标色度分量残差块进行编码,得到码流。
另一方面,提供了一种解码方法,所述解码方法包括:
通过解析码流,获取针对目标图像块的目标色度分量残差块,所述目标图像块包括目标亮度分量块和目标色度分量块,所述目标色度分量残差块为所述目标色度分量块的残差块;
对所述目标亮度分量块进行帧内预测,得到所述目标亮度分量预测块;
基于所述目标亮度分量预测块和所述目标亮度分量块的残差块,得到目标亮度分量重建块;
利用线性模型,对所述目标亮度分量重建块进行计算,得到暂时色度分量预测块;所述暂时色度分量预测块的大小与所述目标亮度分量预测块的大小相同;
利用所述最佳预测模式对应的滤波器,对所述暂时色度分量预测块进行降采样,得到目标色度分量预测块;
基于所述目标色度分量残差块和所述目标色度分量预测块,得到目标色度分量重建块;
基于所述目标色度分量重建块,得到所述目标图像块。
另一方面,本申请实施例提供了一种编码器,用于执行上述第一方面或其各实现方式中的方法。具体地,该编码器包括用于执行上述第一方面或其各实现方式中的方法的功能单元。
另一方面,本申请实施例提供了一种解码器,用于执行上述第二方面或其各实现方式中的方法。具体地,该解码器包括用于执行上述第二方面或其各实现方式中的方法的功能单元。
另一方面,本申请实施例提供了一种电子设备,包括:
处理器,适于实现计算机指令;以及,
计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令适于由处理器加载并执行执行如上述第一方面至第二方面中的任一方面或其各实现方式中的方法。
另一方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机指令,该计算机指令被计算机设备的处理器读取并执行时,使得计算机设备执行上述第一方面至第二方面中的任一方面或其各实现方式中的方法。
另一方面,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述第一方面至第二方面中的任一方面或其各实现方式中的方法。
在数字视频编解码中,亮度分量块与色度分量块的帧内预测过程有较大不同,亮度分量块的预测模式包括62个角度预测模式和3个非角度预测模式,可以通过计算并在62个角度预测模式和3个非 角度预测模式中选出一个最佳预测模式对所述亮度分量块进行帧内预测,而色度分量块的预测模式包括6个预测模式,可以通过计算并在6个预测模式中选出一个最佳预测模式对所述色度分量块进行帧内预测,可见,与色度分量块的帧内预测过程相比,亮度分量块的帧内预测过程更为精确,压缩效果更好。在同一个图像块中,亮度分量块与色度分量块具有特征一致性,即图像块内容的主要特征信息(如方向特征等)在不同分量块中保持一致,且不因线性变换而改变。因此,在亮度分量块经过65个帧内预测模式计算选出的最佳预测模式后,在跨分量预测技术中,基于亮度分量重建块进行线性变换的方式,可得到暂时色度分量预测块,然后对暂时色度分量预测块进行降采样后,可得到亮度分量预测块。
由于暂时色度分量预测块仍然存有该图像块的主要特征信息,因此,在对暂时色度分量预测块进行降采样的过程中,如果能够考虑到该图像块的主要特征信息,则能够提高该图像块的压缩效率。由于用于对亮度分量块进行帧内预测的最佳预测模式,能够体现亮度分量块的主要特征信息,即,能够体现该目标图像块的主要特征信息。换言之,亮度分量块的主要特征信息不同,其最佳预测模式可能不同。
本申请实施例中,利用所述最佳预测模式对应的滤波器,对所述暂时色度分量预测块进行降采样,相当于,利用目标亮度分量块的帧内角度预测的最佳模式作为指导信息对暂时色度分量预测块的降采样滤波器进行优化,使得在对所述暂时色度分量预测块进行降采样的过程中,能够考虑到目标亮度分量块的主要特征信息,即能够考虑到该目标图像块的主要特征信息,进而,能够提高该目标图像块的压缩效果。此外,本申请提供的方案不需要传输用于标识滤波器的标志位,能够降低压缩效率。
附图说明
图1至图3是本申请实施例提供的颜色格式的各分量的分布图。
图4是本申请实施例提供的编码树单元和编码单元的关系的示意性结构图。
图5是本申请实施例提供的编码框架的示意性结构图。
图6是本申请实施例提供的33种角度预测模式的具体方向示意图。
图7是本申请实施例提供的解码框架的示意性结构图。
图8和图9是本申请实施例提供的与编码单元相邻的重构样本的示意性结构图。
图10至图12是本申请实施例提供的用于计算线性模型的参考样本的示意性结构图。
图13是本申请实施例提供的六抽头滤波器的示意性结构图。
图14是本申请实施例提供的跨分量技术的示意性流程图。
图15和图16是本申请实施例提供的编码方法的示意性流程图。
图17至19是本申请实施例提供的降采样滤波器的示意性结构图。
图20是本申请实施例提供的解码方法的示意性流程图。
图21是本申请实施例的编码器的示意性框图。
图22是本申请实施例的解码器的示意性框图。
图23是本申请实施例提供的电子设备的示意结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供的方案可应用于数字视频编码技术领域,例如,图像编解码领域、视频编解码领域、硬件视频编解码领域、专用电路视频编解码领域、实时视频编解码领域。本申请实施例提供的方案可结合至音视频编码标准(Audio Video coding Standard,AVS)、第二代AVS标准(AVS2)或第三代AVS标准(AVS3)。包括但不限于H.264/音视频编码(Audio Video coding,AVC)标准、H.265/高效视频编码(High Efficiency Video Coding,HEVC)标准以及H.266/多功能视频编码(Versatile Video Coding,VVC)标准。本申请实施例提供的方案可以用于对图像进行有损压缩(lossy compression),也可用于对图像进行无损压缩(lossless compression)。该无损压缩可以是视觉无损压缩(visually lossless compression),也可以是数学无损压缩(mathematically lossless compression)。
在数字视频编码过程中,编码器对不同颜色格式的原始视频序列读取不相等的亮度分量的像素和色度分量的像素,即编码器读取一幅黑白图像或彩色图像,然后针对黑白图像或彩色图像进行编码。其中,黑白图像可以包括亮度分量的像素,彩色图像可以包括色度分量的像素,可选的,彩色图像还可以包括亮度分量的像素。原始视频序列的颜色格式可以是亮度色度(YCbCr,YUV)格式或红绿蓝(Red-Green-Blue,RGB)格式等。针对YUV格式,Y表示明亮度(Luminance或Luma),也即是灰 阶值,Cb(U)表示蓝色色差,也可称为蓝色色度分量,Cr(V)表示红色色差,也可称为红色色度分量U和V表示为色度(Chroma)用于描述色差信息,色差信息可以包括色彩信息及饱和度。作为本申请的具体示例,针对颜色格式为4:2:0、4:2:2或4:4:4的视频序列,图1至图3是本申请实施例提供的颜色格式的各分量的分布图,其中,圆形表示Y分量,三角形表示UV分量。如图1所示,4:4:4表示全像素显示(YYYYCbCrCbCrCbCrCbCr)。如图2所示,4:2:2表示每4个像素有4个亮度分量,4个色度分量(YYYYCbCrCbCr)。如图3所示,4:2:0表示每4个像素有4个亮度分量,2个色度分量(YYYYCbCr)。
编码器读取一幅黑白图像或彩色图像之后,将其划分成块数据,并对块数据进行编码。该块数据可以是编码树单元(Coding Tree Unit,CTU)或编码单元块(Coding Unit,CU)。图4是本申请实施例提供的编码树单元和编码单元的关系的示意性结构图,如图4所示,一个编码树单元又可以继续被划分成若干个CU,CU可以为长方形块也可以为正方形块。即编码器可基于CTU或CU进行编码。亮度分量块和色度分量块均可以作为CU进行编码。换言之,数字视频编码器将原始视频序列读取成一帧一帧的图像并将图像分割成CTU,而CTU又可继续划分为不同与相同大小的CU,可针对色度分量块和亮度分量块中分别执行具体编码过程。
编码器通常为混合框架编码模式,一般包含帧内与帧间预测、变换与量化、反变换与反量化、环路滤波及熵编码等操作。帧内预测只参考同一帧图像的信息,预测当前划分块内的像素信息,用于消除空间冗余;帧间预测可以参考不同帧的图像信息,利用运动估计搜索最匹配当前划分块的运动矢量信息,用于消除时间冗余;变换将预测后的图像块转换到频率域,能量重新分布,结合量化可以将人眼不敏感的信息去除,用于消除视觉冗余;熵编码可以根据当前上下文模型以及二进制码流的概率信息消除字符冗余。
为了便于理解,先对本申请提供的编码框架进行简单介绍。
图5是本申请实施例提供的编码框架100的示意性框图。
如图5所示,该编码框架100可包括帧内预测单元180、残差单元110、变换与量化单元120、熵编码单元130、反变换与反量化单元140、以及环路滤波单元150。可选的,该编码框架100还可包括解码图像缓冲单元160和/或帧间预测单元170。该编码框架100也可称为混合框架编码模式。
在编码框架100中,帧内预测单元180或帧间预测单元170可对待编码图像块进行预测,以输出预测块。残差单元110可基于预测块与待编码图像块计算残差块,即预测块和待编码图像块的差值。该残差块经由变换与量化单元120变换与量化等过程,可以去除人眼不敏感的信息,以消除视觉冗余。可选的,经过变换与量化单元120变换与量化之前的残差块可称为时域残差块,经过变换与量化单元120变换与量化之后的时域残差块可称为频率残差块或频域残差块。熵编码单元130接收到变换与量化单元120输出的变换量化系数后,可基于该变换量化系数输出码流。例如,熵编码单元130可根据目标上下文模型以及二进制码流的概率信息消除字符冗余。例如,熵编码单元130可以用于基于上下文的自适应二进制算术熵编码(CABAC)。熵编码单元130也可称为头信息编码单元。可选的,在本申请中,该待编码图像块也可称为原始图像块或目标图像块,预测块也可称为预测图像块或图像预测块,还可以称为预测信号或预测信息,重建块也可称为重建图像块或图像重建块,还可以称为重建信号或重建信息。此外,针对编码端,该待编码图像块也可称为编码块或编码图像块,针对解码端,该待编码图像块也可称为解码块或解码图像块。该待编码图像块可以是CTU或CU。
简言之,编码框架100将预测块与待编码图像块计算残差得到残差块经由变换与量化等过程,将残差块传输到解码端。解码端接收并解析码流后,经过反变换与反量化等步骤得到残差块,将解码端预测得到的预测块叠加残差块后得到重建块。
需要说明的是,编码框架100中的反变换与反量化单元140、环路滤波单元150以及解码图像缓冲单元160可用于形成一个解码器。相当于,帧内预测单元180或帧间预测单元170可基于已有的重建块对待编码图像块进行预测,进而能够保证编码端和解码端的对参考帧的理解一致。换言之,编码器可复制解码器的处理环路,进而可与解码端产生相同的预测。具体而言,量化的变换系数通过反变换与反量化单元140反变换与反量化来复制解码端的近似残差块。该近似残差块加上预测块后可经过环路滤波单元150,以平滑滤除由于基于块处理和量化产生的块效应等影响。环路滤波单元150输出的图像块可存储在解码图像缓存单元160中,以便用于后续图像的预测。
帧内预测单元180可用于帧内预测,帧内预测只参考同一帧图像的信息,预测待编码图像块内的像素信息,用于消除空间冗余;帧内预测所使用的帧可以为I帧。例如,可根据从左至右、从上到下的编码顺序,待编码图像块可以参考左上方图像块,上方图像块以及左侧图像块作为参考信息来预测待编码图像块,而待编码图像块又作为下一个图像块的参考信息,如此,可对整幅图像进行预测。若输入的数字视频为彩色格式,例如YUV 4:2:0格式,则该数字视频的每一图像帧的每4个像素点由4 个Y分量和2个UV分量组成,编码框架100可对Y分量(即亮度块)和UV分量(即色度块)分别进行编码。类似的,解码端也可根据格式进行相应的解码。帧间预测单元170可用于帧间预测,帧间预测可以参考不同帧的图像信息,利用运动估计搜索最匹配待编码图像块的运动矢量信息,用于消除时间冗余;帧间预测所使用的帧可以为P帧和/或B帧,P帧指的是向前预测帧,B帧指的是双向预测帧。
针对帧内预测过程,帧内预测可借助角度预测模式与非角度预测模式对待编码图像块进行预测,以得到预测块,根据预测块与待编码图像块计算得到的率失真信息,筛选出待编码图像块最优的预测模式,并将该预测模式经码流传输到解码端。解码端解析出预测模式,预测得到目标解码块的预测块并叠加经码流传输而获取的时域残差块,可得到重建块。经过历代的数字视频编解码标准发展,非角度模式保持相对稳定,有均值模式和平面模式;角度模式则随着数字视频编解码标准的演进而不断增加。以国际数字视频编码标准H系列为例,H.264/AVC标准仅有8种角度预测模式和1种非角度预测模式;H.265/HEVC扩展到33种角度预测模式和2种非角度预测模式。在H.266/VVC中,帧内预测模式被进一步拓展,对于亮度块共有67种传统预测模式和非传统的预测模式。非传统的预测模式可以包括矩阵加权帧内预测(Matrix weighted intra-frame prediction,MIP)模式。传统预测模式包括:模式编号0的平面(planar)模式、模式编号1的DC模式和模式编号2到模式编号66的角度预测模式。
图6为本申请实施例提供的66种角度预测模式的具体方向示意图。
如图6所示,区域1至区域4包括66种角度预测模式,这66种角度预测模式可分为水平类模式、竖直类模式以及对角线模式,水平类模式的模式值小于等于对角线模式的模式值,垂直模式的模式值大于对角线模式的模式值,非角度模式包括平面模式和DC模式。模式编号为12的模式所在的方向和模式编号为24的模式所在的方向分别表示竖直和水平方向,其余角度预测模式的预测方向都可以看作是在竖直或水平方向上做一个角度偏移。模式编号18的模式可作为对角线模式。
VVC的参考软件测试平台(VVC TEST MODEL,VTM)对于色度块除了planar模式、DC模式和角度模式外,还有跨分量线性模型预测(Cross component linear model prediction,CCLM)模式。MIP模式目前为VVC独有,而CCLM模式也存在于其它先进的标准里,例如AV1的来自亮度的色度(Chroma from Luma,CfL)模式和AVS3的两步跨分量预测模式(Two Step Cross-component Prediction Mode,TSCPM)。在TSCPM中,编码器可根据率失真(Rate Distortion)代价最优选出亮度分量块的最佳预测模式并传输该最佳预测模式和相应预测残差等。
图7是本申请实施例提供的解码框架200的示意性框图。
如图7所示,该解码框架200可包括熵解码单元210、反变换反量化单元220、残差单元230、帧内预测单元240、帧间预测单元250、环路滤波单元260、解码图像缓存单元270。
熵解码单元210接收并解析码流后,以获取预测块和频域残差块,针对频域残差块,通过反变换反量化单元220进行反变换与反量化等步骤,可获取时域残差块,残差单元230将帧内预测单元240或帧间预测单元250预测得到的预测块叠加至经过通过反变换反量化单元220进行反变换与反量化之后的时域残差块,可得到重建块。例如,帧内预测单元240或帧间预测单元250可通过解码码流的头信息,获取预测块。
应理解,图5至图7仅为本申请的示例,不应理解为对本申请的限制。
例如,该编码框架100中的环路滤波单元150可包括去块滤波器(DBF)和样点自适应补偿滤波(SAO)。DBF的作用是去块效应,SAO的作用是去振铃效应。在本申请的其他实施例中,该编码框架100可采用基于神经网络的环路滤波算法,以提高视频的压缩效率。或者说,该编码框架100可以是基于深度学习的神经网络的视频编码混合框架。在一种实现中,可以在去块滤波器和样点自适应补偿滤波基础上,采用基于卷积神经网络的模型计算对像素滤波后的结果。环路滤波单元150在亮度分量和色度分量上的网络结构可以相同,也可以有所不同。考虑到亮度分量包含更多的视觉信息,还可以采用亮度分量指导色度分量的滤波,以提升色度分量的重建质量。
需要说明的是,在数字视频编解码中,亮度分量块与色度分量块的帧内预测过程有较大不同,亮度分量块的预测模式包括62个角度预测模式和3个非角度预测模式,可以通过计算并在62个角度预测模式和3个非角度预测模式中选出一个最佳预测模式对所述亮度分量块进行帧内预测,而色度分量块的预测模式包括6个预测模式,可以通过计算并在6个预测模式中选出一个最佳预测模式对所述色度分量块进行帧内预测,可见,与色度分量块的帧内预测过程相比,亮度分量块的帧内预测过程更为精确,压缩效果更好。在同一个图像块中,亮度分量块与色度分量块具有特征一致性,即图像块内容的主要特征信息(如方向特征等)在不同分量块中保持一致,且不因线性变换而改变。因此,在亮度分量块经过65个帧内预测模式计算选出的最佳预测模式后,在跨分量预测技术中,基于亮度分量重 建块进行线性变换的方式,可得到暂时色度分量预测块,然后对暂时色度分量预测块进行降采样后,可得到亮度分量预测块。
为便于理解本申请的方案,下面对跨分量预测技术进行说明。
跨分量预测技术具体实施过程作用于帧内预测过程中,编码器使用亮度分量块(Luminance Block)的训练样本训练用于预测色度分量块(Chrominance Block)的线性模型(Linear Model),以及使用参考样本和线性模型来确定暂时色度分量预测块。本申请中的线性模型可以理解为用于CCLM的线性模型的简称。为便于理解,下面以编码器使用目标亮度分量块的训练样本训练用于预测目标色度分量块的线性模型,以及使用参考样本和线性模型来确定暂时色度分量预测块为例对跨分量预测模式进行说明。
在VVC中,使用线性模型来减少分量之间的冗余。其线性模型通过与目标亮度分量块相邻的原始样本与重构样本训练得到。所述与目标亮度分量块相邻的原始样本与重构样本可包括以下样本中的部分和全部:与目标亮度分量块相邻的上侧原始样本与上侧重构样本、与目标亮度分量块相邻的左侧原始样本与左侧重构样本、与目标亮度分量块相邻的右上侧原始样本与右上侧重构样本、与目标亮度分量块相邻的左下侧原始样本与左下侧重构样本、以及与目标亮度分量块相邻的左上侧原始样本与左上侧重构样本。
图8和图9是本申请实施例提供的与编码单元相邻的重构样本的示意性结构图。
如图8所示,针对一个8x8的亮度分量块,所述与该8x8的亮度分量块相邻的重构样本可包括:与该8x8的亮度分量块相邻的上侧8个重构样本点、与该8x8的亮度分量块相邻的左侧8个重构样本点、与该8x8的亮度分量块相邻的右上侧4个重构样本点、以及与该8x8的亮度分量块相邻的左下侧4个重构样本点。如图9所示,针对一个颜色格式YUV4:2:0之下的4x4的亮度分量块,所述与该4x4的亮度分量块相邻的重构样本可包括:与该4x4的亮度分量块相邻的上侧4个重构样本点、与该4x4的亮度分量块相邻的左侧4个重构样本点、与该4x4的亮度分量块相邻的右上侧4个重构样本点、以及与该4x4的亮度分量块相邻的左下侧4个重构样本点。
在目标图像块中,针对目标色度分量块预测得到的色度分量预测块。具体而言,可先由目标亮度分量重建块经过线性模型后得到暂时色度分量预测块,并对所述暂时色度分量预测块进行降采样得到目标色度分量预测块。
其中,基于线性模型的计算过程可表示如下:
Pred C(i,j)=α·Rec L(i,j)+β;
其中,Pred C(i,j)表示所述暂时色度分量预测块中像素的预测值,Rec L(i,j)表示所述目标亮度分量重建块,Rec L(i,j)可以是经降采样滤波器处理后的亮度分量重建块,也可以是未经降采样滤波器处理后的亮度分量重建块,α和β分别为基于参考样本得到的参数。
在对色度分量预测块进行跨分量帧内预测时,可基于参考样本计算线性模型,即基于参考样本确定α和β。其中,参考样本可包括与目标亮度分量块相邻的重建样本以及与目标色度分量块相邻的重建样本。与目标亮度分量块相邻的重建样本包括:与目标亮度分量块相邻的上侧重建样本以及左侧重建样本;与目标色度分量块相邻的重建样本包括:与目标色度分量块相邻的上侧重建样本以及左侧重建样本。图10至图12是本申请实施例提供的用于计算线性模型的参考样本的示意性结构图。如图10所示,若参考样本来自两参考侧时,则CU的上侧参考样本选取上侧第一样本点与上侧最右后样本点,CU的左侧参考样本选取左侧第一样本点与左侧最下样本点。如图11所示,若参考样本只来自上侧时,以CU的宽度的四分之一距离为步长,等间隔选取四个样本点。如图12所示,若参考样本只来自左侧时,以CU的高度的四分之一距离为步长,等间隔选取四个样本点。
具体地,在选取参考样本作为计算样本时,可以结合与目标亮度分量块相邻的重建样本和与目标色度分量块相邻的重建样本的可用性确定参考样本。作为示例,可以采用两个上侧相邻重建样本与两个左侧相邻重建样本的组合,还可以全部采用四个上侧相邻重建样本,以及全部采用四个左侧相邻重建样本。根据上述参考样本的选择不同,目标色度分量块的预测模式不同。例如,若上侧相邻重建样本和左侧相邻重建样本可用,且线性模型计算采用的参考样本同时来自上侧和左侧相邻重建样本时;或若只有上侧相邻重建样本可用,且线性模型计算采用的参考样本只选上侧相邻重建样本时;或若只有左侧相邻重建样本可用,且线性模型计算采用的参考样本只选左侧相邻重建样本时;所述目标色度分量块的预测模式均为TSCPM模式。若上侧相邻重建样本和左侧相邻重建样本可用,且线性模型计算采用的参考样本只选上侧相邻重建样本时,所述目标色度分量块的预测模式为上侧TSCPM(TSCPM top,TSCPM_T)模式。若上侧相邻重建样本和左侧相邻重建样本可用,且线性模型计算采用的参考样本只选左侧相邻重建样本时,所述目标色度分量块的预测模式为左侧TSCPM(TSCPM left, TSCPM_L)模式。
在一种实现中,α和β可通过以下公式得到:
α=(Y Max-Y Min)/(X Max-X Min);
β=Y Min-α·X Min
其中,Y Max表示采用的与目标色度分量块相邻的重建样本中两个最大样本值的平均值,Y Min表示采用的目标色度分量块相邻的重建样本中两个最小样本值的平均值。X Max表示采用的与目标亮度分量块相邻的重建样本中的两个最大样本值的平均值,X Min表示采用的与目标亮度分量块相邻的重建样本中的两个最小样本值的平均值。
综上,在对色度分量预测块进行跨分量帧内预测时,编码器可根据计算得到的线性模型进行跨分量预测,在目标图像块中,目标亮度分量重建块被用于生成相对应的暂时色度预测分量块(Temporary Chroma Prediction Block)。即编码器可基于α和β,计算出暂时色度分量预测块,该暂时色度分量预测块的大小与亮度分量预测块的大小相同。
在针对暂时色度分量预测块的降采样过程中,假设输入数字视频颜色格式一般为YUV4:2:0格式,即目标色度分量块的大小为目标亮度分量块的四分之一。为得到相对应的正确大小色度分量块,该暂时色度分量预测块需要分别对水平和垂直方向进行二分之一降采样,经过降采样之后的色度分量预测块为相对应的亮度分量块四分之一大小。其中,上述对暂时色度分量预测块进行降采样所采用的滤波器在该暂时色度分量预测块的左边界处采用两抽头相同系数的滤波器,而在其他位置均采用六抽头两个不同系数的降采样滤波器。
非左边界上的降采样过程如以下公式计算得到:
Figure PCTCN2021076059-appb-000001
其中,P C表示所述目标色度分量预测块中像素的预测值,P′ C表示所述暂时色度分量预测块中像素的预测值,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
左边界上的降采样过程如以下公式计算得到:
P C=(P′ C(2x,2y)+2×P′ C(2x,2y+1)+1)>>3。
其中,P C表示所述目标色度分量预测块中像素的预测值,P′ C表示所述暂时色度分量预测块中像素的预测值,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
图13是本申请实施例提供的六抽头滤波器的示意性结构图。
如图13所示,针对非左边界上的降采样过程,采用六抽头两个不同系数的降采样滤波器对所述暂时色度分量预测块进行降采样。作为示例,可对所述暂时色度分量预测块中的第2行第2列、第2行第3列、第2行第4列、第3行第2列、第3行第3列、第3行第4列的像素进行降采样,以得到所述目标色度分量预测块中的第x列,第y行像素的预测值。
通常而言,自然视频中包含各种角度方向的特征信息,在帧内编码过程中,针对目标亮度分量块,编码器可以计算多个角度预测模式,并选出最优预测模式,以得到更好的角度预测效果和提高压缩效率。现有跨分量预测技术利用目标亮度分量重建块,进行线性变换得到暂时色度分量预测块,该暂时色度分量预测块包含较多亮度分量的特征信息,如方向特征等。使用单一的六抽头两不同系数对该暂时色度分量预测块进行降采样,并没有考虑到当前视频内容的一些突出特征信息,将所有内容进行统一模糊。
换言之,由于暂时色度分量预测块仍然存有该图像块的主要特征信息,因此,在对暂时色度分量预测块进行降采样的过程中,如果能够考虑到该图像块的主要特征信息,则能够提高该图像块的压缩效率。由于用于对亮度分量块进行帧内预测的最佳预测模式,能够体现亮度分量块的主要特征信息,即,能够体现该目标图像块的主要特征信息。换言之,亮度分量块的主要特征信息不同,其最佳预测模式可能不同。
本申请实施例提供一种编码方法,在所述编码方法中,利用所述最佳预测模式对应的滤波器,对所述暂时色度分量预测块进行降采样,相当于,利用目标亮度分量块的帧内角度预测的最佳模式作为 指导信息对暂时色度分量预测块的降采样滤波器进行优化,使得在对所述暂时色度分量预测块进行降采样的过程中,能够考虑到目标亮度分量块的主要特征信息,即能够考虑到该目标图像块的主要特征信息,进而,能够提高该目标图像块的压缩效果。
图14是本申请实施例提供的跨分量技术的示意性流程图。
如图14所示,编码器利用线性模型,对所述目标亮度分量重建块进行计算后,可以得到暂时色度分量预测块,然后通过对所述暂时色度分量预测块进行降采样后,可以得到目标色度分量预测块。
图15是本申请实施例提供的编码方法300的示意性流程图。应理解,该编码方法300可由编码器执行。例如应用于图5所示的编码框架100。为便于描述,下面以编码器为例进行说明。
如图15所示,所述编码方法300可包括:
S310,将目标图像序列中的目标图像帧划分为多个图像块,所述多个图像块包括目标图像块,所述目标图像块包括目标亮度分量块和目标色度分量块;
S320,利用最佳预测模式,对所述目标亮度分量块进行帧内预测,得到所述目标亮度分量预测块;
S330,基于所述目标亮度分量预测块和所述目标亮度分量块的残差块,得到目标亮度分量重建块;
S340,利用线性模型,对所述目标亮度分量重建块进行计算,得到暂时色度分量预测块;所述暂时色度分量预测块的大小与所述目标亮度分量预测块的大小相同;
S350,利用所述最佳预测模式对应的滤波器,对所述暂时色度分量预测块进行降采样,得到目标色度分量预测块;
S360,对所述目标色度分量块和所述目标色度分量预测块,得到目标色度分量残差块;
S370,对所述目标色度分量残差块进行编码,得到码流。
例如,编码器获取标志位和所述目标图像块,所述目标图像块包括目标亮度分量块和目标色度分量块,所述标志位用于标识是否使用跨分量预测技术;在所述标识位用于表示使用跨分量预测技术的情况下,利用最佳预测模式,对所述目标亮度分量块进行帧内预测,得到所述目标亮度分量预测块。例如,编码器在所述最佳预测模式是否符合特定方向性的情况下,利用所述最佳预测模式对应的滤波器,对所述暂时色度分量预测块进行降采样,得到目标色度分量预测块;即在跨分量预测模式中,目标图像块不同的方向性对应不同的滤波器。
本申请实施例中,利用所述最佳预测模式对应的滤波器,对所述暂时色度分量预测块进行降采样,相当于,利用目标亮度分量块的帧内角度预测的最佳模式作为指导信息对暂时色度分量预测块的降采样滤波器进行优化,使得在对所述暂时色度分量预测块进行降采样的过程中,能够考虑到目标亮度分量块的主要特征信息,即能够考虑到该目标图像块的主要特征信息,进而,能够提高该目标图像块的压缩效果。此外,本申请提供的方案不需要传输用于标识滤波器的标志位,能够降低压缩效率。
应当理解,所述标志位用于控制在所述目标图像序列、目标图像帧或所述目标图像块是否使用跨分量预测技术,如该标志位为1则代表使用跨分量预测技术,为0则代表不使用跨分量预测技术。在具体实现中,可以通过用户设置的方式控制参数集是否开启控制标识,在参数集中开启所述允许标识的情况下,代表需要获取所述标志位的具体数值,此时,可通过查询用户配置的配置文件获取所述标志位的具体数值,即该标志位为1还是为0。
针对数字视频编解码技术,可通过比约加德增量比特率(
Figure PCTCN2021076059-appb-000002
delta bit rate,BD-rate)衡量编码器的性能,本申请在通用测试条件(common test condition,CTC)下,利用AVS3的参考软件,即高性能模型(High-Performance Model,HPM),对本申请提供的方案进行了性能测试。表1概述了测试的所有帧内(All Intra,AI)配置的仿真结果,下面结合表1对第一预测模式的预测性能进行说明。
表1
序列类别 Y U V
通甲(4K) 0.05% 0.01% 0.04%
通乙(1080P) -0.04% -0.24% 0.14%
通丙(720P) -0.01% 0.08% -0.74%
总体 0.00% -0.05% -0.19%
如表1所示,在Y分量没有损失的情况下,UV分量均有编码增益,U分量的BD-rate和V分量的BD-rate分别有0.05%及0.19%的增益(gain)。其中,通甲为4K的测试视频,通乙为1080P的测试视频,通丙为720p的测试视频。BD-rate为负代表测试结果的性能得到提升。BD-rate代表相同PSNR下的码率差异,BD-rate越小表示编码算法的性能越好。
需要说明的是,一般来说,PSNR随码率的降低而增大,能够说明新方法具有较好的性能。然而,会出现这样一种情况,即码率相对于原来的方法有所降低,但是PSNR即视频的质量却降低了,在这种情况下,可以采用BD-rate衡量编码算法的性能。当然,在视频处理过程中,也可利用其他参数来 衡量编码算法的性能,以表征利用新方法得到的视频相对于原来的方法得到的视频在码率和PSNR上的变化情况,本申请实施例对此不作具体限定。例如,也可采用比约加德增量信号噪音功率比(
Figure PCTCN2021076059-appb-000003
delta peak signal-to-noise rate,BD-PSNR)来衡量编码算法的性能,BDPSNR代表相同码率下的PSNR的差异,BD-PSNR越大表示编码算法的性能越好。
在本申请的一些实施例中,所述S350之前,所述方法300还可包括:
根据所述目标色度分量块的预测模式,确定可用的参考样本;所述参考样本包括与所述目标亮度分量块相邻的重建样本和与所述目标色度分量块相邻的重建样本;基于所述参考样本,计算所述线性模型。
例如,编码器根据所述目标色度分量块的预测模式,确定可用的参考样本;所述参考样本包括与所述目标亮度分量块相邻的重建样本和与所述目标色度分量块相邻的重建样本;基于所述参考样本,计算α和β。其中,参考样本可包括与目标亮度分量块相邻的重建样本以及与目标色度分量块相邻的重建样本。与目标亮度分量块相邻的重建样本包括:与目标亮度分量块相邻的上侧重建样本以及左侧重建样本;与目标色度分量块相邻的重建样本包括:与目标色度分量块相邻的上侧重建样本以及左侧重建样本。在选取参考样本作为计算样本时,可以结合与目标亮度分量块相邻的重建样本和与目标色度分量块相邻的重建样本的可用性确定参考样本。作为示例,可以采用两个上侧相邻重建样本与两个左侧相邻重建样本的组合,还可以全部采用四个上侧相邻重建样本,以及全部采用四个左侧相邻重建样本。根据上述参考样本的选择不同,目标色度分量块的预测模式不同。例如,若上侧相邻重建样本和左侧相邻重建样本可用,且线性模型计算采用的参考样本同时来自上侧和左侧相邻重建样本时;或若只有上侧相邻重建样本可用,且线性模型计算采用的参考样本只选上侧相邻重建样本时;或若只有左侧相邻重建样本可用,且线性模型计算采用的参考样本只选左侧相邻重建样本时;所述目标色度分量块的预测模式均为TSCPM模式。若上侧相邻重建样本和左侧相邻重建样本可用,且线性模型计算采用的参考样本只选上侧相邻重建样本时,所述目标色度分量块的预测模式为上侧TSCPM(TSCPM top,TSCPM_T)模式。若上侧相邻重建样本和左侧相邻重建样本可用,且线性模型计算采用的参考样本只选左侧相邻重建样本时,所述目标色度分量块的预测模式为左侧TSCPM(TSCPM left,TSCPM_L)模式。需要说明的是,本申请实施例中涉及的参考样本可以参考上文图10至图12所示的内容以及相关描述,为避免重复,此处不再赘述。
图16是本申请实施例提供的编码方法380的示意性流程图。应理解,该编码方法380可由编码器执行。例如应用于图5所示的编码框架100。为便于描述,下面以编码器为例进行说明。
如图16所示,所述方法380可包括:
S381,编码器获取参考样本。
若当前色度分量的预测模式为两步跨分量预测模式TSCPM或者增强的两步跨分量预测模式TSCPM_T以及TSCPM_L,则编码器首先对目标亮度分量块进行帧内预测,并得到亮度分量重建块。编码器根据目标图像块相邻的重构样本与目标色度分量块的预测模式获取线性模型的参考样本。
S382,编码器基于所述参考样本进行线性模型的计算。
S383,编码器根据计算得到的线性模型对目标亮度分量重建块进行计算,以得到暂时色度分量预测块;所述暂时色度分量预测块的大小与所述目标亮度分量预测块的大小相同。
S384,编码器获取目标亮度分量块的最佳预测模式。
S385,编码器判断最佳预测模式是否为特定预测模式?
S386,若最佳预测模式不是特定预测模式,编码器使用普通滤波器对所述暂时色度分量预测块进行降采样。
S387,若最佳预测模式为特定预测模式,编码器使用所述特定预测模式对应的特定滤波器,对所述暂时色度分量预测块进行降采样。
S388,得到目标色度分量预测块。
具体来说,编码器判断所述最佳预测模式是否是特定的预测模式,若是特定的预测模式,则利用所述最佳预测模式对应的滤波器,对所述暂时色度分量预测块进行降采样,得到目标色度分量预测块;若不是特定的预测模式则使用原始的滤波器进行降采样得到色度预测块。
在本申请的一些实施例中,所述最佳预测模式为垂直类模式;所述S350可包括:
在所述暂时色度分量预测块的上边界上,采用两个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块;在所述暂时色度分量预测块的非上边界上,采用两个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块。
例如,所述竖直类模式是模式编号为12的模式,当然,也可以是编码为其他值的模式,本申请 实施例对此不作具体限定。
需要说明的是,本申请实施例中涉及的两个两抽头相同系数的滤波器可以理解为两个两抽头滤波器,且所述两个两抽头滤波器中的每一个量抽头滤波器中的两个抽头系数相同,甚至所述两个两抽头滤波器的四个抽头系数相同。类似的,所述两个三抽头两个不同系数的滤波器可以理解为两个三抽头滤波器,且所述两个三抽头滤波器中的每一个三抽头滤波器包括的三个抽头系数可包括两个不相同的抽头系数。
在一种实现方式中,在所述暂时色度分量预测块的上边界上,基于以下公式确定所述目标色度分量预测块:
Figure PCTCN2021076059-appb-000004
Figure PCTCN2021076059-appb-000005
Figure PCTCN2021076059-appb-000006
其中,P C表示所述目标色度分量预测块中像素的预测值,
Figure PCTCN2021076059-appb-000007
Figure PCTCN2021076059-appb-000008
表示分别使用所述两个两抽头相同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
换言之,,在所述暂时色度分量预测块的上边界上,可以对4个像素进行降采样,以得到所述目标色度分量预测块中1个像素的预测值。(P′ C(2x,2y)+P′ C(2x,2y+1)+1)>>1>>1等价于将(P′ C(2x,2y)+P′ C(2x,2y+1)+1)的值除以2。类似的,(P′ C(2x+1,2y)+P′ C(2x+1,2y+1)+1)>>1等价于将(P′ C(2x+1,2y)+P′ C(2x+1,2y+1)+1)的值除以2。
在一种实现方式中,在所述暂时色度分量预测块的非上边界上,基于以下公式确定所述目标色度分量预测块:
Figure PCTCN2021076059-appb-000009
Figure PCTCN2021076059-appb-000010
Figure PCTCN2021076059-appb-000011
其中,P C表示所述目标色度分量预测块中像素的预测值,
Figure PCTCN2021076059-appb-000012
Figure PCTCN2021076059-appb-000013
表示分别使用所述两个三抽头两个不同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
图17是本申请实施例提供的利用两个三抽头两个不同系数的滤波器进行降采样的示意图。
如图17所示,所述两个不同系数分别为2和3。针对非左边界上的降采样过程,采用两个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样。作为示例,可利用一个三抽头两个不同系数的滤波器对所述暂时色度分量预测块中的第2行第3列、第3行第3列、第4行第3列像素进行降采样,以得到一个采样结果;利用另一个三抽头两个不同系数的滤波器对所述暂时色度分量预测块中的第2行第4列、第3行第4列、第4行第4列像素进行降采样,以得到另一个采样结果,然后将基于这两个采样结果的最大值确定为所述目标色度分量预测块中的第x列,第y行像素的预测值。
在本申请的一些实施例中,所述最佳预测模式为水平类模式;所述S350可包括:
在所述暂时色度分量预测块的左边界上,采用两个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块;在所述暂时色度分量预测块的非左边界上,采用两个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块。
例如,所述竖直类模式是模式编号为24的模式,当然,也可以是编码为其他值的模式,本申请实施例对此不作具体限定。
在一种实现方式中,在所述暂时色度分量预测块的左边界上,基于以下公式确定所述目标色度分量预测块:
Figure PCTCN2021076059-appb-000014
Figure PCTCN2021076059-appb-000015
Figure PCTCN2021076059-appb-000016
其中,P C表示所述目标色度分量预测块中像素的预测值,
Figure PCTCN2021076059-appb-000017
Figure PCTCN2021076059-appb-000018
表示分别使用所述两个两抽头相同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
在一种实现方式中,在所述暂时色度分量预测块的非左边界上,基于以下公式确定所述目标色度分量预测块:
Figure PCTCN2021076059-appb-000019
Figure PCTCN2021076059-appb-000020
Figure PCTCN2021076059-appb-000021
其中,P C表示所述目标色度分量预测块中像素的预测值,
Figure PCTCN2021076059-appb-000022
Figure PCTCN2021076059-appb-000023
表示分别使用所述两个三抽头两个不同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
图18是本申请实施例提供的利用两个三抽头两个不同系数的滤波器进行降采样的另一示意图。
如图18所示,所述两个不同系数分别为2和3。针对非左边界上的降采样过程,采用两个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样。作为示例,可利用一个三抽头两个不同系数的滤波器对所述暂时色度分量预测块中的第1行第2列、第1行第3列、第1行第4列像素进行降采样,以得到一个采样结果;利用另一个三抽头两个不同系数的滤波器对所述暂时色度分量预测块中的第2行第2列、第2行第3列、第2行第4列像素进行降采样,以得到另一个采样结果,然后将基于这两个采样结果的最大值确定为所述目标色度分量预测块中的第x列,第y行像素的预测值。
在本申请的一些实施例中,所述最佳预测模式为对角线类模式;所述S350可包括:
在所述暂时色度分量预测块的左边界和上边界上,采用一个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的采样结果确定为所述目标色度分量预测块;在所述暂时色度分量预测块的非边界上,采用一个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的采样结果确定为所述目标色度分量预测块。
例如,所述竖直类模式是模式编号为18的模式,当然,也可以是编码为其他值的模式,本申请实施例对此不作具体限定。
在一种实现方式中,在所述暂时色度分量预测块的左边界和上边界上,基于以下公式确定所述目标色度分量预测块:
P C=(P′ C(2x,2y)+P′ C(2x+1,2y+1)+1)>>1;
其中,P C表示所述目标色度分量预测块中像素的预测值,P′ C表示所述暂时色度分量预测块中像素的预测值,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
在一种实现方式中,在所述暂时色度分量预测块的非边界上,基于以下公式确定所述目标色度分量预测块:
P C=(3×P′ C(2x,2y)+3×P′ C(2x+1,2y+1)+2×P′ C(2x-1,2y-1)+4)>>3;
其中,P C表示所述目标色度分量预测块中像素的预测值,P′ C表示所述暂时色度分量预测块中像素的预测值,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
图19是本申请实施例提供的利用一个三抽头两个不同系数的滤波器进行降采样的另一示意图。
如图19所示,所述两个不同系数分别为2和3。针对在所述暂时色度分量预测块的非边界上的降采样过程,采用一个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样。作为示例,可利用一个三抽头两个不同系数的滤波器对所述暂时色度分量预测块中的第2行第2列、第3行第3列、第4行第4列像素进行降采样,以得到一个采样结果;并将该一个采样结果确定为所述目标色度分量预测块中的第x列,第y行像素的预测值。
本申请还提供了一种与编码方法300匹配的解码方法。
图20是本申请实施例提供的解码方法的示意性流程图。应理解,该解码方法400可由解码器执行。例如应用于图7所示的解码框架200。
如图20所示,所述解码方法400可包括:
S410,通过解析码流,获取针对目标图像块的目标色度分量残差块,所述目标图像块包括目标亮度分量块和目标色度分量块,所述目标色度分量残差块为所述目标色度分量块的残差块;
S420,对所述目标亮度分量块进行帧内预测,得到所述目标亮度分量预测块;
S430,基于所述目标亮度分量预测块和所述目标亮度分量块的残差块,得到目标亮度分量重建块;
S440,利用线性模型,对所述目标亮度分量重建块进行计算,得到暂时色度分量预测块;所述暂时色度分量预测块的大小与所述目标亮度分量预测块的大小相同;
S450,利用所述最佳预测模式对应的滤波器,对所述暂时色度分量预测块进行降采样,得到目标色度分量预测块;
S460,基于所述目标色度分量残差块和所述目标色度分量预测块,得到目标色度分量重建块;
S470,基于所述目标色度分量重建块,得到所述目标图像块。
在本申请的一些实施例中,所述S450之前,所述方法400还可包括:
根据所述目标色度分量块的预测模式,确定可用的参考样本;所述参考样本包括与所述目标亮度分量块相邻的重建样本和与所述目标色度分量块相邻的重建样本;基于所述参考样本,计算所述线性模型。
在本申请的一些实施例中,所述最佳预测模式为垂直类模式;所述S450可包括:
在所述暂时色度分量预测块的上边界上,采用两个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块;在所述暂时色度分量预测块的非上边界上,采用两个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块。
在一种实现方式中,在所述暂时色度分量预测块的上边界上,基于以下公式确定所述目标色度分量预测块:
Figure PCTCN2021076059-appb-000024
Figure PCTCN2021076059-appb-000025
Figure PCTCN2021076059-appb-000026
其中,P C表示所述目标色度分量预测块中像素的预测值,
Figure PCTCN2021076059-appb-000027
Figure PCTCN2021076059-appb-000028
表示分别使用所述两个两抽头相同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
在一种实现方式中,在所述暂时色度分量预测块的非上边界上,基于以下公式确定所述目标色度分量预测块:
Figure PCTCN2021076059-appb-000029
Figure PCTCN2021076059-appb-000030
Figure PCTCN2021076059-appb-000031
其中,P C表示所述目标色度分量预测块中像素的预测值,
Figure PCTCN2021076059-appb-000032
Figure PCTCN2021076059-appb-000033
表示分别使用所述两个三抽头两个不同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
在本申请的一些实施例中,所述最佳预测模式为水平类模式;所述S450可包括:
在所述暂时色度分量预测块的左边界上,采用两个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块;在所述暂时色度分量预测块的非左边界上,采用两个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块。
在一种实现方式中,在所述暂时色度分量预测块的左边界上,基于以下公式确定所述目标色度分量预测块:
Figure PCTCN2021076059-appb-000034
Figure PCTCN2021076059-appb-000035
Figure PCTCN2021076059-appb-000036
其中,P C表示所述目标色度分量预测块中像素的预测值,
Figure PCTCN2021076059-appb-000037
Figure PCTCN2021076059-appb-000038
表示分别使用所述两个两抽头相同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
在一种实现方式中,在所述暂时色度分量预测块的非左边界上,基于以下公式确定所述目标色度分量预测块:
Figure PCTCN2021076059-appb-000039
Figure PCTCN2021076059-appb-000040
Figure PCTCN2021076059-appb-000041
其中,P C表示所述目标色度分量预测块中像素的预测值,
Figure PCTCN2021076059-appb-000042
Figure PCTCN2021076059-appb-000043
表示分别使用所述两个三抽头两个不同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
在本申请的一些实施例中,所述最佳预测模式为对角线类模式;所述S450可包括:
在所述暂时色度分量预测块的左边界和上边界上,采用一个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的采样结果确定为所述目标色度分量预测块;在所述暂时色度分量预测块的非边界上,采用一个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的采样结果确定为所述目标色度分量预测块。
在一种实现方式中,在所述暂时色度分量预测块的左边界和上边界上,基于以下公式确定所述目标色度分量预测块:
P C=(P′ C(2x,2y)+P′ C(2x+1,2y+1)+1)>>1;
其中,P C表示所述目标色度分量预测块中像素的预测值,P′ C表示所述暂时色度分量预测块中像素的预测值,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
在一种实现方式中,在所述暂时色度分量预测块的非边界上,基于以下公式确定所述目标色度分量预测块:
P C=(3×P′ C(2x,2y)+3×P′ C(2x+1,2y+1)+2×P′ C(2x-1,2y-1)+4)>>3;
其中,P C表示所述目标色度分量预测块中像素的预测值,P′ C表示所述暂时色度分量预测块中像素的预测值,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
应理解,解码方法400的过程为编码方法300的逆过程,即解码方法400中的步骤可以参考编码方法300中的相应步骤,为了简洁,在此不再赘述。
以上结合附图详细描述了本申请的优选实施方式,但是,本申请并不限于上述实施方式中的具体细节,在本申请的技术构思范围内,可以对本申请的技术方案进行多种简单变型,这些简单变型均属于本申请的保护范围。例如,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本申请对各种可能的组合方式不再另行说明。又例如,本申请的各种不同的实施方式之间也可以进行任意组合,只要其不违背本申请的思想,其同样应当视为本申请所公开的内容。还应理解,在本申请的各种方法实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
例如,在本申请的可替代实施例中,也可以根据目标图像块的相邻图像块块的最优预测模式,确定参考样本,以提高编码效率。对于暂时色度分量预测块的生成过程,所述暂时色度分量预测块可以使用一个线性模型,也可以针对不同区域使用不同的线性模型,以提升预测效果,进而提高编码效率。这些简单变型均属于本申请的保护范围。
上文详细描述了本申请的方法实施例,下文结合图11至图13,详细描述本申请的装置实施例。
图21是本申请实施例的编码器500的示意性框图。
如图21所示,所述编码器500可包括:
划分单元510,用于将目标图像序列中的目标图像帧划分为多个图像块,所述多个图像块包括目标图像块,所述目标图像块包括目标亮度分量块和目标色度分量块;
预测单元520,用于:
利用最佳预测模式,对所述目标亮度分量块进行帧内预测,得到所述目标亮度分量预测块;
基于所述目标亮度分量预测块和所述目标亮度分量块的残差块,得到目标亮度分量重建块;
利用线性模型,对所述目标亮度分量重建块进行计算,得到暂时色度分量预测块;所述暂时色度分量预测块的大小与所述目标亮度分量预测块的大小相同;
利用所述最佳预测模式对应的滤波器,对所述暂时色度分量预测块进行降采样,得到目标色度分量预测块;
残差单元530,用于对所述目标色度分量块和所述目标色度分量预测块,得到目标色度分量残差块;
编码单元540,用于对所述目标色度分量残差块进行编码,得到码流。
在本申请的一些实施例中,利用所述最佳预测模式对应的滤波器,对所述目标亮度分量重建块进行帧内预测,得到暂时色度分量预测块之前,所述预测单元520还用于:
根据所述目标色度分量块的预测模式,确定可用的参考样本;所述参考样本包括与所述目标亮度分量块相邻的重建样本和与所述目标色度分量块相邻的重建样本;基于所述参考样本,计算所述线性模型。
在本申请的一些实施例中,所述最佳预测模式为垂直类模式;所述预测单元520具体用于:
在所述暂时色度分量预测块的上边界上,采用两个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块;在所述暂时色度分量预测块的非上边界上,采用两个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块。
在本申请的一些实施例中,所述预测单元520具体用于:
在所述暂时色度分量预测块的上边界上,基于以下公式确定所述目标色度分量预测块:
Figure PCTCN2021076059-appb-000044
Figure PCTCN2021076059-appb-000045
Figure PCTCN2021076059-appb-000046
其中,P C表示所述目标色度分量预测块中像素的预测值,
Figure PCTCN2021076059-appb-000047
Figure PCTCN2021076059-appb-000048
表示分别使用所述两个两抽 头相同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
在本申请的一些实施例中,所述预测单元520具体用于:
在所述暂时色度分量预测块的非上边界上,基于以下公式确定所述目标色度分量预测块:
Figure PCTCN2021076059-appb-000049
Figure PCTCN2021076059-appb-000050
Figure PCTCN2021076059-appb-000051
其中,P C表示所述目标色度分量预测块中像素的预测值,
Figure PCTCN2021076059-appb-000052
Figure PCTCN2021076059-appb-000053
表示分别使用所述两个三抽头两个不同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
在本申请的一些实施例中,所述最佳预测模式为水平类模式;所述预测单元520具体用于:
在所述暂时色度分量预测块的左边界上,采用两个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块;在所述暂时色度分量预测块的非左边界上,采用两个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块。
在本申请的一些实施例中,所述预测单元520具体用于:
在所述暂时色度分量预测块的左边界上,基于以下公式确定所述目标色度分量预测块:
Figure PCTCN2021076059-appb-000054
Figure PCTCN2021076059-appb-000055
Figure PCTCN2021076059-appb-000056
其中,P C表示所述目标色度分量预测块中像素的预测值,
Figure PCTCN2021076059-appb-000057
Figure PCTCN2021076059-appb-000058
表示分别使用所述两个两抽头相同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
在本申请的一些实施例中,所述预测单元520具体用于:
在所述暂时色度分量预测块的非左边界上,基于以下公式确定所述目标色度分量预测块:
Figure PCTCN2021076059-appb-000059
Figure PCTCN2021076059-appb-000060
Figure PCTCN2021076059-appb-000061
其中,P C表示所述目标色度分量预测块中像素的预测值,
Figure PCTCN2021076059-appb-000062
Figure PCTCN2021076059-appb-000063
表示分别使用所述两个三抽头两个不同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
在本申请的一些实施例中,所述最佳预测模式为对角线类模式;所述预测单元520具体用于:
在所述暂时色度分量预测块的左边界和上边界上,采用一个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的采样结果确定为所述目标色度分量预测块;在所述暂时色度 分量预测块的非边界上,采用一个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的采样结果确定为所述目标色度分量预测块。
在本申请的一些实施例中,所述预测单元520具体用于:
在所述暂时色度分量预测块的左边界和上边界上,基于以下公式确定所述目标色度分量预测块:
P C=(P′ C(2x,2y)+P′ C(2x+1,2y+1)+1)>>1;
其中,P C表示所述目标色度分量预测块中像素的预测值,P′ C表示所述暂时色度分量预测块中像素的预测值,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
在本申请的一些实施例中,所述预测单元520具体用于:
在所述暂时色度分量预测块的非边界上,基于以下公式确定所述目标色度分量预测块:
P C=(3×P′ C(2x,2y)+3×P′ C(2x+1,2y+1)+2×P′ C(2x-1,2y-1)+4)>>3;
其中,P C表示所述目标色度分量预测块中像素的预测值,P′ C表示所述暂时色度分量预测块中像素的预测值,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
图22是本申请实施例的解码器600的示意性框图。
如图22所示,所述解码器600可包括:
解析单元610,通过解析码流,获取针对目标图像块的目标色度分量残差块,所述目标图像块包括目标亮度分量块和目标色度分量块,所述目标色度分量残差块为所述目标色度分量块的残差块;
预测单元620,用于:
对所述目标亮度分量块进行帧内预测,得到所述目标亮度分量预测块;
基于所述目标亮度分量预测块和所述目标亮度分量块的残差块,得到目标亮度分量重建块;
利用线性模型,对所述目标亮度分量重建块进行计算,得到暂时色度分量预测块;所述暂时色度分量预测块的大小与所述目标亮度分量预测块的大小相同;
利用所述最佳预测模式对应的滤波器,对所述暂时色度分量预测块进行降采样,得到目标色度分量预测块;
第一处理单元630,用于基于所述目标色度分量残差块和所述目标色度分量预测块,得到目标色度分量重建块;
第二处理单元640,用于基于所述目标色度分量重建块,得到所述目标图像块。
在本申请的一些实施例中,利用所述最佳预测模式对应的滤波器,对所述目标亮度分量重建块进行帧内预测,得到暂时色度分量预测块之前,所述预测单元620还用于:
根据所述目标色度分量块的预测模式,确定可用的参考样本;所述参考样本包括与所述目标亮度分量块相邻的重建样本和与所述目标色度分量块相邻的重建样本;基于所述参考样本,计算所述线性模型。
在本申请的一些实施例中,所述最佳预测模式为垂直类模式;所述预测单元620具体用于:
在所述暂时色度分量预测块的上边界上,采用两个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块;在所述暂时色度分量预测块的非上边界上,采用两个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块。
在本申请的一些实施例中,所述预测单元620具体用于:
在所述暂时色度分量预测块的上边界上,基于以下公式确定所述目标色度分量预测块:
Figure PCTCN2021076059-appb-000064
Figure PCTCN2021076059-appb-000065
Figure PCTCN2021076059-appb-000066
其中,P C表示所述目标色度分量预测块中像素的预测值,
Figure PCTCN2021076059-appb-000067
Figure PCTCN2021076059-appb-000068
表示分别使用所述两个两抽头相同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量 预测块的第y行。
在本申请的一些实施例中,所述预测单元620具体用于:
在所述暂时色度分量预测块的非上边界上,基于以下公式确定所述目标色度分量预测块:
Figure PCTCN2021076059-appb-000069
Figure PCTCN2021076059-appb-000070
Figure PCTCN2021076059-appb-000071
其中,P C表示所述目标色度分量预测块中像素的预测值,
Figure PCTCN2021076059-appb-000072
Figure PCTCN2021076059-appb-000073
表示分别使用所述两个三抽头两个不同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
在本申请的一些实施例中,所述最佳预测模式为水平类模式;所述预测单元620具体用于:
在所述暂时色度分量预测块的左边界上,采用两个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块;在所述暂时色度分量预测块的非左边界上,采用两个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块。
在本申请的一些实施例中,所述预测单元620具体用于:
在所述暂时色度分量预测块的左边界上,基于以下公式确定所述目标色度分量预测块:
Figure PCTCN2021076059-appb-000074
Figure PCTCN2021076059-appb-000075
Figure PCTCN2021076059-appb-000076
其中,P C表示所述目标色度分量预测块中像素的预测值,
Figure PCTCN2021076059-appb-000077
Figure PCTCN2021076059-appb-000078
表示分别使用所述两个两抽头相同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
在本申请的一些实施例中,所述预测单元620具体用于:
在所述暂时色度分量预测块的非左边界上,基于以下公式确定所述目标色度分量预测块:
Figure PCTCN2021076059-appb-000079
Figure PCTCN2021076059-appb-000080
Figure PCTCN2021076059-appb-000081
其中,P C表示所述目标色度分量预测块中像素的预测值,
Figure PCTCN2021076059-appb-000082
Figure PCTCN2021076059-appb-000083
表示分别使用所述两个三抽头两个不同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
在本申请的一些实施例中,所述最佳预测模式为对角线类模式;所述预测单元620具体用于:
在所述暂时色度分量预测块的左边界和上边界上,采用一个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的采样结果确定为所述目标色度分量预测块;在所述暂时色度分量预测块的非边界上,采用一个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的采样结果确定为所述目标色度分量预测块。
在本申请的一些实施例中,所述预测单元620具体用于:
在所述暂时色度分量预测块的左边界和上边界上,基于以下公式确定所述目标色度分量预测块:
P C=(P′ C(2x,2y)+P′ C(2x+1,2y+1)+1)>>1;
其中,P C表示所述目标色度分量预测块中像素的预测值,P′ C表示所述暂时色度分量预测块中像素的预测值,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
在本申请的一些实施例中,所述预测单元620具体用于:
在所述暂时色度分量预测块的非边界上,基于以下公式确定所述目标色度分量预测块:
P C=(3×P′ C(2x,2y)+3×P′ C(2x+1,2y+1)+2×P′ C(2x-1,2y-1)+4)>>3;
其中,P C表示所述目标色度分量预测块中像素的预测值,P′ C表示所述暂时色度分量预测块中像素的预测值,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
应理解,装置实施例与方法实施例可以相互对应,类似的描述可以参照方法实施例。为避免重复,此处不再赘述。具体地,图21所示的编码器500可以对应于执行本申请实施例的方法300中的相应主体,即编码器500中的各个单元的前述和其它操作和/或功能分别为了实现方法300等各个方法中的相应流程。图22所示的解码器600可以对应于执行本申请实施例的方法400中的相应主体,并且解码器600中的各个单元的前述和其它操作和/或功能分别为了实现方法400等各个方法中的相应流程。
还应当理解,本申请实施例涉及的编码器500或解码器600中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成,这可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述单元是基于逻辑功能划分的,在实际应用中,一个单元的功能也可以由多个单元来实现,或者多个单元的功能由一个单元实现。在本申请的其它实施例中,该编码器500或解码器600也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由多个单元协作实现。根据本申请的另一个实施例,可以通过在包括例如中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理元件和存储元件的通用计算机的通用计算设备上运行能够执行相应方法所涉及的各步骤的计算机程序(包括程序代码),来构造本申请实施例涉及的编码器500或解码器600,以及来实现本申请实施例的编码方法或解码方法。计算机程序可以记载于例如计算机可读存储介质上,并通过计算机可读存储介质装载于电子设备中,并在其中运行,来实现本申请实施例的相应方法。
换言之,上文涉及的单元可以通过硬件形式实现,也可以通过软件形式的指令实现,还可以通过软硬件结合的形式实现。具体地,本申请实施例中的方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路和/或软件形式的指令完成,结合本申请实施例公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件组合执行完成。可选地,软件可以位于随机存储器,闪存、只读存储器、可编程只读存储器、电可擦写可编程存储器、寄存器等本领域的成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法实施例中的步骤。
图26是本申请实施例提供的电子设备700的示意结构图。
如图26所示,该电子设备700至少包括处理器710以及计算机可读存储介质720。其中,处理器710以及计算机可读存储介质720可通过总线或者其它方式连接。计算机可读存储介质720用于存储计算机程序721,计算机程序721包括计算机指令,处理器710用于执行计算机可读存储介质720存储的计算机指令。处理器710是电子设备700的计算核心以及控制核心,其适于实现一条或多条计算机指令,具体适于加载并执行一条或多条计算机指令从而实现相应方法流程或相应功能。
作为示例,处理器710也可称为中央处理器(CentralProcessingUnit,CPU)。处理器710可以包括但不限于:通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等等。
作为示例,计算机可读存储介质720可以是高速RAM存储器,也可以是非不稳定的存储器(Non-VolatileMemory),例如至少一个磁盘存储器;可选的,还可以是至少一个位于远离前述处理器710的计算机可读存储介质。具体而言,计算机可读存储介质720包括但不限于:易失性存储器和/或非易失性存储器。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存 取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DR RAM)。
在一种实现方式中,该电子设备700可以是本申请实施例涉及的编码端、编码器或编码框架;该计算机可读存储介质720中存储有第一计算机指令;由处理器710加载并执行计算机可读存储介质720中存放的第一计算机指令,以实现本申请实施例提供的编码方法中的相应步骤;换言之,计算机可读存储介质720中的第一计算机指令由处理器710加载并执行相应步骤,为避免重复,此处不再赘述。
在一种实现方式中,该电子设备700可以是本申请实施例涉及的解码端、解码器或解码框架;该计算机可读存储介质720中存储有第二计算机指令;由处理器710加载并执行计算机可读存储介质720中存放的第二计算机指令,以实现本申请实施例提供的解码方法中的相应步骤;换言之,计算机可读存储介质720中的第二计算机指令由处理器710加载并执行相应步骤,为避免重复,此处不再赘述。
根据本申请的另一方面,本申请实施例还提供了一种计算机可读存储介质(Memory),计算机可读存储介质是电子设备700中的记忆设备,用于存放程序和数据。例如,计算机可读存储介质720。可以理解的是,此处的计算机可读存储介质720既可以包括电子设备700中的内置存储介质,当然也可以包括电子设备700所支持的扩展存储介质。计算机可读存储介质提供存储空间,该存储空间存储了电子设备700的操作系统。并且,在该存储空间中还存放了适于被处理器710加载并执行的一条或多条的计算机指令,这些计算机指令可以是一个或多个的计算机程序721(包括程序代码)。
根据本申请的另一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。例如,计算机程序721。此时,数据处理设备700可以是计算机,处理器710从计算机可读存储介质720读取该计算机指令,处理器710执行该计算机指令,使得该计算机执行上述各种可选方式中提供的编码方法或解码方法。
换言之,当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时,全部或部分地运行本申请实施例的流程或实现本申请实施例的功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质进行传输,例如,该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元以及流程步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
最后需要说明的是,以上内容,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (26)

  1. 一种编码方法,其特征在于,包括:
    将目标图像序列中的目标图像帧划分为多个图像块,所述多个图像块包括目标图像块,所述目标图像块包括目标亮度分量块和目标色度分量块;
    利用最佳预测模式,对所述目标亮度分量块进行帧内预测,得到所述目标亮度分量预测块;
    基于所述目标亮度分量预测块和所述目标亮度分量块的残差块,得到目标亮度分量重建块;
    利用线性模型,对所述目标亮度分量重建块进行计算,得到暂时色度分量预测块;所述暂时色度分量预测块的大小与所述目标亮度分量预测块的大小相同;
    利用所述最佳预测模式对应的滤波器,对所述暂时色度分量预测块进行降采样,得到目标色度分量预测块;
    对所述目标色度分量块和所述目标色度分量预测块,得到目标色度分量残差块;
    对所述目标色度分量残差块进行编码,得到码流。
  2. 根据权利要求1所述的方法,其特征在于,所述利用所述最佳预测模式对应的滤波器,对所述目标亮度分量重建块进行帧内预测,得到暂时色度分量预测块之前,所述方法还包括:
    根据所述目标色度分量块的预测模式,确定可用的参考样本;所述参考样本包括与所述目标亮度分量块相邻的重建样本和与所述目标色度分量块相邻的重建样本;
    基于所述参考样本,计算所述线性模型。
  3. 根据权利要求2所述的方法,其特征在于,所述最佳预测模式为垂直类模式;
    所述利用最佳预测模式对应的滤波器,对所述暂时色度分量预测块进行降采样,得到目标色度分量预测块,包括:
    在所述暂时色度分量预测块的上边界上,采用两个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块;在所述暂时色度分量预测块的非上边界上,采用两个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块。
  4. 根据权利要求3所述的方法,其特征在于,所述在所述暂时色度分量预测块的上边界上,采用两个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块,包括:
    在所述暂时色度分量预测块的上边界上,基于以下公式确定所述目标色度分量预测块:
    Figure PCTCN2021076059-appb-100001
    Figure PCTCN2021076059-appb-100002
    Figure PCTCN2021076059-appb-100003
    其中,P C表示所述目标色度分量预测块中像素的预测值,
    Figure PCTCN2021076059-appb-100004
    Figure PCTCN2021076059-appb-100005
    表示分别使用所述两个两抽头相同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
  5. 根据权利要求3所述的方法,其特征在于,所述在所述暂时色度分量预测块的非上边界上,采用两个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块,包括:
    在所述暂时色度分量预测块的非上边界上,基于以下公式确定所述目标色度分量预测块:
    Figure PCTCN2021076059-appb-100006
    Figure PCTCN2021076059-appb-100007
    Figure PCTCN2021076059-appb-100008
    其中,P C表示所述目标色度分量预测块中像素的预测值,
    Figure PCTCN2021076059-appb-100009
    Figure PCTCN2021076059-appb-100010
    表示分别使用所述两个三抽头两个不同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y 行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
  6. 根据权利要求2所述的方法,其特征在于,所述最佳预测模式为水平类模式;
    所述利用最佳预测模式对应的滤波器,对所述暂时色度分量预测块进行降采样,得到目标色度分量预测块,包括:
    在所述暂时色度分量预测块的左边界上,采用两个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块;在所述暂时色度分量预测块的非左边界上,采用两个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块。
  7. 根据权利要求6所述的方法,其特征在于,所述在所述暂时色度分量预测块的左边界上,采用两个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块,包括:
    在所述暂时色度分量预测块的左边界上,基于以下公式确定所述目标色度分量预测块:
    Figure PCTCN2021076059-appb-100011
    Figure PCTCN2021076059-appb-100012
    Figure PCTCN2021076059-appb-100013
    其中,P C表示所述目标色度分量预测块中像素的预测值中像素的预测值,
    Figure PCTCN2021076059-appb-100014
    Figure PCTCN2021076059-appb-100015
    表示分别使用所述两个两抽头相同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
  8. 根据权利要求6所述的方法,其特征在于,所述在所述暂时色度分量预测块的非左边界上,采用两个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块,包括:
    在所述暂时色度分量预测块的非左边界上,基于以下公式确定所述目标色度分量预测块:
    Figure PCTCN2021076059-appb-100016
    Figure PCTCN2021076059-appb-100017
    Figure PCTCN2021076059-appb-100018
    其中,P C表示所述目标色度分量预测块中像素的预测值,
    Figure PCTCN2021076059-appb-100019
    Figure PCTCN2021076059-appb-100020
    表示分别使用所述两个三抽头两个不同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
  9. 根据权利要求2所述的方法,其特征在于,所述最佳预测模式为对角线类模式;
    所述利用最佳预测模式对应的滤波器,对所述暂时色度分量预测块进行降采样,得到目标色度分量预测块,包括:
    在所述暂时色度分量预测块的左边界和上边界上,采用一个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的采样结果确定为所述目标色度分量预测块;在所述暂时色度分量预测块的非边界上,采用一个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的采样结果确定为所述目标色度分量预测块。
  10. 根据权利要求9所述的方法,其特征在于,所述在所述暂时色度分量预测块的左边界和上边界上,采用一个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的采样结果确定为所述目标色度分量预测块,包括:
    在所述暂时色度分量预测块的左边界和上边界上,基于以下公式确定所述目标色度分量预测块:
    P C=(P′ C(2x,2y)+P′ C(2x+1,2y+1)+1)>>1;
    其中,P C表示所述目标色度分量预测块中像素的预测值,P′ C表示所述暂时色度分量预测块中像素的预测值,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
  11. 根据权利要求9所述的方法,其特征在于,所述在所述暂时色度分量预测块的非边界上,采用一个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的采样结果确定为所述目标色度分量预测块,包括:
    在所述暂时色度分量预测块的非边界上,基于以下公式确定所述目标色度分量预测块:
    P C=(3×P′ C(2x,2y)+3×P′ C(2x+1,2y+1)+2×P′ C(2x-1,2y-1)+4)>>3;
    其中,P C表示所述目标色度分量预测块中像素的预测值,P′ C表示所述暂时色度分量预测块中像素的预测值,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
  12. 一种解码方法,其特征在于,包括:
    通过解析码流,获取针对目标图像块的目标色度分量残差块,所述目标图像块包括目标亮度分量块和目标色度分量块,所述目标色度分量残差块为所述目标色度分量块的残差块;
    对所述目标亮度分量块进行帧内预测,得到所述目标亮度分量预测块;
    基于所述目标亮度分量预测块和所述目标亮度分量块的残差块,得到目标亮度分量重建块;
    利用线性模型,对所述目标亮度分量重建块进行计算,得到暂时色度分量预测块;所述暂时色度分量预测块的大小与所述目标亮度分量预测块的大小相同;
    利用所述最佳预测模式对应的滤波器,对所述暂时色度分量预测块进行降采样,得到目标色度分量预测块;
    基于所述目标色度分量残差块和所述目标色度分量预测块,得到目标色度分量重建块;
    基于所述目标色度分量重建块,得到所述目标图像块。
  13. 根据权利要求12所述的方法,其特征在于,所述利用所述最佳预测模式对应的滤波器,对所述目标亮度分量重建块进行帧内预测,得到暂时色度分量预测块之前,所述方法还包括:
    根据所述目标色度分量块的预测模式,确定可用的参考样本;所述参考样本包括与所述目标亮度分量块相邻的重建样本和与所述目标色度分量块相邻的重建样本;
    基于所述参考样本,计算所述线性模型。
  14. 根据权利要求13所述的方法,其特征在于,所述最佳预测模式为垂直类模式;
    所述利用最佳预测模式对应的滤波器,对所述暂时色度分量预测块进行降采样,得到目标色度分量预测块,包括:
    在所述暂时色度分量预测块的上边界上,采用两个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块;在所述暂时色度分量预测块的非上边界上,采用两个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块。
  15. 根据权利要求14所述的方法,其特征在于,所述在所述暂时色度分量预测块的上边界上,采用两个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块,包括:
    在所述暂时色度分量预测块的上边界上,基于以下公式确定所述目标色度分量预测块:
    Figure PCTCN2021076059-appb-100021
    Figure PCTCN2021076059-appb-100022
    Figure PCTCN2021076059-appb-100023
    其中,P C表示所述目标色度分量预测块中像素的预测值,
    Figure PCTCN2021076059-appb-100024
    Figure PCTCN2021076059-appb-100025
    表示分别使用所述两个两抽头相同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
  16. 根据权利要求14所述的方法,其特征在于,所述在所述暂时色度分量预测块的非上边界上, 采用两个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块,包括:
    在所述暂时色度分量预测块的非上边界上,基于以下公式确定所述目标色度分量预测块:
    Figure PCTCN2021076059-appb-100026
    Figure PCTCN2021076059-appb-100027
    Figure PCTCN2021076059-appb-100028
    其中,P C表示所述目标色度分量预测块中像素的预测值,
    Figure PCTCN2021076059-appb-100029
    Figure PCTCN2021076059-appb-100030
    表示分别使用所述两个三抽头两个不同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
  17. 根据权利要求13所述的方法,其特征在于,所述最佳预测模式为水平类模式;
    所述利用最佳预测模式对应的滤波器,对所述暂时色度分量预测块进行降采样,得到目标色度分量预测块,包括:
    在所述暂时色度分量预测块的左边界上,采用两个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块;在所述暂时色度分量预测块的非左边界上,采用两个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块。
  18. 根据权利要求17所述的方法,其特征在于,所述在所述暂时色度分量预测块的左边界上,采用两个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块,包括:
    在所述暂时色度分量预测块的左边界上,基于以下公式确定所述目标色度分量预测块:
    Figure PCTCN2021076059-appb-100031
    Figure PCTCN2021076059-appb-100032
    Figure PCTCN2021076059-appb-100033
    其中,P C表示所述目标色度分量预测块中像素的预测值,
    Figure PCTCN2021076059-appb-100034
    Figure PCTCN2021076059-appb-100035
    表示分别使用所述两个两抽头相同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
  19. 根据权利要求17所述的方法,其特征在于,所述在所述暂时色度分量预测块的非左边界上,采用两个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的两个采样结果中的最大值确定为所述目标色度分量预测块,包括:
    在所述暂时色度分量预测块的非左边界上,基于以下公式确定所述目标色度分量预测块:
    Figure PCTCN2021076059-appb-100036
    Figure PCTCN2021076059-appb-100037
    Figure PCTCN2021076059-appb-100038
    其中,P C表示所述目标色度分量预测块中像素的预测值,
    Figure PCTCN2021076059-appb-100039
    Figure PCTCN2021076059-appb-100040
    表示分别使用所述两个三抽头两个不同系数的滤波器进行降采样得到的两个采样结果,P′ C表示所述暂时色度分量预测块中像素的预测值,MAX(·)表示最大值运算,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
  20. 根据权利要求13所述的方法,其特征在于,所述最佳预测模式为对角线类模式;
    所述利用最佳预测模式对应的滤波器,对所述暂时色度分量预测块进行降采样,得到目标色度分量预测块,包括:
    在所述暂时色度分量预测块的左边界和上边界上,采用一个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的采样结果确定为所述目标色度分量预测块;在所述暂时色度分量预测块的非边界上,采用一个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的采样结果确定为所述目标色度分量预测块。
  21. 根据权利要求20所述的方法,其特征在于,所述在所述暂时色度分量预测块的左边界和上边界上,采用一个两抽头相同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的采样结果确定为所述目标色度分量预测块,包括:
    在所述暂时色度分量预测块的左边界和上边界上,基于以下公式确定所述目标色度分量预测块:
    P C=(P′ C(2x,2y)+P′ C(2x+1,2y+1)+1)>>1;
    其中,P C表示所述目标色度分量预测块中像素的预测值,P′ C表示所述暂时色度分量预测块中像素的预测值,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
  22. 根据权利要求20所述的方法,其特征在于,所述在所述暂时色度分量预测块的非边界上,采用一个三抽头两个不同系数的滤波器对所述暂时色度分量预测块进行降采样,并将得到的采样结果确定为所述目标色度分量预测块,包括:
    在所述暂时色度分量预测块的非边界上,基于以下公式确定所述目标色度分量预测块:
    P C=(3×P′ C(2x,2y)+3×P′ C(2x+1,2y+1)+2×P′ C(2x-1,2y-1)+4)>>3;
    其中,P C表示所述目标色度分量预测块中像素的预测值,P′ C表示所述暂时色度分量预测块中像素的预测值,(2x,2y)表示位于所述暂时色度分量预测块的第2x列,第2y行的像素,>>表示右移运算符,x表示所述目标色度分量预测块的第x列,y表示所述目标色度分量预测块的第y行。
  23. 一种编码器,其特征在于,包括:
    划分单元,用于将目标图像序列中的目标图像帧划分为多个图像块,所述多个图像块包括目标图像块,所述目标图像块包括目标亮度分量块和目标色度分量块;
    预测单元,用于:
    利用最佳预测模式,对所述目标亮度分量块进行帧内预测,得到所述目标亮度分量预测块;
    基于所述目标亮度分量预测块和所述目标亮度分量块的残差块,得到目标亮度分量重建块;
    利用线性模型,对所述目标亮度分量重建块进行计算,得到暂时色度分量预测块;所述暂时色度分量预测块的大小与所述目标亮度分量预测块的大小相同;
    利用所述最佳预测模式对应的滤波器,对所述暂时色度分量预测块进行降采样,得到目标色度分量预测块;
    残差单元,用于对所述目标色度分量块和所述目标色度分量预测块,得到目标色度分量残差块;
    编码单元,用于对所述目标色度分量残差块进行编码,得到码流。
  24. 一种解码器,其特征在于,包括:
    解析单元,通过解析码流,获取针对目标图像块的目标色度分量残差块,所述目标图像块包括目标亮度分量块和目标色度分量块,所述目标色度分量残差块为所述目标色度分量块的残差块;
    预测单元,用于:
    对所述目标亮度分量块进行帧内预测,得到所述目标亮度分量预测块;
    基于所述目标亮度分量预测块和所述目标亮度分量块的残差块,得到目标亮度分量重建块;
    利用线性模型,对所述目标亮度分量重建块进行计算,得到暂时色度分量预测块;所述暂时色度分量预测块的大小与所述目标亮度分量预测块的大小相同;
    利用所述最佳预测模式对应的滤波器,对所述暂时色度分量预测块进行降采样,得到目标色度分量预测块;
    第一处理单元,用于基于所述目标色度分量残差块和所述目标色度分量预测块,得到目标色度分量重建块;
    第二处理单元,用于基于所述目标色度分量重建块,得到所述目标图像块。
  25. 一种电子设备,其特征在于,包括:
    处理器,适于执行计算机程序;
    计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被所述处 理器执行时,实现如权利要求1至11中任一项所述的编码方法,或实现如权利要求12至22中任一项所述的解码方法。
  26. 一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括计算机指令,所述计算机指令适于由所述处理器加载并执行如权利要求1至11中任一项所述的编码方法,或实现如权利要求12至22中任一项所述的解码方法。
PCT/CN2021/076059 2020-03-20 2021-02-08 编码方法、解码方法、编码器、解码器以及电子设备 WO2021185008A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/CN2021/081132 WO2021185257A1 (zh) 2020-03-20 2021-03-16 图像编码方法、图像解码方法及相关装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010206251.0A CN113497937B (zh) 2020-03-20 2020-03-20 图像编码方法、图像解码方法及相关装置
CN202010206251.0 2020-03-20

Publications (1)

Publication Number Publication Date
WO2021185008A1 true WO2021185008A1 (zh) 2021-09-23

Family

ID=77767996

Family Applications (2)

Application Number Title Priority Date Filing Date
PCT/CN2021/076059 WO2021185008A1 (zh) 2020-03-20 2021-02-08 编码方法、解码方法、编码器、解码器以及电子设备
PCT/CN2021/081132 WO2021185257A1 (zh) 2020-03-20 2021-03-16 图像编码方法、图像解码方法及相关装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
PCT/CN2021/081132 WO2021185257A1 (zh) 2020-03-20 2021-03-16 图像编码方法、图像解码方法及相关装置

Country Status (2)

Country Link
CN (1) CN113497937B (zh)
WO (2) WO2021185008A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116074530A (zh) * 2022-01-19 2023-05-05 杭州海康威视数字技术股份有限公司 一种图像解码方法、编码方法及装置
WO2023197192A1 (zh) * 2022-04-12 2023-10-19 Oppo广东移动通信有限公司 编解码方法、装置、编码设备、解码设备以及存储介质
WO2024077911A1 (en) * 2022-10-13 2024-04-18 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for point cloud coding

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109274969A (zh) * 2017-07-17 2019-01-25 华为技术有限公司 色度预测的方法和设备
CN110557621A (zh) * 2019-08-27 2019-12-10 咪咕文化科技有限公司 参数获取方法、像素点对选择方法及相关设备
WO2020015648A1 (en) * 2018-07-16 2020-01-23 Huawei Technologies Co., Ltd. Video encoder, video decoder, and corresponding encoding and decoding methods
CN110839153A (zh) * 2018-08-17 2020-02-25 北京字节跳动网络技术有限公司 简化的跨分量预测
CN110881126A (zh) * 2018-09-05 2020-03-13 华为技术有限公司 色度块预测方法以及设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100401789C (zh) * 2004-06-11 2008-07-09 上海大学 H.264/avc帧内预测模式的快速选择方法
US9693070B2 (en) * 2011-06-24 2017-06-27 Texas Instruments Incorporated Luma-based chroma intra-prediction for video coding
CN103650512B (zh) * 2011-07-12 2017-04-19 英特尔公司 基于亮度的色度帧内预测
US10419757B2 (en) * 2016-08-31 2019-09-17 Qualcomm Incorporated Cross-component filter
WO2018221631A1 (ja) * 2017-06-02 2018-12-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法および復号方法
US11070824B2 (en) * 2017-09-15 2021-07-20 Sony Corporation Image processing device and method
WO2019198997A1 (ko) * 2018-04-11 2019-10-17 엘지전자 주식회사 인트라 예측에 기반한 영상 코딩 방법 및 그 장치
WO2019206115A1 (en) * 2018-04-24 2019-10-31 Mediatek Inc. Method and apparatus for restricted linear model parameter derivation in video coding

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109274969A (zh) * 2017-07-17 2019-01-25 华为技术有限公司 色度预测的方法和设备
WO2020015648A1 (en) * 2018-07-16 2020-01-23 Huawei Technologies Co., Ltd. Video encoder, video decoder, and corresponding encoding and decoding methods
CN110839153A (zh) * 2018-08-17 2020-02-25 北京字节跳动网络技术有限公司 简化的跨分量预测
CN110881126A (zh) * 2018-09-05 2020-03-13 华为技术有限公司 色度块预测方法以及设备
CN110557621A (zh) * 2019-08-27 2019-12-10 咪咕文化科技有限公司 参数获取方法、像素点对选择方法及相关设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
D.-Y. KIM (CHIPS&MEDIA), S.-C. LIM, J. LEE, J. KANG, H. LEE (ETRI): "CE3-related: CCLM with unified filter shape", 16. JVET MEETING; 20191001 - 20191011; GENEVA; (THE JOINT VIDEO EXPLORATION TEAM OF ISO/IEC JTC1/SC29/WG11 AND ITU-T SG.16 ), no. JVET-P0265, 25 September 2019 (2019-09-25), XP030216751 *

Also Published As

Publication number Publication date
CN113497937A (zh) 2021-10-12
WO2021185257A1 (zh) 2021-09-23
CN113497937B (zh) 2023-09-05

Similar Documents

Publication Publication Date Title
WO2021185008A1 (zh) 编码方法、解码方法、编码器、解码器以及电子设备
JP7350082B2 (ja) ループフィルタリング方法、装置およびコンピュータ記憶媒体
WO2021203394A1 (zh) 环路滤波的方法与装置
WO2022052533A1 (zh) 编码方法、解码方法、编码器、解码器以及编码系统
WO2019085942A1 (zh) Sao模式决策方法、装置、电子设备及可读存储介质
WO2021134706A1 (zh) 环路滤波的方法与装置
WO2020258055A1 (zh) 环路滤波的方法与装置
KR20210129151A (ko) 루프 필터링 구현 방법 및 장치
WO2022155923A1 (zh) 编码方法、解码方法、编码器、解码器以及电子设备
JP7481332B2 (ja) デコードのための予測方法及びその装置、並びにコンピュータ記憶媒体
WO2021134635A1 (zh) 变换方法、编码器、解码器以及存储介质
WO2022252222A1 (zh) 编码方法和编码装置
WO2022116085A1 (zh) 编码方法、解码方法、编码器、解码器以及电子设备
WO2022178686A1 (zh) 编解码方法、编解码设备、编解码系统以及计算机可读存储介质
WO2021134303A1 (zh) 变换方法、编码器、解码器以及存储介质
WO2023193254A1 (zh) 解码方法、编码方法、解码器以及编码器
WO2021134327A1 (zh) 变换方法、编码器、解码器以及存储介质
WO2023193253A1 (zh) 解码方法、编码方法、解码器以及编码器
WO2020140214A1 (zh) 解码预测方法、装置及计算机存储介质
WO2023123398A1 (zh) 滤波方法、滤波装置以及电子设备
WO2024007116A1 (zh) 解码方法、编码方法、解码器以及编码器
WO2023070505A1 (zh) 帧内预测方法、解码器、编码器及编解码系统
WO2023197179A1 (zh) 解码方法、编码方法、解码器以及编码器
WO2023130226A1 (zh) 一种滤波方法、解码器、编码器及计算机可读存储介质
WO2023197181A1 (zh) 解码方法、编码方法、解码器以及编码器

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21771236

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21771236

Country of ref document: EP

Kind code of ref document: A1