CN113940074A - 基于广角帧内预测和变换的图像编码方法和装置 - Google Patents

基于广角帧内预测和变换的图像编码方法和装置 Download PDF

Info

Publication number
CN113940074A
CN113940074A CN202080039427.6A CN202080039427A CN113940074A CN 113940074 A CN113940074 A CN 113940074A CN 202080039427 A CN202080039427 A CN 202080039427A CN 113940074 A CN113940074 A CN 113940074A
Authority
CN
China
Prior art keywords
intra prediction
transform
prediction mode
current block
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080039427.6A
Other languages
English (en)
Inventor
具文模
林宰显
南廷学
金昇焕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN113940074A publication Critical patent/CN113940074A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

根据本文档的图像解码方法包括以下步骤:获得帧内预测模式信息和LFNST索引;基于帧内预测模式信息来推导当前块的帧内预测模式;当将广角帧内预测应用于当前块时,通过帧内预测模式重映射来推导修改的帧内预测模式;基于修改的帧内预测模式来决定包括LFNST矩阵的LFNST集;基于LFNST集和LFNST索引选择LFNST矩阵中的一个;以及基于所选择的LFNST矩阵来推导当前块的变换系数。

Description

基于广角帧内预测和变换的图像编码方法和装置
技术领域
本公开涉及一种图像编码技术,并且更具体地,涉及用于基于图像编码系统中的广角帧内预测和变换对图像进行编码的方法和设备。
背景技术
如今,在各个领域中对诸如4K、8K或更高的超高清(UHD)图像/视频这样的高分辨率和高质量图像/视频的需求已经不断增长。随着图像/视频数据变成更高分辨率和更高质量,与传统图像数据相比,所发送的信息量或比特量增加。因此,当使用诸如传统有线/无线宽带线这样的介质来发送图像数据或者使用现有存储介质来存储图像/视频数据时,其传输成本和存储成本增加。
另外,如今,对于诸如虚拟现实(VR)和人工现实(AR)内容或全息图等这样的沉浸式媒体的兴趣和需求正在增加,并且对具有与诸如游戏图像这样的真实图像不同的图像特征的图像/视频的广播正在增加。
因此,需要有效地压缩并发送或存储以及再现具有如上所述的各种特征的高分辨率和高质量图像/视频的信息的高效图像/视频压缩技术。
发明内容
技术问题
本公开的一技术方面在于提供用于增加图像编码效率的方法和设备。
本公开的另一技术方面在于提供用于增加变换索引编码的效率的方法和设备。
本公开的又一技术方面在于提供用于在应用广角帧内预测的帧内预测中对变换索引进行编码的方法和设备。
技术方案
根据本公开的实施方式,提供了一种由解码设备执行的图像解码方法。该方法可以包括:从比特流中获得帧内预测模式信息和LFNST索引;基于帧内预测模式信息来推导当前块的帧内预测模式;当广角帧内预测被应用于当前块时,通过帧内预测模式重映射推导修改的帧内预测模式;基于修改的帧内预测模式来确定包括LFNST矩阵的LFNST集;基于LFNST集和LFNST索引来选择LFNST矩阵中的一个;基于选择的LFNST矩阵来推导当前块的变换系数;以及基于变换系数来推导当前块的残差样本。
这里,当用于当前块的分割树(partitioning tree)结构是双树类型时,可以针对亮度块和色度块中的每一个接收LFNST索引。当色度块的帧内预测模式为使用与亮度块的帧内预测模式相同的模式的直接模式(DM)时,可以将广角帧内预测应用于色度块。
当根据应用于当前块的帧内预测模式确定四个LFNST集中的任何一个时,在修改的帧内预测模式在从67到80的范围内的情况下的LFNST集与在修改的帧内预测模式在从-1到-14的范围内的情况下的LFNST集可以相同。
根据本公开的另一实施方式,提供了一种由编码设备执行的图像编码方法。该方法可以包括:推导当前块的帧内预测模式;基于广角帧内预测是否应用于当前块而通过帧内预测模式重映射推导修改的帧内预测模式;基于修改的帧内预测模式来推导预测样本;基于预测样本来推导当前块的残差样本;基于修改的帧内预测模式来确定包括LFNST矩阵的LFNST集;基于残差样本、LFNST集和LFNST矩阵来推导当前块的变换系数;以及编码包括帧内预测模式和指示LFNST矩阵的LFNST索引的图像信息。
根据本公开的又一实施方式,可以提供一种数字存储介质,该数字存储介质存储包括根据由编码设备执行的图像编码方法生成的编码的图像信息和比特流的图像数据。
根据本公开的又一实施方式,可以提供一种数字存储介质,该数字存储介质存储包括编码的图像信息和比特流的图像数据以使解码设备执行图像解码方法。
技术效果
根据本公开,可以增加整体图像/视频压缩效率。
根据本公开,可以增加变换索引编码的效率。
本公开的技术方面可以提供用于在应用广角帧内预测的帧内预测中编码变换索引的方法和设备。
可以通过本公开的具体示例获得的效果不限于上面列出的效果。例如,可以存在相关领域的普通技术人员可以理解或从本公开推导出的各种技术效果。因此,本公开的特定效果不限于本公开中明确描述的那些,并且可以包括可以根据本公开的技术特征理解或推导出的各种效果。
附图说明
图1示意性地例示了可应用本公开的视频/图像编码系统的示例。
图2是示意性地例示可应用本公开的视频/图像编码设备的配置的图。
图3是示意性地例示可应用本公开的视频/图像解码设备的配置的图。
图4是例示根据本公开的实施方式的67个帧内预测模式的图。
图5是例示根据本公开的实施方式的广角帧内预测模式的图。
图6是例示根据本公开的实施方式的非正方形块的帧内预测的图。
图7是例示根据本公开的实施方式的在推导色度块的帧内预测模式时可应用的DM的图。
图8是例示根据实施方式的在推导色度块的帧内预测模式时可应用的CCLM的图。
图9示意性地例示了根据本公开的实施方式的多变换方案。
图10是例示根据本公开的实施方式的RST的图。
图11是例示根据本公开的实施方式的视频解码设备的操作的流程图。
图12是例示根据本公开的实施方式的视频编码设备的操作的流程图。
图13例示了应用本公开的内容流传输系统的结构。
具体实施方式
尽管本公开可能易于进行各种修改并且包括各种实施方式,但是其具体实施方式已在附图中通过示例的方式示出,并且现在将对其进行详细描述。然而,这并不旨在将本公开限制于本文公开的具体实施方式。本文中使用的术语只是出于描述特定实施方式的目的,并不旨在限制本公开的技术思路。除非上下文另外清楚指示,否则单数形式可以包括复数形式。诸如“包括”和“具有”之类的术语旨在指示存在以下描述中使用的特征、数字、步骤、操作、元件、组件或其组合,因此不应被理解为预先排除了存在或添加一个或更多个不同特征、数字、步骤、操作、元件、组件或其组合的可能性。
此外,为了方便描述彼此不同的特性功能,独立地例示了本文中描述的附图上的各组件,然而,并不意指各组件由单独的硬件或软件来实现。例如,可以组合这些组件中的任何两个或更多个以形成单个组件,并且任何单个组件可以被划分成多个组件。其中组件被组合和/或划分的实施方式将属于本公开的专利权的范围,只要它们不脱离本公开的实质即可。
在下文中,将参照附图更详细地说明本公开的优选实施方式。另外,在附图中,相同的附图标号用于相同的组件,并且将省略对相同组件的重复描述。
本文档涉及视频/图像编码。例如,本文档中公开的方法/示例可以涉及VVC(通用视频编码)标准(ITU-T Rec.H.266)、VVC之后的下一代视频/图像编码标准、或其它视频编码相关标准(例如,HEVC(高效视频编码)标准(ITU-T Rec.H.265)、EVC(基本视频编码)标准、AVS2标准等)。
在本文档中,可以提供与视频/图像编码相关的各种实施方式,并且除非相反地指定,否则这些实施方式可以彼此组合并执行。
在本文档中,视频可以是指一段时间内一系列图像的集合。通常,图片是指表示特定时间区域的图像的单元,而条带/贴片是构成图片的一部分的单元。条带/贴片可以包括一个或更多个编码树单元(CTU)。一幅图片可以由一个或更多个条带/贴片组成。一幅图片可以由一个或多个贴片组组成。一个贴片组可以包括一个或更多个贴片。
像素或图元(pel)可以是指构成一幅图片(或图像)的最小单元。另外,“样本”可用作与像素相对应的术语。样本通常可以表示像素或像素值,并且可以仅表示亮度分量的像素/像素值或仅表示色度分量的像素/像素值。另选地,样本可以意指空间域中的像素值,或者当该像素值被变换为频域时,其可以意指频域中的变换系数。
单元可以表示图像处理的基本单位。单元可以包括特定区域和与该区域相关的信息中的至少一个。一个单元可以包括一个亮度块和两个色度(例如,cb、cr)块。根据情况,可以将单元和诸如块、区域等这样的术语互换地使用。在通常情况下,M×N块可以包括由M列和N行组成的样本(或样本阵列)或变换系数的集(或阵列)。
在本文档中,术语“/”和“,”应该被解释为指示“和/或”。例如,表述“A/B”可以意指“A和/或B”。另外,“A、B”可以意指“A和/或B”。另外,“A/B/C”可以意指“A、B和/或C中的至少一个”。另外,“A/B/C”可以意指“A、B和/或C中的至少一个”。
另外,在该文档中,术语“或”应该被解释为指示“和/或”。例如,表述“A或B”可以包括1)仅A、2)仅B和/或3)A和B二者。换句话说,本文档中的术语“或”应该被解释为指示“附加地或另选地”。
在本公开中,“A和B中的至少一个”可以意指“仅A”、“仅B”或“A和B两者”。此外,在本公开中,表述“A或B中的至少一个”或者“A和/或B中的至少一个”可以被解释为“A和B中的至少一个”。
此外,在本公开中,“A、B和C中的至少一个”可以意指“仅A”、“仅B”、“仅C”或“A、B和C的任何组合”。此外,“A、B或C中的至少一个”或“A、B和/或C中的至少一个”可以意指“A、B和C中的至少一个”。
另外,本公开中使用的括号可以表示“例如”。具体地,当指示为“预测(帧内预测)”时,可以意指“帧内预测”被提出为“预测”的示例。换句话说,本公开的“预测”不限于“帧内预测”,并且“帧内预测”是作为“预测”的示例而提出的。另外,当指示为“预测(即,帧内预测)”时,这也可以意指“帧内预测”被提出为“预测”的示例。
在本公开中的一个附图中单独描述的技术特征可以单独地实现或可以同时实现。
图1示意性地例示可应用本公开的视频/图像编码系统的示例。
参照图1,视频/图像编码系统可以包括第一装置(源装置)和第二装置(接收装置)。源装置可以经由数字存储介质或网络以文件或流的形式将编码后的视频/图像信息或数据传递到接收装置。
源装置可以包括视频源、编码设备和发送器。接收装置可以包括接收器、解码设备和渲染器。编码设备可以被称为视频/图像编码设备,并且解码设备可以被称为视频/图像解码设备。发送器可以被包括在编码设备中。接收器可以被包括在解码设备中。渲染器可以包括显示器,并且显示器可以被配置为单独的装置或外部组件。
视频源可以通过捕获、合成或生成视频/图像的处理来获得视频/图像。视频源可以包括视频/图像捕获装置和/或视频/图像生成装置。视频/图像捕获装置可以包括例如一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。视频/图像生成装置可以包括例如计算机、平板计算机和智能电话,并且可以(电子地)生成视频/图像。例如,可以通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可以被生成相关数据的处理取代。
编码设备可以对输入视频/图像进行编码。编码设备可以执行诸如针对压缩和编码效率的预测、变换和量化这样的一系列过程。编码后的数据(编码后的视频/图像信息)可以以比特流的形式输出。
发送器可以通过数字存储介质或网络以文件或流的形式将以比特流的形式输出的编码后的视频/图像信息或数据发送到接收装置的接收器。数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等这样的各种存储介质。发送器可以包括用于通过预定文件格式生成媒体文件的元件,并且可以包括用于通过广播/通信网络进行发送的元件。接收器可以接收/提取比特流,并且将接收/提取的比特流发送到解码设备。
解码设备可以通过执行与编码设备的操作对应的诸如解量化、逆变换、预测等这样的一系列过程来解码视频/图像。
渲染器可以渲染解码后的视频/图像。可以通过显示器显示渲染后的视频/图像。
图2是示意性地例示可应用本公开的视频/图像编码设备的配置的图。在下文中,所谓的视频编码设备可以包括图像编码设备。
参照图2,编码设备200可以包括图像划分器210、预测器220、残差处理器230、熵编码器240、加法器250、滤波器260和存储器270。预测器220可以包括帧间预测器221和帧内预测器222。残差处理器230可以包括变换器232、量化器233、解量化器234、逆变换器235。残差处理器230可以进一步包括减法器231。加法器250可以称为重构器或重构块生成器。根据实施方式,以上描述的图像划分器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可以由一个或更多个硬件组件(例如,编码器芯片组或处理器)构成。此外,存储器270可以包括解码图片缓冲器(DPB),并且可以由数字存储介质构成。硬件组件可以进一步包括作为内部/外部组件的存储器270。
图像划分器210可以将输入到编码设备200的输入图像(或图片或帧)划分为一个或更多个处理单元。作为一个示例,处理单元可以被称为编码单元(CU)。在这种情况下,从编码树单元(CTU)或最大编码单元(LCU)开始,可以根据四叉树二叉树三叉树(QTBTTT)结构来递归地划分编码单元。例如,基于四叉树结构、二叉树结构和/或三叉树结构,一个编码单元可以被划分为深度较深的多个编码单元。在这种情况下,例如,可以首先应用四叉树结构,并且可以稍后应用二叉树结构和/或三叉树结构。另选地,可以首先应用二叉树结构。可以基于未进一步划分的最终编码单元来执行根据本公开的编码过程。在这种情况下,基于根据图像特性的编码效率,最大编码单元可以直接用作最终编码单元。另选地,可以根据需要将编码单元递归地划分为更深的深度的编码单元,由此可以将最佳大小的编码单元用作最终编码单元。这里,编码过程可以包括诸如预测、变换和重构之类的过程,其将在后面描述。作为另一示例,处理单元可以进一步包括预测单元(PU)或变换单元(TU)。在这种情况下,预测单元和变换单元可以与上述最终编码单元分开或划分开。预测单元可以是样本预测的单元,并且变换单元可以是用于推导变换系数的单元和/或用于从变换系数推导残差信号的单元。
根据情况,可以使用单元和诸如块、区域等之类的术语来代替彼此。在通常情况下,M×N块可以表示由M列和N行构成的样本或变换系数的集。样本通常可以表示像素或像素值,并且可以仅表示亮度分量的像素/像素值,或者仅表示色度分量的像素/像素值。样本可用作与一幅图片(或图像)的像素或图元(pel)相对应的术语。
减法器231从输入图像信号(原始块、原始样本阵列)中减去从预测器220输出的预测信号(预测块、预测样本阵列)以生成残差信号(残差块、残差样本阵列),并且所生成的残差信号被发送到变换器232。预测器220可以对处理目标块(下文称为“当前块”)执行预测,并且可以生成包括当前块的预测样本的预测块。预测器220可以确定是以当前块或CU为基础应用帧内预测还是应用帧间预测。如稍后在每个预测模式的描述中所讨论的,预测器可以生成诸如预测模式信息之类的与预测有关的各种信息,并将所生成的信息发送到熵编码器240。关于预测的信息可以在熵编码器240中编码并以比特流的形式输出。
帧内预测器222可以通过参考当前图片中的样本来预测当前块。根据预测模式,参考样本可以位于当前块的附近或与当前块分开。在帧内预测中,预测模式可以包括多种非定向模式和多种定向模式。非定向模式可以包括例如DC模式和平面模式。根据预测方向的详细程度,定向模式可以包括例如33种定向预测模式或65种定向预测模式。然而,这仅仅是示例,并且根据设置,可以使用更多或更少的定向预测模式。帧内预测器222可以通过使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可以基于参照图片上的运动向量所指定的参考块(参考样本阵列)来推导针对当前块的预测块。此时,为了减少在帧间预测模式下发送的运动信息的量,可以基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为基础来预测运动信息。运动信息可以包括运动向量和参照图片索引。运动信息还可以包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括当前图片中存在的空间邻近块和参照图片中存在的时间邻近块。包括参考块的参照图片和包括时间邻近块的参照图片可以彼此相同或彼此不同。时间邻近块可以被称为并置参考块、并置CU(colCU)等,并且包括时间邻近块的参照图片可以被称为并置图片(colPic)。例如,帧间预测器221可以基于邻近块来配置运动信息候选列表,并且生成指示哪个候选被用于推导当前块的运动向量和/或参照图片索引的信息。可以基于各种预测模式来执行帧间预测。例如,在跳变模式和合并模式的情况下,帧间预测器221可以使用邻近块的运动信息作为当前块的运动信息。在跳变模式下,与合并模式不同,不能发送残差信号。在运动信息预测(运动向量预测、MVP)模式的情况下,邻近块的运动向量可以被用作运动向量预测符,并且可以通过发信号通知运动向量差来指示当前块的运动向量。
预测器220可以基于各种预测方法来生成预测信号。例如,预测器可以将帧内预测或帧间预测应用于对一个块的预测,并且也可以同时应用帧内预测和帧间预测。这可以被称为组合的帧间和帧内预测(CIIP)。另外,预测器可以基于块内复制(IBC)预测模式或调色板模式,以便对块执行预测。IBC预测模式或调色板模式可以被用于诸如屏幕内容编码(SCC)这样的游戏等的内容图像/视频编码。尽管IBC基本上在当前块中执行预测,但是其执行方式与帧间预测的相似之处在于,它推导当前块中的参考块。也就是说,IBC可以使用本公开中描述的帧间预测技术中的至少一种。
通过帧间预测器221和/或帧内预测器222生成的预测信号可以被用于生成重构信号或者生成残差信号。变换器232可以通过向残差信号应用变换技术来生成变换系数。例如,变换技术可以包括离散余弦变换(DCT)、离散正弦变换(DST)、Karhunen-Loève变换(KLT)、基于图的变换(GBT)或有条件非线性变换(CNT)中的至少一种。这里,GBT意指当用曲线图表示像素之间的关系信息时从曲线图获得的变换。CNT是指基于使用所有先前重构的像素生成的预测信号而获得的变换。另外,变换处理可以被应用于大小相同的正方形像素块,或者可以应用于大小可变的块而非正方形的块。
量化器233可以对变换系数进行量化并且将它们发送到熵编码器240,并且熵编码器240可以对量化后的信号(关于量化变换系数的信息)进行编码并且输出比特流中的编码后的信号。关于量化变换系数的信息可以被称为残差信息。量化器233可以基于系数扫描顺序将块类型的量化变换系数重新布置成一维向量形式,并且基于一维向量形式的量化变换系数来生成关于量化变换系数的信息。熵编码器240可以执行诸如例如指数哥伦布(exponential Golomb)、上下文自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)等这样的各种编码方法。熵编码器240可以对除了量化变换系数(例如,语法元素的值等)之外的视频/图像重构所需的信息一起或分别进行编码。编码后的信息(例如,编码后的视频/图像信息)可以以比特流的形式在网络抽象层(NAL)的单元基础上进行发送或存储。视频/图像信息还可以包括关于诸如适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)、视频参数集(VPS)等这样的各种参数集的信息。另外,视频/图像信息还可以包括常规约束信息。在本公开中,从编码设备发送到/发信号通知给解码设备的信息和/或语法元素可以被包括在视频/图像信息中。视频/图像信息可以通过上述编码过程进行编码并且被包括在比特流中。可以通过网络传输比特流,或者将其存储在数字存储介质中。这里,网络可以包括广播网络、通信网络和/或类似物,并且数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等这样的各种存储介质。发送从熵编码器240输出的信号的发送器(未示出)或存储其的存储器(未示出)可以被配置为编码设备200的内部/外部元件,或者发送器可以被包括在熵编码器240中。
从量化器233输出的量化变换系数可以被用于生成预测信号。例如,通过利用解量化器234和逆变换器235向量化变换系数应用解量化和逆变换,可以重构残差信号(残差块或残差样本)。加法器155将重构后的残差信号与从帧间预测器221或帧内预测器222输出的预测信号相加,使得可以生成重构信号(重构图片、重构块、重构样本阵列)。当如在应用跳变模式的情况下一样没有针对处理当前块的残差时,可以将预测块用作重构块。加法器250可以被称为重构器或重构块生成器。所生成的重构信号可以被用于当前图片中的下一处理当前块的帧内预测,并且如随后描述的,可以被用于通过滤波进行的下一图片的帧间预测。
此外,在图片编码和/或重构处理中,可以应用具有色度缩放的亮度映射(LMCS)。
滤波器260可以通过向重构信号应用滤波来改善主观/客观视频质量。例如,滤波器260可以通过向重构图片应用各种滤波方法来生成修改后的重构图片,并且可以将修改后的重构图片存储在存储器270中,尤其是存储在存储器270的DPB中。各种滤波方法可以包括例如解块滤波、样本自适应偏移、自适应环形滤波器、双边滤波器等。如随后在对每种滤波方法的描述中所讨论的,滤波器260可以生成与滤波相关的各种信息,并且将所生成的信息发送到熵编码器240。关于滤波的信息可以在熵编码器240中被编码并且以比特流的形式被输出。
已发送到存储器270的修改后的重构图片可以被用作帧间预测器221中的参照图片。据此,编码设备可以避免在应用帧间预测时编码设备100和解码设备中的预测失配,并且还可以提高编码效率。
存储器270DPB可以存储修改后的重构图片,以便使用它作为帧间预测器221中的参照图片。存储器270可以存储从中已推导(或编码了)运动信息的当前图片中的块的运动信息和/或已经重构的图片中的块的运动信息。所存储的运动信息可以被发送到帧间预测器221,以被用作邻近块的运动信息或时间邻近块的运动信息。存储器270可以存储当前图片中的重构块的重构样本,并且将它们发送到帧内预测器222。
图3是示意性地例示可应用本公开的视频/图像解码设备的配置的图。
参照图3,视频解码设备300可以包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350和存储器360。预测器330可以包括帧间预测器331和帧内预测器332。残差处理器320可以包括解量化器321和逆变换器321。根据实施方式,上面已描述的熵解码器310、残差处理器320、预测器330、加法器340和滤波器350可以由一个或更多个硬件组件(例如,解码器芯片组或处理器)构成。另外,存储器360可以包括解码图片缓冲器(DPB),并且可以由数字存储介质构成。硬件组件还可以包括存储器360作为内部/外部组件。
当输入包括视频/图像信息的比特流时,解码设备300可以与据此已在图2的编码设备中处理视频/图像信息的处理对应地重构图像。例如,解码设备300可以基于与从比特流获得的与块分割相关的信息来推导单元/块。解码设备300可以通过使用在编码设备中应用的处理单元来执行解码。因此,解码的处理单元可以是例如编码单元,可以用编码树单元或最大编码单元顺着四叉树结构、二叉树结构和/或三叉树结构对其进行分割。可以用编码单元推导一个或更多个变换单元。并且,可以通过再现器来再现通过解码设备300解码并输出的重构图像信号。
解码设备300可以以比特流的形式接收从图2的编码设备输出的信号,并且可以通过熵解码器310对接收到的信号进行解码。例如,熵解码器310可以对比特流进行解析,以推导图像重构(或图片重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可以包括关于诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)、视频参数集(VPS)等这样的各种参数集的信息。另外,视频/图像信息还可以包括常规约束信息。解码设备可以进一步基于关于参数集的信息和/或常规约束信息对图片进行解码。在本公开中,随后将描述的发信号通知/接收的信息和/或语法元素可以通过解码过程被解码并且从比特流中获得。例如,熵解码器310可以基于诸如指数哥伦布编码、CAVLC、CABAC等这样的编码方法对比特流中的信息进行解码,并且可以输出图像重构所需的语法元素的值和关于残差的变换系数的量化值。更具体地,CABAC熵解码方法可以接收与比特流中的各语法元素对应的bin,使用解码目标语法元素信息以及邻近和解码目标块的解码信息或者在先前步骤中解码的符号/bin的信息来确定上下文模型,根据所确定的上下文模型来预测bin生成概率并且对bin执行算术解码以生成与每个语法元素值对应的符号。这里,CABAC熵解码方法可以在确定上下文模型之后使用针对下一个符号/bin的上下文模型解码的符号/bin的信息来更新上下文模型。在熵解码器310中解码的信息当中的关于预测的信息可以被提供到预测器(帧间预测器332和帧内预测器331),并且在熵解码器310中已对其执行了熵解码的残差值(即,量化变换系数)和关联的参数信息可以被输入到残差处理器320。残差处理器320可以推导残差信号(残差块、残差样本、残差样本阵列)。另外,在熵解码器310中解码的信息当中的关于滤波的信息可以被提供到滤波器350。此外,接收从编码设备输出的信号的接收器(未示出)还可以将解码设备300构成为内部/外部元件,并且接收器可以是熵解码器310的组件。此外,根据本公开的解码设备可以被称为视频/图像/图片编码设备,并且解码设备可以被分为信息解码器(视频/图像/图片信息解码器)和样本解码器(视频/图像/图片样本解码器)。信息解码器可以包括熵解码器310,并且样本解码器可以包括解量化器321、逆变换器322、加法器340、滤波器350、存储器360、帧间预测器332和帧内预测器331中的至少一个。
解量化器321可以通过对量化变换系数进行解量化来输出变换系数。解量化器321可以将量化变换系数重新布置为二维块的形式。在这种情况下,可以基于已在编码设备中执行的系数扫描的顺序来执行重新布置。解量化器321可以使用量化参数(例如,量化步长信息)对量化变换系数执行解量化,并且获得变换系数。
解量化器322通过对变换系数进行逆变换来获得残差信号(残差块、残差样本阵列)。
预测器可以对当前块执行预测,并且生成包括针对当前块的预测样本的预测块。预测器可以基于从熵解码器310输出的关于预测的信息来确定向当前块应用帧内预测还是帧间预测,并且具体地可以确定帧内/帧间预测模式。
预测器可以基于各种预测方法来生成预测信号。例如,预测器可以将帧内预测或帧间预测应用于对一个块的预测,并且也可以同时应用帧内预测和帧间预测。这可以被称为组合的帧间和帧内预测(CIIP)。另外,预测器可以针对块的预测执行块内复制(IBC)。块内复制可以被用于诸如屏幕内容编码(SCC)这样的游戏等的内容图像/视频编码。尽管IBC基本上在当前块中执行预测,但是其执行方式与帧间预测的相似之处在于,它推导当前块中的参考块。也就是说,IBC可以使用本公开中描述的帧间预测技术中的至少一种。
帧内预测器331可以通过参考当前图片中的样本来预测当前块。根据预测模式,参考样本可以位于当前块的附近或与当前块分开。在帧内预测中,预测模式可以包括多种非定向模式和多种定向模式。帧内预测器331可以通过使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器332可以基于参照图片上的运动向量所指定的参考块(参考样本阵列)来推导针对当前块的预测块。此时,为了减少在帧间预测模式下发送的运动信息的量,可以基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为基础来预测运动信息。运动信息可以包括运动向量和参照图片索引。运动信息还可以包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括当前图片中存在的空间邻近块和参照图片中存在的时间邻近块。例如,帧间预测器332可以基于邻近块来配置运动信息候选列表,并且基于接收到的候选选择信息来推导当前块的运动向量和/或参照图片索引。可以基于各种预测模式来执行帧间预测,并且关于预测的信息可以包括指示针对当前块的帧间预测的模式的信息。
加法器340可以通过将所获得的残差信号与从预测器330输出的预测信号(预测块、预测样本阵列)相加来生成重构信号(重构图片、重构块、重构样本阵列)。当如在应用跳变模式的情况下一样没有针对处理目标块的残差时,可以将预测块用作重构块。
加法器340可以被称为重构器或重构块生成器。所生成的重构信号可以被用于当前块中的下一处理目标块的帧内预测,并且如随后描述的,可以通过滤波来输出或者被用于下一图片的帧间预测。
此外,在图片解码处理中,可以应用具有色度缩放的亮度映射(LMCS)。
滤波器350可以通过向重构后的信号应用滤波来改善主观/客观视频质量。例如,滤波器350可以通过向重构图片应用各种滤波方法来生成修改后的重构图片,并且可以将修改后的重构图片发送到存储器360中,尤其是发送到存储器360的DPB中。各种滤波方法可以包括例如解块滤波、样本自适应偏移、自适应环形滤波器、双边滤波器等。
已存储在存储器360的DPB中的(修改后的)重构图片可以被用作帧间预测器332中的参照图片。存储器360可以存储从中已推导(或解码了)运动信息的当前图片中的块的运动信息和/或已经重构的图片中的块的运动信息。所存储的运动信息可以被发送到帧间预测器260,以被用作邻近块的运动信息或时间邻近块的运动信息。存储器360可以存储当前图片中的重构块的重构样本,并且将它们发送到帧内预测器331。
在本说明书中,在解码设备300的预测器330、解量化器321、逆变换器322和滤波器350中描述的示例可以分别类似地或对应地应用于编码设备200的预测器220、解量化器234、逆变换器235和滤波器260。
如上所述,执行预测,以便提高执行视频编码时的压缩效率。据此,可以生成包括针对作为编码目标块的当前块的预测样本的预测块。这里,预测块包括空间域(或像素域)中的预测样本。可以在编码设备和解码设备中相同地推导预测块,并且编码设备可以通过向解码设备发信号通知并非原始块本身的原始样本值而是关于原始块与预测块之间的残差的信息(残差信息)来提高图像编码效率。解码设备可以基于残差信息来推导包括残差样本的残差块,通过将残差块与预测块相加来生成包括重构样本的重构块,并且生成包括重构块的重构图片。
可以通过变换过程和量化过程来生成残差信息。例如,编码设备可以推导原始块与预测块之间的残差块,通过对残差块中所包括的残差样本(残差样本阵列)执行变换过程来推导变换系数,并且通过对变换系数执行量化过程来推导量化变换系数,使得它可以(通过比特流)向解码设备发信号通知关联的残差信息。这里,残差信息可以包括量化变换系数的值信息、位置信息、变换技术、变换核、量化参数等。解码设备可以基于残差信息来执行量化/解量化过程并且推导残差样本(或残差样本块)。解码设备可以基于预测块和残差块来生成重构块。编码设备可以通过对量化变换系数进行解量化/逆变换来推导残差块以便作为下一个图片的帧间预测的参考,并且可以基于此来生成重构图片。
图4是例示根据本公开的实施方式的67个帧内预测模式的图。
在根据本公开的实施方式的帧内预测中,可以使用根据图4和表1的67个帧内预测模式。
[表1]
Figure BDA0003376661340000141
这是现有的35个角度模式到67个角度模式的扩展,用于高分辨率图像的帧内编码和更准确的预测。在图4中由虚线表示的箭头指示在35个角度模式中新添加的32个的角度模式。
帧内平面(INTRA_PLANAR)模式和帧内DC(INTRA_DC)模式与现有的帧内平面模式和现有的帧内DC模式相同。所添加的32个角度模式可以应用于所有块大小,并且可以应用于亮度(luma)分量和色度(chroma)分量的帧内编码和解码两者。
参照图4,基于具有左上对角线预测方向的帧内预测模式34,可以将帧内预测模式划分成具有水平方向性的帧内预测模式和具有垂直方向性的帧内预测模式。在图4中,H和V分别标示水平方向性和垂直方向性,并且数字-32至32指示样本网格位置上的1/32单位的位移。这些数字可以表示对于模式索引值的偏移。帧内预测模式2至33具有水平方向性,并且帧内预测模式34至66具有垂直方向性。严格地说,帧内预测模式34可以被视为既不是水平的也不是垂直的,但在确定二次变换的变换集时可以被分类为属于水平方向性。这是因为输入数据被转置以用于基于帧内预测模式34对称的垂直定向模式,并且针对水平模式的输入数据对准方法用于帧内预测模式34。对输入数据进行转置意指将二维的M×N块数据的行和列切换成N×M数据。帧内预测模式18和帧内预测模式50可以分别表示水平帧内预测模式和垂直帧内预测模式,并且帧内预测模式2可以被称为右上对角帧内预测模式,因为帧内预测模式2具有左参考像素并且在右上方向上执行预测。类似地,帧内预测模式34可以被称为右下对角帧内预测模式,而帧内预测模式66可以被称为左下对角帧内预测模式。
如上所描述,帧内预测的预测方向可以在顺时针方向上定义为45度至-135度。然而,当当前块是非正方形块时,可以用广角帧内预测(WAIP)模式适应性地替换一些现有的定向帧内预测模式。
图5是例示根据本公开的实施方式的广角帧内预测模式的图。
当应用广角帧内预测时,关于现有帧内预测的信息可以被发信号通知并且可以被解析并然后被重映射到广角帧内预测模式的索引。因此,可以不改变用于特定块(例如,具有特定大小的非正方形块)的帧内预测模式的总数量,也就是说,帧内预测模式的总数量是67,并且可以不改变用于特定块的帧内预测模式编码。
将参照图6来描述前面的广角帧内预测方法在特定情况下增加图像的编码效率的原因。图6是例示根据本公开的实施方式的非正方形块的帧内预测的图。
如图6的(a)所示,当当前预测块的宽度大于其高度时,上参考像素通常接近要预测的块内部的位置。因此,在左下方向上比在右上方向上执行预测可以更准确。相反,当块的高度大于其宽度时,如图6的(b)所示,左参考像素通常接近要预测的块内部的位置。因此,在右上方向上比在左下方向上执行预测可以更准确。因此,将重映射应用到广角帧内预测模式的索引(即,模式索引变换)可以是有利的。
表2例示了用于通过将帧内预测模式重映射到广角帧内预测模式来推导修改的帧内模式的过程。
[表2]
Figure BDA0003376661340000161
参考表2,指定帧内预测模式的变量predModeIntra、变换块的高度和宽度等用作用于广角帧内预测模式映射过程的输入值,并且输出值是修改的帧内预测模式(predModeIntra)。变换块或编码块的高度和宽度可以是用于重映射帧内预测模式的当前块的高度和宽度。这里,可以将反映宽度和宽度之间的比率的变量whRatio设置为Abs(log2(nW/nH))。
对于非正方形块,可以根据两个单独的情况来修改帧内预测模式。
首先,如果(1)当前块的宽度大于高度、(2)在修改之前的帧内预测模式等于或大于2、以及(3)帧内预测模式小于当whRatio大于1时被推导为(8+2*whRatio)的值并且当whRatio小于或等于1时被推导为8的值(predModeIntra小于(whRatio>1)?(8+2*whRatio):8)的所有条件被满足时,帧内预测模式被设置为等于predModeIntra+65的值。
在另一种情况下,如果(1)当前块的高度大于宽度、(2)在修改之前的帧内预测模式小于或等于66、以及(3)帧内预测模式大于当whRatio大于1时被推导为(60-2*whRatio)的值并且当whRatio小于或等于1时被推导为60的值(predModeIntra大于(whRatio>1)?(60-2*whRatio):60)的所有条件被满足时,帧内预测模式被设置为等于predModeIntra-67的值。
当参考表2所示的过程应用广角帧内预测模式时,要经理模式索引变换的模式关于67个模式列出,如表3所示。
[表3]
条件 替换的帧内预测模式
W/H==2 模式2,3,4,5,6,7
W/H>2 模式2,3,4,5,6,7,8,9,10,11,12,13,14,15
W/H==1
H/W==1/2 模式61,62,63,64,65,66
H/W<1/2 模式53,54,55,56,57,58,59,60,61,62,63,64,65,66
用于广角帧内预测的模式索引可以在变换之前被编码为模式索引。例如,即使当模式2在67模式配置中变换为模式67时,可以编码先前模式索引值2。
当对当前块执行帧内预测时,可以执行当前块的亮度分量块(亮度块)的预测和其色度分量块(色度块)的预测。在此情况下,用于色度分量(色度块)的帧内预测模式可以与用于亮度分量(亮度块)的帧内预测模式分开地设置。
在本说明书中,“色度块”、“色度图像”等可以指代与chroma块、chroma图像等相同的含义,并且因此可以互换地使用色度和chroma。类似地,“亮度块”、“亮度图像”等可以指代与luma块、luma图像等相同的含义,且因此可以互换地使用亮度和luma。
在本说明书中,“当前色度块”可以指代作为当前编码单元的当前块的色度分量块,并且“当前亮度块”可以指代作为当前编码单元的当前块的亮度分量块。因此,当前亮度块和当前色度块彼此对应。然而,当前亮度块和当前色度块并不总是具有相同的块形状和相同的块数量,并且取决于情况可以具有不同的块形状和不同的块数量。在一些情况下,当前色度块可以对应于当前亮度区域,在此情况下,当前亮度区域可以包括至少一个亮度块。
可以基于帧内色度预测模式信息来指示色度分量的帧内预测模式,并且可以用intra_chroma_pred_mode语法元素的形式发信号通知帧内色度预测模式信息。例如,帧内色度预测模式信息可以指示平面模式、DC模式、垂直模式、水平模式、推导模式(DM)和CCLM模式中的一个。这里,当使用图4所示的67个帧内预测模式时,平面模式可以指示帧内预测模式0,DC模式可以指示帧内预测模式1,垂直模式可以指示帧内预测模式50,并且水平模式可以指示帧内预测模式18。DM也可以被称为直接模式。CCLM可以被称为LM。
DM和CCLM是用于使用关于亮度块的信息来预测色度块的相关帧内预测模式。DM可以指代其中将与亮度分量的帧内预测模式相同的帧内预测模式应用于色度分量的帧内预测模式的模式。CCLM可以指代以下帧内预测模式:其中在生成色度块的预测块的过程中对亮度块的重构样本进行下采样,然后通过将CCLM参数α和β应用于经下采样的样本而推导出的样本用作色度块的预测样本。
图7是例示根据本公开的实施方式的在推导色度块的帧内预测模式时可应用的DM的图。
如上所描述,DM可以被定义为原样使用在与当前色度块相同的位置处的亮度块的帧内预测方向的预测模式。在本说明书中,直接使用亮度块(luma块)的帧内预测模式来推导色度帧内模式或可以使用亮度模式或根据亮度模式来推导的色度帧内预测模式可以被称为DM。
在联合视频探索小组(JVET)中使用的联合探索测试模型(JEM)中,作为现有单模式的DM被扩展到多个模式以供使用。
也就是说,当配置用于色度图像的帧内预测模式时,可以选择覆盖图7所示的位置的块的预测模式作为多个DM模式且用于帧内预测。使用从用于亮度块的多个DM当中选择的一个DM作为用于色度块的帧内预测模式的候选可以被称为多DM信令(MDMS)。
用于推导DM的过程可以如下。
(1)用于在与色度块相同的位置处的亮度块的中央(Cr)、左上(TL)、上下(TR)、左下(BL)和右下(BR)位置的帧内预测模式
(2)用于作为当前色度块的相邻块的左(L)、上(A)、BL、右上(AR)和左上(AL)块的帧内预测模式
(3)平面模式,DC模式
(4)先前选择的定向模式(在(1)和(2)中选择的定向模式)-1或+1的定向模式
(5)垂直模式,水平模式,模式2、34、66、10、26
(6)当没有通过上述过程选择5个预测模式时,复制和选择先前选择的模式。
当在(4)中存在多个定向模式时,可以选择第一定向模式-1或+1的定向模式,然后可以选择第二定向模式-1或+1的定向模式。以此方式,可以依次选择多个定向模式-1或+1的定向模式,并且通过(6)可以最终选择五个预测模式作为候选模式。
当存在67个帧内预测模式时,可以在(5)中选择的模式10和26对应于预测模式编号。
图8是例示根据实施方式的在推导色度块的帧内预测模式时可应用的CCLM的图。
在本说明书中,“参考样本模板”可以指代用于预测当前色度块的当前色度块的一组相邻参考样本。可以预定义参考样本模板,并且可以将关于参考样本模板的信息从编码设备200发信号通知给解码设备300。
参照图8,围绕作为当前色度块的4×4块的一条线中阴影化的一组样本指示参考样本模板。在图8中示出,参考样本模板被配置在一条线的参考样本中,而对应于参考样本模板的亮度区域中的参考样本区域被配置成两条线。
在实施方式中,当在联合视频探索小组(JVET)中使用的联合探索测试模型(JEM)中执行色度图像的帧内编码时,可以使用跨分量线性模型(CCLM)。CCLM是用于根据重构的亮度图像的像素值预测色度图像的像素值的方法并且基于亮度图像和色度图像之间的高相关性的特性。
Cb和Cr色度图像的CCLM预测可以基于下式。
[式1]
PredC(i,j)=α·Rec′L(i,j)+β
此处,predC(i,j)表示要预测的Cb或Cr色度图像,RecL‘(i,j)表示调整到色度块大小的重构的亮度图像,并且(i,j)表示像素的坐标。在4:2:0颜色格式中,由于亮度图像的大小是色度图像的大小的两倍,所以需要通过降采样来生成具有色度块大小的RecL‘,因此可以在考虑RecL(2i,2j)和相邻像素两者时采用要用于色度图像predC(i,j)的亮度图像的像素。RecL‘(i,j)可以被称为经降采样的亮度样本。
例如,可以如下式所示使用六个相邻像素来推导RecL‘(i,j)。
[式2]
Rec′L(x,y)=(2×RecL(2x,2y)+2×RecL(2x,2y+1)+RecL(2x-1,2y)+RecL(2x+1,2y)+RecL(2x-1,2y+1)+RecL(2x+1,2y+1)+4)>>3
α和β表示Cb或Cr色度块的相邻模板与图8中的阴影区域中的亮度块的相邻模板之间的互相关和平均差。例如,α和β由式3表示。
[式3]
Figure BDA0003376661340000201
Figure BDA0003376661340000202
L(n)表示对应于当前色度图像的亮度块的相邻参考样本和/或左相邻样本,C(n)表示当前应用编码的当前色度块的相邻参考样本和/或左相邻样本,并且(i,i)表示像素位置。另外,L(n)可以表示当前亮度块的经降采样的上相邻样本和/或左相邻样本。N可以表示用于CCLM参数的计算的像素对(照度和色度)值的总数量,并且可以指示是当前色度块的宽度和高度中的较小值的两倍的值。
图片可以划分成编码树单元(CTU)的序列。CTU可以对应于编码树块(CTB)。另选地,CTU可以包括亮度样本的编码树块以及对应的色度样本的两个编码树块。根据亮度块和对应的色度块是否具有单独的分割结构,可以将树类型分类为单树(SINGLE_TREE)或双树(DUAL_TREE)。单树可以指示色度块具有与亮度块相同的分割结构,而双树可以指示色度分量块具有不同于亮度块的分割结构的分割结构。
在下文中,将描述涉及本公开的图像编码或解码过程的变换过程。
图9示意性地例示根据本公开的实施方式的多变换技术。
参照图9,变换器可以对应于前述图2的编码设备中的变换器,并且逆变换器可以对应于前述图2的编码设备中的逆变换器、或者图3的解码设备中的逆变换器。
变换器可以通过基于残差块中的残差样本(残差样本阵列)执行一次变换来推导(一次)变换系数(S910)。该一次变换可以被称为核心变换。在本文中,一次变换可以基于多变换选择(MTS),并且当将多变换用作一次变换时,可以将其称为多核心变换。
多核心变换可以表示附加地使用离散余弦变换(DCT)类型2和离散正弦变换(DST)类型7、DCT类型8和/或DST类型1进行变换的方法。也就是说,多核心变换可以表示基于从DCT类型2、DST类型7、DCT类型8和DST类型1当中选择的多个变换核将空间域的残差信号(或残差块)变换为频域的变换系数(或一次变换系数)的变换方法。在本文中,从变换器的视角来看一次变换系数可以称为临时变换系数。
换句话说,当应用常规变换方法时,可以通过基于DCT类型2对残差信号(或残差块)应用从空间域到频率域的变换来生成变换系数。与此不同,当应用多核心变换时,可以通过基于DCT类型2、DST类型7、DCT类型8和/或DST类型1对残差信号(或残差块)应用从空间域到频率域的变换来生成变换系数(或一次变换系数)。在本文中,DCT类型2、DST类型7、DCT类型8和DST类型1可以被称为变换类型、变换核或变换核心。可以基于基函数来定义这些DCT/DST变换类型。
当执行多核心变换时,可以从变换核当中选择用于当前块的垂直变换核和水平变换核,可以基于垂直变换核对当前块执行垂直变换,并且可以基于水平变换核对当前块执行水平变换。这里,水平变换可以指示对当前块的水平分量的变换,并且垂直变换可以指示对当前块的垂直分量的变换。可以基于包括残差块的当前块(CU或子块)的预测模式和/或变换索引来适应性地确定垂直变换核/水平变换核。
此外,根据示例,如果通过应用MTS来执行一次变换,则可以通过将特定基函数设置为预定值并组合要在垂直变换或水平变换中应用的基函数来设置变换核的映射关系。例如,当水平变换核表示为trTypeHor,并且垂直方向变换核表示为trTypeVer时,可以将值为0的trTypeHor或trTypeVer设置给DCT2,将值为1的trTypeHor或trTypeVer设置给DST7,并且将值为2的trTypeHor或trTypeVer可以设置给DCT8。
在这种情况下,MTS索引信息可以被编码并且发信号通知到解码设备以指示多个变换核集中的任何一个。例如,MTS索引0可以指示trTypeHor和trTypeVer值均为0,MTS索引1可以指示trTypeHor和trTypeVer值均为1,MTS索引2可以指示trTypeHor值为2并且trTypeVer值为1,MTS索引为3可以指示trTypeHor值为1并且trTypeVer值为2,而MTS索引4可以指示trTypeHor和trTypeVer值均为2。
在一个示例中,根据MTS索引信息的变换核集在下表中示出。
[表4]
tu_mts_idx[x0][y0] 0 1 2 3 4
trTypeHor 0 1 2 1 2
trTypeVer 0 1 1 2 2
变换器可以通过基于(一次)变换系数执行二次变换来推导修改的(二次)变换系数(S920)。一次变换是从空间域到频域的变换,而二次变换是指通过使用(一次)变换系数之间存在的相关性,变换为更具压缩性的表示。二次变换可以包括不可分离的变换。在这种情况下,二次变换可以称为不可分离的二次变换(NSST)或模式相关的不可分离的二次变换(MDNSST)。不可分离的二次变换可以表示这样的变换,其通过基于不可分离的变换矩阵对通过一次变换推导出的(一次)变换系数进行二次变换来生成针对残差信号的修改的变换系数(或二次变换系数)。此时,垂直变换和水平变换可以不单独应用于(一次)变换系数(或者水平变换和垂直变换可以不独立应用),但是可以基于不可分离的变换一次地应用变换矩阵。换句话说,不可分离的二次变换可以表示这样的变换方法,其中,(一次)变换系数的垂直分量和水平分量不分离,并且例如,将二维信号(变换系数)通过某个确定的方向(例如,行第一方向或列第一方向)重新布置为一维信号,然后基于不可分离的变换矩阵生成修改的变换系数(或二次变换系数)。例如,根据行优先顺序,M×N个块以第一行、第二行、...和第N行的顺序设置成排。根据列优先顺序,M×N个块以第一列、第二列、...和第N列的顺序设置成排。不可分离的二次变换可以应用于配置有(一次)变换系数的块(在下文中,可以称为变换系数块)的左上区域。例如,如果变换系数块的宽度(W)和高度(H)均等于或大于8,则可以将8×8不可分离的二次变换应用于变换系数块的左上8×8区域。此外,如果变换系数块的宽度(W)和高度(H)均等于或大于4,并且变换系数块的宽度(W)或高度(H)小于8,那么可以将4×4不可分离的二次变换应用于变换系数块的左上min(8,W)×min(8,H)区域。然而,实施方式不限于此,并且例如,即使仅满足变换系数块的宽度(W)或高度(H)等于或大于4的条件,4×4不可分离的二次变换也可以应用于变换系数块的左上min(8,W)×min(8,H)区域。
具体地,例如,如果使用4×4输入块,则不可分离的二次变换可以如下执行。
4×4输入块X可以表示如下。
[式4]
Figure BDA0003376661340000231
如果X以向量的形式表示,则向量
Figure BDA0003376661340000232
可以如下表示。
[式5]
Figure BDA0003376661340000233
在式5中,向量
Figure BDA0003376661340000234
是通过根据行优先顺序重新布置式4的二维块X而获得的一维向量。
在这种情况下,可以如下计算不可分离的二次变换。
[式6]
Figure BDA0003376661340000235
在此式中,
Figure BDA0003376661340000236
表示变换系数向量,而T表示16×16(不可分离的)变换矩阵。
通过前述式6,可以推导16×1变换系数向量
Figure BDA0003376661340000237
并且可以通过扫描顺序(水平、垂直和对角线等)将向量
Figure BDA0003376661340000238
重新组织为4×4块。然而,上述计算是示例,并且超立方体-吉文斯变换(HyGT)等也可以用于不可分离的二次变换的计算,以便降低不可分离的二次变换的计算复杂度。
此外,在不可分离的二次变换中,可以将变换核(或变换核心、变换类型)选择为模式相关。在这种情况下,模式可以包括帧内预测模式和/或帧间预测模式。
如上所述,可以基于以变换系数块的宽度(W)和高度(H)为基础确定的8×8变换或4×4变换来执行不可分离的二次变换。8×8变换是指当W和H二者都等于或大于8时可应用于变换系数块中包含的8×8区域的变换,并且8×8区域可以是变换系数块中的左上8×8区域。类似地,4×4变换是指当W和H二者都等于或大于4时可应用于变换系数块中包含的4×4区域的变换,并且4×4区域可以是变换系数块中的左上4×4区域。例如,8×8变换核矩阵可以是64×64/16×64矩阵,而4×4变换核矩阵可以是16×16/8×16矩阵。
这里,为了选择模式相关的变换核,可以针对8×8变换和4×4变换二者配置用于不可分离的二次变换的每个变换集二个不可分离的二次变换核,并且可以存在四个变换集。也就是说,可以针对8×8变换配置四个变换集,并且可以针对4×4变换配置四个变换集。在这种情况下,针对8×8变换的四个变换集中的每个变换集可以包括二个8×8变换核,并且针对4×4变换的四个变换集中的每个变换集可以包括二个4×4变换核。
然而,随着变换的大小(即,变换所应用于的区域的大小)可以为例如除了8×8或4×4之外的大小,集的数量可以是n,并且每个集中的变换核的数量可以是k。
变换集可以被称为NSST集或LFNST集。可以例如基于当前块(CU或子块)的帧内预测模式来选择变换集当中的特定集。低频不可分离的变换(LFNST)可以是缩减不可分离的变换的示例,其将稍后描述,并且表示用于低频分量的不可分离的变换。
根据示例,可以映射根据帧内预测模式的四个变换集,例如,如下表所示。
[表5]
lfnstPredModeIntra lfnstTrSetIdx
lfnstPredModeIntra<0 1
0<=lfnstPredModeIntra<=1 0
2<=lfnstPredModeIntra<=12 1
13<=lfnstPredModeIntra<=23 2
24<=lfnstPredModeIntra<=44 3
45<=lfnstPredModeIntra<=55 2
56<=lfnstPredModeIntra<=80 1
81<=lfnstPredModeIntra<=83 0
如表5所示,根据帧内预测模式,四个变换集中的任何一个,即,lfnstTrSetIdx,可以映射到四个索引(即,0至3)中的任何一个。
当确定特定集用于不可分离的变换时,可以通过不可分离的二次变换索引来选择特定集中的k个变换核之一。编码设备可以基于率失真(RD)校验来推导指示特定变换核的不可分离的二次变换索引,并且可以将不可分离的二次变换索引发信号通知给解码设备。解码设备可以基于不可分离的二次变换索引来选择特定集中的k个变换核中的一个。例如,lfnst索引值0可以指代第一不可分离的二次变换核,lfnst索引值1可以指代第二不可分离的二次变换核,lfnst索引值2可以指代第三不可分离的二次变换核。另选地,lfnst索引值0可以指示第一不可分离的二次变换没有被应用于当前块,并且lfnst索引值1至3可以指示三个变换核。
变换器可以基于所选择的变换核来执行不可分离的二次变换,并且可以获得修改的(二次)变换系数。如上所述,修改的变换系数可以被推导为通过量化器量化的变换系数,并且可以被编码并发信号通知给解码设备,并且被传送到编码设备中的解量化器/逆变换器。
此外,如上所述,如果省略了二次变换,则可以将作为一次(可分离的)变换的输出的(一次)变换系数推导为如上所述通过量化器量化的变换系数,并且可以被编码并发信号通知给解码设备,并传送到编码设备中的解量化器/逆变换器。
逆变换器可以与在上述变换器中已经执行的顺序相反的顺序执行一系列过程。逆变换器可以接收(解量化的)变换系数,并且通过执行二次(逆)变换来推导(一次)变换系数(S950),并且可以通过对(一次)变换系数执行一次(逆)变换来获得残差块(残差样本)(S960)。就此而言,从逆变换器的视角来看,一次变换系数可以被称为修改的变换系数。如上所述,编码设备和解码设备可以基于残差块和预测块来生成重构块,并且可以基于重构块来生成重构图片。
解码设备还可以包括二次逆变换应用确定器(或用于确定是否应用二次逆变换的元件)和二次逆变换确定器(或用于确定二次逆变换的元件)。二次逆变换应用确定器可以确定是否应用二次逆变换。例如,二次逆变换可以是NSST、RST或LFNST,并且二次逆变换应用确定器可以基于通过解析比特流而获得的二次变换标志来确定是否应用二次逆变换。在另一示例中,二次逆变换应用确定器可以基于残差块的变换系数来确定是否应用二次逆变换。
二次逆变换确定器可以确定二次逆变换。在这种情况下,二次逆变换确定器可以基于根据帧内预测模式指定的LFNST(NSST或RST)变换集来确定应用于当前块的二次逆变换。在实施方式中,可以取决于一次变换确定方法来确定二次变换确定方法。可以根据帧内预测模式来确定一次变换和二次变换的各种组合。此外,在示例中,二次逆变换确定器可以基于当前块的大小来确定应用二次逆变换的区域。
此外,如上所述,如果省略二次(逆)变换,则可以接收(解量化的)变换系数,可以执行一次(可分离的)逆变换,并且可以获得残差块(残差样本)。如上所述,编码设备和解码设备可以基于残差块和预测块来生成重构块,并且可以基于重构块来生成重构图片。
此外,在本公开中,可以在NSST的概念中应用其中减小了变换矩阵(核)的大小的缩减二次变换(RST),以便减少不可分离的二次变换所需的计算量和存储量。
此外,本公开中描述的变换核、变换矩阵以及构成变换核矩阵的系数,即,核系数或矩阵系数,可以以8比特来表示。这可以是在解码设备和编码设备中实现的条件,并且与现有的9比特或10比特相比,可以减少存储变换核所需的存储量,并且可以合理地适应性能劣化。另外,以8比特表示核矩阵可以允许使用小的乘法器,并且可以更适合于用于最佳软件实现的单指令多数据(SIMD)指令。
在本说明书中,术语“RST”可以是指基于大小根据缩减因子而减小的变换矩阵来对当前块的残差样本执行的变换。在执行缩减变换的情况下,由于变换矩阵的大小的减小,可以减少变换所需的计算量。也就是说,RST可以用于解决在大小大的块的变换或不可分离的变换时发生的计算复杂性问题。
RST可以被称为诸如缩减变换、缩减二次变换、缩小变换、简化变换和简单变换等之类的各种术语,并且RST可以被称为的名称不限于所列示例。另选地,如上所述,由于RST主要在变换块中的包括非零系数的低频区域中执行,因此它可以被称为低频不可分离的变换(LFNST)。
此外,当基于RST执行二次逆变换时,编码设备200的逆变换器235和解码设备300的逆变换器322可以包括:逆缩减二次变换器,其基于变换系数的逆RST来推导修改的变换系数;以及逆一次变换器,其基于修改的变换系数的逆一次变换来推导当前块的残差样本。逆一次变换是指应用于残差的一次变换的逆变换。在本公开中,基于变换推导变换系数可以是指通过应用变换来推导变换系数。
图10是例示根据本公开的实施方式的RST的图。
在本公开中,“当前块”可以指代要编码的当前块,残差块或变换块。
在根据示例的RST中,可以将N维向量映射到位于另一个空间中的R维向量,从而可以确定缩减变换矩阵,其中R小于N。N可以是指应用了变换的块的侧边的长度的平方,或与应用了变换的块相对应的变换系数的总数,并且缩减因子可以是指R/N值。缩减因子可以被称为缩减因子、缩小因子、简化因子、简单因子或其它各种术语。此外,R可以被称为缩减系数,但是根据情况,缩减因子可以是指R。此外,根据情况,缩减因子可以是指N/R值。
在示例中,可以通过比特流来用信号通知缩减因子或缩减系数,但是示例不限于此。例如,可以在编码设备200和解码设备300中的每一个中存储针对缩减因子或缩减系数的预定值,并且在这种情况下,可以不单独发信号通知缩减因子或缩减系数。
根据示例的缩减变换矩阵的大小可以是小于N×N(常规变换矩阵的大小)的R×N,并且可以如下面的式7所限定。
[式7]
Figure BDA0003376661340000271
图10的(a)中所示的缩减变换块中的矩阵T可以是指式7的矩阵TR×N。如图10的(a)所示,当将缩减变换矩阵TR×N乘以当前块的残差样本时,可以推导当前块的变换系数。
在示例中,如果应用了变换的块的大小是8×8并且R=16(即,R/N=16/64=1/4),则根据图10的(a)的RST可以被表示为以下式8所示的矩阵运算。在这种情况下,存储和乘法计算可以通过缩减因子缩减至大约1/4。
在本公开中,矩阵运算可以理解为通过将列向量与设置在列向量的左侧的矩阵相乘来获得列向量的运算。
[式8]
Figure BDA0003376661340000272
在式8中,r1至r64可以表示当前块的残差样本,并且具体地可以是通过应用一次变换而生成的变换系数。作为式8的计算的结果,可以推导当前块的变换系数ci,并且推导ci的过程可以如式9所示。
[式9]
Figure BDA0003376661340000273
作为式9的计算的结果,可以推导当前块的变换系数c1至cR。也就是说,当R=16时,可以推导当前块的变换系数c1至c16。如果应用常规变换而不是RST,并将64×64(N×N)大小的变换矩阵与64×1(N×1)大小的残差样本相乘,则因为应用了RST而针对当前块仅推导16(R)个变换系数,尽管针对当前块推导了64(N)个变换系数。由于用于当前块的变换系数的总数从N缩减到R,所以编码设备200向解码设备300发送的数据量减少,因此编码设备200与解码设备300之间的传输效率可以提高。
当从变换矩阵的大小的视角考虑时,常规变换矩阵的大小为64×64(N×N),但缩减变换矩阵的大小缩减为16×64(R×N),因此与执行常规变换的情况相比,执行RST的情况下的存储使用率可以减小R/N比率。另外,当与使用常规变换矩阵的情况下的乘法计算的数量N×N相比时,使用缩减变换矩阵可以将乘法计算的数量(R×N)减小R/N比率。
在示例中,编码设备200的变换器232可以通过对当前块的残差样本执行一次变换和基于RST的二次变换来推导当前块的变换系数。这些变换系数可以被传送到解码设备300的逆变换器,并且解码设备300的逆变换器322可以基于针对变换系数的逆缩减二次变换(RST)来推导修改的变换系数,并且可以基于针对修改的变换系数的逆一次变换来推导当前块的残差样本。
根据示例的逆RST矩阵TN×R的大小为比常规逆变换矩阵N×N的大小小的N×R,并且与式7中所示的缩减变换矩阵TR×N具有转置关系。
图10的(b)所示的缩减逆变换块中的矩阵Tt可以是指逆RST矩阵TN×R T(上标T是指转置)。如图10的(b)所示,当将逆RST矩阵TN×R T乘以当前块的变换系数时,可以推导当前块的修改的变换系数或当前块的残差样本。逆RST矩阵TR×N T可以表示为(TR×N T)N×R
更具体地,当逆RST被用作二次逆变换时,当逆RST矩阵TN×R T被乘以当前块的变换系数时,可以推导当前块的修改的变换系数。此外,可以将逆RST用作逆一次变换,并且在这种情况下,当将逆RST矩阵TN×R T与当前块的变换系数相乘时,可以推导当前块的残差样本。
在示例中,如果应用逆变换的块的大小是8×8并且R=16(即,R/N=16/64=1/4),则根据图10的(b)的RST可以被表示为以下式10所示的矩阵运算。
[式10]
Figure BDA0003376661340000291
在式10中,c1至c16可以表示当前块的变换系数。作为式10的计算的结果,可以推导表示当前块的修改的变换系数或当前块的残差样本的rj,并且推导rj的过程可以如式11所示。
[式11]
Figure BDA0003376661340000292
作为式11的计算的结果,可以推导表示当前块的修改的变换系数或当前块的残差样本的r1至rN。从逆变换矩阵的大小的视角考虑,常规逆变换矩阵的大小为64×64(N×N),但逆缩减变换矩阵的大小缩减为64×16(R×N),因此与执行常规逆变换的情况相比,执行逆RST的情况下的存储使用率可以减小R/N比率。另外,当与使用常规逆变换矩阵的情况下的乘法计算的数量N×N相比时,使用逆缩减变换矩阵可以将乘法计算的数量(N×R)减少R/N比率。
表5所示的变换集配置也可以应用于8×8RST。也就是说,可以根据表5中的变换集来应用8×8RST。由于根据帧内预测模式,一个变换集包括两个或三个变换(核),因此可以将其配置为选择包括在不应用二次变换的情况下在内的至多四个变换中的一个。在不应用二次变换的变换中,可以考虑应用恒等矩阵(identity matrix)。假设分别将索引0、1、2和3分配给四个变换(例如,可以将索引0分配给应用恒等矩阵的情况,即,不应用二次变换的情况),可以针对每个变换系数块发信号通知作为语法元素的变换索引或lfnst索引,由此指定要应用的变换。也就是说,针对左上8×8块,通过变换索引,可以指定RST配置中的8×8NSST,或者当应用LFNST时可以指定8×8lfnst。8×8lfnst和8×8RST指代当要变换的当前块的W和H均等于或大于8时可应用于变换系数块中包括的8×8区域的变换,并且8×8区域可以是变换系数块中的左上8×8区域。类似地,4×4lfnst和4×4RST指代当当前块的W和H均等于或大于4时可应用于变换系数块中包括的4×4区域的变换,并且4×4区域可以是变换系数块中的左上4×4区域。
根据本公开的实施方式,对于编码过程中的变换,可以仅选择48条数据,并且可以向其应用最大16×48变换核矩阵,而不是将16×64变换核矩阵应用于形成8×8区域的64条数据。此处,“最大”意味着m在m×48变换核矩阵中具有最大值16以用于生成m个系数。也就是说,当通过将m×48变换核矩阵(m≤16)应用于8×8区域来执行RST时,输入48条数据,并且生成m个系数。当m是16时,输入48条数据并且生成16个系数。也就是说,假设48条数据形成48×1向量,16×48矩阵和48×1向量依次相乘,由此生成16×1向量。这里,形成8×8区域的48条数据可以被适当地布置,由此形成48×1向量。例如,存在于8×8区域中的除了右下4×4区域之外的区域中的48条数据可以形成48×1向量。这里,当通过应用最大16×48变换核矩阵来执行矩阵运算时,生成16个修改的变换系数,并且可以根据扫描顺序将16个修改的变换系数布置在左上4×4区域中,并且可以用零填充右上4×4区域和左下4×4区域。
对于解码过程中的逆变换,可以使用前述变换核矩阵的转置矩阵。也就是说,当在由解码设备执行的逆变换过程中执行逆RST或LFNST时,根据预定布置顺序在一维向量中配置应用逆RST的输入系数数据,并且可以根据预定布置顺序将通过将一维向量与在一维向量左侧的对应的逆RST矩阵相乘而获得的修改的系数向量布置到二维块中。
总之,在变换过程中,当RST或LFNST被应用于8×8区域时,在8×8区域的除了右下区域之外的左上区域、右上区域和左下区域中的48个变换系数与16×48变换核矩阵的矩阵运算。对于矩阵运算,以一维阵列输入48个变换系数。当执行矩阵运算时,推导出16个修改的变换系数,并且可以将修改的变换系数布置于8×8区域的左上区域中。
相反,在逆变换过程中,当将逆RST或LFNST应用于8×8区域时,可以根据扫描顺序以一维阵列输入8×8区域中的变换系数当中的对应于8×8区域的左上区域的16个变换系数,并且可以经历与48×16变换核矩阵的矩阵运算。也就是说,矩阵运算可以表示为(48×16矩阵)*(16×1变换系数向量)=(48×1修改的变换系数向量)。这里,n×1向量可以被解释为具有与n×1矩阵相同的含义,并且因此可以被表示为n×1列向量。此外,*表示矩阵乘法。当执行矩阵运算时,可以推导出48个修改的变换系数,并且可以将48个修改的变换系数布置在8×8区域中的除了右下区域之外的左上区域、右上区域和左下区域中。
当二次逆变换基于RST时,编码设备200的逆变换器235和解码设备300的逆变换器322可以包括用于基于对变换系数的逆RST推导修改的变换系数的逆缩减二次变换器以及用于基于对修改的变换系数的逆一级变换来推导当前块的残差样本的逆一次变换器。逆一次变换指代应用于残差的一次变换的逆变换。在本公开中,基于变换推导变换系数可以指代通过应用变换来推导变换系数。
当在帧内预测中应用广角帧内预测且因此将帧内预测模式重置、重新索引或重映射时,可以讨论用于配置用于不可分离的二次变换(即,LFNST)的帧内预测模式的方法。
根据示例,可以基于新或修改的帧内预测模式应用不可分离的二次变换,在此情况下,可以存在用于设置用于将修改的帧内预测模式应用到表5的变换集的变量的各种示例。
根据示例,当针对帧内预测推导帧内预测模式(predModeIntra)并将广角帧内预测应用于当前块时,可以对应于广角帧内预测来更新或重映射所推导出的帧内预测模式。通过重映射修改的帧内模式可以设置为变量predModeIntra,其与修改之前的帧内模式相同。用于最终帧内预测模式的变量predModeIntra可以用作用于LFNST的变换集的帧内预测模式。
根据另一示例,可以将用于最终帧内预测模式的变量predModeIntra重置为用于LFNST的变换集的帧内预测模式(lfnstPredModeIntra)。
另选地,根据示例,当应用LFNST而非从帧内预测推导出的帧内预测模式时,可以通过应用广角帧内预测来设置新变量lfnstPredModeIntra。根据本实施方式的图像处理过程可以在下面的表6至表22中示出。
[表6]
Figure BDA0003376661340000321
表6示出了图像解码过程中的指示是否应用不可分离的二次变换(即,是否存在指示是否应用不可分离的二次变换的变换索引,即lfnst_idx)的语法元素sps_lfnst_enabled_flag的信令。可以在残差编码语法或编码单元语法中发信号通知lfnst_idx。
[表7]
Figure BDA0003376661340000331
表7示出了在编码单元语法中发信号通知lfnst_idx。lfnst_idx可以指示包括在变换集中的两个变换核矩阵中的任何一个,并且为0的lfnst_idx可以指示不应用不可分离的二次变换(即,LFNST)。
[表8]
Figure BDA0003376661340000341
表8示出了用于应用广角帧内预测的帧内预测模式被新设置在变换过程中。如表8所示,当表7的lfnst_idx不为0时,推导用于LFNST的各种变量。在第一步骤中,当当前块为非正方形时,表示当前块的高度与宽度之间的比率的变量whRatio被设置为(Abs(Log2(nTbW/nTbH))),并且将用于二次变换的帧内预测模式(lfnstPredModeIntra)设置为当前块的帧内预测模式IntraPredMode。
在第二步骤中,当当前块是非正方形时,lfnstPredModeIntra被重映射到新的帧内预测模式。由于该过程与参考表2所描述的相同,因此省略了冗余描述。
当反映广角帧内预测的帧内预测模式(lfnstPredModeIntra)被新推导出时,可以基于变量lfnstPredModeIntra执行不可分离的二次变换(LFNST)。
[表9]
Figure BDA0003376661340000351
表9示出了推导通过变换核矩阵解量化的经变换的样本的列表y[i](低频不可分离的变换过程),其中对应于用于选择变换集的索引(lfnstPredModeIntra)的lfnstPredModeIntra用作输入值。可以基于LfnstPredModeIntra选择变换集,并且可以根据指示变换集中的任何一个的变换索引来应用各种变换核矩阵。表10至表22示出了根据用于4×4LFNST和8×8LFNST的变换索引的变换核矩阵(lowFreqTransMatrix)。
[表10]
Figure BDA0003376661340000361
表10示出了根据反映广角帧内预测模式的帧内预测模式(lfnstPredModeIntra)的变换集索引(lfnstTrSetIdx)。根据表10,在对应于广角帧内预测的预测模式中,即,如果lfnstPredModeIntra小于0(lfnstPredModeIntra<0)或lfnstPredModeIntra的范围从56到80(56<=lfnstPredModeIntra<=80),则变换集索引(lfnstTrSetIdx)可以被推导为1。
表11至表14依次示出了在4×4LFNST中当变换集索引的范围从0到3时可以包括在每个集中的两个变换核矩阵。可以基于指示在LFNST之后输出的变换系数的大小的nTrS、变换集索引(lfnstTrSetIdx)和变换索引(lfnstIdx)来推导表11至表14中的变换核矩阵。根据示例,4×4LFNST中的变换系数的大小nTrS可以是16。
[表11]
Figure BDA0003376661340000371
[表12]
Figure BDA0003376661340000381
[表13]
Figure BDA0003376661340000391
[表14]
Figure BDA0003376661340000401
表15至表22依次示出了在8×8LFNST中当变换集索引的范围从0到3时可以包括在每个集中的两个变换核矩阵。可以基于指示在LFNST之后输出的变换系数的大小的nTrS、变换集索引(lfnstTrSetIdx)和变换索引(lfnstIdx)来推导表15至表22中的变换核矩阵。根据示例,8×8LFNST中的变换系数的大小nTrS可以是48。由于存在48个输出变换系数,所以变换核矩阵可以是48×16矩阵,并且通过将一行的48个矩阵系数除以16条来示出。表15示出了当变换集索引(lfnstTrSetIdx)为0且变换索引(lfnstIdx)为1时的变换核矩阵,表16示出了当变换集索引(lfnstTrSetIdx)为0且变换索引(lfnstIdx)为2时的变换核矩阵。类似地,表17和表18分别示出了当变换集索引(lfnstTrSetIdx)为1且变换索引(lfnstIdx)为1时以及当变换集索引(lfnstTrSetIdx)为1且变换索引(lfnstIdx)为2时的变换核矩阵。类似地,表19和表20分别示出了当变换集索引(lfnstTrSetIdx)为2且变换索引(lfnstIdx)为1时以及当变换集索引(lfnstTrSetIdx)为2且变换索引(LFnst Idx)为2时的变换核矩阵。类似地,表21和表22分别示出了当变换集索引(lfnstTrSetIdx)为3且变换索引(lfnstIdx)为1时以及当变换集索引(lfnstTrSetIdx)为3且变换索引(lfnstIdx)为2时的变换核矩阵。
[表15]
Figure BDA0003376661340000411
[表16]
Figure BDA0003376661340000421
[表17]
Figure BDA0003376661340000431
[表18]
Figure BDA0003376661340000441
[表19]
Figure BDA0003376661340000451
[表20]
Figure BDA0003376661340000461
[表21]
Figure BDA0003376661340000471
[表22]
Figure BDA0003376661340000481
根据另一示例,可以在后续编码和解码过程中通过输入值和输出值来发送从帧内预测推导出的变量predModeIntra。最终,可以使用不可分离的变换(LFNST)过程中输入的变量wideAngPredModeIntra来应用LFNST。该过程在下表中示出。
[表23]
Figure BDA0003376661340000491
[表24]
Figure BDA0003376661340000501
表23示出了在子图像处理步骤(条款8.4.5.2规定的帧内样本预测过程和条款8.7.2规定的缩放和变换过程)中推导变量wideAngPredModeIntra作为输出值,而表24示出了在帧内样本预测步骤(8.4.5.2中的帧内样本预测)中推导变量wideAngPredModeIntra作为输出值。
[表25]
Figure BDA0003376661340000511
表25示出了表24的子步骤,其中将变量wideAngPredModeIntra推导为输出值。从表25推导出的变量wideAngPredModeIntra是应用广角帧内预测的非正方形块的模式重映射的结果,并且与参考表2所描述的相同。
[表26]
Figure BDA0003376661340000531
表26示出了表25中设置的变量wideAngPredModeIntra用作图像处理的变换步骤中的输入值。
[表27]
Figure BDA0003376661340000541
表27示出了将wideAngPredModeIntra应用于不可分离二次变换(即,LFNST)。根据表27的变换核矩阵可以与上述表11至表22中的变换核矩阵相同,并且表6和表7的索引信令也可以应用于此实施方式。
提供以下附图以描述本公开的具体示例。由于在附图中示出的装置的具体名称或特定信号/消息/字段的名称是为了例示而提供的,所以本公开的技术特征不限于在以下附图中使用的特定名称。
图11是例示根据本公开的实施方式的视频解码设备的操作的流程图。
图11所示的每个操作可以由图3所示的解码设备300执行。具体地,S1100可以由图3所示的熵解码器310执行,S1110和S1120可以由图3所示的帧内预测器331执行,并且S1130至S1160可以由逆变换器322执行。根据S1100至S1160的操作基于参照图4至图10解释的前述细节中的一些。因此,将省略或将简要地描述与上文参照图3至图10解释的那些细节重叠的具体细节的描述。
根据实施方式的解码设备300可以从比特流中获得帧内预测模式信息和LFNST索引(S1100)。
帧内预测模式信息可以包括指示MPM列表中的MPM候选中的一个的最可能模式(MPM)索引以及指示未包括在MPM候选中的其余帧内预测模式中的一个的其余帧内预测模式信息,MPM列表是基于用于当前块的相邻块(例如,左相邻块和/或上相邻块)的帧内预测模式和附加帧内预测模式推导出的。
另外,解码设备300可以从比特流中解码关于当前块的量化变换系数的信息,并且可以基于关于当前块的量化变换系数的信息推导当前块的量化变换系数。关于当前块的量化变换系数的信息可以包括于序列参数集(SPS)或条带报头中,并且可以包括关于是否应用缩减变换(RST)的信息、关于应用缩减变换的最小变换大小的信息、关于应用缩减变换的最大变换大小的信息、缩减逆变换大小、以及关于指示变换集(LFNST集)中所包含的变换核矩阵(LFNST矩阵)中的任何一个的变换索引(LFNST索引)的信息中的至少一者。
当用于当前块的分割树结构是双树类型时,可以针对亮度块和色度块中的每一个接收LFNST索引。
解码设备300还可以接收指示逆一次变换的变换核的MTS索引信息。
根据实施方式的解码设备300可以通过解量化当前块的量化变换系数来推导变换系数。根据示例,当执行逆二次变换和逆一次变换时,已对其执行解量化的样本可以被称为变换系数,并且已对其执行逆二次变换的样本可以被称为修改的变换系数。如果需要,两个样本可以统称为变换系数。当执行逆一次变换时,推导出残差样本。
解码设备300基于帧内预测模式信息来推导当前块的帧内预测模式(S1110)。
例如,解码设备300可以基于当前块的相邻块的预测模式来生成MPM列表,并且可以基于所接收的MPM索引或其余帧内预测模式信息来推导当前块的帧内预测模式。
解码设备300可以在推导帧内预测样本之前确定广角帧内预测是否应用于当前块,并且可以在将广角帧内预测应用于当前块时通过帧内预测模式重映射推导修改的帧内预测模式(S1120)。
基于是否应用帧内分割预测,当前块可以是变换块或编码块,并且当当前块的高度和宽度不相同时,即,当当前块为非正方形时,可以应用广角帧内预测。
对于非正方形块,可以根据两个单独的情况来修改帧内预测模式,并且可以基于当前块的高度和宽度中的哪一者更大、当前块的高度与宽度之间的比率以及帧内预测模式来推导修改的帧内预测模式。
首先,在第一种情况下,如果(1)当前块的宽度大于高度、(2)在修改之前的帧内预测模式等于或大于2、以及(3)帧内预测模式小于当whRatio大于1时被推导为(8+2*whRatio)的值并且当whRatio小于或等于1时被推导为8的值的所有条件被满足时,帧内预测模式被设置为等于predModeIntra+65的值。
在第二种情况下,如果(1)当前块的高度大于宽度、(2)在修改之前的帧内预测模式小于或等于66、以及(3)帧内预测模式大于当whRatio大于1时被推导为(60-2*whRatio)的值并且当whRatio小于或等于1时被推导为60的值的所有条件被满足时,帧内预测模式被设置为等于predModeIntra-67的值。
例如,当帧内预测模式信息指示平面模式(0)、DC模式(1)以及图4的定向模式2至66中的任何一个时,如果当前块的宽度大于当前块的高度,则修改的帧内预测模式可以被推导为在从图5的67到80的范围内。如果当前块的高度大于当前块的宽度,则修改的帧内预测模式可以被推导为在从图5的-1到-14的范围内。
当色度块的帧内预测模式是使用与亮度块的帧内预测模式相同的模式的DM时,可以将广角帧内预测应用于色度块。
解码设备300的逆变换器332可以基于根据应用于当前块的修改的帧内预测模式的映射关系来确定变换集(即,LFNST集)(S1130),并且可以基于LFNST集和LFNST索引来选择多个LFNST矩阵中的任何一个(S1140)。
根据示例,如表5所示,当根据当前块的帧内预测模式确定四个LFNST集中的任何一个时,可以在应用广角帧内预测的所有情况下确定相同LFNST集。也就是说,在修改的帧内预测模式在从67到80的范围内的情况下的LFNST集和在修改的帧内预测模式在从-1到-14的范围内的情况下的LFNST集可以是相同的。
随后,解码设备300可通过将LFNST矩阵应用于解量化变换系数来执行逆RST(例如,逆LFNST),由此推导出当前块的修改的变换系数(S1150)。
如上所述,可以根据要变换的变换块的帧内预测模式来确定多个变换集中的任何一个,并且可以基于包括于由LFNST索引指示的LFNST集中的LFNST矩阵中的任何一个来执行逆RST。
LFNST矩阵可以是其中列的数量小于行的数量的非正方形矩阵。
参见S1150,可以识别出,当前块的残差样本是基于对当前块的变换系数的逆RST来推导出的。关于逆变换矩阵的大小,一般逆变换矩阵的大小为N×N,而逆RST矩阵的大小被缩减为N×R,因此与执行一般变换时相比,在执行逆RST时可以使存储器占用减少R/N比率。此外,与当使用一般逆变换矩阵时的乘法运算的数量N×N相比,当使用逆RST矩阵时,可以将乘法运算的数量减少R/N比率(到N×R)。另外,由于在应用逆RST时仅需要解码R个变换系数,所以与应用其中需要解码N个变换系数的一般逆变换相比,当前块的变换系数的总数量可以从N减小到R,因此增加解码效率。也就是说,根据S1150,解码设备300的(逆)变换效率和解码效率可以通过逆RST增加。
根据实施方式的解码设备300可以基于对修改的变换系数的逆变换来推导当前块的残差样本(S1160)。
解码设备300可以对当前块的修改的变换系数执行逆一次变换,在此情况下,可应用简化的逆变换或者可以使用常规可分离的变换作为逆一次变换。
随后,解码设备300可以基于当前块的残差样本和当前块的预测样本来生成重构样本。
提供以下附图以描述本公开的具体示例。由于在附图中示出的装置的具体名称或特定信号/消息/字段的名称是为了例示而提供的,所以本公开的技术特征不限于在以下附图中使用的特定名称。
图12是例示根据本公开的实施方式的视频编码设备的操作的流程图。
图12所示的每个操作可以由图2所示的编码设备200执行。具体地,S1200到S1220可以由图2所示的预测器执行,S1230可以由由图2所示的减法器231执行,S1240和S1250可以由图2所示的变换器232执行,并且S1260可以由图2所示的熵编码器240执行。根据S1200至S1260的操作基于在图4至图10中描述的内容中的一些。因此,将省略或将简要描述与上文参照图2和图4至图10解释的那些细节重叠的具体细节的描述。
根据实施方式的编码设备200可以推导当前块的帧内预测模式(S1200)。
编码设备200可以配置当前块的MPM列表,并且可以基于率失真优化(RDO)来确定最佳帧内预测模式。
MPM列表可以包括高度有可能应用于当前块的候选帧内预测模式(MPM候选)。例如,MPM列表可以包括相邻块的帧内预测模式并且还可以包括根据预定方法的特定帧内预测模式。
编码设备200可以基于各种帧内预测模式执行预测,并且可以基于其上的率失真优化(RDO)确定最佳帧内预测模式。编码设备200可以仅使用包括于MPM列表中的MPM候选来确定最佳帧内预测模式,或者可以除了包括于MPM列表中的MPM候选之外还使用其余帧内预测模式来确定最佳帧内预测模式。
当广角帧内预测应用于当前块时,编码设备200可通过帧内预测模式重映射来推导修改的帧内预测模式(S1210)。
基于是否应用帧内分割预测,当前块可以是变换块或编码块,并且当当前块的高度和宽度不相同时,即,当当前块为非正方形时,可以应用广角帧内预测。
对于非正方形块,可以根据两个单独的情况来修改帧内预测模式,并且可以基于当前块的高度和宽度中的哪一者更大、当前块的高度与宽度之间的比率以及帧内预测模式来推导修改的帧内预测模式。例如,当帧内预测模式信息指示平面模式(0)、DC模式(1)以及图4的定向模式2至66中的任何一个时,如果当前块的宽度大于当前块的高度,则修改的帧内预测模式可以被推导为在从图5的67到80的范围内。如果当前块的高度大于当前块的宽度,则修改的帧内预测模式可以被推导为在从图5的-1到-14的范围内。
当色度块的帧内预测模式是使用与亮度块的帧内预测模式相同的模式的DM时,可以将广角帧内预测应用于色度块。
编码设备200可以基于应用于当前块的修改的帧内预测模式来推导预测样本(S1220),并且可以基于预测样本来推导当前块的残差样本(S1230)。
根据实施方式的编码设备200可以基于修改的帧内预测模式来确定包括LFNST矩阵的LFNST集(S1240)。
编码设备200可以在基于LFNST集的不可分离的变换之前执行基于MTS的一次变换,并且可以生成指示使用哪个MTS的MTS索引。
根据示例,如表5所示,当根据当前块的帧内预测模式确定四个LFNST集中的任何一个时,可以在应用广角帧内预测的所有情况下确定相同LFNST集。也就是说,在修改的帧内预测模式在从67到80的范围内的情况下的LFNST集和在修改的帧内预测模式在从-1到-14的范围内的情况下的LFNST集可以是相同的。
编码设备200可以基于残差样本、LFNST集和LFNST矩阵来推导当前块的变换系数(S1250)。
如上所述,可以基于对残差样本的一次变换来推导当前块的变换系数,并且可以通过多个变换核执行一次变换。在此情况下,可以基于帧内预测模式选择变换核。
尽管在执行一次变换之后的残差样本可以被称为变换系数,并且在执行LFNST之后的样本可以被称为修改的变换系数,但这两种类型的样本可以统称为变换系数。
如上所述,可以根据要变换的变换块的帧内预测模式来确定多个变换集中的任何一个,并且可以基于包括于LFNST集中的LFNST矩阵中的任何一个来执行逆RST。
每个LFNST集可以包括两个LFNST矩阵,并且LFNST矩阵可以是其中列的数量小于行的数量的非正方形矩阵。
参见S1250,基于对残差样本的RST来推导当前块的变换系数。关于变换核矩阵的大小,一般变换核矩阵的大小是N×N,而简化的变换矩阵的大小被缩减为R×N,因此与执行一般变换时相比,在执行RST时可以使存储器占用减少R/N比率。此外,与当使用一般变换矩阵时的乘法运算的数量N×N相比,当使用简化的变换核矩阵时,可以将乘法运算的数量减少R/N比率(到N×R)。另外,由于在应用RST时仅需要推导R个变换系数,所以与应用其中推导N个变换系数的一般变换相比,当前块的变换系数的总数量可以从N减小到R,因此减少由编码设备200发送到解码设备300的数据量。也就是说,根据S1250,编码设备200的变换效率和编码效率可以通过RST增加。
根据实施方式的编码设备200可以通过基于当前块的修改的变换系数执行量化来推导量化变换系数并且可以编码关于量化变换系数的信息。
编码设备200可以编码并生成图像信息,除了关于量化变换系数的信息之外,图像信息还包括帧内预测模式和指示LFNST矩阵的LFNST索引(S1260)。
根据此实施方式的LFNST索引的语法元素可以指示是否应用(逆)LFNST以及包括在LFNST集中的LFNST矩阵中的任何一个。当LFNST集包括两个变换核矩阵时,变换索引的语法元素可以具有三个值。
根据示例,当用于当前块的分割树结构为双树类型时,可以针对亮度块和色度块中的每一个来编码LFNST索引。
根据实施方式,变换索引的语法元素可以被推导为指示无(逆)RST应用于当前块的值0、指示变换核矩阵当中的第一变换核矩阵的值1,或指示变换核矩阵当中的第二变换核矩阵的值2。
在本公开中,可以省略量化/解量化和/或变换/逆变换中的至少一者。当省略量化/解量化时,可以将量化变换系数称为变换系数。当省略变换/逆变换时,变换系数可以被称为系数或残差系数,或者为了表述一致性仍可以被称为变换系数。
另外,在本公开中,量化变换系数和变换系数可以分别被称为变换系数和缩放变换系数。在此情况下,残差信息可以包括关于变换系数的信息,并且可以通过残差编码语法发信号通知关于变换系数的信息。可以基于残差信息(或关于变换系数的信息)来推导变换系数,并且可以通过变换系数的逆变换(缩放)来推导缩放变换系数。可以基于缩放变换系数的逆变换(变换)来推导残差样本。这些细节也可以在本公开的其它部分中应用/表达。
在上述实施方式中,借助于一系列步骤或方框基于流程图解释了方法,但是本公开不限于步骤的顺序,并且可以按与上述顺序或步骤不同的顺序或步骤来执行某一步骤,或某一步骤与其它步骤并发地执行。此外,本领域普通技术人员可以理解,流程图中所示的步骤不是排它的,并且在不影响本公开的范围的情况下,可以并入另一步骤或者可以删除流程图中的一个或更多个步骤。
根据本公开的上述方法可以被实现为软件形式,并且根据本公开的编码设备和/或解码设备可以被包括在诸如电视、计算机、智能电话、机顶盒和显示装置等之类的用于图像处理的设备中。
当本公开中的实施方式通过软件来实施时,上述方法可以被实施为用于执行上述功能的模块(步骤、功能等)。这些模块可以存储在存储器中并且可以由处理器执行。存储器可以在处理器内部或外部,并且可以以各种众所周知的方式连接到处理器。处理器可以包括专用集成电路(ASIC)、其它芯片组、逻辑电路和/或数据处理装置。存储器可以包括只读存储器(ROM)、随机存取存储器(RAM)、闪存、存储卡、存储介质和/或其它存储装置。也就是说,本公开中描述的实施方式可以在处理器、微处理器、控制器或芯片上实施和执行。例如,每个附图中所示的功能单元可以在计算机、处理器、微处理器、控制器或芯片上实施和执行。
此外,应用本公开的解码设备和编码设备可以包括在多媒体广播收发器、移动通信终端、家庭影院视频装置、数字影院视频装置、监控相机、视频聊天装置、实时通信装置(诸如视频通信)、移动流装置、存储介质、便携式摄像机、视频点播(VoD)服务提供装置、顶置(OTT)视频装置、互联网流服务提供装置、三维(3D)视频装置、视频电话视频装置、和医疗视频装置,并且可以用于处理视频信号或数据信号。例如,顶置(OTT)视频装置可以包括游戏机、蓝光播放器、互联网接入TV、家庭影院系统、智能电话、平板PC、数字视频记录仪(DVR)等。
另外,应用本公开的处理方法可以以由计算机执行的程序的形式来生产,并且可以存储在计算机可读记录介质中。具有根据本公开的数据结构的多媒体数据也可以存储在计算机可读记录介质中。计算机可读记录介质包括存储计算机可读数据的各种存储装置和分布式存储装置。计算机可读记录介质可以包括例如蓝光盘(BD)、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。此外,计算机可读记录介质包括以载波(例如,互联网上的传输)形式实施的介质。另外,通过编码方法所生成的比特流可以存储在计算机可读记录介质中,或者通过有线或无线通信网络来传输。另外,本公开的实施方式可以通过程序代码被实施为计算机程序产品,并且程序代码可以按照本公开的实施方式在计算机上执行。程序代码可以存储在计算机可读载体上。
图13例示了应用本公开的内容流系统的结构。
此外,应用本公开的内容流系统可以大致包括编码服务器、流服务器、web服务器、媒体存储装置、用户设备和多媒体输入装置。
编码服务器用于将从诸如智能电话、相机、便携式摄像机等的多媒体输入装置输入的内容压缩成数字数据以生成比特流,并且向流服务器发送它。作为另一示例,在诸如智能电话、相机、便携式摄像机等的多媒体输入装置直接生成比特流的情况下,可以省略编码服务器。可以通过应用本公开的编码方法或比特流生成方法来生成比特流。并且流服务器可以在发送或接收比特流的过程期间临时存储比特流。
流服务器基于用户的请求通过web服务器向用户装置发送多媒体数据,web服务器用作向用户通知存在什么服务的的器具。当用户请求用户想要的服务时,web服务器将请求传送至流服务器,并且流服务器向用户发送多媒体数据。在此而言,内容流系统可以包括单独的控制服务器,并且在这种情况下,控制服务器用于控制内容流系统中的相应装置之间的命令/响应。
流服务器可以从媒体存储装置和/或编码服务器接收内容。例如,在从编码服务器接收内容的情况下,可以实时地接收内容。在这种情况下,为了平稳地提供流服务,流服务器可以存储比特流达预定时间。
例如,用户装置可以包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航仪、板式PC、平板PC、超级本、可穿戴装置(例如,手表型终端(智能手表)、眼镜型终端(智能眼镜)、头戴式显示器(HMD))、数字TV、台式计算机、数字标牌等。内容流系统中的各个服务器可以作为分布式服务器操作,并且在这种情况下,由各个服务器接收到的数据可以用分布式方式进行处理。
本文所公开的权利要求可以以各种方式组合。例如,本公开的方法权利要求的技术特征可以被组合以在设备中实现或执行,并且设备权利要求的技术特征可以被组合以在方法中实现或执行。此外,方法权利要求和设备权利要求的技术特征可以被组合以在设备中实现或执行,并且方法权利要求和设备权利要求的技术特征可以被组合以在方法中实现或执行。

Claims (15)

1.一种由解码设备执行的图像解码方法,所述图像解码方法包括以下步骤:
从比特流中获得帧内预测模式信息和LFNST索引;
基于所述帧内预测模式信息来推导当前块的帧内预测模式;
当广角帧内预测被应用于所述当前块时,通过帧内预测模式重映射来推导修改的帧内预测模式;
基于所述修改的帧内预测模式来确定包括LFNST矩阵的LFNST集;
基于所述LFNST集和所述LFNST索引来选择所述LFNST矩阵中的一个;
基于所选择的LFNST矩阵来推导所述当前块的变换系数;以及
基于所述变换系数来推导所述当前块的残差样本。
2.根据权利要求1所述的图像解码方法,其中,当用于所述当前块的分割树结构是双树类型时,针对亮度块和色度块中的每一个接收所述LFNST索引。
3.根据权利要求2所述的图像解码方法,其中,当所述色度块的帧内预测模式是使用与所述亮度块的帧内预测模式相同的模式的直接模式DM时,所述广角帧内预测被应用于所述色度块。
4.根据权利要求1所述的图像解码方法,其中,所述当前块包括变换块或编码块,并且
其中,当所述当前块的高度和宽度不相同时,所述广角帧内预测被应用于所述当前块。
5.根据权利要求4所述的图像解码方法,其中,基于所述当前块的高度和宽度中的哪一个更大、所述当前块的高度与宽度的比率、以及所述帧内预测模式来推导所述修改的帧内预测模式。
6.根据权利要求5所述的图像解码方法,其中,所述帧内预测模式信息指示平面模式0、DC模式1以及定向模式2至66中的任何一个,
其中,当所述当前块的宽度大于所述当前块的高度时,所述修改的帧内预测模式被推导为在从67到80的范围内,并且
其中,当所述当前块的高度大于所述当前块的宽度时,所述修改的帧内预测模式被推导为在从-1到-14的范围内。
7.根据权利要求6所述的图像解码方法,其中,根据应用于所述当前块的所述帧内预测模式来确定四个LFNST集中的任何一个,并且
其中,在所述修改的帧内预测模式在从67到80的范围内的情况下的LFNST集与在所述修改的帧内预测模式在从-1到-14的范围内的情况下的LFNST集相同。
8.根据权利要求6所述的图像解码方法,其中,所述LFNST索引指示是否应用LFNST以及所述LFNST集中包括的所述LFNST矩阵中的任何一个。
9.一种由图像编码设备执行的图像编码方法,所述图像编码方法包括以下步骤:
推导当前块的帧内预测模式;
基于广角帧内预测是否应用于所述当前块,通过帧内预测模式重映射来推导修改的帧内预测模式;
基于所述修改的帧内预测模式来推导预测样本;
基于所述预测样本来推导所述当前块的残差样本;
基于所述修改的帧内预测模式来确定包括LFNST矩阵的LFNST集;
基于所述残差样本、所述LFNST集和所述LFNST矩阵来推导所述当前块的变换系数;以及
对包括所述帧内预测模式和指示所述LFNST矩阵的LFNST索引的图像信息进行编码。
10.根据权利要求9所述的图像编码方法,其中,当用于所述当前块的分割树结构是双树类型时,针对亮度块和色度块中的每一个接收所述LFNST索引。
11.根据权利要求10所述的图像编码方法,其中,当所述色度块的帧内预测模式是使用与所述亮度块的帧内预测模式相同的模式的直接模式DM时,所述广角帧内预测被应用于所述色度块。
12.根据权利要求9所述的图像编码方法,其中,基于所述当前块的高度和宽度中的哪一个更大、所述当前块的高度与宽度的比率、以及所述帧内预测模式来推导所述修改的帧内预测模式。
13.根据权利要求12所述的图像编码方法,其中,所述帧内预测模式信息指示平面模式0、DC模式1以及定向模式2至66中的任何一个,
其中,当所述当前块的宽度大于所述当前块的高度时,所述修改的帧内预测模式被推导为在从67到80的范围内,并且
其中,当所述当前块的高度大于所述当前块的宽度时,所述修改的帧内预测模式被推导为在从-1到-14的范围内。
14.根据权利要求13所述的图像编码方法,其中,根据应用于所述当前块的所述帧内预测模式来确定四个LFNST集中的任何一个,并且
其中,在所述修改的帧内预测模式在从67到80的范围内的情况下的LFNST集与在所述修改的帧内预测模式在从-1到-14的范围内的情况下的LFNST集相同。
15.一种计算机可读数字存储介质,所述计算机可读数字存储介质存储指示信息,所述指示信息使图像解码方法被执行,所述图像解码方法包括以下步骤:
从比特流中获得帧内预测模式信息和LFNST索引;
基于所述帧内预测模式信息来推导当前块的帧内预测模式;
当广角帧内预测被应用于所述当前块时,通过帧内预测模式重映射来推导修改的帧内预测模式;
基于所述修改的帧内预测模式来确定包括LFNST矩阵的LFNST集;
基于所述LFNST集和所述LFNST索引来选择所述LFNST矩阵中的一个;
基于所选择的LFNST矩阵来推导所述当前块的变换系数;以及
基于所述变换系数来推导所述当前块的残差样本。
CN202080039427.6A 2019-05-27 2020-05-27 基于广角帧内预测和变换的图像编码方法和装置 Pending CN113940074A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201962853155P 2019-05-27 2019-05-27
US62/853,155 2019-05-27
US201962853689P 2019-05-28 2019-05-28
US62/853,689 2019-05-28
US201962856134P 2019-06-02 2019-06-02
US62/856,134 2019-06-02
PCT/KR2020/006827 WO2020242183A1 (ko) 2019-05-27 2020-05-27 광각 인트라 예측 및 변환에 기반한 영상 코딩 방법 및 그 장치

Publications (1)

Publication Number Publication Date
CN113940074A true CN113940074A (zh) 2022-01-14

Family

ID=73554113

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080039427.6A Pending CN113940074A (zh) 2019-05-27 2020-05-27 基于广角帧内预测和变换的图像编码方法和装置

Country Status (3)

Country Link
US (2) US11641471B2 (zh)
CN (1) CN113940074A (zh)
WO (1) WO2020242183A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024017006A1 (en) * 2022-07-22 2024-01-25 Mediatek Inc. Accessing neighboring samples for cross-component non-linear model derivation

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023044617A1 (zh) * 2021-09-22 2023-03-30 深圳市大疆创新科技有限公司 编解码方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180367814A1 (en) * 2017-06-15 2018-12-20 Qualcomm Incorporated Intra filtering applied together with transform processing in video coding
US10284844B1 (en) * 2018-07-02 2019-05-07 Tencent America LLC Method and apparatus for video coding
CN112840648A (zh) * 2018-08-12 2021-05-25 Lg电子株式会社 用于处理图像信号的方法和装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10491922B2 (en) 2015-09-29 2019-11-26 Qualcomm Incorporated Non-separable secondary transform for video coding
US10708164B2 (en) 2016-05-03 2020-07-07 Qualcomm Incorporated Binarizing secondary transform index
CN114339229B (zh) * 2016-05-04 2024-04-12 夏普株式会社 用于对变换数据进行编码的系统和方法
WO2019074291A1 (ko) * 2017-10-11 2019-04-18 엘지전자 주식회사 분리 변환 기반 영상 코딩 방법 및 그 장치
US11284108B2 (en) * 2017-10-24 2022-03-22 Wilus Institute Of Standards And Technology Inc. Video signal processing method and apparatus
CA3088026C (en) * 2017-12-15 2023-10-03 Lg Electronics Inc. Image coding method on basis of transformation and device therefor
WO2019147087A1 (ko) * 2018-01-25 2019-08-01 주식회사 윌러스표준기술연구소 비디오 신호 처리 방법 및 장치
US10567752B2 (en) * 2018-07-02 2020-02-18 Tencent America LLC Method and apparatus for intra prediction for non-square blocks in video compression
US11039139B2 (en) * 2018-09-14 2021-06-15 Tencent America LLC Method and apparatus for identity transform in multiple transform selection

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180367814A1 (en) * 2017-06-15 2018-12-20 Qualcomm Incorporated Intra filtering applied together with transform processing in video coding
US10284844B1 (en) * 2018-07-02 2019-05-07 Tencent America LLC Method and apparatus for video coding
CN112840648A (zh) * 2018-08-12 2021-05-25 Lg电子株式会社 用于处理图像信号的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LIANG ZHAO: "Wide Angular Intra Prediction for Versatile Video Coding", 2019 DATA COMPRESSION CONFERENCE (DCC), 29 March 2019 (2019-03-29), pages 3 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024017006A1 (en) * 2022-07-22 2024-01-25 Mediatek Inc. Accessing neighboring samples for cross-component non-linear model derivation

Also Published As

Publication number Publication date
US20220150504A1 (en) 2022-05-12
WO2020242183A1 (ko) 2020-12-03
US11641471B2 (en) 2023-05-02
US20230199189A1 (en) 2023-06-22

Similar Documents

Publication Publication Date Title
US11700377B2 (en) Modified transform-based image coding method and device for same
US20240007642A1 (en) Image coding method based on transform, and device therefor
CN113170197A (zh) 基于二次变换的图像编码方法及其装置
CN113302942A (zh) 基于二次变换的图像编码方法及其设备
CN113273214A (zh) 基于二次变换的图像编码方法及其装置
US20220394257A1 (en) Transform-based image coding method and device therefor
US11871035B2 (en) Image coding method on basis of transform, and apparatus therefor
CN113841407A (zh) 基于帧内预测的图像编码中的变换
US20220417518A1 (en) Transform-based image coding method and device
US20230199189A1 (en) Image coding method and device on basis of wide-angle intra prediction and transform
US20230012486A1 (en) Transform-based image coding method and device therefor
CN114946189A (zh) 基于变换的图像编码方法及其装置
US20220150503A1 (en) Method and apparatus for image coding based on transform
CN114930848A (zh) 基于变换的图像编码方法及其设备
US12003773B2 (en) Transform-based video coding method, and device therefor
US11765389B2 (en) Image coding method based on transform, and device for same
CN113228685A (zh) 用于基于二次变换编码图像的方法及其装置
US11973951B2 (en) Transform-based image coding method and device therefor
US11962779B2 (en) Image coding method based on conversion, and device for same
US20230128355A1 (en) Transform-based image coding method and device therefor
US20220385943A1 (en) Transform-based image coding method and device therefor
CN114846799A (zh) 基于变换的图像编码方法及其设备
US20220312013A1 (en) Transform-based image coding method, and device therefor
US20240121394A1 (en) Transform-based image coding method and device for same
US20240064337A1 (en) Transform-based image coding method, and device therefor

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination