CN116600115A - 图像编码设备、图像解码设备及其存储介质和发送设备 - Google Patents

图像编码设备、图像解码设备及其存储介质和发送设备 Download PDF

Info

Publication number
CN116600115A
CN116600115A CN202310620110.7A CN202310620110A CN116600115A CN 116600115 A CN116600115 A CN 116600115A CN 202310620110 A CN202310620110 A CN 202310620110A CN 116600115 A CN116600115 A CN 116600115A
Authority
CN
China
Prior art keywords
lfnst
transform
block
index
mts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310620110.7A
Other languages
English (en)
Inventor
具文模
林宰显
金昇焕
M·萨勒海法尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN116600115A publication Critical patent/CN116600115A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

本申请涉及图像编码设备、图像解码设备及其存储介质和发送设备。根据本文档的图像解码方法包括:用于解析在残差编码级别接收的残差信息并且根据预定扫描顺序布置当前块的变换系数的残差编码步骤;用于通过将LFNST或MTS中的至少一个应用于变换系数来推导残差样本的步骤;以及用于基于残差样本生成重构图片的步骤,其中,基于指示LFNST核的LFNST索引执行LFNST,基于指示MTS核的MTS索引执行MTS,LFNST索引和MTS索引是在编码单元级别被发信号通知的,并且MTS索引是在LFNST索引被发信号通知之后立即被发信号通知的。

Description

图像编码设备、图像解码设备及其存储介质和发送设备
本申请是原案申请号为202080079999.7的发明专利申请(国际申请号:PCT/KR2020/013459,申请日:2020年10月5日,发明名称:基于变换的图像编码方法及其设备)的分案申请。
技术领域
本公开涉及一种图像编码技术,并且更具体地,涉及图像编码系统中的用于基于变换对图像进行编码的方法和设备。
背景技术
如今,在各个领域中对诸如4K、8K或更高的超高清(UHD)图像/视频这样的高分辨率和高质量图像/视频的需求已经不断增长。随着图像/视频数据变成更高分辨率和更高质量,与传统图像数据相比,所发送的信息量或比特量增加。因此,当使用诸如传统有线/无线宽带线这样的介质来发送图像数据或者使用现有存储介质来存储图像/视频数据时,其传输成本和存储成本增加。
另外,如今,对于诸如虚拟现实(VR)和人工现实(AR)内容或全息图等这样的沉浸式媒体的兴趣和需求正在增加,并且对具有与诸如游戏图像这样的真实图像不同的图像特征的图像/视频的广播正在增加。
因此,需要有效地压缩并发送或存储以及再现具有如上所述的各种特征的高分辨率和高质量图像/视频的信息的高效图像/视频压缩技术。
发明内容
技术目的
本公开的一技术方面在于提供用于增加图像编码效率的方法和设备。
本公开的另一技术方面在于提供用于增加变换索引编码的效率的方法和设备。
本公开的又一技术方面在于提供使用LFNST和MTS的图像编码方法和设备。
本公开的又一技术方面在于提供用于LFNST索引和MTS索引信令的图像编码方法和设备。
技术方案
根据本公开的实施方式,提供了一种由解码设备执行的图像解码方法。该方法可以包括:执行通过解析在残差编码级别接收到的残差信息来根据预定扫描顺序布置当前块的变换系数的残差编码;通过将LFNST或MTS中的至少一个应用于变换系数来推导残差样本;以及基于残差样本生成重构图片,其中可以基于指示LFNST核的LFNST索引执行LFNST,可以基于指示MTS核的MTS索引执行MTS,LFNST索引和MTS索引可以是在编码单元级别被发信号通知的,并且MTS索引可以是在LFNST索引被发信号通知之后立即被发信号通知的。
在当前块的树类型为单树类型时,可以在执行针对当前块的亮度块和色度块的残差编码之后解析LFNST索引。
在当前块的树类型为双树类型并且对色度分量进行编码时,可以在执行针对色度块的Cb分量和Cr分量的残差编码之后解析LFNST索引。
在当前块被分区为多个子分区块时,可以在执行针对多个子分区块的残差编码之后解析LFNST索引。
在当前块被分区成多个子分区块时,可以与在多个子分区块中的每一个的除了DC位置之外的区域中是否存在变换系数无关地解析LFNST索引。
执行残差编码可以包括:推导指示在当前块的除了DC位置之外的区域中是否存在变换系数的第一变量;以及推导指示在当前块或由当前块分区成的子分区块的除了左上的第一区域之外的第二区域中是否存在变换系数的第二变量,并且当在除了DC位置之外的区域中存在变换系数并且在第二区域中不存在变换系数时,LFNST索引可以被解析。
执行残差编码可以包括:推导指示在当前块的除了左上16×16区域之外的区域中是否存在变换系数的第三变量,并且当在除了16×16区域之外的区域中不存在变换系数时,可以解析MTS索引。
根据本公开的另一实施方式,提供了一种由编码设备执行的图像编码方法。该方法可以包括:执行通过将LFNST或MTS中的至少一个应用于残差样本推导当前块的变换系数并根据预定扫描顺序布置变换系数的变换系数推导操作;对指示LFNST核的LFNST索引或指示MTS核的MTS索引中的至少一者进行编码;以及构造并输出图像信息,使得在编码单元级别发信号通知LFNST索引和MTS索引,并且在发信号通知LFNST索引之后立即发信号通知MTS索引。
根据本公开的又一实施方式,可以提供一种数字存储介质,该数字存储介质存储包括根据由编码设备执行的图像编码方法生成的比特流和编码的图像信息的图像数据。
根据本公开的又一实施方式,可以提供一种数字存储介质,该数字存储介质存储包括编码的图像信息和比特流的图像数据以使解码设备执行图像解码方法。
技术效果
根据本公开,可以增加整体图像/视频压缩效率。
根据本公开,可以增加变换索引编码的效率。
本公开的又一技术方面提供了使用LFNST和MTS的图像编码方法和设备。
本公开的再一技术方面可以提供用于LFNST索引和MTS索引信令的图像编码方法及设备。
可以通过本公开的具体示例获得的效果不限于上面列出的效果。例如,可以存在相关领域的普通技术人员可以理解或从本公开推导出的各种技术效果。因此,本公开的特定效果不限于本公开中明确描述的那些,并且可以包括可以根据本公开的技术特征理解或推导出的各种效果。
附图说明
图1是示意性地说明可应用本公开的实施方式的视频/图像编码设备的配置的图。
图2是示意性地说明可应用本公开的实施方式的视频/图像解码设备的配置的图。
图3示意性地例示了根据本公开的实施方式的多变换技术。
图4示意性地示出了65个预测方向的帧内定向模式。
图5是例示根据本公开的实施方式的RST的图。
图6是例示根据示例的将正向一次变换的输出数据布置成一维向量的顺序的图。
图7是例示根据示例的将正向二次变换的输出数据布置成二维块的顺序的图。
图8是例示LFNST被应用于的块形状的图。
图9是例示根据示例的正向LFNST的输出数据的布置的图并且四处了根据示例的其中布置有正向LFNST的输出数据的块。
图10示出了根据示例的正向LFNST的输出数据的数量被限制为最大值16的图。
图11是例示根据示例的应用4×4LFNST的块中的清零的图。
图12是例示根据示例的应用8×8LFNST的块中的清零的图。
图13是例示根据另一示例的应用8×8LFNST的块中的清零的图。
图14是例示从一个编码块分割的子块的示例的图。
图15是例示从一个编码块分割的子块的另一示例的图。
图16是例示根据示例的M×2(M×1)块和2×M(1×M)块之间的对称性的图。
图17是例示根据示例转置的2×M块的图。
图18例示了根据示例的8×2或2×8区域的扫描顺序。
图19是用于说明根据示例的解码图像的方法的图。
图20是用于说明根据示例的编码图像的方法的图。
图21示意性地例示了可应用本公开的视频/图像编码系统的示例。
图22例示了应用本公开的内容流系统的结构。
具体实施方式
尽管本公开可能易于进行各种修改并且包括各种实施方式,但是其具体实施方式已在附图中通过示例的方式示出,并且现在将对其进行详细描述。然而,这并不旨在将本公开限制于本文公开的具体实施方式。本文中使用的术语只是出于描述特定实施方式的目的,并不旨在限制本公开的技术思路。除非上下文另外清楚指示,否则单数形式可以包括复数形式。诸如“包括”和“具有”之类的术语旨在指示存在以下描述中使用的特征、数字、步骤、操作、元件、组件或其组合,因此不应被理解为预先排除了存在或添加一个或更多个不同特征、数字、步骤、操作、元件、组件或其组合的可能性。
此外,为了方便描述彼此不同的特性功能,独立地例示了本文中描述的附图上的各组件,然而,并不意指各组件由单独的硬件或软件来实现。例如,可以组合这些组件中的任何两个或更多个以形成单个组件,并且任何单个组件可以被划分成多个组件。其中组件被组合和/或划分的实施方式将属于本公开的专利权的范围,只要它们不脱离本公开的实质即可。
在下文中,将参照附图更详细地说明本公开的优选实施方式。另外,在附图中,相同的附图标号用于相同的组件,并且将省略对相同组件的重复描述。
本文档涉及视频/图像编码。例如,本文档中公开的方法/示例可以涉及VVC(通用视频编码)标准(ITU-T Rec.H.266)、VVC之后的下一代视频/图像编码标准、或其它视频编码相关标准(例如,HEVC(高效视频编码)标准(ITU-T Rec.H.265)、EVC(基本视频编码)标准、AVS2标准等)。
在本文档中,可以提供与视频/图像编码相关的各种实施方式,并且除非相反地指定,否则这些实施方式可以彼此组合并执行。
在本文档中,视频可以是指一段时间内一系列图像的集合。通常,图片是指表示特定时间区域的图像的单元,而条带/贴片是构成图片的一部分的单元。条带/贴片可以包括一个或更多个编码树单元(CTU)。一幅图片可以由一个或更多个条带/贴片组成。一幅图片可以由一个或多个贴片组组成。一个贴片组可以包括一个或更多个贴片。
像素或图元(pel)可以是指构成一幅图片(或图像)的最小单元。另外,“样本”可用作与像素相对应的术语。样本通常可以表示像素或像素值,并且可以仅表示亮度分量的像素/像素值或仅表示色度分量的像素/像素值。另选地,样本可以意指空间域中的像素值,或者当该像素值被变换为频域时,其可以意指频域中的变换系数。
单元可以表示图像处理的基本单位。单元可以包括特定区域和与该区域相关的信息中的至少一个。一个单元可以包括一个亮度块和两个色度(例如,cb、cr)块。根据情况,可以将单元和诸如块、区域等这样的术语互换地使用。在通常情况下,M×N块可以包括由M列和N行组成的样本(或样本阵列)或变换系数的集(或阵列)。
在本文档中,术语“/”和“,”应该被解释为指示“和/或”。例如,表述“A/B”可以意指“A和/或B”。另外,“A、B”可以意指“A和/或B”。另外,“A/B/C”可以意指“A、B和/或C中的至少一个”。另外,“A/B/C”可以意指“A、B和/或C中的至少一个”。
另外,在该文档中,术语“或”应该被解释为指示“和/或”。例如,表述“A或B”可以包括1)仅A、2)仅B和/或3)A和B二者。换句话说,本文档中的术语“或”应该被解释为指示“附加地或另选地”。
在本公开中,“A和B中的至少一个”可以意指“仅A”、“仅B”或“A和B两者”。此外,在本公开中,表述“A或B中的至少一个”或者“A和/或B中的至少一个”可以被解释为“A和B中的至少一个”。
此外,在本公开中,“A、B和C中的至少一个”可以意指“仅A”、“仅B”、“仅C”或“A、B和C的任何组合”。此外,“A、B或C中的至少一个”或“A、B和/或C中的至少一个”可以意指“A、B和C中的至少一个”。
另外,本公开中使用的括号可以表示“例如”。具体地,当指示为“预测(帧内预测)”时,可以意指“帧内预测”被提出为“预测”的示例。换句话说,本公开的“预测”不限于“帧内预测”,并且“帧内预测”是作为“预测”的示例而提出的。另外,当指示为“预测(即,帧内预测)”时,这也可以意指“帧内预测”被提出为“预测”的示例。
在本公开中的一个附图中单独描述的技术特征可以单独地实现或可以同时实现。
图1是示意性地说明可应用本公开的实施方式的视频/图像编码设备的配置的图。在下文中,所谓的视频编码设备可以包括图像编码设备。
参照图1,编码设备100可以包括并且配置有图像划分器110、预测器120、残差处理器130、熵编码器140、加法器150、滤波器160和存储器170。预测器120可以包括帧间预测器121和帧内预测器122。残差处理器130可以包括变换器132、量化器133、解量化器134、逆变换器135。残差处理器130可以进一步包括减法器131。加法器150可以称为重构器或重构块生成器。根据实施方式,以上描述的图像划分器110、预测器120、残差处理器130、熵编码器140、加法器150和滤波器160可以由一个或更多个硬件组件(例如,编码器芯片组或处理器)构成。此外,存储器170可以包括解码图片缓冲器(DPB),并且也可以由数字存储介质构成。硬件组件可以进一步包括作为内部/外部组件的存储器170。
图像划分器110可以将输入到编码设备100的输入图像(或图片、帧)分割成一个或更多个处理单元。作为示例,处理单元可以被称为编码单元(CU)。在此情况下,可以从编码树单元(CTU)或最大编码单元(LCU)根据四叉树二叉树三叉树(QTBTTT)结构递归地分割编码单元。例如,可以基于四叉树结构、二叉树结构和/或三叉树结构将一个编码单元分割成更深深度的多个编码单元。在此情况下,例如,可首先应用四叉树结构,并且稍后可应用二叉树结构和/或三叉树结构。另选地,也可首先应用二叉树结构。根据本文档的编码过程可以基于不再被分割的最终编码单元来执行。在此情况下,基于根据图像特性等的编码效率,LCU可直接用作最终编码单元,或者可选地,编码单元可递归地分割成更深深度的编码单元,使得具有最佳大小的编码单元可用作最终编码单元。这里,编码过程可以包括稍后描述的诸如预测、变换和重构之类的过程。作为另一示例,处理单元还可以包括预测单元(PU)或变换单元(TU)。在此情况下,PU和TU中的每一者可以从前述最终编码单元分割或划分。PU可以是用于样本预测的单元,并且TU可以是用于诱导变换系数的单元和/或用于从变换系数诱导残差信号的单元。
在一些情况下,单元可以与诸如块或区域之类的术语互换地使用。通常,M×N块可以表示由M列和N行组成的样本或者一组变换系数。样本一般可以表示像素或像素的值,并且还可以仅表示亮度分量的像素/像素值,并且也可以仅表示色度分量的像素/像素值。样本可以用作对应于配置一个图片(或图像)的像素或图元的项。
编码设备100可以通过从输入图像信号(原始块、原始样本阵列)中减去从帧间预测器121或帧内预测器122输出的预测信号(预测块、预测样本阵列)来生成残差信号(残差块、残差样本阵列),并且将所生成的残差信号发送到变换器132。在此情况下,如所说明,编码器100内的用于从输入图像信号(原始块、原始样本阵列)减去预测信号(预测块、预测样本阵列)的单元可以被称为减法器131。预测器可对要处理的块(下文称为当前块)执行预测,并且生成包括当前块的预测样本的预测块。预测器可以确定是以当前块或CU为基础应用帧内预测还是应用帧间预测。预测器可以生成关于预测的各种信息,诸如预测模式信息,以将所生成的信息传送到熵编码器140,如稍后在对每个预测模式的描述中所描述的。关于预测的信息可由熵编码器140编码,并且可以比特流的形式输出。
帧内预测器122可以参考当前图片内的样本来预测当前块。根据预测模式,所参考的样本可位于与当前块相邻,或也可以位于远离当前块。帧内预测中的预测模式可以包括多个非定向模式和多个定向模式。非定向模式可以包括例如DC模式或平面模式。根据预测方向的精细度,定向模式可以包括(例如)33个定向预测模式或65个定向预测模式。然而,这是例示性的,并且可以根据设置使用比上述数量更多或更少的定向预测模式。帧内预测器122还可以使用应用于相邻块的预测模式来确定应用于当前块的预测模式。
帧间预测器121可以基于由参考图片上的运动向量指定的参考块(参考样本阵列)来诱导当前块的预测块。此时,为了减少在帧间预测模式中发送的运动信息的量,可以基于相邻块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可以包括运动向量和参考图片索引。运动信息还可以包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,相邻块可以包括存在于当前图片内的空间相邻块及存在于参考图片中的时间相邻块。包括参考块的参考图片和包括时间相邻块的参考图片也可彼此相同,并且也可彼此不同。时间相邻块可称为名称,例如并置参考块、并置CU(col CU)或其类似者,并且包括时间相邻块的参考图片也可称为诸如并置参考块、并置CU(colCU)等的名称,并且包括时间邻近块的参照图片可以被称为并置图片(colPic)。例如,帧间预测器121可以基于相邻块配置运动信息候选列表,并且生成指示什么候选用于推导当前块的运动向量和/或参考图片索引的信息。帧间预测可以基于各种预测模式来执行,并且例如,在跳过模式和合并模式的情况下,帧间预测器121可以使用相邻块的运动信息作为当前块的运动信息。在跳过模式的情况下,与合并模式不同,可以不发送残差信号。运动向量预测(MVP)模式可以通过使用相邻块的运动向量作为运动向量预测并且通过发信号通知运动向量差来指示当前块的运动向量。
预测器120可以基于稍后将描述的各种预测方法来生成预测信号。例如,预测器可不仅应用帧内预测或帧间预测来预测一个块,而且同时应用帧内预测和帧间预测。这可以被称为组合帧间和帧内预测(CIIP)。此外,预测器可以基于帧内块复制(IBC)预测模式或调色板模式以便对块执行预测。IBC预测模式或调色板模式可用于游戏等的内容图像/视频编码,例如画面内容编码(SCC)。IBC基本上在当前图片中执行预测,但其可类似地对帧间预测执行,因为其推导当前图片中的参考块。也就是说,IBC可以使用本文档中所描述的帧间预测技术中的至少一个。调色板模式可以被视为帧内编码或帧内预测的示例。当应用调色板模式时,可以基于关于调色板索引和调色板表的信息发信号通知图片中的样本值。
通过预测器(包括帧间预测器121和/或帧内预测器122)生成的预测信号可以用于生成重构信号或用于生成残差信号。变换器132可以通过将变换技术应用于残差信号来生成变换系数。例如,变换技术可以包括离散余弦变换(DCT)、离散正弦变换(DST)、Karhunen–Loève变换(KLT)、基于图形的变换(GBT)或有条件非线性变换(CNT)中的至少一者。这里,当像素之间的关系信息被例示为曲线图时,GBT表示从曲线图获得的变换。CNT表示基于通过使用所有先前重构的像素生成的预测信号而获取的变换。另外,变换过程还可应用于具有相同大小的正方形的像素块,并且还可应用于具有可变大小而非正方形的块。
量化器133可以量化变换系数以将量化变换系数发送到熵编码器140,并且熵编码器140可以编码量化信号(关于量化变换系数的信息)以输出比特流形式的编码的量化信号。关于量化变换系数的信息可以被称作残差信息。量化器133可以基于系数扫描顺序以一维向量的形式重新布置具有块形式的量化变换系数,并且还可以基于一维向量形式的量化变换系数而生成关于量化变换系数的信息。熵编码器140可执行各种编码方法,例如,诸如指数哥伦布编码、上下文自适应可变长度编码(CAVLC)和上下文自适应二进制算术编码(CABAC)。熵编码器140还可以将视频/图像重构所需的信息(例如,语法元素的值等)与量化变换系数编码在一起或与量化变换系数分离地编码。编码的信息(例如,编码的视频/图像信息)可以以比特流的形式以网络抽象层(NAL)为单位进行发送或存储。视频/图像信息还可以包括关于诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)之类的各种参数集的信息。此外,视频/图像信息还可以包括一般约束信息。在此文档中,从编码设备传输/发信号通知到解码设备的语法元素和/或信息可以包括于视频/图像信息中。视频/图像信息可以通过上述编码过程被编码而被包括在比特流中。比特流可以通过网络发送,或可以存储于数字存储介质中。在本文中,网络可以包括广播网络和/或通信网络等,并且数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD和SSD之类的各种存储介质。用于发送从熵编码器140输出的信号的发送器(未示出)和/或用于存储信号的存储装置(未示出)可以被配置为编码设备100的内部/外部元件,或者发送器也可以被包括在熵编码器140中。
从量化器133输出的量化变换系数可以用于生成预测信号。例如,解量化器134和逆变换器135可以对量化变换系数应用解量化和逆变换,以便恢复残差信号(残差块或残差样本)。加法器150可以将重构的残差信号与从帧间预测器121或帧内预测器122输出的预测信号相加,以便生成重构信号(重构图片、重构块、重构样本阵列)。如在应用跳过模式的情况下,如果要处理的块不存在残差,则可以使用预测块作为重构块。加法器150可以称为重构器或重构块生成器。所生成的重构信号可以用于要在当前图片内处理的下一个块的帧内预测,并且如下所述,还可以通过滤波用于下一个图片的帧间预测。
此外,也可以在图片编码和/或重构过程中应用亮度映射与色度缩放(LMCS)。
滤波器160可以对重构信号应用滤波,由此提高主观/客观的图像质量。例如,滤波器160可以将各种滤波方法应用于重构图片以生成修改的重构图片,并且将修改的重构图片存储在存储器170中,具体地,存储在存储器170的DPB中。各种滤波方法可以包括(例如)解块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。滤波器160可生成各种滤波相关信息以将所生成的信息传送到熵编码器140,如稍后在对每个滤波方法的描述中所描述的那样。滤波相关信息可由熵编码器140编码且可以以比特流的形式输出。
发送到存储器170的修改的重构图片可以用作帧间预测器121中的参考图片。如果由帧间预测器应用帧间预测,则编码设备可以避免编码设备100与解码设备之间的预测失配,并且还可改进编码效率。
存储器170的DPB可以存储要用作帧间预测器121中的参考图片的修改的重构图片。存储器170可以存储其中推导(或编码)当前图片内的运动信息的块的运动信息和/或先前重构的图片内的块的运动信息。所存储的运动信息可以被传送到帧间预测器121以用作空间相邻块的运动信息或时间相邻块的运动信息。存储器170可以存储当前图片内的重构块的重构样本,并且将重构样本传送到帧内预测器122。
图2是示意性地说明可应用本公开的实施方式的视频/图像解码设备的配置的图。
参照图2,解码设备200可以包括并配置有熵解码器210、残差处理器220、预测器230、加法器240、滤波器250和存储器260。预测器230可以包括帧间预测器232和帧内预测器231。残差处理器220可以包括解量化器221和逆变换器222。根据实施方式,以上已经描述的熵解码器210、残差处理器220、预测器230、加法器240和滤波器250可以由一个或更多个硬件组件(例如,解码器芯片组或处理器)来配置。此外,存储器260可以包括解码图片缓冲器(DPB),并且可以由数字存储介质配置。硬件组件还可以包括作为内部/外部组件的存储器260。
当输入包括视频/图像信息的比特流时,解码设备200可以响应于其中在图1所示的编码设备中处理视频/图像信息的过程而重构图像。例如,解码设备200可以基于从比特流获得的块分割相关信息推导单元/块。解码设备200可以使用应用于编码设备的处理单元来执行解码。因此,用于解码的处理单元可以是(例如)编码单元,并且编码单元可以从CTU或LCU根据四叉树结构、二叉树结构和/或的三叉树结构进行分割。可从编码单元推导一个或更多个变换单元。另外,通过解码设备200解码和输出的重构图像信号可以通过再现设备再现。
解码设备200可以接收以比特流的形式从图1所示的编码设备输出的信号,并且所接收的信号可以通过熵解码器210进行解码。例如,熵解码器210可以通过解析比特流来推导图像重构(或图片重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可以包括关于诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)之类的各种参数集的信息。此外,视频/图像信息还可以包括一般约束信息。解码设备还可以基于关于参数集的信息和/或一般约束信息来解码图片。要发信令通知/接收的信息和/或语法元素(其将在本文当中稍后描述)可以通过解码过程解码并且从比特流获得。例如,熵解码器210可以基于诸如指数哥伦布编码、CAVLC或CABAC之类的编码方法解码比特流内的信息,并且输出图像重构所需的语法元素的值,以及残差相关变换系数的量化值。更具体来说,CABAC熵解码方法可以接收与比特流中的各语法元素对应的bin,使用要解码的语法元素信息以及相邻块和要解码的块的解码信息或者在先前步骤中解码的符号/bin的信息来确定上下文模型,并且通过根据所确定的上下文模型预测bin生成概率以对bin执行算术解码来生成与每个语法元素的值对应的符号。此时,CABAC熵解码方法可以确定上下文模型并且然后使用用于下一符号/bin的上下文模型的解码的符号/bin的信息来更新上下文模型。可以将由熵解码器210解码的信息当中的关于预测的信息提供给预测器(帧间预测器232和帧内预测器231),并且由熵解码器210执行熵解码的残差值,即,量化变换系数和相关参数信息,可以被输入到残差处理器220。残差处理器220可推导残差信号(残差块、残差样本、残差样本阵列)。另外,可以将由熵解码器210解码的信息当中的关于滤波的信息提供给滤波器250。此外,用于接收从编码设备输出的信号的接收器(未示出)还可以被配置为解码设备200的内部/外部元件,或者接收器也可以是熵解码器210的组件。此外,根据本公开的解码设备可以被称为视频/图像/图片解码设备,并且解码设备还可以被分类为信息解码器(视频/图像/图片信息解码器)和样本解码器(视频/图像/图片样本解码器)。信息解码器可以包括熵解码器210,并且样本解码器可以包括解量化器221、逆变换器222、加法器240、滤波器250、存储器260、帧间预测器232和帧内预测器231中的至少一个。
解量化器221可以对量化变换系数进行解量化以输出变换系数。解量化器221可以以二维块形式重新布置量化变换系数。在此情况下,可以基于由编码设备执行的系数扫描顺序来执行重新布置。解量化器221可以使用量化参数(例如,量化步长信息)对量化变换系数执行解量化,并且获取变换系数。
逆变换器222对变换系数进行逆变换以获取残差信号(残差块、残差样本阵列)。
预测器230可对当前块执行预测,并且生成包括当前块的预测样本的预测块。预测器可以基于从熵解码器210输出的关于预测的信息来确定是对当前块应用帧内预测还是帧间预测,并且确定特定帧内/帧间预测模式。
预测器可以基于稍后将描述的各种预测方法来生成预测信号。例如,预测器可以不仅将帧内预测或帧间预测应用于一个块的预测,而且可以同时应用帧内预测和帧间预测。这可以被称为组合帧间和帧内预测(CIIP)。此外,预测器可以基于帧内块复制(IBC)预测模式或调色板模式以便对块执行预测。IBC预测模式或调色板模式可用于游戏等的内容图像/视频编码,例如画面内容编码(SCC)。IBC基本上在当前图片中执行预测,但其可类似地对帧间预测执行,因为其推导当前图片中的参考块。也就是说,IBC可以使用本文档中所描述的帧间预测技术中的至少一个。调色板模式可以被视为帧内编码或帧内预测的示例。当应用调色板模式时,可以通过包括于视频/图像信息中来发信号通知关于调色板表和调色板索引的信息。
帧内预测器231可参考当前图片内的样本来预测当前块。根据预测模式,所参考的样本可位于与当前块相邻,或也可以位于远离当前块。帧内预测中的预测模式可以包括多个非定向模式和多个定向模式。帧内预测器231还可以使用应用于相邻块的预测模式来确定应用于当前块的预测模式。
帧间预测器232可以基于由参考图片上的运动向量指定的参考块(参考样本阵列)来诱导当前块的预测块。此时,为了减少在帧间预测模式中发送的运动信息的量,可以基于相邻块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可以包括运动向量和参考图片索引。运动信息还可以包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,相邻块可以包括存在于当前图片内的空间相邻块以及存在于参考图片中的时间相邻块。例如,帧间预测器232可以基于相邻块配置运动信息候选列表,并且基于所接收的候选选择信息推导当前块的运动向量和/或参考图片索引。可以基于各种预测模式执行帧间预测,并且关于预测的信息可以包括指示当前块的帧间预测的模式的信息。
加法器240可以将所获取的残差信号与从预测器(包括帧间预测器232和/或帧内预测器231)输出的预测信号(预测块、预测样本阵列)相加,以生成重构信号(重构图片、重构块、重构样本阵列)。如在应用跳过模式的情况下,如果要处理的块不存在残差,则可以使用预测块作为重构块。
加法器240可以称为重构器或重构块生成器。所生成的重构信号可以用于要在当前图片内处理的下一个块的帧内预测,并且如下所述,还可以通过滤波来输出或者还可以用于下一个图片的帧间预测。
此外,也可以在图片解码过程中应用亮度映射与色度缩放(LMCS)。
滤波器250可以对重构信号应用滤波,从而提高主观/客观图像质量。例如,滤波器250可以将各种滤波方法应用于重构图片以生成修改的重构图片,并且将修改的重构图片发送到存储器260,具体地,存储器260的DPB。各种滤波方法可以包括(例如)解块滤波、样本自适应偏移、自适应环路滤波器、双向滤波器等。
存储在存储器260的DPB中的(修改的)重构图片可用作帧间预测器232中的参考图片。存储器260可存储其中推导(解码)当前图片内的运动信息的块的运动信息和/或先前重构图片内的块的运动信息。所存储的运动信息可以被传送到帧间预测器260,以便被用作空间相邻块的运动信息或时间相邻块的运动信息。存储器260可以将重构块的重构样本存储在当前图片内,并将存储的重构样本传送到帧内预测器231。
在本文档中,编码设备100的滤波器160、帧间预测器121和帧内预测器122中描述的示例性实施方式可以分别同等地应用于解码设备200的滤波器250、帧间预测器232和帧内预测器231。
如上所述,执行预测,以便提高执行视频编码时的压缩效率。据此,可以生成包括针对作为编码目标块的当前块的预测样本的预测块。这里,预测块包括空间域(或像素域)中的预测样本。可以在编码设备和解码设备中相同地推导预测块,并且编码设备可以通过向解码设备发信号通知并非原始块本身的原始样本值而是关于原始块与预测块之间的残差的信息(残差信息)来提高图像编码效率。解码设备可以基于残差信息来推导包括残差样本的残差块,通过将残差块与预测块相加来生成包括重构样本的重构块,并且生成包括重构块的重构图片。
可以通过变换过程和量化过程来生成残差信息。例如,编码设备可以推导原始块与预测块之间的残差块,通过对残差块中所包括的残差样本(残差样本阵列)执行变换过程来推导变换系数,并且通过对变换系数执行量化过程来推导量化变换系数,使得它可以(通过比特流)向解码设备发信号通知关联的残差信息。这里,残差信息可以包括量化变换系数的值信息、位置信息、变换技术、变换核、量化参数等。解码设备可以基于残差信息来执行量化/解量化过程并且推导残差样本(或残差样本块)。解码设备可以基于预测块和残差块来生成重构块。编码设备可以通过对量化变换系数进行解量化/逆变换来推导残差块以便作为下一个图片的帧间预测的参考,并且可以基于此来生成重构图片。
图3示意性地例示了根据本公开的实施方式的多变换技术。
参照图3,变换器可以对应于前述图1的编码设备中的变换器,并且逆变换器可以对应于前述图1的编码设备中的逆变换器、或者图2的解码设备中的逆变换器。
变换器可以通过基于残差块中的残差样本(残差样本阵列)执行一次变换来推导(一次)变换系数(S310)。该一次变换可以被称为核心变换。在本文中,一次变换可以基于多变换选择(MTS),并且当将多变换用作一次变换时,可以将其称为多核心变换。
多核心变换可以表示附加地使用离散余弦变换(DCT)类型2和离散正弦变换(DST)类型7、DCT类型8和/或DST类型1进行变换的方法。也就是说,多核心变换可以表示基于从DCT类型2、DST类型7、DCT类型8和DST类型1当中选择的多个变换核将空间域的残差信号(或残差块)变换为频域的变换系数(或一次变换系数)的变换方法。在本文中,从变换器的视角来看一次变换系数可以称为临时变换系数。
换句话说,当应用常规变换方法时,可以通过基于DCT类型2对残差信号(或残差块)应用从空间域到频率域的变换来生成变换系数。与此不同,当应用多核心变换时,可以通过基于DCT类型2、DST类型7、DCT类型8和/或DST类型1对残差信号(或残差块)应用从空间域到频率域的变换来生成变换系数(或一次变换系数)。在本文中,DCT类型2、DST类型7、DCT类型8和DST类型1可以被称为变换类型、变换核或变换核心。可以基于基函数来定义这些DCT/DST变换类型。
当执行多核心变换时,可以从变换核当中选择用于目标块的垂直变换核和水平变换核,可以基于垂直变换核对目标块执行垂直变换,并且可以基于水平变换核对目标块执行水平变换。这里,水平变换可以指示对目标块的水平分量的变换,并且垂直变换可以指示对目标块的垂直分量的变换。可以基于包括残差块的目标(CU或子块)的预测模式和/或变换索引来适应性地确定垂直变换核/水平变换核。
此外,根据示例,如果通过应用MTS来执行一次变换,则可以通过将特定基函数设置为预定值并组合要在垂直变换或水平变换中应用的基函数来设置变换核的映射关系。例如,当水平变换核表示为trTypeHor,并且垂直方向变换核表示为trTypeVer时,可以将值为0的trTypeHor或trTypeVer设置给DCT2,将值为1的trTypeHor或trTypeVer设置给DST7,并且将值为2的trTypeHor或trTypeVer可以设置给DCT8。
在这种情况下,MTS索引信息可以被编码并且发信号通知到解码设备以指示多个变换核集中的任何一个。例如,MTS索引0可以指示trTypeHor和trTypeVer值均为0,MTS索引1可以指示trTypeHor和trTypeVer值均为1,MTS索引2可以指示trTypeHor值为2并且trTypeVer值为1,MTS索引为3可以指示trTypeHor值为1并且trTypeVer值为2,而MTS索引4可以指示trTypeHor和trTypeVer值均为2。
在一个示例中,根据MTS索引信息的变换核集在下表中示出。
[表1]
tu_mts_idx[x0][y0] 0 1 2 3 4
trTypeHor 0 1 2 1 2
trTypeVer 0 1 1 2 2
变换器可以基于(一次)变换系数执行二次变换以推导修改的(二次)变换系数(S320)。一次变换是从空间域到频域的变换,而二次变换是指使用(一次)变换系数之间存在的相关性,变换为更紧凑的表示。二次变换可以包括不可分离的变换。在这种情况下,二次变换可以称为不可分离的二次变换(NSST)或模式相关的不可分离的二次变换(MDNSST)。NSST可以表示基于不可分离的变换矩阵对通过一次变换推导出的(一次)变换系数进行二次变换以生成针对残差信号的修改的变换系数(或二次变换系数)的变换。这里,基于不可分离的变换矩阵,可以将变换一次应用于(一次)变换系数而无需将垂直变换和水平变换分离(或独立地应用水平/垂直变换)。换句话说,NSST不单独应用于垂直方向和水平方向上的(一次)变换系数,并且可以表示例如将二维信号(变换系数)通过特定的预定方向(例如,行优先方向或列优先方向)重新布置为一维信号并然后基于不可分离的变换矩阵生成修改的变换系数(或二次变换系数)的变换方法。例如,行优先顺序是针对M×N个块以第一行、第二行、...和第N行的顺序设置成排,而列优先顺序是针对M×N个块以第一列、第二列、…和第M列的顺序设置成排。NSST可以应用于配置有(一次)变换系数的块(在下文中,称为变换系数块)的左上区域。例如,当变换系数块的宽度W和高度H二者都为8或更大时,可以将8×8NSST应用于变换系数块的左上8×8区域。此外,在变换系数块的宽度(W)和高度(H)二者都为4或更大的同时,当变换系数块的宽度(W)或高度(H)小于8时,4×4NSST可以应用于变换系数块的左上min(8,W)×min(8,H)区域。然而,实施方式不限于此,例如,即使仅满足变换系数块的宽度W或高度H为4或更大的条件,也可以将4×4NSST应用于变换系数块的左上端min(8,W)×min(8,H)区域。
具体地,例如,如果使用4×4输入块,则不可分离的二次变换可以如下执行。
4×4输入块X可以表示如下。
[式1]
如果X以向量的形式表示,则向量可以如下表示。
[式2]
在式2中,向量是通过根据行优先顺序重新布置式1的二维块X而获得的一维向量。
在这种情况下,可以如下计算不可分离的二次变换。
[式3]
在此式中,表示变换系数向量,而T表示16×16(不可分离的)变换矩阵。
通过前述式3,可以推导16×1变换系数向量并且可以通过扫描顺序(水平、垂直和对角线等)将向量重新组织为4×4块。然而,上述计算是示例,并且超立方体-吉文斯变换(HyGT)等也可以用于不可分离的二次变换的计算,以便降低不可分离的二次变换的计算复杂度。
此外,在不可分离的二次变换中,可以将变换核(或变换核心、变换类型)选择为模式相关。在这种情况下,模式可以包括帧内预测模式和/或帧间预测模式。
如上所述,可以基于以变换系数块的宽度(W)和高度(H)为基础确定的8×8变换或4×4变换来执行不可分离的二次变换。8×8变换是指当W和H二者都等于或大于8时可应用于变换系数块中包含的8×8区域的变换,并且8×8区域可以是变换系数块中的左上8×8区域。类似地,4×4变换是指当W和H二者都等于或大于4时可应用于变换系数块中包含的4×4区域的变换,并且4×4区域可以是变换系数块中的左上4×4区域。例如,8×8变换核矩阵可以是64×64/16×64矩阵,而4×4变换核矩阵可以是16×16/8×16矩阵。
这里,为了选择模式相关的变换核,可以针对8×8变换和4×4变换二者配置用于不可分离的二次变换的每个变换集二个不可分离的二次变换核,并且可以存在四个变换集。也就是说,可以针对8×8变换配置四个变换集,并且可以针对4×4变换配置四个变换集。在这种情况下,针对8×8变换的四个变换集中的每个变换集可以包括二个8×8变换核,并且针对4×4变换的四个变换集中的每个变换集可以包括二个4×4变换核。
然而,随着变换的大小(即,变换所应用于的区域的大小)可以为例如除了8×8或4×4之外的大小,集的数量可以是n,并且每个集中的变换核的数量可以是k。
变换集可以被称为NSST集或LFNST集。可以例如基于当前块(CU或子块)的帧内预测模式来选择变换集当中的特定集。低频不可分离的变换(LFNST)可以是缩减不可分离的变换的示例,其将稍后描述,并且表示用于低频分量的不可分离的变换。
作为参考,例如,帧内预测模式可以包括两个非定向(或非角度)帧内预测模式和65个定向(或角度)帧内预测模式。非定向帧内预测模式可以包括0号的平面帧内预测模式和1号的DC帧内预测模式,并且定向帧内预测模式可以包括2号至66号的65个帧内预测模式。然而,这是示例,并且即使帧内预测模式的数量不同也可以应用本文档。此外,在一些情况下,还可以使用67号帧内预测模式,并且67号帧内预测模式可以表示线性模型(LM)模式。
图4示意性地示出了65个预测方向的帧内定向模式。
参照图4,基于具有左上对角预测方向的帧内预测模式34,帧内预测模式可以划分为具有水平方向性的帧内预测模式和具有垂直方向性的帧内预测模式。在图4中,H和V分别标示水平方向性和垂直方向性,并且数字-32至32指示样本网格位置上的1/32单位的位移。这些数字可以表示对于模式索引值的偏移。帧内预测模式2至33具有水平方向性,并且帧内预测模式34至66具有垂直方向性。严格地说,帧内预测模式34可以被视为既不是水平的也不是垂直的,但在确定二次变换的变换集时可以被分类为属于水平方向性。这是因为输入数据被转置以用于基于帧内预测模式34对称的垂直定向模式,并且针对水平模式的输入数据对准方法用于帧内预测模式34。对输入数据进行转置意指将二维的M×N块数据的行和列切换成N×M数据。帧内预测模式18和帧内预测模式50可以分别表示水平帧内预测模式和垂直帧内预测模式,并且帧内预测模式2可以被称为右上对角帧内预测模式,因为帧内预测模式2具有左参考像素并且在右上方向上执行预测。类似地,帧内预测模式34可以被称为右下对角帧内预测模式,而帧内预测模式66可以被称为左下对角帧内预测模式。
根据示例,可以映射根据帧内预测模式的四个变换集,例如,如下表所示。
[表2]
lfnstPredModeIntra lfnstTrSetIdx
lfnstPredModeIntra<0 1
0<=lfnstPredModeIntra<=1 0
2<=lfnstPredModeIntra<=12 1
13<=lfnstPredModeIntra<=23 2
24<=lfnstPredModeIntra<=44 3
45<=lfnstPredModeIntra<=55 2
56<=lfnstPredModeIntra<=80 1
81<=lfnstPredModeIntra<=83 0
如表2所示,根据帧内预测模式,四个变换集中的任何一个,即,lfnstTrSetIdx,可以映射到四个索引(即,0至3)中的任何一个。
当确定特定集用于不可分离的变换时,可以通过不可分离的二次变换索引来选择特定集中的k个变换核之一。编码设备可以基于率失真(RD)校验来推导指示特定变换核的不可分离的二次变换索引,并且可以将不可分离的二次变换索引发信号通知给解码设备。解码设备可以基于不可分离的二次变换索引来选择特定集中的k个变换核中的一个。例如,lfnst索引值0可以指代第一不可分离的二次变换核,lfnst索引值1可以指代第二不可分离的二次变换核,lfnst索引值2可以指代第三不可分离的二次变换核。另选地,lfnst索引值0可以指示第一不可分离的二次变换没有被应用于目标块,并且lfnst索引值1至3可以指示三个变换核。
变换器可以基于所选择的变换核来执行不可分离的二次变换,并且可以获得修改的(二次)变换系数。如上所述,修改的变换系数可以被推导为通过量化器量化的变换系数,并且可以被编码并发信号通知给解码设备,并且被传送到编码设备中的解量化器/逆变换器。
此外,如上所述,如果省略了二次变换,则可以将作为一次(可分离的)变换的输出的(一次)变换系数推导为如上所述通过量化器量化的变换系数,并且可以被编码并发信号通知给解码设备,并传送到编码设备中的解量化器/逆变换器。
逆变换器可以与在上述变换器中已经执行的顺序相反的顺序执行一系列过程。逆变换器可以接收(解量化的)变换系数,并且通过执行二次(逆)变换来推导(一次)变换系数(S350),并且可以通过对(一次)变换系数执行一次(逆)变换来获得残差块(残差样本)(S360)。就此而言,从逆变换器的视角来看,一次变换系数可以被称为修改的变换系数。如上所述,编码设备和解码设备可以基于残差块和预测块来生成重构块,并且可以基于重构块来生成重构图片。
解码设备还可以包括二次逆变换应用确定器(或用于确定是否应用二次逆变换的元件)和二次逆变换确定器(或用于确定二次逆变换的元件)。二次逆变换应用确定器可以确定是否应用二次逆变换。例如,二次逆变换可以是NSST、RST或LFNST,并且二次逆变换应用确定器可以基于通过解析比特流而获得的二次变换标志来确定是否应用二次逆变换。在另一示例中,二次逆变换应用确定器可以基于残差块的变换系数来确定是否应用二次逆变换。
二次逆变换确定器可以确定二次逆变换。在这种情况下,二次逆变换确定器可以基于根据帧内预测模式指定的LFNST(NSST或RST)变换集来确定应用于当前块的二次逆变换。在实施方式中,可以取决于一次变换确定方法来确定二次变换确定方法。可以根据帧内预测模式来确定一次变换和二次变换的各种组合。此外,在示例中,二次逆变换确定器可以基于当前块的大小来确定应用二次逆变换的区域。
此外,如上所述,如果省略二次(逆)变换,则可以接收(解量化的)变换系数,可以执行一次(可分离的)逆变换,并且可以获得残差块(残差样本)。如上所述,编码设备和解码设备可以基于残差块和预测块来生成重构块,并且可以基于重构块来生成重构图片。
此外,在本公开中,可以在NSST的概念中应用其中减小了变换矩阵(核)的大小的缩减二次变换(RST),以便减少不可分离的二次变换所需的计算量和存储量。
此外,本公开中描述的变换核、变换矩阵以及构成变换核矩阵的系数,即,核系数或矩阵系数,可以以8比特来表示。这可以是在解码设备和编码设备中实现的条件,并且与现有的9比特或10比特相比,可以减少存储变换核所需的存储量,并且可以合理地适应性能劣化。另外,以8比特表示核矩阵可以允许使用小的乘法器,并且可以更适合于用于最佳软件实现的单指令多数据(SIMD)指令。
在本说明书中,术语“RST”可以是指基于大小根据缩减因子而减小的变换矩阵来对目标块的残差样本执行的变换。在执行缩减变换的情况下,由于变换矩阵的大小的减小,可以减少变换所需的计算量。也就是说,RST可以用于解决在大小大的块的变换或不可分离的变换时发生的计算复杂性问题。
RST可以被称为诸如缩减变换、缩减二次变换、缩小变换、简化变换和简单变换等之类的各种术语,并且RST可以被称为的名称不限于所列示例。另选地,由于RST主要在变换块中的包括非零系数的低频区域中执行,因此它可以被称为低频不可分离的变换(LFNST)。变换索引可以被称作LFNST索引。
此外,当基于RST执行二次逆变换时,编码设备100的逆变换器135和解码设备200的逆变换器222可以包括:逆缩减二次变换器,其基于变换系数的逆RST来推导修改的变换系数;以及逆一次变换器,其基于修改的变换系数的逆一次变换来推导目标块的残差样本。逆一次变换是指应用于残差的一次变换的逆变换。在本公开中,基于变换推导变换系数可以是指通过应用变换来推导变换系数。
图5是例示根据本公开的实施方式的RST的图。
在本公开中,“目标块”可以指代要编码的当前块,残差块或变换块。
在根据示例的RST中,可以将N维向量映射到位于另一个空间中的R维向量,从而可以确定缩减变换矩阵,其中R小于N。N可以是指应用了变换的块的侧边的长度的平方,或与应用了变换的块相对应的变换系数的总数,并且缩减因子可以是指R/N值。缩减因子可以被称为缩减因子、缩小因子、简化因子、简单因子或其它各种术语。此外,R可以被称为缩减系数,但是根据情况,缩减因子可以是指R。此外,根据情况,缩减因子可以是指N/R值。
在示例中,可以通过比特流来发信号通知缩减因子或缩减系数,但是示例不限于此。例如,可以在编码设备100和解码设备200中的每一个中存储针对缩减因子或缩减系数的预定值,并且在这种情况下,可以不单独发信号通知缩减因子或缩减系数。
根据示例的缩减变换矩阵的大小可以是小于N×N(常规变换矩阵的大小)的R×N,并且可以如下面的式4所限定。
[式4]
图5的(a)中所示的缩减变换块中的矩阵T可以是指式4的矩阵TR×N。如图5的(a)所示,当将缩减变换矩阵TR×N乘以目标块的残差样本时,可以推导当前块的变换系数。
在示例中,如果应用了变换的块的大小是8×8并且R=16(即,R/N=16/64=1/4),则根据图5的(a)的RST可以被表示为以下式5所示的矩阵运算。在这种情况下,存储和乘法计算可以通过缩减因子缩减至大约1/4。
在本公开中,矩阵运算可以理解为通过将列向量与设置在列向量的左侧的矩阵相乘来获得列向量的运算。
[式5]
在式6中,r1至r64可以表示目标块的残差样本,并且具体地可以是通过应用一次变换而生成的变换系数。作为式5的计算的结果,可以推导目标块的变换系数ci,并且推导ci的过程可以如式6所示。
[式6]
作为式6的计算的结果,可以推导目标块的变换系数c1至cR。也就是说,当R=16时,可以推导目标块的变换系数c1至c16。如果应用常规变换而不是RST,并将64×64(N×N)大小的变换矩阵与64×1(N×1)大小的残差样本相乘,则因为应用了RST而针对目标块仅推导16(R)个变换系数,尽管针对目标块推导了64(N)个变换系数。由于用于目标块的变换系数的总数从N缩减到R,所以编码设备100向解码设备200发送的数据量减少,因此编码设备100与解码设备200之间的传输效率可以提高。
当从变换矩阵的大小的视角考虑时,常规变换矩阵的大小为64×64(N×N),但缩减变换矩阵的大小缩减为16×64(R×N),因此与执行常规变换的情况相比,执行RST的情况下的存储使用率可以减小R/N比率。另外,当与使用常规变换矩阵的情况下的乘法计算的数量N×N相比时,使用缩减变换矩阵可以将乘法计算的数量(R×N)减小R/N比率。
在示例中,编码设备100的变换器132可以通过对目标块的残差样本执行一次变换和基于RST的二次变换来推导目标块的变换系数。这些变换系数可以被传送到解码设备200的逆变换器,并且解码设备200的逆变换器222可以基于针对变换系数的逆缩减二次变换(RST)来推导修改的变换系数,并且可以基于针对修改的变换系数的逆一次变换来推导目标块的残差样本。
根据示例的逆RST矩阵TN×R的大小为比常规逆变换矩阵N×N的大小小的N×R,并且与式4中所示的缩减变换矩阵TR×N具有转置关系。
图5的(b)所示的缩减逆变换块中的矩阵Tt可以是指逆RST矩阵TN×R T(上标T是指转置)。如图5的(b)所示,当将逆RST矩阵TN×R T乘以目标块的变换系数时,可以推导目标块的修改的变换系数或目标块的残差样本。逆RST矩阵TR×N T可以表示为(TR×N)T N×R
更具体地,当逆RST被用作二次逆变换时,当逆RST矩阵TN×R T被乘以目标块的变换系数时,可以推导目标块的修改的变换系数。此外,可以将逆RST用作逆一次变换,并且在这种情况下,当将逆RST矩阵TN×R T与目标块的变换系数相乘时,可以推导目标块的残差样本。
在示例中,如果应用逆变换的块的大小是8×8并且R=16(即,R/N=16/64=1/4),则根据图5的(b)的RST可以被表示为以下式7所示的矩阵运算。
[式7]
在式7中,c1至c16可以表示目标块的变换系数。作为式7的计算的结果,可以推导表示目标块的修改的变换系数或目标块的残差样本的rj,并且推导rj的过程可以如式8所示。
[式8]
作为式8的计算的结果,可以推导表示目标块的修改的变换系数或目标块的残差样本的r1至rN。从逆变换矩阵的大小的视角考虑,常规逆变换矩阵的大小为64×64(N×N),但逆缩减变换矩阵的大小缩减为64×16(R×N),因此与执行常规逆变换的情况相比,执行逆RST的情况下的存储使用率可以减小R/N比率。另外,当与使用常规逆变换矩阵的情况下的乘法计算的数量N×N相比时,使用逆缩减变换矩阵可以将乘法计算的数量(N×R)减少R/N比率。
表2所示的变换集配置也可以应用于8×8RST。也就是说,可以根据表2中的变换集来应用8×8RST。由于根据帧内预测模式,一个变换集包括两个或三个变换(核),因此可以将其配置为选择包括在不应用二次变换的情况下在内的至多四个变换中的一个。在不应用二次变换的变换中,可以考虑应用恒等矩阵(identity matrix)。假设分别将索引0、1、2和3分配给四个变换(例如,可以将索引0分配给应用恒等矩阵的情况,即,不应用二次变换的情况),可以针对每个变换系数块发信号通知作为语法元素的变换索引或lfnst索引,由此指定要应用的变换。也就是说,针对左上8×8块,通过变换索引,可以指定RST配置中的8×8NSST,或者当应用LFNST时可以指定8×8lfnst。8×8lfnst和8×8RST指代当要变换的目标块的W和H均等于或大于8时可应用于变换系数块中包括的8×8区域的变换,并且8×8区域可以是变换系数块中的左上8×8区域。类似地,4×4lfnst和4×4RST指代当目标块的W和H均等于或大于4时可应用于变换系数块中包括的4×4区域的变换,并且4×4区域可以是变换系数块中的左上4×4区域。
根据本公开的实施方式,对于编码过程中的变换,可以仅选择48条数据,并且可以向其应用最大16×48变换核矩阵,而不是将16×64变换核矩阵应用于形成8×8区域的64条数据。此处,“最大”意味着m在m×48变换核矩阵中具有最大值16以用于生成m个系数。也就是说,当通过将m×48变换核矩阵(m≤16)应用于8×8区域来执行RST时,输入48条数据,并且生成m个系数。当m是16时,输入48条数据并且生成16个系数。也就是说,假设48条数据形成48×1向量,16×48矩阵和48×1向量依次相乘,由此生成16×1向量。这里,形成8×8区域的48条数据可以被适当地布置,由此形成48×1向量。例如,可以基于构成8×8区域当中的除了右下4×4区域之外的区域的48条数据来构造48×1向量。这里,当通过应用最大16×48变换核矩阵来执行矩阵运算时,生成16个修改的变换系数,并且可以根据扫描顺序将16个修改的变换系数布置在左上4×4区域中,并且可以用零填充右上4×4区域和左下4×4区域。
对于解码过程中的逆变换,可以使用前述变换核矩阵的转置矩阵。也就是说,当在由解码设备执行的逆变换过程中执行逆RST或LFNST时,根据预定布置顺序在一维向量中配置应用逆RST的输入系数数据,并且可以根据预定布置顺序将通过将一维向量与在一维向量左侧的对应的逆RST矩阵相乘而获得的修改的系数向量布置到二维块中。
总之,在变换过程中,当RST或LFNST被应用于8×8区域时,在8×8区域的除了右下区域之外的左上区域、右上区域和左下区域中的48个变换系数与16×48变换核矩阵的矩阵运算。对于矩阵运算,以一维阵列输入48个变换系数。当执行矩阵运算时,推导出16个修改的变换系数,并且可以将修改的变换系数布置于8×8区域的左上区域中。
相反,在逆变换过程中,当将逆RST或LFNST应用于8×8区域时,可以根据扫描顺序以一维阵列输入8×8区域中的变换系数当中的对应于8×8区域的左上区域的16个变换系数,并且可以经历与48×16变换核矩阵的矩阵运算。也就是说,矩阵运算可以表示为(48×16矩阵)*(16×1变换系数向量)=(48×1修改的变换系数向量)。这里,n×1向量可以被解释为具有与n×1矩阵相同的含义,并且因此可以被表示为n×1列向量。此外,*表示矩阵乘法。当执行矩阵运算时,可以推导出48个修改的变换系数,并且可以将48个修改的变换系数布置在8×8区域中的除了右下区域之外的左上区域、右上区域和左下区域中。
当二次逆变换基于RST时,编码设备100的逆变换器135和解码设备200的逆变换器222可以包括用于基于对变换系数的逆RST推导修改的变换系数的逆缩减二次变换器以及用于基于对修改的变换系数的逆一级变换来推导目标块的残差样本的逆一次变换器。逆一次变换指代应用于残差的一次变换的逆变换。在本公开中,基于变换推导变换系数可以指代通过应用变换来推导变换系数。
上面描述的非分离变换(LFNST)将如下详细描述。LFNST可以包括由编码设备进行的正向变换和由解码设备进行的逆变换。
编码设备接收在应用一次(核心)变换之后推导出的结果(或结果的一部分)作为输入,并且应用正向二次变换(二次变换)。
[式9]
y=GTx
在式9中,x和y分别是二次变换的输入和输出,G是表示二次变换的矩阵,并且变换基向量由列向量组成。在逆LFNST的情况下,当变换矩阵G的维度表示为[行的数量×列的数量]时,在正向LFNST的情况下,矩阵G的转置变成GT的维度。
对于逆LFNST,矩阵G的维度是[48×16]、[48×8]、[16×16]、[16×8],并且[48×8]矩阵和[16×8]矩阵是分别从[48×16]矩阵和[16×16]矩阵的左侧采样的8个变换基向量的部分矩阵。
另一方面,对于正向LFNST,矩阵GT的维度是[16×48]、[8×48]、[16×16]、[8×16],并且[8×48]矩阵和[8×16]矩阵是通过分别从[16×48]矩阵和[16×16]矩阵的上部采样8个变换基向量而获得的部分矩阵。
因此,在正向LFNST的情况下,[48×1]向量或[16×1]向量可以作为输入x,并且[16×1]向量或[8×1]向量可以作为输出y。在视频编码和解码中,正向一次变换的输出是二维(2D)数据,因此为了构造[48×1]向量或[16×1]向量作为输入x,需要通过将作为正向变换的输出的2D数据适当地布置来构造一维向量。
图6是例示根据示例的将正向一次变换的输出数据布置成一维向量的顺序的图。图6的(a)和(b)的左图示出了用于构造[48×1]向量的顺序,并且图6的(a)和(b)的右图示出了用于构造[16×1]向量的顺序。在LFNST的情况下,可以通过将2D数据按与图6的(a)和(b)中相同的顺序顺序地布置来获得一维向量x。
可以根据当前块的帧内预测模式确定正向一次变换的输出数据的布置方向。例如,在当前块的帧内预测模式相对于对角线方向处于水平方向时,可以按图6的(a)的顺序布置正向一次变换的输出数据,并且在当前块的帧内预测模式相对于对角线方向处于垂直方向时,可以按图6的(b)的顺序布置正向一次变换的输出数据。
根据示例,可以应用不同于图6的(a)和(b)的布置顺序的布置顺序,并且为了推导与应用图6的(a)和(b)的布置顺序时相同的结果(y向量),可以根据布置顺序重新布置矩阵G的列向量。也就是说,可以重新布置G的列向量,使得构成x向量的每个元素总是乘以相同的变换基向量。
由于通过式9推导的输出y是一维向量,因此当在使用正向二次变换的结果作为输入的过程中(例如,在执行量化或残差编码的过程中)需要二维数据作为输入数据时,式9的输出y向量需要再次被适当地布置为2D数据。
图7是例示根据示例的将正向二次变换的输出数据布置成二维块的顺序的图。
在LFNST的情况下,输出值可以根据预定扫描顺序布置在2D块中。图7的(a)示出了当输出y是[16×1]向量时,根据对角线扫描顺序将输出值布置在2D块的16个位置处。图7的(b)示出了当输出y是[8×1]向量时,根据对角线扫描顺序将输出值布置在2D块的8个位置处,并且用零填充其余的8个位置。图7的(b)中的X指示它被填充有零。
根据另一示例,由于可以预设在执行量化或残差编码时处理输出向量y的顺序,因此输出向量y可以不布置在如图7中所示的2D块中。然而,在残差编码的情况下,可以在2D块(例如,4×4)单元(例如,CG(系数组))中执行数据编码,并且在此情况下,根据如图7的对角线扫描顺序中的特定顺序来布置数据。
此外,解码设备可以通过根据用于逆变换的预设扫描顺序来布置通过解量化过程输出的二维数据来配置一维输入向量y。输入向量y可以通过下式输出为输出向量x。
[式10]
x=Gy
在逆LFNST的情况下,可以通过将作为[16×1]向量或[8×1]向量的输入向量y乘以G矩阵来推导输出向量x。对于逆LFNST,输出向量x可以是[48×1]向量或[16×1]向量。
输出向量x根据图6中所示的顺序布置在二维块中,并且被布置为二维数据,并且该二维数据成为逆一次变换的输入数据(或输入数据的一部分)。
因此,逆二次变换整体上是正向二次变换过程的相反,并且在逆变换的情况下,与在正向方向上不同,首先应用逆二次变换,然后应用逆一次变换。
在逆LFNST中,可以选择8个[48×16]矩阵和8个[16×16]矩阵中的一个作为变换矩阵G。是应用[48×16]矩阵还是应用[16×16]矩阵取决于块的大小和形状。
另外,可以从如上表2所示的四个变换集中推导8个矩阵,并且每个变换集可以由两个矩阵组成。根据帧内预测模式确定在4个变换集当中使用哪个变换集,并且更具体地,基于通过考虑广角帧内预测(WAIP)而扩展的帧内预测模式的值来确定变换集。通过索引信令来推导从构成所选择的变换集的两个矩阵当中选择哪个矩阵。更具体地,0、1和2可以作为发送的索引值,0可以指示不应用LFNST,并且1和2可以指示构成基于帧内预测模式值选择的变换集的两个变换矩阵中的任何一个。
此外,如上所述,由变换目标块的大小和形状来确定将[48×16]矩阵和[16×16]矩阵中的哪个变换矩阵应用于LFNST。
图8是例示LFNST被应用于的块形状的图。图8的(a)示出了4×4块,图8的(b)示出了4×8块和8×4块,图8的(c)示出了4×N块或N×4块,其中N为16或更大,图8的(d)示出了8×8块,图8的(e)示出了M×N块,其中M≥8、N≥8并且N>8或M>8。
在图8中,具有厚边界的块指示LFNST被应用到的区域。对于图8的(a)和(b)的块,LFNST被应用于左上4×4区域,并且对于图8的(c)的块,LFNST被单独地应用于被连续地布置的两个左上4×4区域。在图8的(a)、(b)和(c)中,由于LFNST以4×4区域为单位应用,所以该LFNST在下文中将被称为“4×4LFNST”。基于G的矩阵维度,可以应用[16×16]或[16×8]矩阵。
更具体地,[16×8]矩阵被应用到图8的(a)的4×4块(4×4TU或4×4CU),并且[16×16]矩阵被应用到图8的(b)和(c)中的块。这是为了将最坏情况的计算复杂度调整为每个样本8次乘法。
关于图8的(d)和(e),LFNST被应用于左上8×8区域,并且该LFNST在下文中被称为“8×8LFNST”。作为对应的变换矩阵,可以应用[48×16]矩阵或[48×8]矩阵。在正向LFNST的情况下,由于[48×1]向量(式9中的X向量)作为输入数据被输入,所以不是左上8×8区域的所有样本值都被用作正向LFNST的输入值。也就是说,如可以从图6的(a)的左侧顺序或图6的(b)的左侧顺序看出的,可以基于属于在将右下4×4块原样留下的同时的其余3个4×4块的样本来构造[48×1]向量。
[48×8]矩阵可以应用于图8的(d)中的8×8块(8×8TU或8×8CU),并且[48×16]矩阵可以应用于图8的(e)中的8×8块。这也是为了将最坏情况的计算复杂度调整为每个样本8次乘法。
取决于块形状,当对应的正向LFNST(4×4或8×8LFNST)被应用时,生成8或16个输出数据(式9中的Y向量,[8×1]或[16×1]向量)。在正向LFNST中,由于矩阵GT的特性,输出数据的数量等于或小于输入数据的数量。
图9是例示根据示例的正向LFNST的输出数据的布置的图,并且示出了其中根据块形状布置正向LFNST的输出数据的块。
在图9所示的块的左上的阴影区域对应于正向LFNST的输出数据所位于的区域,用0标记的位置指示填充有值0的样本,并且其余区域表示未被正向LFNST改变的区域。在未被LFNST改变的区域中,正向一次变换的输出数据保持不变。
如上所述,由于所应用的变换矩阵的尺寸根据块的形状而变化,因此输出数据的数量也变化。如图9,正向LFNST的输出数据可能不完全填充左上4×4块。在图9的(a)和(d)的情况下,将[16×8]矩阵和A[48×8]矩阵分别应用于由粗线指示的块或块内部的部分区域,并且生成作为正向LFNST的输出的[8×1]向量。也就是说,根据图7的(b)所示的扫描顺序,可以仅填充8个输出数据,如图9的(a)和(d)所示,并且可以在其余的8个位置中填充0。在图8的(d)的LFNST应用的块的情况下,如图9的(d)所示,与左上4×4块相邻的右上和左下的两个4×4块也被填充有值0。
如上所述,基本上,通过发信号通知LFNST索引,规定了是否应用LFNST和要应用的变换矩阵。如图9所示,当LFNST被应用时,由于正向LFNST的输出数据的数量可以等于或小于输入数据的数量,所以出现如下填充有零值的区域。
1)如图9的(a)所示,来自左上4×4块中的扫描顺序上的第八个位置和后面的位置的样本,即,来自第九到第十六的样本。
2)如图9的(d)和(e)中所示,当应用[48×16]矩阵或[48×8]矩阵时,与左上4×4块相邻的两个4×4块或者扫描顺序上的第二和第三4×4块。
因此,如果通过检查区域1)和2)存在非零数据,则确定未应用LFNST,使得可以省略对应的LFNST索引的信令。
根据示例,例如,在VVC标准中采用的LFNST的情况下,由于在残差编码之后执行LFNST索引的信令,因此编码设备可以通过残差编码来知道在TU或CU块内的所有位置是否存在非零数据(有效系数)。因此,编码设备可以基于非零数据的存在来确定是否执行关于LFNST索引的信令,并且解码设备可以确定是否解析LFNST索引。当非零数据不存在于以上1)和2)中指定的区域中时,执行LFNST索引的信令。
由于截短的一元码被应用为LFNST索引的二值化方法,所以LFNST索引由多达两个bin组成,并且0、10和11分别被指派为用于可能的LFNST索引值0、1和2的二进制码。在当前用于VVC的LFNST的情况下,将基于上下文的CABAC编码应用于第一bin(常规编码),并且将旁通编码应用于第二bin。第一bin的上下文的总数量为2,当(DCT-2,DCT-2)被应用为用于水平方向和垂直方向的一次变换对并且亮度分量和色度分量以双树类型编码时,一个上下文被分配并且另一上下文应用于其余情况。LFNST索引的编码如下表所示。
[表3]
此外,对于采用的LFNST,可以应用以下简化方法。
(i)根据示例,正向LFNST的输出数据的数量可以被限于最大值16。
在图8的(c)的情况下,4×4LFNST可以分别应用于与左上方相邻的两个4×4区域,并且在这种情况下,可以生成最大32个LFNST输出数据。当正向LFNST的输出数据的数量被限制为最大值16时,在4×N/N×4(N≥16)块(TU或CU)的情况下,4×4LFNST仅应用于左上方的一个4×4区域,LFNST可以仅应用于图8的所有块一次。通过此,可以简化图像编码的实现方式。
图10示出了根据示例的正向LFNST的输出数据的数量被限制为最大值16。如图10,当LFNST被应用到4×N或N×4块(其中N为16或更大)中的最左上的4×4区域时,正向LFNST的输出数据成为16个。
(ii)根据示例,可以附加地清零应用到未应用LFNST的区域。在本文档中,清零可以表示用为0的值填充属于特定区域的所有位置。也就是说,可以将清零应用于由于LFNST而未改变的区域,并且维持正向一次变换的结果。如上所述,由于LFNST被划分为4×4LFNST和8×8LFNST,所以清零可以如下划分为两种类型((ii)-(A)和(ii)-(B))。
(ii)-(A)当应用4×4LFNST时,未应用4×4LFNST的区域可以被清零。图11是例示根据示例的应用4×4LFNST的块中的清零的图。
如图11所示,关于应用了4×4LFNST的块,即,对于图9的(a)、(b)和(c)中的所有块,未应用LFNST的整个区域可以用零填充。
另一方面,图11的(d)示出当正向LFNST的输出数据的数量的最大值被限制为16(如图10所示)时,对未应用4×4LFNST的其余块执行清零。
(ii)-(B)当应用8×8LFNST时,未应用8×8LFNST的区域可以被清零。图12是例示根据示例的应用8×8LFNST的块中的清零的图。
如图12所示,关于应用8×8LFNST的块,即,对于图9的(d)和(e)中的所有块,LFNST未被应用到的整个区域可以用零填充。
(iii)由于以上(ii)中呈现的清零,用零填充的区域可以不与当LFNST被应用时相同。因此,可以根据对比图9的LFNST的情况更宽的区域进行(ii)中提出的清零来检查是否存在非零数据。
例如,当(ii)-(B)被应用时,在检查图9的(d)和(e)中的用零填充的区域是否存在非零数据之后,另外附加地检查图12中用0填充的区域是否存在非零数据,可以仅当不存在非零数据时执行针对LFNST索引的信令。
当然,即使应用(ii)中提出的清零,也可以与现有LFNST索引信令相同的方式检查非零数据是否存在。也就是说,在检查在图9中用零填充的块中是否存在非零数据之后,可以应用LFNST索引信令。在此情况下,编码设备仅执行清零并且解码设备不假设清零,也就是,仅检查非零数据是否仅存在于图9中明确标记为0的区域中,可以执行LFNST索引解析。
另选地,根据另一示例,可以执行如图13所示的清零。图13是例示根据另一示例的应用8×8LFNST的块中的清零的图。
如图11和图12所示,可以将清零应用于除了应用LFNST的区域之外的所有区域,或者可以将清零仅应用于局部区域,如图13所示。清零仅应用于除了图13的左上8×8区域之外的区域,清零可以不应用于左上×8区域内的右下4×4块。
可以推导出应用LFNST的简化方法((i)、(ii)-(A)、(ii)-(B)、(iii))的组合的各种实施方式。当然,上述简化方法的组合不限于以下实施方式,并且可以将任何组合应用于LFNST。
实施方式
-将正向LFNST的输出数据的数量限制为最大值16→(i)
-当应用4×4LFNST时,未应用4×4LFNST的所有区域被清零→(II)-(A)
-当应用8×8LFNST时,未应用8×8LFNST的所有区域被清零→(II)-(B)
-在检查非零数据是否也存在于填充有零值的现有区域以及由于附加的清零而填充有零的区域中((ii)-(A)、(ii)-(B))之后,仅在不存在非零数据时发信号通知LFNST索引→(iii)。
在实施方式的情况下,当应用LFNST时,可以存在非清零数据的区域限于左上4×4区域的内部。更详细地,在图11的(a)和图12的(a)的情况下,扫描顺序上的第八个位置是其中可以存在非零数据的最后位置。在图11的(b)和(c)以及图12的(b)的情况下,扫描顺序上的第十六个位置(即,左上4×4块的右下边缘的位置)是其中可以存在除了0以外的数据的最后位置。
因此,在应用LFNST之后,在检查非零数据是否存在于残差编码过程不允许的位置(在超出最后位置的位置处)之后,可以确定是否发信号通知LFNST索引。
在(ii)中提出的清零方法的情况下,由于当应用了一次变换和LFNST两者时最终生成的数据的数量,所以执行整个变换过程所需的计算量可以降低。也就是说,当LFNST被应用时,由于清零被应用于正向一次变换输出数据存在于未应用LFNST的区域中,因此不需要为在执行正向一次变换期间成为清零的区域生成数据。因此,可以降低生成对应的数据所需的计算量。在(ii)中提出的清零方法的附加效果总结如下。
首先,如上所述,减少执行整个变换过程所需的计算量。
特别地,当应用(ii)-(B)时,最坏情况的计算量被减少,使得变换过程可以被变轻。换句话说,一般来说,需要大量的计算来执行大尺寸的一次变换。通过应用(ii)-(B),作为执行正向LFNST的结果而推导出的数据的数量可以减小到16或更小。另外,随着整个块(TU或CU)的大小增加,减少变换操作的量的效果进一步增加。
第二,可以减少整个变换过程所需的计算量,由此降低执行变换所需的功耗。
第三,减小了变换过程中涉及的延迟。
诸如LFNST之类的次级变换向现有的一次变换添加了计算量,因而增加了执行变换时涉及的总体延迟时间。特别地,在帧内预测的情况下,由于在预测过程中使用相邻块的重构数据,所以在编码期间,由于二次变换导致的延迟的增加导致直到重构的延迟的增加。这可以导致帧内预测编码的总体延迟的增加。
然而,如果应用(ii)中提出的清零,则当应用LFNST时可以极大地减少执行一次变换的延迟时间,保持或减少整个变换的延迟时间,使得可以更简单地实现编码设备。
在传统的帧内预测中,当前要编码的块被视为一个编码单元,并且在不分割的情况下执行编码。然而,帧内子分区(ISP)编码意味着通过在水平方向或垂直方向上划分当前要编码的块来执行帧内预测编码。在这种情况下,可以通过以划分块为单位执行编码/解码来生成重构块,并且重构块可以用作下一个划分块的参考块。根据实施方式,在ISP编码中,可以将一个编码块划分为两个或四个子块并进行编码,并且在ISP中,在一个子块中,参考位于相邻的左侧或相邻的上侧的子块的重构像素值执行帧内预测。在下文中,“编码”可以用作包括由编码设备执行的编码和由解码设备执行的解码两者的概念。
表4表示在应用ISP时根据块大小划分的子块的数量,并且根据ISP划分的子分区可以称为变换块(TU)。
[表4]
块大小(CU) 划分的数量
4×4 不可用
4×8、8×4 2
所有其它情况 4
ISP是将预测为亮度帧内的块根据块的大小在垂直方向或水平方向上划分为两个或四个子分区。例如,可以应用ISP的最小块大小为4×8或8×4。当块大小大于4×8或8×4时,将块划分为4个子分区。
图14和图15例示了一个编码块被划分成的子块的示例,并且更具体地,图14例示了编码块(宽度(W)×高度(H))是4×8块或8×4块的划分的示例,并且图15例示了编码块不是4×8块、8×4块或4×4块的情况的划分的示例。
当应用ISP时,子块根据划分类型从左到右或从上到下顺序地进行编码(例如,水平地或垂直地),并在经由针对一个子块的逆变换和帧内预测执行重构处理之后,可以执行下一个子块的编码。对于最左或最上的子块,参考已经编码的编码块的重构像素,如在传统的帧内预测方法中一样。此外,当后续内部子块的每一侧不与前一子块相邻时,为了推导与对应侧相邻的参考像素,参考已编码的相邻编码块的重构像素,如在传统的帧内预测方法中一样。
在ISP编码模式中,可以用相同的帧内预测模式对所有子块进行编码,并且可以发信号通知指示是否使用ISP编码的标志以及指示是否在哪个方向上划分(水平或垂直)的标志。如图14和图15所示,子块的数量可以根据块的形状调整为2个或4个,当一个子块的大小(宽度×高度)小于16时,可以限制以使得不允许划分成对应的子块或不应用ISP编码本身。
在ISP预测模式的情况下,将一个编码单元划分为两个或四个分区块(即,子块)并进行预测,并且将相同的帧内预测模式应用于划分的两个或四个分区块。
如上所述,在划分方向上,水平方向(当分别具有M和N的水平长度和垂直长度的M×N编码单元在水平方向上进行划分时,如果M×N编码单元被划分为两个,则M×N编码单元被划分为M×(N/2)块,并且如果M×N编码单元被划分为四个块,则M×N编码单元被划分为M×(N/4)块)和垂直方向(当M×N编码单元在垂直方向上进行划分时,如果M×N编码单元被划分为两个,则M×N编码单元被划分为(M/2)×N块,并且如果M×N编码单元被划分为四个,则M×N编码单元被划分为(M/4)×N块)二者都是可能的。当在水平方向上划分M×N编码单元时,按照上下顺序对分区块进行编码,并且当在垂直方向上划分M×N编码单元时,按照左右顺序对分区块进行编码。在水平(垂直)方向划分的情况下,可以参考上(左)分区块的重构像素值来预测当前编码的分区块。
可以对通过ISP预测方法以分区块为单位生成的残差信号应用变换。基于DST-7/DCT-8组合以及现有的DCT-2的多变换选择(MTS)技术可以应用于基于正向的一次变换(核心变换),并且正向低频不可分离的变换(LFNST)可以应用于根据一次变换生成的变换系数以生成最终修改的变换系数。
也就是说,LFNST可以应用于通过应用ISP预测模式划分成的分区块,并且相同的帧内预测模式应用于划分的分区块,如上所述。因此,当选择基于帧内预测模式推导的LFNST集时,所推导的LFNST集可以应用于所有的分区块。也就是说,因为相同的帧内预测模式应用于所有分区块,所以相同的LFNST集可以应用于所有分区块。
根据实施方式,LFNST可以仅应用于具有4或更大的水平长度和垂直长度二者的变换块。因此,当根据ISP预测方法的划分的分区块的水平长度或垂直长度小于4时,不应用LFNST并且不发信号通知LFNST索引。此外,当对每个分区块应用LFNST时,可以将对应的分区块视为一个变换块。当不应用ISP预测方法时,可以将LFNST应用于编码块。
将详细描述将LFNST应用于每个分区块的方法。
根据实施方式,在将正向LFNST应用于各个分区块之后,在按变换系数扫描顺序的左上4×4区域中仅留下最多16个(8个或16个)系数,然后可以应用清零,其中其余的位置和区域全部被填充为0。
另选地,根据实施方式,当分区块的一侧的长度为4时,LFNST仅应用于左上4×4区域,并且当分区块的所有侧的长度(即,宽度和高度)为8或更大时,LFNST可以应用于左上8×8区域内的除了右下4×4区域之外的其余48个系数。
另选地,根据实施方式,为了将最坏情况的计算复杂度调整为每个样本8次乘法,当每个分区块是4×4或8×8时,在应用正向LFNST之后可以仅输出8个变换系数。也就是说,当分区块为4×4时,可以应用8×16矩阵作为变换矩阵,当分区块为8×8时,可以应用8×48矩阵作为变换矩阵。
在当前的VVC标准中,以编码单元为单位执行LFNST索引信令。因此,在ISP预测模式中并且当对所有分区块应用LFNST时,可以将相同的LFNST索引值应用于对应的分区块。也就是说,当在编码单元级别发送一次LFNST索引值时,对应的LFNST索引可以应用于编码单元中的所有分区块。如上所述,LFNST索引值可以具有0、1和2的值,其中0表示不应用LFNST的情况,而1和2表示在应用LFNST时存在于一个LFNST集中的两个变换矩阵。
如上所述,LFNST集是由帧内预测模式确定的,并且在ISP预测模式的情况下,因为编码单元中的所有分区块都是在相同的帧内预测模式下预测的,所以分区块可以参考相同的LFNST集。
作为另一示例,LFNST索引信令仍然以编码单元为单位来执行,但是在ISP预测模式的情况下,不确定是否对所有分区块均一地应用LFNST,并且对于每个分区块,可以通过单独的条件来确定是否应用在编码单元级别发信号通知的LFNST索引值以及是否应用LFNST。这里,可以通过比特流以针对每个分区块的标志的形式发信号通知单独的条件,并且当标志值为1时,应用在编码单元级别发信号通知的LFNST索引值,并且当标志值为0时,可以不应用LFNST。
在应用了ISP模式的编码单元中,当分区块的一侧的长度小于4时应用LFNST的示例描述如下。
首先,当分区块的大小为N×2(2×N)时,可以将LFNST应用于左上M×2(2×M)区域(其中M≤N)。例如,当M=8时,左上区域变为8×2(2×8),因此存在16个残差信号的区域可以是正向LFNST的输入,并且可以应用R×16(R≤16)的正向变换矩阵。
这里,正向LFNST矩阵可以是除了当前VVC标准中包括的矩阵之外的单独的附加矩阵。此外,对于最坏情况的复杂度控制,其中仅对16×16矩阵的上8行向量进行采样的8×16矩阵可以用于变换。稍后将详细描述复杂度控制方法。
其次,当分区块的大小为N×1(1×N)时,可以将LFNST应用于左上M×1(1×M)区域(其中M≤N)。例如,当M=16时,左上区域变为16×1(1×16),因此存在16个残差信号的区域可以是正向LFNST的输入,并且可以应用R×16(R≤16)的正向变换矩阵。
这里,对应的正向LFNST矩阵可以是除了当前VVC标准中包括的矩阵之外的单独的附加矩阵。此外,为了控制最坏情况的复杂度,其中仅对16×16矩阵的上8行向量进行采样的8×16矩阵可以用于变换。稍后将详细描述复杂度控制方法。
可以同时应用第一实施方式和第二实施方式,或者可以应用两个实施方式中的任一个。特别地,在第二实施方式的情况下,因为在LFNST中考虑了一次变换,因此通过实验观察到,与LFNST索引信令成本相比,在现有LFNST中可以获得的压缩性能改进相对较小。然而,在第一实施方式的情况下,观察到与可以从传统LFNST获得的压缩性能改进相似的压缩性能改进。也就是说,在ISP的情况下,可以通过实验查看2×N和N×2的LFNST的应用对实际压缩性能的贡献。
在当前VVC的LFNST中,应用了帧内预测模式之间的对称性。相同的LFNST集应用于设置在模式34(在右下角的45度对角线方向上的预测)周围的两个定向模式,例如,相同的LFNST集应用于模式18(水平定向预测模式)和模式50(垂直定向预测模式)。然而,在模式35至66中,当应用正向LFNST时,输入数据被转置,然后应用LFNST。
VVC支持广角帧内预测(WAIP)模式,考虑到WAIP模式,基于修改后的帧内预测模式推导LFNST集。对于由WAIP扩展的模式,LFNST集是通过使用对称性来确定的,就像在一般的帧内预测方向模式中一样。例如,因为模式-1与模式67对称,所以应用相同的LFNST集,并且因为模式-14与模式80对称,所以应用相同的LFNST集。模式67至80在应用正向LFNST之前对输入数据进行转置之后应用LFNST变换。
在将LFNST应用于左上M×2(M×1)块的情况下,因为应用了LFNST的块是非正方形的,所以不能应用对LFNST的对称性。因此,代替应用基于帧内预测模式的对称性,如在表2的LFNST中,可以应用M×2(M×1)块和2×M(1×M)块之间的对称性。
图16是例示根据实施方式的M×2(M×1)块和2×M(1×M)块之间的对称性的图。
如图16所示,因为可以认为M×2(M×1)块中的模式2与2×M(1×M)块中的模式66对称,所以可以将相同的LFNST集应用于2×M(1×M)块和M×2(M×1)块。
在这种情况下,为了将应用于M×2(M×1)块的LFNST集应用于2×M(1×M)块,基于模式2而不是模式66来选择LFNST集。也就是说,在应用正向LFNST之前,在转置2×M(1×M)块的输入数据之后,可以应用LFNST。
图17是例示根据实施方式的转置2×M块的示例的图。
图17的(a)是例示可以通过以列优先顺序读取2×M块的输入数据来应用LFNST的图,图17的(b)是例示可以通过以行优先顺序读取M×2(M×1)块的输入数据来应用LFNST的图。将LFNST应用于左上M×2(M×1)或2×M(M×1)块的方法描述如下。
1.首先,如图17的(a)和(b)所示,输入数据被布置成构成正向LFNST的输入向量。例如,参照图16,对于以模式2预测的M×2块,遵循图17的(b)中的顺序,对于以模式66预测的2×M块,输入数据按图17的(a)的顺序布置,然后可以应用为模式2设置的LFNST。
2.对于M×2(M×1)块,考虑到WAIP,基于修改的帧内预测模式确定LFNST集。如上所述,帧内预测模式和LFNST集之间建立了预设的映射关系,其可以用表2所示的映射表来表示。
对于2×M(1×M)块,在考虑到WAIP的情况下从修改的帧内预测模式中向下沿45度对角线方向围绕预测模式(在VVC标准的情况下为模式34)的对称模式可以被获得,并且然后基于对应的对称模式和映射表确定LFNST集。围绕模式34的对称模式(y)可以通过下式推导。下面将更详细地描述映射表。
[式11]
如果2≤x≤66,则y=68-x,
否则(x≤-1或x≥67),y=66-x
3.当应用正向LFNST时,可以通过将在处理1中准备的输入数据乘以LFNST核来推导变换系数。可以根据在处理2中确定的LFNST集和预定的LFNST索引来选择LFNST核。
例如,当M=8并且应用16×16矩阵作为LFNST核时,可以通过将矩阵乘以16个输入数据来生成16个变换系数。生成的变换系数可以按照VVC标准中使用的扫描顺序布置在左上8×2或2×8区域中。
图18例示了根据实施方式的8×2或2×8区域的扫描顺序。
除了左上8×2或2×8区域之外的所有区域都可以用零值(清零)填充,或者可以将应用一次变换的现有变换系数保持原样。预定LFNST索引可以是当在编程处理中在改变LFNST索引值的同时计算RD成本时尝试的LFNST索引值(0、1、2)之一。
在将最坏情况的计算复杂度调整到某个程度或更低的配置的情况下(例如,8次乘法/样本),例如,在通过乘以仅取16×16矩阵的上8行的8×16矩阵来生成仅8个变换系数之后,变换系数可以按图18的扫描顺序设置,并且可以对其余的系数区域应用清零。稍后将描述最坏情况的复杂度控制。
4.当应用逆LFNST时,将预设数量(例如,16个)的变换系数设置为输入向量,并且从处理2获得的LFNST集和从选择解析的LFNST索引推导的LFNST核(例如,16×16矩阵)被选择,然后通过将LFNST核与对应的输入向量相乘,可以推导出输出向量。
在M×2(M×1)块的情况下,输出向量可以按图17的(b)的行优先顺序设置,而在2×M(1×M)块的情况下,输出向量可以是以图17的(a)的列优先顺序设置。
除了其中对应的输出向量设置于左上M×2(M×1)或2×M(M×2)区域内的区域之外的其余区域以及分区块中除了左上M×2(M×1)或2×M(M×2)区域之外的区域(分区块中的M×2)区域可以全部被清零为具有零值,或者可以被配置为通过残差编码和逆量化处理原样保持重构的变换系数。
在构造输入向量时,如第3点中那样,输入数据可以按照图18的扫描顺序布置,并且为了将最坏情况的计算复杂度控制在一定程度或更低,可以通过减少输入数据的数量(例如,8个而不是16个)来构造输入向量。
例如,当M=8时,如果使用8个输入数据,则可以仅从对应的16×16矩阵中取左侧的16×8矩阵,并相乘以获得16个输出数据。稍后将描述最坏情况的复杂度控制。
在上述实施方式中,当应用LFNST时,示出了在M×2(M×1)块和2×M(1×M)块之间应用对称的情况,但是根据另一示例,可以将不同的LFNST集应用于两个块形状中的每一个。
在下文中,将描述使用帧内预测模式的映射方法和ISP模式的LFNST集配置的各种示例。
在ISP模式的情况下,LFNST集配置可以与现有的LFNST集不同。换句话说,可以应用与现有LFNST核不同的核,并且可以应用与应用于当前VVC标准的帧内预测模式索引和LFNST集之间的映射表不同的映射表。应用于当前VVC标准的映射表可以与表2的映射表相同。
在表2中,preModeIntra值表示考虑到WAIP而改变的帧内预测模式值,lfnstTrSetIdx值是指示特定LFNST集的索引值。每个LFNST集都配置有两个LFNST核。
当应用ISP预测模式时,如果每个分区块的水平长度和垂直长度二者都等于或大于4,则可以应用与当前VVC标准中应用的LFNST核相同的核,并且映射表可以照原样应用。可以应用不同于当前VVC标准的映射表和LFNST核。
当应用ISP预测模式时,当每个分区块的水平长度或垂直长度小于4时,可以应用不同于当前VVC标准的映射表和LFNST核。在下文中,表5至表7表示帧内预测模式值(考虑到WAIP而改变的帧内预测模式值)和LFNST集之间的映射表,其可以应用于M×2(M×1)块或2×M(1×M)块。
[表5]
predModeIntra lfnstTrSetIdx
predModeIntra<0 1
0<=predModeIntra<=1 0
2<=predModeIntra<=12 1
13<=predModeIntra<=23 2
24<=predModeIntra<=34 3
35<=predModeIntra<=44 4
45<=predModeIntra<=55 5
56<=predModeIntra<=66 6
67<=predModeIntra<=80 6
81<=predModeIntra<=83 0
[表6]
predModeIntra lfnstTrSetIdx
predModeIntra<0 1
0<=predModeIntra<=1 0
2<=predModeIntra<=23 1
24<=predModeIntra<=44 2
45<=predModeIntra<=66 3
67<=predModeIntra<=80 3
81<=predModeIntra<=83 0
[表7]
predModeIntra lfnstTrSetIdx
predModeIntra<0 1
0<=predModeIntra<=1 0
2<=predModeIntra<=80 1
81<=predModeIntra<=83 0
表5的第一映射表配置有七个LFNST集,表6的映射表配置有四个LFNST集,并且表7的映射表配置有两个LFNST集。作为另一示例,当其配置有一个LFNST集时,lfnstTrSetIdx值可以相对于preModeIntra值固定为0。
在下文中,将描述在将LFNST应用于ISP模式时保持最坏情况的计算复杂度的方法。
在ISP模式的情况下,当应用LFNST时,为了将每个样本(或每个系数、每个位置)的乘法次数保持在某个值或更少,可能会限制LFNST的应用。根据分区块的大小,通过如下应用LFNST,每个样本(或每个系数,每个位置)的乘法次数可以保持为8或更少。
1.当分区块的水平长度和垂直长度二者都为4或更大时,可以应用与当前VVC标准中针对LFNST的最坏情况的计算复杂度控制方法相同的方法。
也就是说,当分区块是4×4块时,可以在正向方向上应用通过从16×16矩阵中采样上8行获得的8×16矩阵而不是16×16矩阵,并且可以在逆方向上应用通过从16×16矩阵中采样左8列获得的16×8矩阵。此外,当分区块是8×8块时,在正向方向上,代替16×48矩阵,应用通过从16×48矩阵中采样上8行而获得的8×48矩阵,并且在逆方向上,代替48×16矩阵,可以应用通过从48×16矩阵中采样左8列获得的48×8矩阵。
在4×N或N×4(N>4)块的情况下,当执行正向变换时,在将16×16矩阵仅应用于左上4×4块之后生成的16个系数可以设置在左上4×4区域中,并且其它区域可以填充有值0。另外,在执行逆变换时,将位于左上4×4块中的16个系数按扫描顺序设置以形成输入向量,然后可以通过乘以16×16矩阵生成16个输出数据。生成的输出数据可以设置在左上4×4区域中,并且除了左上4×4区域之外的其余区域可以填充有值0。
在8×N或N×8(N>8)块的情况下,当执行正向变换时,在将16×48矩阵应用于仅左上8×8块内的ROI区域(除了来自左上8×8块中的右下4×4块之外的其余区域)后的生成16个系数可以设置在左上4×4区域中,并且所有其它区域可以填充有值0。此外,在执行逆变换时,位于左上4×4区域中的16个系数按扫描顺序设置以形成输入向量,然后可以通过乘以48×16矩阵生成48个输出数据。生成的输出数据可以填充在ROI区域中,并且所有其它区域可以填充有值0。
2.当分区块的大小为N×2或2×N并且LFNST应用于左上M×2或2×M区域(M≤N)时,可以应用根据N值采样的矩阵。
在M=8的情况下,对于N=8的分区块,即,8×2或2×8块,在正向变换的情况下,可以应用通过从16×16矩阵中采样上8行获得的8×16矩阵而不是16×16的矩阵,并且在逆变换的情况下,可以应用通过从16×16矩阵中采样左8列获得的16×8矩阵而不是16×16矩阵。
当N大于8时,在正向变换的情况下,将16×16矩阵应用于左上8×2或2×8块后生成的16个输出数据被设置在左上8×2或2×8块中,并且其余区域可以填充有值0。在逆变换的情况下,位于左上8×2或2×8块中的16个系数按扫描顺序设置以形成输入向量,然后可以通过乘以16×16矩阵生成16个输出数据。生成的输出数据可以放置在左上8×2或2×8块中,并且所有其余区域可以填充有值0。
3.当分区块的大小为N×1或1×N并且LFNST应用于左上M×1或1×M区域(M≤N)时,可以应用根据N值采样的矩阵。
当M=16时,对于N=16的分区块,即,16×1或1×16块,在正向变换的情况下,可以应用通过从16×16矩阵中采样上8行获得的8×16矩阵而不是16×16的矩阵,并且在逆变换的情况下,可以应用通过从16×16矩阵中采样左8列获得的16×8矩阵而不是16×16矩阵。
当N大于16时,在正向变换的情况下,将16×16矩阵应用于左上16×1或1×16块后生成的16个输出数据可以设置在左上16×1或1×16块中,并且其余区域可以填充有值0。在逆变换的情况下,可以将位于左上16×1或1×16块中的16个系数按扫描顺序设置以形成输入向量,然后可以通过乘以16×16矩阵生成16个输出数据。生成的输出数据可以设置在左上16×1或1×16块中,并且所有其余区域可以填充有值0。
作为另一示例,为了将每个样本(或每个系数,每个位置)的乘法次数保持在某个值或更少,基于ISP编码单元大小而不是ISP分区块的大小的每个样本(或每个系数,每个位置)的乘法次数可以保持为8或更少。当ISP分区块当中只有一个块满足应用LFNST的条件时,可以基于对应的编码单元大小而不是分区块的大小来应用LFNST的最坏情况的复杂度计算。例如,如果特定编码单元的亮度编码块通过被分割成具有4×4大小的四个分区块而用ISP进行编码,并且对于它们当中的两个分区块不存在非零变换系数,则它可以被配置为使得针对其它两个分区块中的每个分区块不是生成8个,而是生成16个变换系数。
在下文中,描述了在ISP模式中发信号通知LFNST索引的方法。
如上所述,LFNST索引可以具有值0、1和2,其中0指示未应用LFNST,并且1和2指示包括在所选择的LFNST集中的两个LFNST核矩阵中的一个。在当前的VVC标准中,如下所述发送LFNST索引。
1.可以针对每个编码单元(CU)发送一次LFNST索引。在双树情况下,可针对亮度块和色度块中的每一者发信号通知单独的LFNST索引。
2.当未发信号通知LFNST索引时,将LFNST索引推断为作为默认值的0。在下面的情况下LFNST索引值被推断为0。
A.当在不应用变换的模式(例如,变换跳过、BDPCM、无损编码等)中时
B.当一次变换不是DCT-2时(当它是DST7或DCT8时),即,当水平变换或垂直变换不是DCT-2时
C.当编码单元的亮度块的水平长度或垂直长度超过可变换最大亮度变换的大小时,例如,当在可变换最大亮度变换的大小为64的情况下编码块的亮度块的大小为128×16时,LFNST不适用。
在双树情况下,确定亮度分量的编码单元和色度分量的编码单元中的每一者是否超过最大亮度变换的大小。也就是说,检查亮度块是否超过可变换最大亮度变换的大小,并且检查色度块是否超过用于颜色格式的对应亮度块的水平/垂直长度和最大可变换亮度变换的大小。例如,当颜色格式为4:2:0时,对应亮度块的水平/垂直长度中的每一者是色度块的水平/垂直长度的两倍,并且对应亮度块的变换大小是色度块的变换大小的两倍。作为另一示例,当颜色格式为4:4:4时,对应亮度块的水平/垂直长度与色度块的水平/垂直长度相同。
64-长度变换或32-长度变换可表示分别以64或32的长度水平或垂直应用的变换,并且“变换大小”可以表示64或32的对应长度。
在单树情况下,检查亮度块的水平或垂直长度是否超过可变换最大亮度变换块的大小,并且如果其超过该大小,则可以跳过LFNST索引信令。
D.可仅在编码单元的水平长度和垂直长度两者大于或等于4时发送LFNST索引。
在双树情况下,可仅针对对应分量(即,亮度或色度分量)的水平长度和垂直长度两者大于或等于4的情况发信号通知LFNST索引。
在单树情况下,可仅针对亮度分量的水平长度和垂直长度两者大于或等于4的状况发信号通知LFNST索引。
E.在最后非零系数位置不是DC位置(块的左上位置)的情况下,当它是双树类型亮度块时,如果最后非零系数位置不是DC位置,则发送LFNST索引。当它是双树类型色度块时,如果即使Cb的最后非零系数位置和Cr的最后非零系数位置中的一者不是DC位置,则发送LNFST索引。
在单树类型的情况下,如果即使在亮度分量、Cb分量和Cr分量中的一者中最后非零系数位置不是DC位置,则发送LFNST索引。
在本文中,如果指示针对一个变换块是否存在变换系数的编码块标志(CBF)值为0,则不检查变换块的最后非零系数位置来确定是否发信号通知LFNST索引。也就是说,如果CBF值是0,则由于变换不应用于块,所以当检查用于LFNST索引信令的条件时,可以不考虑最后非零系数位置。
例如,1)在双树类型和亮度分量的情况下,如果对应CBF值是0,则不发信号通知LFNST索引,2)在双树类型和色度分量的情况下,如果Cb的CBF值是0且Cr的CBF值是1,则通过仅检查Cr的最后非零系数位置来发送LFNST索引,并且3)在单树类型的情况下,对于亮度、Cb和Cr中的全部,仅针对相应CBF值是1的分量检查最后非零系数位置。
F.当识别出在除了可以存在LFNSF变换系数的位置之外的位置处存在变换系数时,可以跳过LFNST索引信令。在4×4变换块和8×8变换块的情况下,LFNST变换系数可以根据VVC标准中的变换系数扫描顺序从DC位置开始存在于8个位置,并且所有其余位置用0填充。另外,当变换块不是4×4变换块和8×8变换块时,LFNST变换系数可以根据VVC标准中的变换系数扫描顺序从DC位置开始存在于16个位置处,并且所有其余位置用0填充。
因此,在执行残差编码之后,当非零变换系数存在于要用0填充的区域中时,可以跳过LFNST索引信令。
此外,ISP模式可仅应用于亮度块或可应用于亮度块和色度块两者。如上文所描述,当应用ISP预测时,通过将对应编码单元分割成2个或4个分区块来进行预测,并且可以将变换应用于每个分区块。因此,当在编码单元的基础上确定其中发信号通知LFNST索引的条件时,也应考虑LFNST适用于每个分区块的事实。另外,当将ISP预测模式仅应用于特定分量(例如,亮度块)时,应通过考虑仅针对分量实现分割成分区块的事实来发信号通知LFNST索引。当处于ISP模式时可能的LFNST索引信令方案总结如下。
1.可以针对每个编码单元(CU)发送一次LFNST索引。在双树情况下,可针对亮度块和色度块中的每一者发信号通知单独的LFNST索引。
2.当未发信号通知LFNST索引时,将LFNST索引推断为作为默认值的0。在下面的情况下LFNST索引值被推断为0。
A.当在不应用变换的模式(例如,变换跳过、BDPCM、无损编码等)中时
B.当编码单元的亮度块的水平长度或垂直长度超过可变换最大亮度变换的大小时,例如,当在可变换最大亮度变换的大小为64的情况下编码块的亮度块的大小为128×16时,LFNST不适用。
还可以基于分区块而非编码单元的大小来确定是否发信号通知LFNST索引。也就是说,当对应亮度块的分区块的水平长度或垂直长度超过可变换最大亮度变换的大小时,可以跳过LFNST索引信令,并且可以推断LFNST索引为0。
在双树情况下,确定亮度分量的编码单元或分区块和色度分量的编码单元或分区块中的每一者是否超过最大变换块大小。也就是说,将亮度的编码单元或分区块的水平和垂直长度中的每一个与最大亮度变换尺寸进行比较,并且如果它们中的任何一个大于最大亮度变换尺寸,则不应用LFNST,并且在色度的编码单元或分区块的情况下,用于颜色格式的对应亮度块的水平/垂直长度与可变换最大亮度变换尺寸进行比较。例如,当颜色格式为4:2:0时,对应亮度块的水平/垂直长度中的每一者是色度块的水平/垂直长度的两倍,并且对应亮度块的变换大小是色度块的变换大小的两倍。作为另一示例,当颜色格式为4:4:4时,对应亮度块的水平/垂直长度与色度块的水平/垂直长度相同。
在单树情况下,检查亮度块(编码单元或分区块)是否超过可变换最大亮度变换块的大小,并且如果其超过该大小,则可跳过LFNST索引信令。
C.如果应用了当前VVC标准中包括的LFNST,则可以仅当分区块的水平长度和垂直长度二者都大于或等于4时才发送LFNST索引。
如果除了当前VVC标准中包括的LFNST之外还应用了针对2×M(1×M)或M×2(M×1)块的多达LFNST,则仅当分区块具有大于或等于2×M(1×M)或M×2(M×1)块的大小时才发送LFNST索引。这里,P×Q块大于或等于R×S块表示P≥R并且Q≥S。
总之,可以仅当分区块具有大于或等于适用于LFNST的最小大小的大小时才发送LFNST索引。在双树情况下,可仅在亮度或色度分量的分区块具有大于或等于适用于LFNST的最小大小的大小时发信号通知LFNST索引。在单树情况下,可仅在亮度分量的分区块具有大于或等于适用于LFNST的最小大小的大小时发信号通知LFNST索引。
在本文档中,M×N块等于或大于K×L块表示M等于或大于K并且N等于或大于L。M×N块大于K×L块表示M等于或大于K并且N等于或大于L,其中M大于K或者N大于L。M×N块小于或等于K×L块表示M小于或等于K并且N小于或等于L。M×N块小于K×L块表示M小于或等于K并且N小于或等于L,其中M小于K或者N小于L。
D.在最后非零系数位置不是DC位置(块的左上位置)的情况下,当它是双树类型亮度块时,如果对应的最后非零系数位置不是所有分区块中的甚至任何一个中的DC位置,则可以执行LFNST发送。当它是双树类型和色度块时,如果Cb的所有分区块的非零系数位置(这里,当ISP模式没有应用于色度分量时,认为分区块的数量是1)和Cr的所有分区块的最后非零系数位置(这里,当ISP模式没有应用于色度分量时,认为分区块的数量是1)中的甚至任何一者不是DC位置,则可以发送对应的LNFST索引。
在单树类型的情况下,如果即使在亮度分量、Cb分量和Cr分量的所有分区块中的任何一个中,最后非零位置不是DC位置,则可发送对应的LNFST索引。
在本文中,如果指示针对每个分区块是否存在变换系数的编码块标志(CBF)值为0,则不检查对应分区块的最后非零系数位置来确定是否发信号通知LFNST索引。也就是说,如果CBF值是0,则由于不将变换应用于块,所以当检查用于LFNST索引信令的条件时不考虑最后非零系数位置。
例如,1)在双树类型和亮度分量的情况下,当确定是否针对每个分区块发信号通知LFNST索引时,如果对应CBF值是0,2)在双树类型和色度分量的情况下,如果Cb的CBF值为0且Cr的CBF值为1,则可以通过仅检查每个分区块的Cr的非零系数位置来确定是否发信号通知LFNST索引,以及3)在单树类型的情况下,可以通过仅针对亮度分量、Cb分量和Cr分量的所有分区块中CBF值为1的块检查最后非零系数位置来确定是否发信号通知LFNST索引。
在ISP模式的情况下,图像信息可以被配置为不检查最后的非零系数位置,并且其实施方式可以如下。
i.在ISP模式的情况下,可以通过跳过对亮度块和色度块两者的非零系数位置的检查来允许LFNST索引信令。也就是说,即使最后非零系数位置对于所有分区块都是DC位置或对应CBF值是0,也可允许LFNST索引信令。
ii.在ISP模式的情况下,基于前述方案,可仅针对亮度块跳过对非零系数位置的检查,并且可以针对色度块检查非零系数位置。例如,在双树类型和亮度块的情况下,允许LFNST索引信令而不检查非零系数位置,并且在双树类型和色度块的情况下,可以通过检查通过前述方案对于最后非零系数位置是否存在DC位置来确定是否发信号通知LFNST索引。
iii.在ISP模式和单树类型的情况下,可以应用方案i或ii。也就是说,在ISP模式和单树类型的情况下,当应用方案i时,可以通过跳过对亮度块和色度块两者的最后非零系数位置的检查来允许LFNST索引信令。另选地,可应用方案ii以通过上述方案按照针对亮度分量的分区块跳过针对非零系数位置的检查且针对色度分量的分区块执行针对非零系数位置的检查的方式来确定发信号通知LFNST索引(当ISP未应用于色度分量时,可以将分区块的数量视为1)。
E.如果即使针对所有分区块当中的一个分区块,识别出变换系数存在于除了可以存在LFNST变换系数的位置之外的位置处,则可以跳过LFNST索引信令。
例如,在4×4分区块和8×8分区块的情况下,LFNST变换系数可以根据VVC标准中的变换系数扫描顺序存在于从DC位置开始的8个位置处,并且所有其余位置用0填充。另外,当变换块大于或等于4×4大小并且不是4×4分区块和8×8分区块时,LFNST变换系数可以根据VVC标准中的变换系数扫描顺序存在于从DC位置开始的16个位置处,并且所有其余位置用0填充。
因此,在执行残差编码之后,当非零变换系数存在于要用0填充的区域中时,可以跳过LFNST索引信令。
如果当分区块具有2×M(1×M)或M×2(M×1)的大小时,LFNST也适用,则可以如下指定LFNST变换系数所在的区域。当假设应用LFNST时,如果在变换系数所在的区域之外的区域可以用0填充,并且如果在要用0填充的区域中存在非零变换系数,则可以跳过LFNST索引信令。
i.如果LFNST适用于2×M或M×2块,并且如果M=9,则可以仅针对2×8或8×2分区块生成8个LFNST变换系数。当根据图18的扫描顺序布置变换系数时,可以从DC位置根据扫描顺序来布置8个变换系数,并且可用0填充其余8个位置。
当针对2×N或N×2(N>8)分区块可生成16个LFNST变换系数时,并且当根据图18的扫描顺序来布置变换系数时,可以从DC位置根据扫描顺序来布置16个变换系数,并且可用0填充其余位置。也就是说,在2×N或N×2(N>8)分区块中,除左上2×8或8×2块之外的区域可用0填充。代替8个LFNST变换系数,还可针对2×8或8×2分区块生成16个变换系数。在此情况下,不存在要用0填充的区域。如上所述,当应用LFNST时,在确定即使在一个分区块中在被确定为用0填充的区域中存在非零变换系数时,可以跳过LFNST索引信令,并且可以推断LFNST索引为0。
ii.如果LFNST适用于1×M或M×1块,并且如果M=16,则可以仅针对1×16或16×1分区块生成8个LFNST变换系数。当根据从左到右或从上到下的扫描顺序来布置变换系数时,可以从DC位置根据对应扫描顺序来布置8变换系数,并且可用0填充其余8个位置。
当针对1×N或N×1(N>16)个分区块可生成16个LFNST变换系数时,并且当根据从左到右或从上到下的扫描顺序来布置变换系数时,可以从DC位置根据对应扫描顺序来布置16个变换系数,并且可用0填充其余位置。也就是说,1×N或N×1(N>16)分区块中的除了左上1×16或16×1块之外的区域可以用0填充。
代替8个LFNST变换系数,也可以为1×16或16×1分区块生成16个变换系数。在此情况下,不存在要用0填充的区域。如上所述,当应用LFNST时,在确定即使在一个分区块中在被确定为用0填充的区域中存在非零变换系数时,可以跳过LFNST索引信令,并且可以推断LFNST索引为0。
此外,在ISP模式的情况下,代替DCT-2,通过针对水平方向和垂直方向中的每一个独立地考虑长度条件,在没有针对当前VVC标准中的MTS索引的信令的情况下应用DST-7。确定水平或垂直长度是否大于或等于4或大于或等于16,并且根据确定的结果确定一次变换核。因此,当处于ISP模式时并且当LFNST适用时,可以如下配置变换组合。
1.在LFNST索引为0的情况下(包括LFNST索引被推断为0的情况),当ISP被包括在当前VVC标准中时,其可符合确定一次变换的条件。也就是说,检查针对水平方向和垂直方向中的每一者是否独立地满足长度条件(长度大于或等于4且小于或等于16的条件),并且如果满足条件,则针对一次变换应用DST-7而非DCT-2,并且如果不满足条件,则可应用DCT-2。
2.在LFNST索引大于0的情况下,对于一次变换,以下两种配置是可能的。
A.DCT-2适用于水平方向和垂直方向两者。
B.当ISP被包括在当前VVC标准中时,其可符合确定一次变换的条件。也就是说,检查针对水平方向和垂直方向中的每一者是否独立地满足长度条件(长度大于或等于4且小于或等于16的条件),并且如果满足条件,则应用DST-7而非DCT-2,并且如果不满足条件,则可应用DCT-2。
当处于ISP模式时,图像信息可以被配置为使得LFNST索引不是每个编码单元而是每个分区块地发送。在这种情况下,可以通过认为在前述LFNST索引信令方案中发送LFNST索引的单元中仅存在一个分区块来确定是否发信号通知LFNST索引。
此外,下面将描述LFNST索引和MTS索引的信令顺序。
根据示例,可以在最后非零系数位置的编码位置之后对在残差编码中发信号通知的LFNST索引进行编码,并且可以在LFNST索引之后立即编码MTS索引。在这种配置的情况下,可以针对每个变换单元发信号通知LFNST索引。另选地,即使未在残差编码中发信号通知,也可以在最后有效系数位置的编码之后对LFNST索引进行编码,并且MTS索引可以被编码在LFNST索引之后。
根据示例的残差编码的语法如下。
[表8]
表8所示的主要变量的含义如下。
1.cbWidth、cbHeight:当前编码块的宽度和高度
2.log2TbWidth、log2TbHeight:当前变换块的宽度和高度的以2为底的对数值,其可以通过反映清零而减小到可以存在非零系数的左上区域。
3.sps_lfnst_enabled_flag:指示是否启用LFNST的标志,如果标志值为0,则它指示不启用LFNST,并且如果标志值为1,则它指示启用LFNST。它被定义在序列参数集(SPS)中。
4.CuPredMode[chType][x0][y0]:与变量chType和(x0,y0)位置相对应的预测模式,chType可以具有0和1的值,其中0指示亮度分量,并且1指示色度分量。(x0,y0)位置指示图片上的位置,并且MODE_INTRA(帧内预测)和MODE_INTER(帧间预测)可以作为CuPredMode[chType][x0][y0]的值。
5.IntraSubPartitionsSplit[x0][y0]:(x0,y0)位置的内容与第4条中相同。它指示在(x0,y0)位置应用了哪个ISP分区,ISP_NO_SPLIT指示对应于(x0,y0)位置的编码单元没有被划分为分区块。
6.intra_mip_flag[x0][y0]:(x0,y0)位置的内容与以上第4条中相同。intra_mip_flag是指示是否应用基于矩阵的帧内预测(MIP)预测模式的标志。如果标志值为0,则它指示未启用MIP,如果标志值为1,则它指示启用了MIP。
7.cIdx:值0指示亮度,并且值1和2指示分别是色度分量的Cb和Cr。
8.treeType:指示单树和双树等(SINGLE_TREE:单树,DUAL_TREE_LUMA:用于亮度分量的双树,DUAL_TREE_CHROMA:用于色度分量的双树)
9.tu_cbf_cb[x0][y0]:(x0,y0)位置的内容与第4条中相同。它指示Cb分量的编码块标志(CBF)。如果其值为0,则它意味着在Cb分量的对应变换单元中不存在非零系数,并且如果其值为1,则它指示Cb分量的对应变换单元中存在非零系数。
10.lastSubBlock:它指示最后非零系数所位于的子块(系数组(CG))按照扫描顺序的位置。0指示包含DC分量的子块,并且在大于0的情况下,它不是包含DC分量的子块。
11.lastScanPos:它指示在一个子块内最后有效系数按照扫描顺序所在的位置。如果一个子块包括16个位置,则可以有从0至15的值。
12.lfnst_idx[x0][y0]:要解析的LFNST索引语法元素。如果不解析,则它被推断为值0。也就是说,默认值被设置为0,指示不应用LFNST。
13.LastSignificantCoeffX、LastSignificantCoeffY:它们指示变换块中最后有效系数所位于的x和y坐标。x坐标从0开始并且从左向右增加,以及y坐标从0开始并且从上向下增加。如果两个变量的值都为0,则它意味着最后有效系数位于DC。
14.cu_sbt_flag:指示当前VVC标准中包括的子块变换(SBT)是否被启用的标志。如果标志值为0,则它指示未启用SBT,并且如果标志值为1,则它指示启用了SBT。
15.sps_explicit_mts_inter_enabled_flag、sps_explicit_mts_intra_enabled_flag:分别指示显式MTS是否应用于帧间CU和帧内CU的标志。如果对应的标志值为0,则它指示对帧间CU或帧内CU不启用MTS,如果对应的标志值为1,则它指示启用MTS。
16.tu_mts_idx[x0][y0]:要解析的MTS索引语法元素。如果不解析,则它被推断为值0。也就是说,默认值被设置为0,指示在水平方向和垂直方向二者都启用DCT-2。
如表8所示,在单树的情况下,可以仅使用用于亮度的最后有效系数位置条件来确定是否发信号通知LFNST索引。也就是说,如果最后有效系数的位置不是DC并且最后有效系数存在于左上子块(CG)(例如,4×4块)中,则发信号通知LFNST索引。在这种情况下,在4×4变换块和8×8变换块的情况下,仅当在左上子块中的位置0至7存在最后有效系数时才发信号通知LFNST索引。
在双树的情况下,独立于亮度和色度中的每一个,发信号通知LFNST索引,并且在色度的情况下,可以通过仅将最后有效系数位置条件应用于Cb分量来发信号通知LFNST索引。对于Cr分量,可以不检查对应条件,并且如果Cb的CBF值为0,则可以通过将最后有效系数位置条件应用于Cr分量来发信号通知LFNST索引。
表8的“Min(log2TbWidth,log2TbHeight)>=2”可以表示为“Min(tbWidth,tbHeight)>=4”,而“Min(log2TbWidth,log2TbHeight)>=4”可以表示为“Min(tbWidth,tbHeight)>=16”。
在表8中,log2ZoTbWidth和log2ZoTbHeight分别意味着通过清零可以存在最后有效系数的左上区域以2为底(base-2)的宽度和高度的对数值。
如表8所示,log2ZoTbWidth和log2ZoTbHeight值可以在两个地方被更新。第一个是在解析MTS索引或LFNST索引值之前,第二个是在解析MTS索引之后。
第一次更新是在解析MTS索引(tu_mts_idx[x0][y0])值之前,所以无论MTS索引值如何,都可以设置log2ZoTbWidth和log2ZoTbHeight。
在解析MTS索引之后,对大于0的MTS索引(DST-7/DCT-8组合)设置log2ZoTbWidth和log2ZoTbHeigh。当一次变换中DST-7/DCT-8独立地应用于水平方向和垂直方向中的每一个时,在每个方向上每行或每列可以有多达16个有效系数。也就是说,在应用长度为32或更大的DST-7/DCT-8之后,可以从左或上开始针对每行或每列推导多达16个变换系数。因此,在2D块中,当DST-7/DCT-8应用于水平方向和垂直方向二者时,可以在仅多达16×16的左上区域中存在有效系数。
另外,当在当前一次变换中DCT-2独立地应用于水平方向和垂直方向中的每一个时,在每个方向上每行或每列可以有多达32个有效系数。也就是说,当应用长度为64或更大的DCT-2时,可以从左或上开始针对每行或每列推导多达32个变换系数。因此,在2D块中,当DCT-2应用于水平方向和垂直方向二者时,可以在仅多达32×32的左上区域中存在有效系数。
另外,当对于水平方向和垂直方向在一侧应用DST-7/DCT-8并且在另一侧应用DCT-2时,在在前方向中可以存在16个有效系数,并且在在后方向中可以存在32个有效系数。例如,在64×8变换块的情况下,如果在水平方向应用DCT-2,并且在垂直方向应用DST-7(在应用隐式MTS的情况下可能发生),则可以在多达左上32×8区域中存在有效系数。
如果如表8所示,log2ZoTbWidth和log2ZoTbHeight在两个地方被更新,也就是说,在解析MTS索引之前,last_sig_coeff_x_prefix和last_sig_coeff_y_prefix的范围可以由log2ZoTbWidth和log2ZoTbHeight确定,如下表所示。
[表9]
附加地,在这种情况下,可以通过在last_sig_coeff_x_prefix和last_sig_coeff_y_prefix的二值化过程中反映log2ZoTbWidth和log2ZoTbHeight值来设置last_sig_coeff_x_prefix和last_sig_coeff_y_prefix的最大值。
[表10]
根据示例,在应用ISP模式和LFNST的情况下,当应用表8的信令时,规范文本可以被配置如表11所示。与表8相比,删除了仅在不包括ISP模式的情况下发信号通知LFNST索引的条件(表8中的IntraSubPartitionsSplit[x0][y0]==ISP_NO_SPLIT)。
在单树中,当针对亮度分量(cIdx=0)发送的LFNST索引被重用于色度分量时,针对存在有效系数的第一ISP分区块发送的LFNST索引可以应用于色度变换块。另选地,即使在单树中,也可以与针对亮度分量发信号通知LFNST索引分离地,针对色度分量发信号通知LFNST索引。表11中变量的描述与表8中的相同。
[表11]
根据另一示例,在表11中,当在ISP中允许最后有效系数仅位于所有分区块的DC位置中时,用于解析LFNST索引的条件可以如下变化。
[表12]
根据示例,可以在编码单元级别发信号通知LFNST索引和/或MTS索引。如上所述,LFNST索引可以具有三个值0、1和2,其中0指示不应用LFNST,1和2分别指示所选择的LFNST集中包括两个LFNST核候选中的第一候选和第二候选。通过截短的一元二值化对LFNST索引进行编码,并且值0、1、2可以分别被编码为0、10、11的bin串。
根据示例,可以仅在一次变换中DCT-2应用于水平方向和垂直方向二者时应用LFNST。因此,如果在发信号通知LFNST索引之后发信号通知MTS索引,则可以仅在LFNST索引为0时才发信号通知MTS索引,并且在LFNST索引不为0时可以通过在不发信号通知MTS索引的情况下,将DCT-2应用于水平方向和垂直方向二者,来执行一次变换。
MTS索引可以具有值0、1、2、3和4,其中0、1、2、3和4可以指示DCT-2/DCT-2、DST-7/DST-7、DCT-8/DST-7、DST-7/DCT-8、DCT-8/DCT-8分别应用于水平方向和垂直方向。另外,可以通过截短的一元二值化对MTS索引进行编码,并且值0、1、2、3、4可以分别被编码为0、10、110、1110、1111的bin串。
在编码单元级别发信号通知LFNST索引可以被指示为下表所示。可以在编码单元语法表的后半部分中发信号通知LFNST索引。
[表13]
可以如下表16所示地设置表13中的变量LfnstDcOnly和变量LfnstZeroOutSigCoeffFlag。
变量LfnstDcOnly在对于具有为1的编码块标志(CBF,如果在对应块中存在至少一个有效系数,则等于0,否则,等于0)的变换块,所有最后有效系数都位于DC位置(左上位置)时等于1,否则等于0。具体地,在双树亮度的情况下,对于一个亮度变换块检查最后有效系数的位置,并且在双树色度的情况下,对于Cb的变换块和Cr的变换块二者,检查最后有效系数的位置。在单树的情况下,可以对于亮度、Cb和Cr的变换块检查最后有效系数的位置。
如果在应用LFNST时在清零位置处存在有效系数,则变量LfnstZeroOutSigCoeffFlag等于0,否则等于1。
表13及后续表中包含的lfnst_idx[x0][y0]指示对应编码单元的LFNST索引,而tu_mts_idx[x0][y0]指示对应编码单元的MTS索引。
根据示例,为了在编码单元级别在LFNST索引之后连续编码MTS索引,可以如表14所示地配置编码单元语法表。
[表14]
将表14与表13相比,在用于发信号通知lfnst_idx[x0][y0]的条件中用于检查tu_mts_idx[x0][y0]的值是否为0的条件(即,检查DCT-2是否应用于水平方向和垂直方向二者)改变为用于检查transform_skip_flag[x0][y0]的值是否为0的条件(!transform_skip_flag[x0][y0])。transform_skip_flag[x0][y0]指示编码单元是否是以其中跳过变换的变换跳过模式编码的,并且在MTS索引和LFNST索引之前发信号通知该标志。也就是说,由于在发信号通知tu_mtx_idx[x0][y0]的值之前发信号通知lfnst_idx[x0][y0],因此可以仅检查关于transform_skip_flag[x0][y0]的值的条件。
如表14所示,当编码tu_mts_idx[x0][y0]时检查多个条件,并且如上所述,仅在lfnst_idx[x0][y0]的值为0时才发信号通知tu_mts_idx[x0][y0]。
tu_cbf_luma[x0][y0]是指示对于亮度分量是否存在有效系数的标志,并且cbWidth和cbHeight分别指示亮度分量的编码单元的宽度和高度。
在表14中,(IntraSubPartitionsSplit[x0][y0]==ISP_NO_SPLIT)指示不应用ISP模式,并且(!cu_sbt_flag)指示不应用SBT。
根据表14,当亮度分量的编码单元的宽度和高度二者都为32或更小时,发信号通知tu_mts_idx[x0][y0],也就是说,是否应用MTS由亮度分量的编码单元的宽度和高度来确定。
根据另一示例,当变换块(TU)贴片化(tiling)发生时(例如,当最大变换大小被设置为32时,将64×64的编码单元划分成4个32×32的变换块并编码),可以基于每个变换块的大小来发信号通知MTS索引。例如,当变换块的宽度和高度二者都为32或更小时,可以将相同的MTS索引值应用于编码单元中的所有变换块,由此应用相同的一次变换。另外,当发生变换块贴片化时,表14中的tu_cbf_luma[x0][y0]的值可以是左上变换块的CBF值,或者可以在所有变换块当中的即使一个变换块的CBF值为1时设置为1。
根据示例,当ISP模式应用于当前块时,可以应用LFNST,在该情况下表14可以改变为如表15所示。
[表15]
如表15所示,即使在ISP模式下(IntraSubPartitionsSplitType!=ISP_NO_SPLIT),lfnst_idx[x0][y0]也可以被配置为被发信号通知,并且相同的LFNST索引值可以应用于所有ISP分区块。
此外,如表15所示,由于仅在除ISP模式之外的模式下发信号通知tu_mts_idx[x0][y0],因此MTS索引编码部分与表14中相同。
如表14和表15所示,当在LFNST索引之后立即发信号通知MTS索引时,在执行残差编码时无法知道关于一次变换的信息。也就是说,在残差编码之后发信号通知MTS索引。因此,在残差编码部分中,对于长度为32的DST-7或DCT-8在仅保留16个系数的同时执行清零的部分可以改变为如下表16所示。
[表16]
如表16所示,在确定log2ZoTbWidth和log2ZoTbHeight的过程中(其中log2ZoTbWidth和log2ZoTbHeight分别表示在执行清零之后留下的左上区域的宽度和高度的以2为底的对数值),可以省略检查tu_mts_idx[x0][y0]的值。
可以基于如表10所示的log2ZoTbWidth和log2ZoTbHeight确定表16中last_sig_coeff_x_prefix和last_sig_coeff_y_prefix的二值化。
此外,如表16所示,当在残差编码中确定log2ZoTbWidth和log2ZoTbHeight时,可以添加检查sps_mts_enable_flag的条件。
表10中的TR指示截短的Rice二值化方法,并且可以根据下表描述的方法基于表10中定义的cMax和cRiceParam对最后有效系数信息进行二值化。
[表17]
在另一示例中,编码单元语法表和残差编码语法表如下。
[表18]
[表19]
在表18中,MtsZeroOutSigCoeffFlag初始设置为1,并且在表19的残差编码中可以改变该值。当要通过清零用0填充的区域(LastSignificantCoeffX>15||LastSignificantCoeffY>15)中存在有效系数时,变量MtsZeroOutSigCoeffFlag的值从1变为0,在这种情况下,不发信号通知MTS索引,如表19所示。
根据示例,表18中的MTS索引编码部分可以改变为如下表所示。
[表20]
与表18不同,表20中的变量MtsZeroOutSigCoeffFlag被初始化为0而不是1(MtsZeroOutSigCoeffFlag=0)。当要通过清零用0填充的区域(LastSignificantCoeffX>15||LastSignificantCoeffY>15)中存在有效系数时,变量MtsZeroOutSigCoeffFlag的值保持为0,在这种情况下,不发信号通知MTS索引。
准备以下附图以说明本说明书的具体示例。由于在附图中描述的特定装置的名称或特定信号/消息/字段的名称是通过示例的方式而呈现的,所以本说明书的技术特征不限于在以下附图中使用的特定名称。
图19是示出根据本文档的实施方式的视频解码设备的操作的流程图。
图19中公开的每个步骤基于以上在图2至图18中描述的一些内容。因此,将省略或简化与以上图2至图18中描述的内容重复的特定内容的说明。
根据实施方式,解码设备200可以基于从比特流接收的残差信息执行残差编码,并且具体地可以解析在残差编码级别接收的残差信息,并且可以根据预定扫描顺序布置当前块的变换系数(S1910)。
解码设备200可以从比特流中解码关于当前块的量化变换系数的信息,并且可以基于关于当前块的量化变换系数的信息来推导目标块的量化变换系数。关于目标块的量化变换系数的信息可以合并在序列参数集(SPS)或条带报头中,并且可以包括关于是否应用缩减变换(RST)的信息、关于缩减因子的信息、关于应用缩减变换的最小变换大小的信息、关于应用缩减变换的最大变换大小的信息、以及关于指示包括在变换集中的变换核矩阵和简化逆变换大小中的任意之一的变换索引的信息中的至少一者。
另外,解码设备还可以接收关于当前块的帧内预测模式的信息以及关于ISP是否应用于当前块的信息。解码设备可以通过接收和解析指示是否应用ISP编码或ISP模式的标志信息来推导当前块是否被划分为预定数量的子分区变换块。这里,当前块可以是编码块。另外,解码设备可以通过指示当前块将被划分的方向的标志信息来推导划分的子分区块的大小和数量。
解码设备200可以通过对关于当前块的残差信息(即,量化变换系数)进行解量化来推导变换系数,并且可以根据预定扫描顺序布置推导出的变换系数。
更具体地,推导出的变换系数可以以4×4块为单位根据逆对角扫描顺序布置,并且4×4块内的变换系数也可以根据逆对角扫描顺序布置。也就是说,可以根据在诸如VVC或HEVC之类的视频编解码器中应用的逆扫描顺序来布置已经被执行了解量化的变换系数。
基于该残差信息推导出的变换系数可以是如上所述的解量化变换系数,也可以是量化变换系数。也就是说,变换系数可以是能够检查其是否是当前块中的非零数据的任何数据,而与它是否被量化无关。
解码设备可以通过对量化变换系数应用逆变换来推导残差样本。
如上所述,解码设备可以通过应用作为不可分离的变换的LFNST或作为可分离的变换的MTS来推导残差样本,并且可以分别基于指示LFNST核(即,LFNST矩阵)的LFNST索引和指示MTS核的MTS索引来执行这样的变换。
解码设备可以在编码单元级别接收并解析LFNST索引或MTS索引中的至少一个,并且可以在指示MTS核的MTS索引之前(即,紧接在之前)解析指示LFNST核的LFNST索引(S1920)。
可以根据LFNST索引的特定条件,例如,当LFNST索引为0时,解析MTS索引。
残差编码级别可以包括用于最后有效系数位置信息的语法,并且可以在解析最后有效系数位置信息之后解析LFNST索引。
根据示例,在当前块为亮度块且LFNST索引为0时,可以解析MTS索引。也就是说,在当前块为亮度块时,如果LFNST索引大于0,则可以不解析MTS索引。
根据示例,在当前块的树类型为双树时,可以解析用于亮度块和色度块中的每一个的LFNST索引。
此外,在推导变换系数时,可以推导当前块中通过清零而可以存在最后有效系数的左上区域的宽度和高度,并且可以在解析MTS索引之前推导左上区域的宽度和高度。
此外,可以通过左上区域的宽度和高度来推导最后有效系数的位置,并且可以基于左上区域的宽度和高度来二值化最后有效系数位置信息。
另选地,根据示例,在当前块的树类型是单树类型时,解码设备可以对当前块的亮度块和色度块执行残差编码,然后可以解析LFNST索引。
当在执行残差编码之后在编码单元级别(而不是在变换块级别或残差编码级别)解析LFNST索引时,可以接收在变换过程中需要的清零信息和反映亮度块和色度块的完整变换系数位置的LFNST索引,而不是关于亮度块或色度块的变换系数信息。
在当前块的树类型为双树类型并且对色度分量进行编码时,解码设备可以对色度块的Cb分量和Cr分量执行残差编码,然后可以解析LFNST索引。
当在执行残差编码之后在编码单元级别(而不是在变换块级别或残差编码级别)解析LFNST索引时,可以接收在变换过程中需要的清零信息以及反映色度块的Cb分量和Cr分量的完整变换系数的位置的LFNST索引,而不是关于色度块的Cb分量和Cr分量中的任何一个的变换系数信息。
在当前块被分区为多个子分区块时,解码设备可以对多个子分区块执行残差编码,然后可以解析LFNST索引。
与以上描述类似,当在执行残差编码之后在编码单元级别(而不是在变换块级别或残差编码级别)解析LFNST索引时,可以接收在变换过程中需要的清零信息和反映了所有子分区块的完整变换系数的位置的LFNST索引,而不是关于一些或单独的子分区块的变换系数信息。
根据示例,在当前块被分区为多个子分区块时,可以解析LFNST索引,而与在多个子分区块中的每一个的除了DC位置之外的区域中是否存在变换系数无关。也就是说,如果在ISP应用于当前块时允许最后有效系数仅位于所有子分区块的DC位置中,则可以允许发信号通知LFNST索引。
在残差编码过程中,解码设备可以推导指示在当前块的除了DC位置之外的区域中是否存在变换系数的第一变量,并且可以推导指示在当前块或由当前块分区成的子分区块的除了左上的第一区域之外的第二区域中是否存在变换系数的第二变量。
当在除了DC位置之外的区域中存在变换系数并且在第二区域中不存在变换系数时,解码设备可以解析LFNST索引。
具体地,为了确定是否解析LFNST索引,解码设备可以推导指示在当前块的除了DC位置之外的区域中是否存在变换系数(即,有效系数)的第一变量。
第一变量可以是在残差编码过程中可以推导的变量LfnstDcOnly。在当前块中包含最后有效系数的子块的索引为0且子块中最后有效系数的位置大于0时,第一变量可以被推导为0,并且在第一变量为0时,可以解析LFNST索引。子块是指在残差编码中用作编码单元的4×4块,也可以称为系数组(CG)。子块索引0指示左上4×4子块。
第一变量可以初始设置为1,并且依据在除了DC位置之外的区域中是否存在有效系数,可以保持为1或者可以被改变为0。
变量LfnstDcOnly指示在一个编码单元内的至少一个变换块的非DC分量位置是否存在非零系数,在一个编码单元内的至少一个变换块的非DC分量位置存在非零系数时,可以为0,并且在一个编码单元内的所有变换块的非DC分量位置不存在非零系数时,可以为1。
解码设备可以推导指示在当前块的除了左上的第一区域之外的第二区域中是否存在有效系数的第二变量,由此检查是否已经对第二区域执行了清零。
第二变量可以是可以指示在应用LFNST时执行了清零的变量LfnstZeroOutSigCoeffFlag。第二变量可以初始设置为1,并且当在第二区域中存在有效系数时可以被改变为0。
如果存在最后非零系数的子块的索引大于0且变换块的宽度和高度两者大于或等于4,或如果其中存在最后非零系数的子块中的非零系数的最后位置大于7且变换块的大小为4×4或8×8,则变量LfnstZeroOutSigCoeffFlag可推导为0。子块表示在残差编码的情况下在编码基础上使用的4×4块,并且可以被称为系数组(CG)。当子块的索引不为0时,它指示左上4×4子块。
也就是说,如果在变换块中除了存在LFNST变换系数的左上区域之外的区域中推导出非零系数,或者如果非零系数针对4×4块和8×8块存在于按照扫描顺序的第八个位置之外,则变量LfnstZeroOutSigCoeffFlag被设置为0。
根据示例,当将ISP应用于编码单元时,如果识别出即使对于所有子分区块的一个子分区块,在除了其中可存在LFNST变换系数的位置之外的位置存在变换系数,则可以跳过LFNST索引信令。也就是说,如果在一个子分区块中不执行清零且在第二区域中存在有效系数,则不发信号通知LFNST索引。
此外,可以基于当前块的大小来推导第一区域。
例如,如果当前块的大小是4×4或8×8,则第一区域可以在扫描方向上从当前块的左上位置直到第八样本位置。在当前块被分割时,如果子分区块的大小是4×4或8×8,则第一区域可以在扫描方向上从子分区块的左上位置直到第八样本位置。
如果当前块的大小是4×4或8×8,因为通过正向LFNST输出8条数据,则在解码设备中接收的8个变换系数可以被布置为直到当前块的扫描方向上的第八样本位置,如图11的(a)和图12的(a)所示。
另外,在当前块的大小不是4×4或8×8的情况下,第一区域可以是当前块的左上位置的4×4区域。如果当前块的大小不是4×4或8×8,因为通过正向LFNST输出16条数据,则在解码设备中接收的16个变换系数可以被布置在当前块的左上位置的4×4区域中,如图11的(b)到(d)和图12的(b)所示。
此外,可以根据如图7所示的对角线扫描方向来布置可布置在第一区域中的变换系数。
如上文所描述,当将当前块分割成子分区块时,如果在多个子分区块的所有相应第二区域中不存在变换系数,则解码设备可以解析LFNST索引。如果对于任何一个子分区块,在第二区域中存在变换系数,则不解析LFNST索引。
如上文所描述,可以将LFNST应用于其中宽度和高度大于或等于4的子分区块,并且作为编码块的当前块的LFNST索引可以被应用于多个子分区块。
此外,由于应用LFNST的清零(包括可以涉及应用LFNST的每个清零)也被直接应用于子分区块,所以第一区域也同样被应用于子分区块。也就是说,如果分割的子分区块是4×4块或8×8块,则将LFNST应用于从子分区块的左上位置到扫描方向上的第八变换系数的变换系数,并且如果子分区块不是4×4块或8×8块,则LFNST可以应用于子分区块的左上4×4区域的变换系数。
另外,在残差编码过程中,解码设备可以推导指示在当前块的除左上16×16区域之外的区域中是否存在变换系数的第三变量,并且可以在除了16×16区域之外的区域中不存在变换系数时解析MTS索引。
第三变量可以是可以指示在应用MTS时执行清零的变量MtsZeroOutSigCoeffFlag。变量MtsZeroOutSigCoeffFlag指示在除了执行MTS之后通过清零可以存在最后有效系数的左上区域之外的区域(即,除了左上16×16区域之外的区域)中是否存在变换系数,并且第三变量的值可以初始设置为1并且当在除了左上16×16区域之外的区域中存在变换系数时可以从1改变为0。当第三变量的值为0时,不发信号通知MTS索引。
解码设备可以通过应用基于LFNST索引执行的LFNST或基于MTS索引执行的MTS中的至少一个来推导残差样本(S1930)。
随后,解码设备200可以基于当前块的残差样本和当前块的预测样本生成重构样本(S1940)。
以下附图是为了解释本说明书的具体示例而准备的。由于附图中描述的特定装置的名称或特定信号/消息/字段的名称以示例的方式呈现,因此本说明书的技术特征不限于以下附图中使用的特定名称。
图20是示出根据本文档的实施方式的视频编码设备的操作的流程图。
图20中公开的每个步骤是基于以上图3至图18中描述的一些内容。因此,将省略或简要说明与以上在图3至图18中描述的内容重复的具体内容的解释。
根据实施方式的编码设备100可以基于应用于当前块的帧内预测模式来推导当前块的预测样本(S2010)。
在将ISP应用于当前块的情况下,编码设备可以对每个子分区变换块执行预测。
编码设备可以确定是否向当前块(即,编码块)应用ISP编码或ISP模式,并且根据确定结果可以确定当前块要被划分的方向,并推导要划分的子块的大小和数量。
编码设备100可以基于预测样本推导当前块的残差样本(S2020)。
编码设备100可以通过将LFNST或MTS中的至少一个应用于残差样本来推导当前块的变换系数,并且可以根据预定扫描顺序布置变换系数(S2030)。
可以通过诸如MTS之类的多个变换核执行一次变换,并且在这种情况下,可以基于帧内预测模式选择变换核。
此外,编码设备100可以确定是否对当前块的变换系数执行二次变换或不可分离的变换(具体地,LFNST),并且可以将LFNST应用于变换系数以推导修改的变换系数。
与在垂直方向或水平方向上分离和变换作为变换目标的系数的一次变换不同,LFNST是在无需在特定方向上分离系数的情况下应用变换的不可分离的变换。这样的不可分离的变换可以是仅将变换应用于低频区域而不是作为变换目标的整个目标块的低频不可分离的变换。
当对当前块应用ISP时,编码设备可以确定是否可以将LFNST应用于划分的子分区块的高度和宽度。
编码设备可以确定是否可以将LFNST应用于划分的子分区块的高度和宽度。在这种情况下,解码设备可以在子分区块的高度和宽度等于或大于4时解析LFNST索引。
编码设备可以对指示LFNST核的LFNST索引和指示MTS核的MTS索引中的至少一个进行编码(S2040)。
可以根据LFNST索引的特定条件(例如,当LFNST索引为0时)来对MTS索引进行编码。
根据示例,在当前块为亮度块且LFNST索引指示0时,编码设备可以对MTS索引进行编码。
根据示例,在当前块的树类型为双树时,编码设备可以针对亮度块和色度块中的每一个对LFNST索引进行编码。
根据示例,在推导变换系数时,编码设备可以推导在当前块中通过清零可以存在最后有效系数的左上区域的宽度和高度,可以基于左上区域的宽度和高度来推导最后有效系数位置,并且可以对最后有效系数位置信息进行二值化。
根据示例,可以在发信号通知MTS索引之前,推导左上区域的宽度和高度。
另选地,根据示例,在当前块的树类型是单树类型时,编码设备可以推导当前块的亮度块和色度块的所有变换系数,然后可以在编码单元级别对LFNST索引进行编码。
当推导出所有变换系数之后在编码单元级别(而不是在变换块级别或残差编码级别)对LFNST索引进行编码时,可以对变换过程中需要的清零信息和反映亮度块和色度块的完整变换系数的位置的LFNST索引进行编码,而不是对关于亮度块或色度块的变换系数信息进行编码。
在当前块的树类型为双树类型并且对色度分量进行编码时,编码设备可以推导色度块的Cb分量和Cr分量的所有变换系数,然后可以在编码单元级别对LFNST索引进行编码。
当在推导出所有变换系数之后在编码单元级别(而不是在变换块级别或残差编码级别)对LFNST索引进行编码时,可以对变换过程中需要的清零信息以及反映色度块的Cb分量和Cr分量的完整变换系数的位置的LFNST索引而不是关于色度块的Cb分量和Cr分量中任何一个的变换系数信息进行编码。
在当前块被划分为多个子分区块时,编码设备可以推导出多个子分区块的所有变换系数,然后可以在编码单元级别对LFNST索引进行编码。
与以上的描述类似,当在推导出所有变换系数之后在编码单元级别(而不是在变换块级别或残差编码级别)对LFNST索引进行解析时,可以对变换过程中需要的清零信息和反映所有子分区块的完整变换系数的位置的LFNST索引进行编码,而不是对一些或单独的子分区块的变换系数信息进行编码。
在当前块被分区为多个子分区块时,编码设备可以对LFNST索引进行编码,而与在多个子分区块中的每一个的除了DC位置之类的区域中是否存在变换系数无关。也就是说,如果在将ISP应用于当前块时允许最后有效系数仅位于所有子分区块的DC位置中,则可以允许LFNST索引的信令。
在推导变换系数的过程中,编码设备可以推导指示在当前块的除了DC位置之外的区域中是否存在变换系数的第一变量和指示在当前块的或由当前块分区成的子分区块中的除了左上的第一区域之外的第二区域中是否存在变换系数的第二变量。
当在除了DC位置之外的区域中存在变换系数并且在第二区域中不存在变换系数时,编码设备可以对LFNST索引进行编码。
具体地,第一变量可以是变量LfnstDcOnly,并且在当前块中包含最后有效系数的子块的索引为0且子块中最后有效系数的位置大于0时,可以被推导出为0,并且当第一变量为0时,可以对LFNST索引进行编码。
第一变量可以初始设置为1,并且依据除了DC位置以外的区域中是否存在有效系数,可以保持为1或者可以被改变为0。
变量LfnstDcOnly指示在一个编码单元内的至少一个变换块的非DC分量位置是否存在非零系数,在一个编码单元内的至少一个变换块的非DC分量位置存在非零系数时可以为0,并且在一个编码单元内的所有变换块的非DC分量位置处不存在非零系数时,可以为1。
编码设备可以在执行LFNST之后将不存在修改的变换系数的当前块的第二区域清零,并且可以推导指示在第二区域中是否存在变换系数的第二变量。
如图11和图12所示,可以将当前块的不存在修改的变换系数的其余区域清零。由于这种清零,可以减少执行整个变换过程所需的计算量并减少整个变换过程所需的运算量,从而减少执行变换所需的功耗。此外,可以减少变换过程中需要的延迟,从而增加图像编码效率。
第二变量可以是可以指示在应用LFNST时执行清零的变量LfnstZeroOutSigCoeffFlag。第二变量可以初始设置为1,并且当在第二区域中存在有效系数时可以被改变为0。
当其中存在最后非零系数的子块的索引大于0且变换块的宽度和高度两者等于或大于4时,或当其中存在最后非零系数的子块中的最后非零系数的位置大于7且变换块的大小为4×4或8×8时,变量LfnstZeroOutSigCoeffFlag可以被推导为0。
也就是说,当在变换块中除了可以存在LFNST变换系数的左上区域之外的区域中推导出非零系数时,或者针对4×4块和8×8块在按照扫描顺序的第八个位置之外存在非零系数时,变量LfnstZeroOutSigCoeffFlag被设置为0。
在应用ISP的情况下的第一区域的描述和清零的描述与在解码方法中描述的内容基本上相同,因此将省略冗余描述。
根据示例,编码设备可以在当前块的一次变换中应用MTS时执行清零。编码设备可以执行用0填充当前块或子分区块的除了左上16×16区域之外的区域的清零,并且可以根据指示在清零区域中是否存在变换系数的第三变量来对MTS索引进行编码。
第三变量可以是可以指示在应用MTS时是否执行清零的变量MtsZeroOutSigCoeffFlag。变量MtsZeroOutSigCoeffFlag指示在除了执行MTS之后通过清零可以存在最后有效系数的左上区域之外的区域(即,除了左上16×16区域之外的区域)中是否存在变换系数,并且第三变量的值可以初始设置为1并且可以在除了左上16×16区域之外的区域中存在变换系数时从1被改变为0。当第三变量的值为0时,MTS索引不被编码和发信号通知。
编码设备可以构造和输出图像信息,使得在编码单元级发信号通知LFNST索引和MTS索引中的至少一个并且在发信号通知LFNST索引之后立即发信号通知MTS索引(S2050)。
附加地,编码设备可以通过基于当前块的变换系数或修改的变换系数执行量化,来推导量化变换系数,并且可以对包括关于量化变换系数的信息的图像信息进行编码并输出。
编码设备可以生成包括关于量化变换系数的信息的残差信息。残差信息可以包括上述变换相关信息/语法元素。编码设备可以对包括残差信息的图像/视频信息进行编码,并且可以以比特流的形式输出经编码的图像/视频信息。
更具体地,编码设备可以生成关于量化变换系数的信息,并且可以对关于生成的量化变换系数的信息进行编码。
在本公开中,可以省略量化/解量化和/或变换/逆变换中的至少一者。当省略量化/解量化时,可以将量化变换系数称为变换系数。当省略变换/逆变换时,变换系数可以被称为系数或残差系数,或者为了表述一致性仍可以被称为变换系数。
另外,在本公开中,量化变换系数和变换系数可以分别被称为变换系数和缩放变换系数。在此情况下,残差信息可以包括关于变换系数的信息,并且可以通过残差编码语法发信号通知关于变换系数的信息。可以基于残差信息(或关于变换系数的信息)来推导变换系数,并且可以通过变换系数的逆变换(缩放)来推导缩放变换系数。可以基于缩放变换系数的逆变换(变换)来推导残差样本。这些细节也可以在本公开的其它部分中应用/表达。
在上述实施方式中,借助于一系列步骤或方框基于流程图解释了方法,但是本公开不限于步骤的顺序,并且可以按与上述顺序或步骤不同的顺序或步骤来执行某一步骤,或某一步骤与其它步骤并发地执行。此外,本领域普通技术人员可以理解,流程图中所示的步骤不是排它的,并且在不影响本公开的范围的情况下,可以并入另一步骤或者可以删除流程图中的一个或更多个步骤。
根据本公开的上述方法可以被实现为软件形式,并且根据本公开的编码设备和/或解码设备可以被包括在诸如电视、计算机、智能电话、机顶盒和显示装置等之类的用于图像处理的设备中。
当本公开中的实施方式通过软件来实施时,上述方法可以被实施为用于执行上述功能的模块(步骤、功能等)。这些模块可以存储在存储器中并且可以由处理器执行。存储器可以在处理器内部或外部,并且可以以各种众所周知的方式连接到处理器。处理器可以包括专用集成电路(ASIC)、其它芯片组、逻辑电路和/或数据处理装置。存储器可以包括只读存储器(ROM)、随机存取存储器(RAM)、闪存、存储卡、存储介质和/或其它存储装置。也就是说,本公开中描述的实施方式可以在处理器、微处理器、控制器或芯片上实施和执行。例如,每个附图中所示的功能单元可以在计算机、处理器、微处理器、控制器或芯片上实施和执行。
此外,应用本公开的解码设备和编码设备可以包括在多媒体广播收发器、移动通信终端、家庭影院视频装置、数字影院视频装置、监控相机、视频聊天装置、实时通信装置(诸如视频通信)、移动流装置、存储介质、摄像机、视频点播(VoD)服务提供装置、顶置(OTT)视频装置、互联网流服务提供装置、三维(3D)视频装置、视频电话视频装置、和医疗视频装置,并且可以用于处理视频信号或数据信号。例如,顶置(OTT)视频装置可以包括游戏机、蓝光播放器、互联网接入TV、家庭影院系统、智能电话、平板PC、数字视频记录仪(DVR)等。
另外,应用本公开的处理方法可以以由计算机执行的程序的形式来生产,并且可以存储在计算机可读记录介质中。具有根据本公开的数据结构的多媒体数据也可以存储在计算机可读记录介质中。计算机可读记录介质包括存储计算机可读数据的各种存储装置和分布式存储装置。计算机可读记录介质可以包括例如蓝光盘(BD)、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。此外,计算机可读记录介质包括以载波(例如,互联网上的传输)形式实施的介质。另外,通过编码方法所生成的比特流可以存储在计算机可读记录介质中,或者通过有线或无线通信网络来传输。另外,本公开的实施方式可以通过程序代码被实施为计算机程序产品,并且程序代码可以按照本公开的实施方式在计算机上执行。程序代码可以存储在计算机可读载体上。
图21例示了可应用本公开的视频/图像编码系统的示例。
参照图21,视频/图像编码系统可以包括源装置和接收装置。源装置可以通过数字存储介质或网络以文件或流的形式将编码后的视频/图像信息或数据传递到接收装置。
源装置可以包括视频源、编码设备和发送器。接收装置可以包括接收器、解码设备和渲染器。编码设备可以被称为视频/图像编码设备,并且解码设备可以被称为视频/图像解码设备。发送器可以被包括在编码设备中。接收器可以被包括在解码设备中。渲染器可以包括显示器,并且显示器可以被配置为单独的装置或外部组件。
视频源可以通过捕获、合成或生成视频/图像的处理来获得视频/图像。视频源可以包括视频/图像捕获装置和/或视频/图像生成装置。视频/图像捕获装置可以包括例如一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。视频/图像生成装置可以包括例如计算机、平板计算机和智能电话,并且可以(电子地)生成视频/图像。例如,可以通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可以被生成相关数据的处理取代。
编码设备可以对输入视频/图像进行编码。编码设备可以执行诸如针对压缩和编码效率的预测、变换和量化这样的一系列过程。编码后的数据(编码后的视频/图像信息)可以以比特流的形式输出。
发送器可以通过数字存储介质或网络以文件或流的形式将以比特流的形式输出的编码后的视频/图像信息或数据发送到接收装置的接收器。数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等这样的各种存储介质。发送器可以包括用于通过预定文件格式生成媒体文件的元件,并且可以包括用于通过广播/通信网络进行发送的元件。接收器可以接收/提取比特流,并且将接收/提取的比特流发送到解码设备。
解码设备可以通过执行与编码设备的操作对应的诸如解量化、逆变换、预测等这样的一系列过程来解码视频/图像。
渲染器可以渲染解码后的视频/图像。可以通过显示器显示渲染后的视频/图像。
图22例示了应用本公开的内容流系统的结构。
此外,应用本公开的内容流系统可以大致包括编码服务器、流服务器、web服务器、媒体存储装置、用户设备和多媒体输入装置。
编码服务器用于将从诸如智能电话、相机、摄像机等的多媒体输入装置输入的内容压缩成数字数据以生成比特流,并且向流服务器发送它。作为另一示例,在诸如智能电话、相机、摄像机等的多媒体输入装置直接生成比特流的情况下,可以省略编码服务器。可以通过应用本公开的编码方法或比特流生成方法来生成比特流。并且流服务器可以在发送或接收比特流的过程期间临时存储比特流。
流服务器基于用户的请求通过web服务器向用户装置发送多媒体数据,web服务器用作向用户通知存在什么服务的器具。当用户请求用户想要的服务时,web服务器将请求传送至流服务器,并且流服务器向用户发送多媒体数据。在此而言,内容流系统可以包括单独的控制服务器,并且在这种情况下,控制服务器用于控制内容流系统中的相应装置之间的命令/响应。
流服务器可以从媒体存储装置和/或编码服务器接收内容。例如,在从编码服务器接收内容的情况下,可以实时地接收内容。在这种情况下,为了平稳地提供流服务,流服务器可以存储比特流达预定时间。
例如,用户装置可以包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航仪、板式PC、平板PC、超级本、可穿戴装置(例如,手表型终端(智能手表)、眼镜型终端(智能眼镜)、头戴式显示器(HMD))、数字TV、台式计算机、数字标牌等。内容流系统中的各个服务器可以作为分布式服务器操作,并且在这种情况下,由各个服务器接收到的数据可以用分布式方式进行处理。
本文所公开的权利要求可以以各种方式组合。例如,本公开的方法权利要求的技术特征可以被组合以在设备中实现或执行,并且设备权利要求的技术特征可以被组合以在方法中实现或执行。此外,方法权利要求和设备权利要求的技术特征可以被组合以在设备中实现或执行,并且方法权利要求和设备权利要求的技术特征可以被组合以在方法中实现或执行。

Claims (10)

1.一种用于图像解码的解码设备,所述解码设备包括:
存储器;以及
至少一个处理器,所述至少一个处理器连接到所述存储器,所述至少一个处理器被配置为:
基于预测信息推导当前块的帧内预测模式;
基于所述当前块的所述帧内预测模式推导预测样本;
执行通过解析在残差编码级别接收到的残差信息来根据预定扫描顺序布置所述当前块的变换系数的残差编码;
通过将LFNST或MTS中的至少一个应用于所述变换系数来推导残差样本;并且
基于所述残差样本和所述预测样本生成重构图片,
其中,基于与LFNST核相关的LFNST索引执行所述LFNST,
其中,基于与MTS核相关的MTS索引执行所述MTS,
其中,所述LFNST索引和所述MTS索引是在编码单元级别被发信号通知的,并且
其中,所述MTS索引是在所述LFNST索引被发信号通知之后立即被发信号通知的。
2.根据权利要求1所述的解码设备,其中,基于所述当前块的树类型为单树类型,在执行针对所述当前块的亮度块和色度块的残差编码之后解析所述LFNST索引。
3.根据权利要求1所述的解码设备,其中,基于所述当前块的树类型为双树类型并且对色度分量进行编码,在执行针对色度块的Cb分量和Cr分量的残差编码之后解析所述LFNST索引。
4.根据权利要求1所述的解码设备,其中,基于所述当前块被分区为多个子分区块,在执行针对所述多个子分区块的残差编码之后解析所述LFNST索引。
5.根据权利要求4所述的解码设备,其中,基于所述当前块被分区为所述多个子分区块,与在所述多个子分区块中的每一个的除了DC位置之外的区域中是否存在变换系数无关地解析所述LFNST索引。
6.根据权利要求1所述的解码设备,其中,所述至少一个处理器还被配置为:推导与在所述当前块的除了DC位置之外的区域中是否存在所述变换系数相关的第一变量;以及推导与在所述当前块或由所述当前块分区成的子分区块的除了左上的第一区域之外的第二区域中是否存在所述变换系数相关的第二变量,并且
其中,当在所述除了DC位置之外的区域中存在所述变换系数并且在所述第二区域中不存在所述变换系数时,解析所述LFNST索引。
7.根据权利要求1所述的解码设备,其中,所述至少一个处理器还被配置为:推导与在所述当前块的除了左上16×16区域之外的区域中是否存在所述变换系数相关的第三变量,并且
其中,响应于在除了所述16×16区域之外的区域中不存在所述变换系数的情况,解析所述MTS索引。
8.一种用于图像编码的编码设备,所述编码设备包括:
存储器;以及
至少一个处理器,所述至少一个处理器连接到所述存储器,所述至少一个处理器被配置为:
确定当前块的帧内预测模式;
基于所述当前块的所述帧内预测模式推导所述当前块的预测样本,其中,用于指定所述当前块的所述帧内预测模式的预测信息被编码到比特流中;
基于所述预测样本推导所述当前块的残差样本;
执行通过将LFNST或MTS中的至少一个应用于所述残差样本来推导所述当前块的变换系数并且根据预定扫描顺序布置所述变换系数的变换系数推导操作;
对与LFNST核相关的LFNST索引或与MTS核相关的MTS索引中的至少一者进行编码;并且
构造并输出图像信息,使得在编码单元级别发信号通知所述LFNST索引和所述MTS索引并且在发信号通知所述LFNST索引之后立即发信号通知所述MTS索引。
9.一种计算机可读数字存储介质,所述计算机可读数字存储介质存储通过根据权利要求8所述的编码设备生成的比特流。
10.一种用于发送用于图像的数据的设备,所述设备包括:
至少一个处理器,所述至少一个处理器被配置为获得比特流,其中,所述比特流是通过以下生成的:确定当前块的帧内预测模式;基于所述当前块的所述帧内预测模式推导所述当前块的预测样本,其中,用于指定所述当前块的所述帧内预测模式的预测信息被编码到所述比特流中;基于所述预测样本推导所述当前块的残差样本;执行通过将LFNST或MTS中的至少一个应用于所述残差样本来推导所述当前块的变换系数并且根据预定扫描顺序布置所述变换系数的变换系数推导操作;对与LFNST核相关的LFNST索引或与MTS核相关的MTS索引中的至少一者进行编码;以及构造并输出图像信息,使得在编码单元级别发信号通知所述LFNST索引和所述MTS索引并且在发信号通知所述LFNST索引之后立即发信号通知所述MTS索引;以及
发送器,所述发送器被配置为发送包括所述图像信息的所述比特流的所述数据。
CN202310620110.7A 2019-10-04 2020-10-05 图像编码设备、图像解码设备及其存储介质和发送设备 Pending CN116600115A (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US201962911185P 2019-10-04 2019-10-04
US62/911,185 2019-10-04
US201962911951P 2019-10-07 2019-10-07
US62/911,951 2019-10-07
PCT/KR2020/013459 WO2021066598A1 (ko) 2019-10-04 2020-10-05 변환에 기반한 영상 코딩 방법 및 그 장치
CN202080079999.7A CN114731436B (zh) 2019-10-04 2020-10-05 基于变换的图像编码方法及其设备

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN202080079999.7A Division CN114731436B (zh) 2019-10-04 2020-10-05 基于变换的图像编码方法及其设备

Publications (1)

Publication Number Publication Date
CN116600115A true CN116600115A (zh) 2023-08-15

Family

ID=75338424

Family Applications (4)

Application Number Title Priority Date Filing Date
CN202310619854.7A Pending CN116418982A (zh) 2019-10-04 2020-10-05 图像编码方法、图像解码方法及其存储介质和发送方法
CN202310620110.7A Pending CN116600115A (zh) 2019-10-04 2020-10-05 图像编码设备、图像解码设备及其存储介质和发送设备
CN202310620600.7A Pending CN116437085A (zh) 2019-10-04 2020-10-05 图像编码设备、图像解码设备及其存储介质和发送设备
CN202080079999.7A Active CN114731436B (zh) 2019-10-04 2020-10-05 基于变换的图像编码方法及其设备

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202310619854.7A Pending CN116418982A (zh) 2019-10-04 2020-10-05 图像编码方法、图像解码方法及其存储介质和发送方法

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN202310620600.7A Pending CN116437085A (zh) 2019-10-04 2020-10-05 图像编码设备、图像解码设备及其存储介质和发送设备
CN202080079999.7A Active CN114731436B (zh) 2019-10-04 2020-10-05 基于变换的图像编码方法及其设备

Country Status (10)

Country Link
US (2) US11516484B2 (zh)
EP (1) EP4017010A4 (zh)
JP (2) JP7436645B2 (zh)
KR (1) KR20220050967A (zh)
CN (4) CN116418982A (zh)
AU (2) AU2020360013B2 (zh)
BR (1) BR122023020352A2 (zh)
CA (1) CA3156849A1 (zh)
MX (1) MX2022003998A (zh)
WO (1) WO2021066598A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021052804A1 (en) * 2019-09-16 2021-03-25 Interdigital Vc Holdings France, Sas Secondary transform for fast video encoder
EP4024870A4 (en) * 2019-09-21 2022-11-02 LG Electronics Inc. TRANSFORMATION-BASED IMAGE CODING METHOD AND APPARATUS THEREOF
US20220353504A1 (en) * 2019-09-23 2022-11-03 Lg Electronics Inc. Image coding method based on transform, and device therefor
US20210321137A1 (en) * 2020-03-30 2021-10-14 Qualcomm Incorporated Low-frequency non-separable transform index signaling in video coding
WO2023080691A1 (ko) * 2021-11-03 2023-05-11 주식회사 윌러스표준기술연구소 비디오 신호 처리 방법 및 이를 위한 장치
WO2024011370A1 (zh) * 2022-07-11 2024-01-18 Oppo广东移动通信有限公司 视频图像处理方法及装置、编解码器、码流、存储介质

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140018873A (ko) * 2011-04-07 2014-02-13 엘지전자 주식회사 영상 정보 부호화 방법 및 복호화 방법
CN104488270B (zh) * 2012-06-29 2018-05-18 韩国电子通信研究院 一种利用解码设备的视频解码方法
US10491922B2 (en) * 2015-09-29 2019-11-26 Qualcomm Incorporated Non-separable secondary transform for video coding
US10708164B2 (en) * 2016-05-03 2020-07-07 Qualcomm Incorporated Binarizing secondary transform index
WO2018049594A1 (en) * 2016-09-14 2018-03-22 Mediatek Inc. Methods of encoder decision for quad-tree plus binary tree structure
US10880564B2 (en) * 2016-10-01 2020-12-29 Qualcomm Incorporated Transform selection for video coding
US10638126B2 (en) * 2017-05-05 2020-04-28 Qualcomm Incorporated Intra reference filter for video coding
US10567801B2 (en) * 2018-03-07 2020-02-18 Tencent America LLC Method and apparatus for video coding with primary and secondary transforms
CN116366844A (zh) * 2018-03-09 2023-06-30 韩国电子通信研究院 使用样点滤波的图像编码/解码方法和设备
US11317085B2 (en) * 2018-03-30 2022-04-26 Vid Scale, Inc. Template-based inter prediction techniques based on encoding and decoding latency reduction
US10834393B2 (en) * 2018-09-10 2020-11-10 Tencent America LLC Intra interpolation filter for multi-line intra prediction
KR101997604B1 (ko) * 2019-01-22 2019-07-08 에스케이 텔레콤주식회사 영상 부호화/복호화 방법 및 장치
US11991393B2 (en) * 2019-04-16 2024-05-21 Hfi Innovation Inc. Methods and apparatuses for coding video data with secondary transform
GB2585030A (en) * 2019-06-25 2020-12-30 British Broadcasting Corp Method of signalling in a video codec

Also Published As

Publication number Publication date
CN116437085A (zh) 2023-07-14
CN114731436B (zh) 2023-06-16
US20230049623A1 (en) 2023-02-16
EP4017010A1 (en) 2022-06-22
CA3156849A1 (en) 2021-04-08
AU2024203027A1 (en) 2024-05-23
JP7436645B2 (ja) 2024-02-21
KR20220050967A (ko) 2022-04-25
JP2022550867A (ja) 2022-12-05
EP4017010A4 (en) 2022-11-16
WO2021066598A1 (ko) 2021-04-08
AU2020360013B2 (en) 2024-02-08
BR122023020352A2 (pt) 2024-02-27
CN116418982A (zh) 2023-07-11
JP2024036659A (ja) 2024-03-15
MX2022003998A (es) 2022-04-26
CN114731436A (zh) 2022-07-08
US11516484B2 (en) 2022-11-29
AU2020360013A1 (en) 2022-05-26
US20220217364A1 (en) 2022-07-07

Similar Documents

Publication Publication Date Title
CN114731434B (zh) 基于变换的图像编码方法及其装置
CN114731436B (zh) 基于变换的图像编码方法及其设备
CN114846798B (zh) 用于基于变换的图像编码的方法及其设备
CN114667735B (zh) 基于变换的图像编译方法及其设备
CN116916023A (zh) 图像解码和编码方法、存储介质及发送方法
CN114762342B (zh) 基于变换的图像编码方法及其装置
CN114747220B (zh) 基于变换的图像编码方法及其设备
CN114651446B (zh) 基于变换的图像编译方法及其装置
CN114762343B (zh) 基于变换的图像编码方法及其装置
CN114651445B (zh) 基于变换的视频编码方法及其装置
CN114600465B (zh) 基于变换的图像编码方法及其装置
CN114747221B (zh) 基于变换的图像编码方法及其装置
CN114762338B (zh) 基于变换的图像编码方法及其装置
CN114762344B (zh) 基于变换的图像编码方法及其装置
CN114762341B (zh) 用于基于变换的图像编码的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination