CN111742555B - 对视频信号进行编码/解码的方法及其设备 - Google Patents

对视频信号进行编码/解码的方法及其设备 Download PDF

Info

Publication number
CN111742555B
CN111742555B CN201980014404.7A CN201980014404A CN111742555B CN 111742555 B CN111742555 B CN 111742555B CN 201980014404 A CN201980014404 A CN 201980014404A CN 111742555 B CN111742555 B CN 111742555B
Authority
CN
China
Prior art keywords
transform
block
quadratic
current block
mts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201980014404.7A
Other languages
English (en)
Other versions
CN111742555A (zh
Inventor
具文模
M·萨勒海法尔
金昇焕
林宰显
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Priority to CN202210950690.1A priority Critical patent/CN115484463A/zh
Priority to CN202210949304.7A priority patent/CN115514973A/zh
Priority to CN202210949305.1A priority patent/CN115514974A/zh
Publication of CN111742555A publication Critical patent/CN111742555A/zh
Application granted granted Critical
Publication of CN111742555B publication Critical patent/CN111742555B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Abstract

本发明的实施方式提供了一种对视频信号进行处理的方法和设备。具体地,根据本发明的实施方式的一种对视频信号进行解码的方法可以包括以下步骤:基于当前块的帧内预测模式从预定义的二次变换集中确定要应用于所述当前块的二次变换集;从所确定的二次变换集中获取指示要应用于所述当前块的二次变换矩阵的第一语法元素;使用所述第一语法元素所指定的二次变换矩阵以对所述当前块的左上区域执行二次逆变换,从而导出二次逆变换后的块;以及使用所述当前块的一次变换矩阵以对所述二次逆变换后的块执行一次逆变换,从而导出所述当前块的残差块。

Description

对视频信号进行编码/解码的方法及其设备
技术领域
本公开涉及对图像信号进行处理的方法和设备,并且具体地,涉及通过执行变换对图像信号进行编码或解码的方法和设备。
背景技术
压缩编码是指用于通过通信线路发送数字化信息或将其以适当形式存储在存储介质中的信号处理技术。诸如视频、图像和音频这样的媒体可以是压缩编码的对象,并且具体地,对图像执行压缩编码的技术被称为视频图像压缩。
下一代视频内容将具有高空间分辨率、高帧速率和高维度场景呈现的特征。为了处理这样的内容,存储器存储、存储器访问速率和处理能力将显著增加。
因此,必须设计用于更高效地处理下一代视频内容的编码工具。特别地,在高效视频编码(HEVC)标准之后的视频编解码器标准需要将空间域视频信号变换成频域信号的高效变换技术连同具有更高精度的预测技术。
发明内容
技术问题
本公开的实施方式提供了向当前块应用适当变换的图像信号处理方法和设备。
本公开所解决的技术问题不限于以上的技术问题,并且对于本领域技术人员而言,本文中未描述的其它技术问题将根据下面的描述而变得显而易见。
技术方案
在本公开的一方面,一种对视频信号进行解码的方法可以包括以下步骤:在基于当前块的帧内预测模式的预定义的二次变换集当中确定应用于所述当前块的二次变换集;获取指示所确定的二次变换集中的应用于所述当前块的二次变换矩阵的第一语法元素;通过使用所述第一语法元素所指定的二次变换矩阵对所述当前块的左上区域执行二次逆变换来导出二次逆变换后的块;以及通过使用所述当前块的一次变换矩阵对所述二次逆变换后的块执行一次逆变换来导出所述当前块的残差块。
优选地,所述预定义的二次变换集中的每一个可以包括两个二次变换矩阵。
导出所述二次逆变换后的块的步骤可以包括以下步骤:包括基于所述当前块的宽度和高度来确定所述二次逆变换的输入长度和输出长度。
优选地,如果所述当前块的宽度和高度等于4,则所述不可分变换的输入长度可以等于8并且所述输出长度可以等于16。
优选地,所述方法还可以包括以下步骤:对指示应用于所述当前块的一次变换的一次变换矩阵的第二语法元素进行解析;以及基于所述第二语法元素来确定是否能够对所述当前块应用二次变换。
优选地,如果所述第二语法元素指示预定义的特定变换类型,则可以通过确定能够对所述当前块应用二次变换来执行确定是否能够应用所述二次变换。
优选地,所述预定义的特定变换类型可以被限定为DCT2。
在本公开的另一方面,一种对视频信号进行解码的设备包括:存储器,该存储器用于存储所述视频信号;以及处理器,该处理器联接到所述存储器,并且所述处理器可以被配置为:在基于当前块的帧内预测模式的预定义的二次变换集当中确定应用于所述当前块的二次变换集;获取指示所确定的二次变换集中的应用于所述当前块的二次变换矩阵的第一语法元素;通过使用所述第一语法元素所指定的二次变换矩阵对所述当前块的左上区域执行二次逆变换来导出二次逆变换后的块;并且通过使用所述当前块的一次变换矩阵对所述二次逆变换后的块执行一次逆变换来导出所述当前块的残差块。
有益效果
根据本公开的实施方式,能够通过确定和应用适于当前块的变换来提高变换效率。
另外,根据本公开的实施方式,通过高效地设计用于一次变换和二次变换的变换,能改善计算复杂度并且能提高压缩性能。
此外,根据本公开的实施方式,通过限制应用二次变换的一次变换的变换核,能显著地改善计算复杂度。
本公开的效果不限于上述效果,并且根据以下描述,本文中没有描述的其它效果对于本领域的技术人员将变得明显。
附图说明
为了帮助理解本公开而被包括在本文中作为说明书的一部分的附图提供了本公开的实施方式,并且通过以下描述来描述本公开的技术特征。
图1示出了作为应用本公开的实施方式的视频编码系统的示例。
图2是作为应用本公开的实施方式的对视频/图像信号进行编码的编码设备的示意性框图。
图3是作为应用本公开的实施方式的对图像信号进行解码的解码设备的示意性框图。
图4是作为应用本公开的实施方式的内容流传输系统的配置示图。
图5示出了适用本公开的实施方式,图5a是用于描述根据QT(四叉树)的块分割结构的示图,图5b是用于描述根据BT(二叉树)的块分割结构的示图,并且图5c是用于描述根据TT(三叉树)的块分割结构的示图。
图6和图7示出了应用本公开的实施方式,图6是编码设备中的变换和量化单元以及反量化和逆变换单元的示意性框图,并且图7是解码设备中的反量化和逆变换单元的示意性框图。
图8是示出了执行自适应多重变换(AMT)的过程的流程图。
图9是示出了执行AMT的解码过程的流程图。
图10是示出了根据本公开的实施方式的基于MTS的逆变换过程的流程图。
图11是根据本公开的实施方式的基于MTS执行解码的设备的框图。
图12和图13是示出了作为应用了本公开的实施方式的应用二次变换的编码/解码的流程图。
图14和图15示出了应用本公开的实施方式,图14是用于描述吉文斯旋转(Givensrotation)的示图,并且图15示出了由吉文斯旋转层和置换构成的4×4不可分二次变换(NSST)中的一轮的配置。
图16示出了作为应用本公开的实施方式的简化二次变换(RST)的操作。
图17是示出了作为应用本公开的实施方式的以反向扫描顺序从第六十四系数至第十七系数执行反向扫描的过程的示图。
图18例示了作为应用本公开的实施方式的使用单变换指示符(STI)进行的编码的示例性流程图。
图19例示了作为应用本公开的实施方式的使用联合变换指示符(UTI)进行的编码的示例性流程图。
图20a和图20b例示了作为应用本公开的实施方式的使用UTI进行的编码的两个示例性流程图。
图21是示出了作为应用本公开的实施方式的用于执行变换的编码的示例性流程图。
图22是示出了作为应用本公开的实施方式的用于执行变换的解码的示例性流程图。
图23是示出了作为应用本公开的实施方式的编码设备100中的变换单元120的示例的详细框图。
图24是示出了作为应用本公开的实施方式的解码设备200中的逆变换单元230的示例的详细框图。
图25是作为应用本公开的实施方式的对视频信号进行处理的流程图。
图26是作为应用本公开的实施方式的对视频信号进行处理的设备的示例性框图。
图27是示出了根据应用本公开的实施方式的对视频信号进行变换的方法的流程图。
图28是作为应用本公开的实施方式的对视频信号进行处理的设备的示例性框图。
具体实施方式
参照附图来更详细地描述本公开的一些实施方式。将连同附图一起公开的详细描述旨在描述本公开的一些示例性实施方式,而不旨在描述本公开的唯一实施方式。以下的详细描述包括更多细节,以提供对本公开的完全理解。然而,本领域的技术人员应该理解,本公开可以在没有这些细节的情况下实现。
在一些情况下,为了避免本公开的概念模糊,已知结构和装置被省略,或者可基于各个结构和装置的核心功能以框图形式示出。
虽然在本公开中使用的大多数术语已选自本领域中广泛使用的通用术语,但是一些术语已由申请人任意地选择,并且在下面的描述中将根据需要详细地解释它们的含义。因此,应该基于术语的本意而非它们的简单名称或含义来理解本公开。
以下描述中所使用的具体术语被提供以帮助理解本公开,并且在不脱离本公开的技术精神的范围的情况下,这些具体术语的使用可以被改变为各种形式。例如,可以在每个编码过程中适当地替换和解释信号、数据、样本、图片、帧、块等。
在本说明书中,“处理单元”是指在其中执行诸如预测、变换和/或量化这样的编码/解码过程的单元。另外,处理单元可以被解释为包括用于亮度分量的单元和用于色度分量的单元的含义。例如,处理单元可以与块、编码单元(CU)、预测单元(PU) 或变换单元(TU)对应。
另外,处理单元可以被解释为包括用于亮度分量的单元或用于色度分量的单元。例如,处理单元可以与用于亮度分量的编码树块(CTB)、编码块(CB)、PU或变换块(TB)对应。另外,处理单元可以与用于色度分量的CTB、CB、PU或TB对应。此外,处理单元不限于此,并且可以被解释为包括用于亮度分量的单元和用于色度分量的单元的含义。
另外,处理单元不一定限于方形块,并且可以被配置为具有三个或更多个顶点的多边形形状。
此外,在本说明书中,像素被称为样本。另外,使用样本可以意指使用像素值等。
图1示出了作为应用本公开的实施方式的视频编码系统的示例。
视频编码系统可以包括源装置10和接收装置20。源装置10可以通过数字存储介质或网络以文件或流传输的形式将编码后的视频/图像信息或数据发送到接收装置20。
源装置10可以包括视频源11、编码设备12和发送器13。接收装置20可以包括接收器、解码设备22和渲染器23。编码设备12可以被称为视频/图像编码设备,并且解码设备20可以被称为视频/图像解码设备。发送器13可以被包括在编码设备12中。接收器21可以被包括在解码设备22中。渲染器23可以包括显示器,并且显示器可以被配置为单独装置或外部组件。
视频源可以通过视频/图像捕获、组合或生成过程来获取视频/图像。视频源可以包括视频/图像捕获装置和/或视频/图像生成装置。视频/图像捕获装置可以包括例如一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。视频/图像生成装置可以包括例如计算机、平板计算机和智能电话等,并且(电子地)生成视频/图像。例如,可以通过计算机等来生成虚拟视频/图像,并且在这种情况下,可以用相关数据生成过程来替换视频/图像捕获过程。
编码设备12可以对输入视频/图像进行编码。编码设备12可以为了压缩和编码效率而执行诸如预测、变换和量化这样的一系列过程。编码后的数据(编码后的视频/ 图像信息)可以以比特流的形式输出。
发送器13可以通过数字存储介质或网络将以比特流的形式输出的编码后的视频/图像信息或数据以文件或流传输的形式发送到接收装置的接收器。数字存储介质可以包括诸如USB、SD、CD、DVD、Blueray、HDD和SSD这样的各种存储介质。发送器 13可以包括用于通过预定的文件格式生成媒体文件的元件以及用于通过广播/通信网络进行发送的元件。接收器21可以提取比特流,并且将该比特流发送到解码设备22。
解码设备22可以通过执行与编码设备12的操作对应的诸如反量化、逆变换和预测这样的一系列过程对视频/图像进行解码。
渲染器23可以渲染解码后的视频/图像。渲染后的视频/图像可以通过显示器显示。
图2是作为应用本公开的实施方式的对视频/图像信号进行编码的编码设备的示意性框图。编码设备100可以与图1的编码设备12对应。
图像分割单元110可以将输入到编码设备100的输入图像(或图片或帧)分割成一个或更多个处理单元。例如,处理单元可以被称为编码单元(CU)。在这种情况下,可以根据四叉树二叉树(QTBT)结构从编码树单元(CTU)或最大编码单元(LCU) 递归地分割编码单元。例如,可以基于四叉树结构和/或二叉树结构将单个编码单元分割成深度较深的多个编码单元。在这种情况下,可以首先应用四叉树结构,然后可以应用二叉树结构。另选地,可以首先应用二叉树结构。可以基于不再被分割的最终编码单元来执行根据本公开的编码过程。在这种情况下,最大编码单元可以被直接用作最终编码单元,或者编码单元可以被递归地分割成深度较深的编码单元,并且可以根据图像特性基于编码效率在必要时使用具有最佳大小的编码单元作为最终编码单元。这里,编码过程可以包括随后将描述的诸如预测、变换和重构这样的过程。另选地,处理单元还可以包括预测单元(PU)或变换单元(TU)。在这种情况下,可以从以上提到的最终编码单元分割或划分预测单元和变换单元。预测单元可以是样本预测的单元,并且变换单元可以是导出变换系数的单元和/或根据变换系数导出残差信号的单元。
单元可以与术语“块”或“区域”可互换地使用。通常,M×N块表示M列和N行中的样本或变换系数的集合。样本通常可以表示像素或像素值,并且可以仅表示亮度分量的像素/像素值或者仅表示色度分量的像素/像素值。样本可以被用作与图片(图像)、像素或图素对应的术语。
编码设备100可以通过从输入的视频信号(原始块或原始样本阵列)中减去从帧间预测单元180或帧内预测单元185输出的预测信号(预测块或预测样本阵列)来生成残差信号(残差块或残差样本阵列),并且所生成的残差信号被发送到变换单元120。在这种情况下,如所示出的,编码器100中的从输入的视频信号(原始块或原始样本阵列)中减去预测信号(预测块或预测样本阵列)的单元可以称为减法器115。预测器可以对处理目标块(下文中,被称为当前块)执行预测,并且生成包括相对于当前块的预测样本的预测块。预测器可以确定向当前块或CU的单元应用帧内预测还是帧间预测。预测器可以生成诸如预测模式信息这样的关于预测的各种类型的信息,并且将该信息发送到熵编码单元190,如随后在对每种预测模式的描述中描述的。关于预测的信息可以在熵编码单元190中被编码并且以比特流的形式被输出。
帧内预测单元185可以参考当前图片中的样本来预测当前块。所参考的样本可以与当前块邻近或者可以根据预测模式与其分开。在帧内预测中,预测模式可以包括多种非定向模式和多种定向模式。非定向模式可以包括例如DC模式和平面模式。根据预测方向的详细程度,定向模式可以包括例如33种定向预测模式或65种定向预测模式。然而,这是示例性的,并且根据设置,可以使用等于或大于65或等于或小于33 的多种定向预测模式。帧内预测单元185可以使用应用于邻近块的预测模式来确定要应用于当前块的预测模式。
帧间预测单元180可以基于参考图片上的运动向量所指定的参考块(参考样本阵列)来导出关于当前块的预测块。这里,为了减少在帧间预测模式下发送的运动信息的数量,可以基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单元预测运动信息。运动信息可以包括运动向量和参考图片索引。运动信息还可以包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括当前图片中存在的空间邻近块和参考图片中存在的时间邻近块。包括参考块的参考图片可以与包括时间邻近块的参考图片相同或不同。时间邻近块可以被称为并置参考块或并置CU(colCU),并且包括时间邻近块的参考图片可以被称为并置图片 (colPic)。例如,帧间预测单元180可以基于邻近块来形成运动信息候选列表,并且生成指示哪个候选被用于导出当前块的运动向量和/或参考图片索引的信息。可以基于各种预测模式来执行帧间预测,并且在跳跃模式和合并模式的情况下,帧间预测单元180可以将邻近块的运动信息用作当前块的运动信息。在跳跃模式的情况下,可以与合并模式不同地发送残差信号。在运动向量预测(MVP)模式的情况下,可以通过使用邻近块的运动向量作为运动向量预测项并发信号通知运动向量差来指示当前块的运动向量。
通过帧间预测单元180或帧内预测单元185生成的预测信号可以被用于生成重构信号或残差信号。
变换单元120可以通过向残差信号应用变换技术来生成变换系数。例如,变换技术可以包括DCT(离散余弦变换)、DST(离散正弦变换)、KLT(Karhunen-Loeve变换)、GBT(基于图的变换)和CNT(有条件非线性变换)中的至少一种。本文中, GBT是指从表示关于像素之间的关系的信息的图获得的变换。CNT是指基于使用所有先前重构的像素生成的预测信号而获得的变换。另外,可以向大小相同的正方形像素块应用变换过程或者向大小可变的非正方形块应用变换过程。
量化单元130可以对变换系数进行量化并且将量化后的变换系数发送到熵编码单元190,并且熵编码单元190可以对量化后的信号(关于量化后的变换系数的信息)进行编码并且将编码后的信号作为比特流输出。关于量化后的变换系数的信息可以被称为残差信息。量化单元130可以基于系数扫描顺序将块形式的量化后的变换系数重新布置为一维向量的形式,并且基于一维向量形式的量化后的变换系数来生成关于量化后的变换系数的信息。例如,熵编码单元190可以执行诸如指数Golomb、CAVLC(上下文自适应可变长度编码)和CABAC(上下文自适应二进制算术编码)这样的各种编码方法。熵编码单元190可以将视频/图像重构所需的信息(例如,语法元素的值等) 与量化后的变换系数一起或与其分开地进行编码。编码后的信息(例如,视频/图像信息)可以以网络抽象层(NAL)为单元以比特流的形式进行发送或存储。可以通过网络发送比特流,或者将其存储在数字存储介质中。这里,网络可以包括广播网络和 /或通信网络,并且数字存储介质可以包括诸如USB、SD、CD、DVD、Blueray、HDD 和SSD这样的各种存储介质。发送从熵编码单元190输出的信号的发送器(未示出) 和/或存储该信号的存储器(未示出)可以被配置为编码设备100的内部/外部元件,并且发送器可以是熵编码单元190的组件。
从量化单元130输出的量化后的变换系数可以被用于生成预测信号。例如,可以通过环路中的反量化单元140和逆变换单元150对量化后的变换系数应用反量化和逆变换来重构残差信号。加法器155可以将重构后的残差信号与从帧间预测单元180或帧内预测单元185输出的预测信号相加,使得可以生成重构信号(重构图片、重构块或重构样本阵列)。当如在应用跳跃模式的情况下一样没有相对于处理目标块的残差时,预测块可以被用作重构块。加法器155也可以被称为重构单元或重构块生成器。所生成的重构信号可以被用于当前图片中的下一处理目标块的帧内预测,或者被用于通过随后将描述的滤波的下一图片的帧间预测。
滤波单元160可以通过向重构信号应用滤波来改善主观/客观图片质量。例如,滤波单元160可以通过向重构图片应用各种滤波方法来生成修改后的重构图片,并且将修改后的重构图片发送到解码图片缓冲器170。所述各种滤波方法可以包括例如去块滤波、样本自适应偏移、自适应环路滤波和双边滤波。滤波单元160可以生成关于滤波的各种类型的信息,并且将该信息发送到熵编码单元190,如随后在对每种滤波方法的描述中所描述的。关于滤波的信息可以在熵编码单元190中被编码并且以比特流的形式输出。
发送到解码图片缓冲器170的修改后的重构图片可以在帧间预测单元180中被用作参考图片。因此,当应用帧间预测时,编码设备可以避免编码设备100与解码设备之间的失配并且提高编码效率。
解码图片缓冲器170可以存储修改后的重构图片,使得在帧间预测单元180中将修改后的重构图片用作参考图片。
图3是作为应用本公开的实施方式的对视频信号执行解码的解码设备的示意性框图。图3的解码设备200与图1的解码设备22对应。
参照图3,解码设备200可以包括熵解码单元210、反量化单元220、逆变换单元230、加法器235、滤波单元240、解码图片缓冲器(DPB)250、帧间预测单元260和帧内预测单元265。帧间预测单元260和帧内预测单元265可以被统称为预测器。即,预测器可以包括帧间预测单元180和帧内预测单元185。反量化单元220和逆变换单元230可以被统称为残差处理器。即,残差处理器可以包括反量化单元220和逆变换单元230。根据实施方式,以上提到的熵解码单元210、反量化单元220、逆变换单元230、加法器 235、滤波单元240、帧间预测单元260和帧内预测单元265可以被配置为单个硬件组件 (例如,解码器或处理器)。另外,根据实施方式,解码图片缓冲器250可以被配置为单个硬件组件(例如,存储器或数字存储介质)。
当输入包括视频/图像信息的比特流时,解码设备200可以通过与在图2的编码设备100中处理视频/图像信息的过程对应的过程来重构图像。例如,解码设备200可以使用在编码设备100中应用的处理单元来执行解码。因此,解码的处理单元可以是例如编码单元,并且可以根据四叉树结构和/或二叉树结构从编码树单元或最大编码单元中分割出编码单元。另外,可以通过再现设备来再现由解码设备200解码并输出的重构视频信号。
解码设备200可以以比特流的形式接收从图2的编码设备100输出的信号,并且可以通过熵解码单元210对接收到的信号进行解码。例如,熵解码单元210可以对比特流进行解析,以导出图像重构(或图片重构)所需的信息(例如,视频/图像信息)。例如,熵解码单元210可以基于诸如指数Golomb、CAVLC或CABAC这样的编码方法对比特流中的信息进行解码,并且输出图像重构所需的语法元素值和相对于残差的变换系数的量化后的值。更具体地,CABAC熵解码方法接收与比特流中的每个语法元素对应的bin,使用解码目标语法元素信息以及邻近和解码目标块的解码信息或者关于先前阶段中解码的符号/bin的信息来确定上下文模型,根据所确定的上下文模型来预测bin生成概率并且对bin执行算术解码以生成与每个语法元素值对应的符号。这里, CABAC熵解码方法可以在确定上下文模型之后,使用关于针对下一符号/bin上下文模型解码的符号/bin的信息来更新上下文模型。在熵解码单元210中被解码的信息当中的关于预测的信息可以被提供到预测器(帧间预测单元260和帧内预测单元265),并且已经在熵解码单元210中被执行熵解码的残差值(即,量化后的变换系数)和相关参数信息可以被输入到反量化单元220。另外,在熵解码单元210中被解码的信息当中的关于滤波的信息可以被提供到滤波单元240。此外,接收从编码设备100输出的信号的接收器(未示出)可以被附加地配置为解码设备200的内部/外部元件,或者接收器可以是熵解码单元210的组件。
反量化单元220可以对量化后的变换系数进行反量化,以输出变换系数。反量化单元220可以将量化后的变换系数重新布置为二维块的形式。在这种情况下,可以在编码设备100中基于系数扫描顺序来执行重新布置。反量化单元220可以使用量化参数 (例如,量化步长信息)对量化后的变换系数执行反量化,并且获取变换系数。
逆变换单元230对变换系数进行逆变换,以获得残差信号(残差块或残差样本阵列)。
预测器可以对当前块执行预测,并且生成包括相对于当前块的预测样本的预测块。预测器可以基于从熵解码单元210输出的关于预测的信息来确定向当前块应用帧内预测还是帧间预测,并且确定特定的帧内/帧间预测模式。
帧内预测单元265可以参考当前图片中的样本来预测当前块。所参考的样本可以与当前块邻近或者可以根据预测模式与当前块分开。在帧内预测中,预测模式可以包括多种非定向模式和多种定向模式。帧内预测单元265可以使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测单元260可以基于参考图片上的运动向量所指定的参考块(参考样本阵列)来导出相对于当前块的预测块。这里,为了减少在帧间预测模式下发送的运动信息的量,可以基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单元预测运动信息。运动信息可以包括运动向量和参考图片索引。运动信息还可以包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括当前图片中存在的空间邻近块和参考图片中存在的时间邻近块。例如,帧间预测单元260可以基于邻近块来形成运动信息候选列表,并且基于接收到的候选选择信息来导出当前块的运动向量和/或参考图片索引。可以基于各种预测模式来执行帧间预测,并且关于预测的信息可以包括指示针对当前块的帧间预测模式的信息。
加法器235可以通过将所获得的残差信号与从帧间预测单元260或帧内预测单元265输出的预测信号(预测块或预测样本阵列)相加来生成重构信号(重构图片、重构块或重构样本阵列)。当如在应用跳跃模式的情况下一样没有相对于处理目标块的残差时,预测块可以被用作重构块。
加法器235也可以被称为重构单元或重构块生成器。所生成的重构信号可以被用于当前图片中的下一处理目标块的帧内预测,或者被用于通过随后将描述的滤波的下一图片的帧间预测。
滤波单元240可以通过向重构后的信号应用滤波来改善主观/客观图片质量。例如,滤波单元240可以通过向重构图片应用各种滤波方法来生成修改后的重构图片,并且将修改后的重构图片发送到解码图片缓冲器250。所述各种滤波方法可以包括例如去块滤波、样本自适应偏移(SAO)、自适应环路滤波(ALF)和双边滤波。
发送到解码图片缓冲器250的修改后的重构图片可以被帧间预测单元260用作参考图片。
在本说明书中,编码设备100的滤波单元160、帧间预测单元180和帧内预测单元185中描述的实施方式可以被同等地或以对应方式应用于解码设备的滤波单元240、帧间预测单元260和帧内预测单元265。
图4是作为应用本公开的实施方式的内容流传输系统的配置示图。
应用本公开的内容流传输系统可以包括编码服务器410、流传输服务器420、网络服务器430、媒体存储装置440、用户设备450和多媒体输入装置460。
编码服务器410用于将从诸如智能电话、相机和摄像机这样的多媒体输入装置输入的内容压缩成数字数据以生成比特流,并且将该比特流发送到流传输服务器420。作为另一示例,当诸如智能电话、相机和摄像机这样的多媒体输入装置460直接生成比特流时,可以省略编码服务器410。
可以通过应用本公开的编码方法或比特流生成方法来生成比特流,并且流传输服务器420可以在发送或接收比特流的处理中临时地存储比特流。
流传输服务器420基于用户请求通过网络服务器430将多媒体数据发送到用户设备450,并且网络服务器430用作将服务告知用户的介质。当用户向网络服务器430发送所期望的服务的请求时,网络服务器430将请求传送到流传输服务器420,并且流传输服务器420将多媒体数据发送到用户。这里,内容流传输系统可以包括附加的控制服务器,并且在这种情况下,控制服务器用于控制内容流传输系统中的装置之间的命令/响应。
流传输服务器420可以从媒体存储装置440和/或编码服务器410接收内容。例如,当从编码服务器410接收到内容时,流传输服务器420可以实时地接收内容。在这种情况下,流传输服务器420可以将比特流存储达预定时间,以便提供平稳的流传输服务。
用户设备450的示例可以包括蜂窝电话、智能电话、膝上型计算机、数字广播终端、PDA(个人数字助理)、PMP(便携式多媒体播放器)、导航装置、触屏PC、平板PC、超级本、可穿戴装置(例如,智能手表、智能眼镜和HMD(头戴式显示器))、数字TV、台式计算机、数字标牌等。
内容流传输系统中的每个服务器都可以作为分布式服务器进行操作,并且在这种情况下,每个服务器接收到的数据都可以被以分布式方式处理。
图5示出了适用本公开的实施方式,图5a是用于描述根据QT(四叉树)的块分割结构的示图,图5b是用于描述根据BT(二叉树)的块分割结构的示图,并且图5c是用于描述根据TT(三叉树)的块分割结构的示图。
在视频编码时,可以基于QT对单个块进行分割。另外,可以使用QT进一步递归地分割根据QT分割的单个子块。可以使用BT、TT和AT中的至少一个来对不再根据QT被分割的叶块进行分割。BT可以具有两种类型的分割:水平BT(2N×N,2N×N);以及垂直BT(N×2N,N×2N)。TT可以具有两种类型的分割:水平TT(2N×1/2N,2N×N, 2N×1/2N);以及垂直TT(1/2N×2N,N×2N,1/2N×2N)。AT可以具有四种类型的分割:水平上AT(2N×1/2N,2N×3/2N);水平下AT(2N×3/2N,2N×1/2N);垂直左AT(1/2N×2N, 3/2N×2N)和垂直右AT(3/2N×2N,1/2N×2N)。可以使用BT、TT和AT来进一步递归地分割BT、TT和AT中的每种类型。
图5a示出了QT分割的示例。块A可以根据QT被分割成四个子块A0、A1、A2和 A3。子块A1可以根据QT被进一步分割成四个子块B0、B1、B2和B3。
图5b示出了BT分割的示例。不再根据QT被分割的块B3可以被分割成垂直BT(C0 和C1)或水平BT(D0和D1)。诸如块C0这样的每个子块可以被进一步递归地分割成水平BT(E0和E1)或垂直BT(F0和F1)。
图5c示出了TT分割的示例。不再根据QT被分割的块B3可以被分割成垂直TT(C0、C1和C2)或水平TT(D0、D1和D2)。诸如块C1这样的每个子块可以被进一步递归地分割成水平TT(E0、E1和E2)或垂直TT(F0、F1和F2)。
图5d示出了AT分割的示例。不再根据QT被分割的块B3可以被分割成垂直AT(C0 和C1)或水平AT(D0和D1)。诸如块C1这样的每个子块可以被进一步递归地分割成水平AT(E0和E1)或垂直TT(F0和F1)。
此外,BT、TT和AT分割可以被以组合方式使用。例如,根据BT分割的子块可以根据TT或AT被分割。例如,根据TT分割的子块可以根据BT或AT被分割。根据AT分割的子块可以根据BT或TT被分割。例如,每个子块可以在水平BT分割之后被分割成垂直BT,或者每个子块可以在垂直BT分割之后被分割成水平BT。在这种情况下,尽管分割顺序不同,但最终分割后的形状是相同的。
另外,当分割块时,可以以各种方式限定块搜索顺序。通常,搜索是从左到右和从上到下执行的,并且块搜索可以意指确定是否每个分割后的子块是否将被附加分割的顺序、当子块不再被分割时子块的编码顺序或者当子块参考邻近其它块的信息时的搜索顺序。
可以对根据如图5a至图5d中所示的分割结构分割的处理单元(或变换块)执行变换,并且具体地,可以在行方向和列方向上执行分割并且可以应用变换矩阵。根据本公开的实施方式,可以根据处理单元(或变换块)在行方向或列方向上的长度来使用不同的变换类型。
向残差块应用变换,以便尽可能地解除残差块的相关性,将系数集中在低频上,并且在块的末尾处生成零尾部。JEM软件中的变换部分包括两个主要功能(核心变换和二次变换)。核心变换由应用于残差块的所有行和列的离散余弦变换(DCT)和离散正弦变换(DST)变换族构成。此后,可以附加地向核心变换的输出的左上角应用二次变换。类似地,可以按逆二次变换和逆核心变换的顺序应用逆变换。首先,可以向系数块的左上角应用逆二次变换。然后,向逆二次变换的输出的行和列应用逆核心变换。核心变换或逆变换可以被称为一次变换或逆变换。
图6和图7示出了应用本公开的实施方式,图6是编码设备100中的变换和量化单元120/130以及反量化和逆变换单元140/150的示意性框图,并且图7是解码设备200中的反量化和逆变换单元220/230的示意性框图。
参照图6,变换和量化单元120/130可以包括一次变换单元121、二次变换单元122和量化单元130。反量化和逆变换单元140/150可以包括反量化单元140、逆二次变换单元151和逆一次变换单元152。
参照图7,反量化和逆变换单元220/230可以包括反量化单元220、逆二次变换单元231和逆一次变换单元232。
在本公开中,可以通过多个阶段执行变换。例如,可以如图6中所示地应用一次变换和二次变换这两个阶段,或者可以根据算法使用不止两个变换阶段。这里,一次变换可以被称为核心变换。
一次变换单元121可以向残差信号应用一次变换。这里,一次变换可以被预定义为编码器和/或解码器中的表。
二次变换单元122可以向一次变换后的信号应用二次变换。这里,二次变换可以被预定义为编码器和/或解码器中的表。
在实施方式,不可分二次变换(NSST)可以被有条件地作为二次变换应用。例如,NSST仅被应用于帧内预测块,并且可以具有适于每个预测模式组的变换集。
这里,可以基于相对于预测方向的对称性来设置预测模式组。例如,预测模式52和预测模式16基于预测模式34(对角方向)是对称的,因此可以产生一组并且可以向其应用同一变换集。这里,当应用针对预测模式52的变换时,因为预测模式52的变换集与预测模式16的变换集相同,所以对输入数据进行转置,然后应用变换。
在平面模式和DC模式的情况下,相对于各方向没有对称性,因此它们具有相应的变换集,并且对应的变换集可以由两种变换构成。每个变换集可以由针对其余方向模式的三种变换构成。
量化单元130可以对二次变换后的信号执行量化。
反量化和逆变换单元140/150执行以上提到的过程的逆过程,并且省略冗余描述。
图7是解码设备200中的反量化和逆变换单元220/230的示意性框图。
参照图7,反量化和逆变换单元220/230可以包括反量化单元220、逆二次变换单元231和逆一次变换单元232。
反量化单元220使用量化步长信息从熵解码后的信号获得变换系数。
逆二次变换单元231对变换系数执行逆二次变换。这里,逆二次变换是指在图6 中描述的二次变换的逆变换。
逆一次变换单元232对逆二次变换后的信号(或块)执行逆一次变换,并且获得残差信号。这里,逆一次变换是指在图6中描述的一次变换的逆变换。
除了应用于HEVC的DCT-2和4×4DST-4之外,自适应多重变换或显式多重变换(AMT或EMT)还被用于对帧间编码块和帧内编码块的残差编码。除了HEVC中的变换之外,还使用了从DCT/DST族中选择的多个变换。在JEM中新引入的变换矩阵是 DST-7、DCT-8、DST-1和DCT-5。下表1示出了所选择的DST/DCT的基本功能。
[表1]
Figure BDA0002641728920000161
可以向宽度和高度等于或小于64的CU应用EMT,并且可以通过CU级别标志来控制是否应用EMT。当CU级别标志为0时,向CU应用DCT-2,以便对残差进行编码。发信号通知两个附加标志,以便标识将在应用EMT的CU中用于亮度编码块的水平变换和垂直变换。如在HEVC中一样,可以在JEM中以变换跳跃模式对块的残差进行编码。对于残差内编码,由于其它帧内预测模式的其它残差统计,使用依赖于模式的变换候选选择过程。如下表2中所示地限定了三个变换子集,并且基于如表3中所示的帧内预测模式选择变换子集。
[表2]
Figure BDA0002641728920000162
连同子集概念一起,通过使用CU级EMT_CU_flag为1的CU的帧内预测模式,初始地基于表2确认变换子集。此后,对于水平(EMT_TU_horizontal_flag)和垂直 (EMT_TU_vertical_flag)变换中的每一个,使用根据表3的标志基于显式信令来选择所确认的变换子集中的两个变换候选中的一个。
[表3]
Figure BDA0002641728920000171
[表4]
Figure BDA0002641728920000172
Figure BDA0002641728920000181
表4示出了作为应用本公开的实施方式的应用自适应多重变换(AMT)的变换配置组。
参照表4,基于预测模式确定变换配置组,并且组的数目可以为6(G0至G5)。另外,G0至G4与应用帧内预测的情况对应,并且G5表示应用于根据帧间预测生成的残差块的变换组合(或变换集或变换组合集)。
一个变换组合可以由应用于对应2D块的行的水平变换(或行变换)和应用于其列的垂直变换(或列变换)构成。
这里,变换配置组中的每一个可以具有四个变换组合候选。可以使用变换组合索引0至3来选择或确定四个变换组合候选,并且可以对变换组合索引进行编码并将其从编码器发送到解码器。
在实施方式中,根据帧内预测模式,通过帧内预测获得的残差数据(或残差信号)可以具有不同的统计特性。因此,可以针对如表4中所示的相应帧内预测应用除了正常余弦变换之外的变换。在本说明书中,变换类型可以被表示为例如DCT类型2、 DCT-II或DCT-2。
参照表4,示出了使用35种帧内预测模式的情况和使用67种帧内预测模式的情况。可以针对每个帧内预测模式列中分类的每个变换配置组应用多个变换组合。例如,多个变换组合可以由(行方向上的变换和列方向上的变换的)四个组合构成。作为特定示例,DST-7和DCT-5可以在行(水平)方向和列(垂直)方向二者上应用于组0,因此可以总共应用四个组。
由于总共四个变换核组合可以被应用于每种帧内预测模式,因此可以逐个变换单元地发送用于选择其中之一的变换组合索引。在本说明书中,变换组合索引可以被称为AMT索引,并且可以由AMT_idx表示。
此外,除了表4中示出的变换核之外,由于残差信号的特性,可能产生DCT-2对于行方向和列方向二者均最佳的情况。因此,可以通过针对每个编码单元限定AMT 标志来自适应地应用变换。这里,当AMT标志为0时,DCT-2可以被应用于行方向和列方向二者,而当AMT标志为1时,可以通过AMT索引选择或确定四个组合之一。
在实施方式中,如果当AMT标志为0时,对于一个变换单元而言变换系数的数目小于3,则不应用表4的变换核并且DST-7可以被应用于行方向和列方向二者。
在实施方式中,如果预先解析了变换系数值并因此变换系数的数目小于3,则不解析AMT索引并且应用DST-7,因此可以减少附加信息的发送量。
在实施方式中,只有当变换单元的宽度和高度二者都等于或小于32时,才可以应用AMT。
在实施方式中,可以通过离线训练来预设表4。
在实施方式中,AMT索引可以被定义为可以指示水平变换和垂直变换的组合的一个索引。另选地,AMT索引可以被定义为单独的水平变换索引和垂直变换索引。
图8是示出了执行自适应多重变换(AMT)的过程的流程图。
尽管在本说明书中基本描述了相对于在水平方向和垂直方向上分别应用的可分变换的实施方式,但是变换组合可以由不可分变换构成。
另选地,变换组合可以被配置为可分变换与不可分变换的混合。在这种情况下,当使用可分变换时,行/列方式的变换选择或水平/垂直方向上的选择不是必要的,并且只有当选择了可分变换时,才可以使用表4的变换组合。
另外,可以不顾及一次变换和二次变换的情况下应用本说明书中提出的方法。即,这些方法可以被应用于这两个变换。这里,一次变换可以是指用于初始地变换残差块的变换,而二次变换可以是指用于向作为一次变换是结果而生成的块应用变换的变换。
首先,编码设备100可以确定与当前块对应的变换组(S805)。这里,变换组可以是指表4中的变换组,但是本公开不限于此,并且变换组可以由其它变换组合构成。
编码设备100可以对变换组中的可用候选变换组合执行变换(S810)。作为变换的结果,编码设备100可以确定或选择速率失真(RD)代价最低的变换组合(S815)。编码设备100可以对与所选择的变换组合对应的变换组合索引进行编码(S820)。
图9是示出了执行AMT的解码过程的流程图。
首先,解码设备200可以确定当前块的变换组(S905)。解码设备200可以解析变换组合索引,并且变换组合索引可以与变换组中的多个变换组合中的一个对应 (S910)。解码设备200可以导出与变换组合索引对应的变换组合(S915)。这里,尽管变换组合可以是指表4中示出的变换组合,但是本公开不限于此。即,变换组合可以被配置为其它变换组合。
解码设备200可以基于变换组合对当前块执行逆变换(S920)。当变换组合由行变换和列变换构成时,可以应用行变换,然后可以应用列变换。然而,本公开不限于此,并且可以在应用列变换之后应用行变换,并且当变换组合由不可分变换构成时,可以立即应用不可分变换。
在另一实施方式中,可以同时执行确定变换组的过程和解析变换组合索引的过程。
在本公开的实施方式中,以上提到的术语“AMT”可以被重新定义为“多重变换集或多重变换选择(MTS)”。通用视频编码(VVC)JVET-K1001-v4中概述了下述的 MTS相关语法和语义。
在本公开的实施方式中,如下地,两个MTS候选可以被用于定向模式并且四个 MTS候选可以被用于非定向模式。
A)非定向模式(DC和平面)
当MTS索引为0时,DST-7被用于水平变换和垂直变换。
当MTS索引为1时,DST-7被用于垂直变换并且DCT-8被用于水平变换。
当MTS索引为2时,DCT-8被用于垂直变换并且DST-7被用于水平变换。
当MTS索引为3时,DST-8被用于水平变换和垂直变换。
B)属于水平组模式的模式
当MTS索引为0时,DST-7被用于水平变换和垂直变换。
当MTS索引为1时,DCT-8被用于垂直变换并且DST-7被用于水平变换。
C)属于垂直组模式的模式
当MTS索引为0时,DST-7被用于水平变换和垂直变换。
当MTS索引为1时,DST-7被用于垂直变换并且DCT-8被用于水平变换。
这里(在使用67种模式的VTM 2.0中),水平组模式包括帧内预测模式2至34并且垂直模式包括帧内预测模式35至66。
在本公开的另一实施方式中,三个MTS候选被用于所有帧内预测模式。
当MTS索引为0时,DST-7被用于水平变换和垂直变换。
当MTS索引为1时,DST-7被用于垂直变换并且DCT-8被用于水平变换。
当MTS索引为2时,DCT-8被用于垂直变换并且DST-7被用于水平变换。
在本公开的另一实施方式中,两个MTS候选被用于定向预测模式并且三个MTS 候选被用于非定向模式。
A)非定向模式(DC和平面)
当MTS索引为0时,DST-7被用于水平变换和垂直变换。
当MTS索引为1时,DST-7被用于垂直变换并且DCT-8被用于水平变换。
当MTS索引为2时,DCT-8被用于垂直变换并且DST-7被用于水平变换。
B)与水平组模式对应的预测模式
当MTS索引为0时,DST-7被用于水平变换和垂直变换。
当MTS索引为1时,DCT-8被用于垂直变换并且DST-7被用于水平变换。
C)与垂直组模式对应的预测模式
当MTS索引为0时,DST-7被用于水平变换和垂直变换。
当MTS索引为1时,DST-7被用于垂直变换并且DCT-8被用于水平变换。
在本公开的另一实施方式中,一个MTS候选(例如,DST-7)可以被用于所有帧内模式。在这种情况下,编码时间可以减少40%,而有少量的编码损失。另外,在 DCT-2和DST-7之间,可以使用一个标志进行指示。
图10是示出了根据本公开的实施方式的基于MTS的逆变换过程的流程图。
应用了本公开的解码设备200可以获得sps_MTS_intra_enabled_flag或 sps_MTS_inter_enabled_flag(S1005)。这里,sps_MTS_intra_enabled_flag指示在帧内编码单元的残差编码语法中是否存在cu_MTS_flag。例如,如果 sps_MTS_intra_enabled_flag=0,则在帧内编码单元的残差编码语法中不存在 cu_MTS_flag,而如果sps_MTS_intra_enabled_flag=1,则在帧内编码单元的残差编码语法中存在cu_MTS_flag。另外,sps_MTS_inter_enabled_flag指示在帧间编码单元的残差编码语法中是否存在cu_MTS_flag。例如,如果sps_MTS_inter_enabled_flag=0,则在帧间编码单元的残差编码语法中不存在cu_MTS_flag,而如果 sps_MTS_inter_enabled_flag=1,则在帧间编码单元的残差编码语法中存在 cu_MTS_flag。
解码设备200可以基于sps_MTS_intra_enabled_flag或sps_MTS_inter_enabled_flag 获得cu_MTS_flag(S1010)。例如,当sps_MTS_intra_enabled_flag=1或 sps_MTS_inter_enabled_flag=1时,解码设备200可以获得cu_MTS_flag。这里, cu_MTS_flag指示是否向亮度变换块的残差样本应用MTS。例如,如果 cu_MTS_flag=0,则不向亮度变换块的残差样本应用MTS,而如果cu_MTS_flag=1,则向亮度变换块的残差样本应用MTS。
解码设备200可以基于cu_MTS_flag获得MTS_idx(S1015)。例如,当 cu_MTS_flag=1时,解码设备200可以获得MTS_idx。这里,MTS_idx指示在水平方向和/或垂直方向上向当前变换块的亮度残差样本应用哪个变换核。
例如,本说明书中描述的实施方式中的至少一个可以被应用于MTS_idx。
解码设备200可以导出与MTS_idx对应的变换核(S1020)。例如,与MTS_idx对应的变换核可以被分别定义为水平变换和垂直变换。
例如,当向当前块应用MTS(即,cu_MTS_flag=1)时,解码设备200可以基于当前块的帧内预测模式来配置MTS候选。在这种情况下,图10的解码流程图还可以包括配置MTS候选的步骤。然后,解码设备200可以使用MTS_idx从所配置的MTS候选当中确定将应用于当前块的MTS候选。
作为另一示例,可以对水平变换和垂直变换应用不同的变换核。然而,本公开不限于此,并且可以对水平变换和垂直变换应用相同的变换核。
解码设备200可以基于变换核执行逆变换(S1025)。
此外,在说明书中,MTS可以被表示为AMT或EMT,并且MTS_idx可以被表示为AMT_idx、EMT_idx、AMT_TU_idx、EMT_TU_idx等,但是本公开不限于此。
按基于MTS标志分为应用MTS的情况和不应用MTS的情况的方式来描述本公开,但是不限于这种表达。例如,是否应用MTS可以意指是否使用除了预定义的特定变换类型(其可以被称为基本变换类型、默认变换类型等)之外的其它变换类型(或变换核)。如果应用了MTS,则除了基本变换类型之外的其它变换类型(例如,多种变换类型当中的任一种变换类型或者两种或更多种变换类型的组合变换类型)可以被用于变换。此外,如果不应用MTS,则基本变换类型可以被用于变换。在实施方式中,基本变换类型可以被配置(或限定)为DCT2。
作为示例,当应用指示是否向当前变换块应用MTS的MTS标志语法以及MTS时,还可以从编码器向解码器独立地发送指示应用于当前变换块的变换类型的MTS索引语法。作为另一示例,当应用指示是否向当前变换块应用MTS的MTS标志语法以及 MTS时,还可以从编码器向解码器发送包括应用于当前变换块的所有变换类型的语法 (例如,MTS索引)。即,在后一示例中,指示应用于当前变换块(或单元)的变换类型的语法(或语法元素)可以在包括上述基本变换类型的所有变换类型组(或变换类型集)内被从编码器发送到解码器。
因此,尽管有该表达,但是指示应用于当前变换块的变换类型的语法(MTS索引)可以包括关于是否应用MTS的信息。换句话说,在后一示例中,可以仅发信号通知 MTS索引,而不发信号通知MTS标志,并且在这种情况下,可以理解DCT2被包括在 MTS中。然而,在本公开中,可以描述DCT2的应用意指不应用MTS。然而,相对于 MTS的技术范围不限于对应的限定。
图11是根据本公开的实施方式的基于MTS执行解码的设备的框图。
应用本公开的解码设备200可以包括序列参数获取单元1105、MTS标志获取单元1110、MTS索引获取单元1115和变换核导出单元1120。
序列参数获取单元1105可以获取sps_MTS_intra_enabled_flag或 sps_MTS_inter_enabled_flag。这里,sps_MTS_intra_enabled_flag指示帧内编码单元的残差编码语法中是否存在cu_MTS_flag,并且sps_MTS_inter_enabled_flag指示帧间编码单元的残差编码语法中是否存在cu_MTS_flag。参照图10的描述可以被应用于特定示例。
MTS标志获取单元1110可以基于sps_MTS_intra_enabled_flag或 sps_MTS_inter_enabled_flag来获取cu_MTS_flag。例如,当sps_MTS_intra_enabled_flag=1或sps_MTS_inter_enabled_flag=1时,MTS标志获取单元 1110可以获取cu_MTS_flag。这里,cu_MTS_flag指示是否向亮度变换块的残差样本应用MTS。参照图10的描述可以被应用于特定示例。
MTS索引获取单元1115可以基于cu_MTS_flag获取MTS_idx。例如,当 cu_MTS_flag=1时,MTS索引获取单元1115可以获取MTS_idx。这里,MTS_idx指示在水平方向和/或垂直方向上向当前变换块的亮度残差样本应用哪个变换核。参照图 10的描述可以被应用于特定示例。
变换核导出单元1120可以导出与MTS_idx对应的变换核。然后,解码设备200可以基于导出的变换核执行逆变换。
引入了依赖模式的不可分二次变换(MDNSST)。为了保持低复杂度,MDNSST 在一次变换后仅被应用于低频系数。另外,主要应用于低频系数的不可分变换可以被称为LFNST(低频不可分变换)。如果变换系数块的宽度(W)和高度(H)二者等于或大于8,则向变换系数块的8×8左上区域应用8×8不可分二次变换。如果宽度或高度小于8,则应用4×4不可分二次变换,并且可以对变换系数块的左上min(8,W)×min(8, H)上执行4×4不可分二次变换。这里,min(A,B)是输出A和B之间的较小值的函数。另外,W×H是块大小,W表示宽度并且H表示高度。
对于块大小4×4和8×8,可以总共存在35×3个不可分二次变换。这里,35是帧内预测模式所指定的变换集的数目并且3是针对每种预测模式的NSST候选的数目。可以在下表5中限定从帧内预测模式到变换集的映射。
[表5]
帧内模式 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
集合 0 1 2 3 4 5 6 7 8 9 10 11 12 23 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
帧内模式 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67(LM)
集合 34 33 32 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 NULL
为了指示变换集当中的变换核,可以对NSST索引(NSST idx)进行编码。当不应用NSST时,发信号通知等于0的NSST索引。
图12和图13是示出了作为应用了本公开的实施方式的应用二次变换的编码/解码的流程图。
在JEM中,不向用变换跳跃模式编码的块应用二次变换(MDNSST)。当针对CU 发信号通知MDNSST索引并且MDNSST索引不等于零时,不针对CU中的用变换跳跃模式编码的分量的块使用MDNSST。在图12和图13中示出了包括系数编码和NSST索引编码的整体编码结构。CBF标志被编码以确定是否执行系数编码和NSST编码。在图12和图13中,CBF标志可以表示亮度块cbg标志(cbf_luma标志)或色度块cbf标志 (cbf_cb标志或cbf_cr标志)。当CBF标志为1时,对变换系数进行编码。
参照图12,编码设备100检查CBF是否为1(S1205)。如果CBF为0,则编码设备 100不执行变换系数编码和NSST索引编码。如果CBF为1,则编码设备100对变换系数执行编码(S1210)。此后,编码设备100确定是否执行NSST索引编码(S1215)并且执行NSST索引编码(S1220)。当不应用NSST索引编码时,编码设备100可以在不应用NSST的情况下结束变换过程并且执行后续步骤(例如,量化)。
参照图13,解码设备200检查CBF是否为1(S1305)。如果CBF为0,则解码设备 200不执行变换系数解码和NSST索引解码。如果CBF为1,则解码设备200对变换系数执行解码(S1310)。此后,解码设备200确定是否执行NSST索引编码(S1315)并且解析NSST索引(S1320)。
可以向8×8或4×4左上区域应用而非向已经应用了一次变换的整个块(在HEVC的情况下的TU)应用NSST。例如,当块大小为8×8或更大时,可以应用8×8 NSST,而当块大小小于8×8时,可以应用4×4 NSST。另外,当应用8×8 NSST时,每个4×4块可以应用4×4NSST。可以根据上述变换集配置确定8×8 NSST和4×4 NSST二者,并且8×8 NSST可以具有64个输入数据和64个输出数据,并且4×4 NSST可以具有16个输入和16 个输出,因为它们是不可分变换。
图14和图15示出了应用本公开的实施方式,图14是用于描述吉文斯旋转的示图,并且图15示出了由吉文斯旋转层和置换构成的4×4 NSST中的一轮的配置。
8×8 NSST和4×4 NSST二者可以被配置为吉文斯旋转的分层组合。与一个吉文斯旋转对应的矩阵被表示为式1,并且矩阵乘积被表示为图14。
[式1]
Figure BDA0002641728920000251
在图14中,可以如式2表示地计算根据吉文斯旋转输出的tm和tn
[式2]
tm=xmcosθ-xnsinθ
tn=xmsinθ+xncosθ
由于如图14中所示吉文斯旋转使两个数据旋转,因此需要32或8次吉文斯旋转来处理64(在8×8 NSST的情况下)或16(在4×4 NSST的情况下)个数据。因此,一组32或8次吉文斯旋转可以形成吉文斯旋转层。如图15中所示,通过置换(混排),一个吉文斯旋转层的输出数据被作为下一个吉文斯旋转层的输入数据进行发送。如图15 中所示置换的模式是被规则定义的,并且在4×3 NSST的情况下,四个吉文斯旋转层和对应的置换形成一轮。4×4NSST被执行两轮,而8×8 NSST被执行四轮。尽管不同的轮次使用相同的置换模式,但是所应用的吉文斯旋转角度是不同的。因此,需要存储构成每次置换的所有吉文斯旋转的角度数据。
作为最后一步,最后对通过吉文斯旋转层输出的数据再执行一次置换,并且针对每次置换分别存储关于对应置换的信息。在正向NSST的末尾执行对应置换,并且最初在逆NSST中应用对应逆置换。
逆NSST逆向地执行吉文斯旋转层和应用于正向NSST的置换,并且通过针对每个吉文斯旋转角度取负值来执行旋转。
RST(简化二次变换)
图16示出了作为应用本公开的实施方式的RST的操作。
当表示变换的正交矩阵为N×N时,简化变换(RT)仅留下N个变换基向量中的R 个(R<N)。可以用式3定义相对于生成变换系数的正向RT的矩阵。
[式3]
Figure BDA0002641728920000261
由于相对于逆RT的矩阵是正向RT矩阵的转置矩阵,因此如图16a 和图16b 中所示,图示了正向RT和逆RT的应用。
应用于已经应用了一次变换的变换系数块的8×8左上块的RT可以被称为8×8RST。在数学表达式3中R被设置为16时,正向8×8 RST具有16×64矩阵的形式并且逆 8×8RST具有64×16矩阵的形式。另外,可以向8×8 RST应用如表5中所示的变换集配置。即,可以根据如表5中所示的帧内预测模式基于变换集来确定8×8 RST。由于根据帧内预测模式,一个变换集由两个或三个变换构成,因此可以选择包括不应用二次变换的情况的四个变换中的最大值的变换(一个变换可以与各向异性矩阵对应)。当索引0、1、2和3被指派给这四个变换时,可以通过发信号通知与每个变换系数块的 NSST索引对应的语法元素来指定要应用的变换。例如,索引9可以被指派给各向异性矩阵,即,不应用二次变换的情况。因此,通过NSST索引,针对8×8左上块,可以根据JEM NSST指定8×8 NSST并且可以根据RST配置指定8×8 RST。
图17是示出了作为应用本公开的实施方式的以反向扫描顺序从第六十四系数至第十七系数执行反向扫描的过程的示图。
当应用由数学表达式3表示的8×8 RST时,生成16个有效变换系数,因此构成8×8区域的64个输入数据减少为16个输出数据,并且根据二维区域的角度,仅四分之一区域被填充有效变换系数。因此,通过应用正向8×8 RST获得的16个输出数据填充图17 的左上区域。
在图17中,4×4左上区域成为填充有效变换系数的所关注区域(ROI),而其余区域是空的。空区域可以被填充有作为默认值的0。如果在除了图17的ROI之外的区域中发现了非零有效变换系数,则尚未明确应用8×8 RST,因此对于对应的NSST索引,可以省略对应的编码。另一方面,如果在除了图17的ROI之外的区域中未发现非零有效变换系数(应用了8×8 RST或者除了ROI之外的区域被填充有0),则可以对NSST索引进行编码,因为可以应用8×8 RST。这种有条件NSST索引编码需要检查非零变换系数的存在与否,并因此能够在残差编码过程之后被执行。
图18例示了作为应用本公开的实施方式的使用单变换指示符进行的编码的示例性流程图。
在本公开的实施方式中,引入了单变换指示符(STI)。当启用STI(STI编码==1)时,可以应用单个变换,而不是依次使用两个变换(一次变换和二次变换)。这里,单个变换可以是任何类型的变换。例如,单个变换可以是可分变换或不可分变换。单个变换可以是从不可分变换逼近的变换。当已经启用了STI时,可以发信号通知单个变换索引(图18中的ST_idx)。这里,单个变换索引可以指示可用变换候选当中的要应用的变换。
参照图18,编码设备100确定CBF是否为1(S1805)。当CBF为1时,编码设备100 确定是否应用STI编码(S1810)。当应用STI编码时,编码设备100对STI索引STI_idx 进行编码(S1845)并且对变换系数执行编码(S1850)。当不应用STI编码时,编码设备100对指示是否以CU级别应用EMT(或MTS)的标志EMT_CU_Flag进行编码 (S1815)。此后,编码设备100对变换系数执行编码(S1820)。然后,编码设备100 确定是否向变换单元(TU)应用EMT(S1825)。当向UT应用EMT时,编码设备100 对应用于TU的一次变换索引EMT_TU Idx进行编码(S1830)。随后,编码设备100确定是否应用NSST(S1835)。当应用NSST时,编码设备100对指示要应用的NSST的索引NSST_Idx进行编码(S1840)。
在示例中,如果满足/启用单个变换编码条件(例如,STI_coding==1),则可以隐式地导出而非发信号通知单个变换索引ST_Idx。可以基于块大小和帧内预测模式隐式地确定ST_idx。这里,ST_Idx可以指示应用于当前变换块的变换(或变换核)。
如果满足以下条件中的一个或更多个(STI_coding==1),则可以启用STI。
1)块大小与诸如4或8这样的预定值对应。
2)块宽度==块高度(正方形块)
3)帧内预测模式是诸如DC模式和平面模式这样的预定模式中的一种。
在另一示例中,可以发信号通知STI编码标志,以便指示是否应用了单个变换。可以基于STI编码值和CBF来发信号通知STI编码标志。例如,当CBF为1并且启用STI 编码时,可以发信号通知STI编码标志。此外,可以考虑块大小、块形状(正方形块或非正方形块)或帧内预测模式来有条件地发信号通知STI编码标志。
为了使用在系数编码期间获取的信息,可以在系数编码之后确定ST_idx。在示例中,可以基于块大小、帧内预测模式和非零系数的数目来隐式地确定ST_idx。在另一示例中,可以基于块大小、块形状、帧内预测模式和/或非零系数的数目来有条件地对ST_idx进行编码/解码。在另一示例中,根据非零系数的分布(即,非零系数的位置),可以省略ST_idx信令。具体地,当在除4×4左上区域之外的区域中发现非零系数时,可以省略ST_idx信令。
图19例示了作为应用本公开的实施方式的使用联合变换指示符(UTI)进行的编码的示例性流程图。
在本公开的实施方式中,引入了联合变换指示符。UTI包括一次变换指示符和二次变换指示符。
参照图19,编码设备100确定CBF是否为1(S1905)。当CBF为1时,编码设备100 确定是否应用UTI编码(S1910)。当应用UTI编码时,编码设备100对UTI索引UTI_idx 进行编码(S1945)并且对变换系数执行编码(S1950)。当不应用UTI编码时,编码设备100对指示是否以CU级别应用EMT(或MTS)的标志EMT_CU_Flag进行编码 (S1915)。此后,编码设备100对变换系数执行编码(S1920)。然后,编码设备100 确定是否向变换单元(TU)应用EMT(S1925)。当向UT应用EMT时,编码设备100 对应用于TU的一次变换索引EMT_TU Idx进行编码(S1930)。随后,编码设备100确定是否应用NSST(S1935)。当应用NSST时,编码设备100对指示要应用的NSST的索引NSST_Idx进行编码(S1940)。
可以针对每个预定单元(CTU或CU)对UTI进行编码。
UTI编码模式可以取决于以下条件。
1)块大小
2)块形状
3)帧内预测模式
预先定义了如何从UTI导出/提取核心变换索引。预先定义了如何从UTI导出/提取二次变换索引。
可以可选地使用针对UTI的语法结构。UTI可以取决于CU(TU)大小。例如,较小的CU(TU)可能具有较窄范围中的UTI索引。在示例中,如果满足预定义的条件 (例如,块大小小于预定义的阈值),则UTI可以仅指示核心变换索引。
[表6]
UTI-索引 二值化(FLC) 核心变换Idx 二次变换Idx
0 00000 0 0
1 00001 0 1
2 00010 0 2
3 00011 0 3
4 00100 1 0
5 00101 1 1
6 00110 1 2
7 00111 1 3
... ... ... ...
31 11111 5 3
在另一示例中,当未指示使用二次变换时(例如,二次变换索引==0或二次变换是已经预定的),UTI索引可以被视为核心变换索引。以相同的方式,当核心变换索引被视为已知时,UTI索引可以被视为二次变换索引。具体地,考虑帧内预测模式和块大小,可以使用预定核心变换。
图20a和图20b例示了作为应用本公开的实施方式的使用UTI进行的编码的两个示例性流程图。
在另一示例中,变换编码结构可以使用UTI索引编码,如图20a和图20b中所示。这里,UTI索引可以比系数编码更早地或者比系数编码更晚地被编码。
参照图20a的流程图,编码设备100检查CBF是否为1(S2005)。当CBF为1时,编码设备100对UTI索引UTI_idx进行编码(S2010)并且对变换系数执行编码(S2015)。
参照图20b的流程图,编码设备100检查CBF是否为1(S2055)。当CBF为1时,编码设备100对变换系数执行编码(S2060)并且对UTI索引UTI_idx进行编码(S2065)。
在本公开的另一实施方式中,引入了用于变换指示符的数据隐藏和隐式编码方法。这里,变换指示符可以包括ST_idx、UTI_idx、EMT_CU_Flag、EMT_TU_Flag、 NSST_Idx以及可以被用于指示变换核的任何种类的变换相关索引。可以不发信号通知以上提到的变换指示符,但是可以在系数编码过程中插入对应的信息(可以在系数编码过程中提取该信息)。系数编码过程可以包括以下部分。
-Last_position_x,Last_position_y
-Group flag
-Significance map
-Greather_than_1flag
-Greather_than_2flag
-Remaining level coding
-Sign coding
例如,可以在以上提到的系数编码过程中的一个或更多个中插入变换指示符信息。为了插入变换指示符信息,可以共同考虑以下内容。
sing编码的模式
其余级别的绝对值
Greather_than_1标志的数目
Last_position_X的值和Last_position_Y的值
可以有条件地考虑以上提到的数据隐藏方法。例如,数据隐藏方法可以取决于非零系数的数目。
在另一示例中,NSST_idx和EMT_idx可能是依赖的。例如,当EMT_CU_Flag等于0(或1)时,NSST_idx可以不为零。在这种情况下,可以发信号通知NSST_idx-1 而非NSST_idx。
在本公开的另一实施方式中,引入了基于帧内预测模式的NSST变换集映射,如下表7中所示。尽管以下将NSST描述为不可分变换的示例,但是另一已知术语(例如, LFNST)可以被用于不可分变换。例如,NSST集和NSST索引可以分别被LFNST集和 LFNST索引替换。此外,本说明书中描述的RST也可以被作为使用应用于变换块的至少一个区域(4×4或8×8左上区域或者8×8块中的除了4×4右下区域之外的区域)的正方形不可分变换矩阵中的输入长度减小和/或输出长度减小的非正方形变换矩阵的不可分变换(例如,LFNST)的示例的LFNST替换。
[表7]
帧内模式 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
NSST集 0 0 2 2 2 2 2 2 2 2 2 2 2 18 18 18 18 18 18 18 18 18 18 18 34 34 34 34 34 34 34 34 34 34
帧内模式 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66
NSST集 34 34 34 34 34 34 34 34 34 34 34 18 18 18 18 18 18 18 18 18 18 18 2 2 2 2 2 2 2 2 2 2 2
如表8中所示,NSST集的编号可以被从0至3重新布置。
[表8]
帧内模式 0 1 2 3 4 5 6 7 8 9 10 11 2 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
NSST集 0 0 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3
帧内模式 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66
NSST集 3 3 3 3 3 3 3 3 3 3 3 2 2 2 2 2 2 2 2 2 2 2 1 1 1 1 1 1 1 1 1 1 1
在NSST变换集中,仅使用了四个变换集(而非35个),因此可以减少所需的存储空间。
另外,可以如下地使用每个变换集的各种数目的变换核。
情况A:针对每个变换集使用两个可用的变换核,使得NSST索引范围为从0至2。例如,当NSST索引为0时,可以不应用二次变换(基于解码器的逆二次变换)。当NSST 索引为1或2时,可以应用二次变换。变换集可以包括索引1或2可以被映射到的两个变换核。
[表9]
Figure BDA0002641728920000311
参照表9,两个变换核被用于不可分变换(NSST或LFNST)集0至3中的每一个。
情况B:针对变换集0使用两个可用的变换核,而针对其它变换集使用一个可用的变换核。变换集0(DC和平面)的可用NSST索引为0至2。然而,其它模式(变换集1、2和3)的NSST索引为0至1。
[表10]
Figure BDA0002641728920000321
参照表10,针对与索引0对应的不可分变换(NSST)集设置两个不可分变换核,并且针对与索引1、2和3对应的不可分变换(NSST)集中的每一个设置一个不可分变换核。
情况C:每个变换集使用一个变换核,并且NSST索引范围为0至1。
[表11]
Figure BDA0002641728920000322
图21是示出了作为应用本公开的实施方式的用于执行变换的编码的示例性流程图。
编码设备100对残差块执行一次变换(S2105)。一次变换可以被称为核心变换。作为实施方式,编码设备100可以通过使用以上提到的MTS执行一次变换。另外,编码设备100可以将指示MTS候选当中的特定MTS的MTS索引发送到解码设备200。这里,可以基于当前块的帧内预测模式来配置MTS候选。
编码设备100确定是否应用二次变换(S2110)。例如,编码设备100可以基于一次变换后的残差块的变换系数来确定是否应用二次变换。例如,二次变换可以是NSST 或RST。
编码设备100确定二次变换(S2115)。这里,编码设备100可以根据帧内预测模式基于NSST(或RST)变换集来确定二次变换。
例如,在步骤S2115之前,编码设备100可以基于当前块的大小来确定将应用二次变换的区域。
编码设备100执行在步骤S2115中确定的二次变换(S2120)。
图22是示出了作为应用本公开的实施方式的用于执行变换的解码的示例性流程图。
解码设备200确定是否应用逆二次变换(S2205)。例如,逆二次变换可以是NSST 或RST。例如,解码设备200可以基于从编码设备100接收的二次变换标志来确定是否应用逆二次变换。
解码设备200确定逆二次变换(S2210)。这里,解码设备200可以基于根据以上提到的帧内预测模式指定的NSST(或RST)变换集来确定应用于当前块的逆二次变换。
另外,例如,在步骤S2210之前,解码设备200可以基于当前块的大小来确定将应用逆二次变换的区域。
解码设备200使用在步骤S2210中确定的逆二次变换对反量化后的残差块执行逆二次变换(S2215)。
解码设备对逆二次变换后的残差块执行逆一次变换(S2220)。逆一次变换可以被称为逆核心变换。在实施方式中,解码设备200可以使用以上提到的MTS执行逆一次变换。另外,作为示例,在步骤S2220之前,解码设备200可以确定是否向当前块应用 MTS。在这种情况下,图22的解码流程图还可以包括确定是否应用MTS的步骤。
例如,当向当前块应用MTS(即,cu_MTS_flag=1)时,解码设备200可以基于当前块的帧内预测模式来配置MTS候选。在这种情况下,图22的解码流程图还可以包括配置MTS候选的步骤。另外,解码设备200可以使用指示出所配置的MTS候选当中的特定MTS的mtx_idx来确定应用于当前块的逆一次变换。
图23是作为应用本公开的实施方式的编码设备100中的变换单元120的详细框图。
应用本公开的实施方式的编码设备100可以包括一次变换单元2310、二次变换应用确定单元2320、二次变换确定单元2330和二次变换单元2340。
一次变换单元2310可以对残差块执行一次变换。一次变换可以被称为核心变换。作为实施方式,一次变换单元2310可以使用以上提到的MTS执行一次变换。另外,一次变换单元2310可以将指示MTS候选当中的特定MTS的MTS索引发送到解码设备 200。这里,可以基于当前块的帧内预测模式来配置MTS候选。
二次变换应用确定单元2320可以确定是否应用二次变换。例如,二次变换应用确定单元2320可以基于一次变换后的残差块的变换系数来确定是否应用二次变换。例如,二次变换可以是NSST或RST。
二次变换确定单元2330确定二次变换。这里,二次变换确定单元2330可以基于根据如上所述的帧内预测模式指定的NSST(或RST)变换集来确定二次变换。
例如,二次变换确定单元2330可以基于当前块的大小来确定将应用二次变换的区域。
二次变换单元2340可以执行所确定的二次变换。
图24是作为应用本公开的实施方式的解码设备200中的逆变换单元230的详细框图。
应用本公开的解码设备200包括逆二次变换应用确定单元2410、逆二次变换确定单元2420、逆二次变换单元2430和逆一次变换单元2440。
逆二次变换应用确定单元2410可以确定是否应用逆二次变换。例如,逆二次变换可以是NSST或RST。例如,逆二次变换应用确定单元2410可以基于从编码设备100接收的二次变换标志来确定是否应用逆二次变换。
逆二次变换确定单元2420可以确定逆二次变换。这里,逆二次变换确定单元2420可以基于根据帧内预测模式指定的NSST(或RST)变换集来确定应用于当前块的逆二次变换。
另外,例如,逆二次变换确定单元2420可以基于当前块的大小来确定将应用逆二次变换的区域。
逆二次变换单元2430可以使用所确定的逆二次变换来对反量化后的残差块执行逆二次变换。
逆一次变换单元2440可以对逆二次变换后的残差块执行逆一次变换。在实施方式中,逆一次变换单元2440可以使用以上提到的MTS执行逆一次变换。另外,作为示例,逆一次变换单元2440可以确定是否向当前块应用MTS。
例如,当向当前块应用MTS(即,cu_MTS_flag=1)时,逆一次变换单元2440可以基于当前块的帧内预测模式来配置MTS候选。另外,逆一次变换单元2440可以使用指示所配置的MTS候选当中的特定MTS的mtx_idx来确定应用于当前块的逆一次变换。
图25是作为应用本公开的实施方式的对视频信号进行处理的流程图。图25的流程图的过程可以由解码设备200或逆变换单元230执行。
首先,解码设备200可以基于不可分变换索引以及当前块的宽度和高度来确定是否向当前块应用逆不可分变换。例如,如果不可分变换索引不为0并且当前块的宽度和高度等于或大于4,则解码设备200可以确定应用了不可分变换。如果不可分变换索引为0或者当前块的宽度或高度小于4,则解码设备200可以省略逆不可分变换并执行逆一次变换。
在步骤S2505中,解码设备200确定指示基于当前块的帧内预测模式预定义的不可分变换集当中的用于当前块的不可分变换的不可分变换集的不可分变换集索引。可以设置不可分变换集索引,使得其被分配给根据帧内预测模式的范围配置的四个变换集中的每一个,如表7或表8中所示。即,不可分变换集索引在帧内预测模式为0和1时可以被确定为第一索引值,在帧内预测模式为2至12或56至66时被确定为第二索引值,在帧内预测模式为13至23或45至55时被确定为第三索引值,并且在帧内预测模式为24 至44时被确定为第四索引值,如表7或表8中所示。
这里,预定义的不可分变换集中的每一个可以包括两个变换核,如表9中所示。此外,预定义的不可分变换集中的每一个可以包括一个或两个变换核,如表10或表11 中所示。
在步骤S2510中,解码设备200将不可分变换集索引所指示的不可分变换集中所包括的变换核当中的针对当前块的不可分变换索引所指示的变换核确定为不可分变换矩阵。例如,可以针对每个不可分变换集索引值配置两个不可分变换核,并且解码设备200可以基于与不可分变换集索引对应的两个变换矩阵核之中的不可分变换索引所指示的变换核来确定不可分变换矩阵。
在步骤S2515中,解码设备200向基于当前块的宽度和高度确定的当前块的左上区域应用不可分变换矩阵。例如,如果当前块的宽度和高度二者等于或大于8,则可以向当前块的8×8左上区域应用不可分变换,并且如果当前块的宽度或高度小于8,则可以向当前块的4×4区域应用不可分变换。响应于将应用不可分变换的区域,不可分变换的大小也可以被设置为8×8或4×4。
此外,解码设备200可以向已经应用了不可分变换的当前块应用水平变换和垂直变换。这里,可以基于MTS索引确定水平变换和垂直变换,以便选择应用于当前块的预测模式和变换矩阵。
下文中,描述了组合并应用一次变换和二次变换的方法。即,本公开的实施方式提出了高效地设计在一次变换和二次变换中使用的变换的方法。在这种情形下,可以应用图1至图25中例示的方法,并且省略冗余描述。
如上所述,一次变换表示基于编码器首先应用于残差块的变换。如果应用了二次变换,则编码器可以对一次变换后的残差块执行二次变换。如果应用了二次变换,则可以基于解码器在一次逆变换之前执行二次逆变换。解码器可以对二次逆变换后的变换系数块执行一次逆变换,以导出残差块。
另外,如上所述,不可分变换可以被用作二次变换,并且为了保持低复杂度,可以仅向左上特定区域的低频率的系数应用二次变换。应用于低频的这些系数的二次变换可以被称为不可分二次变换(NSST)、低频不可分变换(LFNST)或简化二次变换 (RST)。一次变换可以被称为核心变换。
在本公开的实施方式中,一次变换中使用的一次变换候选和二次变换中使用的二次变换核可以被预定义为各种组合。在本公开中,一次变换中使用的一次变换候选可以被称为MTS候选,但是不限于该名称。例如,一次变换候选可以是分别应用于水平方向和垂直方向的变换核(或变换类型)的组合,并且变换核可以是DCT2、DST7 和/或DCT8中的一个。换句话说,一次变换候选可以是DCT2、DST7和/或DCT8的至少一个组合。用详细的示例给出了以下描述。
-组合A
在组合A中,如下表12中例示的,可以根据帧内预测模式来定义一次变换候选和二次变换核。
[表12]
Figure BDA0002641728920000361
参照上表12,作为示例(情况1),如果帧内预测模式具有方向性,则可以使用两个一次变换候选,而如果帧内预测模式没有方向性(例如,DC模式、平面模式),则可以使用四个一次变换候选。在这种情形下,不顾及帧内预测模式的方向性如何,二次变换候选可以包括两个变换核。即,如上所述,可以根据帧内预测模式来预定义多个二次变换核集,并且多个预定义的二次变换核集中的每一个可以包括两个变换核。
另外,作为示例(情况2),如果帧内预测模式具有方向性,则可以使用两个一次变换候选,而如果帧内预测模式没有方向性,则可以使用四个一次变换候选。在这种情况下,如果帧内预测模式具有方向性,则二次变换候选可以包括一个变换核,而如果帧内预测模式没有方向性,则二次变换候选可以包括两个变换核。
另外,作为示例(情况3),如果帧内预测模式具有方向性,则可以使用两个一次变换候选,而如果帧内预测模式没有方向性,则可以使用四个一次变换候选。在这种情形下,不顾及帧内预测模式的方向性如何,二次变换候选可以包括一个变换核。
-组合B
在组合B中,如下表13中例示的,可以根据帧内预测模式来定义一次变换候选和二次变换核。
[表13]
Figure BDA0002641728920000371
参照上表13,作为示例(情况1),可以不顾及帧内预测模式的方向性而使用三个一次变换候选。在这种情形下,不顾及帧内预测模式的方向性如何,二次变换候选可以包括两个变换核。即,如上所述,可以根据帧内预测模式来预定义多个二次变换核集,并且多个预定义的二次变换核集中的每一个可以包括两个变换核。
另外,作为示例(情况2),可以不顾及帧内预测模式的方向性而使用三个一次变换候选。在这种情况下,如果帧内预测模式具有方向性,则二次变换候选可以包括一个变换核,而如果帧内预测模式没有方向性,则二次变换候选可以包括两个变换核。
另外,作为示例(情况3),可以不顾及帧内预测模式的方向性而使用三个一次变换候选。在这种情形下,不顾及帧内预测模式的方向性如何,二次变换候选可以包括一个变换核。
-组合C
在组合C中,如下表14中例示的,可以根据帧内预测模式来定义一次变换候选和二次变换核。
[表14]
Figure BDA0002641728920000381
参照上表14,作为示例(情况1),如果帧内预测模式具有方向性,则可以使用两个一次变换候选,而如果帧内预测模式没有方向性(例如,DC模式、平面模式),则可以使用三个一次变换候选。在这种情形下,不顾及帧内预测模式的方向性如何,二次变换候选可以包括两个变换核。即,如上所述,可以根据帧内预测模式来预定义多个二次变换核集,并且多个预定义的二次变换核集中的每一个可以包括两个变换核。
另外,作为示例(情况2),如果帧内预测模式具有方向性,则可以使用两个一次变换候选,而如果帧内预测模式没有方向性,则可以使用三个一次变换候选。在这种情况下,如果帧内预测模式具有方向性,则二次变换候选可以包括一个变换核,而如果帧内预测模式没有方向性,则二次变换候选可以包括两个变换核。
另外,作为示例(情况3),如果帧内预测模式具有方向性,则可以使用两个一次变换候选,而如果帧内预测模式没有方向性,则可以使用三个一次变换候选。在这种情形下,不顾及帧内预测模式的方向性如何,二次变换候选可以包括一个变换核。
给出的以上描述侧重于使用多个一次变换候选的情况。举例来说,下面描述了在使用固定的一次变换候选的情况下一次变换与二次变换的组合。
-组合D
在组合D中,如下表15中例示的,可以根据帧内预测模式来定义一次变换候选和二次变换核。
[表15]
Figure BDA0002641728920000391
参照上表15,作为实施方式,可以不顾及帧内预测模式而固定地使用一个一次变换候选。例如,固定的一次变换候选可以是DCT2、DST7和/或DCT8的至少一个组合。
作为示例(情况1),可以不顾及帧内预测模式而固定地使用一个一次变换候选。在这种情形下,不顾及帧内预测模式的方向性如何,二次变换候选可以包括两个变换核。即,如上所述,可以根据帧内预测模式来预定义多个二次变换核集,并且多个预定义的二次变换核集中的每一个可以包括两个变换核。
另外,作为示例(情况2),可以不顾及帧内预测模式而固定地使用一个一次变换候选。在这种情况下,如果帧内预测模式具有方向性,则二次变换候选可以包括一个变换核,而如果帧内预测模式没有方向性,则二次变换候选可以包括两个变换核。
另外,作为示例(情况3),可以不顾及帧内预测模式而固定地使用一个一次变换候选。在这种情形下,不顾及帧内预测模式的方向性如何,二次变换候选可以包括一个变换核。
-组合E
在组合E中,如下表16中例示的,可以根据帧内预测模式来定义一次变换候选和二次变换核。
[表16]
Figure BDA0002641728920000392
Figure BDA0002641728920000401
参照上表16,只要应用DCT2作为一次变换,就可以定义二次变换。换句话说,如果不应用MTS(即,如果应用DCT2作为一次变换),则可以应用二次变换。如上图 10中例示的,按分为应用MTS的情况和不应用MTS的情况的方式来描述本公开,但是不限于这种表达。例如,是否应用MTS可以意指是否使用除了预定义的特定变换类型 (其可以被称为基本变换类型、默认变换类型等)之外的其它变换类型(或变换核)。如果应用了MTS,则除了基本变换类型之外的其它变换类型(例如,多个变换类型当中的任一种变换类型或者两种或更多种变换类型的组合变换类型)可以被用于变换。此外,如果不应用MTS,则基本变换类型可以被用于变换。在实施方式中,基本变换类型可以被配置(或限定)为DCT2。
作为示例(情况1),当DCT2被应用于一次变换时,可以应用二次变换。在这种情形下,不顾及帧内预测模式的方向性如何,二次变换候选可以包括两个变换核。即,如上所述,可以根据帧内预测模式来预定义多个二次变换核集,并且多个预定义的二次变换核集中的每一个可以包括两个变换核。
另外,作为示例(情况2),当DCT2被应用于一次变换时,可以应用二次变换。在这种情况下,如果帧内预测模式具有方向性,则二次变换候选可以包括一个变换核,而如果帧内预测模式没有方向性,则二次变换候选可以包括两个变换核。
另外,作为示例(情况3),当DCT2被应用于一次变换时,可以应用二次变换。在这种情形下,不顾及帧内预测模式的方向性如何,二次变换候选可以包括一个变换核。
图26是例示了根据应用本公开的实施方式的对视频信号进行变换的方法的流程图。
参照图26,为了便于解释,基于解码器描述了本公开,但是本公开不限于此。根据本公开的实施方式的用于视频信号的变换方法甚至可以基本上等同地应用于编码器。图26中例示的流程图可以由解码设备200或逆变换单元230执行。
在S2601中,解码设备200对指示应用于当前块的一次变换的一次变换核的第一语法元素进行解析。
在S2602中,解码设备200基于第一语法元素来确定是否能够对当前块应用二次变换。
如果能够对当前块应用二次变换,则在S2603中,解码设备200对指示应用于当前块的二次变换的二次变换核的第二语法元素进行解析。
在S2604中,解码设备200通过使用第二语法元素所指示的二次变换核对当前块的左上特定区域执行二次逆变换来导出二次逆变换后的块。
在S2605中,解码设备200通过使用第一语法元素所指示的一次变换核对二次逆变换后的块执行一次逆变换来导出当前块的残差块。
如上所述,如果第一语法元素指示预定义的第一变换核,则可以通过确定能够对当前块应用二次变换来执行步骤S2602。在这种情形下,第一变换核可以被限定为 DCT2。
另外,如上所述,解码设备200可以基于当前块的帧内预测模式来确定预定义的二次变换核集当中的用于当前块的二次变换的二次变换核集。第二语法元素可以指示所确定的二次变换核集中的应用于当前块的二次变换的二次变换核。
另外,如上所述,预定义的二次变换核集中的每一个可以包括两个变换核。
在本公开的实施方式中,将描述其中使用多重变换集(MTS)的语法结构的示例。
例如,下表17示出了序列参数集的语法结构的示例。
[表17]
Figure BDA0002641728920000421
参照图17,可以通过序列参数集语法来发信号通知是否能够使用根据本公开的实施方式的MTS。这里,sps_MTS_intra_enabled_flag指示是否相对于帧内编码单元以较低级别语法(例如,残差编码语法或变换单元语法)存在MTS标志或MTS索引。另外, sps_MTS_inter_enabled_flag指示是否相对于帧间编码单元以较低级别语法存在MTS 标志或MTS索引。
作为另一示例,下表18示出了变换单元语法结构的示例。
[表18]
Figure BDA0002641728920000431
参照表18,cu_MTS_flag指示是否向亮度变换块的残差样本应用MTS。例如,如果cu_MTS_flag=0,则不向亮度变换块的残差样本应用MTS,而如果cu_MTS_flag=1,则向亮度变换块的残差样本应用MTS。
如上所述,在本公开中基于MTS标志分别描述了应用MTS的情况和不应用MTS 的情况,但是本公开不限于此。例如,是否应用MTS可以与是否使用除了预定义的特定变换类型(其可以被称为基本变换类型、默认变换类型等)之外的变换类型(或变换核)的含义相同。如果应用了MTS,则可以将除了默认变换类型之外的变换类型(例如,多种变换类型中的任一种或者其两种或更多种的组合)用于变换,并且如果不应用MTS,则可以将默认变换类型用于变换。在实施方式中,默认变换类型可以被设置 (或限定)为DCT2。
作为示例,指示是否向当前变换块应用MTS的MTS标志语法和指示在应用MTS 时应用于当前块的变换类型的MTS索引语法可以被独立地从编码器发送到解码器。作为另一示例,包括是否向当前变换块应用MTS和在应用MTS时应用于当前块的变换类型二者的语法(例如,MTS索引)可以被从编码器发送到解码器。即,在后一示例中,指示包括以上提到的默认变换类型的变换类型组(或变换类型集)中的应用于当前变换块(或单元)的变换类型的语法(或语法元素)可以被从编码器发送到解码器。
因此,指示应用于当前变换块的变换类型的语法(MTS索引)可以包括关于是否在不顾及其表示的情况下应用MTS的信息。换句话说,尽管在后一示例中,因为可以仅发信号通知MTS索引而不发信号通知MTS标志,所以MTS可以被视为包括DCT2,但是应用DCT2的情况可以在本公开中被描述为不应用MTS的情况,并且相对于MTS 的技术范围不限于所述限定。
此外,作为另一示例,下表19示出了残差单元语法结构的示例。
[表19]
Figure BDA0002641728920000441
Figure BDA0002641728920000451
Figure BDA0002641728920000461
Figure BDA0002641728920000471
参照表19,可以通过残差语法来发信号通知transform_skip_flag和/或MTS_idx语法(或语法元素)。然而,这仅仅是示例,并且本公开不限于此。例如,可以通过变换单元语法来发信号通知transform_skip_flag和/或MTS_idx语法。
下面将描述能够被用于二次变换的以上提到的二次变换矩阵的具体实施方式。如上所述,二次变换可以被称为不可分二次变换(NSST)、低频不可分变换(LFNST) 或简化二次变换(RST)。
如上所述,在本公开的实施方式中,四个变换集(或二次变换集)可以被用于提高应用二次变换时的存储效率。作为实施方式,编码器/解码器可以将索引0、1、2和 3分配给这四个变换集。
此外,如上所述,每个变换集可以包括预定数目的变换核。作为实施方式,可以在编码器和解码器中预定义用于二次变换的四个变换集,并且每个变换集可以包括一个或两个变换矩阵(或变换类型或变换核)。
下表20示出了适用于8×8区域的变换的示例。
[表20]
Figure BDA0002641728920000481
Figure BDA0002641728920000491
Figure BDA0002641728920000501
Figure BDA0002641728920000511
Figure BDA0002641728920000521
Figure BDA0002641728920000531
Figure BDA0002641728920000541
表20示出了将变换矩阵系数与缩放值128相乘的情况。在表20中,阵列 g_aiNSST8×8[4][2][16][64]中的第一个输入[4]表示变换集的数目(这里,可以通过索引0、1、2和3标识变换集),第二个输入[2]表示构成每个变换集的变换矩阵的数目,第三输入[16]和第四输入[64]表示16×64 RST(简化二次变换)的行和列。
尽管表20假定了变换集包括两个变换矩阵的情况,但是如果变换集包括一个变换矩阵,则其可以被配置为针对表20中的每个变换集以特定顺序使用变换矩阵。例如,当变换集包括一个变换矩阵时,编码器/解码器可以在表20中的每个变换集中使用预定的(即,第一或第二)变换矩阵。
当应用表20的RST时,编码器/解码器可以被配置(限定或设置)为输出16个变换系数,或者被配置为通过仅应用16×64矩阵的m×64部分来仅输出m个变换系数。例如,编码器/解码器可以被配置为使用仅从顶部起通过设置m=8的8×64矩阵输出仅8个变换系数。通过以这种方式应用简化二次变换,能够将计算量减少一半。作为实施方式,编码器/解码器可以将8×64矩阵应用于8×8变换单元(TU),以便减少计算量。
下表21示出了适用于4×4区域的变换的示例。
[表21]
Figure BDA0002641728920000561
Figure BDA0002641728920000571
Figure BDA0002641728920000581
表21示出了将变换矩阵系数与缩放值128相乘的情况。在表21中,阵列 g_aiNSST4×4[4][2][16][16]中的第一个输入[4]表示变换集的数目(这里,可以通过索引0、1、2和3标识变换集),第二个输入[2]表示构成每个变换集的变换矩阵的数目,第三输入[16]和第四输入[16]表示16×64 RST(简化二次变换)的行和列。
尽管表21假定了变换集包括两个变换矩阵的情况,但是如果变换集包括一个变换矩阵,则其可以被配置为针对表21中的每个变换集以特定顺序使用变换矩阵。例如,当变换集包括一个变换矩阵时,编码器/解码器可以在表21中的每个变换集中使用预定的(即,第一或第二)变换矩阵。
当应用表21的RST时,编码器/解码器可以被配置(限定或设置)为输出16个变换系数,或者被配置为通过仅应用16×64矩阵的m×16部分来仅输出m个变换系数。例如,编码器/解码器可以被配置为使用从顶部起通过设置m=8的8×16矩阵来仅输出8个变换系数。通过以这种方式应用简化二次变换,能够将计算量减少一半。作为实施方式,编码器/解码器可以将8×64矩阵应用于8×8变换单元(TU),以便在最坏的情况下减少计算量。
在实施方式中,表20和表21中示出的变换矩阵可以根据预定义的条件应用于4×4、 4×8和8×4左上区域(即,TU)或者仅应用于4×4左上区域。在4×8 TU和8×4 TU的情况下,编码器/解码器可以将其划分为两个4×4区域,并且将所指定的变换应用于每个划分的区域。如果二次变换被限定为仅应用于4×4区域,则可以仅应用(或使用)表 210中定义的变换。
此外,尽管在表20和表21中假定缩放比例为128的情况下定义变换矩阵系数,但是本公开不限于此。例如,可以通过将表20和表21中的缩放值设置为256来限定变换矩阵系数,如表22和表23中所示。
[表22]
Figure BDA0002641728920000601
Figure BDA0002641728920000611
Figure BDA0002641728920000621
Figure BDA0002641728920000631
Figure BDA0002641728920000641
Figure BDA0002641728920000651
Figure BDA0002641728920000661
Figure BDA0002641728920000671
Figure BDA0002641728920000681
[表23]
Figure BDA0002641728920000691
Figure BDA0002641728920000701
Figure BDA0002641728920000711
如上所述,在本公开的实施方式中,四个变换集(或二次变换集)可以被用于提高应用二次变换时的存储效率。作为实施方式,编码器/解码器可以将索引0、1、2和 3分配给这四个变换集。
此外,如上所述,每个变换集可以包括预定数目的变换核。作为实施方式,可以在编码器和解码器中预定义用于二次变换的四个变换集,并且每个变换集可以包括一个或两个变换矩阵(或变换类型或变换核)。
下面将通过各种示例描述适用于二次变换的各种二次变换集和变换矩阵(或变换类型或变换核)。尽管可以详细地定义与表20至表23不同的各种变换矩阵,但是为了方便描述,在本实施方式中,将主要使用示例来描述非定向模式(例如,DC模式和平面模式)以及配置广义二次变换集的方法。
首先,将详细地描述适用于4×4区域的二次变换的示例。在下面相对于能够被用于二次变换的二次变换集的示例当中,第一示例和第四示例中的变换矩阵能够被应用于其中每个变换集包括两个变换矩阵的实施方式。第二示例和第三示例中的变换矩阵能够被应用于其中每个变换集包括一个变换矩阵的实施方式。
具体地,第一示例能够被应用于表15中描述的实施方式的以上提到的组合D和情况1,并且还能够被应用于表12中描述的实施方式的组合A和情况1、表13中描述的实施方式的组合B和情况1、表14中描述的实施方式的组合C和情况1或者表16中描述的实施方式的组合E和情况1。
具体地,第二示例的变换阵列(即,变换集)可以被应用于表15中描述的实施方式的以上提到的组合D和情况3,并且还可以被应用于表12中描述的实施方式的组合A 和情况3、表13中描述的实施方式的组合B和情况3、表14中描述的实施方式的组合C 和情况3或者表16中描述的实施方式的组合E和情况3。
尽管以上提到的组合A、B、C、D和E仅处理其中MTS候选的数目为三个或更少的情况,但是在一次变换中可以针对所有帧内预测模式应用所有四个MTS候选。即使当所有四个MTS候选都被应用时,也可以使用下面的第一示例至第四示例,并且具体地,第四示例的变换阵列可能更适合于应用四个MTS候选的情况。
后续的第五示例至第七示例的变换阵列与应用了35个变换集的情况对应。在变换集被映射到帧内预测模式时可以应用它们,如表24中所示。
[表24]
帧内模式 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
NSST集 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
帧内模式 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66
NSST集 34 33 32 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
在表24中,NSST集索引表示变换集索引。即使当应用表24的映射方法时,也可以应用以上提到的组合A至E。即,可以如上述方法中一样将每个组合应用于第五示例至第八示例。
第五示例和第八示例的变换阵列可以被应用于每个变换集由两个变换矩阵构成的实施方式,并且第六示例和第七示例的变换阵列可以被应用于每个变换集由一个变换矩阵构成的实施方式。
具体地,第五示例可以被应用于表15中描述的实施方式的以上提到的组合D和情况1,并且还可以被应用于表12中描述的实施方式的组合A和情况1、表13中描述的实施方式的组合B和情况1、表14中描述的实施方式的组合C和情况1或者表16中描述的实施方式的组合E和情况1。
具体地,第六示例和第七示例的变换阵列(即,变换集)可以被应用于表15中描述的实施方式的以上提到的组合D和情况3,并且还可以被应用于表12中描述的实施方式的组合A和情况3、表13中描述的实施方式的组合B和情况3、表14中描述的实施方式的组合C和情况3或者表16中描述的实施方式的组合E和情况3。
尽管以上提到的组合A、B、C、D和E仅处理其中MTS候选的数目为三个或更少的情况,但是在一次变换中可以针对所有帧内预测模式应用所有四个MTS候选。即使当所有四个MTS候选都被应用时,也可以使用下面的第五示例至第八示例,并且具体地,第八示例的变换阵列可能更适合于应用四个MTS候选的情况。
下面的第一示例至第八示例的变换阵列当中的适用于4×4区域的变换示例对应于与缩放值128相乘的变换矩阵。以下示例的变换阵列通常可以被表示为 g_aiNSST4x4[N1][N2][16][16]阵列。这里,N1表示变换集的数目。这里,N1为4或35,并且可以由索引0,1,…,N1-1标识。N2表示构成每个变换集的变换矩阵的数字(1或 2),并且[16][16]表示16×16变换矩阵。
在下面的示例中,当变换集由一个变换构成时,特定顺序的变换矩阵可以被用于每个变换集。例如,当变换集包括一个变换矩阵时,编码器/解码器可以在每个变换集中使用预定义的(即,第一或第二)变换矩阵。
为了减少最坏情况下的计算量,编码器/解码器可以向4×4 TU应用8×16矩阵。在以下示例中适用于4×4区域的变换可以被应用于4×4 TU、4×M TU和M×4 TU(M>4),并且当其被应用于4×M TU和M×4 TU时,TU可以被划分成4×4区域,并且可以向其应用每个指定变换,或者可以仅向4×8或8×4左上区域应用变换。此外,可以仅向4×4左上区域应用变换。
在实施方式中,为了减少最坏情况下的计算量,可以应用以下内容。
例如,相对于宽度为W和高度为H的块,当W>=8且H>=8时,编码器/解码器可以将适用于8×8区域的变换阵列(或变换矩阵或变换核)应用于该块的8×8左上区域 (例如,16×64矩阵)。如果W=8并且H=8,则编码器/解码器只能应用16×64矩阵中的 8×64部分。在这种情况下,二次变换的输入可以被作为8个变换系数生成,并且对应区域的其余系数可以被视为0。
此外,例如,如果相对于具有宽度W和高度H的块,W和H中的一个小于8(即,其为4),则编码器/解码器可以应用适用于4×4区域的变换阵列。如果W=4并且H=4,则编码器/解码器只能应用16×16矩阵中的8×16部分。在这种情况下,二次变换的输入可以被作为8个变换系数生成,并且对应区域的其余系数可以被视为0。
在实施方式中,如果(W,H)=(4,8)或(8,4),则编码器/解码器可以仅向4×4左上区域应用二次变换。当W或H大于8时,编码器/解码器仅向两个4×4左上块应用二次变换。即,编码器/解码器可以将最多4×8或8×4左上区域划分成两个4×4块,并且对其应用所指定的变换矩阵。
第一示例
第一示例可以被限定为下表25。可以定义四个变换集,并且每个变换集可以由两个变换矩阵构成。
[表25]
Figure BDA0002641728920000751
Figure BDA0002641728920000761
第二示例
第二示例可以被限定为下表26。可以定义四个变换集,并且每个变换集可以由一个变换矩阵构成。
[表26]
Figure BDA0002641728920000771
第三示例
第三示例可以被限定为下表27。可以定义四个变换集,并且每个变换集可以由一个变换矩阵构成。
[表27]
Figure BDA0002641728920000781
第四示例
第四示例可以被限定为下表28。可以定义四个变换集,并且每个变换集可以由两个变换矩阵构成。
[表28]
Figure BDA0002641728920000791
Figure BDA0002641728920000801
第五示例
第五示例可以被限定为下表29。可以定义35个变换集,并且每个变换集可以由两个变换矩阵构成。
[表29]
Figure BDA0002641728920000811
第六示例
第六示例可以被限定为下表30。可以定义35个变换集,并且每个变换集可以由一个变换矩阵构成。
[表30]
Figure BDA0002641728920000821
第七示例
第七示例可以被限定为下表31。可以定义35个变换集,并且每个变换集可以由一个变换矩阵构成。
[表31]
Figure BDA0002641728920000822
第八示例
第八示例可以被限定为下表32。可以定义35个变换集,并且每个变换集可以由两个变换矩阵构成。
[表32]
Figure BDA0002641728920000831
Figure BDA0002641728920000841
下文中,将描述适用于8×8区域的二次变换的示例。在针对可用于二次变换的二次变换集的以下示例当中,第九示例和第十示例中的变换矩阵可以被应用于每个变换集由两个变换矩阵构成的实施方式。第十示例和第十一示例中的变换矩阵可以被应用于每个变换集由一个变换矩阵构成的实施方式。
具体地,第九示例可以被应用于表15中描述的实施方式的以上提到的组合D和情况1,并且还可以被应用于表12中描述的实施方式的组合A和情况1、表13中描述的实施方式的组合B和情况1、表14中描述的实施方式的组合C和情况1或者表16中描述的实施方式的组合E和情况1。
具体地,第十示例的变换阵列(即,变换集)可以被应用于表15中描述的实施方式的以上提到的组合D和情况3,并且还可以被应用于表12中描述的实施方式的组合A 和情况3、表13中描述的实施方式的组合B和情况3、表14中描述的实施方式的组合C 和情况3或者表16中描述的实施方式的组合E和情况3。
尽管以上提到的组合A、B、C、D和E仅处理其中MTS候选的数目为三个或更少的情况,但是在一次变换中可以针对所有帧内预测模式应用所有四个MTS候选。即使当所有四个MTS候选都被应用时,也可以使用下面的第九示例至第十二示例,并且具体地,第十二示例的变换阵列可能更适合于应用四个MTS候选的情况。
后续的第十三示例至第十六示例的变换阵列对应于应用了35个变换集的情况。它们可以被应用于变换集被映射到相应的帧内预测模式的情况,如以上提到的表24中所示的。
在表24中,NSST集索引表示变换集索引。即使当应用表24的映射方法时,也可以应用以上提到的组合A至E。即,可以如上述方法中一样将每个组合应用于第十三示例至第十六示例。
第十三示例和第十六示例的变换阵列可以被应用于每个变换集由两个变换矩阵构成的实施方式,并且第十四示例和第十五示例的变换阵列可以被应用于每个变换集由一个变换矩阵构成的实施方式。
具体地,第十三示例可以被应用于表15中描述的实施方式的以上提到的组合D和情况1,并且还可以被应用于表12中描述的实施方式的组合A和情况1、表13中描述的实施方式的组合B和情况1、表14中描述的实施方式的组合C和情况1或者表16中描述的实施方式的组合E和情况1。
具体地,第十四示例和第十五示例的变换阵列(即,变换集)可以被应用于表15 中描述的实施方式的以上提到的组合D和情况3,并且还可以被应用于表12中描述的实施方式的组合A和情况3、表13中描述的实施方式的组合B和情况3、表14中描述的实施方式的组合C和情况3或者表16中描述的实施方式的组合E和情况3。
尽管以上提到的组合A、B、C、D和E仅处理其中MTS候选的数目为三个或更少的情况,但是在一次变换中可以针对所有帧内预测模式应用所有四个MTS候选。即使当所有四个MTS候选都被应用时,也可以使用下面的第十三示例至第十六示例,并且具体地,第八示例的变换阵列可能更适合于应用四个MTS候选的情况。
下面的第八示例至第十六示例的变换阵列当中的适用于8×8区域的变换示例对应于与缩放值128相乘的变换矩阵。以下示例的变换阵列通常可以被表示为 g_aiNSST8x8[N1][N2][16][64]阵列。这里,N1表示变换集的数目。这里,N1为4或35,并且可以被用索引0,1,…,N1-1标识。N2表示构成每个变换集的变换矩阵的数字(1 或2),并且[16][64]表示16×64简化二次变换(RST)。
在下面的示例中,当变换集由一个变换构成时,特定顺序的变换矩阵可以被用于每个变换集。例如,当变换集包括一个变换矩阵时,编码器/解码器可以在每个变换集中使用预定义的(即,第一或第二)变换矩阵。
尽管当应用RST时输出16个变换系数,但是仅m个变换系数可以被配置为当仅应用16×64矩阵中的m×64部分时才被输出。例如,能够通过以下步骤将计算量减少一半:将m设置为8,将仅从顶部起的8×64矩阵相乘以仅输出8个变换系数。
第九示例
第九示例可以被限定为下表33。可以定义四个变换集,并且每个变换集可以由两个变换矩阵构成。
[表33]
Figure BDA0002641728920000861
Figure BDA0002641728920000871
Figure BDA0002641728920000881
第十示例
第十示例可以被限定为下表34。可以定义四个变换集,并且每个变换集可以由一个变换矩阵构成。
[表34]
Figure BDA0002641728920000891
Figure BDA0002641728920000901
第十一示例
第十一示例可以被限定为下表35。可以定义四个变换集,并且每个变换集可以由一个变换矩阵构成。
[表35]
Figure BDA0002641728920000911
Figure BDA0002641728920000921
第十二示例
第十二示例可以被限定为下表36。可以定义四个变换集,并且每个变换集可以由两个变换矩阵构成。
[表36]
Figure BDA0002641728920000931
Figure BDA0002641728920000941
Figure BDA0002641728920000951
第十三示例
第十三示例可以被限定为下表37。可以定义35个变换集,并且每个变换集可以由两个变换矩阵构成。
[表37]
Figure BDA0002641728920000961
Figure BDA0002641728920000971
Figure BDA0002641728920000981
第十四示例
第十四示例可以被限定为下表38。可以定义35个变换集,并且每个变换集可以由一个变换矩阵构成。
[表38]
Figure BDA0002641728920000991
第十五示例
第十五示例可以被限定为下表39。可以定义35个变换集,并且每个变换集可以由一个变换矩阵构成。
[表39]
Figure BDA0002641728920001001
Figure BDA0002641728920001011
第十六示例
第十六示例可以被限定为下表40。可以定义35个变换集,并且每个变换集可以由两个变换矩阵构成。
[表40]
Figure BDA0002641728920001021
Figure BDA0002641728920001031
Figure BDA0002641728920001041
图27是示出了根据应用本公开的实施方式的对视频信号进行变换的方法的流程图。
参照图27,尽管为了方便描述将描述侧重于解码器,但是本公开不限于此,并且根据本实施方式的对视频信号进行变换的方法可以等同地应用于编码器。图27的流程图可以由解码设备200或逆变换单元230执行。
解码设备200基于当前块的帧内预测模式从预定义的二次变换集当中确定应用于当前块的二次变换集(S2701)。
解码设备200获取指示所确定的二次变换集中的应用于当前块的二次变换矩阵的第一语法元素(S2702)。
解码设备200通过使用第一语法元素所指定的二次变换矩阵对当前块的左上区域执行二次逆变换来导出二次逆变换后的块(S2703)。
解码设备200通过使用当前块的一次变换矩阵对二次逆变换后的块执行一次逆变换来导出当前块的残差块(S2704)。
如上所述,预定义的二次变换集中的每一个可以包括两个二次变换矩阵。
如上所述,步骤S2704还可以包括基于当前块的宽度和高度来确定二次逆变换的输入长度和输出长度的步骤。如上所述,当当前块的高度和宽度中的每一个为4时,不可分变换的输入长度可以被确定为8并且其输出长度可以被确定为16。
如上所述,解码设备200可以对指示应用于当前块的一次变换的一次变换矩阵的第二语法元素进行解析。另外,解码设备200可以基于第二语法元素确定是否可以对当前块应用二次变换。
如上所述,当第二语法元素指示预定义的特定变换类型时,可以通过确定可以对当前块应用二次变换来执行确定是否可以应用二次变换的步骤。
如上所述,预定义的特定变换类型可以是DCT2。
图28是作为应用本公开的实施方式的对视频信号进行处理的设备的示例性框图。图28中示出的视频信号处理设备可以对应于图1的编码设备或图2的解码设备。
用于对视频信号进行处理的视频处理设备2800包括存储视频信号的存储器2820以及与存储器组合并对视频信号进行处理的处理器2810。
根据本公开的实施方式的处理器2810可以被配置为用于视频信号处理的至少一个处理电路,并且可以通过执行对视频信号进行编码或解码的命令来处理视频信号。即,处理器2810可以通过执行上述编码或解码方法对原始视频数据进行编码或者对编码后的视频信号进行解码。
此外,应用本公开的处理方法可以以由计算机执行并且存储在计算机可读记录介质中的程序的形式制造。根据本公开的具有数据结构的多媒体数据也可以被存储在计算机可读记录介质中。计算机可读记录介质包括其中存储了计算机可读取的数据的所有类型的存储装置和分布式存储装置。计算机可读记录介质可以包括例如Blueray盘 (BD)、通用串行总线(USB)、ROM、PROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。此外,计算机可读记录介质包括以载波(例如,通过互联网进行传输)的形式实现的媒体。此外,通过编码方法生成的比特流可以被存储在计算机可读记录介质中,或者可以通过有线/无线通信网络传输。
此外,本公开的实施方式可以根据程序代码被实现为计算机程序产品,并且程序代码可以根据本公开的实施方式在计算机中执行。程序代码可以被存储在计算机可读载体上。
如上所述,本公开的实施方式可以在处理器、微处理器、控制器或芯片上实现和执行。例如,每幅图中示出的功能单元可以在计算机、处理器、微处理器、控制器或芯片上实现和执行。
此外,应用本公开的解码器和编码器可以被包括在多媒体广播发送/接收设备、移动通信终端、家庭影院视频系统、数字影院视频系统、监视相机、视频通信设备、诸如视频通信这样的实时通信设备、移动流传输装置、存储介质、摄像机、视频点播 (VoD)服务提供设备、顶置视频(OTT视频)视频系统、互联网流传输服务提供设备、3D视频系统、视频电话视频系统、医疗视频系统等中,并且可以被用于处理视频信号或数据信号。例如,OTT视频系统可以包括游戏控制台、蓝光播放器、互联网访问TV、家庭影院系统、智能电话、平板PC、数字录像机(DVR)等。
此外,应用本公开的处理方法可以以由计算机执行并且被存储在计算机可读记录介质中的程序的形式制造。根据本公开的具有数据结构的多媒体数据也可以被存储在计算机可读记录介质中。计算机可读记录介质包括其中存储了计算机可读取的数据的所有类型的存储装置和分布式存储装置。计算机可读记录介质可以包括例如Blueray 盘(BD)、通用串行总线(USB)、ROM、PROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。此外,计算机可读记录介质包括以载波(例如,通过互联网进行传输)的形式实现的媒体。此外,通过编码方法生成的比特流可以被存储在计算机可读记录介质中,或者可以通过有线/无线通信网络传输。
此外,本公开的实施方式可以根据程序代码被实现为计算机程序产品,并且程序代码可以根据本公开的实施方式在计算机中执行。程序代码可以被存储在计算机可读载体上。
上述实施方式是本公开的元件和特征的组合。除非另外提到,否则这些元件或特征可以被视为是选择性的。每个元件或特征可以在不与其它元件或特征组合的情况下实践。另外,本公开的实施方式可以通过组合元件和/或特征的部分来构造。可以重新布置本公开的实施方式中描述的操作顺序。任一个实施方式的一些构造可以被包括在另一个实施方式中并且可以被另一个实施方式的对应构造来取代。本领域的技术人员显而易见的是,在所附的权利要求中没有彼此明确引用的权利要求可以按组合形式作为示例性实施方式存在,或者在提交申请之后通过后续修改被包括作为新的权利要求。
本公开的实现方式可以通过各种手段(例如,硬件、固件、软件或其组合)来实现。在硬件配置中,根据本公开的实现方式的方法可以由一个或更多个专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理器件(DSPD)、可编程逻辑器件 (PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器等来实现。
在固件或软件配置中,本公开的实现方式可以以模块、程序、函数等形式来实现。软件代码可以被存储在存储单元中并且由处理器来执行。存储器可以位于处理器的内部或外部,并且可以经由各种已知手段将数据发送到处理器和从处理器接收数据。
本领域的技术人员将领会,在不脱离本公开的精神和基本特性的情况下,本公开可以以与本文中阐述的方式不同的其它特定方式来执行。因此,以上实施方式因此将被理解为在所有方面都是例示性的,而非限制性的。本公开的范围应该由所附的权利要求及其法律等同物而非以上描述限定,并且落入所附的权利要求的含义和等同范围内的所有改变都应当被包含在本文中。
工业实用性
虽然已经出于例示目的描述了本公开的示例性方面,但是本领域的技术人员应该领会的是,可以在不脱离本公开的基本特性的情况下进行各种修改、添加和替代。

Claims (11)

1.一种对视频信号进行解码的方法,该方法包括以下步骤:
基于当前块的帧内预测模式确定预定义的二次变换集当中的应用于所述当前块的二次变换集;
获取指定所确定的二次变换集中的哪个二次变换矩阵被应用于所述当前块的第一语法元素;
通过基于所述第一语法元素所指定的二次变换矩阵对所述当前块的左上区域执行二次逆变换来导出二次逆变换后的块;以及
通过基于所述当前块的一次变换矩阵对所述二次逆变换后的块执行一次逆变换来导出所述当前块的残差块,
其中,基于所述当前块的宽度和高度为4,所述二次逆变换的输入长度被确定为8,并且基于所述当前块的宽度和高度为8,所述二次逆变换的所述输入长度被确定为8。
2.根据权利要求1所述的方法,
其中,所述预定义的二次变换集中的每一个包括两个二次变换矩阵。
3.根据权利要求1所述的方法,所述方法还包括以下步骤:
对包括针对要被应用以便导出所述当前块的所述残差块的一次变换矩阵的信息的第二语法元素进行解析;以及
基于所述第二语法元素来确定是否能够对所述当前块应用二次变换。
4.根据权利要求3所述的方法,
其中,基于所述第二语法元素包括针对预定义的特定变换类型的信息,通过确定能够对所述当前块应用二次变换来执行确定是否能够应用所述二次变换。
5.根据权利要求4所述的方法,
其中,所述预定义的特定变换类型被限定为DCT2。
6.一种对视频信号进行编码的方法,该方法包括以下步骤:
基于帧内预测模式获取当前块的预测块;
基于所述预测块生成所述当前块的残差块;
对所述残差块执行一次变换以获取一次变换后的块;以及
对所述一次变换后的块的左上区域执行二次变换,
其中,执行所述二次变换的步骤包括以下步骤:
基于当前块的所述帧内预测模式确定预定义的二次变换集当中的应用于所述当前块的二次变换集;
生成指定所确定的二次变换集中的哪个二次变换矩阵被应用于所述一次变换后的块的第一语法元素;以及
通过基于所述第一语法元素所指定的二次变换矩阵执行所述二次变换来获取二次变换后的块,
其中,基于所述当前块的宽度和高度为4,所述二次变换的输出长度被确定为8,并且基于所述当前块的宽度和高度为8,所述二次变换的所述输出长度被确定为8。
7.根据权利要求6所述的方法,
其中,所述预定义的二次变换集中的每一个包括两个二次变换矩阵。
8.根据权利要求6所述的方法,所述方法还包括以下步骤:
生成指示要被应用以便导出所述当前块的所述残差块的一次变换矩阵的第二语法元素;以及
基于所述第二语法元素来确定是否对所述一次变换后的块应用所述二次变换。
9.根据权利要求8所述的方法,
其中,基于所述第二语法元素包括针对预定义的特定变换类型的信息,通过确定对所述一次变换后的块应用所述二次变换来执行确定是否应用所述二次变换,并且
其中,所述预定义的特定变换类型被限定为DCT2。
10.一种计算机可读存储介质,所述计算机可读存储介质用于存储通过执行以下步骤生成的编码后的图片信息:
基于帧内预测模式获取当前块的预测块;
基于所述预测块生成所述当前块的残差块;
对所述残差块执行一次变换以获取一次变换后的块;以及
对所述一次变换后的块的左上区域执行二次变换,
其中,执行所述二次变换的步骤包括以下步骤:
基于当前块的所述帧内预测模式确定预定义的二次变换集当中的应用于所述当前块的二次变换集;
生成指定所确定的二次变换集中的哪个二次变换矩阵被应用于所述一次变换后的块的第一语法元素;以及
通过基于所述第一语法元素所指定的二次变换矩阵执行所述二次变换来获取二次变换后的块,
其中,基于所述当前块的宽度和高度为4,所述二次变换的输出长度被确定为8,并且基于所述当前块的宽度和高度为8,所述二次变换的所述输出长度被确定为8。
11.一种用于数据的发送方法,所述数据包括用于图像的比特流,所述方法包括以下步骤:
获取用于所述图像的所述比特流;以及
发送所述比特流的所述数据,
其中,所述比特流是通过执行以下步骤来生成的:
基于帧内预测模式获取当前块的预测块;
基于所述预测块生成所述当前块的残差块;
对所述残差块执行一次变换以获取一次变换后的块;以及
对所述一次变换后的块的左上区域执行二次变换,
其中,执行所述二次变换的步骤包括以下步骤:
基于当前块的所述帧内预测模式确定预定义的二次变换集当中的应用于所述当前块的二次变换集;
生成指定所确定的二次变换集中的哪个二次变换矩阵被应用于所述一次变换后的块的第一语法元素;以及
通过基于所述第一语法元素所指定的二次变换矩阵执行所述二次变换来获取二次变换后的块,
其中,基于所述当前块的宽度和高度为4,所述二次变换的输出长度被确定为8,并且基于所述当前块的宽度和高度为8,所述二次变换的所述输出长度被确定为8。
CN201980014404.7A 2018-09-05 2019-09-05 对视频信号进行编码/解码的方法及其设备 Active CN111742555B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202210950690.1A CN115484463A (zh) 2018-09-05 2019-09-05 对视频信号进行解码/编码及发送数据的设备
CN202210949304.7A CN115514973A (zh) 2018-09-05 2019-09-05 对视频信号进行解码/编码及发送数据的设备
CN202210949305.1A CN115514974A (zh) 2018-09-05 2019-09-05 对视频信号进行解码/编码及发送数据的方法及介质

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201862727550P 2018-09-05 2018-09-05
US62/727,550 2018-09-05
US201862731073P 2018-09-13 2018-09-13
US201862731078P 2018-09-13 2018-09-13
US201862731075P 2018-09-13 2018-09-13
US62/731,078 2018-09-13
US62/731,075 2018-09-13
US62/731,073 2018-09-13
PCT/KR2019/011514 WO2020050665A1 (ko) 2018-09-05 2019-09-05 비디오 신호의 부호화/복호화 방법 및 이를 위한 장치

Related Child Applications (3)

Application Number Title Priority Date Filing Date
CN202210949305.1A Division CN115514974A (zh) 2018-09-05 2019-09-05 对视频信号进行解码/编码及发送数据的方法及介质
CN202210950690.1A Division CN115484463A (zh) 2018-09-05 2019-09-05 对视频信号进行解码/编码及发送数据的设备
CN202210949304.7A Division CN115514973A (zh) 2018-09-05 2019-09-05 对视频信号进行解码/编码及发送数据的设备

Publications (2)

Publication Number Publication Date
CN111742555A CN111742555A (zh) 2020-10-02
CN111742555B true CN111742555B (zh) 2022-08-30

Family

ID=69723164

Family Applications (4)

Application Number Title Priority Date Filing Date
CN201980014404.7A Active CN111742555B (zh) 2018-09-05 2019-09-05 对视频信号进行编码/解码的方法及其设备
CN202210950690.1A Pending CN115484463A (zh) 2018-09-05 2019-09-05 对视频信号进行解码/编码及发送数据的设备
CN202210949304.7A Pending CN115514973A (zh) 2018-09-05 2019-09-05 对视频信号进行解码/编码及发送数据的设备
CN202210949305.1A Pending CN115514974A (zh) 2018-09-05 2019-09-05 对视频信号进行解码/编码及发送数据的方法及介质

Family Applications After (3)

Application Number Title Priority Date Filing Date
CN202210950690.1A Pending CN115484463A (zh) 2018-09-05 2019-09-05 对视频信号进行解码/编码及发送数据的设备
CN202210949304.7A Pending CN115514973A (zh) 2018-09-05 2019-09-05 对视频信号进行解码/编码及发送数据的设备
CN202210949305.1A Pending CN115514974A (zh) 2018-09-05 2019-09-05 对视频信号进行解码/编码及发送数据的方法及介质

Country Status (6)

Country Link
US (2) US11245894B2 (zh)
EP (1) EP3723372A4 (zh)
JP (4) JP7055879B2 (zh)
KR (3) KR20240017119A (zh)
CN (4) CN111742555B (zh)
WO (1) WO2020050665A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11350118B2 (en) * 2018-05-30 2022-05-31 Digitalinsights Inc. Image encoding/decoding method and device
WO2020050665A1 (ko) * 2018-09-05 2020-03-12 엘지전자 주식회사 비디오 신호의 부호화/복호화 방법 및 이를 위한 장치
CN116684641A (zh) * 2018-12-06 2023-09-01 Lg电子株式会社 图像编解码方法、存储介质和数据发送方法
JP7171920B2 (ja) 2018-12-19 2022-11-15 エルジー エレクトロニクス インコーポレイティド 2次変換に基づく映像コーディング方法及びその装置
JP7267461B2 (ja) 2019-05-10 2023-05-01 北京字節跳動網絡技術有限公司 ビデオ・データ処理方法、装置、記憶媒体及び記憶方法
EP3967032A4 (en) 2019-06-07 2022-07-27 Beijing Bytedance Network Technology Co., Ltd. CONDITIONAL SIGNALING OF A REDUCED SECONDARY TRANSFORM FOR VIDEO BIANARY FLOWS
CN114208183A (zh) 2019-08-03 2022-03-18 北京字节跳动网络技术有限公司 视频的缩减二次变换中基于位置的模式导出
WO2021032045A1 (en) 2019-08-17 2021-02-25 Beijing Bytedance Network Technology Co., Ltd. Context modeling of side information for reduced secondary transforms in video
US11677984B2 (en) * 2019-08-20 2023-06-13 Qualcomm Incorporated Low-frequency non-separable transform (LFNST) signaling
US11457229B2 (en) * 2019-12-23 2022-09-27 Qualcomm Incorporated LFNST signaling for chroma based on chroma transform skip
US11582491B2 (en) * 2020-03-27 2023-02-14 Qualcomm Incorporated Low-frequency non-separable transform processing in video coding
WO2022265420A1 (ko) * 2021-06-16 2022-12-22 엘지전자 주식회사 영상 코딩 방법 및 그 장치
KR20240010481A (ko) * 2021-06-16 2024-01-23 엘지전자 주식회사 저주파 비분리 변환 설계 방법 및 장치
KR20240010480A (ko) * 2021-06-16 2024-01-23 엘지전자 주식회사 저주파 비분리 변환 설계 방법 및 장치

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018038554A1 (ko) * 2016-08-24 2018-03-01 엘지전자(주) 이차 변환을 이용한 비디오 신호의 인코딩/디코딩 방법 및 장치
CN108141596A (zh) * 2015-09-29 2018-06-08 高通股份有限公司 用于视频译码的非可分离二次变换
CN108141594A (zh) * 2015-10-13 2018-06-08 三星电子株式会社 用于对图像进行编码或解码的方法和设备

Family Cites Families (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05308622A (ja) * 1992-04-28 1993-11-19 Mitsubishi Electric Corp 画像符号化・復号化装置
US6266370B1 (en) * 1996-09-03 2001-07-24 Nippon Telegraph And Telephone Corporation Brightness-variation compensation method and coding/decoding apparatus for moving pictures
US7239755B1 (en) * 1997-07-30 2007-07-03 Lg Electronics Inc. Method of reducing a blocking artifact when coding moving picture
KR100281099B1 (ko) * 1997-07-30 2001-04-02 구자홍 동영상의부호화에따른블록화현상제거방법
US6295320B1 (en) * 1997-12-31 2001-09-25 Lg Electronics Inc. Inverse discrete cosine transforming system for digital television receiver
US6263021B1 (en) * 1998-09-18 2001-07-17 Sarnoff Corporation Treating non-zero quantized transform coefficients as zeros during video compression processing
AUPQ668500A0 (en) * 2000-04-04 2000-05-04 Canon Kabushiki Kaisha Accessing items of information
KR100561398B1 (ko) * 2003-06-10 2006-03-16 삼성전자주식회사 동화상 내 구획별로 휘도 변화를 검출하고 보상하는 장치 및 방법
KR100565308B1 (ko) * 2003-11-24 2006-03-30 엘지전자 주식회사 에스엔알 스케일러빌리티를 위한 동영상 부호화 및 복호화 장치
US20050281332A1 (en) * 2004-06-22 2005-12-22 Wai-Ming Lai Transform coefficient decoding
JP2008532192A (ja) * 2004-11-08 2008-08-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチトラック・デジタルデータ記憶装置のビット検出
US7720299B2 (en) * 2005-05-10 2010-05-18 The Aerospace Corporation Compressed data multiple description transmission and resolution conversion system
JP4856954B2 (ja) * 2005-06-08 2012-01-18 パナソニック株式会社 画像符号化装置
WO2007083933A1 (en) * 2006-01-18 2007-07-26 Lg Electronics Inc. Apparatus and method for encoding and decoding signal
US20080071846A1 (en) * 2006-09-14 2008-03-20 Texas Instruments Incorporated Processor Architecture for Programmable Digital Filters in a Multi-Standard Integrated Circuit
JP4806464B2 (ja) * 2007-03-29 2011-11-02 富士通株式会社 画像圧縮装置、画像圧縮方法、画像復元装置、及びプログラム
JP2010528555A (ja) * 2007-05-29 2010-08-19 エルジー エレクトロニクス インコーポレイティド ビデオ信号の処理方法および装置
KR101946376B1 (ko) * 2007-10-16 2019-02-11 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
US8576914B2 (en) * 2011-01-10 2013-11-05 Cisco Technology, Inc. Integer transform video compression system, method and computer program product
US20110116539A1 (en) * 2009-11-13 2011-05-19 Freescale Semiconductor, Inc. Method and apparatus for video decoding with reduced complexity inverse transform
US9215470B2 (en) * 2010-07-09 2015-12-15 Qualcomm Incorporated Signaling selected directional transform for video coding
US9378185B2 (en) * 2010-09-30 2016-06-28 Texas Instruments Incorporated Transform and quantization architecture for video coding and decoding
WO2012070866A2 (ko) * 2010-11-24 2012-05-31 엘지전자 주식회사 스피치 시그널 부호화 방법 및 복호화 방법
JP5552092B2 (ja) * 2011-06-13 2014-07-16 日本電信電話株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
US9496886B2 (en) * 2011-06-16 2016-11-15 Spatial Digital Systems, Inc. System for processing data streams
US20130003856A1 (en) * 2011-07-01 2013-01-03 Samsung Electronics Co. Ltd. Mode-dependent transforms for residual coding with low latency
RU2715382C2 (ru) * 2011-10-18 2020-02-27 Кт Корпорейшен Способ декодирования видеосигнала
KR102145782B1 (ko) * 2011-10-31 2020-08-19 미쓰비시덴키 가부시키가이샤 동화상 부호화 장치, 동화상 부호화 방법 및 컴퓨터 독취 가능한 기억 매체
JP2013168931A (ja) * 2012-01-18 2013-08-29 Jvc Kenwood Corp 画像符号化装置、画像符号化方法及び画像符号化プログラム
JP2013168932A (ja) * 2012-01-18 2013-08-29 Jvc Kenwood Corp 画像復号装置、画像復号方法及び画像復号プログラム
CN103493128B (zh) * 2012-02-14 2015-05-27 华为技术有限公司 用于执行多信道音频信号的适应性下混和上混的方法及设备
US9736497B2 (en) * 2012-07-10 2017-08-15 Sharp Kabushiki Kaisha Prediction vector generation device, image encoding device, image decoding device, prediction vector generation method, and program
US9319684B2 (en) * 2012-08-21 2016-04-19 Qualcomm Incorporated Alternative transform in scalable video coding
AU2013206815A1 (en) * 2013-07-11 2015-03-05 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding video data
US10313682B2 (en) * 2013-08-26 2019-06-04 Qualcomm Incorporated Determining regions when performing intra block copying
US20160044314A1 (en) * 2014-08-08 2016-02-11 Qualcomm Incorporated System and method for reusing transform structure for multi-partition transform
CN105516730B (zh) * 2014-09-24 2018-04-24 晨星半导体股份有限公司 视讯编码装置及视讯解码装置以及其编码与解码方法
US10405000B2 (en) * 2014-11-21 2019-09-03 Vid Scale, Inc. One-dimensional transform modes and coefficient scan order
RU2596751C1 (ru) 2015-05-07 2016-09-10 Общество с ограниченной ответственностью "НПО БиоМикроГели" Вещество для очистки почвы и твердых поверхностей от масел, в том числе от нефти и нефтепродуктов, и способ его использования (варианты)
US10520916B1 (en) * 2015-06-01 2019-12-31 Richard A Gros & Associates, Inc. Control systems
US10554968B2 (en) * 2015-06-10 2020-02-04 Lg Electronics Inc. Method and apparatus for inter prediction on basis of virtual reference picture in video coding system
WO2017069419A1 (ko) * 2015-10-22 2017-04-27 엘지전자 주식회사 비디오 코딩 시스템에서 인트라 예측 방법 및 장치
SG11201803940PA (en) * 2015-10-23 2018-06-28 Tetsuyuki Hirahata Gene therapy composition
US9721582B1 (en) * 2016-02-03 2017-08-01 Google Inc. Globally optimized least-squares post-filtering for speech enhancement
US9998746B2 (en) * 2016-02-10 2018-06-12 Amazon Technologies, Inc. Video decoder memory optimization
WO2017173593A1 (en) * 2016-04-06 2017-10-12 Mediatek Singapore Pte. Ltd. Separate coding secondary transform syntax elements for different color components
US10708164B2 (en) * 2016-05-03 2020-07-07 Qualcomm Incorporated Binarizing secondary transform index
WO2017191782A1 (en) * 2016-05-04 2017-11-09 Sharp Kabushiki Kaisha Systems and methods for coding transform data
CN113411579B (zh) * 2016-05-13 2024-01-23 夏普株式会社 图像解码装置及其方法、图像编码装置及其方法
CN117201809A (zh) * 2016-08-01 2023-12-08 韩国电子通信研究院 图像编码/解码方法和装置以及存储比特流的记录介质
US11095893B2 (en) * 2016-10-12 2021-08-17 Qualcomm Incorporated Primary transform and secondary transform in video coding
KR102416804B1 (ko) * 2016-10-14 2022-07-05 세종대학교산학협력단 영상 부호화 방법/장치, 영상 복호화 방법/장치 및 비트스트림을 저장한 기록 매체
CN116939202A (zh) 2016-10-14 2023-10-24 世宗大学校产学协力团 影像编码方法、影像解码方法以及传送比特流的方法
US10609367B2 (en) * 2016-12-21 2020-03-31 Qualcomm Incorporated Low-complexity sign prediction for video coding
WO2018119609A1 (zh) * 2016-12-26 2018-07-05 华为技术有限公司 一种基于模板匹配的编解码方法及装置
US20190356915A1 (en) * 2017-01-03 2019-11-21 Lg Electronics Inc. Method and apparatus for encoding/decoding video signal using secondary transform
KR20180085526A (ko) * 2017-01-19 2018-07-27 가온미디어 주식회사 효율적 변환을 처리하는 영상 복호화 및 부호화 방법
GB2564150A (en) * 2017-07-05 2019-01-09 Sony Corp Image data encoding and decoding
US10812797B2 (en) * 2018-02-05 2020-10-20 Tencent America LLC Method, apparatus and medium for decoding or encoding using a low-complexity transform
KR102030384B1 (ko) * 2018-06-19 2019-11-08 광운대학교 산학협력단 잔차 계수 부호화/복호화 방법 및 장치
WO2020050665A1 (ko) * 2018-09-05 2020-03-12 엘지전자 주식회사 비디오 신호의 부호화/복호화 방법 및 이를 위한 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108141596A (zh) * 2015-09-29 2018-06-08 高通股份有限公司 用于视频译码的非可分离二次变换
CN108141594A (zh) * 2015-10-13 2018-06-08 三星电子株式会社 用于对图像进行编码或解码的方法和设备
WO2018038554A1 (ko) * 2016-08-24 2018-03-01 엘지전자(주) 이차 변환을 이용한 비디오 신호의 인코딩/디코딩 방법 및 장치

Also Published As

Publication number Publication date
CN115514974A (zh) 2022-12-23
KR20200086732A (ko) 2020-07-17
KR20240017119A (ko) 2024-02-06
JP2024050763A (ja) 2024-04-10
JP7055879B2 (ja) 2022-04-18
US11882273B2 (en) 2024-01-23
CN115484463A (zh) 2022-12-16
KR102432406B1 (ko) 2022-08-12
WO2020050665A1 (ko) 2020-03-12
JP2023071937A (ja) 2023-05-23
US11245894B2 (en) 2022-02-08
CN115514973A (zh) 2022-12-23
JP2022084596A (ja) 2022-06-07
EP3723372A4 (en) 2021-03-31
JP7432031B2 (ja) 2024-02-15
CN111742555A (zh) 2020-10-02
EP3723372A1 (en) 2020-10-14
KR102631802B1 (ko) 2024-01-31
KR20220115828A (ko) 2022-08-18
JP2021509559A (ja) 2021-03-25
US20200359019A1 (en) 2020-11-12
US20220174273A1 (en) 2022-06-02
JP7242929B2 (ja) 2023-03-20

Similar Documents

Publication Publication Date Title
CN111742555B (zh) 对视频信号进行编码/解码的方法及其设备
CN113039803B (zh) 编码/解码视频信号的方法及其装置
CN111919450B (zh) 用于编码/解码视频信号的方法及其装置
JP7465333B2 (ja) 映像信号を処理するための方法及び装置
CN115134592B (zh) 用于编码或解码图像信号的设备及计算机可读记录介质
CN115037934B (zh) 用于图像信号编码和解码的方法及计算机可读记录介质
KR102658656B1 (ko) 비디오 신호의 부호화/복호화 방법 및 이를 위한 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant