CN112753220A - 基于多重变换选择的图像编码方法及其装置 - Google Patents

基于多重变换选择的图像编码方法及其装置 Download PDF

Info

Publication number
CN112753220A
CN112753220A CN201980062874.0A CN201980062874A CN112753220A CN 112753220 A CN112753220 A CN 112753220A CN 201980062874 A CN201980062874 A CN 201980062874A CN 112753220 A CN112753220 A CN 112753220A
Authority
CN
China
Prior art keywords
transform
mts
core
information
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980062874.0A
Other languages
English (en)
Inventor
M·萨勒海法尔
金昇焕
具文模
林宰显
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN112753220A publication Critical patent/CN112753220A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

根据本发明的图像解码方法包括以下步骤:从比特流中导出当前块的量化变换系数;通过基于量化变换系数执行反量化来导出变换系数;通过基于所述变换系数执行逆变换来导出所述当前块的残差样本;以及基于所述残差样本生成重构图片,其中所述逆变换包括从所述比特流获取与多重变换选择(MTS)相关的信息,并且使用基于与所述MTS相关的信息导出的变换核集来执行所述逆变换。

Description

基于多重变换选择的图像编码方法及其装置
技术领域
本公开涉及一种视频编码技术,更具体地,涉及一种视频编码系统中的基于多重变换选择的视频编码方法及其设备。
背景技术
近来在各种领域中对诸如超高清(HUD)图像和4K或8K或更大视频这样的高分辨率且高质量的图像和视频的需求日益增加。随着图像和视频数据变成高分辨率和高质量,与现有图像和视频数据相比,相对发送的信息量或比特数增加。因此,如果使用诸如现有有线或无线宽带线这样的介质来传输图像数据或者使用现有存储介质来存储图像和视频数据,则传输成本和存储成本增加。
此外,近来对诸如虚拟现实(VR)、人工现实(AR)内容或全息图这样的沉浸式媒体的兴趣和需求日益增加。诸如游戏图像这样的图像特性与真实图像的图像特性不同的图像和视频的广播日益增加。
因此,为了有效地压缩并传输或存储并回放具有这样的各种特性的高分辨率且高质量的图像和视频的信息,需要高效的图像和视频压缩技术。
发明内容
技术任务
本公开提供用于增加视频编码效率的方法和设备。
本公开还提供用于提高变换效率的方法和设备。
本公开还提供基于多重变换选择的视频编码方法和设备。
本公开还提供用于对多重变换选择的信息进行编码的方法和设备,这可以提高编码效率。
技术方案
一方面,提供了一种由解码设备执行的图像解码方法。所述方法包括:从比特流导出当前块的量化变换系数;通过基于所述量化变换系数执行反量化来导出变换系数;通过基于所述变换系数执行逆变换来导出所述当前块的残差样本;以及基于所述残差样本产生重构图片,其中,通过从比特流获得用于多重变换选择(MTS)的信息并使用基于用于MTS的信息导出的变换核集来执行逆变换。
另一方面,提供了一种由编码设备执行的图像编码方法。所述方法包括:导出当前块的残差样本;通过基于所述残差样本执行变换来导出所述当前块的变换系数;通过基于所述变换系数执行量化来导出量化变换系数;基于所述量化变换系数产生残差信息;以及对包括所述残差信息的图像信息进行编码,其中通过使用应用于所述当前块的变换核集来执行所述变换,其中生成表示变换核集的用于多重变换选择(MTS)的信息,并且其中用于MTS的信息被包括在图像信息中。
技术效果
根据本公开,可以提高图像/视频的整体压缩效率。
根据本公开,可以通过高效变换来减少针对残差处理发送的数据量,并且可以提高残差编码效率。
根据本公开,在应用多重变换选择时,可以根据变换效率将不同的变换核应用于水平和竖直方向,并且可以提高整体编码率。
附图说明
图1示意性地示出了可以应用本文档的实施方式的视频/图像编码系统的示例。
图2是示出可以应用本文档的实施方式的视频/图像编码设备的配置的示意图。
图3是示出可以应用本文档的实施方式的视频/图像解码设备的配置的示意图。
图4示意性地表示根据本公开的多重变换技术。
图5是示出根据本公开的实施方式的根据是否应用多重变换选择(MTS或EMT)来确定变换组合的处理的流程图。
图6和图7是用于描述根据本公开的实施方式的不可分二次变换(NSST)的示图。
图8和图9是用于描述根据本公开的实施方式的RST的示图。
图10表示能够应用于HEVC标准中所应用的4×4变换系数或变换系数块(4×4块,系数组(CG))的三个正向扫描顺序。
图11和图12是示出根据本公开的实施方式的根据对角扫描顺序的变换系数的映射的示图。
图13是示意性地示出根据本公开的实施方式的编码设备的视频/图像编码方法的流程图。
图14是示意性地示出根据本公开的实施方式的解码设备的视频/图像解码方法的流程图。
图15示出了可以应用本文档中公开的实施方式的内容流传输系统的示例。
具体实施方式
本文档可以以各种方式修改并且可以具有各种实施方式,并且特定的实施方式将在附图中例示并详细地描述。然而,这并不旨在将本文档限制于特定实施方式。本说明书中通常使用的术语用于描述特定的实施方式,而不是用来限制本文档的技术精神。除非在上下文中另外明确表示,否则单数的表述包括复数的表述。该说明书中的诸如“包括”或“具有”这样的术语应该被理解为指示存在本说明书中描述的特性、数字、步骤、操作、元素、组件或其组合,而没有排除存在或添加一个或更多个特性、数字、步骤、操作、元素、组件或其组合的可能性。
此外,为了便于与不同特征功能相关的描述,独立地例示了本文档中描述的附图中的元素。这并不意指各个元素被实现为单独的硬件或单独的软件。例如,至少两个元素可以被组合,以形成单个元素,或者单个元素可以被划分成多个元素。其中元素被组合和/或分开的实施方式也被包括在本文档的权利范围内,除非它偏离了本文档的实质。
下文中,参照附图更具体地描述本文档的优选实施方式。下文中,在附图中,相同的附图标记被用于相同的元素,并且可以省略对相同元素的冗余描述。
图1示意性地例示了可以应用本文档的实施方式的视频/图像编码系统的示例。
参照图1,视频/图像编码系统可以包括第一装置(源装置)和第二装置(接收装置)。源装置可以经由数字存储介质或网络以文件或流传输的形式将编码后的视频/图像信息或数据传递到接收装置。
源装置可以包括视频源、编码设备和发送器。接收装置可以包括接收器、解码设备和渲染器。编码设备可以被称为视频/图像编码设备,并且解码设备可以被称为视频/图像解码设备。发送器可以被包括在编码设备中。接收器可以被包括在解码设备中。渲染器可以包括显示器,并且显示器可以被配置为单独的装置或外部组件。
视频源可以通过捕获、合成或生成视频/图像的处理来获得视频/图像。视频源可以包括视频/图像捕获装置和/或视频/图像生成装置。视频/图像捕获装置可以包括例如一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。视频/图像生成装置可以包括例如计算机、平板计算机和智能电话,并且可以(电子地)生成视频/图像。例如,可以通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可以被生成相关数据的处理取代。
编码设备可以对输入视频/图像进行编码。编码设备可以执行诸如针对压缩和编码效率的预测、变换和量化这样的一系列过程。编码后的数据(编码后的视频/图像信息)可以以比特流的形式输出。
发送器可以通过数字存储介质或网络以文件或流传输的形式将以比特流的形式输出的编码后的视频/图像信息或数据发送到接收装置的接收器。数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等这样的各种存储介质。发送器可以包括用于通过预定文件格式生成媒体文件的元素,并且可以包括用于通过广播/通信网络进行发送的元素。接收器可以接收/提取比特流,并且将接收/提取的比特流发送到解码设备。
解码设备可以通过执行与编码设备的操作对应的诸如反量化、逆变换、预测等这样的一系列过程来解码视频/图像。
渲染器可以渲染解码后的视频/图像。可以通过显示器显示渲染后的视频/图像。
本文档涉及视频/图像编码。例如,本文档中公开的方法/实施方式可以应用于以通用视频编码(VVC)标准、基本视频编码(EVC)标准、AOMedia Video 1(AV1)标准、第二代音频视频编码标准(AVS2)或下一代视频/图像编码标准(例如,H.267或H.268等)公开的方法。
本文档可以提供视频/图像编码的各种实施方式,并且除非相反地指定,否则这些实施方式可以被彼此组合并执行。
在本文档中,视频可以意指随时间推移的一系列图像的集合。通常,图片意指表示特定时间区域的图像的单元,并且切片/图块(tile)是构成图片的一部分的单元。切片/图块可以包括一个或更多个编码树单元(CTU)。一幅图片可以由一个或更多个切片/图块构成。一幅图片可以由一个或更多个图块组构成。一个图块组可以包括一个或更多个图块。块部(brick)可以表示图片中的图块内的CTU行的矩形区域。图块可以被分割成多个块部,各块部由图块内的一个或更多个CTU行组成。没有被分割成多个块部的图块也可以称为块部。块部扫描可以是如下的分割图片的CTU的特定顺序排序:在块部中按CTU光栅扫描对CTU进行连续排序,按图块的块部的光栅扫描对图块内的块部进行连续排序,并且按图片的图块的光栅扫描对图片中的图块进行连续排序。图块是图片中的特定图块列和特定图块行内的CTU的矩形区域。图块列是CTU的高度等于图片的高度并且宽度由图片参数集中的语法元素指定的矩形区域。图块行是CTU的高度由图片参数集中的语法元素指定并且宽度等于图片的宽度的矩形区域。图块扫描可以是以下的分割图片的CTU的特定顺序排序:可以在图块中按CTU光栅扫描对CTU进行连续排序,而可以按图片的图块的光栅扫描对图片中的图块进行连续排序。切片包括图片的可以被排他性地包含在单个NAL单元中的整数个块部。切片可以由多个完整图块组成或者仅由一个图块的连续序列的完整块部组成。在本文档中,可以将图块组与切片彼此互换地使用。例如,在本文档中,图块组/图块组头可以被称为切片/切片头。
像素或画素可以意指构成一幅图片(或图像)的最小单元。另外,“样本”可以被用作与像素对应的术语。样本通常可以表示像素或像素的值,并且可以仅表示亮度分量的像素/像素值,或仅表示色度分量的像素/像素值。
单元可以表示图像处理的基本单元。单元可以包括特定区域和与该区域相关的信息中的至少一个。一个单元可以包括一个亮度块和两个色度(例如,cb、cr)块。根据情况,可以将单元和诸如块、区域等这样的术语互换地使用。在通常情况下,M×N块可以包括由M列和N行组成的样本(或样本阵列)或变换系数的集合(或阵列)。
在本文档中,术语“/”和“,”应该被解释为指示“和/或”。例如,表述“A/B”可以意指“A和/或B”。另外,“A、B”可以意指“A和/或B”。另外,“A/B/C”可以意指“A、B和/或C中的至少一个”。另外,“A/B/C”可以意指“A、B和/或C中的至少一个”。
另外,在本文档中,术语“或”应该被解释为指示“和/或”。例如,表述“A或B”可以包括1)“仅A”、2)“仅B”和/或3)“A和B”二者。换句话说,本文档中的术语“或”应该被解释为指示“另外地或另选地”。
图2是示意性地描述可以应用本文档的视频/图像编码设备的配置的图。下文中,视频编码设备可以包括图像编码设备。
参照图2,编码设备200可以包括图像分割器210、预测器220、残差处理器230、熵编码器240、加法器250、滤波器260和存储器270。预测器220可以包括帧间预测器221和帧内预测器222。残差处理器230可以包括变换器232、量化器233、反量化器234、逆变换器235。残差处理器230还可以包括减法器231。加法器250可以被称为重构器或重构块生成器。根据实施方式,上面已描述的图像分割器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可以由一个或更多个硬件组件(例如,编码器芯片组或处理器)构成。另外,存储器270可以包括解码图片缓冲器(DPB),并且可以由数字存储介质构成。硬件组件还可以包括存储器270作为内部/外部组件。
图像分割器210将输入到编码设备200的输入图像(或图片或帧)分割成一个或更多个处理单元。作为一个示例,处理单元可以被称为编码单元(CU)。在这种情况下,从编码树单元(CTU)或最大编码单元(LCU)开始,可以根据四叉树二叉树三叉树(QTBTTT)结构来递归地分割编码单元。例如,可以基于四叉树结构、二叉树结构和/或三叉树结构将一个编码单元划分成深度更深的多个编码单元。在这种情况下,例如,可以首先应用四叉树结构,随后可以应用二叉树结构和/或三叉树结构。另选地,可以首先应用二叉树结构。可以基于没有被进一步分割的最终编码单元来执行根据本文档的编码过程。在这种情况下,基于根据图像特性的编码效率,可以将最大编码单元直接用作最终编码单元。另选地,可以按需要将编码单元递归地分割成深度进一步更深的编码单元,使得可以将最佳大小的编码单元用作最终编码单元。这里,编码过程可以包括随后将描述的诸如预测、变换和重构这样的过程。作为另一示例,处理单元还可以包括预测单元(PU)或变换单元(TU)。在这种情况下,可以从上述的最终编码单元划分或分割预测单元和变换单元。预测单元可以是样本预测的单元,并且变换单元可以是用于导出变换系数的单元和/或用于根据变换系数导出残差信号的单元。
根据情况,可以将单元和诸如块、区域等这样的术语互换地使用。在常规情况下,M×N块可以表示由M列和N行组成的样本或变换系数的集合。样本通常可以表示像素或像素的值,并且可以仅表示亮度分量的像素/像素值,或仅表示色度分量的像素/像素值。样本可以被用作与一个图片(或图像)的像素或画素对应的术语。
在编码设备200中,从输入图像信号(原始块、原始样本阵列)中减去从帧间预测器221或帧内预测器222输出的预测信号(预测块、预测样本阵列)以生成残差信号(残差块、残差样本阵列),并且所生成的残差信号被发送到变换器232。在这种情况下,如所示出的,在编码器200中从输入图像信号(原始块、原始样本阵列)中减去预测信号(预测块、预测样本阵列)的单元可以被称为减法器231。预测器可以对处理目标块(下文中,被称为“当前块”)执行预测,并且可以生成包括针对当前块的预测样本的预测块。预测器可以确定以当前块或CU为基础应用帧内预测还是帧间预测。如随后在对每种预测模式的描述中所讨论的,预测器可以生成诸如预测模式信息这样的与预测相关的各种信息,并且将所生成的信息发送到熵编码器240。关于预测的信息可以在熵编码器240中被编码并且以比特流的形式被输出。
帧内预测器222可以通过参考当前图片中的样本来预测当前块。根据预测模式,参考样本可以位于当前块的附近或与当前块分开。在帧内预测中,预测模式可以包括多种非定向模式和多种定向模式。非定向模式可以包括例如DC模式和平面模式。根据预测方向的详细程度,定向模式可以包括例如33种定向预测模式或65种定向预测模式。然而,这仅仅是示例,并且根据设置,可以使用更多或更少的定向预测模式。帧内预测器222可以通过使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可以基于参考图片上的运动向量所指定的参考块(参考样本阵列)来导出针对当前块的预测块。此时,为了减少在帧间预测模式下发送的运动信息的量,可以基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为基础来预测运动信息。运动信息可以包括运动向量和参考图片索引。运动信息还可以包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括当前图片中存在的空间邻近块和参考图片中存在的时间邻近块。包括参考块的参考图片和包括时间邻近块的参考图片可以彼此相同或彼此不同。时间邻近块可以被称为并置参考块、并置CU(colCU)等,并且包括时间邻近块的参考图片可以被称为并置图片(colPic)。例如,帧间预测器221可以基于邻近块来配置运动信息候选列表,并且生成指示哪个候选被用于导出当前块的运动向量和/或参考图片索引的信息。可以基于各种预测模式来执行帧间预测。例如,在跳变模式和合并模式的情况下,帧间预测器221可以使用邻近块的运动信息作为当前块的运动信息。在跳变模式下,与合并模式不同,不能发送残差信号。在运动信息预测(运动向量预测、MVP)模式的情况下,邻近块的运动向量可以被用作运动向量预测项,并且可以通过发信号通知运动向量差来指示当前块的运动向量。
预测器220可以基于各种预测方法来生成预测信号。例如,预测器可以将帧内预测或帧间预测应用于对一个块的预测,并且也可以同时应用帧内预测和帧间预测。这可以被称为组合的帧间和帧内预测(CIIP)。另外,预测器可以基于块内复制(IBC)预测模式或调色板模式,以便对块执行预测。IBC预测模式或调色板模式可以被用于诸如屏幕内容编码(SCC)这样的游戏等的内容图像/视频编码。尽管IBC基本上在当前图片中执行预测,但是其执行方式与帧间预测的相似之处在于,它导出当前图片中的参考块。即,IBC可以使用本文档中描述的帧间预测技术中的至少一种。调色板模式可以被视为帧内编码或帧内预测的示例。当应用调色板模式时,可以基于关于调色板索引和调色板表的信息来发信号通知图片中的样本值。
通过预测器(包括帧间预测器221和/或帧内预测器222)生成的预测信号可以被用于生成重构信号或者生成残差信号。变换器232可以通过向残差信号应用变换技术来生成变换系数。例如,变换技术可以包括离散余弦变换(DCT)、离散正弦变换(DST)、Karhunen-Loève变换(KLT)、基于图的变换(GBT)或有条件非线性变换(CNT)中的至少一种。这里,GBT意指当用曲线图表示像素之间的关系信息时从曲线图获得的变换。CNT是指基于使用所有先前重构的像素生成的预测信号而获得的变换。另外,变换处理可以被应用于大小相同的正方形像素块,或者可以应用于大小可变的块而非正方形的块。
量化器233可以对变换系数进行量化并且将它们发送到熵编码器240,并且熵编码器240可以对量化后的信号(关于量化后的变换系数的信息)进行编码并且输出比特流中的编码后的信号。关于量化后的变换系数的信息可以被称为残差信息。量化器233可以基于系数扫描顺序将块类型的量化后的变换系数重新布置成一维向量形式,并且基于一维向量形式的量化后的变换系数来生成关于量化后的变换系数的信息。熵编码器240可以执行诸如例如指数哥伦布(exponential Golomb)、上下文自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)等这样的各种编码方法。熵编码器240可以对除了量化后的变换系数(例如,语法元素的值等)之外的视频/图像重构所需的信息一起或分别进行编码。编码后的信息(例如,编码后的视频/图像信息)可以以比特流的形式在网络抽象层(NAL)的单元基础上进行发送或存储。视频/图像信息还可以包括关于诸如适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)、视频参数集(VPS)等这样的各种参数集的信息。另外,视频/图像信息还可以包括常规约束信息。在本文档中,从编码设备发送到/发信号通知给解码设备的信息和/或语法元素可以被包括在视频/图片信息中。视频/图像信息可以通过上述编码过程进行编码并且被包括在比特流中。可以通过网络传输比特流,或者将其存储在数字存储介质中。这里,网络可以包括广播网络、通信网络和/或类似物,并且数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等这样的各种存储介质。发送从熵编码器240输出的信号的发送器(未示出)或存储其的存储器(未示出)可以被配置为编码设备200的内部/外部元素,或者发送器可以被包括在熵编码器240中。
从量化器233输出的量化后的变换系数可以被用于生成预测信号。例如,通过利用反量化器234和逆变换器235向量化后的变换系数应用反量化和逆变换,可以重构残差信号(残差块或残差样本)。加法器155将重构后的残差信号与从帧间预测器221或帧内预测器222输出的预测信号相加,使得可以生成重构信号(重构图片、重构块、重构样本阵列)。当如在应用跳变模式的情况下一样没有针对处理目标块的残差时,可以将预测块用作重构块。加法器250可以被称为重构器或重构块生成器。所生成的重构信号可以被用于当前图片中的下一处理目标块的帧内预测,并且如随后描述的,可以被用于通过滤波进行的下一图片的帧间预测。
此外,在图片编码和/或重构处理中,可以应用具有色度缩放的亮度映射(LMCS)。
滤波器260可以通过向重构信号应用滤波来改善主观/客观视频质量。例如,滤波器260可以通过向重构图片应用各种滤波方法来生成修改后的重构图片,并且可以将修改后的重构图片存储在存储器270中,尤其是存储在存储器270的DPB中。各种滤波方法可以包括例如解块滤波、样本自适应偏移、自适应环形滤波器、双边滤波器等。如随后在对每种滤波方法的描述中所讨论的,滤波器260可以生成与滤波相关的各种信息,并且将所生成的信息发送到熵编码器240。关于滤波的信息可以在熵编码器240中被编码并且以比特流的形式被输出。
已发送到存储器270的修改后的重构图片可以被用作帧间预测器221中的参考图片。据此,编码设备可以避免在应用帧间预测时编码设备100和解码设备中的预测失配,并且还可以提高编码效率。
存储器270的DPB可以存储修改后的重构图片,以便使用它作为帧间预测器221中的参考图片。存储器270可以存储从中已导出(或编码了)运动信息的当前图片中的块的运动信息和/或已经重构的图片中的块的运动信息。所存储的运动信息可以被发送到帧间预测器221,以被用作邻近块的运动信息或时间邻近块的运动信息。存储器270可以存储当前图片中的重构块的重构样本,并且将它们发送到帧内预测器222。
图3是示意性地描述可以应用本文档的视频/图像解码设备的配置的图。
参照图3,视频解码设备300可以包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350和存储器360。预测器330可以包括帧间预测器331和帧内预测器332。残差处理器320可以包括反量化器321和逆变换器321。根据实施方式,上面已描述的熵解码器310、残差处理器320、预测器330、加法器340和滤波器350可以由一个或更多个硬件组件(例如,解码器芯片组或处理器)构成。另外,存储器360可以包括解码图片缓冲器(DPB),并且可以由数字存储介质构成。硬件组件还可以包括存储器360作为内部/外部组件。
当输入包括视频/图像信息的比特流时,解码设备300可以与据此已在图2的编码设备中处理视频/图像信息的处理对应地重构图像。例如,解码设备300可以基于与从比特流获得的与块分割相关的信息来导出单元/块。解码设备300可以通过使用在编码设备中应用的处理单元来执行解码。因此,解码的处理单元可以是例如编码单元,可以用编码树单元或最大编码单元顺着四叉树结构、二叉树结构和/或三叉树结构对其进行分割。可以用编码单元导出一个或更多个变换单元。并且,可以通过再现器来再现通过解码设备300解码并输出的重构图像信号。
解码设备300可以以比特流的形式接收从图2的编码设备输出的信号,并且可以通过熵解码器310对接收到的信号进行解码。例如,熵解码器310可以对比特流进行解析,以导出图像重构(或图片重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可以包括关于诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)、视频参数集(VPS)等这样的各种参数集的信息。另外,视频/图像信息还可以包括常规约束信息。解码设备可以进一步基于关于参数集的信息和/或常规约束信息对图片进行解码。在本文档中,随后将描述的发信号通知/接收的信息和/或语法元素可以通过解码过程被解码并且从比特流中获得。例如,熵解码器310可以基于诸如指数哥伦布编码、CAVLC、CABAC等这样的编码方法对比特流中的信息进行解码,并且可以输出图像重构所需的语法元素的值和关于残差的变换系数的量化值。更具体地,CABAC熵解码方法可以接收与比特流中的各语法元素对应的bin,使用解码目标语法元素信息以及邻近和解码目标块的解码信息或者在先前步骤中解码的符号/bin的信息来确定上下文模型,根据所确定的上下文模型来预测bin生成概率并且对bin执行算术解码以生成与每个语法元素值对应的符号。这里,CABAC熵解码方法可以在确定上下文模型之后使用针对下一个符号/bin的上下文模型解码的符号/bin的信息来更新上下文模型。在熵解码器310中解码的信息当中的关于预测的信息可以被提供到预测器(帧间预测器332和帧内预测器331),并且在熵解码器310中已对其执行了熵解码的残差值(即,量化后的变换系数)和关联的参数信息可以被输入到残差处理器320。残差处理器320可以导出残差信号(残差块、残差样本、残差样本阵列)。另外,在熵解码器310中解码的信息当中的关于滤波的信息可以被提供到滤波器350。此外,接收从编码设备输出的信号的接收器(未示出)还可以将解码设备300构成为内部/外部元素,并且接收器可以是熵解码器310的组件。此外,根据本文档的解码设备可以被称为视频/图像/图片解码设备,并且解码设备可以被分为信息解码器(视频/图像/图片信息解码器)和样本解码器(视频/图像/图片样本解码器)。信息解码器可以包括熵解码器310,并且样本解码器可以包括反量化器321、逆变换器322、加法器340、滤波器350、存储器360、帧间预测器332和帧内预测器331中的至少一个。
反量化器321可以通过对量化后的变换系数进行反量化来输出变换系数。反量化器321可以将量化后的变换系数重新布置为二维块的形式。在这种情况下,可以基于已在编码设备中执行的系数扫描的顺序来执行重新布置。反量化器321可以使用量化参数(例如,量化步长信息)对量化后的变换系数执行反量化,并且获得变换系数。
逆变换器322通过对变换系数进行逆变换来获得残差信号(残差块、残差样本阵列)。
预测器320可以对当前块执行预测,并且生成包括针对当前块的预测样本的预测块。预测器可以基于从熵解码器310输出的关于预测的信息来确定向当前块应用帧内预测还是帧间预测,并且具体地可以确定帧内/帧间预测模式。
预测器320可以基于各种预测方法来生成预测信号。例如,预测器可以将帧内预测或帧间预测应用于对一个块的预测,并且也可以同时应用帧内预测和帧间预测。这可以被称为组合的帧间和帧内预测(CIIP)。另外,预测器可以基于块内复制(IBC)预测模式或调色板模式,以便对块执行预测。IBC预测模式或调色板模式可以被用于诸如屏幕内容编码(SCC)这样的游戏等的内容图像/视频编码。尽管IBC基本上在当前图片中执行预测,但是其执行方式与帧间预测的相似之处在于,它导出当前图片中的参考块。即,IBC可以使用本文档中描述的帧间预测技术中的至少一种。调色板模式可以被视为帧内编码或帧内预测的示例。当应用调色板模式时,关于调色板表和调色板索引的信息可以被包括在视频/图像信息中并被发信号通知。
帧内预测器331可以通过参考当前图片中的样本来预测当前块。根据预测模式,参考样本可以位于当前块的附近或与当前块分开。在帧内预测中,预测模式可以包括多种非定向模式和多种定向模式。帧内预测器331可以通过使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器332可以基于参考图片上的运动向量所指定的参考块(参考样本阵列)来导出针对当前块的预测块。此时,为了减少在帧间预测模式下发送的运动信息的量,可以基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为基础来预测运动信息。运动信息可以包括运动向量和参考图片索引。运动信息还可以包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括当前图片中存在的空间邻近块和参考图片中存在的时间邻近块。例如,帧间预测器332可以基于邻近块来配置运动信息候选列表,并且基于接收到的候选选择信息来导出当前块的运动向量和/或参考图片索引。可以基于各种预测模式来执行帧间预测,并且关于预测的信息可以包括指示针对当前块的帧间预测的模式的信息。
加法器340将所获得的残差信号与从预测器(帧间预测器332或帧内预测器331)输出的预测信号(预测块、预测样本阵列)相加,使得可以生成重构信号(重构图片、重构块、重构样本阵列)。当如在应用跳变模式的情况下一样没有针对处理目标块的残差时,可以将预测块用作重构块。
加法器340可以被称为重构器或重构块生成器。所生成的重构信号可以用于当前图片中的要处理的下一块的帧内预测,可以通过如下所述的滤波而输出,或者可以用于下一图片的帧间预测。
此外,进行色度缩放的亮度映射(LMCS)可以被应用于图片解码处理。
滤波器350可以通过向重构后的信号应用滤波来改善主观/客观图像质量。例如,滤波器350可以通过向重构图片应用各种滤波方法来生成修改后的重构图片,并且将修改后的重构图片存储在存储器360中,具体地,存储在存储器360的DPB中。各种滤波方法可以包括例如解块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。
存储在存储器360的DPB中的(修改后的)重构图片可以被用作帧间预测器332中的参考图片。存储器360可以存储从其导出(或解码出)当前图片中的运动信息的块的运动信息和/或已经重构的图片中的块的运动信息。所存储的运动信息可以被发送到帧间预测器260,以便被用作空间邻近块的运动信息或时间邻近块的运动信息。存储器360可以存储当前图片中的重构块的重构样本,并且将重构样本传送到帧内预测器331。
在本公开中,在编码设备200的滤波器260、帧间预测器221和帧内预测器222中描述的实施方式可以与解码设备300的滤波器350、帧间预测器332和帧内预测器331相同或者被分别对应于解码设备300的滤波器350、帧间预测器332和帧内预测器331进行应用。对于单元332和帧内预测器331,也同样适用。
如上所述,在执行视频编码时,执行预测以提高压缩效率。可以通过预测生成包括当前块的预测样本的预测块,即,目标编码块。在这种情况下,预测块包括空间域(或像素域)中的预测样本。在编码设备和解码设备中同样地导出预测块。编码设备可以通过向解码设备发信号通知关于原始块而非原始块的原始样本值本身与预测块之间的残差的信息(残差信息)来提高图像编码效率。解码设备可以基于残差信息来导出包括残差样本的残差块,可以通过将残差块与预测块相加来生成包括重构样本的重构块,并且可以生成包括重构块的重构图片。
可以通过变换和量化过程来生成残差信息。例如,编码设备可以导出原始块与预测块之间的残差块,可以通过对残差块中所包括的残差样本(残差样本阵列)执行变换过程来导出变换系数,可以通过对变换系数执行量化过程来导出量化变换系数,并且可以(通过比特流)向解码设备发信号通知相关残差信息。在这种情况下,残差信息可以包括诸如值信息、位置信息、变换方案、变换核以及量化变换系数的量化参数这样的信息。解码设备可以基于残差信息执行反量化/逆变换过程,并且可以导出残差样本(或残差块)。解码设备可以基于预测块和残差块来生成重构图片。此外,编码设备可以通过对量化后的变换系数进行反量化/逆变换来导出残差块以供后续图片的帧间预测参考,并且可以生成重构图片。
此外,根据本公开,在执行变换时,可以分离并变换竖直分量和水平分量。在这种情况下,可以分别选择竖直方向的变换核和水平方向的变换核。这可以称为多重变换选择(MTS)。
图4示意性地表示根据本公开的多重变换技术。
参照图4,变换器可对应于上述图2的编码设备中的变换器,逆变换器可对应于上述图2的编码设备中的逆变换器,或图3的解码设备中的逆变换器。
变换器可通过基于残差块中的残差样本(残差样本阵列)执行主变换来导出(主)变换系数(S410)。该主变换可以被称为核心变换。这里,主变换可以基于多重变换选择(MTS),并且当多重变换被应用为主变换时,它可以被称为多重核心变换。
变换器可通过基于(主)变换系数执行二次变换来导出(二次)变换系数(步骤S420)。(二次)变换系数可以称为修正的变换系数。
主变换意指从空域到频域的变换,而二次变换意指通过使用(主)变换系数之间存在的相关性而变换成更紧凑的表达式。这里,二次变换可以包括不可分变换。在这种情况下,二次变换可以称为不可分二次变换(NSST)或简化二次变换(RST)。
由于执行二次变换以进一步提高变换性能,所以变换器可以选择性地执行二次变换。基于执行二次(逆)变换的情形描述图4所示的实施方式,但是可以省略二次变换。
变换器可将通过执行二次变换导出的(二次)变换系数传送到量化器。量化器可以通过对(二次)变换系数执行量化来导出量化变换系数。此外,量化变换系数可以被编码并发信号通知到解码设备,并且进一步被传送到编码设备中的反量化器/逆变换器。
在省略二次变换的情况下,作为主变换的输出的(主)变换系数可通过量化器被导出为量化变换系数。此外,量化变换系数可以被编码并发信号通知到解码设备,并且进一步被传送到编码设备中的反量化器/逆变换器。
反量化器可以以与上述变换器中执行的过程相反的顺序执行一系列处理。反量化器可以接收(反量化)变换系数并通过执行二次(逆)变换来导出(主)变换系数(步骤S450),并且通过执行主(逆)变换来获得残差块(残差样本)。
这里,从逆变换器的观点来看,主变换系数可以被称为修正的变换系数。如上所述,编码设备和解码设备可基于残差块和预测块产生重构块,并可基于重构块产生重构图片。
在省略二次(逆)变换的情况下,逆变换器可接收(反量化)变换系数并通过执行主逆变换来获得残差块(残差样本)。如上所述,编码设备和解码设备可基于残差块和预测块产生重构块,并可基于该重构块产生重构图片。
此外,如上所述,可以将多重变换选择应用于主变换。在这种情况下,主变换(多重核心变换)可以表示使用DCT(离散余弦变换)和/或DST(离散正弦变换)变换类型的变换方案。在一个实施方式中,DCT类型2可以应用于多重变换选择,或者DCT类型7可以通过限制特定情况来应用。例如,DCT类型7可以仅在诸如帧内预测模式中的4×4块这样的特定情况下应用。在另一实施方式中,可将显式多重变换(EMT)应用于多重变换选择,且在这种情况下,可应用若干变换的组合。例如,可以使用诸如DST类型7(DST7)、DCT类型8(DCT8)、DST类型1(DST1)、DCT类型5(DCT5)和DCT类型2(DCT2)这样的变换类型的组合。
下面的表1和表2示例性地表示在多重核心变换(显式多重变换)中使用的变换的组合。表1表示在帧内预测模式中应用的多个核心变换的组合,表2表示在帧间预测模式中应用的多个核心变换的组合。
[表1]
Figure BDA0002991093840000151
Figure BDA0002991093840000161
[表2]
Figure BDA0002991093840000162
参照上表1,在应用帧内预测模式的情况下,可根据帧内预测模式来配置变换集,并且每个变换集可包括多个变换组合候选。例如,根据帧内预测模式,变换集可包括五个集合Set0(集合0)至Set4(集合4),并且变换集Set0至Set4中的每一个可包括设置了0至3的索引值的变换组合候选。可以通过应用于行的水平变换和应用于列的竖直变换来构造每个变换组合候选,并且可以基于DST7、DCT8、DST1和DCT5的组合来确定水平变换和竖直变换的类型。
参照上表2,在应用帧间预测模式的情况下,可根据是否将多重变换选择应用于相应块(例如,EMT_CU_Flag)来不同地配置变换组合。例如,在不将多重变换选择应用于相应块的情况下(例如,在EMT_CU_Flag为0的情况下),可以使用其中将DCT2应用于水平变换和竖直变换的变换组合集。另选地,在将多重变换选择应用于相应块的情况下(例如,在EMT_CU_Flag为1的情况下),可使用包括四个变换组合候选的变换组合集。在这种情况下,变换组合集可以包括设置了0到3的索引值的变换组合候选,并且可以基于DST7和DCT8的组合来针对每个变换组合候选确定水平变换和竖直变换的类型。
图5是示出根据本公开的实施方式的根据是否应用多重变换选择(MTS或EMT)来确定变换组合的处理的流程图。
根据本公开的实施方式,通过使用表示是否对当前块应用多重变换选择的语法元素,可以以块单位(例如,对于HEVC情况,以CU为单位)来确定多重变换选择的应用。在一个示例中,语法元素可使用EMT_CU_flag。
在帧内预测模式中,在EMT_CU_flag为0的情况下,确定不对当前块应用多重变换选择。在这种情况下,可以像单个变换的情况(例如,HEVC的情况)一样使用DCT2或4×4DST7。在帧内预测模式中,在EMT_CU_flag为1的情况下,确定针对当前块应用多重变换选择。在这种情况下,可以应用上表1中表示的多重变换组合。可以根据上表1中表示的帧内预测模式来改变可能的多重变换组合,并且例如,在帧内预测模式为14、15、16、17、18、19、20、21和22模式的情况下,在水平方向上应用DST7和DCT5,并且在竖直方向上应用DST7和DCT8,并且因此,可以允许总共四个可能的组合。因此,需要分别发信号通知四个组合中的哪一组合被应用。为此,可以使用2比特的索引信息,并且例如可以选择四个变换组合之一并通过2比特的EMT_TU_index语法元素来发信号通知。
在帧间预测模式中,在EMT_CU_flag为0的情况下,可如上表2中所表示地应用DCT2,并且在EMT_CU_flag为1的情况下,可如上表2中所表示地应用多重变换组合。例如,如上表2所示,作为可能的多重变换组合,可以通过应用DST7和DCT8来使用总共四个可能的组合。
更具体地,参照图5,解码设备可获得并解析(熵解码)EMT_CU_flag语法元素(步骤S500)。此外,解码设备可根据解析的EMT_CU_flag的结果值来确定是否应用多重变换选择(步骤S510)。
在EMT_CU_flag为0的情况下,解码设备可确定不应用多重变换选择,并通过对当前块应用DCT2来执行变换(步骤S515)。
在EMT_CU_flag为1的情况下,解码设备可确定应用多重变换选择并针对当前块中的变换系数确定非零变换系数的数目是否为特定阈值(例如,2)或更小(步骤S520)。
在非零变换系数的数目是特定阈值或更小的情况下,解码设备可省略解析EMT_TU_index并将EMT_TU_index值设置为0,并通过对当前块应用如上表1中表示的DST7来执行变换(步骤S525)。
在非零变换系数的数目不是特定阈值或更小的情况下,解码设备可获得并解析(熵解码)EMT_TU_index语法元素(步骤S530)。
解码设备可通过根据解析的EMT_TU_index值确定当前块的水平方向和竖直方向的变换组合来执行变换(步骤S535)。在这种情况下,基于以上表1和表2中表示的变换组合来选择对应于EMT_TU_index值的水平变换和竖直变换,并且可以执行多重变换。
此外,在应用多重变换选择时,可以限制应用多重变换选择的块大小。例如,可以将块大小限制为64×64块大小,并且在块大小大于64×64大小的情况下可以不应用多重变换。
如参照图4所描述的,在执行变换时,可应用主变换,然后可另外应用二次变换。这里,二次变换可以使用不可分二次变换(NSST)或简化二次变换(RST)。
NSST仅在帧内预测模式的情况下应用,并且具有针对每个帧内预测模式的可应用变换集。下面的表3表示在NSST中分配用于每个帧内预测模式的变换集的示例。
[表3]
Figure BDA0002991093840000181
在一个实施方式中,可以通过使用预测方向的对称性来配置NSST中的变换集。例如,由于帧内预测模式52和16相对于帧内预测模式34(对角线方向)对称,所以可应用如上表3中所表示的相同变换集。这样,通过使用预测方向的对称性,可以将彼此对称的帧内预测模式形成为组,并且可以向其分配相同的变换集。然而,当对关于对角线方向彼此对称的帧内预测模式(例如,模式52和16)应用变换时,可在转置输入数据之后应用变换。
帧内预测模式可包括2种非定向(或非角度)帧内预测模式和65种定向(或角度)帧内预测模式。在一些情况下,可进一步使用67号帧内预测模式。67号帧内预测模式可表示线性模型(LM)模式。在使用此类帧内预测模式的情况下,可如上表3中表示地配置总共35个变换集。这里,由于在作为非定向模式的平面模式(0号)和DC模式(1号)的情况下不存在对称性,所以这些模式具有它们自己的变换集,并且每个变换集可以由2个变换构成。对于剩余的定向模式,每个变换集可以由3个变换构成。因此,总的可用变换的数量可以是103(=2×2+33×3)。
图6和图7是用于描述根据本公开的实施方式的不可分二次变换(NSST)的示图。
NSST不可应用于应用了主变换的整个块(例如,用于HEVC情况的TU),而是仅应用于块的左上8×8区域。当然,NSST可以应用于8×8大小或更小的块的整个区域。
即,8×8NSST被应用于块大小为8×8或更大的情况,而4×4NSST被应用于块大小小于8×8的情况,并且在这种情况下,块被划分为4×4块,并且4×4NSST可以被应用于它。8×8NSST和4×4NSST都可以遵循上述表3中表示的变换集配置。由于8×8NSST是不可分变换,所以8×8NSST接收64个数据集作为输入并输出64个数据集,而4×4NSST具有16个输入和16个输出。
8×8NSST和4×4NSST都可以配置为吉文斯旋转的层次组合。对应于一个吉文斯旋转的矩阵可以由式1表示。
[式1]
Figure BDA0002991093840000191
基于上述式1的吉文斯旋转的计算可以如图6所描绘。图6将式1的矩阵乘法示为图。如图6所示,由于单个吉文斯旋转使两个数据集旋转,因此总共需要32或8个吉文斯旋转来处理64(对于8×8NSST)或16(对于4×4NSST)个数据集。因此,32或8个数据集的束形成吉文斯旋转层。
图7示出了对于4×4NSST情况依次处理四个吉文斯旋转层的处理。如图7所示,在经过预定置换(混排)之后,吉文斯旋转层的输出数据被传送到下一吉文斯旋转层的输入数据。如图7所示,有规律地预先确定置换模式,并且对于4×4NSST情况,通过添加四个吉文斯旋转层和相应的置换来建立单轮。对于8×8NSST的情况,六个吉文斯旋转层和相应的置换建立了单轮。4×4NSST需要两轮,8×8NSST需要四轮。在不同的轮之间使用相同的置换模式,但是所应用的吉文斯旋转角对于每种情况是不同的。因此,需要存储构成每个变换的所有吉文斯旋转的角度数据。
作为最后一步,最后对经过吉文斯旋转层的输出数据进一步执行置换,并且为每个变换分别存储相应的置换信息。在正NSST中,在最后一步中执行相应的置换,而在逆NSST中,相反地,在第一步中应用相应置换的逆。对于逆NSST,逆序执行在正NSST中应用的置换和吉文斯旋转层,并且通过取其负值来旋转每个吉文斯旋转的角度。
如上所述,在执行二次变换时,可以使用下面将要描述的NSST或简化二次变换(RST)。
图8和图9是用于描述根据本公开的实施方式的RST的示图。
当表示单个变换的正交矩阵具有N×N形式时,对于简化变换(RT),在N个变换基向量中保留R个向量(这里,R<N)。用于生成变换系数的正RT的矩阵由式2给出。
[式2]
Figure BDA0002991093840000201
由于逆RT的矩阵变为正RT矩阵的转置矩阵,因此正RT和逆RT的应用如图8所示被示意化。
在一个实施方式中,可以将RT应用于包括经过主变换的变换系数的块(以下称为变换系数块)的左上8×8块。在这种情况下,RT可以被称为8×8RST。当在以上式2中将R值取为16时,8×8RST具有用于正8×8RST情况的16×64矩阵形式和用于逆8×8RST情况的64×16矩阵形式。此外,即使对于8×8RST,也可以应用与上表3相同的变换集配置。即,可以根据上表3中表示的变换集来应用8×8RST。由于单个变换集取决于帧内预测模式而包括2或3个变换,所以可以选择包括不应用二次变换的情况的最多4个变换之一(单个变换可以被视为单位矩阵)。当分别为4个变换提供索引0,1,2和3时(例如,可以将0号索引分配给单位矩阵,即,不应用二次变换的情况),可以针对每个变换系数块发信号通知语法元素和NSST索引,并且可以指定所应用的变换。即,通过NSST索引,对于8×8左上块,NSST的情况可以指定8×8NSST,并且RST配置可以指定8×8RST。
当如上述式2所表示地应用正8×8RST时,产生16个有效变换系数,并且可以看出,构成8×8区域的64个输入数据被减少为16个输出数据。在2维区域方面,有效变换系数仅填充在1/4区域中。因此,可在变换系数块的左上区域中填充通过应用正8×8RST而获得的16个输出数据。
图9是示出变换系数扫描顺序的图,并且示出了当从一开始给出正向扫描顺序时(按照正向扫描顺序)从第17个系数到第64个系数的扫描。由于图9示出了逆向扫描,因此可以看出从第64个系数到第17个系数执行逆向扫描(参照箭头方向)。
参照图9,变换系数块的左上4×4区域是有效变换系数被填充的感兴趣(ROI)区域,并且剩余区域被清空。在空区域中,0值可以作为默认被填充。在ROI区域外发现非零有效变换系数的情况下,肯定不应用8×8RST,并且可省略对应的NSST索引编码。另一方面,在图9所示的ROI区域之外未发现非零有效变换系数的情况下(应用8×8RST的情况,当在ROI区域之外填充零时),存在应用8×8RST的可能性,并且NSST索引可被编码。在这种有条件NSST索引编码中,需要检查是否存在非零变换系数,因此,可以在残差编码处理之后执行条件NSST索引编码。
在下文中,描述了可应用于来自RST结构的4×4块的RST的设计和相关优化方法。显然,一些概念也可应用于8×8RST或其它格式的变换以及4×4RST。
在应用RST时,本公开提出可应用于4×4块的RST。
根据本公开的示例,能够应用于一个4×4变换块(即,待变换的4×4目标块)的不可分变换或RST是16×16变换。即,如果构成4×4目标块的数据元素以行优先或列优先的顺序排列,则它们变成16×1向量,并且不可分变换或RST可被应用于目标块。能够在编码设备中执行的正变换即正16×16变换由16个行方向变换基向量构成,并且当取16×1向量和每个变换基向量的内积时,获得相应变换基向量的变换系数。获得十六个变换基向量的相应变换系数的处理与将16×16不可分变换或RST矩阵与输入16×1向量相乘相同。通过矩阵乘法获得的变换系数具有16×1向量形式,并且对于每个变换系数,统计特性可以不同。例如,如果用第0元素到第15元素构造16×1变换系数向量,则第0元素的方差可以大于第15元素的方差。即,由于较大的方差值,位于另一元素前面的一个元素可具有较大的能量值。
此外,如果应用逆16×16不可分变换或逆RST(当忽略量化或整数化计算的影响时),则可以从16×1变换系数重构变换之前的原始4×4目标块信号。如果正16×16不可分变换是标准正交变换,则可以通过取用于正16×16变换的矩阵的转置来获得逆16×16变换。简单地将逆16×16不可分变换矩阵与16×1变换系数向量相乘产生16×1向量形式的数据,并且4×4块信号可以通过以首先应用的行优先或列优先顺序排列它来重构。
此外,如上所述,构成16×1变换系数向量的元素可具有不同的统计特性。如在前一示例中,如果位置更接近前侧(更接近第0元素)的变换系数具有更大的能量,则即使将逆变换应用于首先出现的一些变换系数而不使用所有变换系数,也可以重构非常接近原始信号的信号。例如,如果逆16×16不可分变换由十六个列基向量构成,则可以在通过仅留下L个列基向量来构造16×L矩阵并且仅留下变换系数中更重要的L个变换系数之后(L×1向量,可以如先前示例中那样首先出现),通过将16×L矩阵与L×1向量相乘来从原始输入16×1向量数据重构误差很小的16×1向量。结果,由于在数据恢复中仅涉及L个系数,所以即使当获得变换系数时,获得L×1变换系数向量而不是16×1变换系数向量也是足够的。也就是说,通过从正16×16不可分变换矩阵中选择L个相应的行方向变换向量,构造L×16变换矩阵,然后将其与16×1输入向量相乘,从而可以获得L个有效变换系数。
此时,虽然L值具有1≤L≤16的范围,并且通常,可以通过任何方法从16个变换基向量中选择L个变换基向量,但是选择在信号能量方面具有高重要性的变换基向量在编码效率方面可能是有利的,如在以上从编码和解码的角度呈现的示例中一样。
此外,在应用RST时,本公开提出了一种设置4×4RST的应用区域并布置变换系数的方法。
在本公开的实施方式中,可以将4×4RST应用为二次变换,并且在这种情况下,可以将其二次地应用于已经应用了诸如DCT类型2这样的主变换的块。当假设应用主变换的块的大小为N×N时,通常,当N×N大于或等于4×4时,可以应用4×4RST。将4×4RST应用于N×N块的示例如下。
1)4×4RST可以仅应用于N×N的一些区域,而不是所有区域。例如,其仅可应用于左上M×M区域(M≤N)。
2)在将应用二次变换的区域划分为4×4块之后,可以将4×4RST应用于每个划分的块。
3)上述1)和2)可以混合并应用。例如,在将左上M×M区域划分为4×4块之后,可以将4×4RST应用于所划分的区域。
作为具体示例,可以仅对左上8×8区域应用二次变换,并且当N×N块大于或等于8×8时,可以应用8×8RST,而当N×N块小于8×8时(4×4,8×4,4×8),可以如上述2)那样将其划分为4×4块,然后可以应用4×4RST。
假设在应用4×4RST之后生成L个变换系数(1≤L≤16),则存在如何布置L个变换系数的自由度(即,如何将变换系数映射到目标块中)。然而,由于当在残差编码部分中读取和处理变换系数时存在预定顺序,所以编码性能可根据如何在2维块中布置L个变换系数而变化。HEVC中的残差编码开始于离DC位置最远的位置。这是为了通过使用当离DC位置的距离增加时量化系数值为0或更接近0的事实来改善编码性能。因此,对于L个变换系数,在编码性能方面有利的是,按照残差编码的顺序将具有较高能量的更重要系数布置为稍后被编码。
图10表示能够应用于HEVC标准中所应用的4×4变换系数或变换系数块(4×4块,系数组(CG))的三个正向扫描顺序。图10(a)表示对角扫描;图10(b)表示水平扫描;图10(c)表示竖直扫描。
残差编码遵循图10的扫描顺序的逆顺序,即,以16到1的顺序执行编码。由于图10中所示的三个扫描顺序是根据帧内预测模式选择的,所以可配置为使得L个变换系数的扫描顺序同样根据帧内预测模式来确定。
图11和图12是示出根据本公开的实施方式的根据对角扫描顺序的变换系数的映射的示图。图11和图12的实施方式示出了当将4×4RST应用于4×8块时根据对角扫描顺序来定位有效变换系数的示例。
在实施方式中,当根据对角扫描顺序将左上4×8块划分为4×4块并分别应用4×4RST时,当L值为8时(即,在16个变换系数中仅保留8个变换系数),可以如图11所示定位变换系数。例如,如图11所示,可以将变换系数映射到每个4×4块的一半区域,并且可以在由X标记的位置中默认填充0值。
因此,通过假设根据图10中呈现的扫描顺序为每个4×4块设置L个变换系数,并且在每个4×4块的剩余(16-L)个位置中填充0,可以应用相应的残差编码(例如,传统HEVC中的残差编码)。
在另一实施方式中,如图12(a)所示,设置在两个4×4块的每一个中的L个变换系数可合并成单个4×4块,并如图12(b)所示设置。具体地,当L值为8时,两个4×4块的变换系数被布置在单个4×4块中并被完全填充在单个4×4块中,并且没有变换系数保留在另一4×4块中。因此,由于大部分残差编码对于清空的4×4块变得不必要,所以对于HEVC情况,coded_sub_block_flag可被编码为0。这里,在HEVC(或VVC)中应用的coded_sub_block_flag是用于指定作为当前变换块中的16个变换系数级别的4×4阵列的子块的位置的标志信息,并且对于其中未留下残差的4×4块可以被发信号通知为“0”。
此外,用于混合两个4×4块的变换系数的各种方法是可能的。通常,它们可以以任何顺序组合,但实际示例可包括以下方法。
(1)两个4×4块的变换系数以扫描顺序交替混合。也就是说,当图12中的上部块的变换系数是
Figure BDA0002991093840000241
且下部块的变换系数是
Figure BDA0002991093840000242
Figure BDA0002991093840000243
时,可如下交替地混合所述系数:
Figure BDA0002991093840000244
当然,可以改变
Figure BDA0002991093840000245
Figure BDA0002991093840000246
的顺序以便首先映射
Figure BDA0002991093840000247
(2)可以首先放置第一个4×4块的变换系数,然后放置第二个4×4块的变换系数。换言之,它们可以被如下连续布置:
Figure BDA0002991093840000248
当然,可以如下改变该顺序:
Figure BDA0002991093840000249
在下文中,将描述对4×4RST进行NSST索引的编码的方法。第一种方法是在残差编码之后对NSST索引进行编码的情况,第二种方法是在残差编码之前对NSST索引进行编码的情况。
在对NSST索引进行编码时,在本公开中,NSST索引可以在残差编码之后被编码。
如图11所示,当应用4×4RST时,可根据每个4×4块的变换系数扫描顺序来对第L+1到第16填充0值。因此,如果在两个4×4块中的甚至一个中的第L+1到第16位置之间出现非零值,则其对应于不应用4×4RST的情况。
如果4×4RST具有选择并应用所准备的变换集之一(例如NSST)的结构,则可以发信号通知要在其上应用变换的索引(其可以被称为变换索引、RST索引或NSST索引)。
假设如果通过解码设备中的比特流解析知道NSST索引,则在残差编码之后执行该解析处理。如果执行残差编码并且发现在第L+1到第16之间存在至少一个非零变换系数,则如上所述肯定不应用4×4RST,因此可以设置为不解析NSST索引。因此,在这种情况下,仅在必要时选择性地解析NSST指数,从而提高信令效率。
例如,如图11所示,如果将4×4RST应用于特定区域内的若干4×4块(可将所有相同的4×4RST应用于所有块或可应用不同的4×4RST),则可通过一个NSST索引来指定应用于所有4×4块的(相同或不同的)4×4RST。由于通过一个NSST索引来确定用于所有4×4块的4×4RST以及是否应用,所以可以通过在残差编码处理期间检查在所有4×4块的从第L+1到第16的位置处是否存在非零变换系数,来在甚至一个4×4块中的(从第L+1到第16的位置的)不允许的位置存在非零变换系数时配置为不对NSST索引进行编码。
可针对亮度(亮度)块和色度(色度)块分别发信号通知这些NSST索引,或在色度块的情况下,可针对Cb和Cr发信号通知不同的NSST索引,或可通过仅发信号通知NSST索引一次来共享一个NSST索引。
如果为Cb和Cr共享一个NSST索引,则可应用由相同NSST索引指示的4×4RST(Cb和Cr的4×4RST可相同,或者即使NSST索引相同,也可应用不同的4×4RST)。为了应用上述用于共享的NSST索引的条件信令,检查用于Cb和Cr的所有4×4块的从第L+1到第16是否存在非零变换系数,并且如果找到任何非零变换系数,则可以配置为省略用于NSST索引的信令。
作为另一示例,同样在如图12中那样组合两个4×4块的变换系数的情况下,当应用4×4RST时,在检查非零变换系数是否出现在不存在有效变换系数的位置之后,可确定是否发信号通知NSST索引。具体地,在如图12中那样L值为8并且当应用4×4RST时对于一个4×4块(图12的(b)中由Xs指示的块)不存在有效变换系数的情况下可以设置为:如果在检查没有有效变换系数的块的coded_sub_block_flag之后值是1,则不发信号通知NSST索引。
另外,在对NSST索引进行编码时,在本公开中,可在残差编码之前对NSST索引进行编码。
根据本公开的实施方式,如果在残差编码之前执行NSST索引的编码,则事先确定是否应用4×4RST,因此对于变换系数肯定被填充为零的位置,可以省略残差编码。
在这点上,可以发信号通知NSST索引值,以使其知道是否应用4×4RST(例如,如果NSST索引为0,则不应用4×4RST),或者可以通过单独的语法元素发信号通知。例如,如果单独的语法元素是NSST标志,则首先解析NSST标志以确定是否应用4×4RST。然后,如果NSST标志值为1,则对于不会存在有效变换系数的位置可以省略残差编码。
在HEVC的情况下,当执行残差编码时,TU上的最后一个非零系数位置首先被编码。如果在最后一个非零系数位置编码之后执行对NSST索引的编码并且最后一个非零系数的位置被识别为假定应用4×4RST时非零系数不会出现的位置,则NSST索引不被编码并且不应用4×4RST。例如,在图11中由X指示的位置的情况下,由于当应用4×4RST时未定位到有效变换系数(例如,可填充值0),所以如果最后一个非零系数位于由X指示的区域中,那么可省略对NSST索引的编码。如果最后一个非零系数不位于由X指示的区域中,则可以执行对NSST索引的编码。
如果通过在对最后一个非零系数位置进行编码之后有条件地对NSST索引进行编码已经知道是否应用4×4RST(如上所述,如果最后一个非零系数的位置是假定应用4×4RST时不允许的,则可省略对NSST索引的编码),则可按以下两种方式来处理这之后的剩余残差编码部分。
(1)在不应用4×4RST的情况下,一般残差编码可以保持原样。也就是说,在假设非零变换系数可能存在于从最后一个非零系数位置到DC位置的任何位置的情况下执行编码。
(2)在应用4×4RST的情况下,对于特定位置或特定4×4块(例如,图11中的X位置),对应的变换系数不应存在(其可默认用零填充),所以可省略对相应位置或块的残差编码。例如,当到达图11中由X指示的位置时,可省略对sig_coeff_flag(用于非零系数是否存在于应用于HEVC和VVC的对应位置处的标志)的编码,且当如图12中所示组合两个块的变换系数时,可省略对清空到0的4×4块的coded_sub_block_flag(存在于HEVC中)的编码,且可将对应值导出为0,并且该4×4块可以填充零值而无需单独的编码。
另一方面,在对最后一个非零系数位置的编码之后对NSST索引进行编码的情况下,如果最后一个非零系数的x位置(Px)和y位置(Py)分别小于Tx和Ty(特定阈值),则可以配置为省略NSST索引编码并且不应用4×4RST。例如,当Tx=1和Ty=1时,这意味着当最后一个非零系数存在于DC位置时省略NSST索引编码。通过与阈值比较来确定是否对NSST索引进行编码的方法可以不同地应用于亮度和色度。例如,不同的Tx和Ty可以应用于亮度和色度,或者阈值可以应用于亮度(或色度)而不应用于色度(或亮度)。
当然,可以应用两种省略NSST索引编码的方法(当最后一个非零系数位于不存在有效变换系数的区域中时省略NSST索引编码的方法,以及当最后一个非零系数的X和Y坐标均小于特定阈值时省略NSST索引编码的方法)。例如,在首先对最后一个非零系数位置坐标执行阈值检查之后,可以检查最后一个非零系数是否位于不存在有效变换系数的区域中,并且逆序也是可能的。
在残差编码之前对NSST索引进行编码的方法可应用于8×8RST。也就是说,如果最后一个非零系数位于除了左上4×4区域之外的左上8×8区域中,则可以省略对NSST索引的编码,否则,可以执行对NSST索引的编码。此外,如果最后一个非零系数位置的X和Y坐标值都小于某个阈值,则可以省略对NSST索引的编码。当然,两种方法可以一起应用。
此外,在对NSST索引进行编码时,根据本公开,当应用RST时,可将不同的NSST索引编码和残差编码方案分别应用于亮度和色度。
在残差编码之后执行NSST索引编码的第一方法(方法1)和在残差编码之前执行NSST索引编码的第二方法(方法2)可以分别不同地应用于亮度和色度。
例如,亮度可以遵循方法2中描述的方案,并且方法1可以应用于色度。另选地,根据方法1或方法2将NSST索引编码有条件地应用于亮度,而不将条件NSST索引编码应用于色度,并且相反的情况也是可用的。即,NSST索引编码根据方法1或方法2有条件地应用于色度,而有条件NSST索引编码不应用于亮度。
以下,描述将多重变换应用为主变换的情况的优化方法。
在应用多重变换时,在本公开中,可以基于简化变换(RT)方法来应用多重变换。这也可称为诸如简化显式多重变换(REMT)或简化自适应多重变换(RAMT)之类的术语。
如上所述,如在多重变换选择(或显式多重变换、自适应多重变换)中那样,在若干变换(DCT2,DST7,DCT8,DST1,DCT5等)的组合被选择性地用于主变换的情况下,变换不对所有情况执行,而是应用于预定义的区域以降低复杂度,并且最坏情况的复杂度可以被显著降低。
例如,在基于上述简化变换(RT)方法对具有M×M大小的像素块应用主变换的情况下,不是获得具有M×M大小的变换块,而是可以仅对RxR(M≥R)的变换块执行计算。结果,仅RxR区域存在有效的非零系数,且存在于其它区域中的变换系数可被视为零而不执行计算。下面的表4表示针对每个主变换大小使用预定义的R值的简化自适应多重变换(RAMT)的三个示例。
[表4]
变换大小 简化变换1 简化变换2 简化变换
8x8 4x4 6x6 6x6
16x16 8x8 12x12 8x8
32x32 16x16 16x16 16x16
64x64 32x32 16x16 16x16
128x128 32x32 16x16 16x16
在应用上述RAMT(或REMT)时,根据本公开,可以根据相应的主变换来独立地确定简化变换因子(RT因子)(R)。
例如,在主变换是DCT2的情况下,由于计算量与其它主变换相比相对较小,所以RT可以不用于小块,或者使用相对较大的R值,因此,可以最小化编码性能的降低。例如,在DCT2或其它变换的情况下,可以使用不同的RT因子,如下表5所表示。表5表示对于每个变换大小使用不同RT因子的RAMT的示例。
[表5]
变换大小 DCT2的简化变换 除DCT2之外的简化变换
8x8 8x8 4x4
16×16 16×16 8x8
32x32 32x32 16×16
64x64 32x32 32x32
128x128 32x32 32x32
另外,在应用多重变换时,根据本公开,可根据帧内预测模式来选择EMT(或AMT)核心变换。如上表1和表2所表示的,在EMT_CU_Flag=1(或AMT_CU_Flag=1)的情况下,可以通过2比特的EMT_TU_index来选择EMT索引(0,1,2和3)的四个组合中的一个,并且基于给定的EMT索引,可以选择要应用于相应的主变换的变换类型。下面的表6表示用于基于EMT_index值选择应用于水平和竖直方向的主变换的变换类型的映射表的示例。
[表6]
EMT_TU_index 用于竖直方向的变换 用于水平方向的变换
0 0(DCT-8) 0(DCT-8)
1 0(DCT-8) 1(DST-7)
2 1(DST-7) 0(DCT-8)
3 1(DST-7) 1(DST-7)
在本公开中,分析了根据帧内预测模式发生的主变换的统计,并且基于该统计,提出了更高效的EMT核心变换映射。首先,下表7以百分比(%)表示每个帧内预测模式的EMT_TU_index的分布。
[表7]
EMT_TU_index 0(平面模式) 1(直流模式) Hor模式 Ver模式
0 53.51 35.86 53.33 55.32
1 17.34 23.05 7.59 31.55
2 19.82 23.80 33.36 7.73
3 9.26 17.20 5.73 5.39
基于使用67种模式的帧内预测模式,在上表7中,水平方向(Hor)模式表示从2号到33号的模式,且竖直方向(Ver)模式表示从34号到66号的定向模式。
从上表7可知,对于水平方向(Hor)模式(2<=模式<=33),EMT_TU_index=2的情况显示出比EMT_TU_index=1的情况明显更大的概率。因此,在本公开中,提出了如下表8所表示的映射表。
[表8]
Figure BDA0002991093840000291
上面的表8表示将不同的映射用于水平方向(Hor)模式组的示例。在基于EMT_TU_index导出主变换的方法中,可基于帧内预测方向使用不同的映射表。
此外,在本公开中,可用的EMT_TU_index对于每个帧内预测模式不是相同的,而是可以被不同地定义。例如,如上表7所表示的,对于平面模式,EMT_TU_index=3的情况(对于角度模式,EMT_TU_index>1的情况)的生成概率相对低,并且通过排除生成概率低的索引部分,更高效的编码是可能的。作为示例,表9表示可用的EMT_TU_index值取决于每个帧内预测模式的情况。
[表9]
Figure BDA0002991093840000301
在本公开中,提出以下两种编码方法以高效地对EMT_TU_index的值进行编码,所述EMT_TU_index的值针对上述每一帧内预测模式不同地分布。
1)当EMT(AMT)TU索引被二进制化时,代替固定长度二进制化方法,EMT(AMT)TU索引可以通过使用截断方法来编码。下面的表10表示固定长度和截断一元二进制化方法的示例。
[表10]
Figure BDA0002991093840000302
2)当通过上下文建模对EMT TU索引值进行编码时,可通过使用帧内预测模式的信息来确定上下文模型。下面的表11表示根据上下文映射帧内预测模式的三个实施方式(方法1,方法2和方法3)。具体地,可以与诸如块大小这样的其它因素一起考虑本公开中指定的每个帧内预测模式的上下文建模方法。
[表11]
上下文 方法1 方法2 方法3
0 DC,平面 DC 平面
1 Hor模式 平面 Hor模式,Ver模式,DC
2 Ver模式 Hor模式,Ver模式
在下文中,根据本公开,在AMT(或EMT)方案中提出了通过应用多重变换选择(MTS)来执行变换的处理,并且提出了用于应用多重变换选择的语法元素,然后,提出了用于确定用于多重变换的核类型(变换类型)的方法。
在本公开的实施方式中,在执行变换时,可以使用表示多重变换选择是否可用于执行变换的语法元素。通过使用语法元素,可以从编码设备到解码设备显式地发信号通知是否可以通过使用当前编码目标块的多重变换选择来执行变换。下面的表12表示用于以序列参数集来发信号通知表示多重变换选择是否可用的信息的语法表的示例。下面的表13表示定义由表12的语法元素表示的信息的语义表的示例。
[表12]
Figure BDA0002991093840000311
[表13]
Figure BDA0002991093840000321
参照表12和表13,在执行变换时,作为表示多重变换选择是否可用的信息,可使用sps_mts_intra_enabled_flag或sps_mts_inter_enabled_flag语法元素。例如,sps_mts_intra_enabled_flag可以是表示多重变换选择是否可用于帧内编码块的信息,并且sps_mts_inter_enabled_flag可以是表示多重变换选择是否可用于帧间编码块的信息。这里,帧内编码块是指用帧内预测模式编码的块,并且帧间编码块是指用帧间预测模式编码的块。
在实施方式中,编码设备可通过sps_mts_intra_enabled_flag配置并发信号通知基于多重变换选择的变换是否可用于帧内编码块,并且解码设备可对sps_mts_intra_enabled_flag进行解码并确定多重变换选择是否可用于帧内编码块。另选地,编码设备可通过sps_mts_inter_enabled_flag配置并发信号通知基于多重变换选择的变换是否可用于帧间编码块,解码设备可对sps_mts_inter_enabled_flag进行解码并确定多重变换选择是否可用于帧间编码块。这样,在基于sps_mts_intra_enabled_flag或sps_mts_inter_enabled_flag将相应的帧内编码块或相应的帧间编码块确定为可用于多重变换选择的情况下,下面将描述的表示是否应用多重变换选择的信息(例如,cu_mts_flag)或表示多重变换选择中使用的变换核的信息(例如,mts_idx)可被另外发信号通知。
这里,表12表示sps_mts_intra_enabled_flag或sps_mts_inter_enabled_flag语法元素以序列级(即,序列参数集)被发信号通知,但也通过切片级(即,切片头)或图片级(即,图片参数集)被发信号通知。
另外,在本公开的实施方式中,在如上表12中所表示的那样通过较高级别(例如,序列参数集等)发信号通知的sps_mts_intra_enabled_flag或sps_mts_inter_enabled_flag表示基于多重变换选择的变换是可用的情况下,可以另外以较低级别(例如,残差编码语法,变换单元语法等)发信号通知表示是否在相应块中应用多重变换选择的信息。下面的表14表示用于基于在较高级别显式地发信号通知的语法元素(例如,sps_mts_intra_enabled_flag或sps_mts_inter_enabled_flag)另外以较低级别(例如,变换单元语法)发信号通知表示是否应用多重变换选择的信息(例如,cu_mts_flag)的语法表的示例。表15表示定义由表14的语法元素表示的信息的语义表的示例。
[表14]
Figure BDA0002991093840000331
[表15]
Figure BDA0002991093840000332
此外,在本公开的实施方式中,如上表12和表14所表示的,可基于表示多重变换选择是否可用的信息(例如,sps_mts_intra_enabled_flag,sps_mts_inter_enabled_flag)或表示是否应用多重变换选择的信息(例如,cu_mts_flag)来发信号通知表示在多重变换选择中使用的变换核的信息。下表16表示用于发信号通知表示在多重变换选择中应用的变换核的信息的语法表的示例。表17表示定义由表16的语法元素表示的信息的语义表的示例。
[表16]
Figure BDA0002991093840000351
Figure BDA0002991093840000361
Figure BDA0002991093840000371
[表17]
Figure BDA0002991093840000372
参考上面的表16和表17,作为表示在多重变换选择中使用的变换核的信息,可以使用mts_idx语法元素。mts_idx语法元素可被设置为索引值,该索引值指示在如上述变换集那样的针对多重变换中使用的水平方向变换和竖直方向变换而配置的特定组合中应用于当前块的组合。
例如,在通过诸如sps_mts_intra_enabled_flag、sps_mts_inter_enabled_flag和cu_mts_flag这样的语法元素明确指示对当前块应用多重变换选择的情况下,可以通过残差编码语法或变换单元语法来传送mts_idx语法元素,所述残差编码语法或变换单元语法是用于发信号通知执行当前块的变换所需的信息的级别。解码设备可从编码设备获得mts_idx语法元素,并基于由mts_idx指示的索引值导出应用于当前块的变换核(水平方向变换核和竖直方向变换核),然后执行多重变换。
在这种情况下,可以预先确定用于多重变换选择的水平方向变换核和竖直方向变换核的组合,并且每个组合可以分别对应于mts_idx的索引值。因此,解码设备可在水平方向变换核和竖直方向变换核的预定组合中选择与mts_idx的索引值相对应的组合,并将所选组合的水平方向变换核和竖直方向变换核导出为应用于当前块的变换核集。
此外,根据本公开的实施方式,可以以各种方案来配置用于多重变换选择的变换核的组合。这里,变换核的组合也可以被称为多重变换选择候选(以下,MTS候选)。此外,变换核(即,MTS候选)的组合表示多重变换核集,并且可以通过组合与竖直变换核相对应的变换核类型和与水平变换核相对应的变换核类型来导出多重变换核集。在这种情况下,用于多重变换选择的变换核类型的数目可以是多个,并且在这种情况下,对应于竖直变换核的变换核类型可以是多个变换核类型之一,并且对应于水平变换核的变换核类型可以是多个变换核类型之一。换言之,可以通过组合多个变换核类型来构造多重变换核集(即,MTS候选)。例如,作为用于多重变换选择的变换核类型,可以使用DST7、DCT8、DCT2、DST1、DCT5等。选择多个这些类型,并且组合所选多个类型,然后将其配置为多重变换核集(即,MTS候选)。考虑到变换效率,可以以各种方式构造多重变换核集(即,MTS候选)。
在构造MTS候选时,根据本公开的实施方式,通过使用DST7和DCT8作为变换核类型并组合来构造多个MTS候选,并且可以对应于多个MTS候选中的每一个来分配MTS索引值(例如,mts_idx)。
在一个实施方式中,对于MTS索引的第一索引值(例如,索引值0),为对应于竖直变换核和水平变换核的所有变换核类型选择DST7,并且可以映射组合的MTS候选(即,变换核集)。对于第二索引值(例如,索引值1),对应于竖直变换核的变换核类型被选择为DST7,对应于水平变换核的变换核类型被选择为DCT8,并且组合的MTS候选(即,变换核集)可被映射。对于第三索引值(例如,索引值2),对应于竖直变换核的变换核类型被选择为DCT8,对应于水平变换核的变换核类型被选择为DST7,并且组合的MTS候选(即,变换核集)可被映射。对于第四索引值(例如,索引值3),为对应于竖直变换核和水平变换核的所有变换核类型选择DCT8,并且可以映射组合的MTS候选(即,变换核集)。如此组合的MTS候选可根据下表18中所表示的MTS索引值由对应于竖直变换核和水平变换核的变换核类型来表示。
[表18]
Figure BDA0002991093840000391
在另一实施方式中,对于MTS索引的第一索引值(例如,索引值0),为对应于竖直变换核和水平变换核的所有变换核类型选择DST7,并且可以映射组合的MTS候选(即,变换核集)。对于第二索引值(例如,索引值1),对应于竖直变换核的变换核类型被选择为DCT8,对应于水平变换核的变换核类型被选择为DST7,并且组合的MTS候选(即,变换核集)可被映射。如此组合的MTS候选可根据下表19中所表示的MTS索引值由对应于竖直变换核和水平变换核的变换核类型来表示。
[表19]
Figure BDA0002991093840000392
在另一实施方式中,对于MTS索引的第一索引值(例如,索引值0),为对应于竖直变换核和水平变换核的所有变换核类型选择DST7,并且可以映射组合的MTS候选(即,变换核集)。对于第二索引值(例如,索引值1),对应于竖直变换核的变换核类型被选择为DST7,对应于水平变换核的变换核类型被选择为DCT8,并且组合的MTS候选(即,变换核集)可被映射。如此组合的MTS候选可根据下表20中所表示的MTS索引值由对应于竖直变换核和水平变换核的变换核类型来表示。
[表20]
Figure BDA0002991093840000401
参照表18到表20,根据MTS索引的索引值映射与竖直变换核相对应的变换核类型和与水平变换核相对应的变换核类型。这里,变换核类型值为1的情况指示DST7,而变换核类型值为2的情况指示DCT8。在一些情况下,存在不发信号通知MTS索引语法元素的情况。即,在基于MTS的变换被确定为不可用的情况(例如,sps_mts_intra_enabled_flag或sps_mts_inter_enabled_flag为0的情况)或基于MTS的变换被确定为不应用的情况(例如,cu_mts_flag为0的情况)下,MTS索引信息可以不存在。在这种情况下,解码设备可如上表18至表20所表示地推断MTS索引的值为-1,并且相应的变换核类型0可用作当前块的变换核类型(即,竖直变换核和水平变换核)。在这种情况下,变换核类型0可以指示DCT2。
此外,根据本公开的实施方式,可以考虑帧内预测模式的方向性来构造MTS候选。
在实施方式中,在应用67个帧内预测模式的情况下,上表18中表示的四个MTS候选可用于两个非定向模式(例如,DC模式,平面模式),上表19中表示的两个MTS候选可用于包括具有水平方向性的模式的水平组模式(例如,2号模式到34号模式),并且上表20中表示的两个MTS候选可用于包括具有竖直方向性的模式的竖直组模式(例如,35号模式到66号模式)。
在另一实施方式中,在应用67个帧内预测模式的情况下,下表21中表示的三个MTS候选可用于两个非定向模式(例如,DC模式,平面模式),下表22中表示的两个MTS候选可用于包括具有水平方向性的模式的水平组模式(例如,2号模式到34号模式),并且下表23中表示的两个MTS候选可用于包括具有竖直方向性的模式的竖直组模式(例如,35号模式到66号模式)。
下面的表21表示作为用于两个非定向模式(例如,DC模式,平面模式)的MTS候选的根据MTS索引值的与竖直变换核和水平变换核相对应的变换核类型的示例。
[表21]
Figure BDA0002991093840000411
参考上面的表21,对于MTS索引的第一索引值(例如,索引值0),为对应于竖直变换核和水平变换核的所有变换核类型选择DST7,并且可以映射组合的MTS候选(即,变换核集)。对于第二索引值(例如,索引值1),对应于竖直变换核的变换核类型被选择为DST7,对应于水平变换核的变换核类型被选择为DCT8,并且组合的MTS候选(即,变换核集)可被映射。对于第三索引值(例如,索引值2),对应于竖直变换核的变换核类型被选择为DCT8,对应于水平变换核的变换核类型被选择为DST7,并且组合的MTS候选(即,变换核集)可被映射。
下面的表22表示作为用于包括具有水平方向性的模式的水平组模式(例如,2号模式到34号模式)的MTS候选的根据MTS索引值的与竖直变换核和水平变换核相对应的变换核类型的示例。
[表22]
Figure BDA0002991093840000412
参考上表22,对于MTS索引的第一索引值(例如,索引值0),为对应于竖直变换核和水平变换核的所有变换核类型选择DST7,并且可以映射组合的MTS候选(即,变换核集)。对于第二索引值(例如,索引值1),对应于竖直变换核的变换核类型被选择为DCT8,对应于水平变换核的变换核类型被选择为DST7,并且组合的MTS候选(即,变换核集)可被映射。
下表23表示作为用于包括具有竖直方向性的模式的竖直组模式(例如,35号模式到66号模式)的MTS候选的根据MTS索引值的与竖直变换核和水平变换核对应的变换核类型的示例。
[表23]
Figure BDA0002991093840000421
参考上面的表23,对于MTS索引的第一索引值(例如,索引值0),为对应于竖直变换核和水平变换核的所有变换核类型选择DST7,并且可以映射组合的MTS候选(即,变换核集)。对于第二索引值(例如,索引值1),对应于竖直变换核的变换核类型被选择为DST7,对应于水平变换核的变换核类型被选择为DCT8,并且组合的MTS候选(即,变换核集)可被映射。
参照表21到表23,变换核类型值为1的情况指示DST7,变换核类型值为2的情况指示DCT8。在一些情况下,存在不发信号通知MTS索引语法元素的情况。即,在基于MTS的变换被确定为不可用的情况(例如,sps_mts_intra_enabled_flag或sps_mts_inter_enabled_flag为0的情况)或基于MTS的变换被确定为不应用的情况(例如,cu_mts_flag为0的情况)下,MTS索引信息可不存在。在这种情况下,解码设备可如上表21至表23所表示的推断MTS索引的值为-1,并且相应的变换核类型0可用作当前块的变换核类型(即,竖直变换核和水平变换核)。在这种情况下,变换核类型0可以指示DCT2。
当然,根据本公开,可在不考虑帧内预测模式的方向性的情况下针对所有帧内预测模式构造MTS候选。在实施方式中,可针对所有帧内预测模式构造三个MTS候选,且可对应于三个MTS候选来应用MTS索引值(例如,mts_idx)。
例如,对于MTS索引的第一索引值(例如,索引值0),为对应于竖直变换核和水平变换核的所有变换核类型选择DST7,且可以映射组合的MTS候选(即,变换核集)。对于第二索引值(例如,索引值1),对应于竖直变换核的变换核类型被选择为DST7,对应于水平变换核的变换核类型被选择为DCT8,并且组合的MTS候选(即,变换核集)可被映射。对于第三索引值(例如,索引值2),对应于竖直变换核的变换核类型被选择为DCT8,对应于水平变换核的变换核类型被选择为DST7,并且组合的MTS候选(即,变换核集)可被映射。如此组合的MTS候选可根据下表24中所表示的MTS索引值由对应于竖直变换核和水平变换核的变换核类型来表示。
[表24]
Figure BDA0002991093840000431
参考上面的表24,根据MTS索引的索引值映射对应于竖直变换核的变换核类型和对应于水平变换核的变换核类型。这里,变换核类型值为1的情况指示DST7,而变换核类型值为2的情况指示DCT8。在一些情况下,存在不发信号通知MTS索引语法元素的情况。即,在基于MTS的变换被确定为不可用的情况(例如,sps_mts_intra_enabled_flag或sps_mts_inter_enabled_flag为0的情况)或基于MTS的变换被确定为不应用(例如,cu_mts_flag为0的情况)的情况下,MTS索引信息可不存在。在这种情况下,解码设备可如上表24所表示的推断MTS索引的值为-1,相应的变换核类型0可用作当前块的变换核类型(即,竖直变换核和水平变换核)。在这种情况下,变换核类型0可以指示DCT2。
此外,根据本公开,可以为所有预测模式(即,帧内预测模式和帧间预测模式)构造MTS候选。在实施方式中,为帧内预测模式和帧间预测模式构造一个MTS候选,并且可以分配MTS索引值(例如,mts_idx)。在这种情况下,由于构造了一个MTS候选,因此可以使用标志信息来代替MTS索引以减少比特数。
例如,在标志信息(例如,cu_mts_flag)指示1的情况下,可以映射由一个MTS候选指示的变换核类型。也就是说,在标志信息(例如,cu_mts_flag)指示1的情况下,对应于竖直变换核的变换核类型和对应于水平变换核的变换核类型两者都可被映射到DST7。
下表25表示其中基于标志信息(例如,cu_mts_flag)映射对应于竖直变换核和水平变换核的变换核类型的示例。
[表25]
Figure BDA0002991093840000441
参考上面的表25,在标志信息(例如,cu_mts_flag)指示1的情况下,不考虑预测模式(即,预测模式是帧内预测模式还是帧间预测模式),值1可被导出为与竖直变换核和水平变换核相对应的变换核类型。另选地,在标志信息(例如,cu_mts_flag)指示0的情况下,值0可被导出为对应于竖直变换核和水平变换核的变换核类型两者。这里,变换核类型为1的情况可能意味着使用DST7,而变换核类型为0的情况可能意味着使用DCT2。如上所述,在一些情况下,标志信息(例如cu_mts_flag)可不被发信号通知。例如,在基于MTS的变换被确定为不可用的情况(例如,sps_mts_intra_enabled_flag或sps_mts_inter_enabled_flag为0的情况)或基于MTS的变换被确定为不应用的情况(例如,cu_mts_flag为0的情况)下,标志信息(例如,cu_mts_flag)可不被发信号通知。在这种情况下,解码设备可如上表18至表25中所表示的那样将标志信息(例如,cu_mts_flag)的值推断为0,并且可将相应的变换核类型0用作当前块的变换核类型(即,竖直变换核和水平变换核)。
在上述实施方式中,已经描述了DST7和DCT8被用作变换核类型,但这只是一个示例。根据本公开,可以通过使用各种变换核类型(例如,DCT2,DCT4,DCT5,DCT7,DCT8,DST1,DST4,DST7等)来构造用于多重变换选择的变换核集,并且可以执行多重变换。
此外,诸如DCT2、DCT4、DCT5、DCT7、DCT8、DST1、DST4、DST7等的DCT/DST变换核类型可以基于基函数来定义,并且基函数可以表示为下表26。本公开中描述的变换核类型也可称为变换类型。
[表26]
Figure BDA0002991093840000451
图13是示意性地示出根据本公开的实施方式的编码设备的视频/图像编码方法的流程图。
图13所示的方法可由图2所示的编码设备200执行。具体地,图13所示的步骤S1300可由图2所示的预测器220和减法器231执行,图13所示的步骤S1310可由图2所示的变换器232执行,图13所示的步骤S1320和S1330可由图2所示的量化器233执行,图13所示的步骤S1340可由图2所示的熵编码器240执行。此外,图13所示的方法可以包括本公开中的上述实施方式。因此,在图13中省略或简要描述与上述实施方式重叠的内容的详细描述。
参照图13,编码设备可导出当前块的残差样本(步骤S1300)。
在实施方式中,编码设备可基于应用于当前块的预测模式(例如,帧内预测模式或帧间预测模式)执行预测并导出当前块的预测样本。另外,编码设备可基于当前块的原始样本和预测样本来导出当前块的残差样本。可基于原始样本与预测样本之间的差来导出残差样本。
编码设备可通过基于当前块的残差样本执行变换来导出当前块的变换系数(步骤S1310)。在这种情况下,编码设备可通过应用多重变换选择(以下,MTS)来执行变换。
在实施方式中,当编码设备基于MTS执行变换时,编码设备可通过使用应用于当前块的变换核集来执行变换。此外,编码设备可生成表示应用于当前块的变换核集的用于MTS的信息并对其进行编码,然后将经编码的信息发送到解码设备。这里,用于MTS的信息可包括用于指示应用于当前块的变换核集的MTS索引信息。
更具体地,在编码设备决定对当前块的残差样本执行基于MTS的变换的情况下,编码设备可对多个MTS候选执行变换,并可基于速率失真(RD)成本在多个MTS候选中选择最佳MTS候选。此外,编码设备可生成对应于所选最佳MTS候选的MTS索引信息,并对包括MTS索引信息的MTS的信息进行编码。
这里,多个MTS候选是通过包括竖直变换核和水平变换核的组合来构造的,并且例如,可以包括上面表18到表25中公开的实施方式。换言之,多个MTS候选可表示多重变换核集,并且可通过组合对应于竖直变换核的变换核类型和对应于水平变换核的变换核类型来导出多重变换核集。此外,与竖直变换核相对应的变换核类型可以是多个MTS候选中的一个,并且与水平变换核相对应的变换核类型也可以是多个MTS候选中的一个。例如,可以在MTS中使用的变换核类型可以包括DCT2、DCT4,DCT5、DCT7、DCT8、DST1、DST4、DST7等。在这些变换核类型中,组合多个变换核类型(例如,DST7和DCT8),并且导出多重变换核集(竖直变换核和水平变换核)。
在实施方式中,多个变换核类型可以包括第一变换核类型和第二变换核类型。在这种情况下,多个MTS候选可包括:包含对应于第一变换核类型的竖直变换核和水平变换核的MTS候选、包含对应于第一变换核类型的竖直变换核和对应于第二变换核类型的水平变换核的MTS候选、包含对应于第二变换核类型的竖直变换核和对应于第一变换核类型的水平变换核的MTS候选以及包含对应于第二变换核类型的竖直变换核和水平变换核的MTS候选。在这种情况下,第一变换核类型和第二变换核类型可以是对应于预定变换矩阵的变换核类型。例如,第一变换核类型可以被预定为DST类型7,并且第二变换核类型可以被预定为DCT类型8。
此外,多个MTS候选可被映射到MTS索引信息。例如,在MTS索引信息指示第一索引值(例如,索引值0)的情况下,对应于竖直变换核的变换核类型可以为DST类型7,且对应于水平变换核的变换核类型可以为DST类型7。在MTS索引信息指示第二索引值(例如,索引值1)的情况下,与竖直变换核相对应的变换核类型可以是DST类型7,并且与水平变换核相对应的变换核类型可以是DCT类型8。在MTS索引信息指示第三索引值(例如,索引值2)的情况下,与竖直变换核相对应的变换核类型可以是DCT类型8,并且与水平变换核相对应的变换核类型可以是DST类型7。在MTS索引信息指示第四索引值(例如,索引值3)的情况下,与竖直变换核相对应的变换核类型可以是DCT类型8,并且与水平变换核相对应的变换核类型可以是DCT类型8。根据实施方式,通过考虑帧内预测模式的方向性,可以构造多个MTS候选并将其映射到MTS索引信息。例如,在当前块的预测模式是非定向模式(例如,DC模式或平面模式)的情况下,如上文所例示,对应于竖直和水平变换核的变换核类型彼此不同地映射到第一到第四索引值,并且可以构造MTS候选。换句话说,在当前块的预测模式是非定向模式(例如,DC模式或平面模式)的情况下,可通过使用由第一到第四索引值中的任一者指示的竖直和水平变换核来执行变换。这样的MTS候选构造方案在上文通过上表18至上表20描述。
即,在执行基于MTS的变换时,编码设备可通过使用由MTS索引信息指示的MTS候选表示的变换核集中包括的竖直变换核和水平变换核来对当前块执行变换。
根据实施方式,编码设备可确定是否对当前块执行基于MTS的变换,并可产生确定的信息作为MTS标志信息。例如,MTS标志信息可以是上述表14和表15中描述的cu_mts_flag语法元素。MTS标志信息(例如,cu_mts_flag)等于1的情况可表示执行对当前块的基于MTS的变换。编码设备可对包括MTS标志信息的用于MTS的信息进行编码,并将该信息发送到解码设备。在这种情况下,当MTS标志信息(例如,cu_mts_flag)被设置为1时,编码设备可通过将用于指示应用于当前块的变换核集的MTS索引信息附加地包括在用于MTS的信息中来对MTS索引信息进行编码和发信号通知。
此外,根据实施方式,编码设备可确定多重变换选择是否可用于当前块,并产生确定的信息作为MTS可用性标志信息。在这种情况下,可以根据预测模式将MTS可用性标志信息定义为MTS帧内可用性标志信息和MTS帧间可用性标志信息。MTS帧内可用性标志信息可以是上面表12和表13中描述的sps_mts_intra_enabled_flag语法元素,并且表示基于MTS的变换是否可用于帧内编码块。MTS帧间可用性标志信息可以是上述表12和表13中描述的sps_mts_inter_enabled_flag语法元素,并且表示基于MTS的变换是否可用于帧间编码块。
即,在编码设备确定当前块是用帧内预测模式编码的块并且多重变换选择可用的情况下,编码设备可将MTS帧内可用性标志信息(即,sps_mts_intra_enabled_flag)设置为等于1并对其进行编码。另选地,在编码设备确定当前块是用帧间预测模式编码的块并且多重变换选择可用的情况下,编码设备可将MTS帧间可用性标志信息(即,sps_mts_inter_enabled_flag)设置为等于1并对其进行编码。在这种情况下,MTS帧内可用性标志信息(即,sps_mts_intra_enabled_flag)和MTS帧间可用性标志信息(即,sps_mts_inter_enabled_flag)可以以序列参数集(SPS)级别被发信号通知。
此外,在编码设备确定多重变换选择可用的情况下(即,在MTS帧内可用性标志信息或MTS帧间可用性标志信息等于1的情况下),编码设备可对用于指示应用于当前块的变换核集的MTS索引信息进行编码并发信号通知。MTS索引信息可以通过残差编码语法或变换单元语法来发信号通知。
如上所述,用于MTS的信息可包括MTS标志信息、MTS帧内可用性标志信息和MTS帧间可用性标志信息以及MTS索引信息中的至少一个。换言之,编码设备可根据多重变换选择是否可用或是否应用多重变换选择来显式地发信号通知MTS标志信息、MTS帧内可用性标志信息和MTS帧间可用性标志信息,并且还可根据MTS标志信息、MTS帧内可用性标志信息和MTS帧间可用性标志信息来另外地发信号通知MTS索引信息。这可包括上表12至表17中所述的内容。
编码设备可基于当前块的变换系数执行量化并导出量化变换系数(步骤S1320),并且编码设备可基于量化变换系数生成残差信息(步骤S1330)。
编码装置可对包括用于MTS的信息和残差信息的图像信息进行编码(步骤S1340)。
这里,残差信息可包括诸如量化变换系数的变换方案、变换核和量化参数、值信息、位置信息等这样的信息。用于MTS的信息可包括如上所述的MTS索引信息、MTS标志信息、MTS帧内可用性标志信息和MTS帧间可用性标志信息。
编码图像信息可以以比特流格式输出。可以通过网络或存储介质将比特流发送到解码设备。
图14是示意性地示出根据本公开的实施方式的解码设备的视频/图像解码方法的流程图。
图14所示的方法可由图3所示的解码设备300执行。具体地,图14所示的步骤S1400可以由图3所示的熵解码器310执行,图14所示的步骤S1410可以由图3所示的反量化器321执行,图14所示的步骤S1420可以由图3所示的逆变换器322执行,并且图14所示的步骤S1430可以由图3所示的预测器330和加法器340执行。此外,图14所示的方法可以包括本公开中的上述实施方式。因此,在图14中省略或简要描述与上述实施方式重叠的内容的详细描述。
参照图14,解码设备可从比特流导出当前块的量化变换系数(步骤S1400)。
在实施方式中,解码设备可从比特流获得残差信息并对其进行解码,并基于残差信息导出当前块的量化变换系数。这里,残差信息可包括诸如量化变换系数的变换方案、变换核和量化参数、值信息和位置信息等这样的信息。
解码设备可通过基于当前块的量化变换系数执行反量化来导出当前块的变换系数(步骤S1410)。
解码设备可通过基于当前块的变换系数执行逆变换来导出当前块的残差样本(步骤S1420)。在这种情况下,解码设备可通过应用多重变换选择(以下,MTS)来执行逆变换。
在实施方式中,解码设备可从比特流获得用于MTS的信息并对其进行解码,并以基于用于MTS的信息导出的变换核集为基础执行逆变换。这里,用于MTS的信息可包括用于指示应用于当前块的变换核集的MTS索引信息。
更具体地,解码设备可获得包括在用于MTS的信息中的MTS索引信息,并通过使用由MTS索引信息指示的MTS候选表示的变换核集中包括的竖直变换核和水平变换核来执行逆变换。如上所述,MTS索引信息是指示多个MTS候选中的应用于当前块的MTS候选的信息并被从编码设备发信号通知。
这里,多个MTS候选是通过包括竖直变换核和水平变换核的组合来构造的,并且例如,可以包括上面表18到表25中公开的实施方式。换言之,多个MTS候选可表示多重变换核集,并且可通过组合对应于竖直变换核的变换核类型和对应于水平变换核的变换核类型来导出多重变换核集。此外,与竖直变换核相对应的变换核类型可以是多个MTS候选中的一个,并且与水平变换核相对应的变换核类型也可以是多个MTS候选中的一个。例如,可以在MTS中使用的变换核类型可以包括DCT2、DCT4、DCT5、DCT7、DCT8、DST1、DST4、DST7等。在这些变换核类型中,组合多个变换核类型(例如,DST7和DCT8),并且导出多重变换核集(竖直变换核和水平变换核)。
在实施方式中,多个变换核类型可以包括第一变换核类型和第二变换核类型。在这种情况下,多个MTS候选可包括:包含对应于第一变换核类型的竖直变换核和水平变换核的MTS候选、包含对应于第一变换核类型的竖直变换核和对应于第二变换核类型的水平变换核的MTS候选、包含对应于第二变换核类型的竖直变换核和对应于第一变换核类型的水平变换核的MTS候选以及包含对应于第二变换核类型的竖直变换核和水平变换核的MTS候选。在这种情况下,第一变换核类型和第二变换核类型可以是对应于预定变换矩阵的变换核类型。例如,第一变换核类型可以被预确定为DST类型7,并且第二变换核类型可以被预确定为DCT类型8。
此外,多个MTS候选可被映射到MTS索引信息。例如,在MTS索引信息指示第一索引值(例如,索引值0)的情况下,对应于竖直变换核的变换核类型可以为DST类型7,且对应于水平变换核的变换核类型可以为DST类型7。在MTS索引信息指示第二索引值(例如,索引值1)的情况下,与竖直变换核相对应的变换核类型可以是DST类型7,并且与水平变换核相对应的变换核类型可以是DCT类型8。在MTS索引信息指示第三索引值(例如,索引值2)的情况下,与竖直变换核相对应的变换核类型可以是DCT类型8,并且与水平变换核相对应的变换核类型可以是DST类型7。在MTS索引信息指示第四索引值(例如,索引值3)的情况下,与竖直变换核相对应的变换核类型可以是DCT类型8,并且与水平变换核相对应的变换核类型可以是DCT类型8。根据实施方式,通过考虑帧内预测模式的方向性,可以构造多个MTS候选并将其映射到MTS索引信息。例如,在当前块的预测模式是非定向模式(例如,DC模式或平面模式)的情况下,如上文所例示,对应于竖直和水平变换核的变换核类型彼此不同地映射到第一到第四索引值,并且可以构造MTS候选。换句话说,在当前块的预测模式是非定向模式(例如,DC模式或平面模式)的情况下,可通过使用由第一到第四索引值中的任一者指示的竖直和水平变换核来执行变换。这样的MTS候选构造方案在上文通过上表18至上表20描述。
即,在执行基于MTS的逆变换时,解码设备可通过使用由MTS索引信息指示的MTS候选表示的变换核集中包括的竖直变换核和水平变换核来对当前块执行逆变换。例如,在当前块的预测模式是非定向模式(例如,DC模式或平面模式)并且MTS索引信息指示第一索引值的情况下,解码设备可导出DST类型7作为与映射到第一索引值的竖直和水平变换核类型相应的变换核类型,并且通过应用它,可对当前块执行逆变换。
根据实施方式,解码设备可从比特流获得关于是否对当前块执行基于MTS的逆变换的信息(即,MTS标志信息)。例如,MTS标志信息可以是上述表14和表15中描述的cu_mts_flag语法元素。MTS标志信息(例如,cu_mts_flag)等于1的情况可表示执行当前块的基于MTS的逆变换。因此,解码设备可确定在MTS标志信息(例如,cu_mts_flag)等于1的情况下执行当前块的基于MTS的逆变换,并可进一步包括来自比特流的MTS标志信息。
此外,根据实施方式,解码设备可从比特流获得用于指示多重变换选择是否可用于当前块的信息(即,MTS可用性标志信息)。在这种情况下,可以根据预测模式将MTS可用性标志信息定义为MTS帧内可用性标志信息和MTS帧间可用性标志信息。MTS帧内可用性标志信息可以是上面表12和表13中描述的sps_mts_intra_enabled_flag语法元素,并且表示基于MTS的变换是否可用于帧内编码块。MTS帧间可用性标志信息可以是上述表12和表13中描述的sps_mts_inter_enabled_flag语法元素,并且表示基于MTS的变换是否可用于帧间编码块。
例如,在MTS帧内可用性标志信息(即,sps_mts_intra_enabled_flag)等于1并且当前块的预测模式是帧内预测模式的情况下,解码设备可确定多重变换选择可用于当前块,并且可进一步从比特流获得MTS索引信息。另选地,在MTS帧间可用性标志信息(即,sps_mts_inter_enabled_flag)等于1并且当前块的预测模式是帧间预测模式的情况下,解码设备可确定多重变换选择可用于当前块,并可进一步从比特流获得MTS索引信息。在这种情况下,解码设备可导出由所获得的MTS索引信息指示的变换核集(竖直和水平变换核)。
在MTS帧内可用性标志信息(即,sps_mts_intra_enabled_flag)等于0并且当前块的预测模式是帧内预测模式的情况下,或者在MTS帧间可用性标志信息(即,sps_mts_inter_enabled_flag)等于0并且当前块的预测模式是帧间预测模式的情况下,不从编码设备显式地发信号通知MTS索引信息。在这种情况下,解码设备可以应用预定义的变换核集(竖直和水平变换核)。例如,解码设备可将当前块的水平变换核的变换核类型和竖直变换核的变换核类型都推断为DCT类型2并执行逆变换。
MTS帧内可用性标志信息(即,sps_mts_intra_enabled_flag)和MTS帧间可用性标志信息(即,sps_mts_inter_enabled_flag)可以以序列参数集(SPS)级别被发信号通知。在MTS帧内可用性标志信息或MTS帧间可用性标志信息等于1的情况下获得的MTS索引信息可以通过残差编码语法级别或变换单元语法级别来发信号通知。
如上所述,用于MTS的信息可包括MTS标志信息、MTS帧内可用性标志信息和MTS帧间可用性标志信息以及MTS索引信息中的至少一个。换句话说,解码设备可根据多重变换选择是否可用或是否应用多重变换选择来针对当前块显式地获得MTS标志信息、MTS帧内可用性标志信息和MTS帧间可用性标志信息。此外,解码设备可通过相应的级别语法根据MTS标志信息、MTS帧内可用性标志信息和MTS帧间可用性标志信息来另外显式地获得MTS索引信息。这可包括上表12至表17中所述的内容。
解码设备可基于当前块的残差样本产生重构图片(步骤S1430)。
在实施方式中,解码设备可基于当前块的预测模式执行帧间预测或帧内预测,并产生当前块的预测样本。此外,解码设备可将当前块的预测样本和残差样本相加并获得重构样本。解码设备可基于重构样本重构当前图片。随后,根据需要,为了改善主观/客观图像质量,解码设备可以将环路内滤波处理(例如去块滤波,SAO和/或ALF处理)应用于如上所述的重构图片。
此外,可以根据下表27中所述的规范来执行本公开中的基于上述MTS执行(逆)变换的方法。
[表27]
Figure BDA0002991093840000521
Figure BDA0002991093840000531
在以上提到的实施方式中,虽然已基于以一系列步骤或单元的形式的流程图描述了这些方法,但是本文档的实施方式不限于这些步骤的顺序,并且这些步骤中的一些可以按照与其它步骤的顺序不同的顺序执行或者可以与其它步骤同时执行。此外,本领域技术人员将理解,在流程图中示出的步骤不是排他性的,并且在不影响本文档的权利范围的情况下,这些步骤可以包括附加步骤或者可以删除流程图中的一个或更多个步骤。
根据本文档的以上提到的方法可以用软件形式实现,并且根据本文档的编码设备和/或解码设备可以被包括在例如TV、计算机、智能电话、机顶盒或显示装置的用于执行图像处理的设备中。
在本文档中,当以软件形式实现实施方式时,以上提到的方法可以被实现为用于执行以上提到的功能的模块(程序、函数等)。模块可以被存储在存储器中并且由处理器来执行。存储器可以布置在处理器的内部或外部,并且通过各种公知手段连接到处理器。处理器可以包括专用集成电路(ASIC)、其它芯片集、逻辑电路和/或数据处理装置。存储器可以包括只读存储器(ROM)、随机存取存储器(RAM)、闪存、存储卡、存储介质和/或其它存储装置。即,本文档中描述的实施方式可以在处理器、微处理器、控制器或芯片上实现并执行。例如,附图中例示的功能单元可以在计算机、处理器、微处理器、控制器或芯片上实现并执行。在这种情况下,用于这种实现的信息(例如,关于指令的信息)或算法可以被存储在数字存储介质中。
此外,应用本文档的解码设备和编码设备可以被包括在多媒体广播发送和接收装置、移动通信终端、家庭影院视频装置、数字影院视频装置、监视相机、视频聊天装置、诸如视频通信这样的实时通信装置、移动流传输装置、存储介质、摄像机、视频点播(VoD)服务提供装置、顶置(OTT)视频装置、互联网流传输服务提供装置、三维(3D)视频装置、虚拟现实(VR)装置、增强现实(AR)装置、视频电话视频装置、运输工具终端(例如,车辆(包括自主车辆)终端、飞机终端和轮船终端)和医疗视频装置中,并且可以被用于处理视频信号或数据信号。例如,顶置(OTT)视频装置可以包括游戏控制台、Blueray播放器、互联网访问TV、家庭影院系统、智能电话、平板PC和数字录像机(DVR)。
此外,应用本文档的处理方法可以以由计算机执行的程序的形式产生,并且可以被存储在计算机可读记录介质中。根据本文档的具有数据结构的多媒体数据也可以被存储在计算机可读记录介质中。计算机可读记录介质包括存储有计算机可读数据的所有种类的存储装置。计算机可读记录介质可以包括例如Blueray盘(BD)、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。此外,计算机可读记录介质包括以载波(例如,通过互联网进行传输)的形式实现的介质。此外,使用编码方法而生成的比特流可以被存储在计算机可读记录介质中,或者可以通过有线和无线通信网络传输。
此外,本文档的实施方式可以使用程序代码被实现为计算机程序产品。可以由根据本文档的实施方式的计算机执行程序代码。程序代码可以被存储在可由计算机读取的载波上。
图15示出了可以应用本文档中公开的实施方式的内容流传输系统的示例。
参考图15,应用本文档的实施方式的内容流传输系统可以基本上包括编码服务器、流传输服务器、网络服务器、媒体存储器、用户装置和多媒体输入装置。
编码服务器将从诸如智能电话、相机、摄像机等这样的多媒体输入装置输入的内容压缩成数字数据以生成比特流,并且将该比特流传输到流传输服务器。作为另一示例,当诸如智能电话、相机、摄像机等这样的多媒体输入装置直接生成比特流时,可以省略编码服务器。
可以通过应用本文档的实施方式的编码方法或比特流生成方法来生成比特流,并且流传输服务器可以在发送或接收比特流的处理中临时存储比特流。
流传输服务器基于用户的请求通过网络服务器将多媒体数据发送到用户装置,并且网络服务器用作将服务告知用户的介质。当用户向网络服务器请求所期望的服务时,网络服务器将其传送到流传输服务器,流传输服务器将多媒体数据发送到用户。在这种情况下,内容流传输系统可以包括单独的控制服务器。在这种情况下,控制服务器用于控制内容流传输系统中的装置之间的命令/响应。
流传输服务器可以从媒体存储器和/或编码服务器接收内容。例如,当从编码服务器接收内容时,可以实时地接收内容。在这种情况下,为了提供平稳的流传输服务,流传输服务器可以存储比特流达预定时间。
用户装置的示例可以包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航仪、触屏PC、平板PC、超级本、可穿戴装置(例如,智能手表、智能眼镜、头戴式显示器)、数字TV、台式计算机、数字标牌等。
内容流传输系统中的各个服务器可以作为分布式服务器操作,在这种情况下,从各个服务器接收到的数据可以被分发。

Claims (15)

1.一种由解码设备执行的图像解码方法,包括以下步骤:
从比特流导出当前块的量化变换系数;
通过基于所述量化变换系数执行反量化来导出变换系数;
通过基于所述变换系数执行逆变换来导出所述当前块的残差样本;以及
基于所述残差样本产生重构图片,
其中,通过从所述比特流获得用于多重变换选择MTS的信息并使用基于所述用于MTS的信息导出的变换核集来执行所述逆变换。
2.根据权利要求1所述的方法,其中,所述用于MTS的信息包括用于指示在多个MTS候选中应用于所述当前块的MTS候选的MTS索引信息,
其中,通过使用由所述MTS索引信息指示的MTS候选表示的变换核集中包括的竖直变换核和水平变换核来执行所述逆变换。
3.根据权利要求2所述的方法,其中,所述多个MTS候选表示多重变换核集,
其中,所述多重变换核集是通过组合对应于所述竖直变换核的变换核类型和对应于所述水平变换核的变换核类型而导出的,并且
其中,与所述竖直变换核相对应的变换核类型是多个变换核类型之一,并且与所述水平变换核相对应的变换核类型是所述多个变换核类型之一。
4.根据权利要求3所述的方法,其中,所述多个变换核类型包括第一变换核类型和第二变换核类型,并且
其中,所述MTS索引信息被定义为指示以下中的至少一个的索引值:
包括对应于所述第一变换核类型的竖直变换核和水平变换核的MTS候选,
包括对应于所述第一变换核类型的竖直变换核和对应于所述第二变换核类型的水平变换核的MTS候选,
包括对应于所述第二变换核类型的竖直变换核和对应于所述第一变换核类型的水平变换核的MTS候选,以及
包括对应于所述第二变换核类型的竖直变换核和水平变换核的MTS候选。
5.根据权利要求4所述的方法,其中,所述第一变换核类型和所述第二变换核类型是对应于预定变换矩阵的变换核类型。
6.根据权利要求4所述的方法,其中,所述第一变换核类型是离散正弦变换DST类型7,并且
其中,所述第二变换核类型是离散余弦变换DCT类型8。
7.根据权利要求2所述的方法,其中,当所述当前块的预测模式是非定向模式并且所述MTS索引信息指示第一索引值时,与所述竖直变换核相对应的变换核类型是DST类型7,并且与所述水平变换核相对应的变换核类型是DST类型7,
其中,当所述当前块的预测模式为非定向模式且所述MTS索引信息指示第二索引值时,与所述竖直变换核相对应的变换核类型为DST类型7,并且与所述水平变换核相对应的变换核类型为DCT类型8,
其中,当所述当前块的预测模式为非定向模式且所述MTS索引信息指示第三索引值时,与所述竖直变换核相对应的变换核类型为DCT类型8,与所述水平变换核相对应的变换核类型为DST类型7,并且
其中,当所述当前块的预测模式为非定向模式且所述MTS索引信息指示第四索引值时,与所述竖直变换核相对应的变换核类型为DCT类型8,与所述水平变换核相对应的变换核类型为DCT类型8。
8.根据权利要求2所述的方法,其中,所述用于MTS的信息包括用于指示是否对所述当前块执行基于MTS的逆变换的MTS标志信息,
其中,当所述MTS标志信息指示1时,所述用于MTS的信息包括所述MTS索引信息。
9.根据权利要求2所述的方法,其中,所述用于MTS的信息包括用于指示基于MTS的逆变换是否可用于帧内编码块的MTS帧内可用性标志信息和用于指示基于MTS的逆变换是否可用于帧间编码块的MTS帧间可用性标志信息,并且
其中,所述MTS帧内可用性标志信息和所述MTS帧间可用性标志信息以序列参数集SPS级别被发信号通知。
10.根据权利要求9所述的方法,其中,当所述MTS帧内可用性标志信息等于0并且所述当前块的预测模式是帧内预测模式时,所述当前块的水平变换核的变换核类型和所述当前块的竖直变换核的变换核类型都是DCT类型2,并且
其中,当所述MTS帧间可用性标志信息等于0并且所述当前块的预测模式是帧间预测模式时,所述当前块的水平变换核的变换核类型和所述当前块的竖直变换核的变换核类型都是DCT类型2。
11.一种由编码设备执行的图像编码方法,包括以下步骤:
导出当前块的残差样本;
通过基于所述残差样本执行变换来导出所述当前块的变换系数;
通过基于所述变换系数执行量化来导出量化变换系数;
基于所述量化变换系数生成残差信息;以及
对包括所述残差信息的图像信息进行编码,
其中,通过使用应用于所述当前块的变换核集来执行所述变换,
其中,生成表示所述变换核集的用于多重变换选择MTS的信息,并且
其中,所述用于MTS的信息被包括在所述图像信息中。
12.根据权利要求11所述的方法,其中,所述用于MTS的信息包括用于指示在多个MTS候选中应用于所述当前块的MTS候选的MTS索引信息,并且
其中,通过使用由所述MTS索引信息指示的MTS候选表示的变换核集中包括的竖直变换核和水平变换核来执行所述变换。
13.根据权利要求12所述的方法,其中,所述多个MTS候选表示多重变换核集,
其中,所述多重变换核集是通过组合对应于所述竖直变换核的变换核类型和对应于所述水平变换核的变换核类型而导出的,并且
其中,与所述竖直变换核相对应的变换核类型是多个变换核类型之一,并且与所述水平变换核相对应的变换核类型是所述多个变换核类型之一。
14.根据权利要求12所述的方法,其中,当所述当前块的预测模式是非定向模式并且所述MTS索引信息指示第一索引值时,与所述竖直变换核相对应的变换核类型是DST类型7,并且与所述水平变换核相对应的变换核类型是DST类型7,
其中,当所述当前块的预测模式为非定向模式且所述MTS索引信息指示第二索引值时,与所述竖直变换核相对应的变换核类型为DST类型7,并且与所述水平变换核相对应的变换核类型为DCT类型8,
其中,当所述当前块的预测模式为非定向模式且所述MTS索引信息指示第三索引值时,与所述竖直变换核相对应的变换核类型为DCT类型8,并且与所述水平变换核相对应的变换核类型为DST类型7,并且
其中,当所述当前块的预测模式为非定向模式且所述MTS索引信息指示第四索引值时,与所述竖直变换核相对应的变换核类型为DCT类型8,并且与所述水平变换核相对应的变换核类型为DCT类型8。
15.根据权利要求12所述的方法,其中,所述用于MTS的信息包括用于指示基于MTS的逆变换是否可用于帧内编码块的MTS帧内可用性标志信息和用于指示基于MTS的逆变换是否可用于帧间编码块的MTS帧间可用性标志信息,并且
其中,所述MTS帧内可用性标志信息和所述MTS帧间可用性标志信息以序列参数集SPS级别被发信号通知。
CN201980062874.0A 2018-09-02 2019-09-02 基于多重变换选择的图像编码方法及其装置 Pending CN112753220A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862726299P 2018-09-02 2018-09-02
US62/726,299 2018-09-02
PCT/KR2019/011270 WO2020046091A1 (ko) 2018-09-02 2019-09-02 다중 변환 선택에 기반한 영상 코딩 방법 및 그 장치

Publications (1)

Publication Number Publication Date
CN112753220A true CN112753220A (zh) 2021-05-04

Family

ID=69643683

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980062874.0A Pending CN112753220A (zh) 2018-09-02 2019-09-02 基于多重变换选择的图像编码方法及其装置

Country Status (5)

Country Link
US (1) US20210211727A1 (zh)
EP (1) EP3836543A1 (zh)
KR (3) KR102633714B1 (zh)
CN (1) CN112753220A (zh)
WO (1) WO2020046091A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116868567A (zh) * 2021-10-13 2023-10-10 腾讯美国有限责任公司 自适应多变换集合选择
CN116868567B (zh) * 2021-10-13 2024-06-11 腾讯美国有限责任公司 视频解码方法、装置、计算机设备及存储介质

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220038702A1 (en) 2018-09-20 2022-02-03 Nokia Technologies Oy A method and an apparatus for encoding and decoding of digital image/video material
KR20210104895A (ko) * 2018-12-28 2021-08-25 텔레호낙티에볼라게트 엘엠 에릭슨(피유비엘) 인코더 및 디코더에서 변환 선택을 선택하기 위한 방법 및 장치
CN113905232A (zh) * 2019-03-09 2022-01-07 杭州海康威视数字技术股份有限公司 进行编码和解码的方法、解码端、编码端和系统
CN113950829A (zh) * 2019-06-06 2022-01-18 北京字节跳动网络技术有限公司 简化的变换编解码工具
US11432014B2 (en) * 2019-10-25 2022-08-30 Qualcomm Incorporated Parametric graph-based separable transforms for video coding
US11616983B2 (en) * 2020-05-05 2023-03-28 Tencent America LLC Joint component secondary transform
US11683490B2 (en) 2020-09-10 2023-06-20 Tencent America LLC Context adaptive transform set
CN115633172A (zh) * 2020-12-06 2023-01-20 浙江大华技术股份有限公司 基于ibc模式编码方法、电子设备及存储介质
WO2023101525A1 (ko) * 2021-12-02 2023-06-08 현대자동차주식회사 다중 변환 선택에서 다중 변환 선택 후보의 개수를 조정하는 비디오 부호화/복호화 방법 및 장치
WO2024039209A1 (ko) * 2022-08-17 2024-02-22 주식회사 윌러스표준기술연구소 비디오 신호 처리 방법 및 이를 위한 장치

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104378637A (zh) * 2011-10-18 2015-02-25 株式会社Kt 视频信号解码方法
CN107211144A (zh) * 2015-01-26 2017-09-26 高通股份有限公司 用于预测残差的增强型多重变换
US20170324643A1 (en) * 2016-05-03 2017-11-09 Qualcomm Incorporated Binarizing secondary transform index
US20180020241A1 (en) * 2016-07-15 2018-01-18 Qualcomm Incorporated Signaling of quantization information in non-quadtree-only partitioned video coding

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102416804B1 (ko) * 2016-10-14 2022-07-05 세종대학교산학협력단 영상 부호화 방법/장치, 영상 복호화 방법/장치 및 비트스트림을 저장한 기록 매체
CN110024399B (zh) * 2016-11-28 2024-05-17 韩国电子通信研究院 对图像编码/解码的方法和设备及存储比特流的记录介质
CA3041856A1 (en) * 2016-12-28 2018-07-05 Sony Corporation Image processing apparatus and method
WO2019076138A1 (en) * 2017-10-16 2019-04-25 Huawei Technologies Co., Ltd. METHOD AND APPARATUS FOR ENCODING
CN110324668B (zh) * 2018-03-31 2021-01-05 华为技术有限公司 图像块编码中的变换方法、解码中的反变换方法及装置
KR102532021B1 (ko) * 2018-05-31 2023-05-12 후아웨이 테크놀러지 컴퍼니 리미티드 적응적 변환 타입의 공간 가변 변환
US10986340B2 (en) * 2018-06-01 2021-04-20 Qualcomm Incorporated Coding adaptive multiple transform information for video coding
US10687081B2 (en) * 2018-06-29 2020-06-16 Tencent America LLC Method, apparatus and medium for decoding or encoding
JP7424982B2 (ja) * 2018-08-15 2024-01-30 日本放送協会 画像符号化装置、画像復号装置、及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104378637A (zh) * 2011-10-18 2015-02-25 株式会社Kt 视频信号解码方法
CN107211144A (zh) * 2015-01-26 2017-09-26 高通股份有限公司 用于预测残差的增强型多重变换
US20170324643A1 (en) * 2016-05-03 2017-11-09 Qualcomm Incorporated Binarizing secondary transform index
US20180020241A1 (en) * 2016-07-15 2018-01-18 Qualcomm Incorporated Signaling of quantization information in non-quadtree-only partitioned video coding

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
AMIR SAID等: ""Description of core experiment CE6: transforms and transform signaling"" *
BENJAMIN BROSS: "" Versatile Video Coding (Draft 2)"", pages 1 - 85 *
C. ROSEWARNE: "CE6-related: EMT signalling", Retrieved from the Internet <URL:Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 11th Meeting: Ljubljana, SI, 10–18 July 2018, JVET-K0113> *
HILMI E等: ""CE6-related: Secondary Transforms Coupled with a Simplified Primary Transformation"" *
JIANLE CHEN: ""Algorithm description for Versatile Video Coding and Test Model 2 (VTM 2)"" *
MOONMO KOO: "CE 6-1.11: AMT replacement and restriction", Retrieved from the Internet <URL:Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 11th Meeting: Ljubljana, SI, 10–18 July 2018, JVET-K0096> *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116868567A (zh) * 2021-10-13 2023-10-10 腾讯美国有限责任公司 自适应多变换集合选择
CN116868567B (zh) * 2021-10-13 2024-06-11 腾讯美国有限责任公司 视频解码方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
EP3836543A4 (en) 2021-06-16
KR102534160B1 (ko) 2023-05-26
KR20230074290A (ko) 2023-05-26
US20210211727A1 (en) 2021-07-08
KR20240017992A (ko) 2024-02-08
KR102633714B1 (ko) 2024-02-06
EP3836543A1 (en) 2021-06-16
KR20210031754A (ko) 2021-03-22
WO2020046091A1 (ko) 2020-03-05

Similar Documents

Publication Publication Date Title
KR102534160B1 (ko) 다중 변환 선택에 기반한 영상 코딩 방법 및 그 장치
US11973963B2 (en) Transform-based image coding method and device
US11936911B2 (en) Image coding method based on secondary transform, and device therefor
US20210329249A1 (en) Image coding method based on secondary transform and apparatus therefor
AU2020382299B2 (en) Transform-based image coding method and device therefor
EP4376411A2 (en) Transform in intra prediction-based image coding
JP7230189B2 (ja) シンタックスデザイン方法及びシンタックスを用いてコーディングを行う装置
KR20220019241A (ko) 적응적 루프 필터 기반 비디오 또는 영상 코딩
KR20210158400A (ko) 영상 코딩에서 변환 커널 세트를 나타내는 정보의 시그널링
CN114982239A (zh) 基于变换的图像编码方法及其装置
CN113316938B (zh) 使用去块滤波的图像编译方法和装置
JP7476402B2 (ja) 画像コーディングシステムにおいて変換カーネルセットに関する情報に対するコンテキストコーディング
CN114747220A (zh) 基于变换的图像编码方法及其设备
KR20220000403A (ko) 변환 커널 세트에 관한 정보에 대한 코딩
EP4277278A1 (en) Transform-based image coding
CN114731434A (zh) 基于变换的图像编码方法及其装置
CN114930846A (zh) 基于变换的图像编码方法及其装置
CN114762343A (zh) 基于变换的图像编码方法及其装置
CN112840649A (zh) 图像编码系统中通过使用块分割对图像解码的方法及其装置
CN113273210B (zh) 用于编译关于合并数据的信息的方法和装置
CN114651445A (zh) 基于变换的视频编码方法及其装置
CA3157671A1 (en) Transform-based image coding method and device for same
CA3155120A1 (en) Transform-based image coding method, and device therefor
CN115516855A (zh) 图像编译方法及其装置
CN114762338A (zh) 基于变换的图像编码方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210504

WD01 Invention patent application deemed withdrawn after publication