CN114128276A - 图像编译中指示变换核集的信息的信令 - Google Patents

图像编译中指示变换核集的信息的信令 Download PDF

Info

Publication number
CN114128276A
CN114128276A CN202080052291.2A CN202080052291A CN114128276A CN 114128276 A CN114128276 A CN 114128276A CN 202080052291 A CN202080052291 A CN 202080052291A CN 114128276 A CN114128276 A CN 114128276A
Authority
CN
China
Prior art keywords
bin
transform
bins
index
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080052291.2A
Other languages
English (en)
Inventor
南廷学
具文模
林宰显
金昇焕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN114128276A publication Critical patent/CN114128276A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/94Vector quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/39Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving multiple description coding [MDC], i.e. with separate layers being structured as independently decodable descriptions of input picture data

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

根据本文档的图像解码方法包括基于残差信息生成当前块的残差样本的步骤,其中,残差信息包括多变换选择(MTS)索引和关于变换系数的信息,通过使用变换核集,从根据关于变换系数的信息的变换系数生成残差样本,变换核集由MTS索引从变换核集候选中确定,基于上下文编译导出MTS索引的bin串的至少一个bin,相对于MTS索引,基于上下文索引的值来执行上下文编译。

Description

图像编译中指示变换核集的信息的信令
技术领域
本公开涉及图像编译技术,并且更具体地,涉及指示图像编译中的变换核集的信息的信令。
背景技术
最近,在各种领域中对诸如4K或8K超高清(UHD)图像/视频的高分辨率、高质量图像/视频的需求不断增加。随着图像/视频分辨率或质量变得更高,与传统图像/视频数据相比发送相对更多的信息或比特。因此,如果图像/视频数据经由诸如现有有线/无线宽带线路的介质发送或被存储在传统存储介质中,则传输和存储的成本容易增加。
此外,对虚拟现实(VR)和人工现实(AR)内容以及诸如全息图这样的沉浸式媒体的兴趣和需求日益增长;并且表现出与实际图像/视频不同的图像/视频特性的图像/视频(例如,游戏图像/视频)的广播也日益增长。
因此,需要高度高效的图像/视频压缩技术来有效地压缩并发送、存储或播放如上所述显示出各种特性的高分辨率、高质量图像/视频。
发明内容
技术方案
根据本文档的实施例,提供了一种用于增强图像/视频编译效率的方法和装置。
根据本文档的实施例,提供了一种用于发信号通知指示图像编译中的变换核集的信息的方法和装置。
根据本文档的实施例,提供了一种用于发信号通知MTS索引信息的方法和装置。
根据本文档的实施例,提供了一种用于对指示变换核集的信息进行编译的方法和装置。
根据本文档的实施例,提供了一种用于发信号通知表示多个变换核集当中,要应用于当前块的变换核集的信息的方法和装置。
根据本文档的实施例,提供了一种用于相对于MTS索引的bin串的bin的上下文编译或旁路编译的方法和装置。
根据本文档的实施例,提供了由解码装置执行的视频/图像解码方法。
根据本文档的实施例,提供了用于执行视频/图像解码的解码装置。
根据本文档的实施例,提供了由编码装置执行的视频/图像编码方法。
根据本文档的实施例,提供了用于执行视频/图像编码的编码装置。
根据本文档的实施例,提供了存储根据本文档的实施例中的至少一个中公开的视频/图像编码方法生成的编码的视频/图像信息的计算机可读数字存储介质。
根据本文档的实施例,提供了存储使解码装置执行在本文档的实施例中的至少一个中公开的视频/图像解码方法的编码的信息或编码的视频/图像信息的计算机可读数字存储介质。
有益效果
根据本文档,可以增强整体图像/视频压缩效率。
根据本文档,可以有效地发信号通知指示变换核集的信息。
根据本文档,可以通过有效地编译指示变换核集的信息,降低编译系统的复杂度。
可以通过本文档的详细示例获得的效果不限于以上列举的效果。例如,可以存在相关领域的普通技术人员能够从本文档中理解或导出的各种技术效果。因此,本文档的详细效果不限于在本文档中明确阐述的效果,而是可以包括可以从本文档的技术特征中理解或导出的各种效果。
附图说明
图1示意性地图示了适用本文档的视频/图像编译系统的示例。
图2是示意性地说明了适用本文档的视频/图像编码装置的配置的示图。
图3是示意性地说明了适用本文档的视频/图像解码装置的配置的示图。
图4示例性地图示了65个预测方向上的帧内定向模式。
图5示例性地图示了用于编码语法元素的上下文自适应二进制算术编译(CABAC)。
图6和图7示意性地示出了根据本文档的实施例的多变换方案。
图8和图9是用于说明根据本文档的实施例的RST的图。
图10和图11是用于说明根据本文档的实施例的RST的图。
图12和图13示意性地图示了根据本文档的(一个或多个)实施例的视频/图像解码方法和相关组件的示例。
图14示出了可应用本文档中公开的实施例的内容流传输系统的示例。
具体实施方式
本公开可按各种形式修改,将描述并且在附图中图示其特定实施例。然而,这些实施例并非旨在限制本公开。以下描述中使用的术语仅用于描述特定实施例,而非旨在限制本公开。单数表达包括复数表达,只要清楚地不同解读即可。诸如“包括”和“具有”这样的术语旨在指示存在以下描述中使用的特征、数量、步骤、操作、元件、部件或其组合,因此应该理解,不排除存在或添加一个或更多个不同的特征、数量、步骤、操作、元件、部件或其组合的可能性。
另外,本文档描述的附图的各个配置是为了说明作为彼此不同的特征的功能而独立的图示的,并不意指各个配置通过彼此不同的硬件或不同的软件被实现。例如,可以组合配置中的两个或更多个的配置以形成一个配置,并且也可以将一个配置划分为多个配置。在不脱离本文档的主旨的情况下,配置被组合和/或分离的实施例被包括在权利要求的范围内。
下文中,将参照附图详细地描述本实施例的示例。另外,在整个附图中,类似的附图标记用于指示类似的元件,并且将省略对类似元件的相同描述。
在本文档中,视频可以是指随时间推移的一系列图像。图片通常是指表示特定时间帧的一个图像的单位,并且切片/图块是指在编译方面构成图片的一部分的单位。切片/图块可以包括一个或更多个编译树单元(CTU)。一幅图片可以由一个或更多个切片/图块组成。一幅图片可以由一个或更多个图块组组成。一个图块组可以包括一个或更多个图块。
像素或像元(pel)可意指构成一个图片(或图像)的最小单元。另外,“样本”可用作与像素对应的术语。样本通常可表示像素或像素值,并且可仅表示亮度分量的像素/像素值或仅表示色度分量的像素/像素值。
单元可表示图像处理的基本单位。单元可包括图片的特定区域和与该区域有关的信息中的至少一个。一个单元可包括一个亮度块和两个色度(例如,cb、cr)块。在一些情况下,单元可与诸如块或区域这样的术语互换使用。在一般情况下,M×N块可包括M列和N行的样本(或样本数组)或变换系数的集合(或数组)。另选地,样本可意指空间域中的像素值,并且当这样的像素值被变换到频域时,它可意指频域中的变换系数。
另外,在本说明书中使用的括号可以意指“例如”。具体地,在表达“预测(帧内预测)”的情况下,可以指示“帧内预测”被提议作为“预测”的示例。换句话说,本说明书中的术语“预测”不限于“帧内预测”,并且可以指示“帧内预测”被提议作为“预测”的示例。另外,即使在表达“预测(即,帧内预测)”的情况下,也可以指示“帧内预测”被提议作为“预测”的示例。
本文档涉及视频/图像编译。例如,本文档中公开的方法/实施例可以涉及通用视频编译(VVC)标准(ITU-T Rec.H.266)、VVC之后的下一代视频/图像编译标准或其他视频编译相关标准(例如,高效视频编译(HEVC)标准(ITU-T Rec.H.265)、基本视频编译(EVC)标准、AVS2标准等)。
在本文档中,术语“/”和“,”应该被解释为指示“和/或”。例如,表述“A/B”可以意指“A和/或B”。另外,“A、B”可以意指“A和/或B”。另外,“A/B/C”可以意指“A、B和/或C中的至少一个”。另外,“A/B/C”可以意指“A、B和/或C中的至少一个”。
另外,在该文献中,术语“或”应该被解释为指示“和/或”。例如,表述“A或B”可以包括1)仅A、2)仅B和/或3)A和B二者。换句话说,本文档中的术语“或”应该被解释为指示“另外地或另选地”。
在本说明书中,“A和B中的至少一个”可以意指“仅A”、“仅B”或“A和B二者”。另外,在本说明书中,表述“A或B中的至少一个”或“A和/或B中的至少一个”可以被解释为与“A和B中的至少一个”相同。
另外,在本说明书中,“A、B和C中的至少一个”可以意指“仅A”、“仅B”、“仅C”或“A、B和C的任何组合”。另外,“A、B或C中的至少一个”或“A、B和/或C中的至少一个”可以意指“A、B和C中的至少一个”。
在本说明书中,在一个附图中被单独说明的技术特征可以单独实现,或者可以同时实现。
本文档提议了视频/图像编译的各种实施例,并且除非另外提到,否则以上实施例也可以彼此组合地执行。
图1图示了可以应用本文档的公开内容的视频/图像编译系统的示例。
参照图1,视频/图像编译系统可以包括源设备和接收设备。源设备可以通过数字存储介质或网络以文件或流传输的形式将编码的视频/图像信息或数据发送到接收设备。
源设备可包括视频源、编码装置和发送器。接收设备可包括接收器、解码装置和渲染器。编码装置可被称为视频/图像编码装置,解码装置可被称为视频/图像解码装置。发送器可被包括在编码装置中。接收器可被包括在解码装置中。渲染器可包括显示器,并且显示器可被配置为单独的设备或外部部件。
视频源可通过捕获、合成或生成视频/图像的处理来获取视频/图像。视频源可包括视频/图像捕获设备,和/或视频/图像生成设备。例如,视频/图像捕获设备可包括一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。例如,视频/图像生成设备可包括计算机、平板计算机和智能电话,并且可(以电子方式)生成视频/图像。例如,可通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可由生成相关数据的处理代替。
编码装置可对输入视频/图像进行编码。为了压缩和编译效率,编码装置可执行诸如预测、变换和量化的一系列过程。编码的数据(编码的视频/图像信息)可按比特流的形式输出。
发送器可通过数字存储介质或网络将以比特流的形式输出的编码的图像/图像信息或数据以文件或流的形式发送至接收设备的接收器。数字存储介质可包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送器可包括用于通过预定文件格式生成媒体文件的元件,并且可包括用于通过广播/通信网络传输的元件。接收器可接收/提取比特流并且将所接收的比特流发送至解码装置。
解码装置可通过执行与编码装置的操作对应的诸如解量化、逆变换和预测的一系列过程对视频/图像进行解码。
渲染器可渲染解码的视频/图像。渲染的视频/图像可通过显示器显示。
图2是示意性地图示了可以应用本文档的公开内容的视频/图像编码装置的配置的示图。下文中,所谓的视频编码装置可以包括图像编码装置。
参照图2,编码装置200包括图像分割器210、预测器220、残差处理器230和熵编码器240、加法器250、滤波器260和存储器270。预测器220可包括帧间预测器221和帧内预测器222。残差处理器230可包括变换器232、量化器233、解量化器234和逆变换器235。残差处理器230还可包括减法器231。加法器250可被称为重构器或重构块生成器。根据实施例,图像分割器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可由至少一个硬件部件(例如,编码器芯片组或处理器)配置。另外,存储器270可包括解码图片缓冲器(DPB),或者可由数字存储介质配置。硬件部件还可包括存储器270作为内部/外部部件。
图像分割器210可将输入到编码装置200的输入图像(或者图片或帧)分割成一个或更多个处理器。例如,处理器可被称为编译单元(CU)。在这种情况下,编译单元可根据四叉树二叉树三叉树(QTBTTT)结构从编译树单元(CTU)或最大编译单元(LCU)递归地分割。例如,一个编码单元可基于四叉树结构、二叉树结构和/或三元结构被分割成深度更深的多个编码单元。在这种情况下,例如,可首先应用四叉树结构,稍后可应用二叉树结构和/或三元结构。另选地,可首先应用二叉树结构。可基于不再分割的最终编译单元来执行根据本公开的编译过程。在这种情况下,根据图像特性基于编译效率等,最大编译单元可用作最终编译单元,或者如果需要,编译单元可被递归地分割成深度更深的编译单元并且具有最优大小的编译单元可用作最终编译单元。这里,编译过程可包括预测、变换和重构的过程(将稍后描述)。作为另一示例,处理器还可包括预测单元(PU)或变换单元(TU)。在这种情况下,预测单元和变换单元可从上述最终编译单元拆分或分割。预测单元可以是样本预测的单元,变换单元可以是用于导出变换系数的单元和/或用于从变换系数导出残差信号的单元。
在一些情况下,单元可与诸如块或区域这样的术语互换使用。在一般情况下,M×N块可表示由M列和N行组成的样本或变换系数的集合。样本通常可表示像素或像素值,可仅表示亮度分量的像素/像素值或者仅表示色度分量的像素/像素值。样本可用作与像素或像元的一个图片(或图像)对应的术语。
减法器231可以通过从输入图像信号(原始块、原始样本或原始样本数组)中减去从预测器220输出的预测信号(预测块、预测样本或预测样本数组)来生成残差信号(残差块、残差样本或残差样本数组),并且所生成的残差信号被发送到变换器232。预测器220可以对处理目标块(下文中,被称为“当前块”)执行预测,并生成包括当前块的预测样本的预测块。预测器220可以确定是以当前块或CU为单位应用帧内预测还是帧间预测。如随后在对每种预测模式的描述中所描述的,预测器可以生成诸如预测模式信息这样的与预测相关的各种类型的信息,并将所生成的信息传送到熵编码器240。关于预测的信息可以在熵编码器240中被编码并且以比特流的形式被输出。
帧内预测器222可参考当前图片中的样本来预测当前块。根据预测模式,所参考的样本可位于当前块附近或者可隔开。在帧内预测中,预测模式可包括多个非定向模式和多个定向模式。例如,非定向模式可包括DC模式和平面模式。例如,根据预测方向的详细程度,定向模式可包括33个定向预测模式或65个定向预测模式。然而,这仅是示例,可根据设置使用更多或更少的定向预测模式。帧内预测器222可使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可基于参考图片上运动矢量所指定的参考块(参考样本数组)来导出当前块的预测块。这里,为了减少在帧间预测模式下发送的运动信息量,可基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可包括运动矢量和参考图片索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可包括存在于当前图片中的空间邻近块和存在于参考图片中的时间邻近块。包括参考块的参考图片和包括时间邻近块的参考图片可相同或不同。时间邻近块可被称为并置参考块、并置CU(colCU)等,并且包括时间邻近块的参考图片可被称为并置图片(colPic)。例如,帧间预测器221可基于邻近块来配置运动信息候选列表并且生成指示哪一候选用于导出当前块的运动矢量和/或参考图片索引的信息。可基于各种预测模式执行帧间预测。例如,在跳过模式和合并模式的情况下,帧间预测器221可使用邻近块的运动信息作为当前块的运动信息。在跳过模式下,与合并模式不同,可不发送残差信号。在运动矢量预测(MVP)模式的情况下,邻近块的运动矢量可用作运动矢量预测器,并且可通过用信号通知运动矢量差来指示当前块的运动矢量。
预测器220可以基于下述的各种预测方法来生成预测信号。例如,预测器不仅可以应用帧内预测或帧间预测来预测一个块,而且还可以同时应用帧内预测和帧间预测二者。这可以被称为组合的帧间和帧内预测(CIIP)。另外,预测器可以执行用于块的预测的帧内块复制(IBC)。帧内块复制可以用于游戏等的内容图像/运动图像编译,例如,屏幕内容编译(SCC)。IBC基本上在当前图片中执行预测,但可以因为在当前图片中导出参考块而与帧间预测类似地执行。即,IBC可以使用本文档中描述的帧间预测技术中的至少一种。
通过帧间预测器221和/或帧内预测器222生成的预测信号可以用于生成重构信号或者生成残差信号。变换器232可以通过向残差信号应用变换技术来生成变换系数。例如,变换技术可以包括离散余弦变换(DCT)、离散正弦变换(DST)、基于图的变换(GBT)或有条件非线性变换(CNT)中的至少一种。这里,GBT意指当用图表示像素之间的关系信息时从图获得的变换。CNT是指基于使用所有先前重构的像素生成的预测信号而获得的变换。另外,变换处理可以被应用于具有相同大小的正方形像素块,或者可以应用于具有可变大小而非正方形的块。
量化器233可以对变换系数进行量化并将它们发送到熵编码器240,并且熵编码器240可以对量化的信号(关于量化的变换系数的信息)进行编码并输出比特流。关于量化的变换系数的信息可以被称为残差信息。量化器233可以基于系数扫描顺序将块类型的量化的变换系数重新布置成一维矢量形式,并基于一维矢量形式的量化的变换系数来生成关于量化的变换系数的信息。熵编码器240可以执行诸如(例如)指数哥伦布(Golomb)、上下文自适应可变长度编译(CAVLC)、上下文自适应二进制算术编译(CABAC)等这样的各种编码方法。熵编码器240可以将视频/图像重构所必需的信息与量化的变换系数(例如,语法元素的值等)一起或分开地编码。编码的信息(例如,编码的视频/图像信息)可以以比特流的形式以网络抽象层(NAL)为单位进行发送或存储。视频/图像信息还可以包括与诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)这样的各种参数集有关的信息。另外,视频/图像信息还可以包括常规约束信息。在本文档中,随后将描述的用信号通知/发送的信息和/或语法元素可以通过上述编码过程被编码,并被包括在比特流中。比特流可以通过网络发送,或者可以被存储在数字存储介质中。这里,网络可以包括广播网络和/或通信网络,并且数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等这样的各种存储介质。发送从熵编码器240输出的信号的发送器(未图示)或存储信号的存储单元(未图示)可以被配置为编码装置200的内部/外部元件,并且另选地,发送器可以被包括在熵编码器240中。
从量化器233输出的量化的变换系数可以用于生成预测信号。例如,可以通过经由解量化器234和逆变换器235对量化的变换系数应用解量化和逆变换来重构残差信号(残差块或残差样本)。加法器250将重构的残差信号与从预测器220输出的预测信号相加,以生成重构信号(重构图片、重构块、重构样本、或重构样本数组)。如果没有处理目标块的残差(诸如,应用跳变模式的情况),则预测块可以用作重构块。所生成的重构信号可以用于当前图片中的下一处理目标块的帧内预测,并且如下所述,可以用于通过滤波进行的下一图片的帧间预测。
此外,可以在图片编码和/或重构处理期间应用具有色度缩放的亮度映射(LMCS)。
滤波器260可以通过向重构信号应用滤波来改善主观/客观图像质量。例如,滤波器260可以通过向重构图片应用各种滤波方法来生成修正的重构图片,并将修正的重构图片存储在存储器270中,具体地,存储在存储器270的DPB中。各种滤波方法可以包括例如解块滤波、样本自适应偏移(SAO)、自适应环路滤波器、双边滤波器等。滤波器260可以生成与滤波相关的各种类型的信息,并将所生成的信息传送到熵编码器290,如随后的每种过滤方法的描述中描述的。与滤波相关的信息可以由熵编码器290编码并以比特流的形式被输出。
发送到存储器270的修正的重构图片可以被用作帧间预测器221中的参考图片。当通过编码装置应用帧间预测时,可以避免编码装置200与解码装置之间的预测失配,并且可以提高编码效率。
存储器270的DPB可以存储修正的重构图片,以用作帧间预测器221中的参考图片。存储器270可以存储从其导出(或编码)当前图片中的运动信息的块的运动信息和/或已经重构的图片中的块的运动信息。所存储的运动信息可以被传送到帧间预测器221,以被用作空间邻近块的运动信息或时间邻近块的运动信息。存储器270可以存储当前图片中的重构块的重构样本,并可以将重构样本传送到帧内预测器222。
图3是示意性说明了可以应用本文档的公开内容的视频/图像解码装置的配置的示图。
参照图3,解码装置300可包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350和存储器360。预测器330可包括帧间预测器331和帧内预测器332。残差处理器320可包括解量化器321和逆变换器321。根据实施例,熵解码310、残差处理器320、预测器330、加法器340和滤波器350可由硬件部件(例如,解码器芯片组或处理器)配置。另外,存储器360可包括解码图片缓冲器(DPB)或者可由数字存储介质配置。硬件部件还可包括存储器360作为内部/外部部件。
当输入包括视频/图像信息的比特流时,解码装置300可重构与在图2的编码装置中处理视频/图像信息的处理对应的图像。例如,解码装置300可基于从比特流获得的块分割相关信息来导出单元/块。解码装置300可使用编码装置中应用的处理器来执行解码。因此,例如,解码的处理器可以是编译单元,并且编译单元可根据四叉树结构、二叉树结构和/或三叉树结构从编译树单元或最大编译单元分割。可从编译单元导出一个或更多个变换单元。通过解码装置300解码和输出的重构图像信号可通过再现装置再现。
解码装置300可以以比特流的形式接收从图2的编码装置输出的信号,并且可以通过熵解码器310对接收到的信号进行解码。例如,熵解码器310可以对比特流进行解析,以导出图像重构(或图片重构)所必需的信息(例如,视频/图像信息)。视频/图像信息还可以包括与诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)这样的各种参数集有关的信息。另外,视频/图像信息还可以包括常规约束信息。解码装置还可以基于关于参数集的信息和/或常规约束信息对图片进行解码。随后在本文档中描述的用信号通知/接收的信息和/或语法元素可以通过解码过程被解码并从比特流中获得。例如,熵解码器310可以基于诸如指数哥伦布编译、CABAC或CAVLC这样的编译方法对比特流中的信息进行解码,并且输出图像重构所需的语法元素和针对残差的变换系数的量化值。更具体地,CABAC熵解码方法可以接收与比特流中的每个语法元素对应的bin(二进制位),通过使用在前一级中解码的符号/bin的信息、解码目标块的解码信息或解码目标语法元素信息来确定上下文模型,通过根据所确定的上下文模型预测bin的出现概率来对bin执行算术解码,并生成与每个语法元素的值对应的符号。在这种情况下,CABAC熵解码方法可以通过在确定上下文模型之后,使用针对下一个符号/bin的上下文模型解码的符号/bin的信息来更新上下文模型。由熵解码器310解码的信息当中的与预测相关的信息可以被提供到预测器330,并且与已在熵解码器310中执行熵解码的残差有关的信息(即,量化的变换系数和相关的参数信息)可以被输入到解量化器321。另外,由熵解码器310解码的信息当中的关于滤波的信息可以被提供到滤波器350。此外,用于接收从编码装置输出的信号的接收器(未图示)可以另外被配置为解码装置300的内部/外部元件,或者接收器可以是熵解码器310的构成元件。此外,根据本文档的解码装置可以被称为视频/图像/图片解码装置,并且解码装置可以被分为信息解码器(视频/图像/图片信息解码器)和样本解码器(视频/图像/图片样本解码器)。信息解码器可以包括熵解码器310,并且样本解码器可以包括解量化器321、逆变换器322、预测器330、加法器340、滤波器350和存储器360中的至少一个。
解量化器321可将量化的变换系数解量化并输出变换系数。解量化器321可按二维块形式重排量化的变换系数。在这种情况下,可基于在编码装置中执行的系数扫描顺序来执行重排。解量化器321可使用量化参数(例如,量化步长信息)对量化的变换系数执行解量化并且获得变换系数。
逆变换器322对变换系数逆变换以获得残差信号(残差块、残差样本数组)。
预测器330可对当前块执行预测并生成包括当前块的预测样本的预测块。预测器可基于从熵解码器310输出的关于预测的信息来确定对当前块应用帧内预测还是帧间预测并且可确定特定帧内/帧间预测模式。
预测器可以基于下述的各种预测方法来生成预测信号。例如,预测器不仅可以应用帧内预测或帧间预测来预测一个块,而且还可以同时应用帧内预测和帧间预测。这可以被称为组合的帧间和帧内预测(CIIP)。另外,预测器可以执行用于块的预测的帧内块复制(IBC)。帧内块复制可以用于游戏等的内容图像/运动图像编译,例如,屏幕内容编译(SCC)。IBC基本上在当前图片中执行预测,但可以因为在当前图片中导出参考块而与帧间预测类似地执行。即,IBC可以使用本文档中描述的帧间预测技术中的至少一种。
帧内预测器332可以通过参考当前图片中的样本来预测当前块。根据预测模式,所参考的样本可以位于当前块的邻居中,或者其位置可以与当前块分开。在帧内预测中,预测模式可以包括多种非定向模式和多种定向模式。帧内预测器332可以通过使用应用于邻近块的预测模式来确定将应用于当前块的预测模式。
帧内预测器331可以基于参考图片上的运动矢量所指定的参考块(参考样本数组)来导出当前块的预测块。在这种情况下,为了减少在帧间预测模式下发送的运动信息的量,可以基于邻近块与当前块之间的运动信息相关性以块、子块或样本为单位来预测运动信息。运动信息可以包括运动矢量和参考图片索引。运动信息还可以包括关于帧间预测方向(L0预测、L1预测、Bi预测等)的信息。在帧间预测的情况下,邻近块可以包括当前图片中存在的空间邻近块和参考图片中存在的时间邻近块。例如,帧间预测器331可以基于邻近块来构造运动信息候选列表,并基于接收到的候选选择信息来导出当前块的运动矢量和/或参考图片索引。可以基于各种预测模式来执行帧间预测,并且关于预测的信息可以包括指示针对当前块的帧间预测的模式的信息。
加法器340可以通过将所获得的残差信号与从预测器330输出的预测信号(预测块或预测样本数组)相加来生成重构信号(重构图片、重构块或重构样本数组)。如果不存在处理目标块的残差(诸如,应用跳变模式的情况),则预测块可以用作重构块。
加法器340可以被称为重构器或重构块生成器。所生成的重构信号可以用于在当前图片中将处理的下一个块的帧内预测,并且如随后描述的,还可以通过滤波来输出或者还可以用于下一个图片的帧间预测。
此外,具有色度缩放的亮度映射(LMCS)还可以被应用于图片解码处理。
滤波器350可以通过向重构信号应用滤波来改善主观/客观图像质量。例如,滤波器350可以通过向重构图片应用各种滤波方法来生成修正的重构图片,并将修正的重构图片存储在存储器360中,具体地,存储在存储器360的DPB中。各种滤波方法可以包括例如解块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。
存储在存储器360的DPB中的(修正的)重构图片可以被用作帧间预测器331中的参考图片。存储器360可以存储从其导出(或解码出)当前图片中的运动信息的块的运动信息和/或已经重构的图片中的块的运动信息。所存储的运动信息可以被传送到帧间预测器331,以便被用作空间邻近块的运动信息或时间邻近块的运动信息。存储器360可以存储当前图片中的重构块的重构样本,并将重构样本传送到帧内预测器332。
在本说明书中,解码装置300的预测器330、解量化器321、逆变换器322和滤波器350中描述的实施例也可以以与编码装置200的预测器220、解量化器234、逆变换器235和滤波器260相同的方式或与其对应地应用。
此外,如上所述,在执行视频编译时,执行预测以增强压缩效率。可通过预测生成包括作为要被编译的块的当前块(即,目标编译块)的预测样本的预测块。在这种情况下,预测块包括空间域(或像素域)中的预测样本。预测块在编码装置和解码装置中相同地导出。编码装置可通过用信号向解码装置通知关于原始块(而非原始块的原始样本值本身)与预测块之间的残差的信息(残差信息)来增强图像编译效率。解码装置可基于残差信息来导出包括残差样本的残差块,可通过将残差块和预测块相加来生成包括重构样本的重构块,并且可生成包括重构块的重构图片。
残差信息可通过变换过程和量化过程来生成。例如,编码装置可导出原始块与预测块之间的残差块,可通过对包括在残差块中的残差样本(残差样本数组)执行变换过程来导出变换系数,可通过对变换系数执行量化过程来导出量化的变换系数,并且可将相关残差信息(通过比特流)用信号通知给解码装置。在这种情况下,残差信息可包括量化的变换系数、位置信息、变换方案、变换核和量化参数等的值信息。解码装置可基于残差信息来执行解量化/逆变换过程并且可导出残差样本(或残差块)。解码装置可基于预测块和残差块来生成重构图片。此外,为了后续图片的帧间预测参考,编码装置可通过对量化的变换系数进行解量化/逆变换来导出残差块,并且可基于此来生成重构图片。
例如,帧内预测模式可以包括两个非定向或非角度帧内预测模式和65个定向或角度帧内预测模式。非定向帧内预测模式可以包括0号平面帧内预测模式和1号DC帧内预测模式,并且定向帧内预测模式可以包括65个(2号至66号)帧内预测模式。然而,这是示例性的,并且根据本文档的实施例甚至可以应用于提供不同数量的帧内预测模式的情况。此外,在某些情况下,还可以使用67号帧内预测模式,并且67号帧内预测模式可以表示线性模型(LM)模式。
图4示例性地图示了65个预测方向上的帧内定向模式。
参考图4,在具有左上对角预测方向的34号帧内预测模式周围,可以将模式划分为具有水平方向性的帧内预测模式和具有垂直方向性的帧内预测模式。在图4中,H和V可以分别是指水平方向性和垂直方向性,并且数字-32至32可以表示样本网格位置上以1/32为单位的位移。这可以表示模式索引值的偏移。
例如,2号至33号帧内预测模式可以具有水平方向性,并且34号至66号帧内预测模式具有垂直方向性。此外,从技术上讲,34号帧内预测模式可以被认为既没有水平方向性也没有垂直方向性,但从确定二次变换的变换集的观点来看,可以被归类为属于水平方向性。这是因为针对围绕34号帧内预测模式对称的垂直方向模式,对输入数据进行转置和使用,并且针对34号帧内预测模式使用水平方向模式的输入数据排列方法。这里,输入数据的转置可以意指对于二维块数据M N,按照行变成列而列变成行的方式构造成N M数据。
另外,18号帧内预测模式和50号帧内预测模式可以分别表示水平帧内预测模式和垂直帧内预测模式,并且2号帧内预测模式可以被称为右上对角帧内预测模式,因为以左参考像素沿右上方向进行预测。在相同的上下文中,34号帧内预测模式可以被称为右下对角帧内预测模式,并且66号帧内预测模式可以被称为左下对角帧内预测模式。
图5示例性地图示了用于对语法元素进行编码的上下文自适应二进制算术编译(CABAC)。
例如,在CABAC编译处理中,如果输入信号是并非二进制值的语法元素,则可以通过二值化将输入信号的值变换为二进制值。另外,如果输入信号已经是二进制值(即,如果输入信号的值是二进制值),则可以不执行二值化,而可以按原样使用输入信号。这里,构成二进制值的每个bin0或1可以被称为bin。例如,如果二值化的二进制串为110,则1、1和0中的每一个可以被表示为一个bin。一个语法元素的bin可以表示语法元素的值。二值化可以是基于诸如截断莱斯二值化处理或固定长度二值化处理这样的各种二值化方法的,并且用于目标语法元素的二值化方法可以是预定义的。二值化过程可以由熵编码器中的二值化器执行。
此后,语法元素的二值化的bin可以被输入到常规编译引擎或旁路编译引擎。编码装置的常规编译引擎可以分配反映关于相应bin的概率值的上下文模型,并基于所分配的上下文模型对相应bin进行编码。编码装置的常规编译引擎可以在对相应bin执行编译之后更新相应bin的上下文模型。被编译为上述内容的bin可以被表示为上下文编译的bin。
此外,在语法元素的二值化的bin被输入到旁路编译引擎的情况下,它们可以被如下编译。例如,编码装置的旁路编译引擎可以省略估计关于输入bin的概率的过程以及更新应用于编译的bin的概率模型的过程。在应用旁路编译的情况下,编码装置可以通过应用规则(regular)概率分布而非分配上下文模型来对输入bin进行编译,并且通过这样,可以提高编译速度。被编译为上述内容的bin可以被表示为旁路bin。
熵解码可以表示以倒序执行与上述熵编码相同的处理的处理。
解码装置(熵解码器)可以对编码的图像/视频信息进行解码。图像/视频信息可以包括分割相关信息、预测相关信息(例如,帧间/帧内预测划分信息、帧内预测模式信息、帧间预测模式信息等)、残差信息、或环内滤波相关信息,或者可以包括关于其的各种语法元素。熵编译可以以语法元素为单位执行。
解码装置可以执行目标语法元素的二值化。这里,二值化可以是基于诸如截断莱斯二值化处理或固定长度二值化处理这样的各种二值化方法的,并且用于目标语法元素的二值化方法可以是预定义的。解码装置可以通过二值化过程导出目标语法元素的可用值的可用bin串(bin串候选)。二值化过程可以由熵解码器中的二值化器执行。
解码装置可以在从比特流中的输入比特依次解码或解析目标语法元素的相应bin的同时将导出的bin串与相应语法元素的可用bin串进行比较。如果导出的bin串等于可用bin串中的一个,则与相应bin串对应的值被导出为相应语法元素的值。如若不然,解码装置可以在进一步解析比特流中的下一比特之后重新执行上述过程。通过这样的处理,即使在不使用相应信息的起始比特或结束比特的情况下,也可以使用可变长度比特来执行比特流中的特定信息(或特定语法元素)的用信号通知。通过这样,可以对较小的值分配相对较少的比特,因此整体编译效率可以增强。
解码装置可以基于诸如CABAC或CAVLC这样的熵编译技术执行来自比特流的bin串中的相应bin的基于上下文模型或基于旁路的解码。
在基于上下文模型对语法元素进行解码的情况下,解码装置可以通过比特流接收与语法元素对应的bin,可以使用解码目标块或邻近块的解码信息和语法元素或在前一级中解码的符号/bin信息来确定上下文模型,并可以通过根据所确定的上下文模型预测接收到的bin的出现概率执行bin的算术解码来导出语法元素值。此后,可以基于所确定的上下文模型来更新下一个被解码的bin的上下文模型。
可以通过上下文编译(常规编译)的bin来分配和更新上下文模型,并且可以基于上下文索引(ctxIdx)或上下文索引增量(ctxInc)来指示上下文模型。可以基于ctxInc来导出ctxIdx。具体地,例如,可以通过ctxInc与上下文索引偏移量(ctxIdxOffset)之和来导出表示每个常规编译的bin的上下文模型的ctxIdx。例如,可以通过bin不同地导出ctxInc。ctxIdxOffset可以被表示为ctxIdx的最低值。通常,ctxIdxOffset可以是用于与其他语法元素的上下文模型进行区分的值,并且一个语法元素的上下文模型可以基于ctxInc来划分或导出。
在熵编码过程中,可以确定是通过常规编译引擎执行编码还是通过旁路编译引擎执行编码,并且因此,可以切换编译路径。熵解码可以以倒序执行与熵编码相同的处理。
此外,例如,在语法元素被旁路解码的情况下,解码装置可以通过比特流接收与语法元素对应的bin,并可以通过应用规则概率分布对输入的bin进行解码。在这种情况下,解码装置可以省略导出语法元素的上下文模型的过程以及在解码之后更新应用于bin的上下文模型的过程。
图6和图7示意性图示了根据本文档的多变换技术。
在图6和图7中,变换器可以对应于如上所述的图2的编码装置中的变换器,并且逆变换器可以对应于如上所述的图2的编码装置中的逆变换器或图3的解码装置中的逆变换器。
变换器可以通过基于残差块中的残差样本(残差样本阵列)执行初级变换来导出(初级)变换系数(S610)。这样的初级变换可以被称为核心变换。在此,初级变换可以基于多变换选择(MTS),并且在将多变换应用为初级变换的情况下,可以被称为多核心变换。
例如,多核心变换可以通过另外使用离散余弦变换(DCT)类型2(DCT-II)、离散正弦变换(DST)类型7(DST-VII)、DCT类型8(DCT-VIII)和/或DST类型1(DST-I)来表示变换方法。即,多核心变换可以表示用于基于从DCT类型2、DST类型7、DCT类型8和DST类型1当中选择的多个变换核来将空间域的残差信号(或残差块)变换成频域的变换系数(或初级变换系数)的变换方法。这里,初级变换系数可以被称为变换器侧的临时变换系数。
换句话说,在应用现有变换方法的情况下,可以基于DCT类型2来应用残差信号(或残差块)的空间域到频域的变换,并且可以生成变换系数。然而,与此不同,在应用多核心变换的情况下,可以基于DCT类型2、DST类型7、DCT类型8和/或DST类型1来应用残差信号(或残差块)的空间域到频域的变换,并且可以生成变换系数(或初级变换系数)。这里,DCT类型2、DST类型7、DCT类型8和DST类型1可以被称为变换类型、变换核或变换核心。可以基于基函数来定义DCT/DST变换类型。
在执行多核心变换的情况下,可以从变换核当中选择针对目标块的垂直变换核和/或水平变换核,并且可以基于垂直变换核执行针对目标块的垂直变换,并且可以基于水平变换核执行针对目标块的水平变换。这里,水平变换可以表示针对目标块的水平分量的变换,并且垂直变换可以表示针对目标块的垂直分量的变换。可以基于包括残差块的目标块(CU或子块)的预测模式和/或变换索引来自适应地确定垂直变换核/水平变换核。
另外,例如,在通过应用MTS执行初级变换的情况下,特定基函数可以被配置为指定值,并且在垂直变换或水平变换的情况下,可以通过组合应用的基函数来配置变换核的映射关系。例如,在水平方向变换核由trTypeHor表示且垂直方向变换核由trTypeVer表示的情况下,值为0的trTypeHor或trTypeVer可以被配置为DCT2,并且值为1的trTypeHor或trTypeVer可以被配置为DCT7。值为2的trTypeHor或trTypeVer可以被配置为DCT8。
可替代地,例如,为了指示多个变换核集中的任何一个,可以对MTS索引进行编码,并且可以将MTS索引信息发信号通知给解码装置。在此,MTS索引可以被表示为tu_mts_idx语法元素或mts_idx语法元素。例如,如果MTS索引为0,则可以表示TrTypeHor和TrTypeVer值都为0,并且(trTypeHor,trTypeVer)=(DCT2,DCT2)。如果MTS索引为1,则可以表示TrTypeHor和TrTypeVer值都为1,并且(trTypeHor,trTypeVer)=(DST7,DST7)。如果MTS索引为2,则可以表示TrTypeHor值为2,而TrTypeVer值为1,并且(trTypeHor,trTypeVer)=(DCT8,DST7)。如果MTS索引为3,则可以表示TrTypeHor值为1,而TrTypeVer值为2,并且(trTypeHor,trTypeVer)=(DST7,DCT8)。如果MTS索引为4,则可以表示TrTypeHor和TrTypeVer值都为2,并且(trTypeHor,trTypeVer)=(DCT8,DCT8)。例如,根据MTS索引的变换核集可以如下表所示。
[表1]
MTS索引 0 1 2 3 4
trTypeHor 0 1 2 1 2
trTypeVer 0 1 1 2 2
变换器可以通过基于(初级)变换系数,执行二次变换来导出修正的(二次)变换系数(S620)。初级变换可以是空间域到频域的变换,而二次变换可以通过使用存在于(初级)变换系数之间的相关性来将变换表示为更压缩的表现形式。
例如,二次变换可以包括不可分变换。在这种情况下,二次变换可以被称为不可分二次变换(NSST)或依赖于模式的不可分二次变换(MDNSST)。不可分二次变换可以表示通过基于不可分变换矩阵对通过初级变换导出的(初级)变换系数进行二次变换来生成针对残差信号的修正的变换系数(或二次变换系数)的变换。这里,垂直变换和水平变换不能基于不可分变换矩阵来对(初级)变换系数分开(或独立地)应用,但可以一次性全部应用。
换句话说,不可分二次变换可以表示以下的变换方法:在不将(初级)变换系数分离为垂直分量和水平分量的情况下通过专门确定的方向(例如,行优先方向或列优先方向)将例如二维信号(变换系数)重新排列为一维信号,然后基于不可分变换矩阵来生成修正的变换系数(或二次变换系数)。
例如,行优先方向(或顺序)可以表示按第一行至第N行的顺序将M×N块排成一行,并且列优先方向(或顺序)可以表示按第一列至第M列的顺序将M×N块排成一行。这里,M和N可以表示块的宽度(W)和高度(H),并且可以全部是正整数。
例如,可以向由(初级)变换系数构成的块(下文中,变换系数块)的左上区域应用不可分二次变换。例如,如果变换系数块的宽度(W)和高度(H)都等于或大于8,则可以向变换系数块的左上8×8区域应用8×8不可分二次变换。另外,如果变换系数块的宽度(W)和高度(H)都等于或大于4并且小于8,则可以向变换系数块的左上min(8,W)×min(8,H)区域应用4×4不可分二次变换。然而,实施例不限于此,并且例如,即使满足了变换系数块的宽度(W)和高度(H)都等于或大于4的条件,也可以向变换系数块的左上min(8,W)×min(8,H)区域应用4×4不可分二次变换。
具体地,例如,在使用4×4输入块的情况下,可以如下执行不可分二次变换。
4×4输入块X可以如下地表示。
[式1]
Figure BDA0003477590240000251
例如,X的矢量形式可以如下地表示。
[式2]
Figure BDA0003477590240000257
参照式2,
Figure BDA0003477590240000252
可以表示矢量X,并且式1中的X的二维块可以按照行优先顺序重新排列并表示为一维矢量。
在这种情况下,可以如下地计算二次不可分变换。
[式3]
Figure BDA0003477590240000253
这里,
Figure BDA0003477590240000254
可以表示变换系数矢量,并且T可以表示16×16(不可分)变换矩阵。
基于式3,可以导出大小为16×1的
Figure BDA0003477590240000255
并且可以通过扫描顺序(水平、垂直或对角)将
Figure BDA0003477590240000256
重新组织为4×4块。然而,上述计算是示例性的,并且为了降低不可分二次变换的计算复杂度,可以使用超立方-吉文斯变换(hypercube-givens transform,HyGT)等来计算不可分二次变换。
此外,在不可分二次变换中,可以按依赖于模式的方式选择变换核(或变换核心或变换类型)。这里,模式可以包括帧内预测模式和/或帧间预测模式。
例如,如上所述,可以基于以变换系数块的宽度(W)和高度(H)为基础确定的8×8变换或4×4变换来执行不可分二次变换。例如,如果W和H都等于或大于8,则8×8变换可以表示可以应用于相应变换系数块内部包括的8×8区域的变换,并且8×8区域可以是相应变换系数块内部的左上8×8区域。另外,类似地,如果W和H都等于或大于4,则4×4变换可以表示可以应用于相应变换系数块内部包括的4×4区域的变换,并且4×4区域可以是相应变换系数块内部的左上4×4区域。例如,8×8变换核矩阵可以为64×64/16×64矩阵,并且4×4变换核矩阵可以为16×16/8×16矩阵。
在这种情况下,对于基于模式的变换核选择,可以针对所有8×8变换和4×4变换来配置用于不可分二次变换的每个变换集的两个不可分二次变换核,并且可以提供四个变换集。即,可以针对8×8变换配置四个变换集,并且可以针对4×4变换配置四个变换集。在这种情况下,用于8×8变换的四个变换集中的每一个可以包括两个8×8变换核,并且用于4×4变换的四个变换集中的每一个可以包括两个4×4变换核。
然而,变换的大小、集的数量以及集中变换核的数量是示例性的,并且可以使用除了8×8或4×4之外的大小,或者可以配置n个集,或者在每个集中可以包括k个变换核。这里,n和k可以是正整数。
例如,变换集可以被称为NSST集,并且NSST集中的变换核可以被称为NSST核。例如,可以基于目标块(CU或子块)的帧内预测模式来执行在变换集当中特定集的选择。
此外,如果确定特定集被用于不可分变换,则可以通过不可分二次变换索引来选择特定集中的k个变换核中的一个。例如,编码装置可以基于率失真(RD)检查来导出表示特定变换核的不可分二次变换索引,并可以将该不可分二次变换索引用信号通知给解码装置。例如,解码装置可以基于不可分二次变换索引在特定集中选择k个变换核中的一个。例如,值为0的NSST索引可以表示第一不可分二次变换核,值为1的NSST索引可以表示第二不可分二次变换核,并且值为2的NSST索引可以表示第三不可分二次变换核。另选地,值为0的NSST索引可以表示不对目标块应用第一不可分二次变换,并且值为1至3的NSST索引可以指示如上的三个变换核。
变换器可以基于所选择的变换核来执行不可分二次变换,并可以获得修正的(二次)变换系数。修正的变换系数可以被导出为通过上述量化器量化的量化的变换系数,并且可以被编码以用信号通知给解码装置并可以传送到编码装置中的解量化器/逆变换器。
此外,如果如上所述省略了二次变换,则作为初级(可分)变换的输出的(初级)变换系数可以通过如上所述的量化器被导出为量化的变换系数,并可以被编码以用信号通知给解码装置并可以被传送到编码装置中的解量化器/逆变换器。
参考图7,逆变换器可以以与通过上述变换器执行的过程相反的顺序执行一系列过程。逆变换器可以接收(解量化的)变换系数,通过执行二次(逆)变换来导出(初级)变换系数(S750),并通过相对于(初级)变换系数执行初级(逆)变换来获得残差块(残差样本)(S760)。在此,在逆变换器侧,初级变换系数可以被称为修正的变换系数。如上所述,编码装置和/或解码装置可以基于残差块和预测块来生成重构块,并且可以基于此来生成重构图片。
此外,解码装置还可以包括二次逆变换应用/不应用确定器(或用于确定是否应用二次逆变换的元件)和二次逆变换确定器(或用于确定二次逆变换的元件)。例如,二次逆变换应用/不应用确定器可以确定是否应用二次逆变换。例如,二次逆变换可以是NSST或RST,并且二次逆变换应用/不应用确定器可以基于从比特流中解析或获得的二次变换标志来确定是否应用二次逆变换。另选地,例如,二次逆变换应用/不应用确定器可以基于残差块的变换系数来确定是否应用二次逆变换。
二次逆变换确定器可以确定二次逆变换。在这种情况下,二次逆变换确定器可以基于按照帧内预测模式指定的NSST(或RST)变换集来确定应用于当前块的二次逆变换。另选地,可以取决于初级变换确定方法来确定二次变换确定方法。另选地,可以按照帧内预测模式来确定初级变换和二次变换的各种组合。例如,二次逆变换确定器可以基于当前块的大小来确定应用二次逆变换的区域。
此外,如果如上所述省略了二次(逆)变换,则可以通过接收(解量化的)变换系数并执行初级(可分)逆变换来获得残差块(残差样本)。如上所述,编码装置和/或解码装置可以基于残差块和预测块来生成重构块,并可以基于此来生成重构图片。
此外,在本文档中,为了减少不可分二次变换伴随的计算量和存储器需要量,具有减小的变换矩阵(核)大小的缩减二次变换(RST)可以应用于NSST的概念。
在本文档中,RST可以意指基于大小按照简化因子减小的变换矩阵来对目标块的残差样本执行的(简化)变换。在执行此的情况下,由于变换矩阵的大小减小,因此变换期间所需的计算量可以减少。即,RST可以用于解决大小大的块的变换或不可分变换期间出现的计算复杂度问题。
例如,RST可以被称为诸如缩减变换、缩减二次变换、减小变换、简化变换或简单变换这样的各种术语,并且指代RST的名称不限于所列举的示例。另外,RST主要在初级变换块中包括非0系数的低频域中执行,因此可以被称为低频不可分变换(LFNST)。
此外,在基于RST执行二次逆变换的情况下,编码装置200的逆变换器235和解码装置300的逆变换器322可以包括基于针对变换系数的逆RST导出修正的变换系数的逆RST单元以及基于针对修正的变换系数的逆初级变换导出目标块的残差样本的逆初级变换器。逆初级变换意指已应用于残差的初级变换的逆变换。在本文档中,基于变换来导出变换系数可以意指通过应用对应的变换来导出变换系数。
图8和图9是说明根据本文档的实施例的RST的图。
例如,图8可以是说明应用正缩减变换的图,以及图9可以是说明应用逆缩减变换的图。在本文档中,目标块可以表示被执行编译的当前块、残差块或变换块。
例如,在RST中,N维矢量可以被映射到位于另一空间中的R维矢量上,并且可以确定缩减的变换矩阵。这里,N和R可以是正整数,并且R可以小于N。N可以意指被应用变换的块的一边的长度的平方或与被应用变换的块对应的变换系数的总数,并且简化因子可以意指R/N值。简化因子可以被称为诸如缩减因子、减小因子、化简因子或简单因子这样的各种术语。此外,R可以被称为缩减系数,并且在某些情况下,简化因子可以意指R。另外,在某些情况下,简化因子可以意指N/R值。
例如,可以通过比特流来用信号通知简化因子或缩减系数,但不限于此。例如,简化因子或缩减系数的预定义值可以被存储在编码装置200和解码装置300中,并且在这种情况下,可以不单独用信号通知简化因子或缩减系数。
例如,简化变换矩阵的大小(R×N)可以小于常规变换矩阵的大小((N×N),并可以如下式中地定义。
[式4]
Figure BDA0003477590240000301
例如,图8图示的缩减变换块中的矩阵T可以表示式4的矩阵TR×N。如图8所示,在目标块的残差样本乘以简化变换矩阵TR×N的情况下,可以导出目标块的变换系数。
例如,在应用变换的块的大小为8×8并且R为16(即,R/N=16/64=1/4)的情况下,可以通过如下的式5中的矩阵运算来表示根据图8的RST。在这种情况下,存储器和乘法运算可以按简化因子缩减到约1/4。
在本文档中,矩阵运算可以被理解为通过将矩阵放置在列矢量的左侧并将该矩阵乘以列矢量来获得列矢量的操作。
[式5]
Figure BDA0003477590240000302
在式5中,r1至r64可以表示目标块的残差样本。另选地,例如,它们可以是通过应用初级变换而生成的变换系数。基于式5的运算结果,可以导出目标块的变换系数ci
例如,在R为16的情况下,可以导出目标块的变换系数c1至c16。如果将通过应用常规变换而非RST而具有大小64×64(N×N)的变换矩阵乘以具有大小64×1(N×1)的残差样本,则可以导出目标块的64(N)个变换系数,但由于应用RST,因此可以仅导出目标块的16(R)个变换系数。由于目标块的变换系数的总数从N减少至R,因此可以减少编码装置200向解码装置300发送的数据量,因此可以增加编码装置200与解码装置300之间的发送效率。
考虑到变换矩阵的大小,由于常规变换矩阵的大小为64×64(N×N),并且简化变换矩阵的大小减少至16×64(R×N),因此与执行常规变换的情况相比,执行RST时的存储器使用可以按R/N比率减小。另外,与使用常规变换矩阵时的乘法运算的数量(N×N)相比,简化变换矩阵的使用可以使乘法运算的数量(R×N)按R/N比率减小。
在实施例中,编码装置200的变换器232可以通过执行目标块的残差样本的初级变换和基于RST的二次变换来导出目标块的变换系数。变换系数可以被传送到解码装置300的逆变换器,并且解码装置300的逆变换器322可以基于变换系数的逆缩减二次变换(RST)来导出修正的变换系数,并可以基于修正的变换系数的逆初级变换来导出目标块的残差样本。
根据实施例的逆RST矩阵TN×R的大小可以是比常规逆变换矩阵的大小N×N小的N×R,并可以与式4中例示的简化变换矩阵TR×N呈转置关系。
图9图示的缩减逆变换块中的矩阵Tt可以表示逆RST矩阵TR×N T。在此,上标T可以表示转置。如图9所示,在用于目标块的变换系数乘以逆RST矩阵TR×N T的情况下,可以导出目标块的修正的变换系数或用于目标块的残差样本。逆RST矩阵TR×N T可以被表示为(TR×N)T N×R
更具体地,在逆RST被应用为二次逆变换的情况下,可以通过将目标块的变换系数乘以逆RST矩阵TR×N T来导出目标块的修正的变换系数。此外,逆RST可以被应用为逆初级变换,并且在这种情况下,可以通过将目标块的变换系数乘以逆RST矩阵TR×N T来导出目标块的残差样本。
在实施例中,在应用逆变换的块的大小为8×8并且R为16(即,R/N=16/64=1/4)的情况下,可以通过如下式6中的矩阵运算来表示根据图7的RST。
[式6]
Figure BDA0003477590240000321
在式6中,c1至c16可以表示目标块的变换系数。可以基于式6的运算结果来导出表示目标块的修正的变换系数或目标块的残差样本的rj。即,可以导出表示目标块的修正的变换系数或目标块的残差样本的r1至rN
考虑到逆变换矩阵的大小,由于常规逆变换矩阵的大小为64×64(N×N),并且简化逆变换矩阵的大小减少至64×16(N×R),因此与执行常规逆变换的情况相比,执行逆RST时的存储器使用可以按R/N比率减小。另外,与使用常规逆变换矩阵时的乘法运算的数量(N×N)相比,简化逆变换矩阵的使用可以使乘法运算的数量(N×R)按R/N比率减小。
此外,可以甚至对8×8 RST配置和应用变换集。即,可以按照变换集来应用对应的8×8 RST。由于按照帧内预测模式,一个变换集由两个或三个变换核构成,因此可以配置为选择最多四个变换中的一个,甚至包括不应用二次变换的情况。在不应用二次变换时的变换中,可以认为应用单位矩阵。如果假定为四个变换赋予索引0、1、2或3(例如,0号索引可以被分配给单位矩阵即不应用二次变换的情况),则可以通过用信号通知作为每个变换系数块的NSST索引的语法元素来指定将应用的变换。即,通过NSST索引,可以针对8×8左上块指定8×8 NSST,并且在RST配置中,可以指定8×8 RST。8×8 NSST和8×8 RST可以表示在成为变换目标的目标块的W和H都等于或大于8的情况下能够应用于相应变换系数块内部包括的8×8区域的变换,并且8×8区域可以是相应变换系数块内部的左上8×8区域。类似地,4×4 NSST和4×4 RST可以表示在目标块的W和H都等于或大于4的情况下能够应用于相应变换系数块内部包括的4×4区域的变换,并且4×4区域可以是相应变换系数块内部的左上4×4区域。
此外,例如,编码装置可以通过基于诸如指数哥伦布、上下文自适应可变长度编译(CAVLC)、上下文自适应二进制算术编译(CABAC)等这样的各种编译方法对语法元素的值或残差的变换系数的量化值进行编码来获得比特流。另外,解码装置可以基于诸如指数哥伦布编码、CAVLC、CABAC等这样的各种编译方法来导出语法元素的值或残差的变换系数的量化值。
此外,本文档的实施例可以提出用于发信号通知MTS索引的方案。在此,如上所述,MTS索引可以表示多个变换核集中的任何一个,以及可以对MTS索引进行编码,并且可以将MTS索引信息发信号通知解码装置。解码装置可以通过对MTS索引信息进行解码来获得MTS索引,并且可以基于MTS索引来确定要应用的变换核集。MTS索引可以被表示为tu_mts_idx语法元素或mts_idx语法元素。例如,MTS索引可以使用Rice-Golmb参数0阶进行二值化,但是可以基于截断莱斯(truncated rice)进行二值化。在基于截断莱斯的二值化的情况下,输入参数cMax可以具有值4,并且cRiceParam可以具有值0。例如,编码装置可以通过对MTS索引进行二值化来导出用于MTS索引的bin,通过对导出的bin进行编码来导出MTS索引信息(用于MTS索引的比特),并且将MTS索引信息发信号通知给解码装置。解码装置可以通过解码MTS索引信息来导出用于MTS索引的bin,并且通过将所导出的用于MTS索引的bin与用于MTS索引的候选bin进行比较来导出MTS索引。
例如,MTS索引(例如,tu_mts_idx语法元素或mts_idx语法元素)可以相对于所有bin,基于上下文模型或上下文索引被上下文编译。在这种情况下,可以如在表2中,分配或确定用于MTS索引的上下文编译的上下文索引增量(ctxInc)或根据bin位置的ctxInc。此外,如在表2中,根据bin位置来选择上下文模型。
[表2]
Figure BDA0003477590240000341
参考表2,可以基于cqtDepth来分配用于编号为0的bin(第一bin)的ctxInc。在此,cqtDepth可以表示用于当前块的四叉树深度,并且可以被导出为0到5中的一个值。也就是说,可以根据cqtDepth,为编号为0的bin的ctxInc分配0到5中的一个值。此外,可以为编号为1的bin(第二bin)的ctxInc分配6,可以为编号为2的bin(第三bin)的ctxInc分配7,并且可以为编号为3的bin(第四bin)的ctxInc分配8。也就是说,可以为编号为0的bin到编号为3的bin分配具有不同值的ctxInc。在此,不同的ctxInc值可以表示不同的上下文模型,并且在这种情况下,可以提供用于MTS索引编译的9个上下文模型。
此外,例如,如在表3中,相对于所有bin,MTS索引(例如,tu_mts_idx语法元素或mts_idx语法元素)可以被旁路编译。在这种情况下,可以提供用于MTS索引编译的上下文模型。
[表3]
Figure BDA0003477590240000342
此外,例如,如在表4中,MTS索引(例如,tu_mts_idx语法元素或mts_idx语法元素)可以相对于编号为0的bin(第一bin),基于上下文模型或上下文索引被上下文编译,并且可以相对于剩余bin被旁路编译。也就是说,可以为用于编号为0的bin(第一bin)的ctxInc分配0。在这种情况下,可以提供用于MTS索引编译的一个上下文模型。
[表4]
Figure BDA0003477590240000351
此外,例如,如在表5中,MTS索引(例如,tu_mts_idx语法元素或mts_idx语法元素)可以相对于编号为0的bin(第一bin)和编号为1的bin(第二bin),基于上下文模型或上下文索引被上下文编译,并且可以相对于剩余bin被旁路编译。也就是说,可以为编号为0的bin(第一bin)的ctxInc分配0,以及可以为编号为1的bin(第二bin)的ctxInc分配1。在这种情况下,可以提供用于MTS索引编译的2个上下文模型。
[表5]
Figure BDA0003477590240000352
此外,例如,如在表6中,MTS索引(例如,tu_mts_idx语法元素或mts_idx语法元素)可以相对于所有bin,基于上下文模型或上下文索引被上下文编译,并且可以相对于每一bin分配一个ctxInc。也就是说,可以为编号为0的bin(第一bin)的ctxInc可以分配0,以及可以为编号为1的bin(第二bin)的ctxInc分配1。为编号为2的bin(第三bin)的ctxInc分配2,以及为编号为3的bin(第四bin)的ctxInc分配2。在这种情况下,可以提供用于MTS索引编译的4个上下文模型。
[表6]
Figure BDA0003477590240000361
如上所述,根据实施例,由于通过将旁路编译应用于MTS索引的所有或一些bin或将特定值应用于ctxInc(尽管应用了上下文编译)来减少上下文模型的数量,因此可以降低复杂度,并且可以增加解码器的输出量。此外,在实施例中,在如上所述使用上下文模型的情况下,初始值和/或多窗口大小可以基于每个bin的位置的出现统计而可变。
图10和图11示意性地示出了根据本文档的实施例的视频/图像编码方法和相关组件的示例。
图10中公开的方法可以由图2或图11中公开的编码装置执行。具体地,例如,图10的S1000至S1010可以由图11的编码装置的残差处理器230执行,以及图10的S1020可以由图11的编码装置的熵编码器240执行。此外,尽管在图10中未示出,但是可以由图11的编码装置的预测器220导出预测样本或预测相关信息,可以由编码装置的残差处理器230,从原始样本或预测样本导出残差信息,并且可以由编码装置的熵编码器240从残差信息或预测相关信息生成比特流。图9中公开的方法可以包括在本文档中,如上所述的实施例。
参考图10,编码装置导出当前块的残差样本(S1000)。例如,编码装置可以基于预测样本和原始样本导出残差样本。尽管在图10中未示出,为了生成当前块的预测样本,编码装置可以考虑到速率失真(RD)成本相对于当前块执行帧内预测或帧间预测,并且可以生成包括预测模式/类型信息的预测相关信息。
编码装置基于残差样本生成当前块的残差信息(S1010)。例如,编码装置可以基于残差样本导出当前块的变换系数,并且可以基于变换系数生成残差信息。例如,编码装置可以通过相对于残差样本执行变换来导出变换系数。在此,可以基于变换核或变换核集执行变换。例如,变换核集可以包括水平方向变换核及垂直方向变换核。例如,编码装置可以通过相对于残差样本执行初级变换来导出变换系数。此外,例如,编码装置可以通过相对于残差样本执行初级变换来导出临时变换系数,并且可以通过相对于临时变换系数执行二次变换来导出变换系数。例如,基于变换核集执行的变换可以被表示为初级变换。
例如,残差信息可以包括MTS索引和/或关于变换系数的信息。编码装置可以基于变换系数生成MTS索引和/或关于变换系数的信息。
MTS索引可以表示在变换核集候选当中应用于当前块的(变换系数)的变换核集。在此,MTS索引可以被表示为tu_mts_idx语法元素或mts_idx语法元素。如上所述,变换核集可以包括水平方向变换核和垂直方向变换核,并且水平方向变换核可以被表示为trTypeHor,以及垂直方向变换核可以被表示为trTypeVer。
例如,trTypeHor和trTypeVer值可以由应用于当前块的(变换系数)的水平方向变换核和垂直方向变换核表示,并且MTS索引可以由trTypeHor和trTypeVer值表示为包括0至4的候选之一。
例如,如果MTS索引为0,则可以表示trTypeHor和trTypeVer都为0。此外,如果MTS索引为1,则可以表示trTypeHor和trTypeVer均为1。此外,如果MTS索引为2,则可以表示trTypeHor为2并且trTypeVer为1。如果MTS索引为3,则可以表示trTypeHor为1并且trTypeVer为1。此外,如果MTS索引为4,则可以表示trTypeHor和trTypeVer都为2。例如,如果trTypeHor或trTypeVer值为0,则可以表示在水平方向或垂直方向上将DCT2应用于当前块的(变换系数),如果为1,则可以表示应用DST7,而如果为2,则可以表示应用DCT8。即,可以基于MTS索引,将要在水平方向上应用的变换核以及要在垂直方向上应用的变换核中的每一个表示为包括DCT2、DST7及DCT8的候选中的一个。
可以基于MTS索引的bin串的bin来表示MTS索引。换句话说,MTS索引可以被二值化并表示为MTS索引的bin串的(bin),并且MTS索引的bin串的(bin)可以被熵编码。
换句话说,可以基于上下文编译来表示MTS索引的bin串的bin中的至少一个。在此,可以基于上下文索引增量(ctxInc)的值来执行上下文编译。此外,可以基于上下文索引(ctxIdx)或上下文模型来执行上下文编译。在此,可以基于上下文索引增量的值来表示上下文索引。此外,可以基于上下文索引增量的值以及上下文索引偏移(ctxIdxOffset)来表示上下文索引。
例如,可以基于上下文编译来表示MTS索引的bin串的所有bin。例如,可以基于cqtDepth来表示用于MTS索引的bin串的bin当中的第一bin或第0个bin(bin 0)的ctxInc。在此,cqtDepth可以表示用于当前块的四叉树深度,并且可以表示为0到5当中的一个值。此外,用于第二bin或编号为1的bin(bin 1)的ctxInc可以被表示为6,用于第三bin或编号为2的bin(bin 2)的ctxInc可以被表示为7,以及用于第四bin或编号为3的bin(bin 3)的ctxInc可以被表示为8。此外,例如,用于MTS索引的bin串的bin当中的第一bin或第0个bin(bin 0)的ctxInc可以被表示为0,用于第二bin或编号为1的bin(bin1)的ctxInc可以被表示为1,用于第三bin或编号为2的bin(bin 2)的ctxInc可以被表示为2,以及用于第四bin或编号为3的bin(bin 3)的ctxInc可以被表示为3。即,可用于bin串的bin当中的第一bin的上下文编译的上下文索引增量值的数量可以为1。可替代地,MTS索引的bin串可以包括最多四个bin,并且在四个bin当中,分配给通过上下文编译导出的bin的上下文索引增量值的数量可为1。
此外,例如,MTS索引的bin串的一些bin可以基于上下文编译来表示,并且剩余的bin可以基于旁路编译来表示。例如,用于MTS索引的bin串的bin当中的第一bin或编号为0的bin(bin 0)的ctxInc可以被表示为0,而剩余bin可以基于旁路编译来表示。此外,例如,用于MTS索引的bin串的bin当中的第一bin或编号为0的bin(bin 0)的ctxInc可以被表示为0,用于第二bin或编号为1的bin(bin 1)的ctxInc可以被表示为1,并且剩余bin可以基于旁路编译来表示。即,能够用于bin串的bin当中的第一bin的上下文编译的上下文索引增量值的数量可以为1。
此外,可以基于旁路编译来表示MTS索引的bin串的所有bin。在此,旁路编译可以表示基于均匀概率分布执行上下文编译,并且由于省略了上下文编译的更新过程,因此可以提高编译效率。
关于变换系数的信息可以指示用于导出变换系数的信息。此外,例如,关于变换系数的信息可以包括关于残差样本的信息、变换相关信息和/或量化相关信息。例如,关于变换系数的信息可以包括关于量化变换系数的信息。
编码装置通过对包括残差信息的视频信息进行编码来生成比特流(S1020)。例如,视频信息可以被称为图像信息。例如,视频信息可以进一步包括预测相关信息。例如,编码装置可以对视频信息进行编码以输出比特流。比特流也可以被称为编码(图像或视频)信息。
此外,尽管在图10中未示出,但是,例如,编码装置可以基于残差样本和预测样本来生成重构样本。此外,可以基于重构样本导出重构块以及重构图片。
例如,编码装置可以通过对包括全部或一些上述信息(或语法元素)中的图像信息进行编码来生成比特流或编码信息。此外,可以以比特流的形式输出信息。此外,可以通过网络或存储介质将比特流或编码信息发送到解码装置。此外,比特流或编码信息可以被存储在计算机可读存储介质中,并且比特流或编码信息可以通过上述图像编码方法来生成。
图12和图13示意性地示出了根据本文档的实施例的视频/图像解码方法和相关组件的示例。
图12中公开的方法可以由图3或图13中公开的解码装置执行。具体地,例如,图12的S1200可以由图13的解码装置的熵解码器310执行,以及图12的S1210可以由图13的解码装置的残差处理器320执行,以及图12的S1220可以由图13的解码装置的加法器340执行。此外,尽管图12中未示出,但是可以通过图13的解码装置的熵解码器310,从比特流导出预测相关信息或残差信息,并且可以通过解码装置的残差处理器320,从残差信息导出残差样本。可以通过解码装置的预测器330,从预测相关信息导出预测样本,并且可以通过解码装置的加法器340,从残差样本或预测样本导出重构块或重构图片。图12中公开的方法可以包括本文档中如上所述的实施例。
参照图12,解码装置从比特流中获得残差信息(S1200)。例如,解码装置可以通过解析或解码比特流来获得残差信息。在此,比特流可以被称为编码(图像)信息。例如,残差信息可以包括MTS索引和/或关于变换系数的信息。
MTS索引可以表示变换核集候选当中的要应用于当前块的变换核集。在此,MTS索引可以被表示为tu_mts_idx语法元素或mts_idx语法元素。此外,变换核集可以包括要在水平方向上应用于当前块的变换核及要在垂直方向上应用于当前块的变换核。在此,要在水平方向上应用的变换核可以被表示为trTypeHor,以及要在垂直方向上应用的变换核可以被表示为trTypeVer。
例如,MTS索引可以被导出为包括0至4的候选之一,并且根据MTS索引,trTypeHor和trTypeVer中的每一个可以被导出为0至2之一。例如,如果MTS索引为0,则trTypeHor和trTypeVer可以全部为0。此外,如果MTS索引为1,则trTypeHor和trTypeVer可以全部为1。此外,如果MTS索引是2,则trTypeHor可以为2,并且trTypeVer可以为1。如果MTS索引为3,则trTypeHor可以为1,并且trTypeVer可以为1。此外,如果MTS索引为4,则trTypeHor和trTypeVer可以全部为2。例如,trTypeHor或trTypeVer值可以表示变换核,并且如果为0,则可以表示DCT2,如果为1,则可以表示DST7,并且如果为2,则可以表示DCT8。即,可以基于MTS索引,将要在水平方向上应用的变换核及要在垂直方向上应用的变换核中的每一个导出为包括DCT2、DST7及DCT8的候选中的一个。
MTS索引可以基于MTS索引的bin串的bin来导出。换句话说,MTS索引信息可以被熵解码并且可以被导出为二值化的MTS索引,并且二值化的MTS索引可以被表示为MTS索引的bin串的bin。
换句话说,可以基于上下文编译导出MTS索引的bin串的bin中的至少一个。在此,可以基于上下文索引增量(ctxInc)的值执行上下文编译。此外,可以基于上下文索引(ctxIdx)或上下文模型执行上下文编译。在此,可以基于上下文索引增量的值来导出上下文索引。此外,可以基于上下文索引增量的值以及上下文索引偏移(ctxIdxOffset)来导出上下文索引。
例如,可以基于上下文编译来导出MTS索引的bin串的所有bin。例如,可以基于cqtDepth来分配用于MTS索引的bin串的bin当中的第一bin或第0个bin(bin 0)的ctxInc。在此,cqtDepth可以表示用于当前块的四叉树深度,并且可以导出为0到5当中的一个值。此外,用于第二bin或编号为1的bin(bin 1)的ctxInc可以被分配6,用于第三bin或编号为2的bin(bin2)的ctxInc可以被分配7,并且用于第四bin或编号为3的bin(bin 3)的ctxInc可以被分配8。此外,例如,用于MTS索引的bin串的bin当中的第一bin或第0个bin(bin 0)的ctxInc可以被分配0,用于第二bin或编号为1的bin(bin 1)的ctxInc可以被分配1,用于第三bin或编号为2的bin(bin 2)的ctxInc可以被分配2,并且用于第四bin或编号为3的bin(bin 3)的ctxInc可以被分配3。即,能够用于bin串的bin当中的第一bin的上下文编译的上下文索引增量值的数量可以为1。可替代地,MTS索引的bin串可以包括最多四个bin,以及分配给四个bin当中,由上下文编译导出的bin的上下文索引增量值的数量可以为1。
此外,例如,可以基于上下文编译来导出MTS索引的bin串的一些bin,并且可以基于旁路编译来导出剩余的bin。例如,用于MTS索引的bin串的bin当中的第一bin或编号为0的bin(bin 0)的ctxInc可以被分配0,并且剩余bin可以基于旁路编译导出。此外,例如,用于MTS索引的bin串的bin当中的第一bin或编号为0的bin(bin 0)的ctxInc可以被分配0,用于第二bin或编号为1的bin(bin 1)的ctxInc可以被分配1,以及剩余bin可以基于旁路编译导出。即,能够用于bin串的bin当中的第一bin的上下文编译的上下文索引增量值的数量可以为1。
此外,可以基于旁路编译导出MTS索引的bin串的所有bin。在此,旁路编译可以表示基于均匀概率分布执行上下文编译,并且由于省略了上下文编译的更新过程,因此可以提高编译效率。
关于变换系数的信息可以指示用于导出变换系数的信息。另外,残差信息可以进一步包括用来导出残差样本的信息。例如,残差信息可以包括关于残差样本的信息、逆变换相关信息及/或逆量化相关信息。例如,残差信息可以包括关于量化变换系数的信息。
解码装置基于残差信息生成当前块的残差样本(S1210)。例如,解码装置可以基于残差信息导出当前块的变换系数,并且可以基于变换系数生成残差样本。例如,解码装置可以基于关于包括在残差信息中的量化变换系数的信息来导出当前块的量化变换系数。例如,解码装置可以通过相对于量化变换系数执行解量化来导出当前块的变换系数。
例如,解码装置可以基于包括在残差信息中的MTS索引和根据包括在残差信息中的关于变换系数的信息的变换系数,生成当前块的残差样本(S1120)。例如,可以基于由变换系数和MTS索引表示的变换核集来生成残差样本。也就是说,解码装置可以使用由MTS索引表示的变换核集,通过逆变换从变换系数生成残差样本。在此,使用由MTS索引表示的变换核集的逆变换可以被包括在初级逆变换中。此外,当从变换系数生成残差样本时,解码装置不仅可以使用初级逆变换,而且可以使用二次逆变换。在这种情况下,解码装置可以通过相对于变换系数执行二次逆变换来导出修正的变换系数,并且可以通过相对于修正的变换系数执行初级逆变换来生成残差样本。
解码装置基于残差样本,生成当前块的重构样本(S1220)。例如,解码装置可以从比特流中获得包括预测模式/类型的预测相关信息,并且可以通过基于预测模式/类型信息执行帧内预测或帧间预测来生成用于当前块的预测样本。此外,例如,解码装置可以基于预测样本和残差样本来生成重构样本。此外,例如,可以基于重构样本来导出重构块或重构图片。
例如,解码装置可以通过解码比特流或编码信息来获得包括上述多条信息(或语法元素)中的全部或部分的图像信息。另外,比特流或编码信息可以被存储在计算机可读存储介质中,并可以致使上述解码方法被执行。
尽管已经基于在上述实施例中顺序列出步骤或块的流程图描述了方法,但本文档的步骤不限于特定的顺序,并且特定步骤可以相对于上述步骤在不同的步骤中或以不同的顺序或者同时地执行。另外,本领域的普通技术人员将理解,流程图中的步骤不是排他性的,并且在没有对本公开的范围施加影响的情况下,可以在其中包括另一步骤,或者可以删除流程图中的一个或更多个步骤。
根据本公开的以上提到的方法可以是软件的形式,并且根据本公开的编码装置和/或解码装置可以被包括在用于执行图像处理的设备(例如,TV、计算机、智能电话、机顶盒、显示设备等)中。
当用软件实现本公开的实施例时,可以用执行以上提到的功能的模块(处理或功能)实现以上提到的方法。模块可以被存储在存储器中并且由处理器执行。存储器可以安装在处理器的内部或外部,并可以经由各种公知设备连接到处理器。处理器可以包括专用集成电路(ASIC)、其他芯片集、逻辑电路和/或数据处理设备。存储器可以包括只读存储器(ROM)、随机存取存储器(RAM)、闪速存储器、存储卡、存储介质和/或其他存储设备。换句话说,根据本公开的实施例可以在处理器、微处理器、控制器或芯片上实现和执行。例如,相应图中图示的功能单元可以在计算机、处理器、微处理器、控制器或芯片上实现和执行。在这种情况下,关于实现方式的信息(例如,关于指令的信息)或算法可以被存储在数字存储介质中。
另外,应用本文档的实施例的解码装置和编码装置可以被包括在多媒体广播收发器、移动通信终端、家庭影院视频设备、数字影院视频设备、监视相机、视频聊天设备、诸如视频通信这样的实时通信设备、移动流传输设备、存储介质、便携式摄像机、视频点播(VoD)服务提供器、顶置(OTT)视频设备、互联网流传输服务提供器、3D视频设备、虚拟现实(VR)设备、增强现实(AR)设备、图像电话视频设备、车载终端(例如,车(包括自主车辆)载终端、飞机终端或轮船终端)和医疗视频设备中;并且可以被用于处理图像信号或数据。例如,OTT视频设备可以包括游戏控制台、Blueray(蓝光)播放器、联网TV、家庭影院系统、智能手机、平板PC和数字视频记录仪(DVR)。
另外,应用本文档的实施例的处理方法可以以由计算机执行的程序的形式产生,并可以被存储在计算机可读记录介质中。根据本文档的实施例的具有数据结构的多媒体数据也可以被存储在计算机可读记录介质中。计算机可读记录介质包括存储有计算机可读数据的所有种类的存储设备和分布式存储设备。计算机可读记录介质可以包括例如蓝光盘(BD)、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储设备。计算机可读记录介质还包括以载波(例如,互联网上的传输)的形式实施的媒体。另外,通过编码方法生成的比特流可以被存储在计算机可读记录介质中,或者可以通过有线或无线通信网络传输。
另外,本文档的实施例可以基于程序代码被实施为计算机程序产品,并且程序代码可以根据本文档的实施例在计算机上执行。程序代码可以被存储在计算机可读载体上。
图14表示可以应用于本文档的实施例的内容流传输系统的示例。
参考图14,应用本文档的实施例的内容流传输系统通常可以包括编码服务器、流传输服务器、web服务器、媒体存储装置、用户设备和多媒体输入设备。
编码服务器用来将从诸如智能电话、照相机、便携式摄像机等这样的多媒体输入设备输入的内容压缩为数字数据,生成比特流,并且将其传送至流传输服务器。作为另一示例,在诸如智能电话、照相机、便携式摄像机等这样的多媒体输入设备直接生成码流的情况下,可省略编码服务器。
可通过本文档的实施例应用于的编码方法或比特流生成方法来生成比特流。并且流传输服务器可在发送或接收比特流的过程中暂时存储比特流。
流传输服务器基于用户的请求通过网络服务器向用户装置传送多媒体数据,该网络服务器充当向用户通知存在什么服务的工具。当用户请求用户想要的服务时,网络服务器将请求转移至流传输服务器,并且流传输服务器将多媒体数据传送至用户。在这方面,内容流系统可包括单独的控制服务器,并且在这种情况下,控制服务器用来控制内容流系统中的各个装置之间的命令/响应。
流传输服务器可从媒体存储装置和/或编码服务器接收内容。例如,在从编码服务器接收到内容的情况下,可实时地接收内容。在这种情况下,流传输服务器可将比特流存储预定时间段以流畅地提供流传输服务。
例如,用户装置可包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航、板式PC、平板PC、超极本、可穿戴设备(例如,手表型终端(智能手表)、眼镜型终端(智能眼镜)、头戴式显示器(HMD))、数字TV、台式计算机、数字标牌等。
可将内容流系统中的每个服务器作为分布式服务器操作,并且在这种情况下,可以分布式方式处理由每个服务器接收的数据。
本说明书中的权利要求可以以各种方式组合。例如,本说明书的方法权利要求中的技术特征可以组合以在装置中实施或执行,并且装置权利要求中的技术特征可以组合以在方法中实施或执行。此外,方法权利要求和装置权利要求中的技术特征可以组合以在装置中实施或执行。此外,方法权利要求和装置权利要求中的技术特征可以组合以在方法中实施或执行。

Claims (15)

1.一种由解码装置执行的图像解码方法,所述方法包括:
从比特流中获得残差信息;
基于所述残差信息生成当前块的残差样本;以及
基于所述残差样本生成所述当前块的重构样本,
其中,所述残差信息包括多变换选择(MTS)索引和关于变换系数的信息,
其中,通过使用变换核集,从根据所述关于变换系数的信息的所述变换系数生成所述残差样本,
其中,基于所述MTS索引,从变换核集候选当中确定所述变换核集,
其中,基于上下文编译,导出所述MTS索引的bin串的bin当中的至少一个bin,
其中,基于所述MTS索引的上下文索引增量的值来执行所述上下文编译,
其中,所述MTS索引的所述bin串包括直至4个bin,其中,分配给所述4个bin当中的通过所述上下文编译导出的bin的上下文索引增量的值的数量为1。
2.根据权利要求1所述的图像解码方法,其中,用于所述bin串的bin当中的第一bin的所述上下文索引增量的值为0,用于所述bin串的bin当中的第二bin的所述上下文索引增量的值为1,用于所述bin串的bin当中的第三bin的所述上下文索引增量的值为2,以及用于所述bin串的bin当中的第四bin的所述上下文索引增量的值为3。
3.根据权利要求1所述的图像解码方法,其中,用于所述bin串的bin当中的第一bin的所述上下文索引增量的值为0,以及用于所述bin串的bin当中的第二bin的所述上下文索引增量的值为1,以及
基于旁路编译导出所述bin串的bin当中的剩余bin。
4.根据权利要求1所述的图像解码方法,其中,用于所述bin串的bin当中的第一bin的所述上下文索引增量的值为0,以及
基于旁路编译导出所述bin串的bin当中的剩余bin。
5.根据权利要求1所述的图像解码方法,其中,所述变换核集包括要在水平方向上应用于所述当前块的变换核和要在垂直方向上应用于所述当前块的变换核。
6.根据权利要求1所述的图像解码方法,其中,基于所述MTS索引,要在水平方向上应用的变换核和要在垂直方向上应用的变换核中的每一个被导出为包括DCT2、DST7和DCT8的候选中的一个。
7.根据权利要求1所述的图像解码方法,其中,所述MTS索引被导出为包括0至4的候选中的一个,以及
基于所述MTS索引的所述bin串的bin导出所述MTS索引。
8.一种由编码装置执行的图像编码方法,所述方法包括:
导出用于当前块的残差样本;
基于用于所述当前块的所述残差样本,生成残差信息;
对包括所述残差信息的视频信息进行编码以生成比特流,
其中,所述残差信息包括多变换选择(MTS)索引和关于变换系数的信息,
其中,通过使用变换核集,从所述残差样本生成所述关于变换系数的信息,
其中,所述MTS索引指示变换核集候选当中的所述变换核集,
其中,基于上下文编译,导出所述MTS索引的bin串的bin当中的至少一个bin,
其中,基于所述MTS索引的上下文索引增量的值来执行所述上下文编译,
其中,所述MTS索引的所述bin串包括直至4个bin,其中,分配给所述4个bin当中的通过所述上下文编译导出的bin的上下文索引增量的值的数量为1。
9.根据权利要求8所述的图像编码方法,其中,用于所述bin串的bin当中的第一bin的所述上下文索引增量的值为0,用于所述bin串的bin当中的第二bin的所述上下文索引增量的值为1,用于所述bin串的bin当中的第三bin的所述上下文索引增量的值为2,以及用于所述bin串的bin当中的第四bin的所述上下文索引增量的值为3。
10.根据权利要求8所述的图像编码方法,其中,用于所述bin串的bin当中的第一bin的所述上下文索引增量的值为0,以及用于所述bin串的bin当中的第二bin的所述上下文索引增量的值为1,以及
基于旁路编译表示所述bin串的bin当中的剩余bin。
11.根据权利要求8所述的图像编码方法,其中,用于所述bin串的bin当中的第一bin的所述上下文索引增量的值为0,以及
基于旁路编译表示所述bin串的bin当中的剩余bin。
12.根据权利要求8所述的图像编码方法,其中,所述变换核集包括要在水平方向上应用于所述当前块的变换核和要在垂直方向上应用于所述当前块的变换核。
13.根据权利要求8所述的图像编码方法,其中,基于所述MTS索引,要在水平方向上应用的变换核和要在垂直方向上应用的变换核中的每一个被表示为包括DCT2、DST7和DCT8的候选中的一个。
14.根据权利要求8所述的图像编码方法,其中,所述MTS索引被表示为包括0至4的候选中的一个,以及
基于所述MTS索引的所述bin串的bin表示所述MTS索引。
15.一种存储用于使解码装置执行图像解码方法的编码信息的计算机可读数字存储介质,所述图像解码方法包括:
从所述编码信息中获得残差信息;
基于所述残差信息生成当前块的残差样本;以及
基于所述残差样本生成所述当前块的重构样本,
其中,所述残差信息包括多变换选择(MTS)索引和关于变换系数的信息,
其中,通过使用变换核集,从根据所述关于变换系数的信息的所述变换系数生成所述残差样本,
其中,基于所述MTS索引,从变换核集候选当中确定所述变换核集,
其中,基于上下文编译,导出所述MTS索引的bin串的bin当中的至少一个bin,
其中,基于所述MTS索引的上下文索引增量的值来执行所述上下文编译,
其中,所述MTS索引的所述bin串包括直至4个bin,其中,分配给所述4个bin当中的通过所述上下文编译导出的bin的上下文索引增量的值的数量为1。
CN202080052291.2A 2019-06-19 2020-06-11 图像编译中指示变换核集的信息的信令 Pending CN114128276A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962863813P 2019-06-19 2019-06-19
US62/863,813 2019-06-19
PCT/KR2020/007597 WO2020256344A1 (ko) 2019-06-19 2020-06-11 영상 코딩에서 변환 커널 세트를 나타내는 정보의 시그널링

Publications (1)

Publication Number Publication Date
CN114128276A true CN114128276A (zh) 2022-03-01

Family

ID=74037354

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080052291.2A Pending CN114128276A (zh) 2019-06-19 2020-06-11 图像编译中指示变换核集的信息的信令

Country Status (7)

Country Link
US (2) US11503298B2 (zh)
EP (1) EP3989581A4 (zh)
JP (2) JP7302037B2 (zh)
KR (1) KR20210158400A (zh)
CN (1) CN114128276A (zh)
MX (1) MX2021016152A (zh)
WO (1) WO2020256344A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3238672A1 (en) * 2017-08-04 2019-02-07 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Method and apparatus for configuring transform for video compression
MX2021016152A (es) * 2019-06-19 2022-02-22 Lg Electronics Inc Se?alizacion de informacion que indica el conjunto de nucleo de transformacion en codificacion de imagen.
WO2023191332A1 (ko) * 2022-03-28 2023-10-05 현대자동차주식회사 적응적 다중변환선택을 이용하는 비디오 코딩을 위한 방법 및 장치
WO2024005614A1 (ko) * 2022-07-01 2024-01-04 엘지전자 주식회사 영상 인코딩/디코딩 방법 및 장치, 그리고 비트스트림을 저장한 기록 매체
WO2024076134A1 (ko) * 2022-10-05 2024-04-11 세종대학교산학협력단 동영상 인코딩 및 디코딩 장치와 방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102281435A (zh) * 2010-06-11 2011-12-14 华为技术有限公司 编码方法、解码方法、编码装置、解码装置及编解码系统
US20120230417A1 (en) * 2011-03-08 2012-09-13 Qualcomm Incorporated Coding of transform coefficients for video coding
US20180332289A1 (en) * 2017-05-11 2018-11-15 Mediatek Inc. Method and Apparatus of Adaptive Multiple Transforms for Video Coding
WO2019009618A1 (ko) * 2017-07-04 2019-01-10 삼성전자 주식회사 영상 부호화 방법 및 장치, 영상 복호화 방법 및 장치
KR20190003950A (ko) * 2016-05-03 2019-01-10 퀄컴 인코포레이티드 2차 변환 인덱스 이진화

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120034044A (ko) * 2010-09-30 2012-04-09 한국전자통신연구원 영상 변환 부호화/복호화 방법 및 장치
US10491922B2 (en) * 2015-09-29 2019-11-26 Qualcomm Incorporated Non-separable secondary transform for video coding
FI3806476T3 (fi) * 2018-06-03 2023-08-15 Lg Electronics Inc Menetelmä ja laite videosignaalin käsittelemiseksi redusoitua muunnosta käyttäen
US10948993B2 (en) * 2018-06-07 2021-03-16 Facebook, Inc. Picture-taking within virtual reality
CA3105072A1 (en) * 2018-06-29 2020-01-02 Vid Scale, Inc. Adaptive control point selection for affine motion model based video coding
US11218694B2 (en) * 2018-09-24 2022-01-04 Qualcomm Incorporated Adaptive multiple transform coding
JP2020053924A (ja) 2018-09-28 2020-04-02 シャープ株式会社 動画像符号化装置、動画像復号装置
KR20210104895A (ko) * 2018-12-28 2021-08-25 텔레호낙티에볼라게트 엘엠 에릭슨(피유비엘) 인코더 및 디코더에서 변환 선택을 선택하기 위한 방법 및 장치
US10986334B2 (en) * 2019-03-09 2021-04-20 Tencent America LLC Method and apparatus for video coding
US11240534B2 (en) * 2019-04-05 2022-02-01 Qualcomm Incorporated Extended multiple transform selection for video coding
US11032572B2 (en) * 2019-05-17 2021-06-08 Qualcomm Incorporated Low-frequency non-separable transform signaling based on zero-out patterns for video coding
EP3989562B1 (en) * 2019-06-19 2024-05-22 Lg Electronics Inc. Coding of information about transform kernel set
MX2021016152A (es) * 2019-06-19 2022-02-22 Lg Electronics Inc Se?alizacion de informacion que indica el conjunto de nucleo de transformacion en codificacion de imagen.
US11949870B2 (en) * 2019-06-21 2024-04-02 Qualcomm Incorporated Context modeling for low-frequency non-separable transformation signaling for video coding
US11086476B2 (en) * 2019-10-23 2021-08-10 Facebook Technologies, Llc 3D interactions with web content
US11175730B2 (en) * 2019-12-06 2021-11-16 Facebook Technologies, Llc Posture-based virtual space configurations
US11520399B2 (en) * 2020-05-26 2022-12-06 Snap Inc. Interactive augmented reality experiences using positional tracking
US11256336B2 (en) * 2020-06-29 2022-02-22 Facebook Technologies, Llc Integration of artificial reality interaction modes
US11176755B1 (en) * 2020-08-31 2021-11-16 Facebook Technologies, Llc Artificial reality augments and surfaces
US11178376B1 (en) * 2020-09-04 2021-11-16 Facebook Technologies, Llc Metering for display modes in artificial reality
US11546505B2 (en) * 2020-09-28 2023-01-03 Snap Inc. Touchless photo capture in response to detected hand gestures
US11113893B1 (en) * 2020-11-17 2021-09-07 Facebook Technologies, Llc Artificial reality environment with glints displayed by an extra reality device
US11531402B1 (en) * 2021-02-25 2022-12-20 Snap Inc. Bimanual gestures for controlling virtual and graphical elements

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102281435A (zh) * 2010-06-11 2011-12-14 华为技术有限公司 编码方法、解码方法、编码装置、解码装置及编解码系统
US20120230417A1 (en) * 2011-03-08 2012-09-13 Qualcomm Incorporated Coding of transform coefficients for video coding
KR20190003950A (ko) * 2016-05-03 2019-01-10 퀄컴 인코포레이티드 2차 변환 인덱스 이진화
US20180332289A1 (en) * 2017-05-11 2018-11-15 Mediatek Inc. Method and Apparatus of Adaptive Multiple Transforms for Video Coding
CN109089117A (zh) * 2017-05-11 2018-12-25 联发科技股份有限公司 编码或解码视频数据的方法及装置
WO2019009618A1 (ko) * 2017-07-04 2019-01-10 삼성전자 주식회사 영상 부호화 방법 및 장치, 영상 복호화 방법 및 장치

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
BENJAMIN BROSS ET AL.: "Versatile Video Coding (Draft 3)", 《JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 12TH MEETING: MACAO, CN, 3–12 OCT. 2018 JVET-L1001-V9》, 8 January 2019 (2019-01-08) *
BENJAMIN BROSS ET AL.: "Versatile Video Coding (Draft 5)", 《JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 14TH MEETING: GENEVA, CH, 19–27 MAR. 2019 JVET-N1001-V8》, 11 June 2019 (2019-06-11) *
CHRISTOPHER HOLLMANN ET LA.: "CE-6 related: Transform Simplification", 《JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 13TH MEETING: MARRAKECH, MA, 9–18 JAN. 2019 JVET-M0366-V5》, 15 January 2019 (2019-01-15) *
JANI LAINEMA: "CE6: 2-mode MTS (CE6-2.1)", 《JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 14TH MEETING: GENEVA, CH, 19–27 MARCH 2019 JVET-N0053》, 12 March 2019 (2019-03-12) *
SANTIAGO DE-LUXAN-HERNANDEZ ET AL.: "Block adaptive selection of multiple core transforms for video coding", 《2016 PICTURE CODING SYMPOSIUM(PCS)》, 24 April 2017 (2017-04-24) *
宋锐: "面向高性能视频编码的变换编码技术研究", 《中国优秀硕士学位论文全文数据库(电子期刊)》, 15 November 2017 (2017-11-15) *
梁夫彧 等: "现代视频编码关键技术及其发展", 《电力系统通信》, 13 April 2006 (2006-04-13) *

Also Published As

Publication number Publication date
JP7302037B2 (ja) 2023-07-03
JP7476401B2 (ja) 2024-04-30
US20220116608A1 (en) 2022-04-14
US20230059802A1 (en) 2023-02-23
KR20210158400A (ko) 2021-12-30
US11895300B2 (en) 2024-02-06
JP2022538033A (ja) 2022-08-31
JP2023116782A (ja) 2023-08-22
EP3989581A4 (en) 2023-06-28
EP3989581A1 (en) 2022-04-27
WO2020256344A1 (ko) 2020-12-24
MX2021016152A (es) 2022-02-22
US11503298B2 (en) 2022-11-15

Similar Documents

Publication Publication Date Title
EP3944618B1 (en) Transform for matrix-based intra-prediction in image coding
US11831918B2 (en) Image coding using transform index
CN113940070A (zh) 基于变换的图像编码方法及其装置
US11895300B2 (en) Signaling of information indicating transform kernel set in image coding
EP4376411A2 (en) Transform in intra prediction-based image coding
CN111615830A (zh) 基于选择性变换的图像编码方法和用于该方法的装置
CN112956201B (zh) 使用句法来执行编码的句法设计方法和设备
CN113170197A (zh) 基于二次变换的图像编码方法及其装置
US11909972B2 (en) Coding of information about transform kernel set
CN113273214A (zh) 基于二次变换的图像编码方法及其装置
CN113767625A (zh) 基于mpm列表的帧内预测方法及其设备
CN114982239A (zh) 基于变换的图像编码方法及其装置
US20230209061A1 (en) Context coding for information on transform kernel set in image coding system
CN114467310A (zh) 图像编译系统中残差数据编译的图像解码方法及其装置
CN114009023A (zh) 基于变换的图像编码方法及其装置
CN113597770A (zh) 基于变换的图像编译方法及其装置
CN113273210B (zh) 用于编译关于合并数据的信息的方法和装置
CN114762341A (zh) 用于基于变换的图像编码的方法和装置
CN114270839A (zh) 基于变换对图像进行编码的方法和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination