CN115426495A - 图像编码/解码方法及发送数据的方法 - Google Patents

图像编码/解码方法及发送数据的方法 Download PDF

Info

Publication number
CN115426495A
CN115426495A CN202211046061.2A CN202211046061A CN115426495A CN 115426495 A CN115426495 A CN 115426495A CN 202211046061 A CN202211046061 A CN 202211046061A CN 115426495 A CN115426495 A CN 115426495A
Authority
CN
China
Prior art keywords
transform coefficient
last
region
current block
coeff
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211046061.2A
Other languages
English (en)
Other versions
CN115426495B (zh
Inventor
崔情娥
金昇焕
许镇
柳先美
李翎
崔璋元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Priority to CN202211046061.2A priority Critical patent/CN115426495B/zh
Publication of CN115426495A publication Critical patent/CN115426495A/zh
Application granted granted Critical
Publication of CN115426495B publication Critical patent/CN115426495B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

图像编码/解码方法及发送数据的方法。由解码设备执行的图像解码方法包括以下步骤:接收包括残差信息的比特流;基于比特流中包括的残差信息,推导当前块的量化变换系数;基于逆量化处理从量化变换系数推导当前块的变换系数;通过对所推导的变换系数应用逆变换来推导当前块的残差样本;以及基于当前块的残差样本生成重构图片。

Description

图像编码/解码方法及发送数据的方法
本申请是原案申请号为201980006034.2的发明专利申请(国际申请号:PCT/KR2019/017723,申请日:2019年12月13日,发明名称:基于高频归零确定变换系数扫描顺序的方法及其设备)的分案申请。
技术领域
本发明涉及图像编码技术,更具体地,涉及在图像编码系统中基于高频归零确定变换系数扫描顺序的方法及其设备。
背景技术
近来,在各个领域中对诸如4K、8K或更高的超高清(UHD)图像/视频之类的高分辨率、高质量图像/视频的需求正在增长。随着图像/视频分辨率或质量变得更高,比传统图像/视频数据传输相对更多量的信息或比特。因此,如果图像/视频数据经由诸如现有的有线/无线宽带线路之类的介质传输或存储在传统存储介质中,则传输和存储的成本容易增加。
此外,对于虚拟现实(VR)和人工现实(AR)内容以及诸如全息图之类的沉浸式媒体的兴趣和需求正在增长;并且展现出与实际图像/视频不同的图像/视频特性的图像/视频(诸如游戏图像/视频)的广播也在增长。
因此,需要高效的图像/视频压缩技术来有效地压缩和传输、存储或播放如上所述的表现出各种特性的高分辨率、高质量的图像/视频。
发明内容
技术问题
本公开要解决的一个技术问题在于提供一种提高图像编码效率的方法及设备。
本公开要解决的另一技术问题在于提供一种提高残差编码效率的方法及设备。
本公开要解决的又一技术问题在于提供一种提高变换系数级别编码的效率的方法及设备。
本公开要解决的又一技术问题在于提供一种通过基于高频归零对变换系数进行编码来提高残差编码效率的方法及设备。
本公开要解决的又一技术问题在于提供一种当基于高频归零对当前块(或当前变换块)的变换系数进行编码时基于与当前块中未应用高频归零的区域有关的信息来改变变换系数组扫描方法的方法及其设备。
本公开要解决的又一技术问题在于提供一种省略对与应用了高频归零的区域有关的变换系数组的变换系数扫描并且省略该变换系数组的编码子块标志的信令的方法及其设备。
技术方案
根据本公开的实施方式,提供了一种由解码设备执行的图像解码方法。该方法包括:接收包括残差信息的比特流;基于比特流中包括的残差信息,推导当前块的量化变换系数;基于逆量化处理从量化变换系数推导当前块的变换系数;通过对所推导的变换系数应用逆变换来推导当前块的残差样本;以及基于当前块的残差样本生成重构图片,其中,当前块的每个变换系数与包括变换系数0的高频变换系数区域或包括至少一个有效变换系数的低频变换系数区域有关,并且对当前块的变换系数当中的与低频变换系数区域有关的变换系数执行变换系数扫描。
根据本公开的另一实施方式,提供了一种用于执行图像解码的解码设备。解码设备包括:熵解码器,其接收包括残差信息的比特流,并基于比特流中包括的残差信息,推导当前块的量化变换系数;解量化器,其基于逆量化处理从量化变换系数推导当前块的变换系数;逆变换器,其通过对推导的变换系数应用逆变换来推导当前块的残差样本;以及加法器,其基于当前块的残差样本生成重构图片,其中,当前块的每个变换系数与包括变换系数0的高频变换系数区域或包括至少一个有效变换系数的低频变换系数区域有关,并且对当前块的变换系数当中的与低频变换系数区域有关的变换系数执行变换系数扫描。
根据本公开的又一实施方式,提供了一种由编码设备执行的图像编码方法。该方法包括:推导当前块的残差样本;通过对当前块的残差样本进行变换来推导当前块的变换系数;基于量化处理从变换系数推导量化变换系数;以及对包括关于量化变换系数的信息的残差信息进行编码,其中,当前块的每个变换系数与包括变换系数0的高频变换系数区域或包括至少一个有效变换系数的低频变换系数区域有关,并且对当前块的变换系数当中的与低频变换系数区域有关的变换系数执行变换系数扫描。
根据本公开的又一实施方式,提供了一种用于执行图像编码的编码设备。该编码设备包括减法器,其推导当前块的残差样本;变换器,其通过对当前块的残差样本进行变换来推导当前块的变换系数;量化器,其基于量化处理从变换系数推导量化变换系数;以及熵编码器,其对包括关于量化变换系数的信息的残差信息进行编码,其中,当前块的每个变换系数与包括变换系数0的高频变换系数区域或包括至少一个有效变换系数的低频变换系数区域有关,并且对当前块的变换系数当中的与低频变换系数区域有关的变换系数执行变换系数扫描。
根据本公开的又一实施方式,提供了一种解码器可读存储介质,其存储与使视频解码设备执行根据一些实施方式的解码方法的指令有关的信息。
根据本公开的又一实施方式,提供了一种解码器可读存储介质,其存储与使视频解码设备执行根据实施方式的解码方法的指令有关的信息。根据实施方式的解码方法包括:接收包括残差信息的比特流;基于比特流中包括的残差信息,推导当前块的量化变换系数;基于逆量化处理从量化变换系数推导当前块的变换系数;通过对所推导的变换系数应用逆变换来推导当前块的残差样本;以及基于当前块的残差样本生成重构图片,其中,当前块的每个变换系数与包括变换系数0的高频变换系数区域或包括至少一个有效变换系数的低频变换系数区域有关,并且对当前块的变换系数当中的与低频变换系数区域有关的变换系数执行变换系数扫描。
技术效果
根据本公开,可以提高整体图像/视频压缩效率。
根据本公开,可以提高残差编码的效率。
根据本公开,可以提高变换系数级别编码的效率。
根据本公开,可以通过基于高频归零对变换系数进行编码来提高残差编码效率。
根据本公开,可以通过基于高频归零对当前块(或当前变换块)中的最后有效变换系数的位置信息进行编码来提高图像编码效率。
根据本公开,可以通过减少上下文编码的bin的数量来提高CABAC的吞吐量,并且可以在应用高频归零时通过基于高频归零区域(更准确地,未应用高频归零的区域)的尺寸对语法元素执行二值化来更有效地执行编码。
根据本公开,通过当基于高频归零对当前块(或当前变换块)的变换系数进行编码时基于与当前块中未应用高频归零的区域有关的信息扫描变换系数组,可以提高图像编码效率。
根据本公开,通过省略对与应用了高频归零的区域有关的变换系数组的变换系数扫描并且省略该变换系数组的编码子块标志的信令,可以提高图像编码效率。
附图说明
图1示意性地表示可以应用本公开的视频/图像编码系统的示例。
图2是示意性地描述可以应用本公开的视频/图像编码设备的配置的图。
图3是示意性地描述可以应用本公开的视频/图像解码设备的配置的图。
图4是用于说明根据实施方式的高频归零的图。
图5是用于描述对已经应用了高频归零的当前块的变换系数进行扫描的方法的实施方式的图。
图6是用于描述对已经应用了高频归零的当前块的变换系数进行扫描的方法的另一示例的图。
图7a和图7b是用于说明根据实施方式的熵编码器的配置和操作的图。
图8a和图8b是用于说明根据实施方式的熵解码器的配置和操作方法的图。
图9是示出根据实施方式的编码设备的操作的流程图。
图10是示出根据实施方式的编码设备的配置的框图。
图11是示出根据实施方式的解码设备的操作的流程图。
图12是示出根据实施方式的解码设备的配置的框图。
图13表示可以应用本文档的公开内容的内容流系统的示例。
具体实施方式
根据本公开的实施方式,提供了一种由解码设备执行的图像解码方法。该方法包括接收包括残差信息的比特流;基于比特流中包括的残差信息,推导当前块的量化变换系数;基于逆量化处理从量化变换系数推导当前块的变换系数;通过对推导的变换系数进行逆变换来推导当前块的残差样本;并基于当前块的残差样本生成重构图片,其中,当前块的每个变换系数与包括变换系数0的高频变换系数区域或包括至少一个有效变换系数的低频变换系数区域有关,并且对当前块的变换系数当中的与低频变换系数区域有关的变换系数执行变换系数扫描。
实施本发明的方式
尽管本公开可以易于进行各种修改并且包括各种实施方式,但是其特定实施方式已经通过示例的方式在附图中示出,并且现在将详细描述。然而,这不是旨在将本公开限于本文公开的特定实施方式。本文所使用的术语仅出于描述特定实施方式的目的被使用,并非旨在限制本公开的技术思想来使用。除非上下文另外明确指出,否则单数形式可以包括复数形式。诸如“包括”、“包含”之类的术语旨在指示存在以下描述中所写的特征、数目、步骤、操作、元件、组件或其组合,因此不应被理解为预先排除存在或添加一个或更多个不同特征、数目、步骤、操作、元素、组件或其组合的可能性。
另外,为了便于描述彼此不同的特征功能,在本公开中描述的附图上的各个配置被独立地描述,但是并不意味着配置由单独的硬件或软件来体现。例如,两个或更多个配置可以组合以形成单个配置,并且一个配置可以划分为多个配置。具有通过整合和/或划分而形成的每个组件的实施方式只要不脱离本公开的实质就将落入本公开的专利权的范围内。
在下文中,将参照附图更详细地解释本公开的优选实施方式。在下文中,相同的附图标志用于附图上的相同组件,并且可以省略对相同组件的重复描述。
图1例示了可以应用本公开的视频/图像编码系统的示例。
本文件涉及视频/图像编码。例如,本文件中公开的方法/实施方式可以应用于在多功能视频编码(VVC)标准、基本视频编码(EVC)标准、AOMedia Video 1(AV1)标准、第2代音频视频编码标准(AVS2)或下一代视频/图像编码标准(例如,H.267、H.268等)中公开的方法。
在本文件中,可以提供与视频/图像编码有关的各种实施方式,并且除非有相反指明,否则实施方式可以彼此组合并执行。
在本文件中,视频可以是指一段时间上的一系列图像。图片通常是指在特定时间帧表示一幅图像的单位,而切片/瓦片是指就编码而言组成图片的单位。切片/瓦片可以包括一个或更多个编码树单元(CTU)。一幅图片可以包括一个或更多个切片/瓦片。一幅图片可以包括一个或更多个瓦片组。一个瓦片组可以包括一个或更多个瓦片。砖块可以表示图片中瓦片内CTU行的矩形区域。一个瓦片可以分割为多个砖块,每个砖块包括瓦片内的一个或更多个CTU行。没有分割为多个砖块的瓦片也可以称为砖块。砖块扫描是在砖块的CTU光栅扫描中连续排序的、对图片进行分割的CTU的特定顺序排序,瓦片内的砖块在瓦片的砖块的光栅扫描中是连续排列的,并且图片中的瓦片在图片的瓦片的光栅扫描中是连续排序的。瓦片是图片中特定瓦片列和特定瓦片行内的CTU的矩形区域。瓦片列是高度等于图片的高度并且宽度由图片参数集中的语法元素指定的CTU的矩形区域。瓦片行是高度由图片参数集中的语法元素指定并且宽度等于图片宽度的CTU的矩形区域。瓦片扫描是指在瓦片的CTU光栅扫描中连续排序的、对图片进行分割的CTU的特定顺序排序,而图片中的瓦片在图片的瓦片的光栅扫描中是连续排序的。切片包括可以唯一地包含在单个NAL单元中的图片的整数个砖块。切片可以包括多个完整的瓦片,也可以包括仅一个瓦片的完整砖块的连续序列。在该文件中,瓦片组和切片可以互换使用。例如,在本文件中,瓦片组/瓦片组头也可以被称为切片/切片头。
像素或画素可以表示组成一幅图片(或图像)的最小单位。另外,“样本”可以用作与像素相对应的术语。样本通常可以表示像素或像素值,并且可以仅表示亮度分量的像素/像素值或仅表示色度分量的像素/像素值。
单元可以表示图像处理的基本单位。单元可以包括图片的特定区域和与该区域有关的信息中的至少一个。一个单元可以包括一个亮度块和两个色度(例如,cb、cr)块。在一些情况下,单元可以与诸如块或区域之类的术语互换使用。在一般情况下,M×N块可以包括M列和N行的样本(或样本阵列)或变换系数的集合(或阵列)。
在本文中,术语“/”和“、”应解释为表示“和/或”。例如,表述“A/B”可以表示“A和/或B”。此外,“A、B”可以表示“A和/或B”。此外,“A/B/C”可以表示“A、B和/或C中的至少一个”。另外,“A/B/C”可以表示“A、B和/或C中的至少一个”。
此外,在本文中,术语“或”应解释为表示“和/或”。例如,表述“A或B”可包括1)仅A,2)仅B,和/或3)A和B两者。换句话说,本文中的术语“或”应解释为表示“附加或另选地。”
参照图1,视频/图像编码系统可以包括第一设备(源装置)和第二设备(接收装置)。源设备可以通过数字存储介质或网络以文件或流的形式向接收设备发送编码视频/图像信息或数据。
源设备可以包括视频源、编码设备和发送器。接收器可以包括接收器、解码设备和渲染器。编码设备可以称为视频/图像编码设备,并且解码设备可以称为视频/图像解码设备。发送器可以包括在编码设备中。接收器可以包括在解码设备中。渲染器可以包括显示器,并且显示器可以被配置为单独的装置或外部组件。
视频源可以通过捕获、合成或生成视频/图像的除了来获取视频/图像。视频源可以包括视频/图像捕获装置和/或视频/图像生成装置。视频/图像捕获装置可以包括例如一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。视频/图像生成装置可以包括例如计算机、平板电脑和智能手机,并且可以(电子地)生成视频/图像。例如,可以通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可以由生成相关数据的处理代替。
编码设备可以对输入的视频/图像进行编码。编码设备可以执行一系列过程,诸如预测、变换和量化以实现压缩和编码效率。编码数据(编码视频/图像信息)可以以比特流的形式输出。
发送器可以通过数字存储介质或网络以文件或流的形式向接收装置的接收器发送以比特流形式输出的编码后的图像/图像信息或数据。数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送器可以包括用于通过预定文件格式生成媒体文件的元件,并且可以包括用于通过广播/通信网络进行发送的元件。接收器可以接收/提取比特流,并向解码设备发送接收到的比特流。
解码设备可以通过执行与编码设备的操作相对应的诸如解量化、逆变换和预测之类的一系列过程,来对视频/图像进行解码。
渲染器可以渲染经解码的视频/图像。经渲染的视频/图像可以通过显示器显示。
图2例示了可以应用本公开的视频/图像编码设备的结构。在下文中,视频编码设备可以包括图像编码设备。
参照图2,编码设备200包括图像分割器210、预测器220、残差处理器230和熵编码器240、加法器250、滤波器260和存储器270。预测器220可以包括帧间预测器221和帧内预测器222。残差处理器230可以包括变换器232、量化器233、解量化器234和逆变换器235。残差处理器230还可以包括减法器231。加法器250可以称为重构器或重构块生成器。根据实施方式,图像分割器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可以由至少一个硬件组件(例如,编码器芯片组或处理器)构成。此外,存储器270可以包括解码图片缓冲器(DPB)或者可以由数字存储介质构成。硬件组件还可以包括作为内部/外部组件的存储器270。
图像分割器210可以将输入到编码设备200的输入图像(或图片或帧)分割到一个或更多个处理器中。例如,处理器可以被称为编码单元(CU)。在这种情况下,可以根据四叉树二叉树三叉树(QTBTTT)结构从编码树单元(CTU)或最大编码单元(LCU)来递归地分割编码单元。例如,一个编码单元可以基于四叉树结构、二叉树结构和/或三元结构,被分割为深度更深的多个编码单元。在这种情况下,例如,可以首先应用四叉树结构,随后可以应用二叉树结构和/或三元结构。另选地,可以首先应用二叉树结构。可以基于不再分割的最终编码单元来执行根据本公开的编码过程。在这种情况下,可以根据图像特性基于编码效率将最大编码单元用作最终编码单元,或者如果需要,可以将编码单元递归地分割为深度更深的编码单元并且具有最佳尺寸的编码单元可以用作最终编码单位。这里,编码过程可以包括预测、变换和重构的过程,这将在后面描述。作为另一示例,处理器还可以包括预测单元(PU)或变换单元(TU)。在这种情况下,可以从上述最终编码单元来分离或分割预测单元和变换单元。预测单元可以是样本预测的单元,并且变换单元可以是用于推导变换系数的单元和/或用于从变换系数推导残差信号的单元。
在一些情况下,单元可以与诸如块或区域之类的术语互换使用。在一般情况下,M×N块可以表示由M列和N行组成的样本或变换系数的集合。样本通常可以表示像素或像素值,可以仅表示亮度分量的像素/像素值,或者仅表示色度分量的像素/像素值。样本可用作与像素或画素的一幅图片(或图像)相对应的术语。
在编码设备200中,从输入图像信号(原始块、原始样本阵列)中减去从帧间预测器221或帧内预测器222输出的预测信号(预测块、预测样本阵列),以生成残差信号(残差块、残差样本阵列)并且向变换器232发送所生成的残差信号。在这种情况下,如图所示,在编码设备200中用于从输入图像信号(原始块、原始样本阵列)减去预测信号(预测块、预测样本阵列)的单元可以称为减法器231。预测器可以对要处理的块(在下文中称为当前块)执行预测,并生成包括当前块的预测样本的预测块。预测器可以以当前块或CU为基础来确定是应用帧内预测还是应用帧间预测。如稍后在每个预测模式的描述中所述,预测器可以生成与预测有关的、诸如预测模式信息之类的信息各种信息,并向熵编码器240发送所生成的信息。关于预测的信息可以在熵编码器240中编码并以比特流的形式输出。
帧内预测器222可以通过参考当前图片中的样本来预测当前块。根据预测模式,参考的样本可以位于当前块的附近,或者可以远离当前块。在帧内预测中,预测模式可以包括多个非定向模式和多个定向模式。非定向模式可以包括例如DC模式和平面模式。根据预测方向的详细程度,定向模式可以包括例如33个定向预测模式或65个定向预测模式。然而,这仅是示例,依据设置可以使用更多或更少的定向预测模式。帧内预测器222可以通过使用应用于相邻块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可以基于由参考图片上的运动矢量指定的参考块(参考样本阵列)来推导当前块的预测块。这里,为了减少在帧间预测模式下发送的运动信息的量,可以基于相邻块和当前块之间的运动信息的相关性以块、子块或样本为单位来预测运动信息。运动信息可以包括运动矢量和参考图片索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,相邻块可以包括存在于当前图片中的空间相邻块和存在于参考图片中的时间相邻块。包括参考块的参考图片和包括时间相邻块的参考图片可以相同或不同。时间相邻块可以称为并置参考块、共位CU(colCU)等,并且包括时间相邻块的参考图片可以称为并置图片(colPic)。例如,帧间预测器221可以基于相邻块来配置运动信息候选者列表,并且生成表示哪个候选者用于推导当前块的运动矢量和/或参考图片索引的信息。可以基于各种预测模式来执行帧间预测。例如,在跳过模式和合并模式的情况下,帧间预测器221可以将相邻块的运动信息用作当前块的运动信息。在跳过模式下,与合并模式不同,可能无法发送残差信号。在运动矢量预测(MVP)模式的情况下,可以将相邻块的运动矢量用作运动矢量预测器,并且可以通过发信号通知运动矢量差来指示当前块的运动矢量。
预测器220可以基于以下描述的各种预测方法来生成预测信号。例如,预测器不仅可以应用帧内预测或帧间预测来预测一个块,而且可以同时应用帧内预测和帧间预测。这可以称为帧间帧内组合预测(CIIP)。此外,预测器可以基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可用于游戏等的内容图像/视频编码,例如,屏幕内容编码(SCC)。IBC基本上在当前图片中执行预测,但是可以类似于帧间预测来执行IBC,因为在当前图片中推导参考块。即,IBC可以使用本文中描述的帧间预测技术中的至少一种。调色板模式可以被视为帧内编码或帧内预测的示例。当应用调色板模式时,可以基于关于调色板表和调色板索引的信息来发信号通知图片内的样本值。
由预测器(包括帧间预测器221和/或帧内预测器222)生成的预测信号可以用于生成重构信号或生成残差信号。变换器232可以通过向残差信号应用变换技术来生成变换系数。例如,变换技术可以包括离散余弦变换(DCT)、离散正弦变换(DST)、Karhunen-Loève变换(KLT)、基于图的变换(GBT)或条件非线性变换(CNT)中的至少一种。这里,GBT表示当像素之间的关系信息由图表示时从图获得的变换。CNT是指基于使用所有先前重构的像素生成的预测信号而生成的变换。此外,变换处理可以应用于具有相同尺寸的正方形像素块,或者可以应用于具有可变尺寸而非正方形的块。
量化器233可以对变换系数进行量化,并且将它们发送给熵编码器240,并且熵编码器240可以对量化信号(关于量化变换系数的信息)进行编码并且输出比特流。关于量化变换系数的信息可以称为残差信息。量化器233可以基于系数扫描顺序将块类型量化变换系数重新布置为一维矢量形式,并且基于一维矢量形式的量化变换系数来生成关于量化变换系数的信息。可以生成关于变换系数的信息。熵编码器240可以执行各种编码方法,诸如,例如指数哥伦布(Golomb)、上下文自适应变长编码(CAVLC)、上下文自适应二进制算术编码(CABAC)等。熵编码器240可以对除了量化变换系数以外的视频/图像重构所需的信息(例如,语法元素的值等)一起或分开地进行编码。可以以比特流的形式以NAL(网络抽象层)为单位发送或存储编码信息(例如,编码视频/图像信息)。视频/图像信息还可以包括关于诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)之类的各种参数集的信息。此外,视频/图像信息还可包括一般约束信息。在本文件中,从编码设备向解码设备发送/发信号通知的信息和/或语法元素可以包括在视频/图片信息中。视频/图像信息可以通过上述编码过程被编码并且包括在比特流中。比特流可以通过网络发送,或者可以存储在数字存储介质中。网络可以包括广播网络和/或通信网络,并且数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。可以包括发送从熵编码器240输出的信号的发送器(未示出)和/或存储该信号的存储单元(未示出)作为编码设备200的内部/外部元件,另选地,发送器可以包括在熵编码器240中。
从量化器233输出的量化变换系数可以用于生成预测信号。例如,可以通过利用解量化器234和逆变换器235对量化变换系数应用解量化和逆变换,来重构残差信号(残差块或残差样本)。加法器250将重构的残差信号与从帧间预测器221或帧内预测器222输出的预测信号相加,以生成重构信号(重构图片、重构块、重构样本阵列)。如果要处理的块没有残差(诸如应用了跳过模式的情况),则可以将预测块用作重构块。加法器250可以称为重构器或重构块生成器。所生成的重构信号可以用于在当前图片中要处理的下一块的帧内预测,并且可以通过如下所述的滤波用于下一图片的帧间预测。
此外,在图片编码和/或重构期间,可以应用具有色度缩放的亮度映射(LMCS)。
滤波器260可以通过对重构信号应用滤波来改善主观/客观图像质量。例如,滤波器260可以通过对重构图片应用各种滤波方法来生成修改后的重构图片,并将修改后的重构图片存储在存储器270(具体地,存储器270的DPB)中。各种滤波方法可包括例如去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。滤波器260可以生成与滤波有关的各种信息,并且将生成的信息发送给熵编码器240,如稍后在各种滤波方法的描述中所述。与滤波有关的信息可以由熵编码器240编码并且以比特流的形式输出。
发送给存储器270的修改后的重构图片可以用作帧间预测器221中的参考图片。当通过编码设备应用帧间预测时,可以避免编码设备200与解码设备之间的预测不匹配,并且可以提高编码效率。
存储器270的DPB可以存储用作帧间预测器221中的参考图片的修改后的重构图片。存储器270可以存储从中推导(或编码)当前图片中的运动信息的块的运动信息和/或图片中已重构的块的运动信息。所存储的运动信息可以发送给帧间预测器221,并且用作空间相邻块的运动信息或时间相邻块的运动信息。存储器270可以存储当前图片中的重构块的重构样本,并且可以将重构样本传送给帧内预测器222。
图3例示了可以应用本公开的视频/图像解码设备的结构。
参照图3,解码设备300可以包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350、存储器360。预测器330可以包括帧间预测器332和帧内预测器331。残差处理器320可以包括解量化器321和逆变换器321。根据实施方式,熵解码器310、残差处理器320、预测器330、加法器340和滤波器350可以由硬件组件(例如,解码器芯片组或处理器)构成。此外,存储器360可以包括解码图片缓冲器(DPB),或者可以由数字存储介质构成。硬件组件还可以包括存储器360作为内部/外部组件。
当输入了包括视频/图像信息的比特流时,解码设备300可以与在图2的编码设备中处理视频/图像信息的处理相对应地重构图像。例如,解码设备300可以基于从比特流获得的块分割有关信息来推导单元/块。解码设备300可以使用在编码设备中应用的处理器来执行解码。因此,解码的处理器例如可以是编码单元,并且可以根据四叉树结构、二叉树结构和/或三叉树结构,从编码树单元或最大编码单元对编码单元进行分割。可以从编码单元推导一个或更多个变换单元。可以通过再现设备来再现通过解码设备300解码并输出的重构图像信号。
解码设备300可以以比特流形式接收从图2的编码设备输出的信号,并且可以通过熵解码器310对接收到的信号进行解码。例如,熵解码器310可以解析比特流,以推导图像重构(或图片重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可以包括关于诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)之类的各种参数集的信息。此外,视频/图像信息还可以包括一般约束信息。解码设备还可以基于关于参数集的信息和/或一般约束信息来对图片进行解码。本文中稍后描述的发信号通知的/接收的信息和/或语法元素可以通过解码过程被解码,并从比特流中获取。例如,熵解码器310基于诸如指数哥伦布编码、CAVLC或CABAC之类的编码方法对比特流中的信息进行解码,并输出图像重构所需的语法元素和残差的变换系数的量化值。更具体地,CABAC熵解码方法可以接收与比特流中的每一个语法元素相对应的bin(位),使用解码目标语法元素信息、解码目标块的解码信息或在先前级中解码的符号/bin的信息来确定上下文模型,并通过根据所确定的上下文模型预测bin的出现概率来对该bin进行算术解码,并且生成与每个语法元素的值相对应的符号。在这种情况下,在确定上下文模型之后,CABAC熵解码方法可以通过将经解码的符号/bin的信息用于下一符号/bin的上下文模型来更新上下文模型。由熵解码器310解码的信息当中与预测有关的信息可以提供给预测器(帧间预测器332和帧内预测器331),并且在熵解码器310中对其执行了熵解码的残差值(也就是说,量化变换系数和相关参数信息)可以输入到残差处理器320。残差处理器320可以推导残差信号(残差块、残差样本、残差样本阵列)。此外,由熵解码器310解码的信息当中关于滤波的信息可以提供给滤波器350。此外,用于接收从编码设备输出的信号的接收器(未示出)可以进一步被配置为解码设备300的内部/外部元件,或者接收器可以是熵解码器310的组件。此外,根据本文件的解码设备可以称为视频/图像/图片解码设备,并且解码设备可以分类为信息解码器(视频/图像/图片信息解码器)和样本解码器(视频/图像/图片样本解码器)。信息解码器可以包括熵解码器310,并且样本解码器可以包括解量化器321、逆变换器322、加法器340、滤波器350、存储器360、帧间预测器332和帧内预测器331中的至少一个。
解量化器321可以对量化变换系数进行解量化并且输出变换系数。解量化器321可以以二维块的形式重新布置量化变换系数。在这种情况下,可以基于在编码设备中执行的系数扫描顺序来执行重新布置。解量化器321可以通过使用量化参数(例如,量化步长信息)对量化变换系数执行解量化,并且获得变换系数。
逆变换器322对变换系数进行逆变换以获得残差信号(残差块、残差样本阵列)。
预测器可以对当前块执行预测,并生成包括当前块的预测样本的预测块。预测器可以基于从熵解码器310输出的关于预测的信息来确定向当前块应用帧内预测还是帧间预测,并且可以确定具体的帧内/帧间预测模式。
预测器330可以基于以下描述的各种预测方法来生成预测信号。例如,预测器不仅可以应用帧内预测或帧间预测来预测一个块,而且可以同时应用帧内预测和帧间预测。这可以称为帧间和帧内组合预测(CIIP)。此外,预测器可以基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可以用于游戏等的内容图像/视频编码,例如,屏幕内容编码(SCC)。IBC基本上在当前图片中执行预测,但是可以类似于帧间预测来执行IBC,因为在当前图片中推导参考块。即,IBC可以使用本文件中描述的帧间预测技术中的至少一种。调色板模式可以被视为帧内编码或帧内预测的示例。当应用调色板模式时,可以基于关于调色板表和调色板索引的信息来发信号通知图片内的样本值。
帧内预测器331可以通过参考当前图片中的样本来预测当前块。根据预测模式,参考的样本可以位于当前块的附近,或者可以远离当前块。在帧内预测中,预测模式可以包括多个非定向模式和多个定向模式。帧内预测器331可以通过使用应用于相邻块的预测模式来确定应用于当前块的预测模式。
帧间预测器332可以基于由参考图片上的运动矢量指定的参考块(参考样本阵列)来推导当前块的预测块。在这种情况下,为了减少在帧间预测模式中发送的运动信息的量,可以基于相邻块和当前块之间的运动信息的相关性,以块、子块或样本为单位来预测运动信息。运动信息可以包括运动矢量和参考图片索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,相邻块可以包括存在于当前图片中的空间相邻块和存在于参考图片中的时间相邻块。例如,帧间预测器332可以基于相邻块来配置运动信息候选者列表,并基于接收到的候选者选择信息来推导当前块的运动矢量和/或参考图片索引。可以基于各种预测模式来执行帧间预测,并且关于预测的信息可以包括表示针对当前块的帧间预测的模式的信息。
加法器340可以通过将所获得的残差信号与从预测器(包括帧间预测器332和/或帧内预测器331)输出的预测信号(预测块、预测样本阵列)相加来生成重构信号(重构图片、重构块、重构样本阵列)。如果要处理的块没有残差(例如当应用跳过模式时),则可以将预测块用作重构块。
加法器340可以称为重构器或重构块生成器。所生成的重构信号可以用于当前图片中要处理的下一块的帧内预测,可以通过如下所述的滤波输出,或者可以用于下一图片的帧间预测。
此外,在图片解码处理中可以应用具有色度缩放的亮度映射(LMCS)。
滤波器350可以通过向重构信号应用滤波来改善主观/客观图像质量。例如,滤波器350可以通过对重构图片应用各种滤波方法来生成修改后的重构图片,并将修改后的重构图片存储在存储器360(具体地,存储器360的DPB)中。各种滤波方法可包括例如去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。
存储器360的DPB中存储的(修改后的)重构图片可以用作帧间预测器332中的参考图片。存储器360可以存储从中推导(或解码)当前图片中的运动信息的块的运动信息和/或图片中已重构的块的运动信息。所存储的运动信息可以发送给帧间预测器332,以作为空间相邻块的运动信息或时间相邻块的运动信息来利用。存储器360可以存储当前图片中的重构块的重构样本,并且可以将重构样本传送给帧内预测器331。
在本公开中,在编码设备200的滤波器260、帧间预测器221和帧内预测器222中描述的实施方式可以与解码设备300的滤波器350、帧间预测器332和帧内预测器331相同或分别被应用以对应于解码设备300的滤波器350、帧间预测器332和帧内预测器331。相同的内容也可以应用于帧间预测器332和帧内预测器331。
如上所述,执行预测以增加执行视频编码时的压缩效率。通过这样,可以生成包括作为编码目标块的当前块的预测样本的预测块。在此,预测块包括空间域(或像素域)中的预测样本。可以在编码设备和解码设备中等同地推导预测块,并且编码设备可以向解码设备发信号通知关于原始块和预测块之间的残差的信息(残差信息)而非原始块本身的原始样本值,由此可以提高图像编码效率。解码设备可以基于残差信息来推导包括残差样本的残差块,通过将残差块添加至预测块来生成包括重构样本的重构块,并且生成包括重构块的重构图片。
可以通过变换和量化过程来生成残差信息。例如,编码设备可以推导原始块和预测块之间的残差块,通过对残差块中包括的残差样本(残差样本阵列)执行变换过程来推导变换系数,并且通过对变换系数执行量化过程来推导量化变换系数,从而可以(通过比特流)向解码设备发信号通知关联残差信息。这里,残差信息可以包括量化变换系数的值信息、位置信息、变换技术、变换核、量化参数等。解码设备可以基于残差信息执行解量化/逆变换过程并推导残差样本(或残差样本块)。解码设备可以基于预测块和残差块来生成重构图片。编码设备可以通过对量化变换系数进行解量化/逆变换来推导残差块,以用于下一图片的帧间预测的参考,并且可以基于此生成重构图片。
图4是用于说明根据实施方式的高频归零的图。
在本说明书中,“高频归零”是指将具有第一水平尺寸(或长度)W1和第一垂直尺寸(或长度)H1的(变换)块中与等于或高于一定值的频率有关的变换系数归零(即,确定为0)的处理。当应用高频归零时,(变换)块中的变换系数当中的基于第二水平尺寸W2和第二垂直尺寸H2构造的低频变换系数区域外部的变换系数的变换系数值可以全部确定(设置)为零。低频变换系数区域外部可以称为高频变换系数区域。在示例中,低频变换系数区域可以是从(变换)块的左上端起的四边形的区域。
在本说明书中,特定的术语或语句用于定义特定的信息或概念。例如,在本说明书中,如上所述,将具有第一水平尺寸(或长度)W1和第一垂直尺寸(或长度)H1的(变换)块中与等于或高于一定值的频率有关的变换系数归零的处理被定义为“高频归零”;已经被通过高频归零执行了归零的区域被称为“高频变换系数区域”;并且未执行归零的区域被称为“低频变换系数区域”。为了表示低频变换系数区域的尺寸,第二水平尺寸(或长度)W2和第二垂直尺寸(或长度)H2被使用。
然而,术语“高频归零”可以由诸如高频调零、高频迫零、高频置零等的各种术语代替;术语“高频变换系数区域”可以由诸如高频归零应用区域、高频区域、高频系数区域等的各种术语代替;术语“低频变换系数区域”可以由诸如高频归零未应用区域、低频区域、低频系数区域、限制区域等的各种术语来代替。因此,在本说明书中,当在整个说明书中解释用于定义特定信息或概念的特定术语或语句时,需要根据该术语旨在表示的内容来注意各种操作、功能和效果,而非限于其名称。
在实施方式中,可以提出一种针对应用了高频归零的(变换)块(TB、TU或CB)执行语法元素last_sig_coeff_x_prefix和last_sig_coeff_y_prefix的二值化的方法。last_sig_coeff_x_prefix和last_sig_coeff_y_prefix可以用截断莱斯码进行二值化,并且此时,cRiceParam的值可以使用0。在截断莱斯码的二值化中使用的cMax的值在执行last_sig_coeff_x_prebinarized的二值化时可以基于式1确定,而在执行last_sig_coeff_y_prefix的二值化时可以基于式2确定。
[式1]
cMax=(log2W1<<1)-1
[式2]
cMax=(log2H1<<1)-1
其中,W1可以表示(变换)块的水平长度(或宽度),而H1可以表示(变换)块的垂直长度(或高度)。例如,在如图6所示的64×32变换块的情况下,W1是64,H1是32。因此,用于last_sig_coeff_x_prefix的二值化的cMax的值可以是11,并且用于last_sig_coeff_y_prefix的二值化的cMax的值可以是9。
下表1表示当W1或H1为32时的二值化,并且下表2表示当W1或H1为64时的二值化码字。在实施方式中,可以基于变换块的尺寸来执行截断莱斯码二值化,并且因此,如下表2所示,用于对LastSignificantCoeffX或LastSignificantCoeffY的值是32到47的情况进行编码的last_sig_coeff_x_prefix或last_sig_coeff_y_prefix的码字可以是“11111111110”,而用于对LastSignificantCoeffX或LastSignificantCoeffY的值是48到63的情况进行编码的last_sig_coeff_x_prefix或者last_sig_coeff_y_prefix的码字可以是“11111111111”。两种情况可以基于11个bin(二进制数值)进行二值化。码字可以称为bin串。
[表1]
Figure BDA0003822431730000171
[表2]
Figure BDA0003822431730000172
另外,根据实施方式的编码设备(熵编码器)可以对(量化)变换系数执行残差编码过程。在示例中,编码设备可以根据扫描顺序对当前块(当前编码块(CB)或当前变换块(TB))中的(量化)变换系数执行残差编码。此时,例如,编码设备可以生成并编码与下表3中所写的残差信息有关的各种语法元素。
[表3]
Figure BDA0003822431730000181
Figure BDA0003822431730000191
Figure BDA0003822431730000201
Figure BDA0003822431730000211
Figure BDA0003822431730000221
Figure BDA0003822431730000231
Figure BDA0003822431730000241
Figure BDA0003822431730000251
Figure BDA0003822431730000261
如上表3中所示,当last_sig_coeff_x_prefix的值大于3时,可以进一步发信号通知last_sig_coeff_x_suffix,并且可以基于last_sig_coeff_x_suffix的值来推导LastSignificantCoeffX。例如,用于对LastSignificantCoeffX的值是32至47的情况进行编码的last_sig_coeff_x_prefix的码字可以是“11111111110”,并且可以基于last_sig_coeff_x_suffix的值来确定将使用32至47当中的哪个值。另外,如上表1所示,当last_sig_coeff_y_prefix的值大于3时,可以进一步发信号通知last_sig_coeff_y_suffix,并且可以基于last_sig_coeff_y_suffix的值来推导LastSignificantCoeffY。例如,用于对LastSignificantCoeffY的值是32至47的情况进行编码的last_sig_coeff_x_prefix的码字可以是“11111111110”,并且可以基于last_sig_coeff_y_suffix的值来确定将使用32至47当中的哪个值。
例如,可以如下表4那样执行用于推导LastSignificantCoeffX或LastSignificantCoeffY的具体计算。
[表4]
Figure BDA0003822431730000271
高频归零意味着将具有第一水平尺寸W1或第一垂直尺寸H1的变换块中频率等于或高于一定值的系数归零(即,确定为0),并将残差变换系数限制为第二水平尺寸W2或第二垂直尺寸H2。此时,在实施方式中,可以考虑基于通过高频归零推导的限制区域的尺寸(第二水平尺寸或第二垂直尺寸)基于截断莱斯码来执行二值化的方法,而不是基于变换块的尺寸(第一水平尺寸或第一垂直尺寸)基于截断莱斯码执行二值化的方法。在将last_sig_coeff_x_prefix的cMax和last_sig_coeff_y_prefix的cMax分别定义为下式3和下式4之后,可以使用第二水平尺寸和第二垂直尺寸生成截断莱斯码。
[式3]
cMax=(log2(min(W1,W2))<<1)–1
[表4]
cMax=(log2(min(H1,H2))<<1)-1
在示例中,当第一水平尺寸或第一垂直尺寸为64并且第二水平尺寸或第二垂直尺寸为32时,基于前述式3和式4推导的截断莱斯码可以类似于下表5。通过高频归零,从形成于第二水平尺寸或第二垂直尺寸外部的高频变换系数区域中的高频系数中去除残差变换系数,因此可以如下表6设计二值化码字。
在实施方式中,W2和H2可以被设置为固定值。另选地,可以基于W1和H1确定W2和H2。另选地,可以从编码设备向解码设备发信号通知指示W2和H2的信息。在示例中,W2和H2可以分别设置为32或16。在另一示例中,所述W2和H2可以分别推导为W1的一半和H1的一半。在又一示例中,所述W2和H2可以被推导为max(W1,H1)的一半。然而,这些是示例,并且可以通过在编码设备和解码设备中设置的其他各种方法来确定所述W2和H2。通过所提出的方法,对于LastSignificantCoeffX或LastSignificantCoeffY的一些值,可以有效地减少码字的长度。此外,由于通过所提出的方法减少的编码的bin是上下文编码的bin,因此在吞吐量方面可以具有优势。
[表5]
Figure BDA0003822431730000281
在示例中,可以基于图4中描述的实施方式来执行稍后在图7a至图8b中要描述的残差编码方法。在另一示例中,可以基于图4中描述的示例来执行稍后在图9中要描述的编码方法或稍后在图11中要描述的解码方法。
图5是用于描述对已经应用了高频归零的当前块的变换系数进行扫描的方法的示例的图;并且图6是用于描述对已经应用了高频归零的当前块的变换系数进行扫描的方法的另一示例的图。
在实施方式中,可以执行残差编码,从包括最后非零系数的最后变换系数组的位置沿反向对角线方向扫描变换系数组。另一方面,除此以外,或者另选地,在另一实施方式中,对于应用了高频归零的变换块,可以改变变换系数组的扫描顺序。
图5表示在应用了高频归零的64×64变换块中扫描4×4变换系数组的方法。在图5中,由L表示的部分指示其中包括最后非零系数的4×4变换系数组。高频归零意味着在具有第一水平尺寸W1和/或第一垂直尺寸H1的变换块中将与等于或高于特定频率的高频有关的变换系数归零(或置零),并将残差变换系数限制于第二水平尺寸W2和/或第二垂直尺寸H2。在图5中用点标志的4×4块表示通过高频归零被置零的区域。在图5中,阴影区域可以称为低频变换系数区域,并且用点标志的区域可以称为高频变换系数区域。
W2和/或H2可以设置为固定值,或者基于W1和/或H1来确定。另选地,可以从编码设备向解码设备发信号通知指示W2和/或H2的信息。在示例中,所述W2和H2中的每一个可以被设置为32或16。在另一示例中,所述W2和/或H2可以分别被推导为W1的一半和/或H1的一半。在又一示例中,所述W2和/或H2可以被推导为max(W1,H1)的一半。然而,上述示例并非包括全部内容,并且可以基于编码设备或解码设备中的各种方法来确定所述W2和/或H2。
当使用根据图5的变换系数组扫描方法时,可以确认通过高频归零而置零的区域也应该根据反向对角线扫描顺序进行扫描。在像这样扫描不必要的块的情况下,编码复杂度可能增加,并且逐子块的置零区域(图5中用x标志的由4×4块构成的区域)中对编码子块标志(表示当前块中子块的变换系数的变换系数级别是否全为零的标志,可以例如表示为coded_sub_block_flag)进行编码的负担可以为0。
因此,当应用高频归零时,可以考虑将变换系数组的扫描限制为仅在被限制在其中限制高频归零的区域(或低频变换系数区域)中的尺寸(第二水平尺寸或第二垂直尺寸)内执行的方法。在实施方式中,提出了一种执行如图6中的变换系数组扫描而非根据图5的变换系数组扫描的方法。
在执行根据图6的变换系数组扫描方法的情况下,可以省略不必要的扫描处理,并且防止对编码子块标志的不必要编码。也就是说,根据图6的实施方式,编码设备可以不将当前(变换)中位于超出W2和/或H2的区域(即,高频变换系数区域)的子块的编码子块标志并入残差编码语法(或比特流)中。即,可以不为位于超出W2和/或H2的区域的子块指派用于语法元素coded_sub_block_flag的比特。在这种情况下,解码设备可以在没有对位于超出W2和/或H2的区域的子块执行扫描的情况下推断出最后有效系数不位于超出W2和/或H2的区域中。此外,在不从残差编码语法(或比特流)中解析位于超出W2和/或H2的区域的子块的语法元素coded_sub_block_flag的情况下,解码设备可以推断出语法元素coded_sub_block_flag的值为0。
因此,在根据图6的实施方式中,当与根据图5的实施方式相比时,可以不对64×64当前块中所包括的总共四十九个4×4子块的“coded_sub_block_flag=0”进行编码。由于coded_sub_block_flag被编码为上下文编码的bin,因此,就吞吐量而言,根据图6的实施方式也可以具有优势。即,当认为在残差编码处理中已经应用了高频归零并且在置零区域中不存在非零有效系数时,就存储而言,可以减小变换处理中所需的计算复杂度。
在示例中,可以基于图5和图6中描述的实施方式执行稍后在图7a至图8b中要描述的残差编码方法。在另一示例中,可以基于图5和图6中描述的实施方式执行稍后在图9中要描述的编码方法或稍后在图11中要描述的解码方法。
图7a和图7b是用于说明根据实施方式的熵编码器的配置和操作的图。
参照图7a和图7b,编码设备(熵编码器)可以对(量化)变换系数执行残差编码过程。(量化)变换系数一个在示例中可以是已经应用了高频归零的变换系数,或者在另一示例中可以包括非零的高频系数,并且在这种情况下,在熵编码器中执行的残差编码过程中高频系数可以被视为0或作为0来处理。编码设备可以根据以上在图4中所描述的扫描顺序对当前块(当前编码块(CB)或当前变换块(TB))中的(量化)变换系数执行残差编码。例如,编码设备可以生成并编码如上表3中所写的残差信息的各种语法元素。S700和S710可以合并到图2的残差信息编码过程中。
编码设备可以对与残差有关的语法元素执行二值化(S700)。在示例中,可以对last_sig_coeff_x_prefix和last_sig_coeff_y_prefix执行根据以上图4中所描述的实施方式的二值化。可以基于当前块中的最后有效系数的位置来推导last_sig_coeff_x_prefix和last_sig_coeff_y_prefix。此外,可以根据预定方法,对以上表3的其余语法元素进行二值化。在另一示例中,可以根据固定长度二值化处理对transform_skip_flag、last_sig_coeff_x_suffix、last_sig_coeff_y_suffix、coded_sub_block_flag、sig_coeff_flag、par_level_flag、rem_abs_gt1_flag、rem_abs_gt2_flag、coeff_sign_flag、mts_idx等执行二值化,并且对abs_remainder执行与其对应的二值化。
last_sig_coeff_x_prefix和last_sig_coeff_y_prefix可以表示与当前块的变换系数当中的最后非零变换系数的位置有关的最后有效系数前缀信息的示例。更具体地,last_sig_coeff_x_prefix可以表示作为最后有效系数前缀信息之一的x轴前缀信息的示例,并且last_sig_coeff_y_prefix可以表示作为最后有效系数前缀之一的y轴前缀信息的示例。在对last_sig_coeff_x_prefix和last_sig_coeff_y_prefix的二值化处理中,0可被用作cRiceParam的值。编码设备可以通过二值化过程推导last_sig_coeff_x_prefix和last_sig_coeff_y_prefix中的每一个的bin串。二值化过程可以由熵编码器240中的二值化器242执行。
根据实施方式,可以基于是否应用了高频归零来推导last_sig_coeff_x_prefix和last_sig_coeff_y_prefix中的每一个的cMax值。先前已经在图4中描述了用于推导cMax的具体公式。cMax可以表示在last_sig_coeff_x_prefix或last_sig_coeff_y_prefix的二值化处理中推导的码字(bin串)的最大长度。当减小cMax的值时,可以有效地缩短last_sig_coeff_x_prefix或last_sig_coeff_y_prefix的码字的长度。并且,由于通过缩短码字而减少的编码的bin是上下文编码的bin,因此在图像编码吞吐量方面可以具有优势。
编码设备可以对残差编码相关语法元素执行熵编码(S710)。编码设备可以省略对应用了高频归零的区域的变换系数扫描,并且可以不对应用了高频归零的区域的coded_sub_block_flag进行编码。即,在生成残差编码语法(或比特流)时,编码设备可以不包括用于位于应用了高频归零的区域的子块的语法元素coded_sub_block_flag。编码设备可以仅对未应用高频归零的区域即左上变换系数区域(或低频变换系数区域)的coded_sub_block_flag进行编码,并将经编码的coded_sub_block_flag合并到残差编码语法中(或比特流)中。由此,可以减少指派给残差编码的比特数。
编码设备可以基于诸如上下文自适应算术编码(CABAC)或上下文自适应变长编码(CAVLC)之类的熵编码方案,对bin串进行基于上下文或基于旁路的编码,并且其输出可以合并到比特流中。熵编码过程可以由熵编码器240中的熵编码处理器244执行。除了上述包括关于last_sig_coeff_x_prefix和last_sig_coeff_y_prefix的信息的残差信息之外,比特流可以包括用于图像/视频解码的各种信息,诸如预测信息等。比特流可以通过(数字)存储介质或网络向解码设备传送。
图8a和图8b是用于说明根据实施方式的熵解码器的配置和操作方法的图。
参照图8a和图8b,解码设备(熵解码器)可以通过对编码的残差信息进行解码来推导(量化)变换系数。解码设备可以通过对如先前在图4中所描述的当前块(当前编码块或当前变换块)的编码的残差信息进行解码来推导(量化)变换系数。例如,解码设备可以对与如表3中所写的这种残差信息有关的各种语法元素进行解码,分析相关语法元素的值,并且基于所分析的语法元素的值来推导(量化)变换系数。S800至S810可以合并到用于推导图3的上述(量化)变换系数的过程中。
解码设备可以对与残差有关的语法元素执行二值化(S800)。例如,可以对last_sig_coeff_x_prefix和last_sig_coeff_y_prefix执行基于以上在图4中描述的实施方式的二值化。在这种情况下,0可以被用作cRiceParam的值。解码设备可以通过二值化过程推导用于last_sig_coeff_x_prefix和last_sig_coeff_y_prefix的各个可用值的可用bin串。二值化过程可以由熵解码器310中的二值化器312执行。根据实施方式,可以基于是否应用了高频归零来推导last_sig_coeff_x_prefix和last_sig_coeff_y_prefix中的每一个的cMax值。先前已经在图4中描述了用于推导cMax的特定公式。
cMax可以表示在last_sig_coeff_x_prefix或last_sig_coeff_y_prefix的二值化处理推导的码字(bin串)的最大长度。当减小cMax的值时,可以有效地缩短last_sig_coeff_x_prefix或last_sig_coeff_y_prefix的码字的长度。并且,由于通过缩短码字而减少的编码的bin是上下文编码的bin,因此在图像编码吞吐量方面可以具有优势。
另外,可以根据预定方法对以上表3的其余语法元素进行二值化。例如,可以根据固定长度的二值化处理对transform_skip_flag、last_sig_coeff_x_suffix、last_sig_coeff_y_suffix、coded_sub_block_flag、sig_coeff_flag、par_level_flag、rem_abs_gt1_flag、rem_abs_gt2_flag、coeff_sign_flag、mts_idx等执行二值化,并且可以对abs_remainder执行与其相对应的二值化。
解码设备可以对残差编码相关语法元素执行熵解码(S810)。在依次对每个语法元素的各个bin进行解析和解码时,解码设备可以将推导的bin串与可用bin串进行比较。当推导的bin串与可用bin串之一相同时,与该bin串相对应的值可以被推导为语法元素的值。当推导的bin串与任何可用bin串都不同时,可以在进一步解析和解码比特流中的下一个比特之后执行比较过程。通过此处理,即使不使用比特流中的用于特定信息(特定语法元素)的开始比特或结束比特,也可以使用可变长度比特来发信号通知该信息(其中,通过该长度可变比特可以为较低值指派相对少的比特),因此提高了整体编码效率。
解码设备可以省略对应用了高频归零的区域的变换系数扫描,可以不对应用了高频归零的区域的coded_sub_block_flag进行解析和/或解码,并且可以将其视为0。因此,即使不对位于应用了高频归零的区域处的子块执行扫描,解码设备也可以推断出最后有效系数不位于其内,可以不从残差编码语法(或比特流)中解析位于应用了高频归零的区域处的子块的语法元素coded_sub_block_flag,并且可以推断出语法元素coded_sub_block_flag的值为0。
此外,解码设备可以推断出在当前块的残差信息(例如,残差编码语法)中已经解析和/或解码的语法元素coded_sub_block_flag不是针对应用了高频归零的区域的,并且可以推断出在左上角变换块的残差信息(例如,残差语法)中首先解析和/或解码的语法元素coded_sub_block_flag是针对基于扫描顺序首先被推导的子块的。
解码设备可以基于诸如CABAC、CAVLC等之类的熵编码技术,对来自比特流的bin串中的各个bin执行基于上下文或基于旁路的解码。熵解码过程可以由熵解码器310中的熵解码处理器314执行。解码设备可以基于last_sig_coeff_x_prefix的值和last_sig_coeff_y_prefix的值来推导最后有效系数的位置。例如,可以基于下表6执行特定计算。
[表6]
Figure BDA0003822431730000331
Figure BDA0003822431730000341
在表6中,LastSignificantCoeffX可以表示当前(变换)块中最后非零有效系数的x轴位置,并且LastSignificantCoeffY可以表示当前(变换)块中最后非零有效系数的y轴位置。
除了如上所述的包括关于last_sig_coeff_x_prefix和last_sig_coeff_y_prefix的信息的残差信息之外,比特流可以包括用于图像/视频解码的各种信息,诸如预测信息等。类似于先前描述的,可以通过(数字)存储介质或网络向解码设备传送比特流。
解码设备可以通过基于(量化)变换系数执行解量化过程和/或逆变换过程来推导当前块的残差样本。可以基于残差样本和通过帧间/帧内预测推导的预测样本来生成重构样本,并且可以生成包括重构样本的重构图片。
图9是示出了根据实施方式的编码设备的操作的流程图,并且图10是示出了根据实施方式的编码设备的配置的框图。
根据图9和图10的编码设备可以执行与根据图11和图12的解码设备的操作相对应的操作。因此,稍后在图11和图12中要描述的解码设备的操作可以类似地应用于根据图9和图10的编码设备。
在图9中公开的每个步骤可以由图2中公开的编码设备200来执行。更具体地说,S900可以由图2中公开的减法器231执行;步骤S910可以由图2中公开的变换器232执行;步骤S920可以由图2中公开的量化器233执行;并且步骤S930可以由图2中公开的熵编码器240执行。此外,根据S900至S930的操作是基于以上在图4至图8中描述的一些内容的。因此,将省略或简要说明与以上在图2、图4至图8中所描述的内容重复的特定内容的说明。
如图10所示,根据实施方式的编码设备可以包括减法器231、变换器232、量化器233和熵编码器240。然而,根据情况,可能发生并非图10中所示的所有组件都是编码设备的必要组件,并且编码设备可以由比图10所示的组件更多或更少的组件来体现。
在根据实施方式的编码设备中,减法器231、变换器232、量化器233和熵编码器240中的每一个可以由单独芯片实现,或者至少两个或更多个组件可以通过单个芯片实现。
根据实施方式的编码设备可以推导用于当前块的残差样本(S900)。更具体地,编码设备的减法器231可以推导当前块的残差样本。
根据实施方式的编码设备可以通过对当前块的残差样本进行变换来推导当前块的变换系数(S910)。更具体地,编码设备的变换器232可以通过对当前块的残差样本进行变换来推导当前块的变换系数。
根据实施方式的编码设备可以基于量化处理从变换系数推导量化变换系数(S920)。更具体地,编码设备的量化器233可以基于量化处理从变换系数推导量化变换系数。
根据实施方式的编码设备可以对包括关于量化变换系数的信息的残差信息进行编码(S930)。更具体地,编码设备的熵编码器240可以对包括关于量化变换系数的信息的残差信息进行编码。
在实施方式中,当前块可以代表当前变换块(TB或TU)或当前编码块(CB或CU)。
在实施方式中,当前块的每个变换系数可以与包括变换系数0的高频变换系数区域或包括至少一个有效变换系数的低频变换系数区域有关。
在实施方式中,可以对当前块的变换系数当中与低频变换系数区域有关的变换系数执行变换系数扫描。
在实施方式中,残差信息可以包括指示当前块中子块的变换系数的变换系数级别是否全部为0的编码子块标志,并且该子块可以与低频变换系数区域有关。在实施方式中,编码子块标志可以被写为coded_sub_block_flag。
在实施方式中,可以不对与高频变换系数区域有关的变换系数执行变换系数扫描。
在实施方式中,低频变换系数区域的宽度或低频变换系数区域的高度可以等于或小于32。
在实施方式中,可以基于对当前块的宽度小于32的确定,将低频变换系数区域的宽度确定为与当前块的宽度相同。可以基于对当前块的高度小于32的确定,将低频变换系数区域的高度确定为与当前块的高度相同。可以基于对当前块的宽度等于或大于32的确定,将低频变换系数区域的宽度确定为32。可以基于对当前块的高度等于或大于32的确定,将低频变换系数区域的高度确定为32。
在实施方式中,可以基于下式5来确定低频变换系数区域的宽度和低频变换系数区域的高度:
[式5]
log2(ZoTbWidth)=Min(log2(TbWidth),5)
log2(ZoTbHeight)=Min(log2(TbHeight),5)
在式5中,ZoTbWidth可以表示低频变换系数区域的宽度;ZoTbHeight可以表示低频变换系数区域的高度;TbWidth可以表示当前块的宽度;并且TbHeight可以表示当前块的高度。
在实施方式中,归零可以应用于与高频变换系数区域有关的变换系数,并且可以基于低频变换系数区域的宽度或低频变换系数区域的高度来确定已经应用归零的变换系数的数量。
根据图9和图10的编码设备及编码设备的操作方法,编码设备可以推导当前块的残差样本(S900),通过对当前块的残差样本进行变换来推导当前块的变换系数(S910),基于量化处理从变换系数推导量化变换系数(S920),并且对包括关于量化变换系数的信息的残差信息进行编码(S930),其中,当前块的每个变换系数可以与包括变换系数0的高频变换系数区域或包括至少一个有效变换系数的低频变换系数区域有关,并且可以对当前块的变换系数当中的与低频变换系数区域有关的变换系数执行变换系数扫描。即,可以通过省略对与应用了高频归零的区域有关的变换系数组的变换系数扫描并且省略该变换系数组的编码子块标志的信令来提高图像编码效率。
图11是示出了根据实施方式的解码设备的操作的流程图,并且图12是示出根据实施方式的解码设备的配置的框图。
在图11中公开的每个步骤可以由图3中公开的解码设备300来执行。更具体地,S1100和S1110可以由图3中公开的熵解码器310执行;S1120可以由图3中公开的解量化器322执行;S1130可以由图3中公开的逆变换器322执行;并且S1140可以由图3中公开的加法器340执行。此外,根据S1100至S1140的操作是基于以上在图4至图8b中描述的一些内容的。因此,将省略或简要进行对与以上在图3至图8b中描述的内容重复的特定内容的说明。
如图12所示,根据实施方式的解码设备可以包括熵解码器310、解量化器321、逆变换器322和加法器340。然而,根据情况,可能发生并非图12中所示的所有组件都是解码设备的必要组件,并且解码设备可以由比图12所示的组件更多或更少的组件来体现。
在根据实施方式的解码设备中,熵解码器310、解量化器321、逆变换器322和加法器340中的每一个可以由单独芯片实现,或者至少两个或更多个组件可以通过单个芯片实现。
根据实施方式的解码设备可以接收包括残差信息的比特流(S1100)。更具体地,解码设备的熵解码器310可以接收包括残差信息的比特流。
根据实施方式的解码设备可以基于比特流中包括的残差信息来推导当前块的量化变换系数(S1110)。更具体地,解码设备的熵解码器310可以基于比特流中包括的残差信息来推导当前块的量化变换系数。
根据实施方式的解码设备可以基于解量化处理从量化变换系数推导变换系数(S1120)。更具体地,解码设备的解量化器321可以基于解量化处理从量化变换系数推导变换系数。
根据实施方式的解码设备可以通过将逆变换应用于推导的变换系数来推导当前块的残差样本(S1130)。更具体地,解码设备的逆变换器322可以通过将逆变换应用于推导的变换系数来推导当前块的残差样本。
根据实施方式的解码设备可以基于当前块的残差样本来生成重构图片(S1140)。更具体地,解码设备的加法器340可以基于当前块的残差样本来生成重构图片。
在示例中,当前块的单位可以是变换块TB。在实施方式中,当前块的单位可以是编码块(CB)。
在实施方式中,当前块的每个变换系数可以与包括变换系数0的高频变换系数区域或包括至少一个有效变换系数的低频变换系数区域有关。
在实施方式中,可以对当前块的变换系数当中的与低频变换系数区域有关的变换系数执行变换系数扫描。
在实施方式中,残差信息可以包括指示当前块中的子块的变换系数的变换系数级别是否全部为0的编码子块标志,并且该子块可以与低频变换系数区域有关。在实施方式中,编码子块标志可以被写为coded_sub_block_flag。
在实施方式中,可以不对与高频变换系数区域有关的变换系数执行变换系数扫描。
在实施方式中,低频变换系数区域的宽度或低频变换系数区域的高度可以等于或小于32。
在实施方式中,可以基于对当前块的宽度小于32的确定,将低频变换系数区域的宽度确定为与当前块的宽度相同。可以基于对当前块的高度小于32的确定,将低频变换系数区域的高度确定为与当前块的高度相同。可以基于对当前块的宽度等于或大于32的确定,将低频变换系数区域的宽度确定为32。可以基于对当前块的高度等于或大于32的确定,将低频变换系数区域的高度确定为32。
在实施方式中,可以基于下式6来确定低频变换系数区域的宽度和低频变换系数区域的高度:
[式6]
log2(ZoTbWidth)=Min(log2(TbWidth),5)
log2(ZoTbHeight)=Min(log2(TbHeight),5)
在式6中,ZoTbWidth可以表示低频变换系数区域的宽度;ZoTbHeight可以表示低频变换系数区域的高度;TbWidth可以表示当前块的宽度;而TbHeight可以表示当前块的高度。
在实施方式中,归零可以应用于与高频变换系数区域有关的变换系数,并且可以基于低频变换系数区域的宽度或低频变换系数区域的高度来确定已经应用了归零的变换系数的数量。
根据图11和图12的解码设备及解码设备的操作方法,解码设备可以接收包括残差信息的比特流(S1100),基于比特流中包括的残差信息来推导当前块的量化变换系数(S1110),基于解量化处理从量化变换系数推导变换系数(S1120),通过将逆变换应用于推导的变换系数来推导当前块的残差样本(S1130),并且基于当前块的残差样本生成重构图片(S1140),其中,当前块的每个变换系数可以与包括变换系数0的高频变换系数区域或者包括至少一个有效变换系数的低频变换系数区域有关,并且可以对当前块的变换系数当中与低频变换系数区域有关的变换系数执行变换系数扫描。即,可以通过省略对与应用了高频归零的区域有关的变换系数组的变换系数扫描并且省略该变换系数组的编码子块标志的信令来提高图像编码效率。
在实施方式中,以上在图4至图10中描述的残差编码处理可以基于以下英语说明的内容。
摘要
在该提议中,修改了最后有效系数位置的二值化以减少上下文编码的bin的最大数量。具体来说,在最坏情况下,大块(即64×64、64×N、N×64)的上下文编码的bin的数量从11减少到9。实验结果表明,与全部帧内配置中的VTM3.0相比,对Y、Cb和Cr分量分别为0.01%、0%和-0.02%的BD率降低,并且在随机访问配置中为0.01%、-0.01%和-0.01%的BD率降低。
1简介
已知,大块分区通常呈现较少的残差,并且能量更多地集中在变换域中的低频系数中。在VTM3.0[1]中,对于尺寸(宽度或高度,或者宽度和高度二者)等于64的变换块,高频变换系数被置零。因此,对于其中W指示块宽度并且H指示块高度的W×H变换块,仅保留左上侧(W==64?32:W)×(H==64?32:H)变换系数。
在[1]中,使用cMax=(log2TbSize<<1)–1的截断莱斯二值化,对前缀last_sig_coeff_x_prefix和last_sig_coeff_y_prefix二者进行上下文编码。这里,如果要解析的语法元素为last_sig_coeff_x_prefix,则log2TbSize被设置为等于log2TbWidth,否则log2TbSize被设置为等于log2TbHeight。即,最大可能的幅度由变换块的宽度或高度确定。在最坏情况下,使用上下文建模的bin的数量等于11。表7示出了VTM3.0中W=64或H=64的二值化,其中X表示0或1。
[表7]
Figure BDA0003822431730000401
2.提议的方法。该贡献是在JVET-M0250[2]上提出的。在所提出的方法中,检查当前系数组是否属于高频归零区域。使用该信息,可以跳过用于高频归零区域的不必要的coded_sub_block_flag(CSBF)编码。
在一个实施方式中,可以提出考虑高频归零区域的CSBF编码方法。如果满足用于最后系数组或第一系数组的第一条件,则CSBF的值可以被推断为1。如果不满足用于最后系数组或第一系数组的第一条件,则检查关于高频归零区域的第二条件。如果满足用于高频归零区域的第二条件,则不存在CSBF编码。如果不满足用于高频归零的第二条件,则推导上下文索引并执行CSBF编码。
针对大块尺寸变换,提出了最后位置编码方案。与VTM3.0相比,在最坏情况下,提出的编码方案使用较少的上下文编码的bin。所提出的方案中的码字仍然以截断莱斯码开始,然后是固定长度的码。在高频归零之后,对于W×H变换块,仅保留左上侧的min(W,32)×min(H,32)的变换系数。因此,前缀last_sig_coeff_x_prefix或last_sig_coeff_y_prefix的最大可能码字长度被推导为:
cMax=(min(log2TbSize,5)<<1)–1。
表8示出了W=64或H=64的二值化,其中X表示0或1。这里,强调不同的部分。
[表8]
Figure BDA0003822431730000411
[表9]
Figure BDA0003822431730000421
表9示出了当W=64或H=64和VTM3.0时,前缀(上下文编码的bin)的码字长度的比较。在所提出的方法中,上下文编码的bin可以长达9个,而在VTM3.0中则长达11个bin。注意,当最后位置分量的幅度在24-31的范围内时,上下文编码的bin的数量从10减少到9.3。实验结果
所提出的方法已在VTM3.0软件上实现。按照JVET-L1010[3]中定义的常见测试条件进行了仿真。在每种情况下,锚点是VTM3.0软件。编码时间和解码时间来自交叉检查结果[4]。表10示出了全部帧内(AI)测试条件的实验结果;锚点是VTM3.0。
[表10]
Figure BDA0003822431730000431
表11示出了随机访问(RA)测试条件的实验结果;锚点是VTM3.0。
[表11]
Figure BDA0003822431730000441
4.参考文献[1]Bross,et al.,“Versatile Video Coding(Draft 3),”JointVideo Exploration Team(JVET)of ITU-T SG 16 WP 3 and ISO/IEC JTC1/SC 29/WG 11JVET-L1001,12th meeting,Macao,CN,3-12Oct.2018(B.Bross等人,“多功能视频编码(草案3)”,ITU-T SG 16 WP 3和ISO/IEC JTC1/SC 29/WG 11的联合视频探索小组(JVET)JVET-L1001,第十二次会议,中国澳门,2018年10月3日至12日)。
[2]J.Choi,et al.,“Non-CE7:Simplified CSBF coding for large block-sizetransforms,”Joint Video Exploration Team(JVET)of ITU-T SG 16 WP 3 and ISO/IECJTC1/SC 29/WG 11 JVET-M0250,13th meeting,Marrakech,MA,9-18 Jan.2019(J.Choi等人,“Non-CE7:用于大块尺寸变换的简化CSBF编码”,ITU-T SG 16 WP 3和ISO/IEC JTC1/SC29/WG 11的联合视频探索小组(JVET)JVET-M0250,第13次会议,马萨诸塞州马拉喀什,2019年1月9日至18日)。
[3]F.Bossen,et al.,“JVET common test conditions and softwarereference configurations for SDR video”Joint Video Exploration Team(JVET)ofITU-T SG 16 WP 3 and ISO/IEC JTC1/SC 29/WG 11 JVET-L1010,12th Meeting,Macao,CN,3-12 Oct.2018(F.Bossen等人,“SDR视频的JVET常见测试条件和软件参考配置”,ITU-TSG 16WP 3和ISO/IEC JTC1/SC 29/WG 11联合视频探索小组(JVET)JVET-L1010,第十二次会议,中国澳门,2018年10月3日至12日)。
[4]H.Schwarz,“Crosscheck of JVET-M0251(Non-CE7:Last position codingfor large block-size transforms),”Joint Video Exploration Team(JVET)of ITU-TSG 16 WP 3 and ISO/IEC JTC1/SC 29/WG 11 JVET-M0646,13th meeting,Marrakech,MA,9-18 Jan.2019(H.Schwarz,“JVET-M0251的交叉检查(非CE7:大块尺寸变换的最后位置编码)”,ITU-T SG 16 WP 3和ISO/IEC JTC1/SC 29/WG 11的联合视频探索小组(JVET)JVET-M0646,第13次会议,马萨诸塞州马拉喀什,2019年1月9日至18日)。
5.专利权声明
LG电子公司可以拥有与本贡献中所描述的技术有关的当前或正在申请的专利权,并且以互惠为条件,准备为实施最终的ITU-T建议书|ISO/IEC国际标准(按ITU-T/ITU-R/ISO/IEC专利声明和许可声明表的第2框)而根据合理和非歧视性条款来给予许可。
6.说明
[表12]
Figure BDA0003822431730000461
Figure BDA0003822431730000471
Figure BDA0003822431730000481
Figure BDA0003822431730000491
Figure BDA0003822431730000501
Figure BDA0003822431730000511
last_sig_coeff_x_prefix指定了在变换块内按照扫描顺序的最后有效系数的列位置的前缀。last_sig_coeff_x_prefix的值应在0到(Min(log2TbWidth,5)<<1)-1的范围(包含端点)内。last_sig_coeff_y_prefix指定了在变换块内按扫描顺序的最后有效系数的行位置的前缀。last_sig_coeff_y_prefix的值应在0到(Min(log2TbHeight,5)<<1)-1的范围(包含端点)内。
下表13示出了语法元素和关联的二值化。
[表13]
Figure BDA0003822431730000521
Figure BDA0003822431730000531
在上述实施方式中,基于借助于一系列步骤或框的流程图描述了方法,但是本公开不限于步骤的顺序,并且一些步骤可以以不同的顺序发生或与除以上描述的步骤之外的其他步骤同时发生。此外,本领域普通技术人员可以理解,流程图中示出的步骤不是排他的,并且在不影响本公开范围的情况下,另一步骤可以合并到流程图中或者可以从流程图中删除一个或更多个步骤。
根据本公开的前述方法可以实现为软件形式,并且根据本公开的编码设备和/或解码设备可以被包括在例如TV、计算机、智能手机、机顶盒和显示装置的用于执行图像处理的设备中。
在本公开中,当实施方式由软件体现时,上述方法可以用执行上述功能的模块(处理、功能等)来实施。模块可以存储在存储器中并且可以由处理器执行。存储器可以在处理器内部或外部,并且可以经由公知的各种方式连接到处理器。处理器可以包括专用集成电路(ASIC)、不同的芯片组、逻辑电路和/或数据处理器。存储器可以包括只读存储器(ROM)、随机存取存储器(RAM)、闪存、存储卡、存储介质和/或另一存储装置。即,本公开中描述的实施方式可以在处理器、微处理器、控制器或芯片上体现和执行。例如,每个附图中所示的功能单元可以在处理器、微处理器、控制器或芯片上体现和执行。在这种情况下,用于实施方式的信息(例如,关于指令的信息)或算法可以存储在数字存储介质中。
此外,应用了本公开的解码设备和编码设备可以被包括在多媒体广播收发器、移动通信终端、家庭影院视频装置、数字影院视频装置、监控相机、视频聊天装置、诸如视频通信之类的实时通信装置、移动流装置、存储介质、便携式摄像机、视频点播(VoD)服务提供装置、顶置(OTT)视频装置、互联网流服务提供装置、三维(3D)视频装置、虚拟现实(VR)装置、增强现实(AR)装置、视频电话视频装置、运输工具终端(例如,车辆(包括自主驾驶车辆)终端、飞行器终端、轮船终端等)以及医疗视频装置中,并且可以用于处理视频信号或数据信号。例如,顶置(OTT)视频装置可以包括游戏机、蓝光播放器、互联网接入TV、家庭影院系统、智能电话、平板PC、数字视频记录仪(DVR)等。
另外,应用本公开的处理方法可以以计算机执行的程序的形式产生,并且可以存储在计算机可读记录介质中。根据本公开的具有数据结构的多媒体数据也可以存储在计算机可读记录介质中。计算机可读记录介质包括其中存储计算机可读数据的所有类型的存储装置和分布式存储装置。计算机可读记录介质可以包括例如蓝光盘(BD)、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。此外,计算机可读记录介质包括以载波(例如,经由互联网的传输)形式实现的介质。此外,通过编码方法生成的比特流可以存储在计算机可读记录介质中或通过有线/无线通信网络来传输。
另外,本公开的示例可以通过程序代码体现为计算机程序产品,并且可以按照本公开的实施方式在计算机中执行程序代码。程序代码可以存储在计算机可读载体上。
图13表示可以应用本文件的公开内容的内容流系统的示例。
参照图13,应用了本公开的内容流系统可以主要包括编码服务器、流服务器、网络服务器、媒体存储器、用户装置和多媒体输入装置。
编码服务器用于将从例如智能电话、相机、便携式摄像机等的多媒体输入装置输入的内容压缩为数字数据以生成比特流,并向流服务器发送该比特流。作为另一示例,在智能电话、相机、便携式摄像机等直接生成比特流的情况下,可以省略编码服务器。
可以通过应用了本公开的编码方法或比特流生成方法来生成比特流。并且,流服务器可以在发送或接收比特流的处理中临时存储比特流。
流服务器基于用户的请求通过网络服务器向用户设备发送多媒体数据,该网络服务器起到通知用户存在哪些服务的器的作用。当用户请求他或她想要的服务时,网络服务器将其传送给流服务器,并且流服务器向用户发送多媒体数据。就此而言,内容流系统可以包括单独的控制服务器,并且在这种情况下,控制服务器起到控制内容流系统中的各个设备之间的命令/响应的作用。
流服务器可以从媒体存储器和/或编码服务器接收内容。例如,在从编码服务器接收内容的情况下,可以实时接收内容。在这种情况下,流服务器可以存储比特流达预定时间段以平稳地提供流服务。
例如,用户设备可以包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航仪、触屏PC、平板PC、超级本、可穿戴装置(例如,手表型终端(智能手表)、眼镜型终端(智能眼镜)、头戴式显示器(HMD))、数字TV、台式计算机、数字标牌等。
内容流系统中的每一个服务器可以作为分布式服务器来操作,并且在这种情况下,可以对每个服务器接收的数据进行分布式处理。

Claims (6)

1.一种由解码设备执行的图像解码方法,该图像解码方法包括以下步骤:
接收包括残差信息的比特流;
基于所述残差信息,推导当前块的变换系数;
基于逆变换从所述变换系数推导所述当前块的残差样本;以及
基于所述当前块的所述残差样本生成重构图片,
其中,所述当前块包括高频置零区域和低频变换系数区域,所述低频变换系数区域包括至少一个有效变换系数,并且所述高频置零区域是所述当前块中的所述低频变换系数区域之外的区域,
其中,所述低频变换系数区域中的变换系数被扫描并且所述高频置零区域中的变换系数的扫描被旁路,
其中,所述残差信息包括与所述当前块的最后有效系数的位置的x分量有关的last_sig_coeff_x_prefix语法元素和与所述当前块的所述最后有效系数的所述位置的y分量有关的last_sig_coeff_y_prefix语法元素,
其中,所述last_sig_coeff_x_prefix语法元素是基于截断莱斯二值化的,
其中,所述last_sig_coeff_y_prefix语法元素是基于所述截断莱斯二值化的,
其中,基于所述当前块的宽度和高度二者等于64,
所述低频变换系数区域的宽度被确定为32,
所述last_sig_coeff_x_prefix语法元素的码字的最大长度基于所述低频变换系数区域的所述宽度而被确定为9,
对于值为24到31之一的所述最后有效系数的所述位置的x分量,所述last_sig_coeff_x_prefix语法元素的所述码字为“111111111”,
所述低频变换系数区域的高度被确定为32,
所述last_sig_coeff_y_prefix语法元素的码字的最大长度基于所述低频变换系数区域的所述高度而被确定为9,
对于值为24到31之一的所述最后有效系数的位置的y分量,所述last_sig_coeff_y_prefix语法元素的所述码字为“111111111”,
其中,在所述低频变换系数区域内基于对角线方向来执行变换系数子块扫描,并且
其中,对于所述当前块,位于所述低频变换系数区域外部的子块的编码子块标志不被包括在所述残差信息中。
2.根据权利要求1所述的图像解码方法,其中,各自具有4×4尺寸的子块位于所述低频变换系数区域中。
3.一种由编码设备进行的图像编码方法,该图像编码方法包括以下步骤:
推导当前块的残差样本;
基于所述当前块的所述残差样本推导所述当前块的变换系数;
对与所述变换系数有关的残差信息进行编码,
其中,所述当前块包括高频置零区域和低频变换系数区域,所述低频变换系数区域包括至少一个有效变换系数,并且所述高频置零区域是所述当前块中的所述低频变换系数区域之外的区域,
其中,所述低频变换系数区域中的变换系数被扫描并且所述高频置零区域中的变换系数的扫描被旁路,
其中,所述残差信息包括与所述当前块的最后有效系数的位置的x分量有关的last_sig_coeff_x_prefix语法元素和与所述当前块的所述最后有效系数的所述位置的y分量有关的last_sig_coeff_y_prefix语法元素,
其中,所述last_sig_coeff_x_prefix语法元素是基于截断莱斯二值化的,
其中,所述last_sig_coeff_y_prefix语法元素是基于所述截断莱斯二值化的,
其中,基于所述当前块的宽度和高度二者等于64,
所述低频变换系数区域的宽度被确定为32,
所述last_sig_coeff_x_prefix语法元素的码字的最大长度基于所述低频变换系数区域的所述宽度而被确定为9,
对于值为24到31之一的所述最后有效系数的所述位置的x分量,所述last_sig_coeff_x_prefix语法元素的所述码字为“111111111”,
所述低频变换系数区域的高度被确定为32,
所述last_sig_coeff_y_prefix语法元素的码字的最大长度基于所述低频变换系数区域的所述高度而被确定为9,
对于值为24到31之一的所述最后有效系数的所述位置的y分量,所述last_sig_coeff_y_prefix语法元素的所述码字为“111111111”,
其中,在所述低频变换系数区域内基于对角线方向来执行变换系数子块扫描,并且
其中,对于所述当前块,位于所述低频变换系数区域外部的子块的编码子块标志不被包括在所述残差信息中。
4.根据权利要求3所述的图像编码方法,其中,各自具有4×4尺寸的子块位于所述低频变换系数区域中。
5.一种用于发送包括图像的比特流的数据的方法,所述方法包括:
获得所述图像的所述比特流,其中,所述比特流是通过以下步骤生成的:推导当前块的残差样本;基于所述当前块的所述残差样本推导所述当前块的变换系数;对与所述变换系数有关的残差信息进行编码以生成所述比特流,以及
发送包括所述比特流的所述数据,
其中,所述当前块包括高频置零区域和低频变换系数区域,所述低频变换系数区域包括至少一个有效变换系数,并且所述高频置零区域是所述当前块中的所述低频变换系数区域之外的区域,
其中,所述低频变换系数区域中的变换系数被扫描并且所述高频置零区域中的变换系数的扫描被旁路,
其中,所述残差信息包括与所述当前块的最后有效系数的位置的x分量有关的last_sig_coeff_x_prefix语法元素和与所述当前块的所述最后有效系数的所述位置的y分量有关的last_sig_coeff_y_prefix语法元素,
其中,所述last_sig_coeff_x_prefix语法元素是基于截断莱斯二值化的,
其中,所述last_sig_coeff_y_prefix语法元素是基于所述截断莱斯二值化的,
其中,基于所述当前块的宽度和高度二者等于64,
所述低频变换系数区域的宽度被确定为32,
所述last_sig_coeff_x_prefix语法元素的码字的最大长度基于所述低频变换系数区域的所述宽度而被确定为9,
对于值为24到31之一的所述最后有效系数的所述位置的x分量,所述last_sig_coeff_x_prefix语法元素的所述码字为“111111111”,
所述低频变换系数区域的高度被确定为32,
所述last_sig_coeff_y_prefix语法元素的码字的最大长度基于所述低频变换系数区域的所述高度而被确定为9,
对于值为24到31之一的所述最后有效系数的所述位置的y分量,所述last_sig_coeff_y_prefix语法元素的所述码字为“111111111”,
其中,在所述低频变换系数区域内基于对角线方向来执行变换系数子块扫描,并且
其中,对于所述当前块,位于所述低频变换系数区域外部的子块的编码子块标志不被包括在所述残差信息中。
6.根据权利要求5所述的方法,其中,各自具有4×4尺寸的子块位于所述低频变换系数区域中。
CN202211046061.2A 2018-12-17 2019-12-13 图像编码/解码方法及发送数据的方法 Active CN115426495B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211046061.2A CN115426495B (zh) 2018-12-17 2019-12-13 图像编码/解码方法及发送数据的方法

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201862780925P 2018-12-17 2018-12-17
US62/780,925 2018-12-17
US201962792826P 2019-01-15 2019-01-15
US62/792,826 2019-01-15
CN202211046061.2A CN115426495B (zh) 2018-12-17 2019-12-13 图像编码/解码方法及发送数据的方法
PCT/KR2019/017723 WO2020130514A1 (ko) 2018-12-17 2019-12-13 고주파 제로잉을 기반으로 변환 계수 스캔 순서를 결정하는 방법 및 장치
CN201980006034.2A CN111587575B (zh) 2018-12-17 2019-12-13 基于高频归零确定变换系数扫描顺序的方法及其设备

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201980006034.2A Division CN111587575B (zh) 2018-12-17 2019-12-13 基于高频归零确定变换系数扫描顺序的方法及其设备

Publications (2)

Publication Number Publication Date
CN115426495A true CN115426495A (zh) 2022-12-02
CN115426495B CN115426495B (zh) 2024-05-28

Family

ID=71102256

Family Applications (3)

Application Number Title Priority Date Filing Date
CN202211053759.7A Active CN115442608B (zh) 2018-12-17 2019-12-13 图像编码/解码方法及发送数据的方法
CN201980006034.2A Active CN111587575B (zh) 2018-12-17 2019-12-13 基于高频归零确定变换系数扫描顺序的方法及其设备
CN202211046061.2A Active CN115426495B (zh) 2018-12-17 2019-12-13 图像编码/解码方法及发送数据的方法

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN202211053759.7A Active CN115442608B (zh) 2018-12-17 2019-12-13 图像编码/解码方法及发送数据的方法
CN201980006034.2A Active CN111587575B (zh) 2018-12-17 2019-12-13 基于高频归零确定变换系数扫描顺序的方法及其设备

Country Status (6)

Country Link
US (2) US11838512B2 (zh)
EP (1) EP3700206A4 (zh)
JP (1) JP2021510943A (zh)
KR (4) KR20230154085A (zh)
CN (3) CN115442608B (zh)
WO (1) WO2020130514A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114742950B (zh) * 2022-04-19 2024-02-02 上海海事大学 船舶外形3d数字重构方法、装置、存储介质及电子设备

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110046016A (ko) * 2009-10-28 2011-05-04 삼성전자주식회사 레지듀얼 블록의 부호화 방법 및 장치, 복호화 방법 및 장치
CN102231830A (zh) * 2010-11-23 2011-11-02 浙江大学 用于上下文算术编解码的运算单元
US20130058407A1 (en) * 2011-03-08 2013-03-07 Qualcomm Incorporated Coding of transform coefficients for video coding
US20130230098A1 (en) * 2010-10-06 2013-09-05 Jinhan Song Method and apparatus for encoding frequency transformed block using frequency mask table, and method and apparatus for encoding/decoding video using same
CN104272735A (zh) * 2013-01-16 2015-01-07 黑莓有限公司 针对视频的上下文自适应二进制熵编码的变换系数编码
US20150063443A1 (en) * 2013-08-30 2015-03-05 Fujitsu Limited Quantization method, coding apparatus, and computer-readable recording medium storing quantization program
US20150078432A1 (en) * 2013-09-19 2015-03-19 Blackberry Limited Coding position data for the last non-zero transform coefficient in a coefficient group
US20150181237A1 (en) * 2012-06-22 2015-06-25 Sharp Kabushiki Kaisha Arithmetic decoding device, arithmetic coding device, image decoding apparatus, and image coding apparatus
KR20160088085A (ko) * 2015-01-15 2016-07-25 한국전자통신연구원 고속 변환 계수 부호화 방법 및 장치
US20160219290A1 (en) * 2015-01-26 2016-07-28 Qualcomm Incorporated Enhanced multiple transforms for prediction residual
CN106331715A (zh) * 2016-08-24 2017-01-11 上海富瀚微电子股份有限公司 基于视频压缩编码标准h.265的熵编码系统及其编码方法
US20170064336A1 (en) * 2015-09-01 2017-03-02 Qualcomm Incorporated Coefficient level coding in video coding
CN107835432A (zh) * 2011-06-28 2018-03-23 三星电子株式会社 对视频编码的方法和设备以及对视频解码的方法和设备
US20180098081A1 (en) * 2016-10-01 2018-04-05 Qualcomm Incorporated Transform selection for video coding
CN107959857A (zh) * 2011-10-18 2018-04-24 株式会社Kt 视频信号解码方法
CN108235013A (zh) * 2018-01-22 2018-06-29 合肥工业大学 一种基于hevc的低周期cabac解码器及其解码方法
US20180288409A1 (en) * 2015-09-30 2018-10-04 Lg Electronics Inc. Method and device for coding residual signal in video coding system
WO2018190594A1 (ko) * 2017-04-13 2018-10-18 엘지전자(주) 비디오 신호를 엔트로피 인코딩, 디코딩하는 방법 및 장치

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6226327B1 (en) * 1992-06-29 2001-05-01 Sony Corporation Video coding method and apparatus which select between frame-based and field-based predictive modes
JP3732867B2 (ja) * 1995-03-09 2006-01-11 株式会社ルネサステクノロジ 画像伸張装置
FR2830157A1 (fr) * 2001-09-25 2003-03-28 Koninkl Philips Electronics Nv Procede de conversion de donnees video codees
US7760808B2 (en) * 2005-06-21 2010-07-20 Nokia Corporation Image processing of DCT-based video sequences in compressed domain
CN101133649B (zh) * 2005-12-07 2010-08-25 索尼株式会社 编码装置、编码方法以及解码装置、解码方法
RU2011122801A (ru) * 2008-11-07 2012-12-20 Мицубиси Электрик Корпорейшн Кодер изображения и декодер изображения
US8913666B2 (en) * 2010-10-01 2014-12-16 Qualcomm Incorporated Entropy coding coefficients using a joint context model
US9288496B2 (en) * 2010-12-03 2016-03-15 Qualcomm Incorporated Video coding using function-based scan order for transform coefficients
US8976861B2 (en) * 2010-12-03 2015-03-10 Qualcomm Incorporated Separately coding the position of a last significant coefficient of a video block in video coding
KR101763113B1 (ko) * 2010-12-06 2017-08-01 에스케이 텔레콤주식회사 노이즈성분을 위한 공간영역에서의 영상 부호화/복호화 방법 및 장치
US9706214B2 (en) * 2010-12-24 2017-07-11 Microsoft Technology Licensing, Llc Image and video decoding implementations
US9167253B2 (en) * 2011-06-28 2015-10-20 Qualcomm Incorporated Derivation of the position in scan order of the last significant transform coefficient in video coding
KR101955374B1 (ko) * 2011-06-30 2019-05-31 에스케이 텔레콤주식회사 고속 코딩 단위(Coding Unit) 모드 결정을 통한 부호화/복호화 방법 및 장치
KR101943049B1 (ko) * 2011-06-30 2019-01-29 에스케이텔레콤 주식회사 영상 부호화/복호화 방법 및 장치
AU2011236109B2 (en) * 2011-10-18 2015-02-19 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the significance map for residual coefficients of a transform unit
IN2014CN03598A (zh) * 2011-11-04 2015-07-31 Sharp Kk
US9888261B2 (en) * 2011-11-08 2018-02-06 Samsung Electronics Co., Ltd. Method and device for arithmetic coding of video, and method and device for arithmetic decoding of video
US9357185B2 (en) * 2011-11-08 2016-05-31 Qualcomm Incorporated Context optimization for last significant coefficient position coding
US9565435B2 (en) * 2012-02-04 2017-02-07 Google Technology Holdings LLC Devices and methods for context reduction in last significant coefficient position coding
US10257520B2 (en) * 2012-06-26 2019-04-09 Velos Media, Llc Modified coding for transform skipping
CN108712652A (zh) * 2012-06-29 2018-10-26 韩国电子通信研究院 视频编码方法和计算机可读介质
US9432696B2 (en) * 2014-03-17 2016-08-30 Qualcomm Incorporated Systems and methods for low complexity forward transforms using zeroed-out coefficients
US10284849B2 (en) * 2015-04-13 2019-05-07 Qualcomm Incorporated Quantization parameter (QP) calculation for display stream compression (DSC) based on complexity measure
KR102230264B1 (ko) * 2015-08-28 2021-03-22 삼성전자주식회사 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR101743665B1 (ko) * 2016-02-02 2017-06-05 세종대학교산학협력단 인트라 예측 기반의 비디오 신호 처리 방법 및 장치
CN106162184B (zh) * 2016-07-28 2020-01-10 华为技术有限公司 一种数据块编码方法及装置
CN113873262B (zh) * 2016-10-04 2023-03-24 有限公司B1影像技术研究所 图像数据编码/解码方法和装置
EP3306924A1 (en) * 2016-10-05 2018-04-11 Thomson Licensing Method and device for context-adaptive binary arithmetic coding a sequence of binary symbols representing a syntax element related to picture data
KR20180096194A (ko) * 2017-02-20 2018-08-29 한국전자통신연구원 변환 계수 부호화 및 복호화 장치와 이를 구비하는 부호화 장치 및 복호화 장치
JP2018182444A (ja) * 2017-04-07 2018-11-15 株式会社Jvcケンウッド 画像符号化装置、画像符号化方法及び画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム
CN108810552B (zh) * 2017-04-28 2021-11-09 华为技术有限公司 图像预测方法和相关产品
CN107580224B (zh) * 2017-08-08 2019-11-22 西安理工大学 一种面向hevc熵编码的自适应扫描方法
US11051036B2 (en) * 2018-07-14 2021-06-29 Mediatek Inc. Method and apparatus of constrained overlapped block motion compensation in video coding
US11039139B2 (en) * 2018-09-14 2021-06-15 Tencent America LLC Method and apparatus for identity transform in multiple transform selection
WO2020101321A1 (ko) * 2018-11-12 2020-05-22 엘지전자 주식회사 고주파 제로잉을 기반으로 변환 계수를 코딩하는 방법 및 그 장치

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110046016A (ko) * 2009-10-28 2011-05-04 삼성전자주식회사 레지듀얼 블록의 부호화 방법 및 장치, 복호화 방법 및 장치
US20130230098A1 (en) * 2010-10-06 2013-09-05 Jinhan Song Method and apparatus for encoding frequency transformed block using frequency mask table, and method and apparatus for encoding/decoding video using same
CN102231830A (zh) * 2010-11-23 2011-11-02 浙江大学 用于上下文算术编解码的运算单元
US20130058407A1 (en) * 2011-03-08 2013-03-07 Qualcomm Incorporated Coding of transform coefficients for video coding
CN107835432A (zh) * 2011-06-28 2018-03-23 三星电子株式会社 对视频编码的方法和设备以及对视频解码的方法和设备
CN107959857A (zh) * 2011-10-18 2018-04-24 株式会社Kt 视频信号解码方法
US20150181237A1 (en) * 2012-06-22 2015-06-25 Sharp Kabushiki Kaisha Arithmetic decoding device, arithmetic coding device, image decoding apparatus, and image coding apparatus
CN104272735A (zh) * 2013-01-16 2015-01-07 黑莓有限公司 针对视频的上下文自适应二进制熵编码的变换系数编码
US20150063443A1 (en) * 2013-08-30 2015-03-05 Fujitsu Limited Quantization method, coding apparatus, and computer-readable recording medium storing quantization program
US20150078432A1 (en) * 2013-09-19 2015-03-19 Blackberry Limited Coding position data for the last non-zero transform coefficient in a coefficient group
KR20160088085A (ko) * 2015-01-15 2016-07-25 한국전자통신연구원 고속 변환 계수 부호화 방법 및 장치
US20160219290A1 (en) * 2015-01-26 2016-07-28 Qualcomm Incorporated Enhanced multiple transforms for prediction residual
US20170064336A1 (en) * 2015-09-01 2017-03-02 Qualcomm Incorporated Coefficient level coding in video coding
US20180288409A1 (en) * 2015-09-30 2018-10-04 Lg Electronics Inc. Method and device for coding residual signal in video coding system
CN106331715A (zh) * 2016-08-24 2017-01-11 上海富瀚微电子股份有限公司 基于视频压缩编码标准h.265的熵编码系统及其编码方法
US20180098081A1 (en) * 2016-10-01 2018-04-05 Qualcomm Incorporated Transform selection for video coding
WO2018190594A1 (ko) * 2017-04-13 2018-10-18 엘지전자(주) 비디오 신호를 엔트로피 인코딩, 디코딩하는 방법 및 장치
CN108235013A (zh) * 2018-01-22 2018-06-29 合肥工业大学 一种基于hevc的低周期cabac解码器及其解码方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
XIN ZHAO等: "CE6: Block size dependent zero-out transform (Test 1.14),JVET-K0083-v1", 《JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 11TH MEETING: LJUBLJANA, SI, 10–18 JULY 2018》, 3 July 2018 (2018-07-03) *

Also Published As

Publication number Publication date
CN115426495B (zh) 2024-05-28
EP3700206A1 (en) 2020-08-26
CN111587575A (zh) 2020-08-25
KR20200078501A (ko) 2020-07-01
JP2021510943A (ja) 2021-04-30
US20240056579A1 (en) 2024-02-15
KR102489599B1 (ko) 2023-01-18
KR20220053051A (ko) 2022-04-28
CN115442608B (zh) 2024-05-24
KR20230154085A (ko) 2023-11-07
KR20230013164A (ko) 2023-01-26
US11838512B2 (en) 2023-12-05
KR102388807B1 (ko) 2022-04-20
EP3700206A4 (en) 2020-11-18
WO2020130514A1 (ko) 2020-06-25
KR102595372B1 (ko) 2023-10-27
CN115442608A (zh) 2022-12-06
CN111587575B (zh) 2022-09-16
US20200252615A1 (en) 2020-08-06

Similar Documents

Publication Publication Date Title
CN114374839B (zh) 图像解码方法、图像编码方法和数据发送方法
US12058326B2 (en) Image decoding method and device using residual information in image coding system
CN118540502A (zh) 图像解码方法、图像编码方法、存储介质和数据发送方法
JP2023158204A (ja) 変換スキップ及びパレットコーディング関連情報のシグナリングベースの映像又はビデオコーディング
US20240056579A1 (en) Method of determining transform coefficient scan order based on high frequency zeroing and apparatus thereof
CN114402605A (zh) 图像编码系统中使用残差编码方法的标志的图像解码方法以及用于其的装置
US11677955B2 (en) Image decoding method for coding residual information on basis of high frequency zeroing in image coding system, and device therefor
EP4277278A1 (en) Transform-based image coding
KR20220002701A (ko) 크로마 양자화 파라미터 테이블을 사용하는 영상 디코딩 방법 및 그 장치
CN113812156A (zh) 在视频编译系统中使用简化的残差数据编译解码视频的方法及其设备
US11632557B2 (en) Method and device for decoding video using residual sign related information in video coding system
CN115428460A (zh) 图像编码系统中残差编码的图像解码方法及用于其的设备
CN114762335A (zh) 基于变换跳过和调色板编码相关数据的图像或视频编码

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant