CN110999304B - 图像处理方法和图像编码/解码方法以及使用图像处理方法和图像编码/解码方法的装置 - Google Patents

图像处理方法和图像编码/解码方法以及使用图像处理方法和图像编码/解码方法的装置 Download PDF

Info

Publication number
CN110999304B
CN110999304B CN201880050380.6A CN201880050380A CN110999304B CN 110999304 B CN110999304 B CN 110999304B CN 201880050380 A CN201880050380 A CN 201880050380A CN 110999304 B CN110999304 B CN 110999304B
Authority
CN
China
Prior art keywords
block
unit
current block
mode
intra
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880050380.6A
Other languages
English (en)
Other versions
CN110999304A (zh
Inventor
李镇浩
姜晶媛
李河贤
林成昶
金晖容
金旲衍
李英烈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Industry Academy Cooperation Foundation of Sejong University
Chips and Media Inc
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Industry Academy Cooperation Foundation of Sejong University
Chips and Media Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI, Industry Academy Cooperation Foundation of Sejong University, Chips and Media Inc filed Critical Electronics and Telecommunications Research Institute ETRI
Priority to CN202311568850.7A priority Critical patent/CN117354514A/zh
Priority to CN202311570502.3A priority patent/CN117395409A/zh
Priority to CN202311568811.7A priority patent/CN117354513A/zh
Priority to CN202311563278.5A priority patent/CN117354512A/zh
Publication of CN110999304A publication Critical patent/CN110999304A/zh
Application granted granted Critical
Publication of CN110999304B publication Critical patent/CN110999304B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Abstract

本发明涉及一种图像编码/解码方法和设备。根据本发明的图像解码方法可包括:从比特流获取邻近块的变换系数分布信息;根据邻近块的变换系数分布信息,方向自适应地确定将被解码的当前块的帧内预测模式;并且基于确定的帧内预测模式重建当前块,其中,方向自适应地确定将被解码的当前块的帧内预测模式的步骤包括:基于邻近块的变换系数分布信息,确定与邻近块对应的相似标志信息。

Description

图像处理方法和图像编码/解码方法以及使用图像处理方法 和图像编码/解码方法的装置
技术领域
本发明涉及一种图像编码/解码方法、图像编码/解码设备以及存储比特流的记录介质。更具体地,本发明涉及一种使用帧内预测的图像编码/解码方法和设备以及存储通过所述图像编码/解码方法和设备生成的比特流的记录介质。
背景技术
数字视频技术可在各种数字视频装置(诸如数字电视、数字直接广播系统、无线广播系统、个人数字助理(PDA)、膝上型或台式计算机、数字相机、数字记录装置、视频游戏装置和视频游戏机)中共同找到其应用。数字视频装置通过使用视频压缩技术(诸如MPEG-2、MPEG-4、ITU-T H.264/MPEG-4、第10部分、高级视频编码(AVC)和H.265/HEVC(高效视频编码))来有效地发送和接收数字视频信息。视频压缩技术涉及空间预测和时间预测,以去除或减少视频序列中存在的固有冗余。
存在各种图像压缩技术,诸如用于从当前画面的先前画面或后续画面预测当前画面内的像素的值的帧间预测、用于从当前画面的另一区域预测当前画面的一区域内的像素的值的帧内预测、以及用于向频繁出现的像素值分配短码并向出现较少的像素值分配长码的熵编码。利用这些图像压缩技术,可有效地压缩、传输和存储视频数据。
为了经济有效地对这些应用中所需的图像的各种分辨率、各种帧速率等进行处理,需要一种能够根据应用中所需的性能和功能容易地对图像进行处理的视频解码设备。
例如,当压缩图像时,首先将画面划分为皆具有预定尺寸的多个块,然后基于每个块执行编码。为了提高压缩效率,将帧间预测技术和帧内预测技术用于消除画面中的冗余。
在这种情况下,可通过帧内预测或帧间预测来生成残差信号。当对残差信号执行编码时,数据量减少,并且因此数据压缩率提高。由于以较高的效率执行预测,因此可获得具有较小值的残差信号。因此,可使用该残差信号执行更有效的预测。
帧内预测技术使用位于当前块周围的像素来预测当前块的数据。当前块中的每个像素的实际值与预测值之间的差被称为残差信号块。对于帧内预测,与现有的支持9种预测模式的H.264/AVC相比,HEVC支持更多数量的预测模式(35种模式)。
对于帧间预测,将当前块与邻近画面中的块进行比较以找到与当前块最相似的块。所定位的块的位置信息(Vx,Vy)被称为运动矢量。当前块中的每个像素与基于运动矢量创建的预测块中的每个像素之间的差被称为残差信号或运动补偿残差块。
以这种方式,提高了帧内预测和帧间预测的精度。结果,在残差信号的数据量减少的同时,用于对运动图像进行处理的计算量大大增加。
具体地,为了更有效的图像压缩,可在现有技术中使用67种帧内预测模式。这些模式包括平面模式、DC模式和65种帧内方向模式,并且可更准确且更精确地对自然图像中的边缘的方向进行处理。
由于这些细分的帧内预测模式,极大地增加了对关于最佳帧内预测模式的信息进行编码所需的比特数,这导致了降低压缩效率的问题。
为了解决这个问题,即,为了减少信息量,可从关于先前已经被解码的其他块的信息推导当前块的最佳帧内模式。
然而,尽管推导用于预测当前块的帧内模式的技术可在某种程度上降低压缩率,但是该技术具有极大地增加用于编码和解码的计算复杂度的问题。
具体地,存在如下问题:在推导当前块的帧内模式期间,首先需要解析其他块的解码值或帧内模式。此外,当需要参考其他块以对当前块进行编码或解码时,解码设备具有先前块的解码处理与当前块的解码处理之间的解析依赖性(parsing dependency)。这不仅增加了计算复杂度,而且在实现设备的模块以及配置数据方面引起困难。
发明内容
技术问题
本发明旨在提供一种能够提高图像质量和压缩效率的图像编码/解码方法和设备。
此外,本发明旨在提供一种通过帧内预测执行图像编码/解码的图像编码/解码方法和设备,所述方法和设备能够提高压缩效率。
此外,本发明旨在提供一种记录介质,其中,所述记录介质存储由图像编码/解码方法或设备生成的比特流。
技术方案
一种根据本发明的对图像进行解码的方法,所述方法可包括:从比特流获取邻近块的变换系数分布信息;根据邻近块的变换系数分布信息,方向自适应地确定将被解码的当前块的帧内预测模式;基于确定的帧内预测模式重建当前块,其中,方向自适应地确定将被解码的当前块的帧内预测模式的步骤包括:基于邻近块的变换系数分布信息,确定与邻近块对应的相似标志信息。
在根据本发明的对图像进行解码的方法中,其中,当邻近块位于当前块的左侧时,相似标志信息包括水平相似标志信息。
在根据本发明的对图像进行解码的方法中,其中,当邻近块位于当前块的上方时,相似标志信息包括垂直相似标志信息。
在根据本发明的对图像进行解码的方法中,其中,方向自适应地确定将被解码的当前块的帧内预测模式的步骤包括:根据相似标志信息,针对当前块的帧内预测模式,对特定方向上的帧内预测模式进行精细划分以增加所述特定方向上的候选模式的数量。
在根据本发明的对图像进行解码的方法中,其中,对特定方向上的帧内预测模式进行精细划分的步骤包括:根据相似标志信息,在预定水平方向范围或预定垂直方向范围中对在当前块中能够使用的帧内预测模式进行划分。
在根据本发明的对图像进行解码的方法中,其中,对特定方向上的帧内预测模式进行精细划分的步骤包括:根据相似标志信息,在针对当前块的最可能模式(MPM)候选列表内对与水平相似标志或垂直相似标志对应的模式进行精细划分;并且将划分得到的模式添加到MPM候选列表。
在根据本发明的对图像进行解码的方法中,还包括:获取邻近块的帧内预测模式信息,其中,方向自适应地确定将被解码的当前块的帧内预测模式的步骤包括:基于邻近块的帧内预测模式信息和变换系数分布信息,确定邻近块的水平相似标志信息或垂直相似标志信息。
在根据本发明的对图像进行解码的方法中,其中,对特定方向上的帧内预测模式进行精细划分的步骤包括:根据相似标志信息将在当前块中能够使用的帧内预测模式限制为水平方向或垂直方向。
一种根据本发明的对图像进行解码的设备,所述设备可包括:邻近块信息处理单元,被配置为从比特流获取邻近块的变换系数分布信息;模式确定单元,被配置为根据邻近块的变换系数分布信息来方向自适应地确定将被解码的当前块的帧内预测模式;以及帧内预测单元,被配置为基于确定的帧内预测模式重建当前块,其中,模式确定单元基于邻近块的变换系数分布信息来确定与邻近块对应的相似标志信息。
在根据本发明的对图像进行解码的设备中,其中,当邻近块位于当前块的左侧时,相似标志信息包括水平相似标志信息。
在根据本发明的对图像进行解码的设备中,其中,当邻近块位于当前块的上方时,相似标志信息包括垂直相似标志信息。
在根据本发明的对图像进行解码的设备中,其中,模式确定单元根据相似标志信息对用于当前块的帧内预测模式的候选模式进行精细划分。
在根据本发明的对图像进行解码的设备中,其中,模式确定单元根据相似标志信息在水平方向或垂直方向上的预定范围内对在当前块中能够使用的帧内预测模式进行精细划分。
在根据本发明的对图像进行解码的设备中,其中,模式确定单元根据相似标志信息在当前块的最可能模式(MPM)候选列表内对与水平相似标志或垂直相似标志对应的模式进行精细划分。
在根据本发明的对图像进行解码的设备中,还包括:邻近模式识别单元,被配置为获得邻近块的帧内预测模式信息,其中,模式确定单元基于邻近块的帧内预测模式信息和变换系数分布信息来确定邻近块的水平相似标志信息或垂直相似标志信息。
在根据本发明的对图像进行解码的设备中,模式确定单元根据相似标志信息将在当前块中能够使用的帧内预测模式限制为水平方向或垂直方向。
一种根据本发明的对图像进行编码的方法,包括:获取关于将被编码的当前块的邻近块的信息;根据关于邻近块的信息,方向自适应地确定将被编码的当前块的帧内预测模式;并且根据确定的帧内预测模式对当前块进行编码。
在根据本发明的对图像进行编码的方法中,其中,方向自适应地确定将被编码的当前块的帧内预测模式的步骤包括:基于邻近块的变换系数分布信息,确定与邻近块对应的相似标志信息。
在根据本发明的对图像进行编码的方法中,其中,根据基于关于邻近块的信息而确定的当前块的方向性信息,确定用于熵编码的查找表。
一种根据本发明的计算机可读记录介质可存储由根据本发明的图像编码方法生成的比特流。
将理解,前述概括的特征是本发明的以下详细描述的示例性方面,而不限制本发明的范围。
有益效果
根据本发明,可提供一种能够提高图像质量和压缩效率的图像编码/解码方法和设备。
此外,根据本发明,可提供一种通过帧内预测执行图像编码/解码的图像编码/解码方法和设备,所述方法和设备能够提高压缩效率。
此外,根据本发明,可提供一种记录介质,其中,所述记录介质存储由图像编码/解码方法或设备生成的比特流。
附图说明
图1是示出应用本发明的一个实施例的编码设备的配置的框图;
图2是示出应用本发明的一个实施例的解码设备的配置的框图;
图3是示出图像的用于图像编码/解码的分区结构的示意图;
图4是示出帧内预测处理的一个实施例的示图;
图5是示出帧间预测处理的一个实施例的示图;
图6是示出变换和量化处理的示图;
图7是示出根据本公开的一个实施例的图像编码设备的配置的框图;
图8至图11是示出根据本公开的一个实施例的将图像分区为块并且基于每个块执行图像处理的方法的示图;
图12是示出根据本公开的一个实施例的在图像编码设备中执行的帧间预测方法的框图;
图13是示出根据本公开的一个实施例的图像解码设备的配置的框图;
图14是示出根据本公开的一个实施例的在图像解码设备中执行的帧间预测处理的框图;
图15是示出根据本公开的另一实施例的将图像分区为块并且基于每个块执行图像处理的方法的示图;
图16是示出根据本公开的另一实施例的将图像分区为块并且基于每个块执行图像处理的方法的示图;
图17是示出根据本公开的一个实施例的通过使用二叉树结构对编码单元进行分区来形成变换单元的方法的一个实施例的示图;
图18是示出根据本公开的一个实施例的将图像分区为块并且基于每个块执行图像处理的方法的另一实施例的示图;
图19和图20是示出根据本公开的一个实施例的将图像分区为块并且基于每个块执行图像处理的方法的其它实施例的示图;
图21和图22是示出通过执行率失真优化(RDO)来确定变换单元的分区结构的方法的示图;
图23是示出根据本公开的一个实施例的用于确定帧内预测模式的帧内预测单元的配置的框图;
图24和图25是示出根据本公开的一个实施例的使用方向自适应帧内预测模式执行帧内预测解码处理的方法的流程图;
图26和图27是示出根据本公开的一个实施例的用于方向自适应帧内模式的水平相似标志和垂直相似标志的流程图;
图28至图31是示出根据本公开的一个实施例的针对某些情况的方向自适应帧内模式的示图;以及
图32至图34是示出根据本公开的一个实施例的使用关于邻近块的信息提高熵编码效率的方法的示图。
具体实施方式
可对本发明做出各种修改,并且存在本发明的各种实施例,其中,现在将参照附图提供所述各种实施例的示例并且将详细描述所述各种实施例的示例。然而,本发明不限于此,尽管示例性实施例可被解释为包括本发明的技术构思和技术范围内的所有修改、等同形式或替换形式也是如此。相似的参考标号指在各方面相同或相似的功能。在附图中,为了清楚起见,元件的形状和尺寸可被夸大。在本发明的以下详细描述中,对通过图示的方式示出可实施本发明的具体实施例的附图进行参照。这些实施例被足够详细地描述以使本领域技术人员能够实施本公开。应该理解,本公开的各种实施例尽管不同,但不必是相互排他的。例如,在不脱离本公开的精神和范围的情况下,这里结合一个实施例描述的特定特征、结构和特性可在其它实施例中被实施。此外,应该理解,在不脱离本公开的精神和范围的情况下,每个公开的实施例内的各个元件的位置或布置可被修改。因此,以下详细描述不应以限制的含义来理解,并且本公开的范围仅由所附权利要求(在合适的解释的情况下,还连同权利要求所要求保护的等同物的全部范围)来限定。
在说明书中使用的术语“第一”、“第二”等可被用于描述各种组件,但这些组件并不被解释为受限于这些术语。这些术语仅被用于将一个组件与其它组件区分开。例如,在不脱离本发明的范围的情况下,“第一”组件可被称为“第二”组件,并且“第二”组件也可类似地被称为“第一”组件。术语“和/或”包括多个项的组合或者是多个项中的任意一项。
将理解的是,在本说明书中,当元件仅被称为“连接到”或“结合到”另一元件而不是“直接连接到”或“直接结合到”另一元件时,所述元件可“直接连接到”或“直接结合到”所述另一元件,或者在所述元件与所述另一元件之间具有其他元件的情况下连接到或结合到所述另一元件。相反,应该理解,当元件被称为“直接结合”或“直接连接”到另一元件时,不存在中间元件。
此外,在本发明的实施例中示出的组成部件被独立地示出,以便呈现彼此不同的特性功能。因此,这并不意味着每个组成部件以单独的硬件或软件的组成单元被组成。换句话说,为了方便,每个组成部件包括枚举的组成部件中的每一个。因此,每个组成部件中的至少两个组成部件可被组合形成一个组成部件,或者一个组成部件可被划分为用于执行每个功能的多个组成部件。在没有脱离本发明的本质的情况下,每个组成部件被组合的实施例以及一个组成部件被划分的实施例也被包括在本发明的范围中。
在本说明书中使用的术语仅用于描述具体实施例,而不旨在限制本发明。以单数使用的表达包括复数表达,除非它在上下文中具有明显不同的含义。在本说明书中,将理解,诸如“包括……的”、“具有……的”等的术语旨在指明存在说明书中所公开的特征、数量、步骤、动作、元件、部件、或其组合,而并不旨在排除可存在或者可添加一个或更多个其它特征、数量、步骤、动作、元件、部件、或其组合的可能性。换句话说,当特定元件被称为“被包括”时,除相应元件以外的元件并不被排除,而是,附加的元件可被包括在本发明的实施例中或者是本发明的范围中。
此外,一些组成元件可能不是执行本发明的必要功能的不可缺的组成元件,而是仅提升其性能的可选组成元件。可通过仅包括用于实施本发明的实质的不可缺的组成部件而排除在提升性能时使用的组成元件来实施本发明。仅包括所述不可缺的组成元件而排除在仅提升性能时使用的可选组成元件的结构也被包括在本发明的范围中。
在下文中,将参照附图详细描述本发明的实施例。在描述本发明的示例性实施例时,将不详细描述公知功能或结构,这是因为它们会不必要地模糊对本发明的理解。附图中的相同的组成元件由相同的参考标号来表示,并且对相同元件的重复描述将被省略。
在下文中,图像可指构成视频的画面,或者可指视频本身。例如,“对图像进行编码或解码或者进行编码和解码两者”可指“对运动画面进行编码或解码或者进行编码和解码两者”,并且可指“对运动画面的图像中的一个图像进行编码或解码或者进行编码和解码两者。”
在下文中,术语“运动画面”和“视频”可被用作相同的含义并且可彼此替换。
在下文中,目标图像可以是作为编码目标的编码目标图像和/或作为解码目标的解码目标图像。此外,目标图像可以是输入到编码设备的输入图像、以及输入到解码设备的输入图像。这里,目标图像可与当前图像具有相同的含义。
在下文中,术语“图像”、“画面”、“帧”和“屏幕”可被用作相同的含义并且彼此替换。
在下文中,目标块可以是作为编码目标的编码目标块和/或作为解码目标的解码目标块。此外,目标块可以是作为当前编码和/或解码的目标的当前块。例如,术语“目标块”和“当前块”可被用作相同的含义并且彼此替换。
在下文中,术语“块”和“单元”可被用作相同的含义并且彼此替换。或者“块”可表示特定单元。
在下文中,术语“区域”和“片段”可彼此替换。
在下文中,特定信号可以是表示特定块的信号。例如,原始信号可以是表示目标块的信号。预测信号可以是表示预测块的信号。残差信号可以是表示残差块的信号。
在实施例中,特定信息、数据、标志、索引、元素和属性等中的每一个可具有值。等于“0”的信息、数据、标志、索引、元素和属性的值可表示逻辑假或第一预定义值。换言之,值“0”、假、逻辑假和第一预定义值可彼此替换。等于“1”的信息、数据、标志、索引、元素和属性的值可表示逻辑真或第二预定义值。换句话说,值“1”、真、逻辑真和第二预定义值可彼此替换。
当变量i或j用于表示列、行或索引时,i的值可以是等于或大于0的整数、或者等于或大于1的整数。也就是说,列、行、索引等可从0开始计数,或者可从1开始计数。
术语描述
编码器:表示执行编码的设备。也就是说,表示编码设备。
解码器:表示执行解码的设备。也就是说,表示解码设备。
块:是M×N的样点阵列。这里,M和N可表示正整数,并且块可表示二维形式的样点阵列。块可指单元。当前块可表示在编码时成为目标的编码目标块,或者在解码时成为目标的解码目标块。此外,当前块可以是编码块、预测块、残差块和变换块中的至少一个。
样点:是构成块的基本单元。根据比特深度(Bd),样点可被表示为从0到2Bd-1的值。在本发明中,样点可被用作像素的含义。也就是说,样点、pel、像素可具有彼此相同的含义。
单元:可指编码和解码单元。当对图像进行编码和解码时,单元可以是通过对单个图像进行分区而生成的区域。此外,当在编码或解码期间将单个图像分区为子划分单元时,单元可表示子划分单元。也就是说,图像可被分区为多个单元。当对图像进行编码和解码时,可执行针对每个单元的预定处理。单个单元可被分区为尺寸小于该单元的尺寸的子单元。依据功能,单元可表示块、宏块、编码树单元、编码树块、编码单元、编码块、预测单元、预测块、残差单元、残差块、变换单元、变换块等。此外,为了将单元与块区分开,单元可包括亮度分量块、与亮度分量块相关联的色度分量块、以及每个颜色分量块的语法元素。单元可具有各种尺寸和形状,具体地,单元的形状可以是二维几何图形,诸如正方形、长方形、梯形、三角形、五边形等。此外,单元信息可包括指示编码单元、预测单元、变换单元等的单元类型以及单元尺寸、单元深度、单元的编码和解码的顺序等中的至少一个。
编码树单元:被配置有亮度分量Y的单个编码树块以及与色度分量Cb和Cr相关的两个编码树块。此外,编码树单元可表示包括块和每个块的语法元素。可通过使用四叉树分区方法、二叉树分区方法和三叉树分区方法中的至少一个对每个编码树单元进行分区,以配置诸如编码单元、预测单元、变换单元等的更低等级的单元。编码树单元可被用作用于指定在对作为输入图像的图像进行编码/解码时成为处理单元的样点块的术语。这里,四叉树可表示四元树。
编码树块:可用作用于指定Y编码树块、Cb编码树块和Cr编码树块中的任意一个的术语。
邻近块:可表示与当前块相邻的块。与当前块相邻的块可表示与当前块的边界接触的块、或者位于距当前块预定距离内的块。邻近块可表示与当前块的顶点相邻的块。这里,与当前块的顶点相邻的块可表示与水平相邻于当前块的邻近块垂直相邻的块、或者与垂直相邻于当前块的邻近块水平相邻的块。
重建的邻近块:可表示与当前块相邻并且已经在空间/时间上被编码或解码的邻近块。这里,重建的邻近块可表示重建的邻近单元。重建的空间邻近块可以是在当前画面内并且已经通过编码或解码或者编码和解码两者而被重建的块。重建的时间邻近块是在参考图像内的与当前画面的当前块对应的位置处的块或所述块的邻近块。
单元深度:可表示单元的分区程度。在树结构中,最高节点(根节点)可与未被分区的第一单元对应。此外,最高节点可具有最小深度值。在这种情况下,最高节点的深度可以为等级0。深度为等级1的节点可表示通过对第一单元进行一次分区而生成的单元。深度为等级2的节点可表示通过对第一单元进行两次分区而生成的单元。深度为等级n的节点可表示通过对第一单元进行n次分区而生成的单元。叶节点可以是最低节点并且是不能被进一步分区的节点。叶节点的深度可以是最大等级。例如,最大等级的预定义值可以是3。根节点的深度可以是最低的,并且叶节点的深度可以是最深的。此外,当单元被表示为树结构时,单元存在于的等级可表示单元深度。
比特流:可表示包括编码图像信息的比特流。
参数集:与比特流内的配置之中的头信息对应。视频参数集、序列参数集、画面参数集和自适应参数集中的至少一个可被包括在参数集中。此外,参数集可包括条带(slice)头和并行块(tile)头信息。
解析:可表示通过执行熵解码来确定语法元素的值,或者可表示熵解码本身。
符号:可表示编码/解码目标单元的语法元素、编码参数和变换系数值中的至少一个。此外,符号可表示熵编码目标或熵解码结果。
预测模式:可以是指示利用帧内预测而被编码/解码的模式或利用帧间预测而被编码/解码的模式的信息。
预测单元:可表示当执行预测(诸如帧间预测、帧内预测、帧间补偿、帧内补偿和运动补偿)时的基本单元。单个预测单元可被分区为具有更小尺寸的多个分区,或者可被分区为多个更低等级的预测单元。多个分区可以是在执行预测或补偿时的基本单元。通过划分预测单元而生成的分区也可以是预测单元。
预测单元分区:可表示通过对预测单元进行分区而获得的形状。
参考画面列表可指包括用于帧间预测或运动补偿的一个或更多个参考画面的列表。存在几种类型的可用参考画面列表,所述可用参考画面列表包括LC(列表组合)、L0(列表0)、L1(列表1)、L2(列表2)、L3(列表3)。
帧间预测指示符可指当前块的帧间预测(单向预测、双向预测等)的方向。可选地,帧间预测指示符可指用于生成当前块的预测块的参考画面的数量。可选地,帧间预测指示符可指在对当前块执行帧间预测或运动补偿时所使用的预测块的数量。
预测列表利用标志指示是否使用特定参考画面列表中的至少一个参考画面来生成预测块。可使用预测列表利用标志来推导帧间预测指示符,并且相反地,可使用帧间预测指示符来推导预测列表利用标志。例如,当预测列表利用标志具有第一值零(0)时,它表示不使用参考画面列表中的参考画面来生成预测块。另一方面,当预测列表利用标志具有第二值一(1)时,它表示使用参考画面列表来生成预测块。
参考画面索引可指指示参考画面列表中的特定参考画面的索引。
参考画面可表示由特定块参考以实现对特定块进行帧间预测或运动补偿的目的的参考画面。可选地,参考画面可以是包括由当前块参考以进行帧间预测或运动补偿的参考块的画面。在下文中,术语“参考画面”和“参考图像”具有相同的含义并且可彼此替换。
运动矢量可以是用于帧间预测或运动补偿的二维矢量。运动矢量可表示编码/解码目标块与参考块之间的偏移。例如,(mvX,mvY)可表示运动矢量。这里,mvX可表示水平分量,并且mvY可表示垂直分量。
搜索范围可以是在帧间预测期间为了检索运动矢量而搜索的二维区域。例如,搜索范围的大小可以是M×N。这里,M和N均为整数。
运动矢量候选可指在对运动矢量进行预测时的预测候选块或预测候选块的运动矢量。此外,运动矢量候选可被包括在运动矢量候选列表中。
运动矢量候选列表可表示由一个或更多个运动矢量候选组成的列表。
运动矢量候选索引可表示在运动矢量候选列表中指示运动矢量候选的指示符。可选地,运动矢量候选索引可以是运动矢量预测因子的索引。
运动信息可表示包括以下项中的至少一项的信息:运动矢量、参考画面索引、帧间预测指示符、预测列表利用标志、参考画面列表信息、参考画面、运动矢量候选、运动矢量候选索引、合并候选和合并索引。
合并候选列表可表示由一个或更多个合并候选组成的列表。
合并候选可表示空间合并候选、时间合并候选、组合合并候选、组合双预测合并候选或零合并候选。合并候选可包括运动信息,诸如帧间预测指示符、针对每个列表的参考画面索引、运动矢量、预测列表利用标志和帧间预测指示符。
合并索引可表示在合并候选列表中指示合并候选的指示符。可选地,合并索引可指示在空间上/时间上与当前块相邻的重建块之中已经推导出合并候选的块。可选地,合并索引可指示合并候选的至少一条运动信息。
变换单元:可表示在对残差信号执行编码/解码(诸如变换、逆变换、量化、反量化、变换系数编码/解码)时的基本单元。单个变换单元可被分区为具有更小尺寸的多个更低等级的变换单元。这里,变换/逆变换可包括第一变换/第一逆变换和第二变换/第二逆变换中的至少一个。
缩放:可表示将量化的等级乘以因子的处理。可通过对量化的等级进行缩放来生成变换系数。缩放也可被称为反量化。
量化参数:可表示当在量化期间使用变换系数来生成量化的等级时使用的值。量化参数还可表示当在反量化期间通过对量化的等级进行缩放来生成变换系数时使用的值。量化参数可以是被映射在量化步长上的值。
增量量化参数:可表示预测的量化参数与编码/解码目标单元的量化参数之间的差值。
扫描:可表示对单元、块或矩阵内的系数进行排序的方法。例如,将系数的二维矩阵改变为一维矩阵可被称为扫描,将系数的一维矩阵改变为二维矩阵可被称为扫描或逆扫描。
变换系数:可表示在编码器中执行变换之后生成的系数值。变换系数可表示在解码器中执行熵解码和反量化中的至少一个之后生成的系数值。通过对变换系数或残差信号进行量化而获得的量化的等级或者量化的变换系数等级也可落入变换系数的含义内。
量化的等级:可表示在编码器中通过对变换系数或残差信号进行量化而生成的值。可选地,量化的等级可表示作为在解码器中将经历反量化的反量化目标的值。类似地,作为变换和量化的结果的量化的变换系数等级也可落入量化的等级的含义内。
非零变换系数:可表示具有除零之外的值的变换系数、或者具有除零之外的值的变换系数等级或量化的等级。
量化矩阵:可表示在被执行以提高主观图像质量或客观图像质量的量化处理或反量化处理中使用的矩阵。量化矩阵也可被称为缩放列表。
量化矩阵系数:可表示量化矩阵内的每个元素。量化矩阵系数也可被称为矩阵系数。
默认矩阵:可表示在编码器或解码器中预先定义的预定量化矩阵。
非默认矩阵:可表示在编码器或解码器中未被预先定义而是由用户用信号发送的量化矩阵。
统计值:针对具有可计算的特定值的变量、编码参数、常量值等之中的至少一个的统计值可以是相应特定值的平均值、加权平均值、加权和值、最小值、最大值、最频繁出现的值、中值、内插值之中的一个或更多个。
图1是示出根据应用了本发明的实施例的编码设备的配置的框图。
编码设备100可以是编码器、视频编码设备或图像编码设备。视频可包括至少一个图像。编码设备100可顺序地对至少一个图像进行编码。
参照图1,编码设备100可包括运动预测单元111、运动补偿单元112、帧内预测单元120、切换器115、减法器125、变换单元130、量化单元140、熵编码单元150、反量化单元160、逆变换单元170、加法器175、滤波器单元180和参考画面缓冲器190。
编码设备100可通过使用帧内模式或帧间模式或者帧内模式和帧间模式两者来对输入图像执行编码。此外,编码设备100可通过对输入图像进行编码来生成包括编码信息的比特流,并输出生成的比特流。生成的比特流可被存储在计算机可读记录介质中,或者可通过有线/无线传输介质被流传输。当帧内模式被用作预测模式时,切换器115可切换到帧内。可选地,当帧间模式被用作预测模式时,切换器115可切换到帧间模式。这里,帧内模式可表示帧内预测模式,帧间模式可表示帧间预测模式。编码设备100可生成针对输入图像的输入块的预测块。此外,编码设备100可在生成预测块之后使用输入块和预测块的残差对残差块进行编码。输入图像可被称为作为当前编码目标的当前图像。输入块可被称为作为当前编码目标的当前块,或者被称为编码目标块。
当预测模式是帧内模式时,帧内预测单元120可使用已被编码/解码并与当前块相邻的块的样点作为参考样点。帧内预测单元120可通过使用参考样点来对当前块执行空间预测,或者通过执行空间预测来生成输入块的预测样点。这里,帧内预测可表示帧内部的预测。
当预测模式是帧间模式时,运动预测单元111可在执行运动预测时从参考图像检索与输入块最匹配的区域,并且通过使用检索到的区域来推导运动矢量。在这种情况下,搜索区域可被用作所述区域。参考图像可被存储在参考画面缓冲器190中。这里,当执行对参考图像的编码/解码时,参考图像可被存储在参考画面缓冲器190中。
运动补偿单元112可通过使用运动矢量对当前块执行运动补偿来生成预测块。这里,帧间预测可表示帧之间的预测或运动补偿。
当运动矢量的值不是整数时,运动预测单元111和运动补偿单元112可通过将插值滤波器应用于参考画面的部分区域来生成预测块。为了对编码单元执行画面间预测或运动补偿,可确定将跳过模式、合并模式、高级运动矢量预测(AMVP)模式和当前画面参考模式之中的哪个模式用于对包括在相应编码单元中的预测单元的运动预测和运动补偿。然后,依据所确定的模式,可不同地执行画面间预测或运动补偿。
减法器125可通过使用输入块和预测块的残差来生成残差块。残差块可被称为残差信号。残差信号可表示原始信号和预测信号之间的差。此外,残差信号可以是通过对原始信号与预测信号之间的差进行变换或量化或者变换和量化而生成的信号。残差块可以是块单元的残差信号。
变换单元130可通过对残差块执行变换来生成变换系数,并输出生成的变换系数。这里,变换系数可以是通过对残差块执行变换而生成的系数值。当变换跳过模式被应用时,变换单元130可跳过对残差块的变换。
可通过将量化应用于变换系数或应用于残差信号来生成量化的等级。在下文中,量化的等级在实施例中也可被称为变换系数。
量化单元140可通过根据参数对变换系数或残差信号进行量化来生成量化的等级,并输出生成的量化的等级。这里,量化单元140可通过使用量化矩阵对变换系数进行量化。
熵编码单元150可通过根据概率分布对由量化单元140计算出的值或者对在执行编码时计算出的编码参数值执行熵编码来生成比特流,并输出生成的比特流。熵编码单元150可对图像的样点信息和用于对图像进行解码的信息执行熵编码。例如,用于对图像进行解码的信息可包括语法元素。
当熵编码被应用时,符号被表示使得较少数量的比特被分配给具有高生成可能性的符号,并且较多数量的比特被分配给具有低生成可能性的符号,因此,可减小用于将被编码的符号的比特流的大小。熵编码单元150可使用诸如指数哥伦布、上下文自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)等的用于熵编码的编码方法。例如,熵编码单元150可通过使用变长编码/码(VLC)表来执行熵编码。此外,熵编码单元150可推导目标符号的二值化方法和目标符号/二进制位的概率模型,并且通过使用推导出的二值化方法和上下文模型来执行算术编码。
为了对变换系数等级(量化的等级)进行编码,熵编码单元150可通过使用变换系数扫描方法将二维块形式的系数改变为一维矢量形式。
编码参数可包括在编码器中被编码并且被用信号发送到解码器的诸如语法元素的信息(标志、索引等)以及在执行编码或解码时推导出的信息。编码参数可表示在对图像进行编码或解码时所需要的信息。例如,以下项中的至少一个值或组合形式可被包括在编码参数中:单元/块尺寸、单元/块深度、单元/块分区信息、单元/块形状、单元/块分区结构、是否进行四叉树形式的分区、是否进行二叉树形式的分区、二叉树形式的分区方向(水平方向或垂直方向)、二叉树形式的分区形式(对称分区或非对称分区)、当前编码单元是否通过三叉树分区被分区、三叉树分区的方向(水平方向或垂直方向)、三叉树分区的类型(对称类型或非对称类型)、当前编码单元是否通过多类型树分区被分区、多类型树分区的方向(水平方向或垂直方向)、多类型树分区的类型(对称类型或非对称类型)和多类型树分区的树(二叉树或三叉树)结构、预测模式(帧内预测或帧间预测)、亮度帧内预测模式/方向、色度帧内预测模式/方向、帧内分区信息、帧间分区信息、编码块分区标志、预测块分区标志、变换块分区标志、参考样点滤波方法、参考样点滤波器抽头、参考样点滤波器系数、预测块滤波方法、预测块滤波器抽头、预测块滤波器系数、预测块边界滤波方法、预测块边界滤波器抽头、预测块边界滤波器系数、帧内预测模式、帧间预测模式、运动信息、运动矢量、运动矢量差、参考画面索引、帧间预测角度、帧间预测指示符、预测列表利用标志、参考画面列表、参考画面、运动矢量预测因子索引、运动矢量预测因子候选、运动矢量候选列表、是否使用合并模式、合并索引、合并候选、合并候选列表、是否使用跳过模式、插值滤波器类型、插值滤波器抽头、插值滤波器系数、运动矢量大小、运动矢量的表示精度、变换类型、变换尺寸、首次(第一次)变换是否被使用的信息、二次变换是否被使用的信息、首次变换索引、二次变换索引、残差信号是否存在的信息、编码块样式、编码块标志(CBF)、量化参数、量化参数残差、量化矩阵、是否应用帧内环路滤波器、帧内环路滤波器系数、帧内环路滤波器抽头、帧内环路滤波器形状/形式、是否应用去块滤波器、去块滤波器系数、去块滤波器抽头、去块滤波器强度、去块滤波器形状/形式、是否应用自适应样点偏移、自适应样点偏移值、自适应样点偏移类别、自适应样点偏移类型、是否应用自适应环路滤波器、自适应环路滤波器系数、自适应环路滤波器抽头、自适应环路滤波器形状/形式、二值化/反二值化方法、上下文模型确定方法、上下文模型更新方法、是否执行常规模式、是否执行旁路模式、上下文二进制位、旁路二进制位、有效系数标志、最后有效系数标志、针对系数组的单元的编码标志、最后有效系数的位置、关于系数的值是否大于1的标志、关于系数的值是否大于2的标志、关于系数的值是否大于3的标志、关于剩余系数值的信息、符号信息、重建的亮度样点、重建的色度样点、残差亮度样点、残差色度样点、亮度变换系数、色度变换系数、量化的亮度等级、量化的色度等级、变换系数等级扫描方法、在解码器侧的运动矢量搜索区域的尺寸、在解码器侧的运动矢量搜索区域的形状、在解码器侧的运动矢量搜索的次数、关于CTU尺寸的信息、关于最小块尺寸的信息、关于最大块尺寸的信息、关于最大块深度的信息、关于最小块深度的信息、图像显示/输出顺序、条带标识信息、条带类型、条带分区信息、并行块标识信息、并行块类型、并行块分区信息、画面类型、输入样点的比特深度、重建样点的比特深度、残差样点的比特深度、变换系数的比特深度、量化的等级的比特深度、以及关于亮度信号的信息或关于色度信号的信息。
这里,用信号发送标志或索引可表示由编码器对相应的标志或索引进行熵编码并将其包括在比特流中,并且可表示由解码器从比特流对相应的标志或索引进行熵解码。
当编码设备100通过帧间预测执行编码时,编码的当前图像可被用作用于随后被处理的另一图像的参考图像。因此,编码设备100可对编码的当前图像进行重建或解码,或者将重建或解码的图像作为参考图像存储在参考画面缓冲器190中。
量化的等级可在反量化单元160中被反量化,或者可在逆变换单元170中被逆变换。可由加法器175将经过反量化或逆变换的系数或者经过反量化和逆变换两者的系数与预测块相加。通过将经过反量化或逆变换的系数或者经过反量化和逆变换两者的系数与预测块相加,可生成重建块。这里,经过反量化或逆变换的系数或经过反量化和逆变换两者的系数可表示执行了反量化和逆变换中的至少一个的系数,并且可表示重建的残差块。
重建块可通过滤波器单元180。滤波器单元180可将去块滤波器、样点自适应偏移(SAO)和自适应环路滤波器(ALF)中的至少一个应用于重建样点、重建块或重建图像。滤波器单元180可被称为环内滤波器。
去块滤波器可去除在块之间的边界中生成的块失真。为了确定是否应用去块滤波器,可基于块中所包括的若干行或列中包括的样点来确定是否将去块滤波器应用于当前块。当将去块滤波器应用于块时,可根据所需的去块滤波强度来应用另一滤波器。
为了补偿编码误差,可通过使用样点自适应偏移将合适的偏移值与样点值相加。样点自适应偏移可以以样点为单位对经过去块的图像与原始图像的偏移进行校正。可使用考虑关于每个样点的边缘信息来应用偏移的方法,或者可使用以下方法:将图像的样点分区为预定数量的区域,确定偏移被应用的区域,并对确定的区域应用偏移。
自适应环路滤波器可基于经过滤波的重建图像和原始图像的比较结果来执行滤波。可将包括在图像中的样点分区为预定组,可确定将被应用于每个组的滤波器,并且可对每个组执行差异化滤波。是否应用ALF的信息可通过编码单元(CU)被用信号发送,并且将被应用于每个块的ALF的形式和系数可变化。
已经通过滤波器单元180的重建块或重建图像可被存储在参考画面缓冲器190中。由滤波器单元180处理的重建块可以是参考图像的一部分。也就是说,参考图像是由滤波器单元180处理的重建块组成的重建图像。存储的参考图像可稍后在帧间预测或运动补偿时被使用。
图2是示出根据应用了本发明的实施例的解码设备的配置的框图。
解码设备200可以是解码器、视频解码设备或图像解码设备。
参照图2,解码设备200可包括熵解码单元210、反量化单元220、逆变换单元230、帧内预测单元240、运动补偿单元250、加法器225、滤波器单元260和参考画面缓冲器270。
解码设备200可接收从编码设备100输出的比特流。解码设备200可接收存储在计算机可读记录介质中的比特流,或者可接收通过有线/无线传输介质被流传输的比特流。解码设备200可通过使用帧内模式或帧间模式对比特流进行解码。此外,解码设备200可生成通过解码而生成的重建图像或解码图像,并输出重建图像或解码图像。当在解码时使用的预测模式是帧内模式时,切换器可被切换到帧内模式。可选地,当在解码时使用的预测模式是帧间模式时,切换器可被切换到帧间模式。
解码设备200可通过对输入比特流进行解码来获得重建残差块,并生成预测块。当重建残差块和预测块被获得时,解码设备200可通过将重建残差块与预测块相加来生成成为解码目标的重建块。解码目标块可被称为当前块。
熵解码单元210可通过根据概率分布对比特流进行熵解码来生成符号。生成的符号可包括量化的等级形式的符号。这里,熵解码方法可以是上述熵编码方法的逆过程。
为了对变换系数等级(量化的等级)进行解码,熵解码单元210可通过使用变换系数扫描方法将单向矢量形式的系数改变为二维块形式。
可在反量化单元220中对量化的等级进行反量化,或者可在逆变换单元230中对量化的等级进行逆变换。量化的等级可以是进行反量化或逆变换或者进行反量化和逆变换两者的结果,并且可被生成为重建的残差块。这里,反量化单元220可将量化矩阵应用于量化的等级。
当使用帧内模式时,帧内预测单元240可通过对当前块执行空间预测来生成预测块,其中,空间预测使用与解码目标块相邻并且已经被解码的块的样点值。
当使用帧间模式时,运动补偿单元250可通过对当前块执行运动补偿来生成预测块,其中,运动补偿使用运动矢量以及存储在参考画面缓冲器270中的参考图像。
加法器225可通过将重建的残差块与预测块相加来生成重建块。滤波器单元260可将去块滤波器、样点自适应偏移和自适应环路滤波器中的至少一个应用于重建块或重建图像。滤波器单元260可输出重建图像。重建块或重建图像可被存储在参考画面缓冲器270中并且在执行帧间预测时被使用。由滤波器单元260处理的重建块可以是参考图像的一部分。也就是说,参考图像是由滤波器单元260处理的重建块组成的重建图像。存储的参考图像可稍后在帧间预测或运动补偿时被使用。
图3是示意性地示出当对图像进行编码和解码时图像的分区结构的示图。图3示意性地示出将单个单元分区为多个更低等级的单元的示例。
为了有效地对图像进行分区,当进行编码和解码时,可使用编码单元(CU)。编码单元可被用作当对图像进行编码/解码时的基本单元。此外,编码单元可被用作用于在对图像进行编码/解码时区分帧内预测模式与帧间预测模式的单元。编码单元可以是用于预测、变换、量化、逆变换、反量化或对变换系数的编码/解码处理的基本单元。
参照图3,图像300按照最大编码单元(LCU)被顺序地分区,并且LCU单元被确定为分区结构。这里,LCU可以以与编码树单元(CTU)相同的含义被使用。单元分区可表示对与该单元相关联的块进行分区。在块分区信息中,可包括单元深度的信息。深度信息可表示单元被分区的次数或程度或者单元被分区的次数和程度两者。可基于树结构将单个单元分区为与深度信息分层地相关联的多个更低等级的单元。换言之,单元和通过对该单元进行分区而生成的更低等级的单元可分别与节点和该节点的子节点相应。分区出的更低等级的单元中的每个可具有深度信息。深度信息可以是表示CU的尺寸的信息,并且可被存储在每个CU中。单元深度表示与对单元进行分区相关的次数和/或程度。因此,更低等级的单元的分区信息可包括关于更低等级的单元的尺寸的信息。
分区结构可表示LCU 310内的编码单元(CU)的分布。可根据是否将单个CU分区为多个(等于或大于2的正整数,包括2、4、8、16等)CU来确定这样的分布。通过分区生成的CU的水平尺寸和垂直尺寸可分别是分区之前的CU的水平尺寸和垂直尺寸的一半,或者可分别具有根据分区的次数而小于分区之前的水平尺寸和垂直尺寸的尺寸。CU可以被递归地分区为多个CU。通过递归分区,与分区之前的CU的高度和宽度之中的至少一个相比,分区之后的CU的高度和宽度之中的至少一个可减小。可递归地执行CU的分区,直到预定义的深度或预定义的尺寸为止。例如,LCU的深度可以是0,最小编码单元(SCU)的深度可以是预定义的最大深度。这里,如上所述,LCU可以是具有最大编码单元尺寸的编码单元,并且SCU可以是具有最小编码单元尺寸的编码单元。分区从LCU 310开始,当CU的水平尺寸或垂直尺寸或者水平尺寸和垂直尺寸两者通过分区而减小时,CU深度增加1。例如,对于每个深度,未被分区的CU的尺寸可以为2N×2N。此外,在被分区的CU的情况下,可将尺寸为2N×2N的CU分区为尺寸为N×N的四个CU。随着深度增加1,N的大小可减半。
此外,可通过使用CU的分区信息来表示CU是否被分区的信息。分区信息可以是1比特信息。除SCU之外的所有CU可包括分区信息。例如,当分区信息的值为1时,可不对CU进行分区,当分区信息的值为2时,可对CU进行分区。
参照图3,具有深度0的LCU可以是64×64的块。0可以是最小深度。具有深度3的SCU可以是8×8的块。3可以是最大深度。32×32的块和16×16的块的CU可分别被表示为深度1和深度2。
例如,当单个编码单元被分区为四个编码单元时,分区出的四个编码单元的水平尺寸和垂直尺寸可以是CU在被分区之前的水平尺寸和垂直尺寸的一半大小。在一个实施例中,当尺寸为32×32的编码单元被分区为四个编码单元时,分区出的四个编码单元中的每一个的尺寸可以为16×16。当单个编码单元被分区为四个编码单元时,可称编码单元可被分区为四叉树形式。
例如,当一个编码单元被分区为两个子编码单元时,该两个子编码单元中的每一个的水平尺寸或垂直尺寸(宽度或高度)可以是原始编码单元的水平尺寸或垂直尺寸的一半。例如,当尺寸为32×32的编码单元被垂直分区为两个子编码单元时,该两个子编码单元中的每一个可具有16×32的尺寸。例如,当尺寸为8×32的编码单元被水平分区为两个子编码单元时,该两个子编码单元中的每个可具有8×16的尺寸。当一个编码单元被分区为两个子编码单元时,可称编码单元被二分区,或者根据二叉树分区结构被分区。
例如,当一个编码单元被分区为三个子编码单元时,可以以1:2:1的比例对编码单元的水平尺寸或垂直尺寸进行分区,从而产生水平尺寸或垂直尺寸的比例为1:2:1的三个子编码单元。例如,当尺寸为16×32的编码单元被水平分区为三个子编码单元时,该三个子编码单元以从最上方子编码单元到最下方子编码单元的顺序可分别具有16×8、16×16和16×8的尺寸。例如,当尺寸为32×32的编码单元被垂直划分为三个子编码单元时,该三个子编码单元以从左侧子编码单元到右侧子编码单元的顺序可分别具有8×32、16×32和8×32的尺寸。当一个编码单元被分区为三个子编码单元时,可称编码单元被三分区或者根据三叉树分区结构被分区。
在图3中,编码树单元(CTU)320是四叉树分区结构、二叉树分区结构和三叉树分区结构全都被应用的CTU的示例。
如上所述,为了对CTU进行分区,可应用四叉树分区结构、二叉树分区结构和三叉树分区结构中的至少一个。可根据预定的优先级顺序将各种树分区结构顺序地应用于CTU。例如,可将四叉树分区结构优先应用于CTU。不能再使用四叉树分区结构进行分区的编码单元可与四叉树的叶节点对应。与四叉树的叶节点对应的编码单元可用作二叉树和/或三叉树分区结构的根节点。也就是说,与四叉树的叶节点对应的编码单元可根据二叉树分区结构或三叉树分区结构被进一步分区,或者可不被进一步分区。因此,通过防止从与四叉树的叶节点对应的编码单元的二叉树分区或三叉树分区得到的编码块经历进一步的四叉树分区,块分区操作和/或用信号发送分区信息的操作可被有效执行。
可使用四分区信息用信号发送与四叉树的节点对应的编码单元被分区的事实。具有第一值(例如,“1”)的四分区信息可指示当前编码单元按照四叉树分区结构被分区。具有第二值(例如,“0”)的四分区信息可指示当前编码单元未按照四叉树分区结构被分区。四分区信息可以是具有预定长度(例如,一个比特)的标志。
在二叉树分区与三叉树分区之间可能没有优先级。也就是说,与四叉树的叶节点对应的编码单元可进一步经历二叉树分区和三叉树分区中的任意分区。此外,通过二叉树分区或三叉树分区生成的编码单元可经历进一步的二叉树分区或进一步的三叉树分区,或者可不被进一步分区。
在二叉树分区和三叉树分区之间不存在优先级的树结构被称为多类型树结构。与四叉树的叶节点对应的编码单元可用作多类型树的根节点。可使用多类型树分区指示信息、分区方向信息和分区树信息中的至少一个来用信号发送是否对与多类型树的节点对应的编码单元进行分区。为了对与多类型树的节点对应的编码单元进行分区,可顺序地用信号发送多类型树分区指示信息、分区方向信息和分区树信息。
具有第一值(例如,“1”)的多类型树分区指示信息可指示当前编码单元将经历多类型树分区。具有第二值(例如,“0”)的多类型树分区指示信息可指示当前编码单元将不经历多类型树分区。
当与多类型树的节点对应的编码单元按照多类型树分区结构被进一步分区时,所述编码单元可包括分区方向信息。分区方向信息可指示当前编码单元将在哪个方向上根据多类型树分区被分区。具有第一值(例如,“1”)的分区方向信息可指示当前编码单元将被垂直分区。具有第二值(例如,“0”)的分区方向信息可指示当前编码单元将被水平分区。
当与多类型树的节点对应的编码单元按照多类型树分区结构被进一步分区时,当前编码单元可包括分区树信息。分区树信息可指示将被用于对多类型树的节点进行分区的树分区结构。具有第一值(例如,“1”)的分区树信息可指示当前编码单元将按照二叉树分区结构被分区。具有第二值(例如,“0”)的分区树信息可指示当前编码单元将按照三叉树分区结构被分区。
分区指示信息、分区树信息和分区方向信息均可以是具有预定长度(例如,一个比特)的标志。
四叉树分区指示信息、多类型树分区指示信息、分区方向信息和分区树信息中的至少任意一个可被熵编码/熵解码。为了对那些类型的信息进行熵编码/熵解码,可使用关于与当前编码单元相邻的邻近编码单元的信息。例如,当前编码单元的左侧邻近编码单元和/或上方邻近编码单元的分区类型(被分区或不被分区、分区树和/或分区方向)与当前编码单元的分区类型相似的可能性很高。因此,可从关于邻近编码单元的信息推导出用于对关于当前编码单元的信息进行熵编码/熵解码的上下文信息。关于邻近编码单元的信息可包括四分区信息、多类型树分区指示信息、分区方向信息和分区树信息中的至少任意一个。
作为另一示例,在二叉树分区和三叉树分区中,可优先执行二叉树分区。也就是说,当前编码单元可首先经历二叉树分区,并且随后可将与二叉树的叶节点对应的编码单元设置为用于三叉树分区的根节点。在这种情况下,对于与三叉树的节点对应的编码单元,可既不执行四叉树分区也不执行二叉树分区。
不能按照四叉树分区结构、二叉树分区结构和/或三叉树分区结构被分区的编码单元成为用于编码、预测和/或变换的基本单元。也就是说,所述编码单元不能被进一步分区以用于预测和/或变换。因此,在比特流中可能不存在用于将编码单元分区为预测单元和/或变换单元的分区结构信息和分区信息。
然而,当编码单元(即,用于分区的基本单元)的尺寸大于最大变换块的尺寸时,可递归地对编码单元进行分区,直到将编码单元的尺寸减小到等于或小于最大变换块的尺寸为止。例如,当编码单元的尺寸为64×64时并且当最大变换块的尺寸为32×32时,可将编码单元分区为用于变换的四个32×32的块。例如,当编码单元的尺寸为32×64并且最大变换块的尺寸为32×32时,可将编码单元分区为用于变换的两个32×32的块。在这种情况下,不单独用信号发送编码单元的用于变换的分区,并且可通过编码单元的水平尺寸或垂直尺寸与最大变换块的水平尺寸或垂直尺寸之间的比较来确定编码单元的用于变换的分区。例如,当编码单元的水平尺寸(宽度)大于最大变换块的水平尺寸(宽度)时,可将编码单元垂直地二等分。例如,当编码单元的垂直尺寸(长度)大于最大变换块的垂直尺寸(长度)时,可将编码单元水平地二等分。
可在编码单元的更高等级用信号发送或确定编码单元的最大尺寸和/或最小尺寸的信息以及变换块的最大尺寸和/或最小尺寸的信息。所述更高等级可以是例如序列级、画面级、条带级等。例如,可将编码单元的最小尺寸确定为4×4。例如,可将变换块的最大尺寸确定为64×64。例如,可将变换块的最小尺寸确定为4×4。
可在编码单元的更高等级用信号发送或确定与四叉树的叶节点对应的编码单元的最小尺寸(四叉树最小尺寸)的信息和/或多类型树的从根节点到叶节点的最大深度(多类型树的最大树深度)的信息。例如,所述更高等级可以是序列级、画面级、条带级等。可针对画面内条带和画面间条带中的每一个用信号发送或确定四叉树的最小尺寸的信息和/或多类型树的最大深度的信息。
可在编码单元的更高等级用信号发送或确定CTU的尺寸与变换块的最大尺寸之间的差信息。例如,所述更高等级可以是序列级、画面级、条带级等。可基于编码树单元的尺寸和所述差信息来确定与二叉树的各个节点对应的编码单元的最大尺寸(在下文中,称为二叉树的最大尺寸)的信息。与三叉树的各个节点对应的编码单元的最大尺寸(在下文中,称为三叉树的最大尺寸)可依据条带的类型而变化。例如,针对画面内条带,三叉树的最大尺寸可以是32×32。例如,针对画面间条带,三叉树的最大尺寸可以是128×128。例如,可将与二叉树的各个节点对应的编码单元的最小尺寸(在下文中,称为二叉树的最小尺寸)和/或与三叉树的各个节点对应的编码单元的最小尺寸(在下文中,称为三叉树的最小尺寸)设置为编码块的最小尺寸。
作为另一示例,可在条带级用信号发送或确定二叉树的最大尺寸和/或三叉树的最大尺寸。可选地,可在条带级用信号发送或确定二叉树的最小尺寸和/或三叉树的最小尺寸。
依据上述各种块的尺寸信息和深度信息,四分区信息、多类型树分区指示信息、分区树信息和/或分区方向信息可被包括在比特流中或可不被包括在比特流中。
例如,当编码单元的尺寸不大于四叉树的最小尺寸时,编码单元不包含四分区信息。因此,可从第二值推导出四分区信息。
例如,当与多类型树的节点对应的编码单元的尺寸(水平尺寸和垂直尺寸)大于二叉树的最大尺寸(水平尺寸和垂直尺寸)和/或三叉树的最大尺寸(水平尺寸和垂直尺寸)时,编码单元可不被二分区或三分区。因此,可不用信号发送多类型树分区指示信息,而是可从第二值推导出多类型树分区指示信息。
可选地,当与多类型树的节点对应的编码单元的尺寸(水平尺寸和垂直尺寸)与二叉树的最大尺寸(水平尺寸和垂直尺寸)相同,和/或是三叉树的最大尺寸(水平尺寸和垂直尺寸)的两倍大时,编码单元可不被进一步二分区或三分区。因此,可不用信号发送多类型树分区指示信息,而是可从第二值推导出多类型树分区指示信息。这是因为,当按照二叉树分区结构和/或三叉树分区结构对编码单元进行分区时,生成了小于二叉树的最小尺寸和/或三叉树的最小尺寸的编码单元。
可选地,当与多类型树的节点对应的编码单元的深度等于多类型树的最大深度时,可不对编码单元进行进一步二分区和/或三分区。因此,可不用信号发送多类型树分区指示信息,而是可从第二值推导出多类型树分区指示信息。
可选地,只有当垂直方向二叉树分区、水平方向二叉树分区、垂直方向三叉树分区和水平方向三叉树分区中的至少一个对于与多类型树的节点对应的编码单元是可行的时,才可用信号发送多类型树分区指示信息。否则,可能无法对编码单元进行二分区和/或三分区。因此,可不用信号发送多类型树分区指示信息,而是可从第二值推导出多类型树分区指示信息。
可选地,只有当垂直方向二叉树分区和水平方向二叉树分区两者或者垂直方向三叉树分区和水平方向三叉树分区两者对于与多类型树的节点对应的编码单元是可行的时,才可用信号发送分区方向信息。否则,可不用信号发送分区方向信息,而是可从指示可能的分区方向的值推导出分区方向信息。
可选地,只有当垂直方向二叉树分区和垂直方向三叉树分区两者或者水平方向二叉树分区和水平方向三叉树分区两者对于与多类型树的节点对应的编码树是可行的时,才可用信号发送分区树信息。否则,可不用信号发送分区树信息,而是可从指示可能的分区树结构的值推导分区树信息。
图4是示出帧内预测处理的示图。
图4中的从中心到外部的箭头可表示帧内预测模式的预测方向。
可通过使用当前块的邻近块的参考样点来执行帧内编码和/或解码。邻近块可以是重建的邻近块。例如,可通过使用包括在重建的邻近块中的参考样点的编码参数或值来执行帧内编码和/或解码。
预测块可表示通过执行帧内预测生成的块。预测块可与CU、PU和TU中的至少一个对应。预测块的单元可具有CU、PU和TU中的一个的尺寸。预测块可以是尺寸为2×2、4×4、16×16、32×32或64×64等的正方形块,或者可以是尺寸为2×8、4×8、2×16、4×16和8×16等的矩形块。
可根据针对当前块的帧内预测模式来执行帧内预测。当前块可具有的帧内预测模式的数量可以是固定值,并且可以是根据预测块的属性不同地确定的值。例如,预测块的属性可包括预测块的尺寸和预测块的形状等。
不管块尺寸为多少,可将帧内预测模式的数量固定为N。或者,帧内预测模式的数量可以是3、5、9、17、34、35、36、65或67等。可选地,帧内预测模式的数量可根据块尺寸或颜色分量类型或者块尺寸和颜色分量类型两者而变化。例如,帧内预测模式的数量可根据颜色分量是亮度信号还是色度信号而变化。例如,随着块尺寸变大,帧内预测模式的数量可增加。可选地,亮度分量块的帧内预测模式的数量可大于色度分量块的帧内预测模式的数量。
帧内预测模式可以是非角度模式或角度模式。非角度模式可以是DC模式或平面模式,并且角度模式可以是具有特定方向或角度的预测模式。帧内预测模式可由模式编号、模式值、模式数字、模式角度和模式方向中的至少一个来表示。帧内预测模式的数量可以是大于或等于1的M,包括非角度模式和角度模式。
为了对当前块进行帧内预测,可执行确定是否可将包括在重建的邻近块中的样点用作当前块的参考样点的步骤。当存在不能用作当前块的参考样点的样点时,通过对包括在重建的邻近块中的样点中的至少一个样点值进行复制或执行插值或者执行复制和插值两者而获得的值可被用于替换样点的不可用样点值,因此经过替换的样点值被用作当前块的参考样点。
当进行帧内预测时,可基于帧内预测模式和当前块的尺寸将滤波器应用于参考样点和预测样点中的至少一个。
在平面模式的情况下,当生成当前块的预测块时,根据预测目标样点在预测块内的位置,可通过使用当前样点的上侧参考样点与左侧参考样点以及当前块的右上侧参考样点与左下侧参考样点的加权和来生成预测目标样点的样点值。此外,在DC模式的情况下,当生成当前块的预测块时,可使用当前块的上侧参考样点与左侧参考样点的平均值。此外,在角度模式的情况下,可通过使用当前块的上侧参考样点、左侧参考样点、右上侧参考样点和/或左下侧参考样点来生成预测块。为了生成预测样点值,可对实数单元执行插值。
可通过预测与当前块相邻存在的块的帧内预测模式来对当前块的帧内预测模式进行熵编码/熵解码。当当前块与邻近块的帧内预测模式相同时,可通过使用预定标志信息来用信号发送当前块与邻近块的帧内预测模式相同的信息。此外,可用信号发送多个邻近块的帧内预测模式之中的与当前块的帧内预测模式相同的帧内预测模式的指示符信息。当当前块与邻近块的帧内预测模式不同时,可通过基于邻近块的帧内预测模式执行熵编码/熵解码来对当前块的帧内预测模式信息进行熵编码/熵解码。
图5是示出画面间预测处理的实施例的示图。
在图5中,矩形可表示画面。在图5中,箭头表示预测方向。根据画面的编码类型,可将画面分类为帧内画面(I画面)、预测画面(P画面)和双预测画面(B画面)。
可在不需要画面间预测的情况下通过帧内预测对I画面进行编码。可通过使用在相对于当前块的一个方向(即,前向或后向)上存在的参考画面,通过画面间预测来对P画面进行编码。可通过使用在相对于当前块的两个方向(即,前向和后向)上存在的参考画面,通过画面间预测来对B画面进行编码。当使用画面间预测时,编码器可执行画面间预测或运动补偿,并且解码器可执行相应的运动补偿。
在下文中,将详细描述画面间预测的实施例。
可使用参考画面和运动信息来执行画面间预测或运动补偿。
可通过编码设备100和解码设备200中的每一个在画面间预测期间推导当前块的运动信息。可通过使用重建的邻近块的运动信息、同位置块(也称为col块或同位块)的运动信息和/或与同位块相邻的块的运动信息来推导当前块的运动信息。同位块可表示先前重建的同位置画面(也称为col画面或同位画面)内的在空间上与当前块位于相同位置的块。同位画面可以是包括在参考画面列表中的一个或更多个参考画面中的一个画面。
推导当前块的运动信息的方法可依据当前块的预测模式变化。例如,作为用于画面间预测的预测模式,可存在AMVP模式、合并模式、跳过模式、当前画面参考模式等。合并模式可被称为运动合并模式。
例如,当AMVP被用作预测模式时,可将重建的邻近块的运动矢量、同位块的运动矢量、与同位块相邻的块的运动矢量和(0,0)运动矢量中的至少一个确定为针对当前块的运动矢量候选,并且通过使用运动矢量候选生成运动矢量候选列表。可通过使用生成的运动矢量候选列表来推导当前块的运动矢量候选。可基于推导出的运动矢量候选来确定当前块的运动信息。同位块的运动矢量或与同位块相邻的块的运动矢量可被称为时间运动矢量候选,并且重建的邻近块的运动矢量可被称为空间运动矢量候选。
编码设备100可计算当前块的运动矢量与运动矢量候选之间的运动矢量差(MVD),并且可对运动矢量差(MVD)执行熵编码。此外,编码设备100可对运动矢量候选索引执行熵编码并生成比特流。运动矢量候选索引可指示包括在运动矢量候选列表中的运动矢量候选之中的最佳运动矢量候选。解码设备可对包括在比特流中的运动矢量候选索引执行熵解码,并且可通过使用经过熵解码的运动矢量候选索引从包括在运动矢量候选列表中的运动矢量候选中选择解码目标块的运动矢量候选。此外,解码设备200可将经过熵解码的MVD与通过熵解码而提取的运动矢量候选相加,从而推导出解码目标块的运动矢量。
比特流可包括指示参考画面的参考画面索引。参考画面索引可通过编码设备100被熵编码,并且随后作为比特流被用信号发送到解码设备200。解码设备200可基于推导出的运动矢量和参考画面索引信息来生成解码目标块的预测块。
推导当前块的运动信息的方法的另一示例可以是合并模式。合并模式可表示合并多个块的运动的方法。合并模式可表示从邻近块的运动信息推导当前块的运动信息的模式。当应用合并模式时,可使用重建的邻近块的运动信息和/或同位块的运动信息来生成合并候选列表。运动信息可包括运动矢量、参考画面索引和画面间预测指示符中的至少一个。预测指示符可指示单向预测(L0预测或L1预测)或双向预测(L0预测和L1预测)。
合并候选列表可以是存储的运动信息的列表。包括在合并候选列表中的运动信息可以是零合并候选和新运动信息中的至少一个,其中,所述新运动信息是与当前块相邻的一个邻近块的运动信息(空间合并候选)、当前块的包括在参考画面内的同位块的运动信息(时间合并候选)和存在于合并候选列表中的运动信息的组合。
编码设备100可通过对合并标志和合并索引中的至少一个执行熵编码来生成比特流,并且可将比特流用信号发送到解码设备200。合并标志可以是指示是否针对每个块执行合并模式的信息,并且合并索引可以是指示当前块的邻近块中的哪个邻近块是合并目标块的信息。例如,当前块的邻近块可包括在当前块的左侧的左侧邻近块、被布置在当前块上方的上方邻近块和在时间上与当前块相邻的时间邻近块。
跳过模式可以是将邻近块的运动信息照原样应用于当前块的模式。当应用跳过模式时,编码设备100可对哪个块的运动信息将被用作当前块的运动信息的事实的信息执行熵编码,以生成比特流,并且可将比特流用信号发送到解码设备200。编码设备100可不将关于运动矢量差信息、编码块标志和变换系数等级中的至少任意一个的语法元素用信号发送到解码设备200。
当前画面参考模式可表示当前块所属的当前画面内的先前重建的区域被用于预测的预测模式。这里,矢量可被用于指定先前重建的区域。可通过使用当前块的参考画面索引来对指示是否将在当前画面参考模式下对当前块进行编码的信息进行编码。可用信号发送指示当前块是否为在当前画面参考模式下编码的块的标志或索引,并且可基于当前块的参考画面索引来推导出所述标志或索引。在当前块在当前画面参考模式下被编码的情况下,可将当前画面添加到针对当前块的参考画面列表,以便使当前画面位于参考画面列表中的固定位置或任意位置。所述固定位置可以是例如由参考画面索引0指示的位置,或者是列表中的最后一个位置。当将当前画面添加到参考画面列表,以便使当前画面位于任意位置时,可用信号发送指示所述任意位置的参考画面索引。
图6是示出变换和量化处理的示图。
如图6中所示,对残差信号执行变换处理和/或量化处理,以生成量化的等级信号。残差信号是原始块与预测块(即,帧内预测块或帧间预测块)之间的差。预测块是通过帧内预测或帧间预测生成的块。所述变换可以是首次变换、二次变换或者首次变换和二次变换两者。对残差信号的首次变换产生变换系数,并且对变换系数的二次变换产生二次变换系数。
从预先定义的各种变换方案中选择的至少一种方案被用于执行首次变换。例如,所述预定义的变换方案的示例包括离散余弦变换(DCT)、离散正弦变换(DST)和Karhunen-Loève变换(KLT)。通过首次变换生成的变换系数可经历二次变换。可根据当前块和/或当前块的邻近块的编码参数来确定用于首次变换和/或二次变换的变换方案。可选地,可通过变换信息的信令来确定变换方案。
由于残差信号通过首次变换和二次变换被量化,因此生成了量化的等级信号(量化系数)。依据块的帧内预测模式或块尺寸/形状,可根据对角线右上扫描、垂直扫描和水平扫描中的至少一个来扫描量化的等级信号。例如,当按照对角线右上扫描来扫描系数时,块形式的系数变为一维矢量形式。除了对角线右上扫描之外,可依据变换块的帧内预测模式和/或尺寸来使用水平地扫描二维块形式的系数的水平扫描和垂直地扫描二维块形式的系数的垂直扫描。扫描的量化等级系数可被熵编码以被插入到比特流中。
解码器对比特流进行熵解码以获得量化等级系数。可通过逆扫描以二维块形式排列量化等级系数。对于逆扫描,可使用对角线右上扫描、垂直扫描和水平扫描中的至少一个。
然后,可对量化等级系数进行反量化,然后根据需要进行二次逆变换,并且最后根据需要进行首次逆变换,以生成重建的残差信号。
图7是示出根据本公开的一个实施例的图像编码设备的配置的框图。图7示出图1的一个实施例。
图像编码设备700包括画面分区单元710、变换单元720、量化单元730、扫描单元731、熵编码单元740、帧内预测单元750、帧间预测单元760、反量化单元735、逆变换单元725、后处理单元770、画面存储单元780、减法器790和加法器795。
参照图7,画面分区单元710分析输入视频信号,将画面分区为编码单元,确定预测模式,并且针对每个编码单元确定预测单元的尺寸。
画面分区单元710根据选择的预测模式(或预测方法)将要被编码的预测单元馈送到帧内预测单元750或帧间预测单元760。画面分区单元710将要被编码的预测单元馈送到减法器790。
图像(即,视频)的画面包括多个条带,并且每个条带可被分区为多个编码树单元(CTU),其中,每个编码树单元是用于画面分区的基本单元。
每个编码树单元可被分区为一个、两个或更多个编码单元(CU),其中,每个编码单元是用于帧间预测或帧内预测的基本单元。
编码树单元的最大尺寸可与编码单元的最大尺寸不同,并且关于它们的信息可被发送到解码设备1300。
每个编码单元可被分区为一个或更多个预测单元(PU),其中,每个预测单元是用于预测处理的基本单元。
在这种情况下,编码设备700针对每个编码单元在帧内预测和帧间预测中选择一种预测方法,并且可针对每个预测单元不同地生成预测块。
每个编码单元CU可被分区为一个、两个或更多个变换单元(TU),其中,每个变换单元是用于残差块的变换的基本单元。
在这种情况下,画面分区单元710基于每个块(例如,基于每个预测单元或基于每个变换单元)将图像数据馈送到减法器790。
图8至图11是根据本公开的一个实施例的用于描述将图像分区为块并基于每个块执行图像处理的方法的示图。图8至图11示出图3的一个实施例。
参照图8,当使用四叉树结构将256×256的编码树单元(CTU)分区为尺寸相等的四个正方形编码单元(CU)时。
可使用四叉树结构进一步对所述四个正方形编码单元(CU)中的每一个进行分区。通过四叉树结构分区的编码单元(CU)中的每一个可具有在从0至3的范围内的任意一个值的深度。
此外,如下所述,可使用二叉树结构进一步对已经使用四叉树结构被分区的编码单元进行分区。也就是说,一个四叉树块可被分区为两个二叉树子块。首先使用四叉树结构对CTU进行分区。可对一个节点进行分区直到最小四叉树节点尺寸minQTSize。当四叉树结构中的节点的尺寸不大于最大可允许二叉树节点尺寸MaxBTSize时,可使用二叉树结构进一步对四叉树结构中的节点进行分区。此外,可对二叉树结构中的节点进行分区直到最小可允许二叉树节点尺寸或最大可允许二叉树分区深度。
也就是说,首先使用四叉树结构对CTU进行分区,并且可使用四叉树结构或二叉树结构来进一步递归地对通过分区生成的每个节点进行分区。通过最终分区生成的二叉树节点不被进一步分区,并且被确定为作为用于预测和变换的基本单元的编码单元。这里,当CU是通过二叉树分区生成的块时,可执行非对称二分区处理。当执行非对称二分区时,一个CU可被划分为尺寸分别为原始编码单元CU的1/4和3/4的两个子CU。
编码单元CU可依据将使用的预测模式被分区为两个或更多个预测单元。
对于帧内预测模式,当一个CU具有2N×2N的尺寸时,一个PU可具有如图9的(a)中所示的2N×2N的尺寸、或如图9的(b)中所示的N×N的尺寸。
另一方面,在帧间预测模式下,当一个编码单元CU具有2N×2N的尺寸时,一个预测单元PU可具有如下尺寸中的任意尺寸:图10的(a)中所示的2N×2N的尺寸、图10的(b)中所示的2N×N的尺寸、图10的(c)中所示的N×2N的尺寸、图10的(d)中所示的N×N的尺寸、图10的(e)中所示的2N×nU的尺寸、图10的(f)中所示的2N×nD的尺寸、图10的(g)中所示的nL×2N的尺寸以及图10的(h)中所示的nR×2N的尺寸。
参照图11,使用四叉树结构来对编码单元CU进行分区以产生四个正方形变换单元(TU)。
可使用四叉树结构进一步对所述四个正方形变换单元TU中的每一个进行分区。所述四个变换单元中的每一个可具有从0至3的范围中的任意一个值的分区深度。
当将利用帧间预测模式来预测编码单元CU时,预测单元PU和变换单元TU可独立地具有不同的分区结构。
当将利用帧内预测模式来预测编码单元CU时,由编码单元CU的分区得到的变换单元TU的尺寸将不大于预测单元PU的尺寸。
变换单元TU可具有64×64像素的最大尺寸。
变换单元720可对残差块进行变换,其中,所述残差块是作为输入预测单元PU的原始信号与输入预测单元的由帧内预测单元750或帧间预测单元760生成的预测信号之间的差的残差信号。可基于每个TU执行变换。
可依据在帧内模式或帧间模式之中使用哪种模式来确定在变换处理中使用的变换矩阵。由于通过帧内预测生成的残差信号具有根据帧内预测模式的方向性,因此可自适应地确定变换矩阵。
变换单元可被变换为两个(水平和垂直)一维变换矩阵。例如,预定的一个变换矩阵可被用于帧间预测。
另一方面,在帧内预测模式的情况下,当选择水平模式作为帧内预测模式时,由于残差块很可能具有垂直方向性,因此将基于DCT的整数矩阵用于垂直方向并且将基于KLT的整数矩阵用于水平方向。当帧内预测模式是垂直方向模式时,将基于DST的整数矩阵和基于KLT的整数矩阵两者用于垂直方向并且将基于DCT的整数矩阵用于水平方向。
在DC模式下,将基于DCT的整数矩阵应用于水平方向和垂直方向两者。
在帧内预测的情况下,可根据变换单元(TU)的尺寸来自适应地确定变换矩阵。
另一方面,变换单元720可按照编码效率选择变换核类型。变换单元720可针对帧间预测模式和帧内预测模式定义各种类型的基函数,并且选择性地使用所述基函数中的一个。
变换单元720可针对帧间预测模式和帧内预测模式定义各种类型的基函数,并且选择性地使用所述基函数中的一个。变换单元720可配备有用于补充变换的映射表,从而能够执行补充变换。例如,变换单元720可执行模式相关的不可分离的二次变换(MDNSST)处理。
量化单元730确定量化步长,其中,所述量化步长用于对使用变换矩阵对残差块进行变换得到的系数进行量化,其中,可针对具有预定尺寸或更大尺寸的每个量化单元确定量化步长。
量化单元的尺寸可以是8×8或16×16。量化单元730可使用根据量化步长和预测模式确定的量化矩阵来对变换块的系数进行量化。
量化单元730可使用与当前量化单元相邻的量化单元的量化步长作为量化步长预测因子。
量化单元730可按照左侧量化单元、上方量化单元和左上方量化单元的顺序扫描当前量化单元的邻近量化单元,并且使用一个或两个有效量化步长来生成当前量化单元的量化步长预测因子。
例如,量化单元730可将找到的有效量化步长中的按照扫描顺序首先出现的第一量化步长或将通过扫描找到的两个有效量化步长的平均值确定为量化步长预测因子。当仅一个量化步长有效时,可将这个有效量化步长确定为量化步长预测因子。
当量化步长预测因子被确定时,量化单元730将当前量化单元的量化步长与量化步长预测因子之间的差值馈送到熵编码单元740。
另一方面,可能存在当前编码单元的左侧编码单元、上方编码单元和左上方编码单元都不存在的情况,或者可能存在按照编码顺序的先前编码单元在最大编码单元中可能不存在的情况。
因此,在最大编码单元内按照编码顺序紧接在当前编码单元之前的先前量化单元的量化步长或与当前编码单元相邻的邻近编码单元的量化步长可成为量化步长候选。
在这种情况下,对量化步长预测因子的选择的优先级可以是如下顺序:1)当前编码单元的左侧编码单元、2)当前编码单元的上方编码单元,3)当前编码单元的左上方编码单元、以及4)按照编码顺序的当前编码单元的先前编码单元。该顺序可被改变。可选地,可不考虑左上方编码单元。
量化的变换块可被馈送到反量化单元735和扫描单元731。
扫描单元731扫描变换块的经过量化的系数,并且将该系数变换为一维量化系数集。在这种情况下,由于变换块的系数的分布可取决于帧内预测模式,因此可根据帧内预测模式来选择扫描方法。
系数扫描方法可依据变换单元的尺寸而变化。扫描模式可依据帧内预测模式而变化。在这种情况下,系数的扫描顺序可以是相反的。
当将经过量化的系数划分为多个子集时,可将相同的扫描模式应用于每个子集内的经过量化的系数。另一方面,可使用用于扫描子集的扫描模式、Z字形扫描模式或对角线扫描模式。
可按照使得从包括DC的主子集顺序地扫描剩余的子集的方式优选地确定扫描模式。然而,相反的顺序也是可行的。
用于扫描子集的扫描模式可与用于扫描每个子集内的经过量化的系数的扫描模式相同。可根据帧内预测模式来确定用于扫描子集的扫描模式。
另一方面,编码设备700可将指示变换单元TU内的最后的非零量化系数的位置和每个子集内的最后的非零量化系数的位置的信息插入到比特流以发送到解码设备1300。
如上所述,反量化单元735可对经过量化的系数进行反量化。逆变换单元725基于每个变换单元(TU)执行逆变换,从而将经过反量化的变换系数恢复为空间域中的残差块。
加法器795可通过将由逆变换单元725重建的残差块与从帧内预测单元750或帧间预测单元760接收到的预测块相加来生成重建块。
此外,后处理单元770可执行用于消除出现在重建画面中的块效应的去块滤波、用于基于每个像素补偿原始画面与重建画面之间的差值的像素自适应偏移(SAO)应用处理以及用于基于每个编码单元补偿原始画面与重建画面之间的差值的自适应环路滤波(ALF)。
可将去块滤波应用于尺寸等于或大于预定尺寸的预测单元(PU)或变换单元(TU)的边界。
例如,去块滤波可包括:确定将被滤波的边界;确定将被应用于所述边界的边界滤波强度;确定是否使用去块滤波器;并且当确定使用去块滤波器时选择将被应用于所述边界的滤波器。
是否应用去块滤波取决于:i)边界滤波强度是否大于零,以及ii)指示与经历滤波的边界相邻的两个块(P块和Q块)之间的边界处的像素值的变化的值是否小于由量化参数确定的第一参考值。
优选地,可使用两个或更多个滤波器。如果位于块边界处的两个像素的值之间的差的绝对值大于或等于第二参考值,则选择执行相对弱滤波的滤波器。
第二参考值由量化参数和边界滤波强度确定。
样点自适应偏移(SAO)应用处理是减少经过去块滤波的图像中的像素与原始图像中的像素之间的失真的处理。基于每个画面或基于每个条带来确定是否应用样点自适应偏移(SAO)应用处理。
可将画面或条带划分为多个偏移区域,并且可针对每个偏移区域确定偏移类型。偏移类型可包括预定数量的边缘偏移类型(例如,四个边缘偏移类型)和两个带偏移类型。
例如,当偏移类型是边缘偏移类型中的一个时,针对每个像素确定边缘类型,并且将与边缘类型对应的偏移应用于每个像素。通过将当前像素与邻近的两个像素进行比较来确定边缘类型。
可根据从原始图像与应用了去块滤波或自适应偏移的重建图像之间的比较得到的值来执行自适应环路滤波。
画面存储单元780从后处理单元770接收经过后处理的图像数据,基于每个画面重建图像,并且存储重建的图像。画面是与一帧或一域对应的图像。
帧间预测单元760使用存储在画面存储单元780中的一个或更多个画面来执行运动估计,并且确定指定一个或更多个参考画面的一个或更多个参考画面索引以及一个或更多个运动矢量。
在这种情况下,可根据确定的一个或更多个参考画面索引和确定的一个或更多个运动矢量,从存储在画面存储单元780中的画面之中的用于运动估计的参考画面提取与将被编码的预测单元对应的预测块(在下文中称为预测块)。
帧内预测单元750使用包括当前预测单元的画面内的重建像素值来执行帧内预测编码。
帧内预测单元750接收当前预测单元(PU)以进行预测编码,根据当前块的尺寸在预定数量的帧内预测模式中选择一个帧内预测模式,并且使用选择的帧内预测模式对当前PU执行帧内预测。
帧内预测单元750可自适应地对参考像素进行滤波以生成帧内预测块。当参考像素不可用时,帧内预测单元750可使用可用像素来生成参考像素。
熵编码单元740对由量化单元730量化的量化系数、从帧内预测单元750接收到的帧内预测信息、从帧间预测单元760接收到的运动信息等进行熵编码。
图12是根据本公开的一个实施例的用于描述在图像编码设备中执行帧间预测的方法的框图。示出的帧间预测编码器包括运动信息确定单元1261、运动信息编码模式确定单元1262、运动信息编码单元1263、预测块生成单元1264、残差块生成单元1265、残差块编码单元1266和复用器1267。
参照图12,运动信息确定单元1261确定当前块的运动信息。运动信息包括参考画面索引和运动矢量。参考画面索引指示先前编码和重建的画面。
当通过单向帧间预测对当前块进行编码时,指示列表0(L0)中的参考画面中的一个参考画面的参考画面索引被包括。当通过双向预测对当前块进行编码时,指示列表0(L0)中的参考画面中的一个参考画面的参考画面索引和指示列表1(L1)中的参考画面中的一个参考画面的参考画面索引可被包括。
此外,当通过双向预测对当前块进行编码时,指示通过将列表0和列表1组合而生成的合成列表LC中的参考画面中的一个或两个画面的索引可被包括。
运动矢量指示由每个参考画面索引指示的画面内的预测块的位置,并且可基于每个像素(基于每个整数像素)或基于每个子像素表示运动矢量。
例如,运动矢量可具有子像素的分辨率,诸如二分之一像素、四分之一像素、八分之一像素或十六分之一像素的分辨率。当运动矢量不具有整数像素的分辨率时,可基于每个整数像素生成预测块。
运动信息编码模式确定单元1262将跳过模式、合并模式和AMVP模式中的一个确定为针对当前块的运动信息的编码模式。
当存在具有与当前块的运动信息相同的运动信息的跳过候选并且残差信号为零时,使用跳过模式。当作为预测单元PU的当前块具有与编码单元(CU)相同的尺寸时,使用跳过模式。
当存在具有与当前块的运动信息相同的运动信息的合并候选时,使用合并模式。当当前块的尺寸与编码单元(CU)的尺寸不同时,使用合并模式。另一方面,合并候选和跳过候选可以是同一个。
当跳过模式和合并模式不适用时,使用AMVP模式。将具有与当前块的运动矢量最相似的运动矢量的AMVP候选选作AMVP预测因子。
运动信息编码单元1263根据由运动信息编码模式确定单元1262确定的方法对运动信息进行编码。
例如,运动信息编码单元1263在运动信息编码模式是跳过模式或合并模式时执行合并运动矢量编码处理,并且在运动信息编码模式是AMVP模式时执行AMVP编码处理。
预测块生成单元1264使用当前块的运动信息来生成预测块。当运动矢量具有整数像素的分辨率时,预测块生成单元1264将与由参考画面索引指示的画面中的由运动矢量指示的位置对应的块复制为当前块的预测块。
另一方面,当运动矢量不具有整数像素的分辨率时,预测块生成单元1264从由参考画面索引指示的画面中的整数像素生成预测块的像素。
在这种情况下,使用针对亮度像素的8抽头插值滤波器来生成预测像素,并且使用针对色度像素的4抽头插值滤波器来生成预测像素。
残差块生成单元1265从当前块和当前块的预测块生成残差块。当当前块具有2N×2N的尺寸时,残差块生成单元1265使用当前块和与当前块对应的2N×2N的预测块来生成残差块。
另一方面,当用于预测的当前块具有2N×N或N×2N的尺寸时,获得针对构成一个2N×2N的块的各个2N×N的块的两个预测块,并且使用该两个2N×N的预测块生成2N×2N的最终预测块。
此外,可使用2N×2N的预测块来生成2N×2N尺寸的残差块。重叠平滑可被应用于边界像素,以消除两个2N×N的预测块之间的边界处的不连续。
残差块编码单元1266可将残差块划分为一个或更多个变换单元(TU),并且可对每个变换单元(TU)进行变换编码、量化和熵编码。
残差块编码单元1266可通过使用基于整数的变换矩阵来对通过帧间预测生成的残差块进行变换,并且变换矩阵可以是基于整数的DCT矩阵。
另一方面,残差块编码单元1266使用量化矩阵来对通过使用变换矩阵变换的残差块的系数进行量化。可根据量化参数来确定量化矩阵。
针对尺寸等于或大于预定尺寸的每个编码单元(CU)确定量化参数。当当前编码单元(CU)小于预定尺寸时,仅对尺寸等于或大于预定尺寸的编码单元中的按照编码顺序首先出现的第一编码单元的量化参数进行编码,并且因为剩余编码单元(CU)的量化参数与第一编码单元(CU)相同,所以不对剩余编码单元(CU)的量化参数进行编码。
此外,可使用根据量化参数和预测模式确定的量化矩阵来对变换块的系数进行量化。
可使用与当前编码单元(CU)相邻的编码单元(CU)的量化参数来对针对尺寸等于或大于预定尺寸的各个编码单元(CU)确定的量化参数进行预测编码。
通过按照左侧编码单元(CU)和上方编码单元(CU)的顺序对左侧编码单元(CU)和上方编码单元(CU)进行搜索来检索一个或两个有效量化参数,并且使用检索到的所述一个或两个有效量化参数来生成当前编码单元(CU)的量化参数预测因子。
例如,可将按照上述顺序检索到的量化参数中的首先出现的有效量化参数确定为当前块的量化参数预测因子。可选地,可通过按照在编码顺序方面为当前编码单元的左侧编码单元(CU)和当前编码单元的先前编码单元(CU)的顺序对当前编码单元的左侧编码单元(CU)和当前编码单元的先前编码单元(CU)进行搜索,将首先出现的有效量化参数确定为量化参数预测因子。
对经过量化的变换块的系数进行扫描并将其变换为一维量化系数集,并且可根据熵编码模式来不同地设置扫描模式。
例如,当通过CABAC进行编码时,可以以预定方式(即,利用Z字形或对角线光栅扫描)扫描通过帧间预测编码的量化系数。当通过CAVLC进行编码时,可以以与上述扫描方式不同的方式执行扫描。
例如,针对帧间预测编码执行扫描,可使用Z字形扫描。另一方面,当针对帧内预测编码执行扫描时,可根据将被使用的帧内预测模式来确定扫描方法。可依据变换单元的尺寸不同地确定系数扫描方法。
扫描模式可依据方向预测模式中的选择的模式而变化,并且可沿相反方向扫描量化系数。
复用器1267对由运动信息编码单元1263编码的运动信息和由残差块编码单元1266编码的残差信号进行复用。
例如,在跳过模式或合并模式的情况下,运动信息仅包括指示预测因子的索引。在AMVP模式的情况下,运动信息可包括当前块的参考画面索引、差运动矢量和AMVP索引。
在下文中,将详细描述图7中示出的帧内预测单元750的操作的一个实施例。
帧内预测单元750从画面分区单元710接收预测单元PU的尺寸和预测模式信息,并且从画面存储单元780读取参考像素,以确定预测单元(PU)的帧内预测模式。
帧内预测单元750通过检查是否存在不可用像素来确定是否创建参考像素,并且参考像素可被用于确定多个帧内预测模式中的针对当前块的一个帧内预测模式。
当当前块位于当前画面的上边界时,与当前块的上边界相邻的像素未被定义。当当前块位于当前画面的左边界时,与当前块的左边界相邻的像素未被定义。这些未定义的像素被认为是不可用像素。
此外,当当前块位于条带边界并且因此与条带的上边界或左边界相邻的像素不是预先编码和重建的像素时,这些像素也被认为是不可用像素。
如上所述,当不存在位于当前块的左侧或上方的像素时,或者当不存在先前被编码和重建的像素时,仅基于可用像素确定用于当前块的预测的帧内预测模式。
另一方面,可通过从当前块的可用参考像素复制像素值来生成在不可用像素位置处的这些参考像素。例如,当当前块的上方块中的像素不可用时,将当前块的左侧块中的像素部分或全部用于生成所述上方块中的像素,反之亦然。
也就是说,可通过将来自最接近的可用参考像素的像素值复制到预定方向上的不可用像素位置来产生这些参考像素。另一方面,当在预定方向上不存在与当前块相邻的可用参考像素时,在相反方向上最接近的可用参考像素的像素值可被复制以生成参考像素。
尽管在当前块的上方块或左侧块中存在像素,但是可能存在如下情况:依据所述上方块或所述左侧块的编码模式,所述上方块或所述左侧块中存在的像素不能被用作可用参考像素。
例如,当与当前块的上边界相邻的参考像素所属的上方块是先前被帧间预测编码并且随后被重建的块时,该参考像素被确定为不可用像素。
在这种情况下,可使用属于与当前块相邻的先前被帧内预测编码和重建的邻近块的像素来生成可用参考像素。编码设备700可将指示根据编码模式确定可用参考像素的事实的信息发送到解码设备1300。
帧内预测单元750通过使用参考像素来确定当前块的帧内预测模式。根据当前块的尺寸来确定可被应用于当前块的帧内预测模式的数量。
例如,当当前块具有8×8尺寸、16×16尺寸或32×32尺寸时,34个帧内预测模式是可用的。另一方面,当当前块具有4×4尺寸时,17个帧内预测模式是可用的。此外,可依据块尺寸将所述34个帧内预测模式进一步细分为67个帧内预测模式。
67、34或17个帧内预测模式包括至少一个非方向模式和多个方向模式。
所述至少一个非方向模式包括DC模式和/或平面模式。当DC模式和平面模式被分类为非方向模式时,可存在用于当前块的帧内预测的67或35个帧内预测模式,而不管当前块的尺寸如何。
在这种情况下,两个非方向模式(DC模式和平面模式)以及64或33个方向模式可用于当前块的预测。
当使用平面模式时,至少一个像素的值(或像素的预测值,在下文中称为第一参考值)和参考像素被用于生成当前块的预测块,其中,所述至少一个像素位于当前块的右下角。
具体地,为了使用增加的数量的方向模式(即,65种方向模式),帧内预测单元750可使用最可能模式(MPM)机制作为帧内模式编码/解码方法。在这种情况下,可选择预定数量(例如,N个)的最可能模式(MPM),并且可在MPM中确定最佳帧内方向模式。这里,N可以是1或更大的整数(即,1、2、3、4、5、……中的任意一个)。下面给出的描述涉及本发明的一个实施例,其中,提取了六个MPM。
帧内预测单元750可通过获得与候选位置对应的邻近块的帧内模式、推导当前块的帧内模式或使用基本帧内模式来构建MPM列表。
初始MPM列表可包括邻近块的5个帧内模式、平面模式和DC模式。帧内预测单元750可通过根据顺序处理操作消除模式中的冗余来构建包括独特模式的MPM列表。因此,按照左侧、上方、平面、DC、左下方、右上方和左上方模式的顺序排列初始帧内模式。当在6模式MPM列表中存在任何空间时,推导出的模式可被添加以填充该空间。例如,可通过将-1或+1加到MPM列表中包括的方向模式的模式编号来推导将被添加到MPM列表的模式。
当即使在执行上述处理之后MPM列表仍然具有空间时,可根据下述顺序将基本模式添加到列表。基本模式:垂直、水平、模式2和对角线模式。全部通过这些处理,可构建具有六个独特模式的列表。
可从上面已经参照图7至图12描述的图像编码设备700的配置推导根据本发明的一个实施例的图像解码设备的配置。可通过按照相反顺序执行上面参照图7至图12描述的图像编码方法的处理来对图像进行解码。
图13是示出根据本发明的一个实施例的运动图像解码设备的配置的框图。解码设备1300包括熵解码单元1310、反量化/逆变换单元1320、加法器1370、去块滤波器1350、画面存储单元1360、帧内预测单元1330、运动补偿预测单元1340和帧内/帧间转换开关1380。图13示出图2的一个实施例。
熵解码单元1310从图像编码设备80接收经过编码的比特流,将比特流解码并解析为帧内预测模式索引、运动信息、量化系数序列等,并且将经过解码的运动信息馈送到运动补偿预测单元1340。
熵解码单元1310将帧内预测模式索引传送到帧内预测单元1330和反量化/逆变换单元1320,使得反量化系数序列可被传送到反量化/逆变换单元1320。
反量化/逆变换单元1320使用多个扫描模式中的任意一个将量化系数序列变换为二维排列的反量化系数集。例如,基于当前块的预测模式(帧内预测或帧间预测)以及当预测模式是帧内时的帧内预测模式来执行对扫描模式的选择。
反量化/逆变换单元1320通过将从多个量化矩阵中选择的量化矩阵应用于二维排列的反量化系数集来重建量化系数。
依据将被重建的当前块的尺寸,可应用不同的量化矩阵。针对具有相同尺寸的块,可根据当前块的预测模式和当前块的帧内预测模式中的至少一个使用不同的量化矩阵。
反量化/逆变换单元1320可对重建的量化系数执行反量化处理以生成残差块。基于每个变换单元(TU)执行反量化处理。
加法器1370通过将由反量化/逆变换单元1320重建的残差块与由运动补偿预测单元1340生成的预测块相加来重建图像块。
去块滤波器1350对由加法器1370生成的重建图像执行去块滤波处理,以减少由在量化处理中发生的图像损失引起的去块伪像。
画面存储单元1360是用于存储局部解码的图像的帧存储器,其中,所述局部解码的图像是由去块滤波器执行去块滤波处理而得到的。
帧内预测单元1330基于从熵解码单元1310接收到的帧内预测模式索引来重建当前块的帧内预测模式,并且根据重建的帧内预测模式生成预测块。
运动补偿预测单元1340从存储在画面存储单元1360中的画面生成与当前块对应的预测块。运动补偿预测单元1340可在应用小数精度的运动补偿时通过使用一个选择的插值滤波器来生成预测块。
帧内/帧间转换开关1380可根据编码模式向加法器1370提供由帧内预测单元1330或运动补偿预测单元1340生成的预测块。
图14是用于描述根据本公开的一个实施例的在图像解码设备中执行的帧间预测处理的框图。
帧间预测解码器包括解复用器1441、运动信息编码模式确定单元1442、合并模式运动信息解码单元1443、AMVP模式运动信息解码单元1444、预测块生成单元1445、残差块解码单元1446和重建块生成单元1447。这里,合并模式运动信息解码单元1443和AMVP模式运动信息解码单元1444可被包括在运动信息解码单元(未示出)中。
参照图14,解复用器1441对接收到的比特流进行解复用,以恢复包括在接收到的比特流中的当前编码的运动信息和编码的残差信号。解复用器1441将恢复的运动信息发送到运动信息编码模式确定单元1442,并且将恢复的残差信号发送到残差块解码单元1446。
运动信息编码模式确定单元1442确定当前块的运动信息编码模式。当接收到的比特流中的跳过标志skip_flag具有值1时,运动信息编码模式确定单元1442可确定当前块的运动信息编码模式是以跳过模式被编码的。
当接收到的比特流中的跳过标志skip_flag具有值0并且从解复用器1441接收到的运动信息仅具有合并索引时,运动信息编码模式确定单元1442可确定当前块的运动信息编码模式是以合并模式被编码的。
此外,当接收到的比特流中的跳过标志skip_flag具有值0并且从解复用器1441接收到的运动信息具有参考画面索引、差分运动矢量和AMVP索引时,运动信息编码模式确定单元1442可确定当前块的运动信息编码模式是以AMVP模式被编码的。
当运动信息编码模式确定单元1442确定当前块的运动信息编码模式是跳过模式或合并模式时,激活合并模式运动信息解码单元1443。当运动信息编码模式确定单元1442确定当前块的运动信息编码模式是AMVP模式时,可激活AMVP模式运动信息解码单元1444。
预测块生成单元1345使用由合并模式运动信息解码单元1443或AMVP模式运动信息解码单元1444重建的运动信息来生成当前块的预测块。
当运动矢量具有整数像素的分辨率时,对与由参考画面索引指示的画面中的由运动矢量所指示的位置对应的块进行复制以生成当前块的预测块。
另一方面,当运动矢量不具有整数像素的分辨率时,从由参考画面索引指示的画面中的整数像素生成预测块的像素(在下文中称为预测像素)。在这种情况下,使用针对亮度像素的八抽头插值滤波器和针对色度像素的四抽头插值滤波器来生成预测像素。
残差块解码单元1446通过对残差信号进行熵解码并且对经过熵解码的系数进行逆扫描来生成二维量化系数块。逆扫描方法可基于熵解码方法变化。
例如,对角线光栅逆扫描方法可被用于基于CABAC的解码,并且Z字形逆扫描方法可被用于基于CAVLC的解码。此外,可基于预测块的尺寸确定逆扫描方法。
残差块解码单元1446使用反量化矩阵对生成的系数块进行反量化。为了推导量化矩阵,量化参数被重建。针对具有预定尺寸或更大尺寸的每个编码单元重建量化步长。
残差块解码单元1446通过对反量化系数块进行逆变换来重建残差块。
重建块生成单元1447通过将由预测块生成单元1445生成的预测块与由残差块解码单元1446生成的残差块相加来生成重建块。
在下文中,将参照图13描述根据实施例的通过帧内预测重建当前块的处理。
首先,通过对接收到的比特流进行解码来获得当前块的帧内预测模式。为此,熵解码单元1310参考多个帧内预测模式表中的一个以重建当前块的第一帧内预测模式索引。
多个帧内预测模式表是由编码设备700和解码设备1300共享的表。根据与当前块相邻的多个块的帧内预测模式的分布从帧内预测模式表中选择的一个表可被使用。
例如,当当前块的左侧块的帧内预测模式与当前块的上方块的帧内预测模式相同时,第一帧内预测模式表被用于重建当前块的第一帧内预测模式索引。相反,当当前块的左侧块的帧内预测模式与当前块的上方块的帧内预测模式不同时,可通过使用第二帧内预测模式表来重建当前块的第一帧内预测模式索引。
作为另一示例,当当前块的上方块和左侧块的帧内预测模式都是方向帧内预测模式时并且当所述上方块和所述左侧块的帧内预测模式的取向之间的角度在预定角度范围内时,可使用第一帧内预测模式表来重建当前块的第一帧内预测模式索引。另一方面,当该角度在所述预定角度范围之外时,可使用第二帧内预测模式表来重建当前块的第一帧内预测模式索引。
熵解码单元1310将重建的当前块的第一帧内预测模式索引发送到帧内预测单元1330。
当所述索引具有最小值时(即,当所述索引为0时),接收第一帧内预测模式索引的帧内预测单元1330可将当前块的最大可允许模式确定为当前块的帧内预测模式。
另一方面,当所述索引具有非零的值时,帧内预测单元1330将由当前块的最大可允许模式指示的索引与第一帧内预测模式索引进行比较,并且当第一帧内预测模式索引不小于由当前块的最大可允许模式指示的索引时,将与通过向第一帧内预测模式索引加1而获得的第二帧内预测模式索引对应的帧内预测模式确定为当前块的帧内预测模式。当第一帧内预测模式索引小于由当前块的最大可允许模式指示的索引时,帧内预测单元1330可将与第一帧内预测模式索引对应的帧内预测模式确定为当前块的帧内预测模式。
当前块的可允许的帧内预测模式的集合可包括至少一个非方向模式和多个方向模式。
所述至少一个非方向模式的示例可以是DC模式和/或平面模式。此外,DC模式或平面模式可自适应地被包括在可允许的帧内预测模式集中。
为此,指定包括在可允许的帧内预测模式集中的非方向模式的信息可被包括在画面头或条带头中。
另外,当存在MPM标志时,帧内预测单元1330可从与编码目标块相邻的邻近块推导MPM候选模式,并且使用推导出的MPM候选模式生成MPM列表。在这种情况下,帧内预测单元1330可将从邻近块推导出的MPM候选添加到MPM列表。帧内预测单元1330使用生成的MPM列表对帧内预测模式进行编码。
具体地,在本发明的实施例中,帧内预测单元1330可基于经过逆变换的块的系数分布、邻近块的帧内预测模式和当前块的尺寸/形状中的至少一个限制当前块的可允许的帧内预测模式,并且在生成MPM候选列表时可限制预测模式候选。这里,限制处理可表示仅预定帧内预测模式被允许或所述预定帧内预测模式不被允许。
例如,作为针对当前块的可允许的帧内预测模式,基于从经过逆变换的块的系数分布、邻近块的帧内预测模式、当前块的尺寸和当前块的形状中的至少一个获取的信息,仅预定帧内预测模式可被允许。可选地,例如,基于从经过逆变换的块的系数分布、邻近块的帧内预测模式、当前块的尺寸和当前块的形状中的至少一个获取的信息,仅预定帧内预测模式可被允许以生成MPM候选模式列表。
此外,在本发明的实施例中,帧内预测单元1330可基于经过逆变换的块的系数分布、邻近块的帧内预测模式以及当前块的尺寸和形状中的至少一个来自适应地执行限制当前块的可允许的帧内预测模式的处理,并且可在生成MPM候选模式列表时方向自适应地对预测模式候选进行处理。这里,方向自适应处理可表示基于关于预定方向的信息执行处理。
也就是说,基于从经过逆变换的块的系数分布、邻近块的帧内预测模式、当前块的尺寸和当前块的形状中的至少一个获取的关于预定方向的信息,可确定针对当前块的可允许的帧内预测模式。可选地,为了生成MPM候选模式列表,可基于从经过逆变换的块的系数分布、邻近块的帧内预测模式、当前块的尺寸和当前块的形状中的至少一个获取的关于预定方向的信息来确定MPM候选。可选地,可基于从经过逆变换的块的系数分布、邻近块的帧内预测模式、当前块的尺寸和当前块的形状中的至少一个获取的预定方向信息来选择非MPM模式中的预定模式。与非MPM模式相比,可使用相对小的二进制位对预定模式进行编码/解码。
方向自适应地对当前块的可允许的帧内预测模式进行处理可表示基于当前块的尺寸和/或形状确定可允许的帧内预测模式。例如,当当前块的形状是矩形时,可根据当前块的宽度与高度的比率来限制预定方向模式。可选地,可根据对角线分量的尺寸和/或方向来限制预定方向模式。预定方向模式可以是具有水平方向性或垂直方向性的模式。
在这种情况下,通过改变用于预测受限的方向模式的参考像素,可将与改变的参考像素对应的模式确定为可允许的帧内预测模式而不是受限的方向模式。例如,当当前块是矩形的2N×N的块时,可将可允许的帧内预测模式限制为作为用于使用左下方块中的参考像素执行预测的模式的帧内预测模式。可将作为用于使用右上方块中的参考像素执行预测的模式的帧内预测模式确定为可允许的帧内预测模式,而不是受限的模式。此外,例如,当当前块是矩形的N×2N的块时,可允许的帧内预测模式被限制为作为用于使用右上方块中的参考像素执行预测的模式的帧内预测模式。可选地,将作为用于使用左下方块中的参考像素执行预测的模式的帧内预测模式确定为可允许的帧内预测模式,而不是受限的模式。
此外,受限的帧内预测模式和/或用于替换受限的帧内预测模式的帧内预测模式的数量可根据当前块的尺寸和/或形状而变化。例如,所述数量可依据当前块的宽度与高度的比率或者对角线分量的尺寸和/或方向而变化。此外,受限的帧内预测模式的数量可与用于替换受限的帧内预测模式的帧内预测模式的数量不同。
接下来,为了生成帧内预测块(通过帧内预测生成的预测块),帧内预测单元1330从画面存储单元1360读取参考像素,并且确定是否存在不可用参考像素。
通过应用当前块的经过解码的帧内预测模式,可根据是否存在用于生成帧内预测块的参考像素来执行确定操作。
接下来,当需要生成参考像素时,帧内预测单元1330可通过使用先前重建的可用参考像素来生成布置在不可用像素位置处的参考像素。
不可用参考像素的定义和生成参考像素的方法可与图7中所示的帧内预测单元750中使用的相同。然而,可依据当前块的经过解码的帧内预测模式选择性地重建用于生成帧内预测块的参考像素。
此外,帧内预测单元1330确定是否将滤波器应用于参考像素以生成预测块。也就是说,帧内预测单元1330可基于当前预测块的经过解码的帧内预测模式和尺寸来确定是否将滤波器应用于参考像素以生成当前块的帧内预测块。
随着块尺寸越大,块效应的问题越严重。随着块尺寸增加,用于对参考像素进行滤波的预测模式的数量增加。当块尺寸大于预定尺寸时,该块被认为是平坦区域。因此,为了降低计算复杂度,可不对参考像素进行滤波。
当确定需要对参考像素应用滤波时,帧内预测单元1330使用滤波器对参考像素进行滤波。
可根据参考像素之间的步差自适应地使用两个或更多个滤波器。滤波器的滤波器系数最好是对称的。
可根据当前块的尺寸自适应地应用两个或更多个滤波器。当应用滤波器时,可将窄带滤波器应用于较小的块,并且可将宽带滤波器应用于较大的块。
当使用DC模式进行预测时,产生具有参考像素的像素值的平均值的预测块,从而无需应用滤波。当图像具有与垂直方向相关联的垂直模式或与水平方向相关联的水平模式时,可无需对参考像素应用滤波。
以这种方式,由于滤波的应用与当前块的帧内预测模式相关联,因此可依据当前块的帧内预测模式和预测块的尺寸自适应地对参考像素进行滤波。
接下来,帧内预测单元1330根据重建的帧内预测模式,使用参考像素或经过滤波的参考像素来生成预测块。可以以与编码设备700中相同的方式来执行预测块的生成。因此,可不描述用于解码的预测块的生成的细节。
帧内预测单元1330确定是否对生成的预测块进行滤波。可基于包括在条带头或编码单元头中的信息或者根据当前块的帧内预测模式来确定是否执行滤波。
当确定生成的预测块将被滤波时,帧内预测单元1330可通过使用与当前块相邻的可用参考像素对预测块的特定位置处的像素进行滤波来生成新像素。
例如,当使用DC模式时,在所有预测像素中,可使用与预测像素相邻的参考像素对与参考像素相邻的一些预测像素进行滤波。
因此,根据预测像素的位置,使用一个或两个参考像素对预测像素进行滤波,并且可将在DC模式下对预测像素的滤波应用于所有尺寸的预测块。
另一方面,在垂直模式的情况下,在预测块的预测像素中,可使用用于生成预测块的除了上方参考像素之外的参考像素来修改与左侧参考像素相邻的预测像素。
以类似的方式,在水平模式的情况下,在生成的预测像素中,可使用用于生成预测块的除了左侧参考像素之外的参考像素来修改与上方参考像素相邻的预测像素。
预测像素的滤波可表示使用从预定帧内预测模式预测的值以及一个或更多个参考像素来执行滤波。例如,可通过对使用方向预测生成的预测值和与当前块相邻的一个或更多个参考像素的一个或更多个值进行加权求和来执行滤波。
以这种方式,可使用当前块的重建的预测块和当前块的残差块来重建当前块。
图15是示出根据本公开的另一实施例的将图像分区为块并且基于每个块执行图像处理的方法的示图。
参照图15,使用四叉树结构对具有256×256的最大尺寸的编码树单元(CTU)进行分区以生成四个正方形编码单元(CU)。
在从四叉树结构分区得到的CU中,可使用二叉树结构对至少一个CU进行分区以产生具有矩形形状的两个CU。可使用三叉树结构进一步对CU中的至少一个CU进行分区。
在从四叉树结构分区得到的CU中,可使用四叉树结构进一步对至少一个CU进行分区以产生四个正方形CU。
在从二叉树结构分区得到的CU中,可通过二叉树结构分区进一步对至少一个CU进行分区以产生具有矩形形状的两个更小的CU。
在从四叉树分区得到的CU中,可通过四叉树结构分区或二叉树结构分区将至少一个CU进一步分区为具有正方形形状或矩形形状的更小的CU。
从二叉树结构分区得到的编码块(CB)可不被进一步分区,但是可按照原样被用于预测和变换。图15中所示的编码块(CB)中的预测单元(PU)和变换单元(TU)的尺寸可具有与相应CB相同的尺寸。
可使用已经参照图9至图10描述的分区方法将通过四叉树结构分区产生的CU中的每个CU分区为一个PU或者两个或更多个PU。
可使用已经参照图11描述的分区方法将从四叉树结构分区得到的编码单元中的每个编码单元分区为一个TU或者两个或更多个TU,并且TU中的每个TU可具有64×64像素的最大尺寸。
用于将图像分区为块并且基于每个块对图像进行处理的语法结构可使用标志来表示分区信息。例如,可使用标志split_cu_flag来表示CU是否被分区,并且可使用标志二进制深度来表示通过二叉树结构分区生成的CU的深度。此外,可使用附加标志binary_split_flag来表示CU是否通过二叉树结构分区被分区。
可通过应用已经参照图7至图14描述的方法对从已经参照图15描述的分区操作得到的块(例如,CU、PU和TU)执行图像编码和解码。
在下文中,参照图16至图21,将描述根据另一实施例的将CU分区为一个TU或者两个或更多个TU的方法。
根据本发明的实施例,可将CU分区为通过二叉树结构分区生成的TU,其中,所述TU中的每个TU是用于对残差块进行变换的基本单元。
图16是根据本公开的另一实施例的用于描述将图像分区为块并且基于每个块执行图像处理的方法的示图。
参照图16,通过二叉树结构分区生成的矩形编码块CB0和CB1中的至少一个可通过二叉树结构分区被进一步分区为正方形变换单元TU0和TU1,其中,所述矩形编码块CB0和CB1中的每一个具有N×2N或2N×N的尺寸,所述正方形变换单元TU0和TU1具有N×N尺寸。
如上所述,基于块的图像编码方法可执行预测、变换、量化和熵编码处理。
在预测处理中,通过参考将被编码的当前块、先前编码的图像或先前编码的邻近图像来生成预测信号,并且计算作为预测信号与当前块之间的差的差分信号。
在变换处理中,可使用各种变换函数对差分信号(输入信号)执行变换。将变换信号分类为DC系数和AC系数,并且执行能量压缩以提高编码效率。
在量化处理中,对输入的变换系数执行量化,并且随后对经过量化的信号执行熵编码以生成编码图像。
可以以与编码方法相反的顺序执行图像解码方法,并且在量化处理中可能发生图像质量失真。
作为提高编码效率和减少图像质量失真的方法,TU的尺寸或形状以及所使用的变换函数可根据变换处理中的差分信号(输入信号)的分布和图像的性质而变化。
例如,当使用代价测量方法(诸如绝对差和(SAD)或均方误差(MSE))在预测处理中通过基于块的运动估计找到与当前块相似的块时,差分信号的分布可依据图像的性质以多种形式出现。
因此,通过经由基于差分信号的各种分布形式选择变换单元(TU)的尺寸或形状来执行变换,可执行有效的编码。
例如,当在任意编码块(CBx)中出现差分信号时,可通过经由二叉树结构分区将编码块(CBx)划分为两个变换单元(TU)来执行有效的变换。通常认为DC值表示输入信号的平均值。因此,当在变换处理中输入差分信号时,由于编码块(CBx)中的每一个被分区为两个变换单元(TU),因此DC值可被有效地表示。
参照图17,可通过二叉树结构分区将正方形的2N×2N的编码单元CU0分区为具有N×2N尺寸或2N×N尺寸的两个矩形变换单元TU0和UT1。
根据本发明的另一实施例,如上所述,通过对编码单元(CU)执行两次或更多次二叉树结构分区,生成多个变换单元(TU)。
参照图18,首先通过二叉树结构分区将N×2N的矩形编码块CB1分区为两个N×N的块,并且随后通过二叉树结构分区将所述两个N×N的块中的每一个进一步分区为N×N/2的矩形块或N/2×N的矩形块。然后,通过二叉树结构分区将所述N/2×N或N×N/2的块进一步分区为N/2×N/2的正方形变换单元TU1、TU2、TU4和TU5。
参照图19,2N×2N的正方形编码块CB0可通过二叉树结构分区被分区以生成N×2N的块,该N×2N的块可通过二叉树结构分区被进一步分区以生成N×N的正方形块,并且该N×N的正方形块可通过二叉树结构分区被进一步分区以生成N/2×N的矩形变换单元TU1和TU2。
参照图20,2N×N的矩形编码块CB0可通过二叉树结构分区被分区以生成N×N的块,并且该N×N的块中的每一个可通过四叉树结构分区被分区以生成N/2×N/2的正方形变换单元TU1、TU2、TU3和TU4。
针对从参照图16至图20描述的分区方法得到的块(例如,编码单元(CU)、预测单元(PU)和变换单元(TU)),可使用已经参照图7至图14描述的方法来执行图像编码和解码。
在下文中,将描述编码设备700确定块分区结构的方法的实施例。
图像编码设备700中的画面分区单元110可通过根据预设顺序执行率失真优化(RDO)来确定可划分的编码单元(CU)、预测单元PU和变换单元TU。
例如,为了确定块分区结构,画面分区单元710可通过执行率失真优化量化(RDO-Q)来确定在比特率和失真方面最佳的块分区结构。
参照图21,当编码单元CU具有2N×2N像素尺寸时,通过按照如下顺序执行RDO:(a)2N×2N像素尺寸、(b)N×N像素尺寸、(c)N×2N像素尺寸以及(d)2N×N像素尺寸,可确定变换单元TU的最佳分区结构。
参照图22,当编码单元CU具有N×2N像素尺寸或2N×N像素尺寸时,通过按照如下顺序执行RDO:(a)N×2N像素尺寸(或2N×N像素尺寸)、(b)N×N像素尺寸、(c)N/2×N(或N×N/2)像素尺寸和N×N像素尺寸、(d)N/2×N/2像素尺寸、N/2×N像素尺寸和N×N像素尺寸以及(e)N/2×N像素尺寸,可确定变换单元TU的最佳分区结构。
在上文中,尽管已经参照执行率失真优化(RDO)以确定块分区结构的示例描述了根据本发明的块分区方法,但是画面分区单元710可使用绝对差(DAD)算法或均方误差(MSE)算法的总和来确定块分区结构,从而在提高效率与降低复杂度之间提供好的折衷。
在下文中,将更详细地描述根据本发明的一个实施例的图像处理方法和使用该图像处理方法的图像编码和解码方法。
图23是根据本公开的一个实施例的用于描述用于确定帧内预测单元的帧内预测模式的配置的框图。
参照图23,根据本发明的一个实施例的帧内预测单元1330包括:邻近块信息处理单元,包括系数分布识别单元2331和邻近模式识别单元2332;相似标志确定单元2333;相似标志存储单元2335;以及模式确定单元2334。
帧内预测单元1330可确定当前块的帧内预测模式。例如,模式确定单元2334可基于关于位于当前块的附近的先前解码的邻近块的信息,对与当前块对应的帧内模式执行限制处理或方向自适应处理。邻近块信息处理单元可获得关于位于将被帧内预测解码的当前块的附近的先前解码的邻近块的信息。模式确定单元2334可使用邻近块信息处理单元来解析比特流以获得信息。此外,当存在先前处理的邻近块的相似标志信息时,模式确定单元2334可从相似标志存储单元2335获得相似标志信息。模式确定单元2334可使用获得的相似标志信息对与当前块对应的候选模式执行限制处理或方向自适应处理。这里,限制处理可表示仅预定帧内预测模式被允许或预定帧内预测模式不被允许。例如,基于关于邻近块的信息和/或邻近块的相似标志信息,仅与当前块对应的预定帧内预测模式可被允许。这里,方向自适应处理可表示基于关于预定方向的信息执行处理。例如,可基于从关于邻近块的信息和/或邻近块的相似标志信息获得的预定方向信息来确定与当前块对应的帧内预测模式。
此外,帧内预测单元1330可通过使用由相似标志确定单元2333确定的信息从关于邻近块的信息确定与当前块对应的相似标志IS_SIMILAR_FLAG。确定的相似标志在相似标志存储单元2335中与当前标志相关联地被存储和更新,并且被用于确定下一个块的模式。
这里,关于邻近块的信息可包括逆变换系数分布信息、像素值改变信息、像素值信息和像素差值信息中的至少一个。例如,可使用包括在邻近块中的邻近像素的散布来计算像素值改变信息,并且散布的度量(measures)的示例包括统计指标,诸如方差、标准差、平均误差和四分位差。
邻近块信息处理单元可包括系数分布识别单元2331和邻近模式识别单元2332。邻近块信息处理单元可提供用于确定当前块的模式或相似标志的信息。
相似标志确定单元2333可获取由系数分布识别单元2331识别的逆变换系数分布信息。此外,相似标志确定单元2330可获取由邻近模式识别单元2332识别的邻近块的帧内模式信息。相似标志确定单元2333可通过使用获取的逆变换系数分布信息和/或邻近块的帧内模式信息来确定相似标志。这里,相似标志可包括水平相似标志或垂直相似标志。
水平相似标志指示先前解码的邻近块中的像素具有垂直方向性。具有垂直方向性表示与和当前块水平相邻的左侧块具有相似性。例如,水平相似标志指示与当前块水平相邻的先前解码的左侧块具有垂直方向性,这表示与当前块具有相似性。因此,该水平相似标志可由左相似标志IS-SIMILAR_LEFT表示。
垂直相似标志指示先前解码的邻近块具有水平方向性。具有水平方向性表示与和当前块垂直相邻的上方块具有相似性。例如,垂直相似标志指示与当前块垂直相邻的先前解码的上方块与当前块具有垂直相似性。该垂直相似标志可由上相似标志IS_SIMILAR_UP表示。
水平相似标志或垂直相似标志将从邻近块被计算,并且将被存储在相似标志存储单元2335中。另一方面,解码设备1300可持续更新相似标志信息以响应邻近块中的改变。可在没有附加信令信息的情况下进行以上处理。
相似标志确定单元2333可从系数分布识别单元2331获取关于邻近块的信息,例如,逆变换系数分布信息。相似标志确定单元2333可基于邻近块信息确定邻近块的水平方向性或垂直方向性。相似标志确定单元2333可使用邻近块的系数分布信息和/或帧内模式信息来更准确地确定方向性。此外,可使用确定的方向性来确定相似标志。
模式确定单元2334可基于先前处理的邻近块的相似标志信息对帧内模式确定执行限制处理或方向自适应处理。
这里,限制处理可表示仅允许预定帧内预测模式或不允许预定帧内预测模式。例如,可根据相似标志信息限制地对针对当前块的可允许的帧内预测模式进行处理。可选地,可限制地对MPM候选模式列表中的预测模式候选进行处理。更具体地,作为针对当前块的可允许的帧内预测模式,基于从经过逆变换的块的系数分布、邻近块的帧内预测模式、当前块的尺寸和当前块的形状中的至少一个获取的信息,仅预定帧内预测模式可被允许。可选地,当生成MPM候选模式列表时,基于从经过逆变换的块的系数分布、邻近块的帧内预测模式、当前块的尺寸和当前块的形状中的至少一个获取的信息,仅预定帧内预测模式候选可被允许。
这里,方向自适应处理可表示基于预定方向信息执行相应处理。例如,可根据相似标志信息限制地对当前块的可允许的帧内预测模式进行处理。可选地,可方向自适应地对MPM候选模式列表中的预测模式候选进行处理。更具体地,可基于从经过逆变换的块的系数分布、邻近块的帧内预测模式、当前块的尺寸和当前块的形状中的至少一个获取的预定方向信息来确定当前块的可允许的帧内预测模式。可选地,当生成MPM候选模式列表时,可基于从经过逆变换的块的系数分布、邻近块的帧内预测模式、当前块的尺寸和当前块的形状中的至少一个获取的预定方向信息来确定MPM候选。
另一方面,当确定相似标志时,系数分布识别单元2331可通过解析比特流来获得和使用仅变换系数信息。系数分布识别单元2331可不使用先前预测解码的块的像素信息或重建的残差信号。因此,限制处理或方向自适应处理可消除解析依赖性。
模式确定单元2334可在没有从编码设备700发送的附加信令信息的情况下执行限制处理。因此,可减少关于具有不必要方向性的预测模式候选的附加信令信息,并且可在不引起解码中的帧间处理解析依赖性的情况下提高压缩效率。
然而,本发明的一个实施例不排除用信号发送与邻近块对应的相似标志信息的情况。相似标志信息的确定和存储处理可根据需要以与编码设备700中相同的方式被执行。也就是说,编码设备700可基于邻近块信息生成相似标志,并且使用生成的相似标志以方向自适应的方式确定帧内模式。在这种情况下,生成的相似标志信息被包括在比特流中,并且因此作为比特流被发送到解码设备1300。模式确定单元2334即使不单独获得关于邻近块的信息或不对关于邻近块的信息进行处理,也可使用邻近块的用信号发送的相似标志信息来确定当前块的模式。因此,在这种情况下,可降低计算复杂度并提高解码设备的性能。
具体地,根据本发明的一个实施例的方向自适应处理可减少针对未由相似标志指示的特定方向的角度内的帧内预测模式的数量,从而简化处理。此外,方向自适应处理可通过对针对由相似标志指示的方向的角度进行更精细地划分来增加该角度内的帧内预测模式的数量。也就是说,尽管帧内预测模式候选的总数没有改变,但是可确定更加准确和精确的预测模式。
例如,当邻近块的帧内模式是水平方向模式时,由于当前块的最佳预测模式与水平方向模式相似的可能性很高,因此相对更多数量的方向模式可被分配给水平方向。另一方面,在这种情况下,相对少量的方向模式被分配给垂直方向。
图24和图25是示出根据本公开的一个实施例的使用方向自适应帧内预测模式执行帧内预测解码处理的方法的流程图。
图26和图27是示出根据本公开的一个实施例的为了获得方向自适应帧内模式而确定的水平相似标志和垂直相似标志的流程图。
参照图24,解码设备1300可获取关于邻近块的信息(S2410)。
例如,解码设备1300可使用系数分布识别单元2331和/或邻近模式识别单元2332来获取系数分布信息和/或帧内模式信息。
相似标志确定单元2333可通过使用关于邻近块的信息(例如,变换系数分布信息和/或帧内模式信息)来确定水平相似标志或垂直相似标志(S2420)。此外,可将在步骤S2420中确定的水平相似标志或垂直相似标志存储在相似标志存储单元2335中(S2430)。
这里,如图26和图27中所示,可基于关于邻近块的信息确定水平相似标志和/或垂直相似标志。例如,可从邻近块的变换系数信息确定水平相似标志和/或垂直相似标志。具体地,关于邻近块的信息可以是变换系数分布信息。相似标志可被用于确定块的帧内模式。
具体地,相似标志确定单元2333可使用邻近块的系数分布信息和/或帧内模式信息来确定将被逆变换的各个像素的残差值的分布是具有垂直方向性还是具有水平方向性。
更具体地,参照图26和图27,相似标志确定单元2333可基于从系数分布识别单元2331获取的变换域中的系数分布信息和邻近块的帧内模式信息,确定重建块中的最下一行或最右一列处的重建像素是否具有根据方向性的相似值。例如,可在解析步骤中执行前述确定操作。
这里,可根据变换核不同地对以上系数分布信息进行分类。相似标志确定单元2333可根据预设映射表来执行与根据变换核和帧内模式分类的系数分布中的至少一个对应的方向映射。
例如,如图26中所示,当DCT变换系数仅存在于第一行中或全部为零时,可确认位于最右一列的重建残差具有相同的值。
因此,相似标志确定单元2333可确定DCT系数是仅存在于邻近块的第一行中还是全部为零。在确定之后,相似标志确定单元2333可确定邻近块的帧内模式是DC模式还是垂直方向模式。
如上所述,当DCT变换系数仅存在于邻近块的第一行中或全部为零时并且当帧内模式是DC模式或垂直方向模式时,可假设将被重建的最右侧的重建像素具有相同的值。因此,当邻近块的DCT变换系数仅存在于邻近块的第一行中或全部为零时并且当帧内模式是DC模式或垂直方向模式时,相似标志确定单元2333可确定邻近块的重建的残差信号具有垂直性。相似标志确定单元2333将针对当前块的水平相似标志IS_SIMILAR_LEFT设置为值1。另一方面,当不满足上述条件时,水平相似标志IS_SIMILAR_LEFT可被设置为值0。
另一方面,参照图27,当DCT变换系数仅存在于第一列中或全部为零时,可确认位于最下一行的重建残差具有相同的值。
因此,当DCT变换系数仅存在于邻近块中的第一列中或全部为零时并且当帧内模式是DC模式或水平方向模式时,相似标志确定单元2333确定邻近块中的重建的残差信号具有水平性。相似标志确定单元2333可将针对当前块的垂直相似标志IS_SIMILAR_UP设置为值1。另一方面,当不满足上述条件时,垂直相似标志IS_SIMILAR_UP可被设置为值0。
因此,水平相似标志可指示当前块的左侧像素是否相似,并且垂直相似标志可指示当前块的上方像素是否相似。
此外,可通过使用水平相似标志和垂直相似标志中的一个来指示当前块的方向性。例如,当邻近块的DCT变换系数仅存在于邻近块的第一行中或全部为零时并且当帧内模式是DC模式或垂直方向模式时,相似标志确定单元2333确定邻近块中的重建的残差信号具有垂直性。根据该确定操作,可将针对当前块的水平相似标志确定为具有值1。当DCT变换系数仅存在于邻近块的第一列中或全部为零时并且当帧内模式是DC模式或水平方向模式时,相似标志确定单元2333确定邻近块的重建的残差信号具有水平性。然后,基于该确定操作,针对当前块的水平相似标志可被确定为具有值0。
如上所述,系数分布识别单元2331对比特流进行解析以识别系数分布,邻近模式识别单元2332识别邻近块的帧内模式,并且模式确定单元2334确定当前块的帧内模式。解码设备1300可通过解析处理来对此进行预先处理。例如,当根据帧内模式确定了变换系数的扫描方向时,可在解析处理中对根据本发明的一个实施例的帧内模式确定处理进行处理。
参照DCT变换描述了相似标志确定单元2333的操作。当使用与DCT不同的变换方法时,相似标志确定单元2333可使用不同变换的特征信息。例如,相似标志确定单元2333可识别与特征信息对应的系数分布信息,并且可根据系数分布信息确定水平相似标志或垂直相似标志。可根据在重建块中的下方一行或右侧一列中的重建像素是否在预定范围内具有相似值来确定水平相似标志或垂直相似标志。此外,在以上实施例中,预测了重建块中的最下方或最右侧的重建像素的方向性,但是不限于此。可通过DCT或另一种变换方法来预测在重建块中的任意位置处的重建像素的方向性。
尽管本发明的实施例给出了相似标志确定单元2333使用系数分布信息和帧内模式信息两者的示例,但是也可仅使用系数分布信息和帧内模式信息中的一个。
另一方面,当相似标志确定单元2333确定水平相似标志或垂直相似标志时,可在解析处理中将该标志存储为内部变量。该标志可被用于确定下一个块或下层块的帧内模式。因此,相似标志不被包括在将被发送的用于用信号发送的比特流中,但是可在解码设备1300中被处理和/或生成。然而,如上所述,依据效率,由编码设备700处理的相似标志可被用信号发送到解码设备1300。
参照图25,当存在已经针对其确定了相似标志的邻近块时,可识别当前块的邻近块(S2510)。
此外,可从相似标志确定单元2333获取与邻近块对应的水平相似标志或垂直相似标志(S2520)。可预先确定水平相似标志或垂直相似标志。
此外,依据获取的标志,可生成方向自适应帧内预测模式候选列表(S2530)。例如,可根据获取的标志创建受限的帧内模式候选列表。
然后,可从方向自适应帧内模式候选列表选择当前块的帧内模式(S2540)。例如,可从受限的帧内模式候选列表选择当前块的帧内模式。
图28至图31是示出根据本公开的一个实施例的针对某些情况的方向自适应帧内模式的示图。
根据本发明的一个实施例的帧内预测单元1330可基于从经过逆变换的块的系数分布、邻近块的帧内预测模式、当前块的尺寸和当前块的形状中的至少一个确定的相似标志来自适应地确定当前块的可允许的帧内预测模式。例如,基于从经过逆变换的块的系数分布、邻近块的帧内预测模式、当前块的尺寸和当前块的形状中的至少一个确定的相似标志的方向信息,当前块的可允许的帧内预测模式的数量可增加或减少。
此外,帧内预测单元1330可基于从经过逆变换的块的系数分布、邻近块的帧内预测模式、当前块的尺寸和当前块的形状中的至少一个确定的相似标志来确定当前块的MPM候选模式列表的预测模式候选。例如,基于从经过逆变换的块的系数分布、邻近块的帧内预测模式、当前块的尺寸和当前块的形状中的至少一个确定的相似标志的方向信息,当前块的MPM候选模式列表的预测模式候选的数量可增加或减少。
例如,当左侧邻近像素与当前块中的像素相似时,可减少水平方向上的帧内模式候选的数量,以简化水平方向或向左方向上的帧内模式候选。此外,为了细分(即,更精细地划分)向上方向或垂直方向上的帧内模式候选方向,可增加垂直方向上的帧内模式候选的数量。在这种情况下,水平方向上的任意模式都会产生几乎相同的预测。因此,垂直方向上的模式细分(即,更精细的划分)使得能够在垂直方向上更精细地调整帧内模式预测,从而提高预测精度和画面质量。这里,细分(即,更精细地划分)帧内模式候选方向表示增加预定方向上的帧内预测模式的数量。
当当前块的上方邻近像素中的每一个与当前块中的像素相似时,可减少垂直方向上的帧内模式候选的数量,以简化垂直方向或向上方向上的帧内模式候选。相反,可增加水平方向上的帧内模式候选的数量,以在水平方向上细分(即,更精细地划分)帧内模式候选方向。在这种情况下,垂直方向上的任意模式都会产生几乎相同的预测。因此,水平方向上的模式细分(更精细的划分)使得能够在水平方向上更精细地调整帧内模式预测,从而提高预测精度和画面质量。
因此,可构建下述列表:该列表在一个方向(即,水平方向或垂直方向)上包括增加的数量的帧内预测模式候选并且在其他方向上包括减少的数量的帧内预测模式候选。
例如,帧内预测单元1330可基于水平相似标志减少水平方向上的与预定阈值或更大值对应的帧内模式的数量。另一方面,与以上减少操作相反,与预定阈值或更大值对应的帧内模式被细分,并且可分配增加的数量的帧内模式。所述预定阈值可由模式编号、模式值、模式数字、模式角度、模式方向或者它们的一个或更多个组合表示。然而,所述预定阈值可不限于此,并且可以是可用于增加或减少垂直方向上的帧内模式的任意条件。
例如,帧内预测单元1330可基于垂直相似标志减少垂直方向上的与预定阈值或更大值对应的帧内模式的数量。另一方面,与以上减少操作相反,水平方向上的与预定阈值或更大值对应的帧内模式可被细分,并且可为水平方向分配增加的数量的帧内模式。
也就是说,在可以针对特定的必要方向进行精度更高的帧内预测处理的同时,方向模式的总数得以维持。
当减少或增加帧内模式的数量时,可基于当前块的帧内预测模式、当前块的尺寸和当前块的形状中的至少一个自适应地对减少操作或增加操作进行处理。例如,当当前块是2N×N的块时,可减少水平模式中的具有预定阈值之外的值的至少一个帧内预测模式。在这种情况下,代替减少的水平帧内预测模式,可添加至少一个垂直帧内预测模式。类似地,当当前块是N×2N的块时,可从垂直方向模式减少具有预定阈值之外的值的至少一个帧内预测模式。在这种情况下,代替减少的垂直帧内预测模式,可添加至少一个水平帧内预测模式。换句话说,依据当前块的尺寸和/或形状,水平方向上的帧内预测模式的数量可与垂直方向上的帧内预测模式的数量不同。此外,去除的帧内预测模式的数量可与添加的帧内预测模式的数量不同。
可以通过预定帧内预测模式编号、模式值、模式数字、模式角度、模式方向、当前块的宽度和高度之中的一个或更多个的组合来确定所述预定阈值。
去除的帧内预测模式和/或代替去除的帧内预测模式而另外分配的帧内预测模式可依据当前块的尺寸和/或形状而变化。例如,它们可依据当前块的宽度与高度的比率或者对角线分量的尺寸和/或方向而变化。减少的帧内预测模式可以是使用布置在(当前块的宽度)×N和N×(当前块的高度)外部的参考像素的模式。这里,N是大于零的正整数,例如,N可以是2。可通过对帧内预测模式编号进行移位来执行减少帧内预测模式的数量和/或增加帧内预测模式的数量的方法。例如,可将预定偏移应用于帧内预测模式编号。
作为本公开的示例,当左侧邻近像素与当前块中的像素相似时,可限制水平方向或向左方向上的帧内模式候选的数量。在这种情况下,水平方向上的任意模式都会产生几乎相同的预测结果。因此,限制处理降低了计算复杂度和计算量。此外,可减少分配给帧内模式的比特数。因此,可提高压缩效率。
当上方邻近像素与当前块中的像素相似时,可限制垂直方向或向上方向上的帧内模式候选的数量。在这种情况下,垂直方向上的任意模式都会产生几乎相同的预测结果。因此,限制处理降低了计算复杂度和计算量,并且减少了分配给帧内模式比特数,从而提高压缩效率。
因此,可构建下述列表:该列表在根据相似标志确定的一个方向(即,水平方向或垂直方向)上包括增加的数量的帧内预测模式候选并且在其他方向上包括减少的数量的帧内预测模式候选的。
因此,可构建下述列表:该列表在水平方向和垂直方向中的根据相似标志选择的一个方向上包括受限的帧内预测模式候选。例如,帧内预测单元1330可通过去除与预定阈值或更大值对应的所有水平帧内模式来限制水平方向上的帧内模式,从而仅保留特定方向。
例如,帧内预测单元1330可通过去除与预定阈值或更大值对应的所有垂直帧内模式来限制垂直方向上的帧内模式,从而仅保留特定方向。
图28示出所有水平相似标志或垂直相似标志为零、在不执行限制处理或不执行方向自适应处理的情况下确定帧内模式或构建MPM候选列表的情况。
图29示出水平相似标志具有值1且垂直相似标志具有值0的情况。在图29的(a)的情况下,在垂直方向上细分出的帧内模式被包括在确定目标列表或MPM候选列表中,而不是具有预定阈值或更大值的水平分量的帧内模式被包括在确定目标列表或MPM候选列表中。此外,例如,在图29的(b)的情况下,可预先去除包含预定阈值或更大值的水平分量的帧内模式,使其不被包括在确定目标列表或MPM候选列表中。
图30示出水平相似标志具有值0且垂直相似标志具有值1的情况。在图30的(a)的情况下,在水平方向上细分出的帧内模式被包括在确定目标列表或MPM候选列表中,而不是具有预定阈值或更大值的垂直分量的帧内模式被包括在确定目标列表或MPM候选列表中。此外,例如,在图30的(b)的情况下,可预先去除包含预定阈值或更大值的垂直分量的帧内模式,使其不被包括在确定目标列表或MPM候选列表中。
图31示出水平相似标志具有值1且垂直相似标志具有值1的情况。在图31的(a)的情况下,可更精细地划分在垂直方向和水平方向上密集地集中的帧内模式,并且所得到的增加的帧内模式可被包括在确定目标列表或MPM候选列表中。此外,例如,在图31的(b)的情况下,从确定目标列表或MPM候选列表排除除了垂直模式和水平模式之外的所有方向帧内模式。
因此,可减少用于在解码设备1300中推导帧内模式的计算量,并且还可减少分配给帧内模式的比特数。
另一方面,仅出于说明性的目的给出了在垂直方向或水平方向上将被去除或添加的模式的数量,并且可依据帧内模式的总数不同地确定每个方向上的帧内模式的数量。然而,依据相似标志,可在特定方向上自适应地增加或减少帧内模式的数量。
此外,根据本发明的实施例,帧内预测单元1330可根据邻近块信息确定当前块的帧内模式角度范围。此外,帧内预测单元1330可仅使用所述角度范围内包括的帧内模式来构建帧内模式候选列表。例如,帧内预测单元1330可使用从邻近块推导出的方向性信息来确定角度范围表。此外,帧内预测单元1330可基于角度范围表来方向自适应地确定帧内模式。
此外,与在执行方向自适应处理之前设置的帧内模式的数量相比,包括在所述角度范围内的帧内模式的数量可相同或可减少。当相同时,可按照等角度间隔更精细地划分与帧内模式识别信息对应的帧内模式。在这种情况下,图像质量得到提高。
另一方面,当与执行方向自适应处理之前设置的数量相比,所述角度范围内的帧内模式的数量减少时,可排除所述角度范围之外的帧内模式,导致图像质量轻微劣化,并且增加了计算量和传输效率。在这种情况下,可显著提高编码效率。
因此,帧内预测单元1330可选择特定方向角度范围内的帧内模式被更精细地划分的划分模式或所述角度范围之外的帧内模式被排除的排除模式。在这种情况下,可另外执行提高图像质量和编码效率两者的处理。
图32至图34是示出根据本公开的一个实施例的使用邻近块信息来提高熵编码效率的方法的示图。
图32是示出根据本发明的一个实施例的图像处理方法的流程图。
熵编码单元740(或熵解码单元1310)可通过使用邻近块的方向性信息来对当前块的帧内模式信息进行熵编码或熵解码。可从邻近块信息处理单元获得邻近块的方向性信息。例如,可从系数分布识别单元2331和/或邻近模式识别单元2332获得方向性信息,并且方向性信息可包括上述相似标志信息。
参照图32,可从邻近块信息确定当前块的方向性(S3210)。基于在步骤S3210中确定的方向性,可确定用于对帧内模式信息进行熵编码的查找表(S3220)。
例如,当水平相似标志和/或当垂直相似标志被确定时,或者当获得了经过解码的帧内模式信息时,熵编码单元740可确定与所确定的水平相似标志和/或垂直相似标志对应的或者与邻近块的帧内模式信息对应的熵编码查找表。
可从关于先前解码的邻近块的信息获得邻近块的方向性信息。这里,所述方向性信息可包括水平方向性信息和/或垂直方向性信息。此外,可确定与关于特定方向性的信息(即,特定方向性信息)对应的熵编码查找表。
熵编码查找表可包括编码表,其中,在该编码表中,帧内模式依据特定方向性信息分别具有不同的可变长度码。例如,与其他帧内模式相比,更短的可变长度码可被分配给与特定方向性信息对应或不与特定方向性信息对应的帧内模式。因此,可执行将更高的概率应用于特定方向性的熵编码和熵解码,从而提高熵编码效率。
参照图33和图34,SET 0是包括水平方向的帧内模式的帧内模式集,并且SET 1是包括垂直方向的帧内模式的帧内模式集。当上方块中的像素与当前块中的像素相似并且因此垂直相似标志具有值1时,与SET 1的帧内模式相比,SET 0的帧内模式被分配有更短的码字BIT或BIN。另一方面,与SET 0的帧内模式相比,SET 1的帧内模式可分配有相对长的码字。可构建具有上述特征的查找表。
在当前块的左侧块的已经解码的帧内模式是水平模式的情况下,可将当前块的方向性信息确定为水平方向。在这种情况下,与包括在SET 1中的帧内模式相比,包括在SET 0中的帧内模式被分配有更短的码字BIT或BIN。另一方面,与SET 0的帧内模式相比,SET 1的帧内模式可分配有相对长的码字。可构建具有上述特征的查找表。
在当前块的上方块的已经解码的帧内模式是垂直模式的情况下,可将当前块的方向性信息确定为垂直方向。在这种情况下,包括在SET 1中的帧内模式被分配有更短的码字BIT或BIN。另一方面,与SET 1中的帧内模式相比,包括在SET 0中的帧内模式可分配有相对长的码字。可构建具有上述特征的查找表。
熵编码单元740或熵解码单元1310可使用邻近块的方向性信息来确定用于当前块的帧内模式编码或帧内模式解码的查找表。根据从邻近块信息预测的当前块的方向性,帧内模式可被分类为对概率更高的方向分配相对短的可变长度码的帧内模式集和对概率更低的方向分配相对长的可变长度码的帧内模式集。因此,可通过这个处理提高熵编码效率。
此外,熵编码单元740或熵解码单元1310可通过使用邻近块的方向性信息来执行将具有相对高概率的码分配给具有相对高概率的方向信息的算术熵编码或算术熵解码。此外,熵编码单元740或熵解码单元1310可执行将具有相对低概率的码分配给具有相对低概率的方向信息的算术熵编码或算术熵解码。因此,可通过这个处理提高熵编码效率。
可在编码器和解码器中以相同的方法执行以上实施例。
应用以上实施例的顺序在编码器与解码器之间可不同,或者应用以上实施例的顺序在编码器和解码器中可相同。
可对每个亮度信号和色度信号执行以上实施例,或者可对亮度信号和色度信号相同地执行以上实施例。
应用本发明的以上实施例的块形状可具有正方形形状或非正方形形状。
可根据编码块、预测块、变换块、块、当前块、编码单元、预测单元、变换单元、单元和当前单元中的至少一个的尺寸来应用本发明的以上实施例。这里,尺寸可被定义为使得以上实施例被应用的最小尺寸或最大尺寸或者最小尺寸和最大尺寸两者,或者可被定义为以上实施例被应用于的固定尺寸。此外,在以上实施例中,可将第一实施例应用于第一尺寸,并且可将第二实施例应用于第二尺寸。换句话说,可根据尺寸组合地应用以上实施例。此外,当尺寸等于或大于最小尺寸且等于或小于最大尺寸时,可应用以上实施例。换句话说,当块尺寸被包括在特定范围内时,可应用以上实施例。
例如,当当前块的尺寸是8×8或更大时,可应用以上实施例。例如,当当前块的尺寸为4×4或更大时,可应用以上实施例。例如,当当前块的尺寸是16×16或更大时,可应用以上实施例。例如,当当前块的尺寸等于或大于16×16且等于或小于64×64时,可应用以上实施例。
可根据时间层来应用本发明的以上实施例。为了识别以上实施例可被应用于的时间层,可用信号发送附加标识符,并且可将以上实施例应用于由相应标识符标识的指定时间层。这里,所述标识符可被定义为以上实施例可被应用于的最低层或最高层或最低层和最高层两者,或者可被定义为指示该实施例被应用于的特定层。此外,可定义实施例被应用于的固定时间层。
例如,当当前图像的时间层是最低层时,可应用以上实施例。例如,当当前图像的时间层标识符是1时,可应用以上实施例。例如,当当前图像的时间层是最高层时,可应用以上实施例。
可定义本发明的以上实施例被应用于的条带类型,并且可根据对应的条带类型来应用以上实施例。
在上述实施例中,基于具有一系列步骤或单元的流程图描述了方法,但是本发明不限于这些步骤的顺序,而是,一些步骤可与其他步骤同时执行或以不同的顺序执行。此外,本领域的普通技术人员应该理解,流程图中的步骤并不互相排斥,并且在不影响本发明的范围的情况下,可将其他步骤添加到流程图或者可将步骤中的一些步骤从流程图删除。
实施例包括示例的各个方面。可不描述各个方面的所有可能组合,但是本领域技术人员将能够认识到不同的组合。因此,本发明可包括权利要求范围内的所有替换、修改和改变。
本发明的实施例可以以程序指令的形式实现,其中,该程序指令可由各种计算机组件执行并且被记录在计算机可读记录介质中。计算机可读记录介质可单独地包括程序指令、数据文件、数据结构等,或者可包括程序指令、数据文件、数据结构等的组合。记录在计算机可读记录介质中的程序指令可以是为本发明专门设计和构建的,或者对于计算机软件技术领域的普通技术人员是公知的。计算机可读记录介质的示例包括磁记录介质(诸如,硬盘、软盘和磁带)、光学数据存储介质(诸如,CD-ROM或DVD-ROM)、磁光介质(诸如软光盘)以及被专门构造为存储和实现程序指令的硬件装置(诸如,只读存储器(ROM)、随机存取存储器(RAM)、闪存等)。程序指令的示例不仅包括由编译器格式化的机械语言代码,而且包括可由计算机使用解释器来实现的高级语言代码。硬件装置可被配置为由一个或更多个软件模块操作或者反之亦然,以实施根据本发明的处理。
尽管已经在特定项目(诸如,详细元件)以及有限的实施例和附图方面描述了本发明,但是它们仅被提供以帮助更全面地理解本发明,并且本发明不限于以上实施例。本发明所属领域的技术人员将理解,可对以上描述进行各种修改和改变。
因此,本发明的精神将不应限于上述实施例,并且所附权利要求及其等同物的整个范围将落入本发明的范围和精神内。
工业适用性
本发明可被用于对图像进行编码/解码。

Claims (4)

1.一种图像解码方法,包括:
从比特流获取当前块的帧内预测模式信息;
当当前块是非正方形时,基于由所述帧内预测模式信息指示的帧内预测模式是否在基于当前块的宽度和高度的组合所确定的阈值之外,将由所述帧内预测模式信息指示的帧内预测模式的编号移位预定偏移;并且
基于当前块的帧内预测模式对当前块进行预测。
2.如权利要求1所述的图像解码方法,还包括:
通过反量化处理来生成当前块的变换系数,并通过对所述当前块的变换系数进行逆变换来生成当前块的残差块;并且
基于当前块的残差块与预测块之和来重建当前块,
其中,
对所述当前块的变换系数进行的逆变换包括:对所述当前块的变换系数进行的二次逆变换和首次逆变换,
对所述当前块的变换系数进行的二次逆变换是基于由当前块的帧内预测模式确定的变换矩阵来执行的。
3.一种图像编码方法,包括:
确定当前块的帧内预测模式;
当当前块是非正方形时,基于当前块的帧内预测模式是否在基于当前块的宽度和高度的组合所确定的阈值之外,将当前块的帧内预测模式的编号移位预定偏移;并且
基于当前块的偏移后的帧内预测模式的编号,生成包括当前块的帧内预测模式信息的比特流。
4.一种存储有通过图像编码方法生成的比特流的计算机可读记录介质,所述图像编码方法包括:
确定当前块的帧内预测模式;
当当前块是非正方形时,基于当前块的帧内预测模式是否在基于当前块的宽度和高度的组合所确定的阈值之外,将所述当前块的帧内预测模式的编号移位预定偏移;并且
基于当前块的偏移后的帧内预测模式的编号,生成包括当前块的帧内预测模式信息的比特流。
CN201880050380.6A 2017-07-28 2018-07-27 图像处理方法和图像编码/解码方法以及使用图像处理方法和图像编码/解码方法的装置 Active CN110999304B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202311568850.7A CN117354514A (zh) 2017-07-28 2018-07-27 图像编码方法和图像解码方法以及计算机可读记录介质
CN202311570502.3A CN117395409A (zh) 2017-07-28 2018-07-27 图像编码方法和图像解码方法以及计算机可读记录介质
CN202311568811.7A CN117354513A (zh) 2017-07-28 2018-07-27 图像编码方法和图像解码方法以及计算机可读记录介质
CN202311563278.5A CN117354512A (zh) 2017-07-28 2018-07-27 图像编码方法和图像解码方法以及计算机可读记录介质

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
KR20170096443 2017-07-28
KR10-2017-0096443 2017-07-28
KR20170096444 2017-07-28
KR10-2017-0096444 2017-07-28
PCT/KR2018/008559 WO2019022568A1 (ko) 2017-07-28 2018-07-27 영상 처리 방법, 그를 이용한 영상 부호화/복호화 방법 및 그 장치

Related Child Applications (4)

Application Number Title Priority Date Filing Date
CN202311563278.5A Division CN117354512A (zh) 2017-07-28 2018-07-27 图像编码方法和图像解码方法以及计算机可读记录介质
CN202311568811.7A Division CN117354513A (zh) 2017-07-28 2018-07-27 图像编码方法和图像解码方法以及计算机可读记录介质
CN202311570502.3A Division CN117395409A (zh) 2017-07-28 2018-07-27 图像编码方法和图像解码方法以及计算机可读记录介质
CN202311568850.7A Division CN117354514A (zh) 2017-07-28 2018-07-27 图像编码方法和图像解码方法以及计算机可读记录介质

Publications (2)

Publication Number Publication Date
CN110999304A CN110999304A (zh) 2020-04-10
CN110999304B true CN110999304B (zh) 2023-12-08

Family

ID=65039718

Family Applications (5)

Application Number Title Priority Date Filing Date
CN201880050380.6A Active CN110999304B (zh) 2017-07-28 2018-07-27 图像处理方法和图像编码/解码方法以及使用图像处理方法和图像编码/解码方法的装置
CN202311563278.5A Pending CN117354512A (zh) 2017-07-28 2018-07-27 图像编码方法和图像解码方法以及计算机可读记录介质
CN202311568850.7A Pending CN117354514A (zh) 2017-07-28 2018-07-27 图像编码方法和图像解码方法以及计算机可读记录介质
CN202311568811.7A Pending CN117354513A (zh) 2017-07-28 2018-07-27 图像编码方法和图像解码方法以及计算机可读记录介质
CN202311570502.3A Pending CN117395409A (zh) 2017-07-28 2018-07-27 图像编码方法和图像解码方法以及计算机可读记录介质

Family Applications After (4)

Application Number Title Priority Date Filing Date
CN202311563278.5A Pending CN117354512A (zh) 2017-07-28 2018-07-27 图像编码方法和图像解码方法以及计算机可读记录介质
CN202311568850.7A Pending CN117354514A (zh) 2017-07-28 2018-07-27 图像编码方法和图像解码方法以及计算机可读记录介质
CN202311568811.7A Pending CN117354513A (zh) 2017-07-28 2018-07-27 图像编码方法和图像解码方法以及计算机可读记录介质
CN202311570502.3A Pending CN117395409A (zh) 2017-07-28 2018-07-27 图像编码方法和图像解码方法以及计算机可读记录介质

Country Status (4)

Country Link
US (4) US11044471B2 (zh)
KR (1) KR20190013611A (zh)
CN (5) CN110999304B (zh)
WO (1) WO2019022568A1 (zh)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3643061A1 (en) * 2017-07-05 2020-04-29 Huawei Technologies Co. Ltd. Devices and methods for video coding
WO2019151297A1 (ja) 2018-01-30 2019-08-08 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
WO2019151280A1 (ja) 2018-01-30 2019-08-08 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
EP3763128A4 (en) * 2018-03-14 2022-04-06 Mediatek Inc. METHOD AND APPARATUS PROVIDING AN OPTIMIZED DIVISION STRUCTURE FOR VIDEO CODING
WO2019185819A1 (en) * 2018-03-29 2019-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Refined block-based predictive coding and decoding of a picture
CA3141303A1 (en) * 2018-05-30 2019-12-05 Digitalinsights Inc. Image encoding/decoding method and device
KR20220107089A (ko) * 2018-09-03 2022-08-01 후아웨이 테크놀러지 컴퍼니 리미티드 인트라 예측을 위한 방법 및 장치
AU2019335454B2 (en) * 2018-09-03 2023-04-20 Huawei Technologies Co., Ltd. A video encoder, a video decoder and corresponding methods
US11317099B2 (en) 2018-10-05 2022-04-26 Tencent America LLC Method and apparatus for signaling an offset in video coding for intra block copy and/or inter prediction
CN110213594A (zh) * 2018-12-29 2019-09-06 腾讯科技(深圳)有限公司 用于帧内编码的方法、装置、帧编码器、帧编码系统以及计算机可读存储媒体
JP7278084B2 (ja) * 2019-01-29 2023-05-19 キヤノン株式会社 情報処理装置および情報処理方法ならびにプログラム
CN109788286B (zh) * 2019-02-01 2021-06-18 北京大学深圳研究生院 一种编码、解码变换方法、系统、设备及计算机可读介质
WO2020171660A1 (ko) 2019-02-21 2020-08-27 엘지전자 주식회사 인트라 예측을 위한 비디오 신호의 처리 방법 및 장치
WO2020171673A1 (ko) * 2019-02-24 2020-08-27 엘지전자 주식회사 인트라 예측을 위한 비디오 신호의 처리 방법 및 장치
US20220124309A1 (en) * 2019-02-28 2022-04-21 Lg Electronics Inc. Unified mpm list-based intra prediction
WO2020182213A1 (en) * 2019-03-13 2020-09-17 Beijing Bytedance Network Technology Co., Ltd. Sub-block transform in transform skip mode
US11956447B2 (en) * 2019-03-21 2024-04-09 Google Llc Using rate distortion cost as a loss function for deep learning
US11616966B2 (en) * 2019-04-03 2023-03-28 Mediatek Inc. Interaction between core transform and secondary transform
CN113796077B (zh) * 2019-05-10 2023-12-26 寰发股份有限公司 视频编解码之亮度mpm列表导出的方法及装置
CN114175635A (zh) * 2019-05-27 2022-03-11 Sk电信有限公司 用于推导帧内预测模式的方法及装置
US11695960B2 (en) * 2019-06-14 2023-07-04 Qualcomm Incorporated Transform and last significant coefficient position signaling for low-frequency non-separable transform in video coding
WO2020256310A1 (ko) * 2019-06-21 2020-12-24 삼성전자 주식회사 비디오 복호화 방법 및 장치, 비디오 부호화 방법 및 장치
KR20220019241A (ko) * 2019-07-08 2022-02-16 엘지전자 주식회사 적응적 루프 필터 기반 비디오 또는 영상 코딩
KR20220046683A (ko) 2019-10-03 2022-04-14 후아웨이 테크놀러지 컴퍼니 리미티드 기하학적 파티션 모드를 위한 코딩 프로세스
CN112702603A (zh) * 2019-10-22 2021-04-23 腾讯科技(深圳)有限公司 视频编码方法、装置、计算机设备和存储介质
CN112543338B (zh) * 2020-10-16 2022-03-04 腾讯科技(深圳)有限公司 视频解码方法、装置、计算机可读介质及电子设备
CN113709481B (zh) * 2020-12-10 2022-12-23 杭州海康威视数字技术股份有限公司 一种编码、解码方法、装置及其设备
CN115203383A (zh) * 2021-04-13 2022-10-18 澜起科技股份有限公司 用于在候选向量集中查询相似向量的方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103748877A (zh) * 2011-08-17 2014-04-23 联发科技(新加坡)私人有限公司 使用非方形区块的帧内预测方法和装置
CN106231312A (zh) * 2010-07-31 2016-12-14 M&K控股株式会社 用于对图像进行编码的装置
WO2017039256A1 (ko) * 2015-08-28 2017-03-09 주식회사 케이티 비디오 신호 처리 방법 및 장치

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6711211B1 (en) 2000-05-08 2004-03-23 Nokia Mobile Phones Ltd. Method for encoding and decoding video information, a motion compensated video encoder and a corresponding decoder
KR101433170B1 (ko) 2008-01-05 2014-08-28 경희대학교 산학협력단 인접 블록의 공간 예측 방향성을 이용하여 화면 내 예측모드를 추정하는 인코딩 및 디코딩 방법, 그 장치
US9467705B2 (en) * 2009-12-30 2016-10-11 Ariscale Inc. Video encoding apparatus, video decoding apparatus, and video decoding method for performing intra-prediction based on directionality of neighboring block
US9532058B2 (en) * 2011-06-03 2016-12-27 Qualcomm Incorporated Intra prediction mode coding with directional partitions
KR101827939B1 (ko) 2011-12-13 2018-02-12 주식회사 스카이미디어테크 적응적인 인트라 예측 모드 부호화 방법 및 장치, 그리고 복호화 방법 및 장치
CN108370441B (zh) * 2015-11-12 2022-07-12 Lg 电子株式会社 在图像编译系统中用于系数引起的帧内预测的方法和装置
CN106878752B (zh) * 2015-12-11 2022-03-04 北京三星通信技术研究有限公司 一种视频编码模式的编解码方法和装置
KR101743665B1 (ko) * 2016-02-02 2017-06-05 세종대학교산학협력단 인트라 예측 기반의 비디오 신호 처리 방법 및 장치
US10547854B2 (en) * 2016-05-13 2020-01-28 Qualcomm Incorporated Neighbor based signaling of intra prediction modes
WO2018030599A1 (ko) * 2016-08-08 2018-02-15 엘지전자(주) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106231312A (zh) * 2010-07-31 2016-12-14 M&K控股株式会社 用于对图像进行编码的装置
CN103748877A (zh) * 2011-08-17 2014-04-23 联发科技(新加坡)私人有限公司 使用非方形区块的帧内预测方法和装置
WO2017039256A1 (ko) * 2015-08-28 2017-03-09 주식회사 케이티 비디오 신호 처리 방법 및 장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Gagan Rath等.CE3-related: Block Shape Adaptive Intra Prediction Directions.Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 11th Meeting: Ljubljana, SI, 10–18 July 2018.2018,2 Description and encoder options. *

Also Published As

Publication number Publication date
WO2019022568A1 (ko) 2019-01-31
CN110999304A (zh) 2020-04-10
KR20190013611A (ko) 2019-02-11
US20200162729A1 (en) 2020-05-21
CN117354514A (zh) 2024-01-05
US20220385895A1 (en) 2022-12-01
CN117395409A (zh) 2024-01-12
CN117354513A (zh) 2024-01-05
US11838502B2 (en) 2023-12-05
US20240040114A1 (en) 2024-02-01
US11044471B2 (en) 2021-06-22
US11463690B2 (en) 2022-10-04
US20210266533A1 (en) 2021-08-26
CN117354512A (zh) 2024-01-05

Similar Documents

Publication Publication Date Title
CN110999304B (zh) 图像处理方法和图像编码/解码方法以及使用图像处理方法和图像编码/解码方法的装置
US20230179793A1 (en) Video encoding/decoding method and device, and recording medium storing bit stream
CN111279695B (zh) 用于基于非对称子块的图像编码/解码的方法及装置
US20240064289A1 (en) Method and Device for Encoding/Decoding Image and Recording Medium Having Bitstream Stored Thereon
US11438589B2 (en) Video encoding/decoding method and apparatus, and recording medium in which bit stream is stored
CN117499684A (zh) 用于对图像进行编码/解码的方法和装置
CN116366845A (zh) 使用样点滤波的图像编码/解码方法和设备
KR20180040088A (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
KR20190067732A (ko) 채널들 간의 선택적인 정보 공유를 사용하는 부호화 및 복호화를 위한 방법 및 장치
US11743452B2 (en) Video encoding/decoding method and device, and recording medium for storing bitstream
US20220312003A1 (en) Intra prediction mode, and entropy encoding/decoding method and device
US20220321894A1 (en) Inter prediction information encoding/decoding method and device
US11496737B2 (en) Image encoding/decoding method and apparatus, and recording medium storing bitstream
US20220070475A1 (en) Image encoding/decoding method and apparatus, and recording media storing bitstream
US20220321915A1 (en) Image encoding/decoding method and apparatus

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant