CN104780366B - 确定图像编码单元和图像解码单元的帧内预测模式 - Google Patents

确定图像编码单元和图像解码单元的帧内预测模式 Download PDF

Info

Publication number
CN104780366B
CN104780366B CN201510175162.3A CN201510175162A CN104780366B CN 104780366 B CN104780366 B CN 104780366B CN 201510175162 A CN201510175162 A CN 201510175162A CN 104780366 B CN104780366 B CN 104780366B
Authority
CN
China
Prior art keywords
coding unit
intra prediction
unit
prediction mode
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510175162.3A
Other languages
English (en)
Other versions
CN104780366A (zh
Inventor
闵正惠
艾林娜·阿尔辛娜
韩宇镇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN104780366A publication Critical patent/CN104780366A/zh
Application granted granted Critical
Publication of CN104780366B publication Critical patent/CN104780366B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Color Television Systems (AREA)

Abstract

一种用于确定编码单元的帧内预测模式的方法和设备。确定包括亮度分量编码单元的帧内预测模式的色度分量编码单元的候选帧内预测模式,并对根据确定的候选帧内预测模式的色度分量编码单元的代价进行比较,以将最小代价的帧内预测模式确定为色度分量编码单元的帧内预测模式。

Description

确定图像编码单元和图像解码单元的帧内预测模式
本申请是申请日为2011年4月5日、申请号为201180027802.6、题为“确定图像编码单元和图像解码单元的帧内预测模式”的专利申请的分案申请。
技术领域
示例性实施例涉及图像的编码和解码,更具体地,涉及对图像编码和解码的方法和设备,其中,通过应用针对亮度分量编码单元确定的帧内预测模式来对色度分量编码单元执行帧内预测。
背景技术
在图像压缩方法(诸如,运动图像专家组(MPEG)-1、MPEG-2、MPEG-4 或H.264/MPEG-4先进视频编码(AVC))中,图像被划分为用于对图像编码的宏块。以能够在帧间预测或帧内预测中使用的所有编码模式对每个宏块编码,随后以根据用于对宏块编码的比特率和基于原始宏块的解码宏块的失真度选择的编码模式对每个宏块编码。
随着用于再现和存储高分辨率或高质量视频内容的硬件被开发和提供,越来越需要能够有效地对高分辨率或高质量视频内容编码或解码的视频编解码器。在传统的视频编解码器中,以宏块为单位对视频编码,其中,每个宏块具有预定尺寸。
发明内容
技术问题
在传统的视频编解码器中,以宏块为单位对视频编码,其中,每个宏块具有预定尺寸。另外,在传统的视频编解码器中,帧内模式的方向性有限。
技术方案
示例性实施例包括基于具有多种尺寸的分层编码单元来确定具有多种方向性的亮度分量编码单元的帧内预测模式的方法,以及用于对图像编码和解码的方法和设备,其中,根据包括针对亮度分量编码单元确定的帧内预测模式的候选帧内预测模式对色度分量编码单元执行帧内预测。
有益效果
根据示例性实施例,通过添加具有多种方向性的亮度分量编码单元的帧内预测模式作为色度分量编码单元的帧内预测模式,可增加色度分量的图像预测效率以及整个图像的预测效率,而不增加吞吐量。
附图说明
图1是根据示例性实施例的用于对视频编码的设备的框图;
图2是根据示例性实施例的用于对视频解码的设备的框图;
图3是用于描述根据示例性实施例的编码单元的概念的示图;
图4是根据本发明示例性实施例的基于编码单元的图像编码器的框图;
图5是根据示例性实施例的基于编码单元的图像解码器的框图;
图6是示出根据示例性实施例的根据深度的较深层编码单元和预测单元的示图;
图7是用于描述根据示例性实施例的编码单元和变换单元之间的关系的示图;
图8是用于描述根据示例性实施例的与编码深度对应的编码单元的编码信息的示图;
图9是根据示例性实施例的根据深度的较深层编码单元的示图;
图10A和图10B是用于描述根据示例性实施例的编码单元、预测单元和变换单元之间的关系的示图;
图11是示出根据示例性实施例的根据编码单元的编码信息的表;
图12A到图12C是根据示例性实施例的亮度分量图像和色度分量图像的格式的示图;
图13是示出根据示例性实施例的根据亮度分量编码单元的尺寸的多个帧内预测模式;
图14A到图14C是用于解释根据示例性实施例的应用于具有预定尺寸的亮度分量编码单元的帧内预测模式的示图;
图15是用于解释根据示例性实施例的应用于具有预定尺寸的亮度分量编码单元的帧内预测模式的示图;
图16是用于解释根据示例性实施例的具有多种方向性的亮度分量编码单元的帧内预测模式的参考示图;
图17是用于解释根据示例性实施例的双线性模式的参考示图;
图18是用于解释根据示例性实施例的产生当前亮度分量编码单元的帧内预测模式的预测值的处理的示图;
图19是用于解释根据示例性实施例的具有不同尺寸的亮度分量编码单元之间的帧内预测模式的映射处理的参考示图;
图20是用于解释根据示例性实施例的将邻近亮度分量编码单元的帧内预测模式映射到代表性帧内预测模式之一的处理的参考示图;
图21是用于解释根据示例性实施例的应用于色度分量编码单元的候选帧内预测模式的示图;
图22是根据示例性实施例的帧内预测设备的框图;
图23是示出根据示例性实施例的确定编码单元的帧内预测模式的方法的流程图;
图24是示出根据示例性实施例的确定解码单元的帧内预测模式的方法的流程图;
图25是用于解释位于具有(dx,dy)的方向性的延长线上的当前像素和邻近像素之间的关系的示图;
图26是用于解释根据示例性实施例的位于根据当前像素的位置具有(dx, dy)的方向性的延长线上的邻近像素的改变;
图27和图28是用于解释根据示例性实施例的确定帧内预测模式方向的方法的示图。
最佳模式
根据示例性实施例的一方面,提供了一种确定当前画面的编码单元的帧内预测模式的方法,所述方法包括:基于最大编码单元和深度将当前画面的亮度分量划分为至少一个亮度分量编码单元,其中,最大编码单元是当前画面被编码的、具有最大尺寸的编码单元,深度指示最大编码单元的分层划分信息;确定所述至少一个亮度分量编码单元的帧内预测模式;对将色度分量编码单元的候选帧内预测模式和所述至少一个亮度分量编码单元的帧内预测模式应用于色度分量编码单元的代价进行比较;基于比较的结果,确定色度分量编码单元的候选帧内预测模式和所述至少一个亮度分量编码单元的确定的帧内预测模式中的具有最小代价的色度分量编码单元的帧内预测模式。
根据示例性实施例的一方面,提供了一种用于确定当前画面的编码单元的帧内预测模式的设备,所述设备包括:亮度帧内预测器,确定从最大编码单元划分的亮度分量编码单元的帧内预测模式和深度,其中,最大编码单元是当前画面被编码的、具有最大尺寸的编码单元,深度指示最大编码单元的分层划分信息;色度帧内预测器,对将从最大编码单元划分的色度分量编码单元的候选帧内预测模式和亮度分量编码单元的帧内预测模式应用于色度分量编码单元的代价进行比较,并基于比较的结果,确定色度分量编码单元的候选预测模式和亮度分量编码单元的帧内预测模式中的具有最小代价的色度分量编码单元的帧内预测模式。
根据示例性实施例的一方面,提供了一种确定当前画面的解码单元的帧内预测模式的方法,所述方法包括:从比特流提取最大编码单元和深度,其中,所述最大编码单元是当前画面被编码的、具有最大尺寸的编码单元,深度指示最大编码单元的分层划分信息;基于最大编码单元和深度,将待解码的当前画面的亮度分量和色度分量分别划分为至少一个亮度分量解码单元和至少一个色度分量解码单元;从比特流提取帧内预测模式信息,所述帧内预测模式信息指示应用于所述至少一个亮度分量解码单元和所述至少一个色度分量解码单元的帧内预测模式;基于提取的帧内预测模式信息对所述至少一个亮度分量解码单元和所述至少一个色度分量解码单元执行帧内预测,以对所述至少一个亮度分量解码单元和所述至少一个色度分量解码单元进行解码。
根据示例性实施例的一方面,提供了一种对图像解码的设备,所述设备包括:熵解码器,从比特流提取最大编码单元、深度和帧内预测模式信息,其中,最大编码单元是当前画面被编码的、具有最大尺寸的编码单元,深度指示最大编码单元的分层划分信息,帧内预测模式信息指示应用于将被解码的亮度分量解码单元和色度分量解码单元的帧内预测模式;帧内预测执行器,根据提取的帧内预测模式对亮度分量解码单元和色度分量解码单元执行帧内预测,以对亮度分量解码单元和色度分量解码单元进行解码。
具体实施方式
以下,将参照附图更全面地描述示例性实施例。
以下,“编码单元”指的是图像数据在编码器端被编码的编码数据单元,以及编码的图像数据在解码器端被解码的编码数据单元。另外,编码深度指的是编码单元被编码的深度。
图1是根据示例性实施例的视频编码设备100的框图。
视频编码设备100包括最大编码单元划分器110、编码单元确定器120、图像数据输出单元130和编码信息输出单元140。
最大编码单元划分器110可基于针对图像的当前画面的最大编码单元来划分当前画面。如果当前画面大于最大编码单元,则可将当前画面的图像数据划分为至少一个最大编码单元。根据示例性实施例的最大编码单元可以是尺寸为32×32、64×64、128×128、256×256等的数据单元,其中,数据单元的形状是宽度和长度为2的若干次方的正方形。可根据至少一个最大编码单元将图像数据输出到编码单元确定器120。
根据示例性实施例的编码单元可由最大尺寸和深度表征。深度表示编码单元从最大编码单元被空间划分的次数,随着深度加深,根据深度的较深层编码单元可从最大编码单元被划分到最小编码单元。最大编码单元的深度是最高深度,最小编码单元的深度是最低深度。由于与每个深度相应的编码单元的尺寸随着最大编码单元的深度加深而减小,因此与较高深度相应的编码单元可包括多个与较低深度相应的多个编码单元。
如上所述,根据编码单元的最大尺寸将当前画面的图像数据划分为多个最大编码单元,每个最大编码单元可包括根据深度划分的较深层编码单元。由于根据示例性实施例的最大编码单元根据深度被划分,因此包括在最大编码单元的空间域中的图像数据可根据深度被分层地分类。
可预先确定编码单元的最大深度和最大尺寸,最大深度和最大尺寸限制最大编码单元的高度和宽度被分层地划分的总次数。可以在画面或条带(slice) 单元中设置这样的最大编码单元和最大深度。换句话说,可针对每个画面或条带设置不同的最大编码单元和不同的最大深度,并且可根据最大深度设置包括在最大编码单元中的最小编码单元的尺寸。这样,通过根据画面或条带设置最大编码单元和最大深度,可通过使用最大编码单元对平坦区域的图像进行编码来提高编码效率,并且可通过使用具有比最大编码单元更小尺寸的编码单元对具有高复杂度的图像进行编码来提高图像的压缩效率。
编码单元确定器120根据最大编码单元确定不同的最大深度。可基于率失真(R-D)代价计算来确定最大深度。确定的最大深度被输出到编码信息输出单元140,根据最大编码深度的图像数据被输出到图像数据输出单元130。
基于与等于或低于最大深度的至少一个深度对应的较深层编码单元对最大编码单元中的图像数据进行编码,并基于每个较深层编码单元来比较对图像数据进行编码的结果。可在比较较深层编码单元的编码误差之后选择具有最小编码误差的深度。可针对每个最大编码单元选择至少一个编码深度。
随着编码单元根据深度被分层地划分并随着编码单元的数量增加,最大编码单元的尺寸被划分。另外,即使一个最大编码单元中的多个编码单元对应于相同深度,仍通过单独测量每个编码单元的图像数据的编码误差来确定是否将对应于相同深度的每个编码单元划分为更低深度。因此,即使当图像数据被包括在一个最大编码单元中时,图像数据被划分为根据深度的多个区域,并且编码误差可根据一个最大编码单元中的区域而不同,因此,编码深度可根据图像数据中的区域而不同。换句话说,最大编码单元可被划分为根据深度具有不同尺寸的编码单元。因此,可在一个最大编码单元中确定一个或多个编码深度,并可根据至少一个编码深度的编码单元来划分最大编码单元的图像数据。
另外,可基于具有不同尺寸的数据单元预测或变换最大编码单元中的具有不同尺寸的编码单元。换句话说,视频编码设备100可基于具有不同尺寸和形状的数据单元执行多个用于对图像编码的操作。为了对图像数据编码,执行诸如预测、变换、熵编码等的操作,并且在此时,相同的数据单元可用于所有操作,或者不同的数据单元可用于每个操作。
例如,视频编码设备100可选择与编码单元不同的数据单元来预测编码单元。例如,当编码单元具有2N×2N(其中,N是正整数)的尺寸时,用于预测的数据单元可具有2N×2N、2N×N、N×2N或N×N的尺寸。换句话说,可基于通过对编码单元的高度和宽度中的至少一个进行划分而获得的数据单元来执行运动预测。在下文中,作为预测的基本单元的数据单元将被称为预测单元。
预测模式可以是帧内模式、帧间模式和跳过模式中的至少一个,其中,对具有特定尺寸或形状的预测单元仅执行特定预测模式。例如,可仅对具有 2N×2N或N×N的尺寸的正方形预测单元执行帧内模式。另外,可仅对具有 2N×2N的尺寸的预测单元执行跳过模式。如果在编码单元中包括多个预测单元,则可对每个预测单元执行预测以选择具有最小误差的预测模式。
可选择地,视频编码设备100可基于与编码单元不同的数据单元变换图像数据。为了变换编码单元,可基于具有小于或等于编码单元的尺寸的数据单元执行变换。用作变换的基础的数据单元将被称为变换单元。
编码单元确定器120可通过使用基于拉格朗日乘子(Lagrangian multiplier) 的率失真最优化来测量根据深度的较深层编码单元的编码误差,从而确定具有最优编码误差的最大编码单元的划分形状。换句话说,编码单元确定器120 可确定将从最大编码单元划分的编码单元的形状,其中,编码单元的尺寸根据深度而不相同。
图像数据输出单元130在比特流中输出最大编码单元的图像数据,其中,图像数据基于由编码单元确定器120确定的至少一个编码深度被编码。由于已经通过编码深度确定器120执行了编码以测量最小编码误差,因此,可通过使用最小编码误差来输出编码数据流。
编码信息输出单元140可在比特流中输出关于根据编码深度的编码模式的信息,所述信息基于由编码单元确定器120确定的至少一个编码深度被编码。关于根据编码深度的编码模式的信息可包括指示编码深度的信息、指示预测单元中的划分类型的信息、指示预测模式的信息以及指示变换单元的尺寸的信息。
可通过使用根据深度的划分信息定义关于编码深度的信息,所述根据深度的划分信息指示是否对较低深度而非当前深度的编码单元执行编码。如果当前编码单元的当前深度是编码深度,则当前编码单元中的图像数据被编码和输出,并且因此划分信息可被定义为不将当前编码单元划分至较低深度。可选择地,如果当前编码单元的当前深度不是编码深度,则对较低深度的编码单元执行编码,并且因此划分信息可被定义为对当前编码单元进行划分以获得较低深度的编码单元。
如果当前深度不是编码深度,则对被划分为较低深度的编码单元的编码单元执行编码。因为在当前深度的一个编码单元中存在较低深度的至少一个编码单元,所以对较低深度的每个编码单元重复执行编码,从而可针对具有相同深度的编码单元递归地执行编码。
因为针对一个最大编码单元确定具有树结构的编码单元,并且针对编码深度的编码单元确定关于至少一个编码模式的信息,所以可针对一个最大编码单元确定关于至少一个编码模式的信息。另外,因为根据深度分层地划分图像数据,所以最大编码单元的图像数据的编码深度可根据位置而不同,从而可针对图像数据设置关于编码深度和编码模式的信息。
相应地,编码信息输出单元140可将相应的编码信息分配给包括在最大编码单元中的每个最小编码单元。换句话说,编码深度的编码单元包括至少一个包含相同编码信息的最小编码单元。因此,如果邻近最小编码单元具有相同的编码信息,则邻近最小编码单元可以是包括在相同最大编码单元中的最小编码单元。
在视频编码设备100中,较深层编码单元可以是通过将作为上一层的较高深度的编码单元的高度或宽度除以2而获得的编码单元。换而言之,在当前深度的编码单元的尺寸是2N×2N时,较低深度的编码单元的尺寸是N×N。另外,尺寸为2N×2N的当前深度的编码单元可包括最多4个较低深度的编码单元。
因此,视频编码设备100可基于最大编码单元的尺寸和考虑当前画面的特性而确定的最大深度,针对每个最大编码单元确定具有最佳形状的编码单元。另外,因为可通过使用各种预测模式和变换中的任何一种来对每个最大编码单元执行编码,所以可考虑各种图像尺寸的编码单元的特性来确定最佳编码模式。
因此,如果以传统的宏块对具有高分辨率或大数据量的图像编码,则每个画面的宏块的数量会过度增加。因此,针对每个宏块产生的压缩信息的条数增加,从而难以发送压缩的信息并且数据压缩效率下降。然而,通过使用视频编码设备100,因为在考虑图像的尺寸而增大编码单元的最大尺寸的同时,考虑图像的特性调整了编码单元,所以图像压缩效率可提高。
图2是根据示例性实施例的视频解码设备200的框图。
参照图2,视频解码设备200包括接收器210、编码信息提取器220以及图像数据解码器230。
接收器210接收并解析视频解码设备200接收的比特流以获取根据最大编码单元的图像数据,并将图像数据输出到图像数据解码器230。接收器210 可从关于当前画面或条带的头部提取关于当前画面或条带的最大编码单元的信息。视频解码设备200根据最大编码单元对图像数据解码。
编码信息提取器220解析从视频解码设备200接收的比特流,并从解析的比特流中的当前画面的头部提取关于根据最大编码单元的编码深度和编码模式的信息。关于提取的编码深度和编码模式的信息被输出到图像数据解码器230。
可针对关于与编码深度相应的至少一个编码单元的信息设置关于根据最大编码单元的编码深度和编码模式的信息,关于编码模式的信息可包括根据编码单元的预测单元的划分类型信息、指示预测模式的信息以及指示变换单元的尺寸的信息。另外,根据深度的划分信息可被提取作为关于编码深度的信息。
关于最大编码单元的划分形状的信息可包括关于根据深度具有不同尺寸的编码单元的信息,关于编码模式的信息可包括指示根据编码单元的预测单元的信息、指示预测模式的信息以及指示变换单元的信息。
图像数据解码器230通过基于编码信息提取器220提取的信息对每个最大编码单元中的图像数据解码,来恢复当前画面。图像数据解码器230可基于关于最大编码单元的划分形状的信息对包括在最大编码单元中的编码单元解码。解码处理可包括预测和反变换,预测包括帧内预测和运动补偿。
可选择地,图像数据解码器230通过基于关于根据最大编码的单元的编码深度和编码模式的信息对每个最大编码单元中的图像数据解码,来恢复当前图像。换而言之,图像数据解码器230可基于关于根据最大编码单元的编码深度的信息,根据至少一个编码深度的编码单元对图像数据解码。解码处理可包括预测和反变换,预测包括帧内预测和运动补偿。
图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的划分类型和预测模式的信息,根据编码单元在预测单元和预测模式中执行帧内预测或运动补偿,从而根据编码单元执行预测。此外,图像数据解码器230 可基于关于根据编码深度的编码单元的变换单元的尺寸的信息,根据编码单元中的每个变换单元来执行反变换,以根据最大编码单元执行反变换。
图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元的编码深度。如果所述划分信息指示在当前深度执行解码,则当前深度是编码深度。因此,图像数据解码器230可通过使用关于预测单元的划分类型、预测模式和变化单元的尺寸的信息,针对当前最大编码单元的图像数据对当前深度的编码单元的编码图像数据进行解码。换而言之,可观察分配给最小编码单元的编码信息,并且包括具有相同划分信息的编码信息的最小编码单元可被聚集以在一个数据单元中被解码。
视频解码设备200可获得与在对每个最大编码单元递归地执行编码时产生最小编码误差的至少一个编码单元有关的信息,并且视频解码设备200可使用所述信息来对当前画面解码。换而言之,可以在每个最大编码单元中的最佳编码单元中对图像数据进行解码。因此,即使图像数据具有高分辨率和大数据量,也可通过使用编码单元的尺寸和编码模式对所述图像数据进行有效地解码和恢复,其中,通过使用从编码器接收的关于最佳编码模式的信息,根据图像数据的特性来自适应地确定编码单元的尺寸和编码模式。
图3是用于描述根据示例性实施例的编码单元的概念的示图。
参照图3,可以以宽度×高度来表示编码单元的尺寸,并且编码单元的尺寸可以是64×64、32×32、16×16、8×8和4×4。除了具有正方形形状的编码单元之外,编码单元可具有64×32、32×64、32×16、16×32、16×8、8×16、8×4 或4×8的尺寸。
在视频数据310中,分辨率是1920×1080,编码单元的最大尺寸是64,最大深度是2。在视频数据320中,分辨率是1920×1080,编码单元的最大尺寸是64,最大深度是4。在视频数据330中,分辨率是352×288,编码单元的最大尺寸是16,最大深度是2。
如果分辨率高或者数据量大,则编码单元的最大尺寸可以很大,从而不仅提高编码效率,还精确地反映图像的特性。因此,具有比视频数据330更高的分辨率的视频数据310和视频数据320的编码单元的最大尺寸可以为64。
最大深度表示从最大编码单元到最小编码单元的总的划分次数。因此,由于视频数据310的最大深度是2,所以视频数据310的编码单元315可包括长轴(long axis)尺寸为64的最大编码单元,还包括由于通过将最大编码单元划分两次使深度加深了两层而使得长轴尺寸为32和16的编码单元。同时,因为视频数据330的最大深度是2,所以视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元,还包括由于通过将最大编码单元划分两次使深度加深了两层而使得长轴尺寸为8和4的编码单元。
因为视频数据320的最大深度是4,所以所述视频数据320的编码单元 325可包括长轴尺寸为64的最大编码单元,并且还包括由于通过将最大编码单元划分四次使深度加深了4层而使得的长轴尺寸为32、16、8和4的编码单元。随着深度加深,详细信息可被精确地表示。
图4是根据示例性实施例的基于编码单元的图像编码器400的框图。
参照图4,帧内预测器410对当前帧405的编码单元中的帧内模式的编码单元执行帧内预测,运动估计器420和运动补偿器425通过使用当前帧405 和参考帧495,对当前帧405的编码单元中的帧间模式的编码单元执行帧间估计和运动补偿。
从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430和量化器440被输出作为量化的变换系数。量化的变换系数通过反量化器460和反变换器470被恢复为空间域中的数据,并且恢复的空间域中的数据在通过去块单元480和环路滤波单元490进行后处理之后,被输出作为参考帧495。量化的变换系数可通过熵编码器450被输出作为比特流455。
为了在视频编码设备100中应用图像编码器400,图像编码器400的所有部件(即,帧内预测器410、运动估计器420、运动补偿器425、变换器430、量化器440、熵编码器450、反量化器460、反变换器470、去块单元480和环路滤波器490)基于最大编码单元、根据深度的编码单元、预测单元和变换单元执行图像编码处理。具体地说,帧内预测器410、运动估计器420以及运动补偿器425通过考虑编码单元的最大尺寸和深度,来确定编码单元的预测单元和预测模式,变换器430通过考虑编码单元的最大尺寸和深度确定变换单元的尺寸。另外,如稍后所述,帧内预测器410通过对色度分量编码单元应用为亮度分量编码单元确定的帧内预测模式来执行帧内预测,因此可提高色度分量编码单元的预测效率。
图5是根据示例性实施例的基于编码单元的图像解码器500的框图。
参照图5,解析器510解析接收的比特流505,并从解析的比特流505 提取将被解码的编码图像数据和解码所需的关于编码的信息。编码图像数据通过熵解码器520和反量化器530被输出作为反量化的数据,并且反量化的数据通过反变换器540被恢复为空间域中的图像数据。帧内预测器550针对空间域中的图像数据,对帧内模式的编码单元执行帧内预测,运动补偿器560 通过使用参考帧585,对帧间模式的编码单元执行运动补偿。经过帧内预测器550和运动补偿器560的空间域中的图像数据可在通过去块单元570和环路滤波单元580进行后处理之后,被输出作为恢复的帧595。另外,通过去块单元570和环路滤波单元580进行后处理的图像数据可被输出作为参考帧 585。
为了在视频解码设备200中应用图像解码器500,图像解码器500的所有部件(即,解析器510、熵解码器520、反量化器530、反变换器540、帧内预测器550、运动补偿器560、去块单元570以及循环滤波单元580)基于最大编码单元、根据深度的编码单元、预测单元和变换单元执行图像解码处理。具体地说,帧内预测器550和运动补偿器560通过考虑编码单元的最大尺寸和深度来确定编码单元的预测单元和预测模式,反变换器540通过考虑编码单元的最大尺寸和深度来确定变换单元的尺寸。
图6是示出根据示例性实施例的根据深度的较深层编码单元的示图。
视频编码设备100和视频解码设备200使用分层的编码单元以考虑图像的特性。根据图像的特性可自适应地确定编码单元的最大高度、最大宽度和最大深度,或可根据用户的输入单独设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来确定根据深度的较深层编码单元的尺寸。
根据示例性实施例,在编码单元的分层结构600中,编码单元的最大高度和最大宽度均为64,最大深度是4。随着深度沿着分层结构600的垂直轴加深,较深层编码单元的高度和宽度均被划分。此外,沿着分层结构600的水平轴示出了构成部分数据单元的预测单元,所述部分数据单元是用于每个较深层编码单元的预测编码的基础。
换而言之,编码单元610是分层结构600中的最大编码单元,其中,深度是0,尺寸(即高度×宽度)是64×64。深度沿着垂直轴加深,并且存在尺寸为32×32和深度为1的编码单元620、尺寸为16×16和深度为2的编码单元 630、尺寸为8×8和深度为3的编码单元640以及尺寸为4×4和深度为4的编码单元650。尺寸为4×4和深度为4的编码单元650是最小编码单元。
部分数据单元在图6中被显示为根据每个深度的沿着水平轴的编码单元的预测单元。换而言之,如果尺寸为64×64和深度为0的编码单元610是预测单元,则所述预测单元可被划分为包括在编码单元610中的多个部分数据单元,即:尺寸为64×64的部分数据单元610、尺寸为64×32的部分数据单元612、尺寸为32×64的部分数据单元614或尺寸为32×32的部分数据单元 616。
尺寸为32×32和深度为1的编码单元620的预测单元可以被划分为包括在编码单元620中的多个部分数据单元,即:尺寸为32×32的部分数据单元620、尺寸为32×16的部分数据单元622、尺寸为16×32的部分数据单元624 和尺寸为16×16的部分数据单元626。
尺寸为16×16和深度为2的编码单元630的预测单元可以被划分为包括在编码单元630中的多个部分数据单元,即:包括在编码单元630中的尺寸为16×16的部分数据单元、尺寸为16×8的部分数据单元632、尺寸为8×16 的部分数据单元634和尺寸为8×8的部分数据单元636。
尺寸为8×8和深度为3的编码单元640的预测单元可以被划分为包括在编码单元640中的多个部分数据单元,即:包括在编码单元640中的尺寸为 8×8的部分数据单元、尺寸为8×4的部分数据单元642、尺寸为4×8的部分数据单元644和尺寸为4×4的部分数据单元646。
尺寸为4×4和深度为4的编码单元650是最小编码单元和最低深度的编码单元。编码单元650的预测单元只被分配给尺寸为4×4的部分数据单元。
为了确定组成最大编码单元610的编码单元的至少一个编码深度,视频编码设备100的编码单元确定器120对包括在最大编码单元610中的与各个深度相应的编码单元执行编码。
随着深度加深,相同范围和相同尺寸的包括数据的根据深度的较深层编码单元的数量增加。例如,需要4个与深度为2相应的编码单元以覆盖与深度为1相应的一个编码单元中包括的数据。因此,为了比较根据深度的相同数据的编码结果,与深度为1相应的编码单元和四个与深度为2相应的编码单元均被编码。
为了对深度中的当前深度执行编码,可通过沿着分层结构600的水平轴对与当前深度相应的编码单元中的每个预测单元执行编码,来针对当前深度确定最小编码误差。另外,可通过随着深度沿分层结构600的垂直轴加深对每个深度执行编码来比较每个深度的最小编码误差,从而搜索根据深度的最小编码误差。编码单元610中具有最小编码误差的深度可被选择作为编码单元610的编码深度和划分类型。
图7是用于描述根据示例性实施例的编码单元710和变换单元720之间的关系的示图。
视频编码设备100或200针对每个最大编码单元根据具有小于或等于最大编码单元的尺寸的编码单元对图像进行编码或解码。可基于不大于相应编码单元的数据单元来选择编码期间用于变换的变换单元的尺寸。例如,在视频编码设备100或200中,如果编码单元170的尺寸是64×64,则可通过使用尺寸为32×32的变换单元720来执行变换。此外,可通过对尺寸为小于 64×64的32×32、16×16、8×8和4×4的变换单元中的每一个执行变换,来对尺寸为64×64的编码单元710的数据进行编码,然后可选择具有最小编码误差的变换单元。
图8是用于描述根据示例性实施例的与编码深度相应的编码单元的编码信息的示图。
视频编码设备100的输出单元130可针对与编码深度对应的每个编码单元,将指示划分类型的信息800、指示预测模式的信息810和指示变换单元的尺寸的信息820编码为关于编码模式的信息,并将其发送。
信息800包括关于当前编码单元的预测单元的划分类型的信息,其中,划分预测单元是用于对当前编码单元进行预测编码的数据单元。例如,深度为0且尺寸为2N×2N的当前编码单元CU_0可被划分为尺寸为2N×2N的预测单元802、尺寸为2N×N的预测单元804、尺寸为N×2N的预测单元806和尺寸为N×N的预测单元808中的任何一个。这里,关于划分类型的信息800 被设置为指示尺寸为2N×N的预测单元804、尺寸为N×2N的预测单元806 和尺寸为N×N的预测单元808中的一个。
信息810指示每个预测单元的预测模式。例如,信息810可指示对由信息800指示的预测单元执行预测编码的模式,即:帧内模式812、帧间模式 814或跳过模式816。
信息820指示当对当前编码单元执行变换时将作为基础的变换单元。例如,变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧间变换单元828。
视频解码设备200的编码信息提取器220可根据每个较深层编码单元提取和使用用于解码的信息800、810和820。
图9是根据示例性实施例的根据深度的较深层编码单元的示图。
划分信息可被用于指示深度的改变。划分信息指示当前深度的编码单元是否被划分为较低深度的编码单元。
用于对深度为0且尺寸为2N_0×2N_0的编码单元进行预测编码的预测单元910可包括:尺寸为2N_0×2N_0的划分类型912、尺寸为2N_0×N_0的划分类型914、尺寸为N_0×2N_0的划分类型916和尺寸为N_0×N_0的划分类型918。
根据每个划分类型,可对尺寸为2N_0×2N_0的一个预测单元、尺寸为 2N_0×N_0的两个预测单元、尺寸为N_0×2N_0的两个预测单元以及尺寸为 N_0×N_0的四个预测单元重复地执行通过运动预测的编码。可对尺寸为2N_0×2N_0、N_0×2N_0、N_0×N_0和N_0×N_0的预测单元执行帧内模式下和帧间模式下的预测。仅对尺寸为2N_0×2N_0的预测单元执行跳过模式下的运动预测。
如果在尺寸为N_0×N_0的划分类型918中编码误差最小,则在操作920,深度从0改变为1以划分划分类型918,并对深度为2和尺寸为N_0×N_0的编码单元922、924、926和928重复执行编码以搜索最小编码误差。
由于对深度相同的编码单元922、924、926和928重复执行编码,因此将描述深度为1的编码单元的编码作为示例。用于对深度为1和尺寸为 2N_1×2N_1(=N_0×N_0)的编码单元进行运动预测的预测单元930可包括:尺寸为2N_1×2N_1的划分类型932、尺寸为2N_1×N_1的划分类型934、尺寸为N_1×2N_1的划分类型936和尺寸为N_1×N_1的划分类型938。根据每个划分类型,对2N_1×2N_1的一个预测单元、尺寸为2N_1×N_1的两个预测单元、尺寸为N_1×2N_1的两个预测单元以及尺寸为N_1×N_1的四个预测单元重复地执行通过运动预测的编码。
如果在尺寸为N_1×N_1的划分类型938中编码误差最小,则在操作940,深度从1改变为2以划分划分类型938,并对深度为2和尺寸为N_2×N_2的编码单元942、944、946和948重复执行编码以搜索最小编码误差。
当最大深度为d时,根据每个深度的划分信息可被设置为达到深度变为 d-1。换而言之,用于对深度为d-1和尺寸为2N_(d-1)×2N_(d-1)的编码单元进行运动预测的预测单元950可包括:尺寸为2N_(d-1)×2N_(d-1)的划分类型 952、尺寸为2N_(d-1)×N_(d-1)的划分类型954、尺寸为N_(d-1)×2N_(d-1)的划分类型956以及尺寸为N_(d-1)×N_(d-1)的划分类型958。
可根据每个划分类型,对尺寸为2N_(d-1)×2N_(d-1)的一个预测单元、尺寸为2N_(d-1)×N_(d-1)的两个预测单元、尺寸为N_(d-1)×2N_(d-1)的两个预测单元以及尺寸为N_(d-1)×N_(d-1)的四个预测单元重复执行通过运动预测的编码。由于最大深度是d,因此深度为d-1的编码单元952不被划分。
为了确定编码单元912的编码深度,视频编码单元设备100通过比较根据深度的编码误差来选择具有最小编码误差的深度。例如,可通过对划分类型912、914、916和918中的每一个执行运动预测来对深度为0的编码单元的编码误差进行编码,然后可确定具有最小编码误差的预测单元。类似地,可根据深度0到d-1搜索具有最小编码误差的预测单元。在深度d,可通过对尺寸为2N_d×2N_d的预测单元960执行运动预测来确定编码误差。这样,可在1到d的所有深度中比较根据深度的最小编码误差,并可将具有最小编码误差的深度确定为编码深度。相应的编码深度模式的编码深度和预测单元可被编码并作为关于编码模式的信息被发送。另外,由于编码单元从深度0被划分到一编码深度,因此仅该编码深度的划分信息被设置为0,除了该编码深度之外的深度的划分信息被设置为1。
视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元912的编码深度以及预测单元的信息,以对编码单元912解码。视频解码设备200可通过使用根据深度的划分信息将划分信息为0的深度确定为编码深度,并且可使用关于相应深度的编码模式的信息以进行解码。
图10A和图10B是描述根据示例性实施例的编码单元1010、预测单元 1060和变换单元1070之间的关系的示图。
编码单元1010是最大编码单元中的与由视频编码设备100确定的编码深度相应的编码单元。预测单元1060是每个编码单元1010的预测单元,变换单元1070是每个编码单元1010的变换单元。
当编码单元1010中的最大编码单元的深度为0时,编码单元1012和1054 的深度为1,编码单元1014、1016、1018、1028、1050和1052的深度为2,编码单元1020、1022、1024、1026、1030、1032和1048的深度为3,编码单元1040、1042、1044和1046的深度为4。
在预测单元1060中,通过在编码单元1010中划分编码单元来获得一些编码单元1014、1016、1022、1032、1048、1050、1052和1054。换而言之,编码单元1014、1022、1050和1054中的划分类型的尺寸为2N×N,编码单元1016、1048和1052的划分类型的尺寸为N×2N,编码单元1032的划分类型的尺寸为N×N。编码单元1010的预测单元小于或等于每个编码单元。
以小于编码单元1052的数据单元对变换单元1070中的编码单元1052 的图像数据执行变换或反变换。另外,变换单元1070中的编码单元1014、 1016、1022、1032、1048、1050和1052与预测单元1060中的那些编码单元在尺寸和形状上不同。换而言之,视频编码设备100和视频解码设备200可单独地对相同的编码单元中的数据单元执行帧内预测、运动估计、运动补偿、变换和反变换。
图11是示出根据示例性实施例的根据编码单元的编码信息的表。
视频编码单元100的编码信息输出单元140可对根据编码单元的编码信息编码,视频解码设备200的编码信息提取器220可提取根据编码单元的编码信息。
编码信息可包括关于编码单元的划分信息、划分类型信息、预测模式信息和关于变换单元的尺寸的信息。图11中示出的编码信息仅仅是可由视频编码设备100和视频解码设备200设置的信息的示例,编码信息不限于此。
划分信息可包括相应的编码单元的编码深度。换而言之,由于编码深度是根据划分信息不再被划分的深度,因此可针对该编码深度设置关于划分类型、预测模式和变换单元的尺寸的信息。如果当前编码单元根据划分信息被进一步划分,则对较低深度的四个划分编码单元独立地执行编码。
关于划分类型的信息可将编码深度中的编码单元的变换单元的划分类型指示为2N×2N、2N×N、N×2N和N×N之一。预测模式可将运动预测模式指示为帧内模式、帧间模式和跳过模式之一。帧内模式可仅被定义在2N×2N和 N×N的划分类型中,跳过模式可仅被定义在2N×2N的划分类型中。变换单元在帧内模式中具有两种尺寸,在帧间模式中具有两种尺寸。
根据编码深度中的编码单元的编码信息可被包括在编码单元的最小编码单元中。因此,通过检查包括在邻近最小编码单元中的编码信息,可确定邻近最小编码单元是否包括在具有相同编码深度的编码单元中。另外,由于可通过使用包括在最小编码单元中的编码信息确定相应编码深度的编码单元,因此可推断最小编码单元的编码深度的分布。
现在将详细描述图4中示出的视频编码设备100的帧内预测单元410和图5中示的视频解码设备200的帧内预测单元550执行的帧内预测。在以下描述中,编码单元指的是图像的编码处理中的当前编码块,解码单元指的是图像的解码处理中的当前解码块。编码单元和解码单元的不同之处仅在于,编码单元用于编码处理,而解码单元用于解码处理。为了一致,除了特殊情况,编码单元和解码单元在编码处理和解码处理中都称为编码单元。
图12A到图12C是根据示例性实施例的亮度分量图像和色度分量图像的格式的示图。
通过使用三个分量(即,Y、Cb和Cr)之一来表示形成一帧的每个编码单元。Y是具有亮度信息的亮度数据,Cb和Cr是具有色度信息的色度数据。
在人通常对于亮度信息比色度信息更敏感的前提下,可使用比亮度数据更少的数据量来表示色度数据。参照图12A,具有4:2:0格式的一个编码单元包括尺寸为H×W(H和W是正整数)的亮度数据1210以及尺寸为(H/2)×(W/2) 的两条色度数据1220和1230,其中,通过对色度分量Cb和Cr进行1/4采样来获得色度数据1220和1230。参照图12B,具有4:2:2格式的一个编码单元包括尺寸为H×W(H和W是正整数)的亮度数据1240以及尺寸为H×(W/2)的两条色度数据1250和1260,其中,通过对色度分量Cb和Cr在水平方向上进行1/2采样来获得色度数据1250和1260。另外,参照图12C,在一个编码单元具有4:4:4格式时,该编码单元包括亮度数据1270、色度数据1280和 1290,每个数据的尺寸均为H×W,没有对色度分量Cb和Cr进行采样,从而精确地表示色度分量图像。
以下,假设被帧内预测的亮度分量编码单元和色度分量编码单元是在 YCbCr(或YUV)色域中定义的具有4:2:0、4:2:2和4:4:4的颜色格式的图像信号之一。
考虑到亮度分量和色度分量之间的关系,通过在应用于色度分量编码单元的候选帧内预测模式中包括为亮度分量编码单元确定的帧内预测模式,提高了色度编码单元的预测效率。
图13是示出根据示例性实施例的根据亮度分量编码单元的尺寸的帧内预测模式的数量的表。
根据示例性实施例,将应用于亮度分量编码单元(在解码处理中的解码单元)的帧内预测模式的数量可被多样地设置。例如,参照图13,如果被执行帧内预测的亮度分量编码单元的尺寸是N×N,则实际对尺寸为2×2、4×4、8×8、 16×16、32×32、64×64和128×128的亮度分量编码单元执行的帧内预测模式的数量可被分别设置为5、9、9、17、33、5和5(在示例2中)。对于另一示例,当将被帧内预测的亮度分量编码单元的尺寸为N×N时,实际对尺寸为 2×2、4×4、8×8、16×16、32×32、64×64和128×128的亮度分量编码单元执行的帧内预测模式的数量可被分别设置为3、17、34、34、34、5和5。实际被执行的帧内预测模式的数量根据亮度分量编码单元的尺寸被不同地设置,这是因为编码预测模式信息的开销根据亮度分量编码单元的尺寸而不同。换而言之,小的亮度分量编码单元占据全部图像数据的小部分,但是为了发送附加信息(诸如亮度分量编码单元的预测模式信息),会具有大的开销。因此,如果通过使用过多数量的预测模式来对亮度分量小编码单元进行编码,则比特数会增加,从而降低压缩效率。另外,亮度分量大编码单元(例如,等于或大于64×64的亮度分量编码单元)通常对应于图像数据的平缓区域,因此通过使用过多数量的预测模式来对该大亮度分量编码单元进行编码也会降低压缩效率。
因此,根据示例性实施例,亮度分量编码单元被粗略地分类为至少三种尺寸,诸如,N1×N1(其中,2=N1=4,N1是整数)、N2×N2(其中,8=N2=32, N2是整数)以及N3×N3(其中,64=N3,N3是整数)。如果对N1×N1的亮度分量编码单元执行的预测模式的数量是A1(其中,A1是正整数),则对N2×N2 的亮度分量编码单元执行的预测模式的数量是A2(其中,A2是正整数),对 N3×N3的亮度分量编码单元执行的预测模式的数量是A3(其中,A3是正整数)。根据亮度分量编码单元的尺寸执行的帧内预测模式的数量可被设置为满足A3=A1=A2。也就是说,如果当前画面被划分为小的亮度分量编码单元、中等亮度分量编码单元和大的亮度分量编码单元,则中等亮度分量编码单元可被设置为具有最大数量的预测模式,小的亮度分量编码单元和大的亮度分量编码单元可被设置为具有相对少数量的预测模式。然而,示例性实施例不限于此,小的亮度分量编码单元和大的亮度分量编码单元还可被设置为具有大数量的预测模式。图13中的根据亮度分量编码单元的尺寸的预测模式的数量仅仅是示例性的并且可改变。
图14A是示出根据示例性实施例的应用于具有预定尺寸的亮度分量编码单元的帧内预测模式的表。
参照图13和图14A,例如,当对尺寸为4×4的亮度分量编码单元执行帧内预测时,该亮度分量编码单元可具有垂直模式(模式0)、水平模式(模式1)、直流(DC)模式(模式2)、对角左下模式(模式3)、对角右下模式(模式4)、垂直右模式(模式5)、水平下模式(模式6)、垂直左模式(模式7)和水平上模式(模式 8)。
图14B示出图14A中示出的帧内预测模式的方向。在图14B中,箭头末端处的数字表示与箭头所指示的预测方向对应的预测模式。这里,模式2是没有方向性的DC模式,因此在图14B中没有示出。
图14C是用于描述根据示例性实施例的通过使用在图14A中示出的帧内预测模式对亮度分量编码单元执行帧内预测的方法的示图。
参照图14C,根据可用帧内预测模式来产生预测编码单元,其中,通过使用当前亮度分量编码单元的邻近像素A到M,根据当前亮度分量编码单元的尺寸确定所述可用帧内预测模式。例如,将描述根据图14A中示出的模式 0(即,垂直模式)对尺寸为4×4的当前编码单元执行预测编码的操作。首先,位于当前编码单元的上侧的邻近像素A到D被预测作为当前编码单元的像素值。也就是说,邻近像素A的值被预测作为当前编码单元的第一列中的四个像素的值,邻近像素B的值被预测作为当前编码单元的第二列中的四个像素的值,邻近像素C的值被预测作为当前编码单元的第三列中的四个像素的值,邻近像素D的值被预测作为当前编码单元的第四列中的四个像素的值。之后,从原始当前编码单元的像素值减去通过使用邻近像素A到D预测的当前编码单元的像素值以计算误差值,然后对误差值编码。
图15是用于解释根据示例性实施例的应用于具有预定尺寸的亮度分量编码单元的帧内预测模式的示图。
参照图13和图15,例如,当对尺寸为2×2的编码单元执行帧内预测时,编码单元可具有总共五个模式,诸如,垂直模式、水平模式、DC模式、平面模式和对角右下模式。
同时,如果尺寸为32×32的亮度分量编码单元具有33个帧内预测模式(如图13所示),则需要设置33个帧内预测模式的方向。根据示例性实施例,为了设置除了图14和图15中示出的帧内预测模式之外的具有各种方向的帧内预测模式,通过使用(dx,dy)参数,来设置用于选择用作亮度分量编码单元的像素的参考像素的邻近像素的预测方向。例如,如果33个预测模式中的每一个被定义为模式N(其中,N是从0到32的整数),则模式0可被设置为垂直模式,模式1可被设置为水平模式,模式2可被设置为DC模式,模式3可被设置为平面模式,模式4到模式31中的每一个可通过使用表示为以下之一的(dx,dy)被定义为具有tan-1(dy/dx)的方向性的预测模式:(1,-1)、(1,1)、(1,2)、 (2,1)、(1,-2)、(2,1)、(1,-2)、(2,-1)、(2,-11)、(5,-7)、(10,-7)、(11,3)、(4,3)、(1,11)、 (1,-1)、(12,-3)、(1,-11)、(1,-7)、(3,-10)、(5,-6)、(7,-6)、(7,-4)、(11,1)、(6,1)、 (8,3)、(5,3)、(5,7)、(2,7)、(5,-7)和(4,-3),如表1所示。
表1
模式32可被设置为使用双线性插值的双线性模式,稍后将参照图16进行描述。
图16A到图16C是用于解释根据示例性实施例的具有各种方向性的亮度分量编码单元的帧内预测模式的参考图。
如上面参照表1所描述的,根据示例性实施例的帧内预测模式中的每一个可通过使用多个(dx,dy)参数具有tan-1(dy/dx)的方向性。
参照图16A,在从将被预测的当前亮度分量编码单元中的当前像素P延长的、角度为根据模式的(dx,dy)参数的值(如表1所示)确定的tan-1(dy/dx)的直线160上的邻近像素A和B可用作当前像素P的预测值(predictor)。在这种情况下,邻近像素A和B可以是已经被编码和恢复的像素,并且属于位于当前编码单元的上方或左侧的先前编码单元。另外,当直线160不是沿着具有整数值的位置上的邻近像素穿过,而是在这些邻近像素之间穿过时,更靠近于直线160的邻近像素可用作当前像素P的预测值。另外,考虑直线160的交叉点和靠近直线160的邻近像素之间的距离的加权平均值可用作当前像素 P的预测值。如果存在与直线160相交的两个像素(例如,位于当前像素P之上的邻近像素A和位于当前像素P的左侧的邻近像素B),则邻近像素A和B 的平均像素值可用作当前像素P的预测值。或者,如果dx和dy参数的值的乘积是正值,则可使用邻近像素A,如果dx和dy参数的值的乘积是负值,则可使用邻近像素B。
图16B和图16C是用于解释当图16A的直线160在整数位置的邻近像素之间穿过而没有通过所述邻近像素时产生预测值的处理的参考图。
参照图16B,如果具有根据每个模式的(dx,dy)确定的tan-1(dy/dx)的角度的直线160在整数位置的邻近像素A 161和邻近像素B 162之间穿过,则考虑延长的直线160的交叉点与靠近延长的直线160的邻近像素A 161和B 162 之间的距离的加权平均值可用作如上所述的预测值。例如,如果邻近像素A 161和角度为tan-1(dy/dx)的延长的直线160的交叉点之间的距离为f,邻近像素B 162和角度为tan-1(dy/dx)的延长的直线160的交叉点之间的距离为g,则可获得当前像素P的预测值为(A×g+B×f)/(f+g)。这里,f和g可以是使用整数的归一化距离。如果使用软件或硬件,则可通过如(g×A+f×B+2)>>2的移位操作获得当前像素P的预测值。如图16B所示,如果延长的直线160穿过将整数位置的邻近像素A 161和邻近像素B 162之间的距离四等分而获得的四个部分中靠近邻近像素161A的第一个四分之一,则可获得当前像素P的预测值为(3×A+B)/4。可通过考虑四舍五入到最接近的整数的移位操作(如 (3×A+B+2)>>2)来执行这样的操作。
同时,如果角度为根据每个模式的(dx,dy)确定的tan-1(dy/dx)的延长的直线160穿过整数位置的邻近像素A 161和邻近像素B 162之间,则邻近像素A 161和邻近像素B 162之间的区间可被划分为预定数量的区域,并且在每个划分的区域中考虑交叉点与邻近像素A 161和邻近像素B 162之间的距离的加权平均值可用作预测值。例如,参照图16C,邻近像素A 161和邻近像素B 162 之间的区间可被划分为如图16C所示的五个区间P1到P5,在每个区间中考虑交叉点与邻近像素A 161和邻近像素B 162之间的距离的代表性加权平均值可被确定,并且该代表性加权平均值可用作当前像素P的预测值。具体地,如果延长的直线160穿过区间P1,则可将邻近像素A的值确定为当前像素P 的预测值。如果延长的直线160穿过区间P2,则考虑邻近像素A和B与区间 P2的中点之间的距离的加权平均值(3×A+1×B+2)>>2可被确定为当前像素P 的预测值。如果延长的直线160穿过区间P3,则考虑邻近像素A和B与区间 P3的中点之间的距离的加权平均值(2×A+2×B+2)>>2可被确定为当前像素P 的预测值。如果延长的直线160穿过区间P4,则考虑邻近像素A和B与区间 P4的中点之间的距离的加权平均值(1×A+3×B+2)>>2可被确定为当前像素P 的预测值。如果延长的直线160穿过区间P5,则邻近像素B的值可被确定为当前像素P的预测值。
另外,如果两个邻近像素(即,如图16A所示的位于上侧的邻近像素A 和位于左侧的邻近像素B)与延长的直线160相交,则邻近像素A和邻近像素 B的平均值可用作当前像素P的预测值,或者如果(dx×dy)是正值,则可使用位于上侧的邻近像素A,而如果(dx×dy)是负值,则可使用位于左侧的邻近像素B。
可由编码端和解码端预先确定表1中示出的具有多种方向性的帧内预测模式,并且可仅发送每个编码单元的帧内预测模式的索引。
图17是用于解释根据示例性实施例的双线性模式的参考图。
参照图17,在双线性模式下,通过考虑将被预测的当前亮度分量编码单元中的当前像素P 170的值、位于当前亮度分量编码单元的上、下、左、右边界的像素的值以及当前像素P 170与当前亮度分量编码单元的上、下、左、右边界之间的距离来计算几何平均值。然后该几何平均值被用作当前像素P 170的预测值。例如,在双线性模式下,使用位于当前像素P170的上、下、左、右侧的虚拟像素A 171、虚拟像素B 172、像素D 176和像素E 177以及当前像素P 170与当前亮度分量编码单元的上、下、左、右边界之间的距离计算的几何平均值用作当前像素P 170的预测值。由于双线性模式是帧内预测模式之一,因此已经被编码和恢复的、属于先前亮度分量编码单元的邻近像素用作预测的参考像素。因此,不使用当前亮度分量编码单元中的像素值,而使用位于当前亮度分量编码单元的上侧和左侧的邻近像素计算的虚拟像素值被用作像素A 171和像素B 172。
特别地,首先,通过计算当前亮度分量编码单元的最右上点的邻近像素 (右上像素)174的值和当前亮度分量编码单元的最左下点的邻近像素(左下像素)175的平均值,来计算当前亮度分量编码单元的最右下点的虚拟像素C 173的值,如以下的等式1所示:
[等式1]
C=0.5(LeftDownPixel+RightUpPixel)
接下来,通过使用以下的等式2,考虑当前像素P 170和当前亮度分量编码单元的左边界之间的距离W1以及当前像素P 170和当前亮度分量编码单元的右边界之间的距离W2,计算在当前像素P 170向下延长时位于当前亮度分量编码单元的最下边界上的虚拟像素A 171的值:
[等式2]
A=(C×W1+LeftDownPixel×W2)/(W1+W2);
A=(C×W1+LeftDownPixel×W2+((W1+W2)/2))/(W1+W2)
当等式2中W1+W2的值是2的幂(如2n)时,可通过诸如 A=(C×W1+LeftDownPixel×W2+2(n-1))>>n的移位操作来计算 A=(C×W1+LeftDownPixel×W2+((W1+W2)/2))/(W1+W2),而不用除法。
类似地,通过使用以下的等式3,考虑当前像素P 170与当前亮度分量编码单元的上边界之间的距离h1以及当前像素P 170与当前亮度分量编码单元的下边界之间的距离h2,计算在当前像素P 170沿向右方向延伸时位于当前亮度分量编码单元的最右边界上的虚拟像素B 172的值:
[等式3]
B=(C×h1+RightUpPixel×h2)/(h1+h2)
B=(C×h1+RightUpPixel×h2+((h1+h2)/2))/(h1+h2)
当等式3中h1+h2的值是2的幂(如2m)时,可通过如 B=(C×h1+RightUpPixel×h2+2(m-1))>>m的移位操作来计算 B=(C×h1+RightUpPixel×h2+((h1+h2)/2))/(h1+h2),而不用除法。
一旦通过使用等式1到等式3确定了位于当前像素P 170的右边界上的虚拟像素B172和位于当前像素P 170的下边界上的虚拟像素A 171的值时,可通过使用A+B+D+E的平均值确定当前像素P 170的预测值。具体地,考虑当前像素P 170与虚拟像素A 171、虚拟像素B172、像素D 176和像素E 177 之间的距离的加权平均值或者A+B+D+E的平均值可用作当前像素P 170的预测值。例如,如果使用加权平均值并且块的尺寸为16×16,则可获得当前像素P的预测值为(h1×A+h2×D+W1×B+W2×E+16)>>5。这样的双线性预测应用于当前编码单元中的所有像素,并产生双线性预测模式中的当前编码单元的预测编码单元。
根据示例性实施例,根据依照亮度分量编码单元的尺寸确定的多种帧内预测模式执行预测编码,从而允许基于图像的特性进行有效率的视频压缩。
根据示例性实施例,由于相比于在传统编解码器中使用的帧内预测模式,更多数量的帧内预测模式根据编码单元的尺寸而被使用,因此与传统编解码器的兼容性会成为问题。在传统技术中,如图14A和图14B所示,可使用最多9个帧内预测模式。因此,有必要将根据示例性实施例选择的具有多种方向的帧内预测模式映射到更少数量的帧内预测模式之一。也就是说,在当前编码单元的可用帧内预测模式的数量为N1(N1是整数)时,为了使当前编码单元的可用帧内预测模式与包括N2(N2是与N1不同的整数)个帧内预测模式的预定尺寸的编码单元兼容,可将当前编码单元的帧内预测模式映射到N2个帧内预测模式中具有最近似方向的帧内预测模式。例如,在当前编码单元中,如表1所示,总共33个帧内预测模式可用,假设最终应用于当前编码单元的帧内预测模式是具有tan-1(3/4)= 36.87(度)的方向性的模式14(即, (dx,dy)=(4,3))。在这种情况下,为了将应用于当前块的帧内预测模式匹配到如图14A和图14B所示的9个帧内预测模式之一,可选择具有与36.87(度) 的方向性最近似的方向性的模式4(右下模式)。也就是说,表1的模式14可被映射到图14B中示出的模式4。同样地,如果应用于当前编码单元的帧内预测模式被选择为是表1的33个可用帧内预测模式中的模式15(即, (dx,dy)=(1,11)),则由于应用于当前编码单元的帧内预测模式的方向性为 tan-1(11)= 84.80(度),因此图14B的具有与方向性84.80(度)最近似的方向性的模式0(垂直)可被映射到模式15。
同时,为了对经过帧内预测而编码的亮度分量编码单元进行解码,需要预测模式信息以确定使用哪个帧内预测模式来对当前亮度分量编码单元编码。因此,当前亮度分量编码单元的帧内预测模式信息在对图像编码时被添加到比特流。此时,开销会增加,因而如果每个亮度分量编码单元的预测模式信息都被添加到比特流,则会降低压缩效率。
因此,根据示例性实施例,不是发送被确定为对当前亮度分量编码单元进行编码的结果的当前亮度分量编码单元的帧内预测模式信息,而是仅发送帧内预测模式的实际值和从邻近亮度分量编码的预测的帧内预测模式的预测值之间的差值。
图18是用于解释根据示例性实施例的产生当前亮度分量编码单元A 180 的帧内预测模式的预测值的处理的示图。
参照图18,可从在邻近亮度分量编码单元中确定的帧内预测模式预测当前亮度分量编码单元A 180的帧内预测模式。例如,当左亮度分量编码单元B 181的帧内预测模式是模式3,并且上亮度分量编码单元C 182的帧内预测模式是模式4时,当前亮度分量编码单元A 180的帧内预测模式可被预测为模式3,其具有上亮度分量编码单元C 182和左亮度分量编码单元B 181的帧内预测模式中的较小值。如果被确定为对当前亮度分量编码单元A 180实际执行的帧内预测编码的结果的帧内预测模式是模式4,则仅发送1(即,与构成从邻近亮度分量编码单元预测的帧内预测模式的模式3之间的差值)作为帧内预测模式信息。在解码期间,以相同的方式产生当前亮度分量解码单元的帧内预测模式的预测值,通过比特流接收的差值与该预测值相加,从而获得实际应用于当前亮度分量解码单元的帧内预测模式信息。在以上描述中,仅使用当前亮度分量编码单元A 180的上邻近编码单元C 182和左邻近编码单元B 181,但是可选地,可通过使用图18的其它的邻近亮度分量编码单元E和D 来预测当前亮度分量编码单元的帧内预测模式。可使用亮度分量编码单元的帧内预测模式,以预测稍后将描述的色度分量编码单元的帧内预测模式。
同时,由于实际执行的帧内预测模式根据亮度分量编码单元的尺寸而不同,因此从邻近亮度分量编码单元预测的帧内预测模式可能与当前亮度分量编码单元的帧内预测模式不匹配。因此,为了从具有不同尺寸的邻近亮度分量编码单元预测当前亮度分量编码单元的帧内预测模式,需要映射亮度分量编码单元的不同的帧内预测模式的映射处理。
图19A和图19B是用于解释根据示例性实施例的具有不同尺寸的亮度分量编码单元之间的帧内预测模式的映射处理的参考图。
参照图19A,当前亮度分量编码单元A 190的尺寸为16×16,左亮度分量编码单元B191的尺寸为8×8,上亮度分量编码单元C 192的尺寸为4×4。另外,如参照图13所描述的,在尺寸分别为4×4、8×8和16×16的亮度分量编码单元中可用的帧内预测模式的数量分别为9、9和33。这里,由于在左亮度分量编码单元B 191中可用的帧内预测模式和在上亮度分量编码单元C 192中可用的帧内预测模式与在当前亮度分量编码单元A 190中可用的帧内预测模式不同,因此从左亮度分量编码单元B 191和上亮度分量编码单元C 192预测的帧内预测模式可能不适合于用作当前亮度分量编码单元A 190的帧内预测模式的预测值。因此,在当前示例性实施例中,左亮度分量编码单元B 191和上亮度分量编码单元C 192的帧内预测模式分别被改变为预定数量的代表性帧内预测模式中最近似方向的第一代表性帧内预测模式和第二代表性帧内预测模式,并且第一代表性帧内预测模式和第二代表性帧内预测模式中具有较小模式值的一个被选择作为最终代表性帧内预测模式。然后,从当前亮度分量编码单元A 190中可用的帧内预测模式中选择具有与最终代表性帧内预测模式最近似方向的帧内预测模式,作为当前亮度分量编码单元A 190的帧内预测模式。
可选择地,参照图19B,假设当前亮度分量编码单元A的尺寸为16×16,左亮度分量编码单元B 191的尺寸为32×32,上亮度分量编码单元C 192的尺寸为8×8。另外,假设尺寸分别为8×8、16×16和32×32的亮度分量编码单元中可用的帧内预测模式的数量分别为9、9和33。另外,假设左亮度分量编码单元B的帧内预测模式为模式4,上亮度分量编码单元C的帧内预测模式为模式31。在这种情况下,由于左亮度分量编码单元B的帧内预测模式和上亮度分量编码单元C的帧内预测模式彼此不兼容,因此左亮度分量编码单元 B和上亮度分量编码单元C中的每一个帧内预测模式被映射到如图20所示的代表性帧内预测模式之一。由于作为左亮度分量编码单元B的帧内预测模式的模式31具有如表1所示的(dx,dy)=(4,-3)的方向性,因此图20的代表性帧内预测模式中具有与tan-1(-3/4)最近似的方向性的模式5被映射,并且由于上亮度分量编码单元C的帧内预测模式模式4具有与图20的代表性帧内预测模式中的模式4相同的方向性,因此模式4被映射。
作为左亮度分量编码单元B的映射帧内预测模式的模式5和作为上亮度分量编码单元C的映射帧内预测模式的模式4中具有较小模式值的模式4可被确定为当前亮度分量编码单元的帧内预测模式的预测值,并且仅当前亮度分量编码单元的实际帧内预测模式和预测帧内预测模式之间的模式差值可被编码为当前亮度分量编码单元的预测模式信息。
图20是用于解释将邻近亮度分量编码单元的帧内预测模式映射到代表性帧内预测模式之一的处理的参考图。在图20中,垂直模式0、水平模式1、 DC模式2、对角左模式3、对角右模式4、垂直右模式5、水平下模式6、垂直左模式7和水平上模式8被示出为代表性帧内预测模式。然而,代表性帧内预测模式不限于此,并且可被设置为具有多种方向性。
参照图20,预定数量的代表性帧内预测模式被设置,邻近亮度分量编码单元的帧内预测模式被映射为具有最近似方向的代表性帧内预测模式。例如,当上亮度分量编码单元的帧内预测模式具有MODE_A 200所指示的方向性时,上亮度分量编码单元的帧内预测模式MODE_A 200被映射到预定的代表性帧内预测模式1到9中具有最近似方向的模式1。类似地,当左亮度分量编码单元的帧内预测模式具有MODE_B 201所指示的方向性时,左亮度分量编码单元的帧内预测模式MODE_B 201被映射到预定的代表性帧内预测模式 1到9中具有最近似方向的模式5。
然后,第一代表性帧内预测模式和第二代表性帧内预测模式中具有较小模式值的一个被选择作为最终的邻近亮度分量编码单元的代表性帧内预测模式。由于较小的模式值通常被设置用于更频繁出现的帧内预测模式,因此具有较小的模式值的代表性帧内预测模式被选择。换而言之,当基于邻近亮度分量编码单元预测不同的帧内预测模式时,具有较小模式值的帧内预测模式更有可能出现。因此,当不同的帧内预测模式彼此竞争时,可选择具有较小模式值的帧内预测模式作为当前亮度分量编码单元的预测值或帧内预测模式。
即使当基于邻近亮度分量编码单元选择了代表性帧内预测模式时,选择的代表性帧内预测模式也可不被用作当前亮度分量编码单元的预测值或帧内预测模式。如果当前亮度分量编码单元A 190具有33个帧内预测模式,并且代表性帧内预测模式的数量为如参照图19所述的9,则与代表性帧内预测模式对应的当前亮度分量编码单元A 190的帧内预测模式不存在。在这种情况下,类似于如上所述将邻近亮度分量编码单元的帧内预测模式映射到代表性帧内预测模式,从根据当前亮度分量编码单元的尺寸的帧内预测模式中选择的具有与代表性帧内预测模式最近似方向的帧内预测模式可被最终选择,作为当前亮度分量编码单元的帧内预测模式的预测值。例如,当基于图20的邻近亮度分量编码单元最终选择的代表性帧内预测模式是模式1时,从根据当前亮度分量编码单元的尺寸的可用帧内预测模式中选择具有与模式1的方向性最近似的方向性的帧内预测模式,作为当前亮度分量编码单元的帧内预测模式的预测值。
同时,如参照图16A到图16C描述的,如果通过使用延长的直线160上的或靠近延长的直线160的邻近像素来产生当前像素P的预测值,则延长的直线160实际具有tan-1(dy/dx)的方向性。为了计算方向性,由于除法(dy/dx) 是必要的,因此当使用硬件或软件时计算向下进行到小数位,因而增加了计算量。因此,当通过以与参照表1描述的方式相似的方式使用dx和dy参数来设置用于选择将用作关于编码单元中的像素的参考像素的邻近像素的预测方向时,使用设置dx和dy的处理以便减少计算量。
图25是用于解释根据示例性实施例的当前像素和位于具有(dy/dx)的方向性的延长线上的邻近像素之间的关系的示图。
参照图25,假设当前像素P的位置为P(j,i),位于方向性为tan-1(dy/dx)(即,倾斜度)且穿过当前像素P的延长的直线2510上的上邻近像素和左邻近像素分别为A和B。当假设上邻近像素的位置对应于坐标平面上的X轴,左邻近像素的位置对应于坐标平面上的y轴时,上邻近像素A位于(j+i×dx/dy,0),左邻近像素B位于(0,i+j×dy/dx)。因此,为了确定用于预测当前像素P的上邻近像素A和左邻近像素B中的任何一个,需要除法,诸如,dx/dy或dy/dx。这样的除法如上所述是很复杂的,因而降低了软件或硬件的计算速度。
因此,代表用于确定邻近像素的预测模式的方向性的dx和dy中的任何一个的值可被确定为2的幂。也就是说,当n和m是整数时,dx和dy可以分别是2n和2m。
参照图25,如果左邻近像素B用作当前像素P的预测值,dx具有值2n,则确定作为左邻近像素B的位置的(0,i+j×dy/dx)所需的j×dy/dx变为 (j×dy/(2n)),通过如(j×dy)>>n的移位操作容易获得使用这样的2的幂的除法,从而降低了计算量。
同样地,如果上邻近像素A用作当前像素P的预测值,dy具有值2m,则确定作为上邻近像素A的位置的(j+i×dx/dy,0)所需的i×dx/dy变为 (i×dx)/(2m),通过如(i×dx)>>m的移位操作容易获得使用这样的2的幂的除法。
图26是用于解释根据示例性实施例的位于根据当前像素的位置的方向为(dx,dy)的延长线上的邻近像素的改变的示图。
作为根据当前像素的位置的预测所需的邻近像素,选择上邻近像素和左邻近像素中的任何一个。
参照图26,在当前像素2610是P(j,i)并通过使用位于预测方向上的邻近像素来预测当前像素2610时,上像素A用于预测当前像素P 2610。在当前像素2610是Q(b,a)时,左像素B用于预测当前像素Q 2620。
如果代表预测方向的(dx,dy)中的仅y轴方向的dy分量具有2的幂(如 2m),而可通过诸如(j+(i×dx)>>m,0)的移位操作确定图26中的上像素A而不用除法,则左像素B需要诸如(0,a+b×2m/dx)的除法。因此,为了在针对当前块的所有像素产生预测值时排除除法,所有的dx和dy可具有2的幂的类型。
图27和图28是用于解释根据示例性实施例的确定帧内预测模式方向的方法的示图。
通常,存在图像或视频信号中显示的线性图案是垂直或水平的多种情况。因此,当通过使用参数dx和dy定义具有多种方向性的帧内预测模式时,可通过如下定义dx和dy值来提高图像编码效率。
具体地,如果dy具有固定的值2m,则可设置dx的绝对值,从而使靠近垂直方向的预测方向之间的距离狭窄,并且使更接近于水平方向的预测模式之间的距离更宽。例如,参照图27,如果dy的值为24(即,16),则dx 的值可被设置为1、2、3、4、6、9、12、16、0、-1、-2、-3、-4、-6、-9、-12 和-16,从而使靠近垂直方向的预测方向之间的距离狭窄,而更靠近于水平方向的预测模式之间的距离更宽。
同样地,如果dx具有固定的值2n,则可设置dy的绝对值,从而使靠近水平方向的预测方向之间的距离狭窄,并且使更接近于垂直方向的预测模式之间的距离更宽。例如,参照图28,如果dx的值为24(即,16),则dy 的值可被设置为1、2、3、4、6、9、12、16、0、-1、-2、-3、-4、-6、-9、-12 和-16,从而使靠近水平方向的预测方向之间的距离狭窄,而更靠近于垂直方向的预测模式之间的距离更宽。
另外,当dx和dy的值之一固定时,其余值可被设置为根据预测模式增加。例如,如果dy固定,则dx之间的距离可被设置为按照预定值增加。另外,水平方向和垂直方向的角度可按照预定单位被划分,可在每个划分的角度中设置这样的增加量。例如,如果dy固定,则dx的值可被设置为具有小于15度的区间中的增加量a、在15度到30度之间的区间中的增加量b以及在大于30度的区间中的增加宽度c。在这种情况下,为了具有如图25所示的形状,dx的值可被设置为满足a<b<c的关系。
例如,参照图25到图28描述的预测模式可通过使用如表2到表4所示的(dx,dy)被定义为具有tan-1(dy/dx)的方向性的预测模式。
表2
dx dy dx dy dx dy
-32 32 21 32 32 13
-26 32 26 32 32 17
-21 32 32 32 32 21
-17 32 32 -26 32 26
-13 32 32 -21 32 32
-9 32 32 -17
-5 32 32 -13
-2 32 32 -9
0 32 32 -5
2 32 32 -2
5 32 32 0
9 32 32 2
13 32 32 5
17 32 32 9
表3
dx dy dx dy dx Dy
-32 32 19 32 32 10
-25 32 25 32 32 14
19 32 32 32 32 19
-14 32 32 -25 32 25
-10 32 32 -19 32 32
-6 32 32 -14
-3 32 32 -10
-1 32 32 -6
0 32 32 -3
1 32 32 -1
3 32 32 0
6 32 32 1
10 32 32 3
14 32 32 6
表4
dx dy dx dy dx dy
-32 32 23 32 32 15
-27 32 27 32 32 19
-23 32 32 32 32 23
-19 32 32 -27 32 27
-15 32 32 -23 32 32
-11 32 32 -19
-7 32 32 -15
-3 32 32 -11
0 32 32 -7
3 32 32 -3
7 32 32 0
11 32 32 3
15 32 32 7
19 32 32 11
例如,参照表2,预测模式通过使用被表示为以下之一的(dx,dy)而具有 tan-1(dy/dx)的方向性:(-32,32)、(-26,32)、(-21,32)、(-17,32)、(-13,32)、(-9, 32)、(-5,32)、(-2,32)、(0,32)、(2,32)、(5,32)、(9,32)、(13,32)、(17,32)、 (21,32)、(26,32)、(32,32)、(32,-26)、(32,-21)、(32,-17)、(32,-13)、(32,-9)、 (32,-5)、(32,-2)、(32,0)、(32,2)、(32,5)、(32,9)、(32,13)、(32,17)、(32,21)、 (32,26)和(32,32)。
图21是用于解释根据示例性实施例的应用于色度分量编码单元的候选帧内预测模式的示图。
参照图21,在对色度分量编码单元进行帧内预测时应用的候选帧内预测模式包括垂直模式、水平模式、DC模式、平面模式以及如上所述针对与当前色度分量编码单元对应的亮度分量编码单元最终确定的帧内预测模式。另外,如上所述,被帧内预测的亮度分量编码单元和色度分量编码单元可以是具有在YCbCr(或YUV)色域中定义的4:2:0、4:2:2、4:4:4的颜色格式的图像信号之一。基于诸如R-D代价的代价计算,多个可用帧内预测模式中具有最小代价的帧内预测模式被选择作为亮度分量编码单元的帧内预测模式。候选帧内预测模式的代价均被计算,具有最小代价的候选帧内预测模式被选择作为色度分量编码单元的最终帧内预测模式。
图22是根据示例性实施例的图像的帧内预测设备2200的框图。根据本发明的当前实施例的帧内预测设备2200可作为图4的图像编码器400的帧内预测器410和图5的图像解码器500的帧内预测器550而进行操作。
参照图22,帧内预测设备220包括亮度帧内预测器2210和色度帧内预测器2220。如上所述,亮度帧内预测器2210基于根据最大编码单元和最大深度划分的每个亮度分量编码单元的尺寸,根据当前亮度分量编码单元的尺寸选择将被应用的候选帧内预测模式,并将确定的候选帧内预测模式应用于当前亮度分量编码单元,以对当前亮度分量编码单元执行帧内预测。亮度帧内预测器2210基于根据经过帧内预测产生的预测编码单元和原始亮度分量编码单元之间的误差值的代价,将具有最小代价的最优帧内预测模式确定为当前亮度分量编码单元的最终帧内预测模式。
色度帧内预测器2220计算根据垂直模式、水平模式、DC模式、平面模式以及与当前色度分量编码单元对应的亮度分量编码单元的最终帧内预测模式的代价,并将具有最小代价的帧内预测模式确定为当前色度分量编码单元的最终帧内预测模式。
同时,当图22的帧内预测设备2200应用于解码设备时,通过使用最大编码单元和构成最大编码单元的分层划分信息的深度信息确定当前亮度分量解码单元和色度分量解码单元的尺寸(其中,通过使用图5的熵解码器520从比特流提取所述最大编码单元和深度信息),并通过使用关于应用于当前亮度分量解码单元和色度分量解码单元的帧内预测模式的信息确定将被执行的帧内预测模式。另外,帧内预测设备2200通过根据提取的帧内预测模式对每个亮度分量解码单元和色度分量解码单元执行帧内预测,来产生预测解码单元。预测解码单元被添加的从比特流恢复的残差数据,因此当前亮度分量解码单元和色度分量解码单元被解码。
图23是示出根据示例性实施例的确定编码单元的帧内预测模式的方法的流程图。
参照图23,在操作2310,基于最大编码单元和构成最大编码单元的分层划分信息的深度,亮度分量的当前画面被划分为至少一个亮度分量编码单元。
在操作2320,确定亮度分量编码单元的帧内预测模式。如上所述,通过基于亮度分量编码单元的尺寸选择将被应用的候选帧内预测模式,通过将候选的帧内预测模式应用于亮度分量编码单元来对亮度分量编码单元执行帧内预测,然后将具有最小代价的最优帧内预测模式确定为亮度分量编码单元的帧内预测模式,由此确定亮度分量编码单元的帧内预测模式。
在操作2330,确定包括亮度分量编码单元的确定的帧内预测模式的色度分量编码单元的候选帧内预测模式。如上所述,除了亮度分量编码单元的确定的帧内预测模式以外,应用于色度分量编码单元的候选帧内预测模式还包括垂直模式、水平模式、DC模式和平面模式。
在操作2340,对根据确定的候选帧内预测模式的色度分量编码单元的代价进行比较,以确定具有最小代价的帧内预测模式。
图24是示出根据示例性实施例的确定解码单元的帧内预测模式的方法的流程图。
参照图24,在操作2410,从比特流提取最大编码单元和构成最大编码单元的分层划分信息的深度。
在操作2420,基于提取的最大编码单元和深度,将被解码的当前画面被划分为亮度分量解码单元和色度分量解码单元。
在操作2430,从比特流提取关于应用于亮度分量解码单元和色度分量解码单元的帧内预测模式的信息。
在操作2440,根据提取的帧内预测模式对亮度分量解码单元和色度分量解码单元执行帧内预测,从而对亮度分量解码单元和色度分量解码单元解码。
根据示例性实施例,通过添加具有多种方向性的亮度分量编码单元的帧内预测模式作为色度分量编码单元的帧内预测模式,可增加色度分量的图像的预测效率以及整个图像的预测效率,而不会增加吞吐量。
示例性实施例可实施为计算机程序,并可在通过使用计算机可读记录介质执行程序的通用数字计算机中实现。计算机可读记录介质的示例包括磁存储介质(例如,ROM、软盘、硬盘等)、光学记录介质(例如,CD-ROM或DVD) 以及存储介质。
示例性实施例的设备可包括连接设备或编码器的每个单元的总线、连接到总线的至少一个处理器(处理器用于执行命令)以及连接到总线的用于存储命令、接收的消息和产生的消息的存储器。
虽然已经参照示例性实施例具体地示出和描述了本发明,但是本领域的普通技术人员应理解,在不脱离权利要求限定的本发明的精神和范围的情况下,可以在形式和细节上进行各种改变。示例性实施例应被认为仅是描述性,而不是出于限制的目的。因此,本发明的范围不是由本发明的详细描述限定,而是由权利要求限定,并且范围内的所有差异应被理解为包括在本发明中。

Claims (1)

1.一种对图像解码的方法,所述方法包括:
从比特流获取指示亮度块的帧内预测模式的第一信息;
从比特流获取指示与亮度块相应的色度块的帧内预测模式的第二信息;
当第二信息指示色度块的帧内预测模式与亮度块的帧内预测模式相同时,确定色度块的帧内预测模式与亮度块的帧内预测模式相同;
基于亮度块的帧内预测模式对亮度块执行帧内预测;
基于色度块的帧内预测模式对色度块执行帧内预测,
其中,亮度块的帧内预测模式包括多个方向之中的特定方向,所述特定方向由水平方向上的dx数和垂直方向上的固定数指示或者由垂直方向上的dy数和水平方向上的固定数指示,
其中,对亮度块执行帧内预测的步骤包括:
根据当前像素的位置以及由亮度块的帧内预测模式指示的所述特定方向来确定将要获取的邻近像素的数量,其中,所述邻近像素位于亮度块的左侧或位于亮度块的上侧,
当所述邻近像素的数量为1时,基于所述邻近像素来获取当前像素的预测值,
当所述邻近像素的数量为2时,基于所述邻近像素的加权平均来获取当前像素的预测值,
其中,当第二信息指示色度块的帧内预测模式与亮度块的帧内预测模式相同时,色度块的帧内预测模式被确定为与亮度块的帧内预测模式相同,
所述加权平均是通过将权重乘以两个邻近像素中的每个邻近像素并将乘积值求平均而得到的,其中,所述权重基于dx数和dy数之一以及当前像素的位置被确定,
其中,根据编码单元的最大尺寸的信息,当前画面被划分为多个最大编码单元,
根据划分信息,当前画面的亮度分量最大编码单元和色度分量最大编码单元被分别划分为一个或更多个亮度分量编码单元和一个或更多个色度分量编码单元,
一个或更多个亮度分量预测单元从亮度分量编码单元被获得,
一个或更多个色度分量预测单元从色度分量编码单元被获得,
所述亮度块是从亮度分量编码单元获得的所述一个或更多个亮度分量预测单元中的亮度分量预测单元,
所述色度块是从色度分量编码单元获得的所述一个或更多个色度分量预测单元中的色度分量预测单元。
CN201510175162.3A 2010-04-05 2011-04-05 确定图像编码单元和图像解码单元的帧内预测模式 Active CN104780366B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2010-0031145 2010-04-05
KR1020100031145A KR101503269B1 (ko) 2010-04-05 2010-04-05 영상 부호화 단위에 대한 인트라 예측 모드 결정 방법 및 장치, 및 영상 복호화 단위에 대한 인트라 예측 모드 결정 방법 및 장치
CN201180027802.6A CN102934446B (zh) 2010-04-05 2011-04-05 确定图像编码单元和图像解码单元的帧内预测模式

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201180027802.6A Division CN102934446B (zh) 2010-04-05 2011-04-05 确定图像编码单元和图像解码单元的帧内预测模式

Publications (2)

Publication Number Publication Date
CN104780366A CN104780366A (zh) 2015-07-15
CN104780366B true CN104780366B (zh) 2018-09-18

Family

ID=44709661

Family Applications (8)

Application Number Title Priority Date Filing Date
CN201510175162.3A Active CN104780366B (zh) 2010-04-05 2011-04-05 确定图像编码单元和图像解码单元的帧内预测模式
CN201510175695.1A Active CN104767996B (zh) 2010-04-05 2011-04-05 确定图像编码单元和图像解码单元的帧内预测模式
CN201510173765.XA Active CN104780364B (zh) 2010-04-05 2011-04-05 确定图像编码单元和图像解码单元的帧内预测模式
CN201710706809.XA Active CN107426569B (zh) 2010-04-05 2011-04-05 确定图像编码单元和图像解码单元的帧内预测模式
CN201180027802.6A Active CN102934446B (zh) 2010-04-05 2011-04-05 确定图像编码单元和图像解码单元的帧内预测模式
CN201510175912.7A Active CN104811701B (zh) 2010-04-05 2011-04-05 确定图像编码单元和图像解码单元的帧内预测模式
CN201510175694.7A Active CN104768002B (zh) 2010-04-05 2011-04-05 确定图像编码单元和图像解码单元的帧内预测模式
CN201510173807.XA Active CN104780365B (zh) 2010-04-05 2011-04-05 确定图像编码单元和图像解码单元的帧内预测模式

Family Applications After (7)

Application Number Title Priority Date Filing Date
CN201510175695.1A Active CN104767996B (zh) 2010-04-05 2011-04-05 确定图像编码单元和图像解码单元的帧内预测模式
CN201510173765.XA Active CN104780364B (zh) 2010-04-05 2011-04-05 确定图像编码单元和图像解码单元的帧内预测模式
CN201710706809.XA Active CN107426569B (zh) 2010-04-05 2011-04-05 确定图像编码单元和图像解码单元的帧内预测模式
CN201180027802.6A Active CN102934446B (zh) 2010-04-05 2011-04-05 确定图像编码单元和图像解码单元的帧内预测模式
CN201510175912.7A Active CN104811701B (zh) 2010-04-05 2011-04-05 确定图像编码单元和图像解码单元的帧内预测模式
CN201510175694.7A Active CN104768002B (zh) 2010-04-05 2011-04-05 确定图像编码单元和图像解码单元的帧内预测模式
CN201510173807.XA Active CN104780365B (zh) 2010-04-05 2011-04-05 确定图像编码单元和图像解码单元的帧内预测模式

Country Status (24)

Country Link
US (8) US8619858B2 (zh)
EP (6) EP3280140B1 (zh)
JP (7) JP5883846B2 (zh)
KR (1) KR101503269B1 (zh)
CN (8) CN104780366B (zh)
AU (1) AU2011239130C1 (zh)
BR (5) BR122020016354B1 (zh)
CA (5) CA2884486C (zh)
CY (5) CY1117535T1 (zh)
DK (5) DK2903274T3 (zh)
ES (6) ES2644037T3 (zh)
HR (5) HRP20160526T1 (zh)
HU (6) HUE035944T2 (zh)
LT (4) LT2903275T (zh)
MX (1) MX2012011563A (zh)
MY (6) MY186586A (zh)
PL (6) PL2903275T3 (zh)
PT (4) PT2903274T (zh)
RS (5) RS56437B1 (zh)
RU (6) RU2542884C2 (zh)
SI (5) SI2903274T1 (zh)
SM (1) SMT201600140B (zh)
WO (1) WO2011126275A2 (zh)
ZA (6) ZA201208296B (zh)

Families Citing this family (85)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101503269B1 (ko) 2010-04-05 2015-03-17 삼성전자주식회사 영상 부호화 단위에 대한 인트라 예측 모드 결정 방법 및 장치, 및 영상 복호화 단위에 대한 인트라 예측 모드 결정 방법 및 장치
KR101904948B1 (ko) * 2010-04-09 2018-10-08 엘지전자 주식회사 비디오 데이터 처리 방법 및 장치
KR101530284B1 (ko) 2010-07-16 2015-06-19 삼성전자주식회사 영상의 인트라 예측 부호화, 복호화 방법 및 장치
MX2013003679A (es) * 2010-10-01 2013-08-12 Samsung Electronics Co Ltd Metodo y aparato de intraprediccion de imagen.
KR101842037B1 (ko) 2011-03-06 2018-03-27 엘지전자 주식회사 휘도 샘플을 이용한 색차 블록의 화면 내 예측 방법 및 이러한 방법을 사용하는 장치
US20140044347A1 (en) * 2011-04-25 2014-02-13 Sharp Kabushiki Kaisha Mage coding apparatus, image coding method, image coding program, image decoding apparatus, image decoding method, and image decoding program
KR101678347B1 (ko) * 2011-06-20 2016-11-21 가부시키가이샤 제이브이씨 켄우드 화상 부호화 장치, 화상 부호화 방법 및 화상 부호화 프로그램, 또한 화상 복호 장치, 화상 복호 방법 및 화상 복호 프로그램
KR20120140181A (ko) * 2011-06-20 2012-12-28 한국전자통신연구원 화면내 예측 블록 경계 필터링을 이용한 부호화/복호화 방법 및 그 장치
CN103503457B (zh) 2011-06-24 2017-02-08 三菱电机株式会社 图像编码装置、图像解码装置、图像编码方法以及图像解码方法
CN107820094A (zh) * 2011-07-02 2018-03-20 三星电子株式会社 视频编码设备、视频解码设备和计算机可读存储介质
CN103748877B (zh) * 2011-08-17 2017-05-10 联发科技(新加坡)私人有限公司 帧内预测方法和装置
US9787982B2 (en) 2011-09-12 2017-10-10 Qualcomm Incorporated Non-square transform units and prediction units in video coding
EP2764694A4 (en) 2011-10-07 2015-11-25 Pantech Co Ltd METHODS AND APPARATUSES FOR INTRA PREDICTION MODE CODING AND DECODING USING INTRA CANDIDATE PREDICTION MODES
US9699457B2 (en) 2011-10-11 2017-07-04 Qualcomm Incorporated Most probable transform for intra prediction coding
JP6034010B2 (ja) * 2011-10-24 2016-11-30 ソニー株式会社 符号化装置、符号化方法、およびプログラム
US9247254B2 (en) * 2011-10-27 2016-01-26 Qualcomm Incorporated Non-square transforms in intra-prediction video coding
US9247257B1 (en) 2011-11-30 2016-01-26 Google Inc. Segmentation based entropy encoding and decoding
CN110830798B (zh) * 2012-01-18 2023-05-02 韩国电子通信研究院 视频解码装置、视频编码装置和传输比特流的方法
US9210438B2 (en) * 2012-01-20 2015-12-08 Sony Corporation Logical intra mode naming in HEVC video coding
US11039138B1 (en) 2012-03-08 2021-06-15 Google Llc Adaptive coding of prediction modes using probability distributions
US20130251028A1 (en) * 2012-03-22 2013-09-26 The Hong Kong University Of Science And Technology Video encoding and decoding with channel prediction and error correction capability
KR101749297B1 (ko) * 2012-04-12 2017-06-21 미디어텍 싱가폴 피티이. 엘티디. 크로마 서브샘플링 포맷들의 블록 파티션을 위한 방법 및 장치
US9912944B2 (en) * 2012-04-16 2018-03-06 Qualcomm Incorporated Simplified non-square quadtree transforms for video coding
GB2501535A (en) * 2012-04-26 2013-10-30 Sony Corp Chrominance Processing in High Efficiency Video Codecs
US9781447B1 (en) 2012-06-21 2017-10-03 Google Inc. Correlation based inter-plane prediction encoding and decoding
US9426466B2 (en) * 2012-06-22 2016-08-23 Qualcomm Incorporated Transform skip mode
US9774856B1 (en) 2012-07-02 2017-09-26 Google Inc. Adaptive stochastic entropy coding
US9167268B1 (en) 2012-08-09 2015-10-20 Google Inc. Second-order orthogonal spatial intra prediction
US9380298B1 (en) 2012-08-10 2016-06-28 Google Inc. Object-based intra-prediction
US9344742B2 (en) 2012-08-10 2016-05-17 Google Inc. Transform-domain intra prediction
CN103634603B (zh) 2012-08-29 2017-07-07 中兴通讯股份有限公司 视频编解码方法、装置及系统
KR102134367B1 (ko) * 2012-09-10 2020-07-15 선 페이턴트 트러스트 화상 부호화 방법, 화상 복호화 방법, 화상 부호화 장치, 화상 복호화 장치, 및 화상 부호화 복호화 장치
US9369732B2 (en) 2012-10-08 2016-06-14 Google Inc. Lossless intra-prediction video coding
JP2014082639A (ja) * 2012-10-16 2014-05-08 Canon Inc 画像符号化装置およびその方法
JP6137817B2 (ja) * 2012-11-30 2017-05-31 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム
US9628790B1 (en) 2013-01-03 2017-04-18 Google Inc. Adaptive composite intra prediction for image and video compression
CN103929650B (zh) * 2013-01-10 2017-04-12 乐金电子(中国)研究开发中心有限公司 一种深度编码单元编码方法、解码方法、编码器及解码器
KR101436949B1 (ko) * 2013-01-18 2014-09-03 연세대학교 산학협력단 영상 인코딩 방법 및 장치, 그리고 영상 처리 장치
KR101475286B1 (ko) * 2013-01-18 2014-12-23 연세대학교 산학협력단 인트라 예측 방법 및 장치, 그리고 영상 처리 장치
US9509998B1 (en) 2013-04-04 2016-11-29 Google Inc. Conditional predictive multi-symbol run-length coding
WO2014163200A1 (ja) * 2013-04-05 2014-10-09 三菱電機株式会社 カラー画像符号化装置、カラー画像復号装置、カラー画像符号化方法及びカラー画像復号方法
US10003792B2 (en) * 2013-05-27 2018-06-19 Microsoft Technology Licensing, Llc Video encoder for images
US20150016516A1 (en) * 2013-07-15 2015-01-15 Samsung Electronics Co., Ltd. Method for intra prediction improvements for oblique modes in video coding
US9392288B2 (en) 2013-10-17 2016-07-12 Google Inc. Video coding using scatter-based scan tables
US9179151B2 (en) 2013-10-18 2015-11-03 Google Inc. Spatial proximity context entropy coding
KR101519557B1 (ko) * 2013-12-27 2015-05-13 연세대학교 산학협력단 고속 화면 내 예측 부호화 방법 및 그 장치
WO2015100731A1 (en) * 2014-01-03 2015-07-09 Mediatek Singapore Pte. Ltd. Methods for determining the prediction partitions
WO2015139165A1 (en) 2014-03-17 2015-09-24 Microsoft Technology Licensing, Llc Encoder-side decisions for screen content encoding
JP6330507B2 (ja) * 2014-06-19 2018-05-30 ソニー株式会社 画像処理装置及び画像処理方法
KR101936663B1 (ko) * 2014-06-26 2019-01-09 후아웨이 테크놀러지 컴퍼니 리미티드 고효율 비디오 코딩 중 계산 부하의 경감 방법 및 장치
CN105812795B (zh) * 2014-12-31 2019-02-12 浙江大华技术股份有限公司 一种最大编码单元的编码模式的确定方法和装置
WO2016123792A1 (en) 2015-02-06 2016-08-11 Microsoft Technology Licensing, Llc Skipping evaluation stages during media encoding
CN104853192B (zh) * 2015-05-08 2018-02-13 腾讯科技(深圳)有限公司 预测模式选择方法及装置
US10038917B2 (en) 2015-06-12 2018-07-31 Microsoft Technology Licensing, Llc Search strategies for intra-picture prediction modes
US10009620B2 (en) 2015-06-22 2018-06-26 Cisco Technology, Inc. Combined coding of split information and other block-level parameters for video coding/decoding
US10003807B2 (en) * 2015-06-22 2018-06-19 Cisco Technology, Inc. Block-based video coding using a mixture of square and rectangular blocks
US10136132B2 (en) 2015-07-21 2018-11-20 Microsoft Technology Licensing, Llc Adaptive skip or zero block detection combined with transform size decision
CN107306353B (zh) * 2016-04-19 2020-05-01 广州市动景计算机科技有限公司 图像空间预测模式选择方法及装置、图像压缩方法及设备
JP6669622B2 (ja) * 2016-09-21 2020-03-18 Kddi株式会社 動画像復号装置、動画像復号方法、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体
CN117395408A (zh) * 2016-10-04 2024-01-12 韩国电子通信研究院 对图像进行编码/解码的方法和设备以及记录介质
EP3306922A1 (en) * 2016-10-05 2018-04-11 Thomson Licensing Method and apparatus for encoding a picture using rate-distortion based block splitting
EP3316578A1 (en) * 2016-10-25 2018-05-02 Thomson Licensing Method and apparatus for encoding and decoding a picture
WO2018124686A1 (ko) * 2016-12-26 2018-07-05 에스케이텔레콤 주식회사 인트라 예측을 이용한 영상의 부호화 및 복호화
WO2018131838A1 (ko) * 2017-01-11 2018-07-19 엘지전자 주식회사 영상 코딩 시스템에서 인트라 예측에 따른 영상 디코딩 방법 및 장치
CN117255196A (zh) * 2017-03-22 2023-12-19 韩国电子通信研究院 基于块形式的预测方法和装置
CN107071417B (zh) * 2017-04-10 2019-07-02 电子科技大学 一种用于视频编码的帧内预测方法
CN111373750A (zh) * 2017-10-24 2020-07-03 韦勒斯标准与技术协会公司 视频信号处理方法和装置
DE112018005899T5 (de) * 2017-12-18 2020-08-13 Arris Enterprises Llc System und Verfahren zum Konstruieren einer Ebene für planare Prädiktion
CN117834858A (zh) 2018-04-24 2024-04-05 三星电子株式会社 视频编码方法和装置以及视频解码方法和装置
CN108737819B (zh) * 2018-05-20 2021-06-11 北京工业大学 一种基于四叉树二叉树结构的灵活编码单元划分方法
GB2589769B (en) 2018-07-15 2023-02-15 Beijing Bytedance Network Tech Co Ltd Cross-component coding order derivation
CN118524228A (zh) * 2018-09-07 2024-08-20 有限公司B1影像技术研究所 编码/解码方法、介质和传输比特流的方法
IL314659A (en) 2018-11-08 2024-09-01 Guangdong Oppo Mobile Telecommunications Corp Ltd A method of encoding/decoding an image signal and a device for it
BR112021011723A2 (pt) 2018-12-21 2021-08-31 Huawei Technologies Co., Ltd. Método e aparelho de predição intra e codificador, decodificador, programa de computador, mídia de armazenamento não transitória, e fluxo de bits
EP3881535A4 (en) 2018-12-29 2022-03-16 Zhejiang Dahua Technology Co., Ltd. INTRA-PREDICTION SYSTEMS AND METHODS
CN109803145B (zh) * 2018-12-29 2022-10-28 浙江大华技术股份有限公司 帧内预测方法、装置、编码器及存储装置
CN113347416B (zh) 2019-01-02 2023-06-02 Oppo广东移动通信有限公司 色度帧内预测方法和装置、及计算机存储介质
CN110213586B (zh) * 2019-06-10 2021-03-05 杭州电子科技大学 一种vvc帧内预测角度模式快速选择方法
WO2020262963A1 (ko) * 2019-06-24 2020-12-30 엘지전자 주식회사 크로마 블록의 최대 변환 크기 설정을 이용한 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법
CN115834879A (zh) 2019-08-14 2023-03-21 Lg电子株式会社 图像编解码方法、发送比特流的方法和记录介质
CN113766223A (zh) * 2020-06-03 2021-12-07 北京三星通信技术研究有限公司 预测模式获取方法和装置
US11962784B2 (en) 2020-09-23 2024-04-16 Ofinno, Llc Intra prediction
US12096003B2 (en) 2020-11-17 2024-09-17 Ofinno, Llc Reduced residual inter prediction
WO2023050370A1 (zh) * 2021-09-30 2023-04-06 Oppo广东移动通信有限公司 帧内预测的方法、解码器、编码器和编解码系统
CN114885164B (zh) * 2022-07-12 2022-09-30 深圳比特微电子科技有限公司 确定帧内预测模式的方法、装置及电子设备和存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101160970A (zh) * 2005-04-18 2008-04-09 三星电子株式会社 运动图像编码和解码方法以及设备

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7830959B2 (en) * 2003-12-26 2010-11-09 Electronics And Telecommunications Research Institute Apparatus and method for performing intra prediction for image decoder
EP1558040A1 (en) * 2004-01-21 2005-07-27 Thomson Licensing S.A. Method and apparatus for generating/evaluating prediction information in picture signal encoding/decoding
US8082419B2 (en) * 2004-03-30 2011-12-20 Intel Corporation Residual addition for video software techniques
KR100813958B1 (ko) * 2004-06-07 2008-03-14 세종대학교산학협력단 동영상의 무손실 인코딩 및 디코딩 방법, 그 장치
US7430238B2 (en) * 2004-12-10 2008-09-30 Micronas Usa, Inc. Shared pipeline architecture for motion vector prediction and residual decoding
US7970219B2 (en) * 2004-12-30 2011-06-28 Samsung Electronics Co., Ltd. Color image encoding and decoding method and apparatus using a correlation between chrominance components
US8290057B2 (en) * 2005-02-18 2012-10-16 Mediatek Incorporation Method of decoding a digital video sequence and related apparatus
KR100763178B1 (ko) * 2005-03-04 2007-10-04 삼성전자주식회사 색 공간 스케일러블 비디오 코딩 및 디코딩 방법, 이를위한 장치
JP4050754B2 (ja) * 2005-03-23 2008-02-20 株式会社東芝 ビデオエンコーダ及び動画像信号の符号化方法
EP1753242A2 (en) * 2005-07-18 2007-02-14 Matsushita Electric Industrial Co., Ltd. Switchable mode and prediction information coding
JP4828543B2 (ja) * 2005-09-26 2011-11-30 三菱電機株式会社 動画像符号化装置及び動画像復号装置
KR100727991B1 (ko) * 2005-10-01 2007-06-13 삼성전자주식회사 영상의 인트라 예측 부호화 방법 및 그 방법을 사용하는부호화 장치
KR100750145B1 (ko) * 2005-12-12 2007-08-21 삼성전자주식회사 영상의 인트라 예측 부호화, 복호화 방법 및 장치
KR20070077609A (ko) * 2006-01-24 2007-07-27 삼성전자주식회사 인트라 예측 모드 결정 방법 및 장치
EP1985124B1 (en) 2006-02-17 2010-09-01 Thomson Licensing Process for coding images using intra prediction mode
KR101330630B1 (ko) 2006-03-13 2013-11-22 삼성전자주식회사 최적인 예측 모드를 적응적으로 적용하여 동영상을부호화하는 방법 및 장치, 동영상을 복호화하는 방법 및장치
US8718139B2 (en) * 2007-01-12 2014-05-06 Mitsubishi Electric Corporation Image decoding device and image decoding method
JP5026092B2 (ja) 2007-01-12 2012-09-12 三菱電機株式会社 動画像復号装置および動画像復号方法
US8630346B2 (en) * 2007-02-20 2014-01-14 Samsung Electronics Co., Ltd System and method for introducing virtual zero motion vector candidates in areas of a video sequence involving overlays
US8995522B2 (en) * 2007-04-13 2015-03-31 Apple Inc. Method and system for rate control
US20080285652A1 (en) * 2007-05-14 2008-11-20 Horizon Semiconductors Ltd. Apparatus and methods for optimization of image and motion picture memory access
KR101362757B1 (ko) * 2007-06-11 2014-02-14 삼성전자주식회사 인터 컬러 보상을 이용한 영상의 부호화 방법 및 장치,복호화 방법 및 장치
KR101291196B1 (ko) * 2008-01-25 2013-07-31 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
KR20090129926A (ko) * 2008-06-13 2009-12-17 삼성전자주식회사 영상 부호화 방법 및 그 장치, 영상 복호화 방법 및 그 장치
JP2010035137A (ja) 2008-07-01 2010-02-12 Sony Corp 画像処理装置および方法、並びにプログラム
KR101517768B1 (ko) 2008-07-02 2015-05-06 삼성전자주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
US8275208B2 (en) * 2008-07-02 2012-09-25 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding image using image separation based on bit location
US8948443B2 (en) * 2008-08-19 2015-02-03 Thomson Licensing Luminance evaluation
KR101452860B1 (ko) 2009-08-17 2014-10-23 삼성전자주식회사 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
KR101503269B1 (ko) 2010-04-05 2015-03-17 삼성전자주식회사 영상 부호화 단위에 대한 인트라 예측 모드 결정 방법 및 장치, 및 영상 복호화 단위에 대한 인트라 예측 모드 결정 방법 및 장치
KR101678347B1 (ko) * 2011-06-20 2016-11-21 가부시키가이샤 제이브이씨 켄우드 화상 부호화 장치, 화상 부호화 방법 및 화상 부호화 프로그램, 또한 화상 복호 장치, 화상 복호 방법 및 화상 복호 프로그램
CN104185993B (zh) * 2012-03-30 2019-02-12 索尼公司 图像处理设备和方法以及记录介质
CN108712649A (zh) * 2012-06-29 2018-10-26 韩国电子通信研究院 视频解码方法、视频编码方法和计算机可读介质
US9374592B2 (en) * 2012-09-08 2016-06-21 Texas Instruments Incorporated Mode estimation in pipelined architectures

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101160970A (zh) * 2005-04-18 2008-04-09 三星电子株式会社 运动图像编码和解码方法以及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Fast intra-mode decision in H.264 video coding using simple directional masks;KIM J et al.;《Visual Communications and Image Processing 2005》;20050715;第2.1节,附图1 *

Also Published As

Publication number Publication date
CY1119621T1 (el) 2018-04-04
RU2014153748A (ru) 2016-07-20
BR112012025310B1 (pt) 2022-02-15
CA2795475A1 (en) 2011-10-13
MY186574A (en) 2021-07-27
EP2903273B1 (en) 2017-10-11
US20170223364A1 (en) 2017-08-03
RU2595950C2 (ru) 2016-08-27
CA2884537C (en) 2017-08-22
HUE029176T2 (en) 2017-02-28
MY186587A (en) 2021-07-28
US8964840B2 (en) 2015-02-24
JP2015180090A (ja) 2015-10-08
HRP20171545T1 (hr) 2017-11-17
EP2545713B1 (en) 2016-05-18
HRP20171546T1 (hr) 2017-11-17
CA2884537A1 (en) 2011-10-13
BR122020016355B1 (pt) 2022-02-08
BR112012025310A2 (pt) 2016-06-28
ES2644036T3 (es) 2017-11-27
EP2903275A1 (en) 2015-08-05
MY186586A (en) 2021-07-28
DK2905962T3 (en) 2017-10-30
ZA201500718B (en) 2017-04-26
ZA201500717B (en) 2016-02-24
BR122021005439B1 (pt) 2022-02-08
CN104780365B (zh) 2018-09-18
WO2011126275A2 (en) 2011-10-13
PL2905962T3 (pl) 2017-12-29
JP2015180089A (ja) 2015-10-08
RS56437B1 (sr) 2018-01-31
CN102934446B (zh) 2017-09-12
CN107426569B (zh) 2020-07-28
HRP20171544T1 (hr) 2017-12-01
CN104780366A (zh) 2015-07-15
JP2015180087A (ja) 2015-10-08
CN104767996A (zh) 2015-07-08
EP2545713A4 (en) 2013-08-07
CN104768002A (zh) 2015-07-08
US20180227583A1 (en) 2018-08-09
SI2545713T1 (sl) 2016-08-31
US20110243225A1 (en) 2011-10-06
EP2903274B1 (en) 2017-09-13
JP6343038B2 (ja) 2018-06-13
PL2903275T3 (pl) 2017-12-29
LT2903274T (lt) 2017-09-25
HUE036050T2 (hu) 2018-06-28
US9794577B2 (en) 2017-10-17
BR122021005440B1 (pt) 2022-02-08
PL2545713T3 (pl) 2016-10-31
RU2595949C2 (ru) 2016-08-27
ES2744279T3 (es) 2020-02-24
WO2011126275A3 (en) 2012-01-26
HUE036255T2 (hu) 2018-06-28
JP2018157580A (ja) 2018-10-04
BR122020016354B1 (pt) 2022-02-15
CA2884486A1 (en) 2011-10-13
RS54757B1 (sr) 2016-10-31
SI2905962T1 (sl) 2017-11-30
CN104811701A (zh) 2015-07-29
EP2903275B1 (en) 2017-10-11
ES2644039T3 (es) 2017-11-27
HUE035944T2 (hu) 2018-06-28
US9667974B2 (en) 2017-05-30
RU2012146757A (ru) 2014-06-20
PT2903274T (pt) 2017-09-22
MY164324A (en) 2017-12-15
HRP20171387T1 (hr) 2017-11-03
RU2595946C2 (ru) 2016-08-27
JP2013524675A (ja) 2013-06-17
RU2542884C2 (ru) 2015-02-27
PL3280140T3 (pl) 2019-11-29
CN104780365A (zh) 2015-07-15
JP2015180088A (ja) 2015-10-08
ZA201208296B (en) 2015-06-24
CN102934446A (zh) 2013-02-13
RU2014153849A (ru) 2016-07-20
EP2903273A1 (en) 2015-08-05
US20130329793A1 (en) 2013-12-12
KR20110111854A (ko) 2011-10-12
CN104811701B (zh) 2018-11-23
CN107426569A (zh) 2017-12-01
US9967572B2 (en) 2018-05-08
LT2903275T (lt) 2017-11-10
RU2014153750A (ru) 2016-07-20
US20150117532A1 (en) 2015-04-30
RS56358B1 (sr) 2017-12-29
RU2014153851A (ru) 2015-06-10
US10432948B2 (en) 2019-10-01
US20150124881A1 (en) 2015-05-07
HRP20160526T1 (hr) 2016-06-17
SI2903273T1 (sl) 2017-11-30
PT2905962T (pt) 2017-10-23
PL2903274T3 (pl) 2017-11-30
DK2903274T3 (en) 2017-10-02
EP2905962A1 (en) 2015-08-12
RU2595947C2 (ru) 2016-08-27
RS56438B1 (sr) 2018-01-31
SI2903274T1 (sl) 2017-10-30
MX2012011563A (es) 2012-12-17
PT2903273T (pt) 2017-10-24
JP2017063507A (ja) 2017-03-30
DK2903275T3 (da) 2017-11-06
CN104780364B (zh) 2019-04-05
CY1119347T1 (el) 2018-02-14
RS56439B1 (sr) 2018-01-31
LT2905962T (lt) 2017-11-10
ZA201500715B (en) 2016-01-27
EP2903274A1 (en) 2015-08-05
CN104780364A (zh) 2015-07-15
CA2884540C (en) 2017-03-14
CA2884205A1 (en) 2011-10-13
MY186589A (en) 2021-07-29
HUE046784T2 (hu) 2020-03-30
JP5883846B2 (ja) 2016-03-15
CY1119623T1 (el) 2018-04-04
SMT201600140B (it) 2016-07-01
AU2011239130B2 (en) 2014-11-06
CY1119617T1 (el) 2018-04-04
CA2795475C (en) 2017-02-14
KR101503269B1 (ko) 2015-03-17
ES2572640T3 (es) 2016-06-01
RU2014153752A (ru) 2016-07-20
AU2011239130A1 (en) 2012-11-01
US20170374370A1 (en) 2017-12-28
ES2644037T3 (es) 2017-11-27
LT2903273T (lt) 2017-11-10
CY1117535T1 (el) 2017-04-26
AU2011239130C1 (en) 2015-04-16
EP3280140B1 (en) 2019-08-14
HUE035945T2 (hu) 2018-06-28
DK2903273T3 (en) 2017-10-30
CA2884205C (en) 2017-12-12
CA2884540A1 (en) 2011-10-13
RU2608397C2 (ru) 2017-01-18
CN104768002B (zh) 2017-09-22
CN104767996B (zh) 2018-06-05
EP2905962B1 (en) 2017-10-11
US20150117533A1 (en) 2015-04-30
JP6673976B2 (ja) 2020-04-01
PL2903273T3 (pl) 2018-01-31
CA2884486C (en) 2017-03-14
US8619858B2 (en) 2013-12-31
SI2903275T1 (sl) 2017-11-30
PT2903275T (pt) 2017-10-23
EP3280140A1 (en) 2018-02-07
DK2545713T3 (da) 2016-05-30
ZA201500716B (en) 2016-01-27
ZA201500719B (en) 2016-01-27
ES2640629T3 (es) 2017-11-03
EP2545713A2 (en) 2013-01-16
MY186576A (en) 2021-07-27

Similar Documents

Publication Publication Date Title
CN104780366B (zh) 确定图像编码单元和图像解码单元的帧内预测模式
CN104811710B (zh) 对视频编码的方法和设备及对视频解码的方法和设备
CN102484704B (zh) 对视频编码的方法和设备以及对视频解码的方法和设备
CN104967846B (zh) 对视频解码的设备
CN105100809B (zh) 用于使用帧内预测进行图像编码和解码的方法和设备
TW201309036A (zh) 使用亮度成分影像的預測色度成分影像用的裝置與方法
TW202143731A (zh) 在高級運動向量預測模式中的圖像解碼方法
CN103596004A (zh) Hevc中基于数学统计和分类训练的帧内预测方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant