CN103843348A - 图像处理装置和方法 - Google Patents

图像处理装置和方法 Download PDF

Info

Publication number
CN103843348A
CN103843348A CN201280048981.6A CN201280048981A CN103843348A CN 103843348 A CN103843348 A CN 103843348A CN 201280048981 A CN201280048981 A CN 201280048981A CN 103843348 A CN103843348 A CN 103843348A
Authority
CN
China
Prior art keywords
motion vector
quantization parameter
unit
current region
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201280048981.6A
Other languages
English (en)
Inventor
佐藤数史
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN103843348A publication Critical patent/CN103843348A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

公开了一种在对运动向量编码时能够提高编码效率的图像处理装置和方法。运动向量编码单元生成(确定)每个PU的预测运动向量。区域决定单元参考当前PUC的预测运动向量和与当前PUC邻接的各个邻接PU的预测运动向量来确定与当前PUC具有相同预测运动向量的邻接PUT所属的CUT,作为为了生成当前CUT的预测量化参数而要参考的区域。本公开例如可应用到图像处理装置。

Description

图像处理装置和方法
技术领域
本公开涉及图像处理装置和方法。具体而言,本公开涉及能够提高编码效率的图像处理装置和方法。
背景技术
近年来,用于根据如下编码方案对图像进行压缩和编码的装置已普及了:该编码方案将图像信息作为数字数据来处理,其在此情况下以高效率地传送和存储信息为目标并且通过利用图像信息所特有的冗余性根据诸如离散余弦变换之类的正交变换和运动补偿来压缩图像信息。这种编码方案的示例包括MPEG(Moving Picture Experts Group,运动图片专家组)等等。
特别地,MPEG2(ISO/IEC13818-2)被定义为一种通用图像编码方案并且是一种涵盖了隔行扫描图像和顺序扫描图像以及标准分辨率图像和高清晰度图像的标准。例如,MPEG2目前被广泛用在用于专业和消费用途的许多种应用中。通过采用MPEG2压缩方案,例如,对于具有720×480像素的标准分辨率的隔行扫描图像分配4至8Mbps的码量(比特率)。通过采用MPEG2压缩方案,例如对于具有1920×1088像素的高分辨率的隔行扫描图像分配18至22Mbps的码量(比特率)。结果,可以实现高压缩率和良好的图像质量。
MPEG2主要旨在用于适合广播的高图像质量编码,而并不兼容用于实现比MPEG1更低的码量(比特率)(更高的压缩率)的编码方案。随着移动终端的普及,预期将来对于这种编码方案的需求将会增加。为了对此作出响应,已确认了MPEG4编码方案的标准化。关于图像编码方案,其规范于1998年12月被确认为国际标准ISO/IEC14496-2。
标准化的日程表明,其于2003年3月成为了名为H.264及MPEG-4Part10(高级视频编码,以下称为H.264/AVC)的国际标准。
另外,作为H.264/AVC的扩展,包括诸如RGB、4:2:2、4:4:4之类的操作所必要的编码工具和MPEG-2规定的8x8DCT和量化矩阵的FRExt(Fidelity Range Extension,保真范围扩展)的标准化在2005年2月完成了。从而,获得了能够令人满意地利用H.264/AVC来表达电影中包括的胶片噪声的编码方案,并且该编码方案将被用在诸如蓝光盘(注册商标)之类的许多种应用中。
然而,近来,对于更高的压缩编码,例如压缩是高画质图像的四倍的4000×2000像素的图像,或者例如在传送能力有限的环境(如因特网)中分发高画质图像,有更多的需求。从而,以上所述的ITU-T下的VCEG(=Video Coding Expert Group,视频编码专家组)正继续进行与编码效率的提高有关的研究。
作为提高编码效率的一种方法,为了利用AVC方案中定义的中值预测来改进运动向量的编码,已提出了一种方法,其允许除了在中值预测中获得的“空间预测子”以外,“时间预测子”和“空间-时间预测子”中的任何一个也可被自适应性地用作预测运动向量信息(以下,这种自适应使用也被称为MV竞争)(例如,参见非专利文献1)。
在AVC方案中,当选择预测运动向量信息时,使用基于被称为联合模型(joint model,JM)的AVC的参考软件中实现的高复杂度模式或低复杂度模式的成本函数值。
也就是说,计算使用预测运动向量信息时的成本函数值并且选择最优的预测运动向量信息。在图像压缩信息中,传送指示关于所使用的预测运动向量信息的信息的标志信息。
然而,将宏块的大小设定到16×16像素对于将成为下一代编码方案的对象的名为UHD(Ultra High Definition,超高清晰度;4000×2000像素)的大图像帧不是最优的。
从而,被称为HEVC(High Efficiency Video Coding,高效率视频编码)的编码系统的标准化当前正被作为ITU-T和ISO/IEC的联合标准化组织的JCTVC(Joint Collaboration Team-Video Coding,联合协作组-视频编码)所开发,以便与AVC相比进一步提高编码效率(例如,参见非专利文献2)。
在HEVC编码方案中,编码单位(coding unit,CU)被定义为与AVC方案中的宏块相同的处理单位。CU的大小不是像AVC方案的宏块那样固定到16×16像素,而是在各个序列的图像压缩信息中指定的。另外,在各个序列中,定义CU的最大大小(LCU:最大编码单位)和最小大小(SCU:最小编码单位)。
另外,在非专利文献2中,可以以子LCU为单位传送量化参数QP。传送量化参数的编码单位的大小是在每个图片的图像压缩信息中指定的。另外,图像压缩信息中包括的关于量化参数的信息是以各个编码单位传送的。
另外,作为对于运动信息的编码方案之一,提出了一种被称为运动分区合并的方法(以下也称为合并模式)(例如,参见非专利文献3)。在此方法中,当当前块的运动信息与邻居块的运动信息相同时,只传送标志信息。在解码期间,利用邻居块的运动信息来重构当前块的运动信息。
然而,在上述MV竞争或合并模式中,由于时间预测子特别是在静止图像区域中实现更高的编码效率,所以观察到如下趋势:即,当在静止图像区域中基于成本函数值来选择预测子时,更有可能选择时间预测子。
引文列表
非专利文献
非专利文献1:Joel Jung,Guillaume Laroche,"Competition-Based Scheme for Motion Vector Selection andCoding",VCEG-AC06,ITU-Telecommunications StandardizationSector STUDY GROUP16Question6Video Coding Experts Group(VCEG)29th Meeting:Klagenfurt,Austria,17-18July,2006
非专利文献2:Thomas Wiegand,Woo-Jin Han,Benjamin Bross,Jens-Rainer Ohm,Gary J.Sullivan,"Working Draft4ofHigh-Efficiency Video Coding",JCTVC-F803,Joint CollaborativeTeam on Video Coding(JCT-VC)of ITU-T SG16WP3and ISO/IECJTC1/SC29/WG116th Meeting:Torino,IT,14-22July,2011
非专利文献3:Martin Winken,Sebastian Bosse,Benjamin Bross,Philipp Helle,Tobias Hinz,Heiner Kirchhoffer,HaricharanLakshman,Detlev Marpe,Simon Oudin,Matthias Preiss,HeikoSchwarz,Mischa Siekmann,Karsten Suehring,and Thomas Wiegand,"Description of video coding technology proposed by FraunhoferHHI",JCTVC-A116,April,2010
发明内容
本发明要解决的问题
这里,在片间(inter-slices),将考虑在当前CU中选择空间预测子并且在当前块的左邻居CU中选择时间预测子的情况或者相反的情况。在此情况下,根据非专利文献2中公开的量化参数的预测编码方案,由于量化参数是在静止区域和运动区域的不同区域之间编码的,所以预测效率会降低。
本公开是鉴于这些情况而作出的,并且目标在于提高对量化参数编码时的编码效率。
解决问题的方案
根据本公开的第一方面,提供了一种图像处理装置,包括:预测运动向量生成单元,其利用位于当前区域周围的周边区域的运动向量生成在对当前区域的运动向量解码时使用的预测运动向量;预测量化参数生成单元,其根据由预测运动向量生成单元生成的周边区域的预测运动向量的预测方法生成在对当前区域的量化参数解码时使用的预测量化参数;以及参数解码单元,其利用由预测运动向量生成单元生成的当前区域的预测运动向量来对当前区域的运动向量解码并且利用由预测量化参数生成单元生成的当前区域的预测量化参数来对当前区域的量化参数解码。
预测量化参数生成单元可依据周边区域的预测运动向量的预测方法是空间预测还是时间预测来生成当前区域的预测量化参数。
预测量化参数生成单元可在周边区域的预测运动向量的预测方法是空间预测时依据对于空间预测参考的参考区域的位置是上方还是左侧来生成当前区域的预测量化参数。
预测量化参数生成单元可利用根据与预测当前区域的预测运动向量的预测方法相同的预测方法生成的周边区域的预测量化参数来生成当前区域的预测量化参数。
当区域由多个子区域构成时,预测量化参数生成单元可以周边区域为对象利用周边区域的位置与位于当前区域左上角的左上子区域邻接的子区域的预测运动向量来生成当前区域的预测量化参数。
当区域由多个子区域构成时,预测量化参数生成单元可以周边区域为对象利用周边区域的在当前区域上方邻接位置处的上方子区域的预测运动向量和周边区域的在当前区域左侧邻接位置处的左侧子区域的预测运动向量来生成当前区域的预测量化参数。
当对周边区域应用双预测式预测时,预测量化参数生成单元可根据周边区域的关于List0预测的预测运动向量的预测方法来生成当前区域的预测量化参数。
当对周边区域应用双预测式预测时,预测量化参数生成单元可在当前图片未被重排序时根据周边区域的关于List0预测的预测运动向量的预测方法来生成当前区域的预测量化参数,并且在当前图片被重排序时根据周边区域的关于List1预测的预测运动向量的预测方法来生成当前区域的预测量化参数。
当对周边区域应用双预测式预测时,预测量化参数生成单元可根据周边区域的关于时间轴上的更近距离的预测的预测运动向量的预测方法来生成当前区域的预测量化参数。
预测量化参数生成单元可根据周边区域的预测运动向量的预测方向和当前区域的预测运动向量的预测方向来生成当前区域的预测量化参数。
图像处理装置还可包括解码单元,其利用由参数解码单元解码出的运动向量和量化参数来对比特流进行解码。
比特流是以具有层次结构的单位来编码的,并且解码单元以具有层次结构的单位来对比特流解码。
根据本公开的第一方面,提供了一种图像处理方法,用于使得图像处理装置执行:利用位于当前区域周围的周边区域的运动向量生成在对当前区域的运动向量解码时使用的预测运动向量;根据所生成的周边区域的预测运动向量的预测方法生成在对当前区域的量化参数解码时使用的预测量化参数;以及利用所生成的当前区域的预测运动向量来对当前区域的运动向量解码并且利用所生成的当前区域的预测量化参数来对当前区域的量化参数解码。
根据本公开的第二方面,提供了一种图像处理装置,包括:预测运动向量生成单元,其利用位于当前区域周围的周边区域的运动向量生成在对当前区域的运动向量编码时使用的预测运动向量;预测量化参数生成单元,其根据由预测运动向量生成单元生成的周边区域的预测运动向量的预测方法生成在对当前区域的量化参数编码时使用的预测量化参数;以及参数编码单元,其利用由预测运动向量生成单元生成的当前区域的预测运动向量来对当前区域的运动向量编码并且利用由预测量化参数生成单元生成的当前区域的预测量化参数来对当前区域的量化参数编码。
预测量化参数生成单元可依据周边区域的预测运动向量的预测方法是空间预测还是时间预测来生成当前区域的预测量化参数。
预测量化参数生成单元可利用根据与预测当前区域的预测运动向量的预测方法相同的预测方法生成的周边区域的预测量化参数来生成当前区域的预测量化参数。
预测量化参数生成单元可根据周边区域的预测运动向量的预测方向和当前区域的预测运动向量的预测方向来生成对象区域的预测量化参数。
图像处理装置还可包括:传送单元,其利用当前区域的运动向量和当前区域的量化参数来对图像编码以生成比特流,并且把经参数编码单元编码的运动向量和量化参数与由编码单元生成的比特流一起传送。
编码单元可按具有层次结构的单位来对图像编码以生成比特流。
根据本公开的第二方面,提供了一种图像处理方法,用于使得图像处理装置执行:利用位于当前区域周围的周边区域的运动向量生成在对当前区域的运动向量编码时使用的预测运动向量;根据所生成的周边区域的预测运动向量的预测方法生成在对当前区域的量化参数编码时使用的预测量化参数;以及利用所生成的当前区域的预测运动向量来对当前区域的运动向量编码并且利用所生成的当前区域的预测量化参数来对当前区域的量化参数编码。
在本公开的一个方面中,利用位于当前区域周围的周边区域的运动向量生成在对当前区域的运动向量解码时使用的预测运动向量,并且根据所生成的周边区域的预测运动向量的预测方法生成在对当前区域的量化参数解码时使用的预测量化参数。另外,利用所生成的当前区域的预测运动向量来对当前区域的运动向量解码,并且利用所生成的当前区域的预测量化参数来对当前区域的量化参数解码。
在本公开的另一方面中,利用位于当前区域周围的周边区域的运动向量生成在对当前区域的运动向量编码时使用的预测运动向量,并且根据所生成的周边区域的预测运动向量的预测方法生成在对当前区域的量化参数编码时使用的预测量化参数。另外,利用所生成的当前区域的预测运动向量来对当前区域的运动向量编码,并且利用所生成的当前区域的预测量化参数来对当前区域的量化参数编码。
上述图像处理装置可以是独立装置,并且可以是构成一个图像编码装置或图像解码装置的内部块。
本发明的效果
根据本公开的一个方面,可以对图像解码。特别地,可以提高编码效率。
根据本公开的另一方面,可以对图像编码。特别地,可以提高编码效率。
附图说明
图1是示出图像编码装置的主要组件的示例的框图。
图2是示出分数像素精度运动预测/补偿处理的示例的图。
图3是示出宏块的示例的图。
图4是用于描述中值操作的图。
图5是用于描述多参考帧的图。
图6是用于描述时间直接模式的图。
图7是用于描述运动向量编码方法的图。
图8是用于描述编码单位的配置示例的图。
图9是示出图片参数集合的语法元素的示例的图。
图10是示出transform_coeff的语法元素的示例的图。
图11是用于描述运动分区合并的图。
图12是用于描述静止区域中的预测运动向量的图。
图13是用于描述根据本技术的量化参数预测方法的图。
图14是用于描述另一种量化参数预测方法的图。
图15是用于描述在双预测式预测的情况下的量化参数预测方法的图。
图16是示出运动向量编码单元、区域判定单元和量化单元的主要组件的示例的框图。
图17是用于描述编码处理的流程的示例的流程图。
图18是用于描述参数生成处理的流程的示例的流程图。
图19是示出图像解码装置的主要组件的示例的框图。
图20是示出运动向量编码单元、区域判定单元和逆量化单元的主要组件的示例的框图。
图21是用于描述解码处理的流程的示例的流程图。
图22是用于描述参数重构处理的流程的示例的流程图。
图23是示出多视点图像编码方案的示例的图。
图24是示出应用了本技术的多视点图像编码装置的主要组件的示例的图。
图25是示出应用了本技术的多视点图像解码装置的主要组件的示例的图。
图26是示出层次图像编码方案的示例的图。
图27是示出应用了本技术的层次图像编码装置的主要组件的示例的图。
图28是示出应用了本技术的层次图像解码装置的主要组件的示例的图。
图29是示出计算机的主要组件的示例的框图。
图30是示出电视装置的示意性配置的示例的框图。
图31是示出移动电话的示意性配置的示例的框图。
图32是示出记录/再现装置的示意性配置的示例的框图。
图33是示出成像装置的示意性配置的示例的框图。
具体实施方式
以下,将描述实现本公开的模式(以下称为实施例)。将按以下顺序给出描述:
1.第一实施例(图像编码装置)
2.第二实施例(图像解码装置)
3.第三实施例(多视点图像编码和解码装置)
4.第四实施例(层次图像编码和解码装置)
5.第五实施例(计算机)
6.应用例
[1.第一实施例]
[图像编码装置]
图1是示出图像编码装置的主要组件的示例的框图。
图1所示的图像编码装置100例如利用根据高效率视频编码(HEVC)方案的预测处理来对图像数据编码。
如图1所示,图像编码装置100包括A/D转换器101、画面重排序缓冲器102、运算单元103、正交变换单元104、量化单元105、无损编码单元106、累积缓冲器107、逆量化单元108和逆正交变换单元109。另外,图像编码装置100还包括运算单元110、解块滤波器111、帧存储器112、选择器113、内预测单元114、运动预测/补偿单元115、预测图像选择器116和率控制器117。
图像编码装置100还包括运动向量编码单元121和区域判定单元122。
A/D转换器101对输入的图像数据执行A/D转换,将转换后的图像数据(数字数据)提供给画面重排序缓冲器102,画面重排序缓冲器102存储图像数据。画面重排序缓冲器102根据GOP(Group OfPicture,图片组)对按存储顺序排列的图像的帧进行重排序以使得帧被以编码顺序重排序以获得帧顺序被重排序的图像,并将该图像提供给运算单元103。画面重排序缓冲器102将帧顺序被重排序的图像提供给内预测单元114和运动预测/补偿单元115。
运算单元103从读取自画面重排序缓冲器102的图像中减去经由预测图像选择器116从内预测单元114或运动预测/补偿单元115提供来的预测图像以获得其差别信息,并将该差别信息输出到正交变换单元104。
另外,例如,在经历间编码的图像的情况下,运算单元103从读取自画面重排序缓冲器102的图像中减去从运动预测/补偿单元115提供来的预测图像。
正交变换单元104对于从运算单元103提供来的差别信息执行诸如离散余弦变换或卡-洛变换(Karhunen-Loeve transform)之类的正交变换。正交变换方法是任选的。正交变换单元104将变换系数提供给量化单元105。
量化单元105对从正交变换单元104提供来的变换系数进行量化。量化单元105基于从率控制器117提供来的关于目标码量的信息设定量化参数并执行量化。量化方法是任选的。量化单元105将量化的变换系数提供给无损编码单元106。
另外,量化单元105在区域判定单元122的控制下预测要处理的对象区域(也称为当前区域)的量化参数。具体而言,量化单元105在区域判定单元122的控制下利用(在图片内)在空间上与对象区域邻接的区域的量化参数生成对象区域的预测量化参数。量化单元105把量化的变换系数提供给无损编码单元106以便对作为对象区域的量化参数与对象区域的预测量化参数之间的差别的差分量化参数编码。
也就是说,执行在图像编码装置100或稍后描述的图像解码装置200中预测对象区域的量化参数的处理以便对量化参数进行编码或解码。从而,预测量化参数用于对量化参数编码或解码。
与对象区域邻接的邻接区域也是位于对象区域周围的周边区域,以下描述中两个词都指同一区域。
无损编码单元106根据任选的编码方案对经量化单元105量化的变换系数进行编码。由于系数数据是在率控制器117的控制下被量化的,所以此码量变成(或接近)率控制器117设定的目标值。
另外,无损编码单元106从内预测单元114获取指示内预测(intra-prediction)模式等的信息并且从运动预测/补偿单元115获取指示间预测(inter-prediction)模式的信息、差分运动向量信息等等。另外,无损编码单元106从量化单元105获取差分量化参数。
无损编码单元106根据任选的编码方案对这些各种类型的信息进行编码并且将这些信息合并(复用)为编码数据的头部信息的一部分。无损编码单元106把通过编码获得的编码数据提供给累积编码数据的累积缓冲器107。
无损编码单元106的编码方案的示例包括可变长度编码和算术编码。可变长度编码的示例包括H.264/AVC方案中定义的上下文自适应可变长度编码(context-adaptive variable length coding,CAVLC)。算术编码的示例包括上下文自适应二元算术编码(context-adaptivebinary arithmetic coding,CABAC)。
累积缓冲器107临时存储从无损编码单元106提供来的编码数据。累积缓冲器107例如在预定的时机把存储在其中的编码数据输出到后级中的记录装置(记录介质)(未示出)、传送线等等。
另外,在量化单元105中量化的变换系数也被提供给逆量化单元108。逆量化单元108根据与量化单元105的量化相对应的方法对经量化的变换系数执行逆量化。逆量化方法是任选的,只要该方法对应于量化单元105的量化处理即可。逆量化单元108将所获得的变换系数提供给逆正交变换单元109。
逆正交变换单元109根据与正交变换单元104的正交变换处理相对应的方法对从逆量化单元108提供来的变换系数执行逆正交变换。逆正交变换方法是任选的,只要该方法对应于正交变换单元104的正交变换处理即可。通过逆正交变换获得的输出(重构的差别信息)被提供给运算单元110。
运算单元110把经由预测图像选择器116从内预测单元114或运动预测/补偿单元115提供来的预测图像与从逆正交变换单元109提供来的逆正交变换结果(即,本地重构的差别信息)相加以获得本地解码的图像(解码图像)。解码图像被提供给解块滤波器111或帧存储器112。
解块滤波器111对从运算单元110提供来的解码图像适当地执行解块滤波处理。例如,解块滤波器111通过对解码图像执行解块滤波处理来去除解码图像的块失真。
解块滤波器111把滤波结果(滤波处理后的解码图像)提供给帧存储器112。如上所述,从运算单元110输出的解码图像可在不经由解块滤波器111的情况下被提供给帧存储器112。也就是说,可不执行解块滤波器111的滤波处理。
帧存储器112存储所提供的解码图像并在预定的时机将存储的解码图像作为参考图像提供给选择器113。
选择器113选择从帧存储器112提供来的参考图像的提供目的地。例如,在间预测的情况下,选择器113把从帧存储器112提供来的参考图像提供给运动预测/补偿单元115。
内预测单元114利用处理对象图片中的像素值来执行基本上利用预测单位(prediction unit,PU)作为处理单位来生成预测图像的内预测(场内预测),其中处理对象图片是经由选择器113从帧存储器112提供来的参考图像。内预测单元114在预先准备的多种内预测模式中执行内预测。
内预测单元114在所有候选内预测模式中生成预测图像,利用从画面重排序缓冲器102提供来的输入图像评估各个预测图像的成本函数值,并且选择最优模式。当选择了最优内预测模式时,内预测单元114把在最优模式中生成的预测图像提供给预测图像选择器116。
如上所述,内预测单元114把指示出所采用的内预测模式等的内预测模式信息提供给对该信息编码的无损编码单元106。
运动预测/补偿单元115利用从画面重排序缓冲器102提供来的输入图像和经由选择器113从帧存储器112提供来的参考图像基本上利用PU作为处理单位来执行运动预测(间预测)。运动预测/补偿单元115把检测到的运动向量提供给运动向量编码单元121,根据检测到的运动向量执行运动补偿处理,并且生成预测图像(间预测图像信息)。运动预测/补偿单元115在预先准备的多种间预测模式中执行这种间预测。
运动预测/补偿单元115在所有候选间预测模式中生成预测图像。运动预测/补偿单元115利用从画面重排序缓冲器102提供来的输入图像、来自运动向量编码单元121的最优预测运动向量信息等等评估各个预测图像的成本函数值,并选择最优模式。当选择了最优间预测模式时,运动预测/补偿单元115把在最优模式中生成的预测图像提供给预测图像选择器116。
另外,运动预测/补偿单元115把指示所采用的间预测模式的信息和当对编码数据解码时在间预测模式中执行处理所必要的信息提供给对该信息编码的无损编码单元106。必要信息的示例包括关于作为对象区域的运动向量与对象区域的预测运动向量之间的差别的差分运动向量的信息、作为预测运动向量信息的指示预测运动向量的索引的标志,等等。
在图像编码装置100或稍后描述的图像解码装置200中,执行预测对象区域的运动向量的处理以便对运动向量编码或解码。从而,预测运动向量被用于对运动向量编码或解码。
预测图像选择器116选择提供给运算单元103和运算单元110的预测图像的来源。例如,在间编码的情况下,预测图像选择器116选择运动预测/补偿单元115作为预测图像的来源并且把从运动预测/补偿单元115提供来的预测图像提供给运算单元103和运算单元110。
率控制器117基于累积在累积缓冲器107中的编码数据的码量来控制量化单元105的量化操作的率,以免发生上溢或下溢。
运动向量编码单元121存储由运动预测/补偿单元115获得的运动向量。运动向量编码单元121预测对象区域的运动向量。具体而言,运动向量编码单元121利用在时间上或空间上与对象区域邻接的邻接区域的运动向量来生成对象区域的预测运动向量(预测子)。运动向量编码单元121把所生成的预测运动向量中最优的最优预测运动向量提供给运动预测/补偿单元115和区域判定单元122。
区域判定单元122存储来自运动向量编码单元121的最优预测运动向量。区域判定单元122确定在参考与对象区域邻接的邻接区域的预测运动向量的预测方法生成对象区域的预测量化参数时要参考其量化参数的邻接区域。区域判定单元122基于该确定结果控制量化单元105的预测量化参数生成处理。
也就是说,在图1的图像编码装置100中,量化单元105在区域判定单元122的控制下根据预测邻接区域的预测运动向量的方法来生成对象区域的预测量化参数。
[1/4像素精度运动预测]
图2是用于描述AVC方案中规定的1/4像素精度运动预测/补偿处理的示例的图。在图2中,每个矩形表示一个像素。在这些矩形之中,A指示帧存储器112中存储的整数精度像素的位置,b、c和d指示具有1/2像素精度的位置,并且e1、e2和e3指示1/4像素精度的位置。
以下,函数Clip1()被定义为以下式(1)。
[数学公式1]
…(1)
例如,当输入图像具有8比特精度时,式(1)中的max_pix的值是255。
位置b和d处的像素值是根据以下式(2)和(3)利用6抽头FIR滤波器生成的。
[数学公式2]
F=A-2-5·A-1+20·A0+20·A1-5·A2+A3
…(2)
[数学公式3]
b,d=Clip1((F+16)>>5)
…(3)
位置c处的像素值是根据以下式(4)至(6)通过在水平和垂直方向上应用6抽头FIR滤波器生成的。
[数学公式4]
F=b-2-5·b-1+20·b0+20·b1-5·b2+b3
…(4)
[数学公式5]
F=d-2-5·d-1+20·d0+20·d1-5·d2+d3
…(5)
[数学公式6]
c=Clip1((F+512)>>10)
…(6)
当在水平和垂直方向上都执行了乘积求和处理之后最后执行一次Clip处理。
位置e1至e3处的像素值是像以下式(7)至(9)中那样通过线性插值生成的。
[数学公式7]
e1=(A+b+1)>>1
…(7)
[数学公式8]
e2=(b+d+1)>>1
…(8)
[数学公式9]
e3=(b+c+1)>>1
…(9)
[宏块]
另外,在MPEG2方案中,在帧运动补偿模式的情况下在各16×16像素中执行运动预测/补偿处理。另外,在场运动补偿模式的情况下对于每一场和每二场中的每一个在各16×8像素中执行运动预测/补偿处理。
与之不同,在AVC方案中,如图3所示,由16×16像素构成的一个宏块可被分割成16×16像素、16×8像素、8×16像素和8×8像素的分区中的任何一种,以使得子宏块具有独立的运动向量信息。另外,如图3所示,8×8像素分区可被分割成由8×8像素、8×4像素、4×8像素和4×4像素构成的子宏块中的任何一种,以使得子宏块具有独立的运动向量信息。
然而,在AVC方案中,当按与MPEG2方案类似的方式执行运动预测/补偿处理时,可生成大量的运动向量信息。从而,直接对所生成的运动向量信息编码可导致编码效率的降低。
[运动向量的中值预测]
作为解决这种问题的方法,在AVC方案中,根据以下方法来减少运动向量的编码信息。
图4所示的线条表示运动补偿块的边界。另外,在图4中,E表示从现在起要编码的当前运动补偿块,并且A至D表示已经编码过的与块E邻接的运动补偿块。
现在,在X=A、B、C、D和E的情况下,X的运动向量信息被定义为mvx。
首先,利用关于运动补偿块A、B和C的运动向量信息,根据中值操作如以下式(10)那样生成运动补偿块E的预测运动向量信息pmvE。
[数学公式10]
pmvE=med(mvA,mvB,mvC)
…(10)
当关于运动补偿块C的信息由于比如在图像帧的边缘之类的原因而不可用时,改为使用关于运动补偿块D的信息。
如式(11)那样利用pmvE来生成作为对于运动补偿块E的运动向量信息被编码到图像压缩信息中的数据mvdE。
[数学公式11]
mvdE=mvE-pmvE
…(11)
注意,在实际处理中,水平和垂直方向上的运动向量信息的各个成分被独立地处理。
[多参考帧]
另外,AVC方案定义了一种被称为多参考帧(multi-referenceframe)的方案,其在诸如MPEG2或H.263之类的传统图像编码方案中是没有定义的。
将参考图5来描述AVC方案中定义的多参考帧。
也就是说,在MPEG2或H.263方案中,以使得P图片只参考帧存储器中存储的一个参考帧的方式执行运动预测/补偿处理。与之不同,如图5所示,在AVC方案中,多个参考帧被存储在存储器中,并且宏块可参考不同的存储器。
[直接模式]
然而,虽然B图片的运动向量信息的量较大,但在AVC方案中准备了一种被称为直接模式的模式。
在直接模式中,运动向量信息未被存储在图像压缩信息中。在图像解码装置中,根据邻居块的运动向量信息或者共位块的运动向量信息来计算当前块的运动向量信息,其中共位块是参考帧的与处理对象块处于相同位置的块。
直接模式包括两类模式,即空间直接模式和时间直接模式,可以对每个片切换这两类模式。
在空间直接模式中,如以下式(12)中所示那样来计算处理对象运动补偿块E的运动向量信息mvE。
mvE=pmvE…(12)
也就是说,由中值预测生成的运动向量信息被应用到当前块。
接下来,将参考图6描述时间直接模式。
在图6中,在L0参考图片中,与当前块位于相同空间地址的块是共位块,并且共位块的运动向量信息被定义为mvcol。另外,当前图片与L0参考图片之间在时间轴上的距离是TDB,并且L0参考图片与L1参考图片之间在时间轴上的距离被定义为TDD。
在此情况下,根据以下式(13)和(14)来计算当前图片中的L0运动向量信息mvL0和L1运动向量信息mvL1。
[数学公式12]
mv L 0 = TD B TD D mv col
…(13)
[数学公式13]
mv L 1 = TD D - TD B TD D mv col
…(14)
由于在AVC图像压缩信息中不存在指示时间轴上的距离的信息TD,所以式(13)和(14)的运算是利用图片顺序计数(picture ordercount,POC)来执行的。
另外,在AVC图像压缩信息中,可在16×16像素的各个宏块中或8×8像素的各个块中定义直接模式。
[预测模式的选择]
然而,为了在AVC编码方案中实现更高的编码效率,选择适当的预测模式是重要的。
作为这种选择方案的一个示例,可以使用在被称为联合模型(JM)的AVC方案的参考软件(可从http://iphome.hhi.de/suehring/tml/index.htm获得)中实现的方法。
在JM方案中,可以选择稍后将描述的高复杂度模式和低复杂度模式这两种模式判定方法。根据这些模式,计算与各个预测模式有关的成本函数值,并且选择使成本函数值最小化的预测模式作为子宏块或宏块的最优模式。
高复杂度模式的成本函数由式(15)表达。
Cost(Mode∈Ω)=D+λ*R…(15)
这里,“Ω”表示用于对当前块和宏块编码的候选预测模式的全体集合,并且“D”表示当在当前预测模式中执行编码时解码图像与输入图像之间的差分参量。“λ”表示作为量化参数的函数给出的拉格朗日乘数。“R”表示当在当前模式中编码时包括正交变换系数在内的总码量。
也就是说,当在高复杂度模式中执行编码时,必须在所有候选模式中执行临时编码处理以便计算参数D和R,从而需要更大量的运算。
低复杂度模式的成本函数由以下式(16)表达。
Cost(Mode∈Ω)=D+QP2Quant(QP)*HeaderBit...(16)
这里,与高复杂度模式不同,D表示预测图像与输入图像之间的差分参量。QP2Quant(QP)是作为量化参数QP的函数给出的,并且HeaderBit表示与诸如运动向量或模式之类的属于头部的信息有关的码量,这些信息中不包括正交变换系数。
也就是说,在低复杂度模式中,虽然必须对各个候选模式执行预测处理,但由于其不需要解码图像,所以不必执行编码处理。从而,与高复杂度模式相比,可以用更少量的运算来计算成本函数值。
[运动向量的MV竞争]
然而,为了改进参考图4描述的使用中值预测的运动向量编码,非专利文献1提出了以下方法。
也就是说,该方法允许除了在AVC方案中定义的中值预测中获得的“空间预测子(空间预测运动向量)”以外,“时间预测子(时间预测运动向量)”和“空间-时间预测子(空间-时间预测运动向量”中的任何一个也可被自适应性地用作预测运动向量信息。这个提出的方法也被称为AVC方案中的MV竞争。此MV竞争也被称为HEVC方案中的高级运动向量预测(Advanced Motion Vector Prediction,AMVP)。
在图7中,“mvcol”被设定为相对于当前块的共位块的当前块的运动向量信息。另外,mvtk(k=0至8)被设定为邻居块的运动向量信息,并且各项预测运动向量信息(预测子)分别由式(17)至(19)定义。此外,当前块的共位块是如下的块:在该块中,在被当前图片参考的参考图片中,提供与当前块相同的xy坐标。
时间预测子:
[数学公式14]
Mvtm5=median{mvcol,mvt0,...mvt3}
…(17)
[数学公式15]
Mvtm9=median{mvcol,mvt0,...mvt18}
…(18)
空间-时间预测子:
[数学公式16]
mvspt=median{mvcol,mvcol,mva,mvb,mvc}
…(19)
在图像编码装置100中,对于各个块计算当使用各项预测运动向量信息时的成本函数,并且选择最优预测运动向量信息。在图像压缩信息中,传送指示在各个块中使用哪个预测运动向量信息的信息(索引)。
[编码单位]
然而,对于将成为下一代编码方案的对象的称为UHD(超高清晰度;4000×2000像素)的大图像帧,将宏块的大小设定到16×16像素不是最优的。
虽然AVC方案如图3中所述定义了诸如宏块或子宏块之类的分层次的块,但HEVC方案如图8所示定义了编码单位(CU)。
也被称为编码树块(coding tree block,CTB)的CU是与AVC方案中的宏块扮演相同角色的以图片为单位的图像的部分区域。宏块的大小被固定到16×16像素,而CU的大小不是固定的,而是在各个序列中在图像压缩信息中指定的。
例如,CU的最大大小(LCU:最大编码单位)和最小大小(SCU:最小编码单位)在输出编码数据中包括的序列参数集合(sequenceparameter set,SPS)中定义。
通过设定split-flag=1,可将每个LCU分割成不小于SCU的大小的更小大小的CU。在图8的示例中,LCU的大小是128,并且最大层深度是5。具有2N×2N的大小的CU在split_flag的值为“1”时被分割成下一层的具有N×N大小的CU。
另外,CU被分割成预测单位(PU),预测单位是充当内预测或间预测的处理单位的区域(以图片为单位的图像的部分区域)。另外,CU被分割成变换单位(TU),变换单位是充当正交变换的处理单位的区域(以图片为单位的图像的部分区域)。当前,除了4×4和8×8正交变换以外,HEVC方案还可使用16×16和32×32正交变换。
在像HEVC方案中那样定义CU并且以CU为单位执行各种处理的编码方案中,可以认为AVC方案中的宏块对应于LCU并且块(子块)对应于CU。另外,可以认为AVC方案中的运动补偿块对应于PU。然而,由于CU具有层结构,所以最上层的LCU的大小一般设定为例如128×128像素,这是大于AVC方案的宏块的大小的。
从而,在以下描述中,假定LCU包括AVC方案中的宏块,并且CU包括AVC方案中的块(子块)。
[量化参数的传送单位]
另外,在HEVC方案中,可以以子LCU为单位传送量化参数QP。在图9所示的图片参数集合中以语法元素的形式描述传送量化参数的CU的大小。
图9是示出图片参数集合的语法元素的示例的图。在图9的示例中,各行左端的数字是为了描述方便起见而指派的行号。
在图9的示例中,在第18行上设定“max_cu_qp_delta_depth”。“max_cu_qp_delta_depth”是指定传送量化参数的CU的大小的参数。
另外,在图10所示的“transform_coeff”中以语法元素的形式描述图像压缩信息中包括的关于量化参数的信息。
图10是示出“transform_coeff”的语法元素的示例的图。在图10的示例中,各行左端的数字是为了描述方便起见而指派的行号。
在图10的示例中,在第四行设定“cu_qp_delta”。“cu_qp_delta”是以CU为单位传送的差分量化参数。“cu_qp_delta”的值是根据式(20)的生成规则来计算的。
IF(left_available)
QP=cu_qp_delta+LeftQP
Else
QP=cu_qp_delta+PrevQP
…(20)
“LeftQP”表示位于当前CU左侧的CU的量化参数,“PrevQP”是就在当前CU之前编码或解码的CU(即,位于当前CU上方的CU)的量化参数。
这里,差分量化参数是量化参数与量化参数的预测值(预测量化参数)之间的差别。也就是说,如式(20)所示,在HEVC方案中,定义当前CU的预测量化参数从位于当前CU左侧的CU的量化参数获得,如果位于当前CU左侧的CU可用的话。另外,定义当前CU的预测量化参数从位于当前CU上方的CU的量化参数获得,如果位于当前CU上方的CU不可用的话。
[运动分区合并]
然而,提出了如图11所示的称为运动分区合并的方法(合并模式)作为运动信息编码方案之一。在此方法中,传送两个标志MergeFlag和MergeLeftFlag作为合并信息,该合并信息是关于合并模式的信息。“MergeFlag=1”表明当前区域X的运动信息与和当前区域邻接的周边区域T或在当前区域左侧邻接的周边区域L的运动信息相同。在此情况下,“MergeLeftFlag”被包括在合并信息中并被传送。“MergeFlag=0”表明当前区域X的运动信息与周边区域T和周边区域L中的任何一个的运动信息不同。在此情况下,传送当前区域X的运动信息。
当当前区域X的运动信息与周边区域L的运动信息相同时,MergeFlag=1并且MergeLeftFlag=1。当当前区域X的运动信息与周边区域T的运动信息相同时,MergeFlag=1并且MergeLeftFlag=0。
[静止区域中的预测运动向量(预测子)]
在MV竞争或合并模式中,特别地,时间预测运动向量(时间预测子)在静止图像区域中实现更高的编码效率。也就是说,当在这种区域中基于式(15)或(16)所示的成本函数值来选择预测运动向量时,与空间预测运动向量相比,在静止图像区域中更有可能选择时间预测运动向量。
在图12的示例中,示出了当前帧和当前帧参考的参考帧。当前帧和参考帧中的椭圆表示运动物体,并且其他区域是静止的背景。
另外,在当前帧中,示出了对象区域X、在对象区域X的左侧邻接的邻接区域A、在对象区域X上方邻接的邻接区域B和在对象区域X右上方邻接的邻接区域C。在参考帧中,邻接区域与对象区域X具有相同xy坐标。
在当前帧中,虽然对象区域X和邻接区域A被包括在静止区域中,但邻接区域B和邻接区域C被包括在运动物体中。另外,在参考帧中,邻接区域Y被包括在静止区域中。如图12所示,例如,当对象区域X位于物体(运动物体和静止物体)的边界时,与邻接区域C的空间预测运动向量相比,更有可能选择邻接区域Y的时间预测运动向量。
然而,在片间,例如,可发生在左邻接区域中选择时间预测运动向量并且在对象区域X中选择空间预测运动向量的情况,或者相反的情况。在此情况下,根据式(20)所示的量化参数预测方案,在静止区域与运动区域的不同区域之间执行量化参数编码处理。从而,预测效率会降低。
因此,在本技术中,根据处理对象区域和邻接区域中的预测运动向量的预测方法(即,预测方法是空间预测还是时间预测)来执行区域判定。另外,根据区域判定结果生成作为用于对量化参数编码(解码)的量化参数的预测值的预测量化参数,从而提高编码效率。
[量化参数预测方法]
接下来,将参考图13描述根据本技术的量化参数预测方法。
在图13的示例中,示出了作为当前编码单位的CUC、作为在CUc左侧邻接的左编码单位的CUL,和作为在CUC上方邻接的上方编码单位的CUT
CUC包括作为预测单位的PUC。PUC表示位于CUC的左上角的预测单位。CUL包括作为预测单位的PUL。PUL是位于CUL右上角的预测单位。CUT包括作为预测单位的PUT。PUT是位于CUT左下角的预测单位。也就是说,PUC、PUL和PUT是与CUC的最左上角的像素邻接的预测单位。也就是说,PU是CU的子区域。
对PUC、PUL和PUT应用间预测。另外,在PUC中,使用时间预测运动向量(时间预测子)来对运动向量编码。在PUL中,使用空间预测运动向量(空间预测子)来对运动向量编码。在PUT中,使用时间预测运动向量(时间预测子)来对运动向量编码。
如上所述,时间预测运动向量是使用在同一时间轴上的不同像素中与当前PU位于相同空间地址处的PU(即,时间上邻接的PU)的运动向量信息的预测方法所获得的预测运动向量。另外,如上所述,空间预测运动向量是使用在与当前PU相同的图片中邻接的PU(即,空间上邻接的PU)的运动向量信息的预测方法所获得的预测运动向量。
这里,如以上参考式(20)所述,根据非专利文献2中公开的方法,对于CUC的量化参数,执行使用CUL的量化参数的预测处理,除非CUL可用。
然而,对于PUC和PUL应用通过不同的预测方法获得的不同的预测运动向量。从而,PUC和PUL被认为属于不同的区域,并且利用CUL的量化参数执行预测CUC的量化参数的处理可导致编码效率的降低。
因此,在本技术中,通过向PUC和PUT应用相同的预测运动向量以使得CUC和CUT被认为是同一区域,假定利用CUT的量化参数来预测CUC的量化参数。
具体而言,图像编码装置100参考当前PUC的预测运动向量和与当前PUC邻接的各个邻接PU的预测运动向量并且确定具有与当前PUC相同预测方法的预测运动向量的邻接PUT所属的CUT作为在生成当前CUC的预测量化参数时要参考的区域。
也就是说,当前CUC的预测量化参数是根据与当前CUC邻接的邻接CU的预测运动向量的预测方法来生成的。更具体而言,当前CUC的预测量化参数是依据与当前CUC邻接的邻接CU的预测运动向量的预测方法是空间预测还是时间预测来生成的。
这样,由于被认为与当前CUC属于同一区域的邻接CU的量化参数被用于生成预测量化参数,所以可以提高量化参数的预测编码的效率。
在图13的示例中,已说明了参考作为与位于CUC的最左上角的像素邻接的预测单位的PUC、PUL和PUT的预测运动向量信息(预测子)的示例。然而,所参考的预测运动向量信息不限于与位于CUC的最左上角的像素邻接的预测单位的信息。
例如,如图14所示,在当前CUC的上方或下方邻接的所有预测单位的预测运动向量信息(预测子)可用于参考。
在图14的示例中,与图13的示例的情况类似,CUC包括作为预测单位的PUC。PUC表示位于CUC的左上角的预测单位。
与之不同,CUL包括作为预测单位的PUL1,PUL2,…等等。PUL1是位于CUL的右上角的预测单位,PUL2位于PUL1下方,并且另一PUL(未示出)位于PUL2下方。也就是说,PUL1,PUL2,…等等是在CUC的左侧邻接的PU。
另外,CUT包括作为预测单位的PUT1,PUT2,…等等。PUT1是位于CUL的右上角的预测单位,PUT2位于PUT1下方,并且另一PUT(未示出)位于PUT2下方。也就是说,PUT1,PUT2,…等等是在CUC的上方邻接的PU。
在图14的示例中,当在CUC的左侧邻接的PUL1,PUL2,…等等的PU中的任何一个的预测运动向量信息具有与PUC相同的预测运动向量信息(属于相同区域)时,CUL的量化参数被用于生成CUC的预测量化参数。
另一方面,当在CUC的上方邻接的PUT1,PUT2,…等等的PU中的任何一个的预测运动向量信息具有与PUC相同的预测运动向量信息(属于相同区域)时,CUT的量化参数被用于生成CUC的预测量化参数。
这样,在图14的示例的情况中,由于被认为属于相同区域的PU(CU)的量化参数被用于当前CU的量化参数的预测,所以可以提高量化参数的预测编码的效率。
在HEVC方案中,位于当前PU左侧的区域的运动向量和位于当前PU上方的区域的运动向量可被用作空间预测运动向量。从而,在本技术中,可依据是使用空间预测子还是时间预测子以及在空间预测子的情况下是使用左侧区域还是上方区域来控制量化参数预测处理。也就是说,当在与当前区域上方和左侧邻接的邻接区域中预测与当前区域相同的空间预测运动向量并且当前区域参考上方区域的信息时,与当前区域类似地使用参考上方区域的邻接区域的量化参数。
另外,在本技术中,当向作为邻接区域的各个CU应用双预测式预测时,例如,利用关于一个列表的预测运动向量信息来执行区域判定处理。
例如,仅利用关于List0的信息来执行区域判定处理。或者,对于未被重排序图片使用List0并且对于被重排序的图片使用List1来执行区域判定处理。
另外,在图15的示例中,对于m=3,以时间顺序示出了P(1)图片、第一B(1)图片、第二B(2)图片和P(2)图片。在此情况下,在第一B(1)图片的处理期间,使用时间上接近的与List0预测有关的P(1)图片的预测运动向量(预测子)的信息。另一方面,在第二B(2)图片的处理期间,使用时间上接近的与List1预测有关的P(2)图片的预测运动向量(预测子)的信息。
这样,可通过考虑与参考图片在时间轴上的距离来确定是使用List0预测还是List1预测。
另外,可通过还考虑预测方向来执行区域判定。也就是说,当当前CU和上方邻接CU中包括的PU要经历双预测式预测,而左侧邻接CU中包括的PU要经历单预测式预测时,利用上方邻接CU的量化参数来预测当前CU的量化参数。
这里,一般地,在HEVC方案的编码装置和解码装置中,诸如邻接区域的运动向量信息和预测运动向量信息之类的参数被存储在线缓冲器中并用于当前区域的编码。从而,本技术的方法可利用邻接预测运动向量信息来执行处理,而不增大线缓冲器的大小。
[运动向量编码单元、区域判定单元和量化单元的配置示例]
图16是示出运动向量编码单元121、区域判定单元122和量化单元105的主要组件的示例的框图。
在图16的示例中,运动向量编码单元121被配置为包括邻接运动向量缓冲器151、候选预测运动向量生成单元152、成本函数值计算单元153和最优预测运动向量确定单元154。
区域判定单元122被配置为包括区域决定单元161和邻接预测运动向量缓冲器162。
量化单元105被配置为包括量化器171、差分QP生成单元172、邻接QP缓冲器173和预测QP生成单元174。
由运动预测/补偿单元115搜索出的运动向量的信息被提供给邻接运动向量缓冲器151和成本函数值计算单元153。邻接运动向量缓冲器151把从运动预测/补偿单元115提供来的运动向量信息作为邻接区域的运动向量的信息累积。在邻接运动向量缓冲器151中累积的邻接区域的运动向量的信息包括空间邻接区域的运动向量的信息和时间邻接区域(在时间轴上的不同图片中位于与当前区域相同空间地址处的区域)的运动向量的信息。
候选预测运动向量生成单元152从邻接运动向量缓冲器151读取指示为在时间上或空间上与当前PU邻接的邻接PU获得的运动向量的信息。候选预测运动向量生成单元152通过参考所读取的运动向量信息生成当前PU的候选预测运动向量并将指示所生成的候选预测运动向量的信息提供给成本函数值计算单元153。
成本函数值计算单元153计算各个候选预测运动向量的成本函数值并将计算出的成本函数值与候选预测运动向量的信息一起提供给最优预测运动向量确定单元154。
最优预测运动向量确定单元154确定使来自成本函数值计算单元153的成本函数值最小化的候选预测运动向量作为当前PU的最优预测运动向量,并将关于该确定结果的信息提供给运动预测/补偿单元115。
运动预测/补偿单元115利用从最优预测运动向量确定单元154提供来的最优预测运动向量的信息生成作为与运动向量的差别的差分运动向量并且计算各个预测模式的成本函数值。运动预测/补偿单元115确定使成本函数值最小化的预测模式作为预测模式之中的最优间预测模式。
运动预测/补偿单元115把最优间预测模式的预测图像提供给预测图像选择器116。另外,运动预测/补偿单元115把所生成的差分运动向量信息提供给无损编码单元106用于运动向量的编码。
在图16的示例中,虽然在图中没有示出,但指示最优间预测模式的信息被从运动预测/补偿单元115提供给最优预测运动向量确定单元154。
最优预测运动向量确定单元154把从运动预测/补偿单元115提供来的信息所指示的最优间预测模式的最优预测运动向量的信息提供给区域决定单元161和邻接预测运动向量缓冲器162。
当提供当前PU的最优预测运动向量的信息时,区域决定单元161从邻接预测运动向量缓冲器162读取与当前PU邻接的邻接CU的最优预测运动向量的信息。区域决定单元161通过参考当前PU的最优预测运动向量和邻接PU的最优预测运动向量根据参考图13至15描述的方法决定邻接PU之中为了生成预测量化参数而参考的PU(区域)。区域决定单元161向预测QP生成单元174提供控制信号以使得决定的PU被参考。
邻接预测运动向量缓冲器162累积从最优预测运动向量确定单元154提供来的最优预测运动向量信息作为用于决定当前PU的区域的邻接PU(位于上方或左侧的PU)的邻接预测运动向量信息。
另一方面,从率控制器117提供来的当前CU的量化参数信息(即,量化参数值)被提供给量化器171和邻接QP缓冲器。另外,从正交变换单元104提供来的当前CU的正交变换系数被提供给量化器171。
量化器171利用从率控制器117提供来的信息所指示的量化参数值对正交变换系数进行量化并将当前CU的量化正交变换系数提供给无损编码单元106。另外,量化器171把当前CU的量化参数信息提供给差分QP生成单元172。
差分QP生成单元172从预测QP生成单元174接收当前CU的预测量化参数信息。差分QP生成单元172获得作为当前CU的量化参数与当前CU的预测量化参数之间的差别的差分量化参数,并将差分量化参数信息提供给无损编码单元106。
邻接QP缓冲器173累积从率控制器117提供来的量化参数信息作为用于生成当前CU的预测量化参数的与当前CU邻接的邻接CU的量化参数信息。
预测QP生成单元174从邻接QP缓冲器173读取从区域决定单元161提供来的控制信号所指示的区域(邻接PU所属的邻接CU)的邻接量化参数。预测QP生成单元174使用所读取的邻接量化参数作为当前CU的预测量化参数并将当前CU的预测量化参数信息提供给差分QP生成单元172。
[编码处理的流程]
接下来,将描述具有这种配置的图像编码装置100执行的各个处理的流程。首先,将参考图17的流程图描述编码处理的流程的示例。
在步骤S101中,A/D转换器101对输入图像执行A/D转换。在步骤S102中,画面重排序缓冲器102存储经A/D转换的图像并且对各个图片进行重排序以使得按显示顺序排列的图片被按编码顺序重排序。
在步骤S103中,内预测单元114在内预测模式中执行内预测处理。在步骤S104中,运动预测/补偿单元115在间预测模式中执行进行运动预测和运动补偿的间运动预测处理。由运动预测/补偿单元115搜索出的运动向量的信息被提供给邻接运动向量缓冲器151和成本函数值计算单元153。
在步骤S105中,运动向量编码单元121、区域判定单元122和量化单元105执行作为生成预测运动向量、预测(差分)量化参数等等的处理的参数生成处理。参数生成处理的细节将参考图18来描述。
利用步骤S105的处理,生成当前PU的预测运动向量,并且在预测运动向量之中确定当前PU的最优预测运动向量。根据邻接PU的预测运动向量的预测方法在与当前PU邻接的邻接PU之中确定为了生成预测量化参数而参考的区域。使用所确定的区域的量化参数作为预测量化参数,并且生成差分量化参数。
所生成的差分量化参数信息被提供给无损编码单元106,并且在稍后描述的步骤S115中经历无损编码。另外,最优间预测模式的预测图像和成本函数值被从运动预测/补偿单元115提供给预测图像选择器116。
在步骤S106中,预测图像选择器116基于从内预测单元114和运动预测/补偿单元115输出的成本函数值来选择最优模式。也就是说,预测图像选择器116选择由内预测单元114生成的预测图像和由运动预测/补偿单元115生成的预测图像中的任何一个。
在步骤S107中,运算单元103计算由步骤S102的处理重排序的图像与由步骤S106的处理选择的预测图像之间的差别。差别数据与原始数据相比具有更小的数据量。从而,与直接对数据编码时相比,可以压缩数据量。
在步骤S108中,正交变换单元104对由步骤S107的处理生成的差别信息执行正交变换。具体而言,执行诸如离散余弦变换或卡-洛变换之类的正交变换,并且输出变换系数。
在步骤S109中,量化单元105的量化器171利用从率控制器117提供来的量化参数对由步骤S108的处理获得的正交变换系数进行量化。
以如下方式对经步骤S109的处理量化的差别信息进行本地解码。也就是说,在步骤S110中,逆量化单元108根据与量化单元105的属性相对应的属性对由步骤S109的处理生成的量化正交变换系数(也称为量化系数)执行逆量化。在步骤S111中,逆正交变换单元109根据与正交变换单元104的属性相对应的属性对由步骤S108的处理获得的正交变换系数执行逆正交变换。
在步骤S112中,运算单元110把预测图像与本地解码的差别信息相加以生成本地解码图像(与运算单元103的输入相对应的图像)。在步骤S113中,解块滤波器111对由步骤S112的处理获得的本地解码图像适当地执行解块滤波处理。
在步骤S114中,帧存储器112存储经历了由步骤S113的处理进行的解块滤波处理的解码图像。运算单元110也把没有经历解块滤波器111的滤波处理的图像提供给帧存储器112,帧存储器112存储这些图像。
在步骤S115中,无损编码单元106对由步骤S109的处理量化的变换系数进行编码。也就是说,对于差别图像执行诸如可变长度编码或算术编码之类的无损编码。
无损编码单元106对在步骤S105中计算出的差分量化参数进行编码并将编码数据添加到差分量化参数。另外,无损编码单元106对关于由步骤S106的处理选择的预测图像的预测模式的信息进行编码并且将该信息添加到通过对差分图像编码而获得的编码数据。也就是说,无损编码单元106对从内预测单元114提供来的最优内预测模式信息或从运动预测/补偿单元115提供来的关于最优间预测模式的信息进行编码,并将该信息添加到编码数据。当步骤S106的处理选择间预测模式的预测图像时,关于在步骤S105中计算出的差分运动向量的信息和指示预测运动向量的索引的标志也被编码。
在步骤S116中,累积缓冲器107累积由步骤S115的处理获得的编码数据。累积在累积缓冲器107中的编码数据被适当地读取并经由传送线路或记录介质传送到解码侧。
在步骤S117中,率控制器117基于由步骤S116的处理累积在累积缓冲器107中的编码数据的码量(生成码量)控制量化单元105的量化操作的率,以免发生上溢或下溢。另外,率控制器117把关于量化参数的信息提供给量化单元105。
当步骤S117的处理结束时,编码处理结束。
[参数生成处理的流程]
接下来,将参考图18的流程图描述图19的步骤S104中的参数生成处理的流程的示例。此参数生成处理是生成用于运动向量和量化参数的编码和解码的预测运动向量、预测(差分)量化参数等等的处理。图19的步骤S154和S155是运动预测/补偿单元115的处理。
由运动预测/补偿单元115搜索出的运动向量信息被提供给邻接运动向量缓冲器151和成本函数值计算单元153。在步骤S151中,候选预测运动向量生成单元152通过参考从邻接运动向量缓冲器151读取的运动向量信息来生成当前PU的候选预测运动向量。候选预测运动向量生成单元152把所生成的候选预测运动向量信息提供给成本函数值计算单元153。
在步骤S152中,成本函数值计算单元153计算由候选预测运动向量生成单元152生成的各个候选预测运动向量的成本函数值。成本函数值计算单元153把计算出的成本函数值与候选预测运动向量信息一起提供给最优预测运动向量确定单元154。
在步骤S153中,最优预测运动向量确定单元154确定使来自成本函数值计算单元153的成本函数值最小化的候选预测运动向量作为对于当前PU的最优预测运动向量并把关于该确定结果的信息提供给运动预测/补偿单元115。
在步骤S154中,运动预测/补偿单元115利用从最优预测运动向量确定单元154提供来的最优预测运动向量的信息生成作为与运动向量的差别的差分运动向量,并计算各个预测模式的成本函数值。
在步骤S154中,运动预测/补偿单元115确定使成本函数值最小化的预测模式作为预测模式之中的最优间预测模式。运动预测/补偿单元115把最优间预测模式的预测图像提供给预测图像选择器116。另外,最优间预测模式信息、最优间预测模式的差分运动向量信息、指示预测运动向量的索引的标志等等被提供给无损编码单元106并在图17的步骤S115中被编码。
运动预测/补偿单元115把指示最优间预测模式的信息提供给最优预测运动向量确定单元154。与此相应,最优预测运动向量确定单元154把从运动预测/补偿单元115提供来的信息所指示的最优间预测模式的最优预测运动向量的信息提供给区域决定单元161和邻接预测运动向量缓冲器162。
当当前PU的最优预测运动向量的信息被提供来时,区域决定单元161从邻接预测运动向量缓冲器162读取与当前PU邻接的邻接CU的最优预测运动向量的信息。在步骤S156中,区域决定单元161通过参考当前PU的最优预测运动向量信息和所读取的邻接PU的最优预测运动向量信息如参考图13至15所述那样执行区域判定。也就是说,在步骤S156中,区域决定单元161通过参考当前PU的最优预测运动向量和邻接PU的最优预测运动向量来决定邻接PU之中为了生成预测量化参数而要参考的区域(包括PU的CU)。
区域决定单元161向预测QP生成单元174提供控制信号以使得决定的PU被参考。预测QP生成单元174从邻接QP缓冲器173中读取从区域决定单元161提供来的控制信号所指示的区域(邻接PU所属的邻接CU)的邻接量化参数。
在步骤S157中,预测QP生成单元174使用读取的邻接量化参数作为当前CU的预测量化参数并将当前CU的预测量化参数信息提供给差分QP生成单元172。从率控制器117提供来的量化参数信息经由量化器171被提供给差分QP生成单元172。
在步骤S158中,差分QP生成单元172获得作为当前CU的量化参数与当前CU的预测量化参数之间的差别的差分量化参数,并将差分量化参数信息提供给无损编码单元106。
如上所述,由于参考了与当前区域(处理对象区域)具有相同预测运动向量的邻接区域来生成当前区域的预测量化参数,所以可以提高差分量化参数的编码效率。
也就是说,通过参考在MV竞争或合并模式中生成的预测运动向量来生成差分量化参数,可以提高编码效率。
另外,用于区域判定的信息是在解码侧重构运动向量所必要的信息并且是以传统技术传送到解码侧的预测运动向量信息。从而,不必传送额外的信息,抑制了编码比特数目的增大。
[2.第二实施例]
[图像解码装置]
接下来,将描述以上述方式编码的编码数据的解码。图19是示出与图1的图像编码装置100相对应的图像解码装置的主要组件的示例的框图。
图19所示的图像解码装置200根据与编码方法相对应的解码方法对由图像编码装置100生成的编码数据进行解码。假定图像解码装置200与图像编码装置100类似地以预测单位(PU)为单位执行间预测。
如图19所示,图像解码装置200包括累积缓冲器201、无损解码单元202、逆量化单元203、逆正交变换单元204、运算单元205、解块滤波器206、画面重排序缓冲器207以及D/A转换器208。另外,图像解码装置200包括帧存储器209、选择器210、内预测单元211、运动预测/补偿单元212和选择器213。
另外,图像解码装置200包括运动向量解码单元221和区域判定单元222。
累积缓冲器201累积传送给它的编码数据并在预定的时机把编码数据提供给无损解码单元202。无损解码单元202根据与无损编码单元106的编码方案相对应的方案对从累积缓冲器201提供来的经图1的无损编码单元106编码的信息进行解码。无损解码单元202把通过解码获得的差别图像的量化系数数据提供给逆量化单元203。
另外,无损解码单元202判定是内预测模式还是间预测模式被选择为最优预测模式,并且基于判定结果把关于最优预测模式的信息提供给内预测单元211或运动预测/补偿单元212。也就是说,例如,当图像编码装置100选择了间预测模式作为最优预测模式时,关于最优预测模式的信息被提供给运动预测/补偿单元212。
逆量化单元203从无损解码单元202获取对象区域(当前CU)的差分量化参数的信息。逆量化单元203在区域判定单元222的控制下利用在空间上与对象区域邻接的邻接区域的量化参数来生成对象区域的预测量化参数。逆量化单元203通过把对象区域的差分量化参数与对象区域的预测量化参数相加来重构量化参数。
逆量化单元203利用重构的量化参数根据与图1的量化单元105的量化方案相对应的方案对无损解码单元202通过解码获得的量化系数数据执行逆量化,并将所获得的系数数据提供给逆正交变换单元204。
逆正交变换单元204根据与图1的正交变换单元104的正交变换方案相对应的方案对从逆量化单元203提供来的系数数据执行逆正交变换。逆正交变换单元204通过该逆正交变换处理获得与经历图像编码装置100的正交变换前的残余数据相对应的解码残余数据。
通过逆正交变换获得的解码残余数据被提供给运算单元205。另外,来自内预测单元211或运动预测/补偿单元212的预测图像经由选择器213被提供给运算单元205。
运算单元205把解码残余数据与预测图像相加以获得与在图像编码装置100的运算单元103减去预测图像之前的图像相对应的解码图像数据。运算单元205把解码图像数据提供给解块滤波器206。
解块滤波器206对所提供的解码图像执行解块滤波处理并将解码图像提供给画面重排序缓冲器207。解块滤波器206通过对解码图像执行解块滤波处理来去除解码图像的块失真。
解块滤波器206把滤波处理结果(滤波后的解码图像)提供给画面重排序缓冲器207和帧存储器209。从运算单元205输出的解码图像可在不经由解块滤波器206的情况下被提供给画面重排序缓冲器207和帧存储器209。也就是说,可不执行解块滤波器206的滤波处理。
画面重排序缓冲器207执行画面重排序。也就是说,被图1的画面重排序缓冲器102按编码顺序重排序的帧被重排序以使得帧按原始显示顺序重排序。D/A转换器208对从画面重排序缓冲器207提供来的解码图像执行D/A转换并将转换后的图像输出到显示图像的显示器(未示出)。
帧存储器209存储提供来的解码图像并且在预定的时机或基于来自内预测单元211、运动预测/补偿单元212等的外部请求把存储的解码图像作为参考图像提供给选择器210。
选择器210选择从帧存储器209提供的参考图像的目的地。当经历了内编码的图像被解码时,选择器210把从帧存储器209提供来的参考图像提供给内预测单元211。另外,当经历了间编码的图像被解码时,选择器210把从帧存储器209提供来的参考图像提供给运动预测/补偿单元212。
无损解码单元202把指示通过对头部信息解码而获得的内预测模式的信息适当地提供给内预测单元211。内预测单元211以图1的内预测单元114中使用的内预测模式利用从帧存储器209获取的参考图像执行内预测来生成预测图像。内预测单元211把所生成的预测图像提供给选择器213。
运动预测/补偿单元212从无损解码单元202获取通过对头部信息解码而获得的信息(最优预测模式信息、参考图像信息等等)。
运动预测/补偿单元212以从无损解码单元202获取的最优预测模式信息所指示的间预测模式利用从帧存储器209获取的参考图像执行间预测以生成预测图像。在此情况下,运动预测/补偿单元212通过参考由运动向量解码单元221重构的运动向量信息来执行间预测。
选择器213把来自内预测单元211的预测图像或来自运动预测/补偿单元212的预测图像提供给运算单元205。
运动向量解码单元221从无损解码单元202获取通过对头部信息解码而获得的信息项之中的关于预测运动向量索引的信息和关于差分运动向量的信息。这里,预测运动向量索引是指示在时间上和空间上与每个PU邻接的邻接区域之中用于预测该PU的运动向量(生成预测运动向量)的邻接区域的信息。关于差分运动向量的信息是指示差分运动向量的值的信息。
运动向量解码单元221利用由预测运动向量的索引指示的PU的运动向量来重构预测运动向量,并将重构的预测运动向量与从无损解码单元202提供来的差分运动向量相加来重构运动向量。运动向量解码单元221把关于重构的运动向量的信息提供给运动预测/补偿单元212。另外,运动向量解码单元221把从无损解码单元202提供来的预测运动向量的索引的信息提供给区域判定单元222。
区域判定单元222基于从运动向量解码单元221提供来的预测运动向量的索引来确定其量化参数将被用作对象区域的预测量化参数的邻接区域。区域判定单元122基于该确定结果控制逆量化单元203的预测量化参数生成处理。
也就是说,在图19的图像解码装置200中,逆量化单元202在区域判定单元222的控制下根据预测邻接区域的预测运动向量的方法生成对象区域的预测量化参数。
运动向量解码单元221和区域判定单元222的根据本技术的基本操作的原理与图1的运动向量编码单元121和区域判定单元122的相同。然而,在图1所示的图像编码装置100中,从候选预测运动向量中选择最优参数,并且根据关于所选的最优预测运动向量的信息来对量化参数编码(即,生成预测量化参数)。
另一方面,在图19所示的图像解码装置200中,关于用于生成用于对运动向量编码(生成差分运动向量)的每个PU的预测运动向量的预测方法的信息(指示预测运动向量的索引的信息)被从编码侧传送来。从而,根据指示预测运动向量的索引的信息来执行区域判定,并且对量化参数编码(即,生成预测量化参数)。
[运动向量解码单元、区域判定单元和逆量化单元的配置示例]
图20是示出运动向量解码单元221、区域判定单元222和逆量化单元203的主要组件的示例的框图。
在图20的示例中,运动向量解码单元221被配置为包括预测运动向量信息缓冲器251、差分运动向量信息缓冲器252、预测运动向量重构单元253、运动向量重构单元254和邻接运动向量缓冲器255。
区域判定单元222被配置为包括区域决定单元261和邻接预测运动向量缓冲器262。
逆量化单元203被配置为包括预测QP生成单元271、邻接QP缓冲器272、差分QP缓冲器273、当前QP重构单元274和逆量化器275。
预测运动向量信息缓冲器251累积由无损解码单元202解码出的指示对象区域(PU)的预测运动向量的索引的信息(以下称为预测运动向量信息)。预测运动向量信息缓冲器251读取当前PU的预测运动向量信息并将该信息提供给预测运动向量重构单元253、区域决定单元261和邻接预测运动向量缓冲器262。
差分运动向量信息缓冲器252累积由无损解码单元202解码出的对象区域(PU)的差分运动向量信息。差分运动向量信息缓冲器252读取对象PU的差分运动向量信息并将该信息提供给运动向量重构单元254。
预测运动向量重构单元253从邻接运动向量缓冲器255中读取从预测运动向量信息缓冲器251提供来的对象PU的预测运动向量信息所指示的邻接PU的运动向量,并重构对象PU的预测运动向量。预测运动向量重构单元253把重构的预测运动向量提供给运动向量重构单元254。
运动向量重构单元254通过把对象PU的差分运动向量与对象PU的重构的预测运动向量的预测运动向量相加来重构运动向量,并把指示重构的运动向量的信息提供给运动预测/补偿单元212。
与此相应,运动预测/补偿单元212利用由运动向量重构单元254重构的运动向量以从无损解码单元202获取的最优预测模式信息所指示的间预测模式利用参考图像执行间预测以生成预测图像。
当当前PU的预测运动向量信息被提供来时,区域决定单元261从邻接预测运动向量缓冲器262中读取与当前PU邻接的邻接PU的预测运动向量信息。区域决定单元261通过参考当前PU的预测运动向量信息和邻接PU的预测运动向量信息来确定邻接PU之中为了生成预测量化参数而要参考的PU(区域)。区域决定单元261向预测QP生成单元271提供控制信号以使得决定的PU被参考。
邻接预测运动向量缓冲器262把从预测运动向量信息缓冲器251提供来的预测运动向量信息作为用于确定当前PU的区域的邻接预测运动向量的信息累积。
预测QP生成单元271从邻接QP缓冲器272中读取来自区域决定单元261的控制信号所指示的区域(邻接PU所属的邻接CU)的邻接量化参数。预测QP生成单元271使用读取的邻接量化参数作为当前CU的预测量化参数并将当前CU的预测量化参数信息提供给当前QP重构单元274。
邻接QP缓冲器272把由当前QP重构单元274重构的量化参数的信息作为用于生成当前CU的预测量化参数的与当前CU邻接的邻接CU的量化参数的信息。
差分QP缓冲器273获取由无损解码单元202解码出的关于差分量化参数的信息并累积该信息。差分QP缓冲器273读取关于当前CU的差分量化参数的信息并将读取的信息提供给当前QP重构单元274。
当前QP重构单元274把从预测QP生成单元271提供来的信息所指示的预测量化参数与从差分QP缓冲器273提供来的信息所指示的差分量化参数相加以重构当前CU的量化参数。当前QP重构单元274把关于重构的当前CU的量化参数的信息提供给邻接QP缓冲器272和逆量化器275。
逆量化器275利用从当前QP重构单元274提供来的信息所指示的量化参数对从无损解码单元202提供来的量化正交变换系数执行逆量化以获得正交变换系数并将正交变换系数提供给逆正交变换单元204。
[解码处理的流程]
接下来,将描述具有这种配置的图像解码装置200执行各个处理的流程。首先,将参考图21的流程图描述解码处理的流程的示例。
当解码处理开始时,在步骤S201中,累积缓冲器201累积传送给它的码流。在步骤S202中,无损解码单元202对从累积缓冲器201提供来的码流(经编码的差别图像信息)进行解码。也就是说,由图1的无损编码单元106编码的I图片、P图片和B图片被解码。
在此情况下,码流中包括的除差别图像信息以外的各种类型的信息,例如差分运动向量信息、指示预测运动向量的索引的标志以及差分量化参数信息,也被解码。
在步骤S203中,逆量化单元203的逆量化器275对由步骤S202的处理获得的量化正交变换系数执行逆量化。在此逆量化处理中,使用由稍后描述的步骤S208的处理获得的量化参数。在步骤S204中,逆正交变换单元204对经历了步骤S203中的逆量化的正交变换系数执行逆正交变换。
在步骤S205中,无损解码单元202基于在步骤S202中解码出的关于最优预测模式的信息来判定要处理的编码数据是否经历了内编码。当判定编码数据经历了内编码时,流程前进到步骤S206。
在步骤S206中,内预测单元211获取内预测模式信息。在步骤S207中,内预测单元211利用在步骤S206中获取的内预测模式信息来执行内预测以生成预测图像。
另外,当在步骤S206中判定要处理的编码数据没有经历内编码(也就是说,编码数据经历了间编码)时,流程前进到步骤S208。
在步骤S208中,运动向量解码单元221、区域判定单元222和逆量化单元203执行作为重构运动向量、量化参数等等的处理的参数重构处理。参数重构处理的细节将参考图22来描述。
通过步骤S208的处理,通过参考关于解码出的预测运动向量的信息来重构当前PU的预测运动向量和运动向量。重构的运动向量被提供给运动预测/补偿单元212。
另外,通过参考关于解码出的预测运动向量的信息来确定为了生成预测量化参数而参考的区域。基于所确定的区域来生成预测量化参数,并且基于所生成的预测量化参数和差分量化参数来重构量化参数。重构的量化参数被提供给逆量化器275并用于步骤S203的处理。
在步骤S209中,运动预测/补偿单元212利用由步骤S208的处理重构的运动向量来执行间运动预测处理以生成预测图像。所生成的预测图像被提供给选择器213。
在步骤S210中,选择器213选择在步骤S207或S209中生成的预测图像。在步骤S211中,运算单元205把在步骤S210中选择的预测图像与通过步骤S204中的逆正交变换获得的差别图像信息相加。这样,解码了原始图像。
在步骤S212中,解块滤波器206对于在步骤S211中获得的解码图像适当地执行解块滤波处理。
在步骤S213中,画面重排序缓冲器207对在步骤S212中经过滤波的图像进行重排序。也就是说,画面重排序缓冲器207对由图像编码装置100的画面重排序缓冲器102按编码顺序排列的帧进行重排序以使得帧按原始显示顺序重排序。
在步骤S214中,D/A转换器208对在步骤S213中重排序了帧的图像进行执行D/A转换。此图像被输出到显示器(未示出)并且该图像被显示。
在步骤S215中,帧存储器209存储在步骤S212中经过滤波的图像。
当步骤S215的处理结束时,解码处理结束。
[参数重构处理的流程]
接下来,将参考图22的流程图描述在图21的步骤S208中执行的参数重构处理的流程的示例。此参数重构处理是利用从编码侧传送来并由无损解码单元202解码的信息来重构运动向量和诸如量化参数之类的参数的处理。
在步骤S251中,运动向量解码单元221获取在图21的步骤S202中由无损解码单元202解码出的关于运动向量的信息。也就是说,预测运动向量信息缓冲器251获取作为关于运动向量的信息项之一的指示预测运动向量的索引的信息并累积该信息。差分运动向量信息缓冲器252获取作为关于运动向量的信息项之一的指示差分运动向量的值的信息并累积该信息。
在步骤S252中,预测运动向量重构单元253重构对象PU的预测运动向量。也就是说,对象PU的预测运动向量的索引被从预测运动向量信息缓冲器251提供来。与此相应,预测运动向量重构单元253从邻接运动向量缓冲器255中读取对象PU的预测运动向量的索引所指示的邻接PU的运动向量并重构对象PU的预测运动向量。重构的对象PU的预测运动向量被提供给运动向量重构单元254。
在步骤S253中,运动向量重构单元254重构当前PU的运动向量。也就是说,指示对象PU的差分运动向量的值的信息被从差分运动向量信息缓冲器252提供来。运动向量重构单元254通过把差分运动向量信息缓冲器252的对象PU的差分运动向量与从预测运动向量重构单元253提供来的预测运动向量相加来重构当前PU的运动向量。指示重构的当前PU的运动向量的信息被提供给运动预测/补偿单元212并用于图21的步骤S209的预测图像生成处理。
在步骤S251中获取的预测运动向量信息也被提供给区域决定单元261和邻接预测运动向量缓冲器262。与此相应,区域决定单元261从邻接预测运动向量缓冲器262读取关于与当前PU邻接的邻接PU的预测运动向量的信息。
在步骤S254中,区域决定单元261如以上参考图13至15所述那样执行区域判定。也就是说,区域决定单元261通过参考关于当前PU的预测运动向量的信息和关于邻接PU的预测运动向量的信息来决定邻接PU之中为了生成预测量化参数而要参考的PU(区域)。区域决定单元261向预测QP生成单元271提供控制信号以使得决定的PU被参考。
在步骤S255中,预测QP生成单元271从邻接QP缓冲器272中读取来自区域决定单元261的控制信号所指示的区域(邻接PU所属的邻接CU)的邻接量化参数并利用邻接量化参数生成当前CU的预测量化参数。指示所生成的当前CU的预测量化参数的信息被提供给当前QP重构单元274。
在步骤S256中,差分QP缓冲器273获取在图21的步骤S202中由无损解码单元202解码出的指示差分量化参数的信息。差分QP缓冲器273读取关于当前CU的差分量化参数的信息并将读取的信息提供给当前QP重构单元274。
在步骤S257中,当前QP重构单元274把从预测QP生成单元271提供来的信息所指示的预测量化参数与从差分QP缓冲器273提供来的信息所指示的差分量化参数相加以重构当前CU的量化参数。重构的当前CU的量化参数被提供给逆量化器275并用于图21的步骤S203的逆量化处理。
通过以这种方式执行各个处理,图像解码装置200可正确地对由图像编码装置100编码的编码数据进行解码并提高编码效率。
也就是说,在图像解码装置200中,由于参考与处理对象区域具有相同预测运动向量的邻接区域来生成处理对象区域的预测量化参数,所以可以提高差分量化参数的编码效率。
也就是说,通过参考在MV竞争或合并模式中生成的预测运动向量来生成差分量化参数,可以提高编码效率。
如上所述,依据当前区域和邻接区域是利用空间预测运动向量还是时间预测运动向量来编码的来对区域分类,并且根据分类结果来执行用于对量化参数编码的预测处理。从而,可以提高编码效率。
在以上描述中,虽然已描述了与HEVC方案有关的情况作为示例,但本技术可应用到使用另外的编码方案的装置,只要这些装置根据MV竞争和合并模式执行运动向量信息编码处理和解码处理。
本技术可应用到当如MPEG、H.26x等的情况中那样通过诸如离散余弦变换之类的正交变换和运动补偿来压缩的图像信息(比特流)被经由诸如卫星广播、有线TV、因特网或蜂窝电话之类的网络介质接收时使用的图像信息编码装置和图像解码方法。另外,本技术可应用到当在诸如光盘或磁盘或闪存存储器之类的存储介质上处理图像信息(比特流)时使用的图像编码装置和图像解码装置。此外,本技术可应用到图像编码装置、图像解码装置等中包括的运动预测补偿装置。[3.第三实施例]
[应用到多视点图像编码和解码]
该系列处理可应用到多视点图像编码和解码。图23示出了多视点图像编码方案的示例。
如图23所示,多视点图像包括多个视点的图像,并且这多个视点之中预定的单个视点的图像被指定为基本视点图像。除了基本视点图像以外的各个视点图像被视为非基本视点图像。
当如图23所示的多视点图像被编码时,可以取各个视点(相同视点)中的量化参数之间的差别:
(1)基本视点:
dQP(基本视点)
=CurrentQP(基本视点)-LeftQP(基本视点)或TopQP(基本视点)
(2)非基本视点:
dQP(非基本视点)
=CurrentQP(非基本视点)-LeftQP(非基本视点)或TopQP(非基本视点)
这里,dQP表示量化参数与量化参数(预测量化参数)之间的差别值(cu_qp_delta),并且CurrentQP是处理对象编码单位(CU)的量化参数。LeftQP和TopQP中的任何一个被用作预测量化参数。LeftQP表示空间上在当前处理对象CU的左侧邻接的左CU的量化参数,并且TopQP表示空间上在当前处理对象CU的上方邻接的上CU的量化参数。
在dQP中,预测量化参数是LeftQP还是TopQP是如上所述依据用于生成当前CU、左CU和上CU中的预测运动向量的预测方法来确定的。也就是说,被认为与当前CU属于同一区域的CU(左CU或上CU)的量化参数被用作当前CU的预测量化参数。
另外,当多视点图像被编码时,可以取各个视点(不同视点)中的量化参数之间的差别:
(3)基本视点/非基本视点:
(3-1)dQP(视点间)
=CurrentQP(基本视点)-CurrentQP(非基本视点)
(3-2)dQP(视点间)
=CurrentQP(基本视点)-LeftQP(非基本视点)或TopQP(非基本视点)
(4)非基本视点/非基本视点:
(4-1)dQP(视点间)
=CurrentQP(非基本视点i)-CurrentQP(非基本视点j)
(4-2)dQP(视点间)
=CurrentQP(非基本视点i)-LeftQP(非基本视点j)或TopQP(非基本视点j)
这样,把被认为与当前CU属于同一区域的CU(左CU或上CU)的量化参数用作当前CU的预测量化参数,并生成差别。这样,即使在执行分层次编码时,也可以提高编码效率。
[多视点图像编码装置]
图24是示出执行上述多视点图像编码的多视点图像编码装置的图。如图24所示,多视点图像编码装置600包括编码单元601、编码单元602和复用器603。
编码单元601对基本视点图像编码以生成基本视点图像编码流。编码单元602对非基本视点图像编码以生成非基本视点图像编码流。复用器603对由编码单元601生成的基本视点图像编码流和由编码单元602生成的非基本视点图像编码流进行复用以生成多视点图像编码流。
可将图像编码装置100(图1)应用到多视点图像编码装置600的编码单元601和602。在此情况下,多视点图像编码装置600设定由编码单元601设定的量化参数与由编码单元602设定的量化参数之间的差别值并传送该差别值。
[多视点图像解码装置]
图25是示出执行上述多视点图像解码的多视点图像解码装置的图。如图25所示,多视点图像解码装置610包括解复用器611、解码单元612和解码单元613。
解复用器611对复用了基本视点图像编码流和非基本视点图像编码流的多视点图像编码流进行解复用以提取基本视点图像编码流和非基本视点图像编码流。解码单元612对解复用器611提取的基本视点图像编码流进行解码以获得基本视点图像。解码单元613对解复用器611提取的非基本视点图像编码流进行解码以获得非基本视点图像。
可将图像解码装置200(图19)应用到多视点图像解码装置610的解码单元612和613。在此情况下,多视点图像解码装置610从由编码单元601设定的量化参数与由编码单元602设定的量化参数之间的差别值设定量化参数并执行逆量化。
[4.第四实施例]
[应用到层次图像编码和解码]
上述一系列处理可被应用到层次图像编码和解码。图26示出了层次图像编码方案的示例。
如图26所示,层次图像包括多个层次(分辨率)的图像,并且这多个分辨率之中的预定单个层次的图像被指定为基本层次图像。除了基本层次图像以外的各个层次图像被视为非基本层次图像。
当执行如图26所示的层次图像编码(空间可伸缩性)时,可以取各个层次(相同层次)的量化参数之间的差别值。
(1)基本层次:
dQP(基本层次)
=CurrentQP(基本层次)-LeftQP(基本层次)或TopQP(基本层次)
(2)非基本层次:
dQP(非基本层次)
=CurrentQP(非基本层次)-LeftQP(非基本层次)或TopQP(非基本层次)
这里,dQP表示量化参数与量化参数(预测量化参数)之间的差别值(cu_qp_delta),并且CurrentQP是处理对象编码单位(CU)的量化参数。LeftQP和TopQP中的任何一个被用作预测量化参数。LeftQP表示空间上在当前处理对象CU的左侧邻接的左CU的量化参数,并且TopQP表示空间上在当前处理对象CU的上方邻接的上CU的量化参数。
在dQP中,预测量化参数是LeftQP还是TopQP是如上所述依据用于生成当前CU、左CU和上CU中的预测运动向量的预测方法来确定的。也就是说,被认为与当前CU属于同一区域的CU(左CU或上CU)的量化参数被用作当前CU的预测量化参数。
另外,当执行层次图像编码(空间可伸缩性)时,可以取各个层次(不同层次)中的量化参数之间的差别值:
(3)基本层次/非基本层次:
(3-1)dQP(层次间)
=CurrentQP(基本层次)-CurrentQP(非基本层次)
(3-2)dQP(层次间)
=CurrentQP(基本层次)-LeftQP(非基本层次)或TopQP(非基本层次)
(4)非基本层次/非基本层次:
(4-1)dQP(层次间)
=CurrentQP(非基本层次i)-CurrentQP(非基本层次j)
(4-2)dQP(层次间)
=CurrentQP(非基本层次i)-LeftQP(非基本层次j)或TopQP(非基本层次j)
这样,把被认为与当前CU属于同一区域的CU(左CU或上CU)的量化参数用作当前CU的预测量化参数,并生成差别。这样,即使在执行分层次编码时,也可以提高编码效率。
[层次图像编码装置]
图27是示出执行上述层次图像编码的层次图像编码装置的图。如图27所示,层次图像编码装置620包括编码单元621、编码单元622和复用器623。
编码单元621对基本层次图像编码以生成基本层次图像编码流。编码单元622对非基本层次图像编码以生成非基本层次图像编码流。复用器623对由编码单元621生成的基本层次图像编码流和由编码单元622生成的非基本层次图像编码流进行复用以生成层次图像编码流。
可将图像编码装置100(图1)应用到层次图像编码装置620的编码单元621和622。在此情况下,层次图像编码装置620设定由编码单元621设定的量化参数与由编码单元622设定的量化参数之间的差别值并传送该差别值。
[层次图像解码装置]
图28是示出执行上述层次图像解码的层次图像解码装置的图。如图28所示,层次图像解码装置630包括解复用器631、解码单元632和解码单元633。
解复用器631对复用了基本层次图像编码流和非基本层次图像编码流的层次图像编码流进行解复用以提取基本层次图像编码流和非基本层次图像编码流。解码单元632对解复用器631提取的基本层次图像编码流进行解码以获得基本层次图像。解码单元633对解复用器631提取的非基本层次图像编码流进行解码以获得非基本层次图像。
可将图像解码装置200(图19)应用到层次图像解码装置630的解码单元632和633。在此情况下,层次图像解码装置630从由编码单元621设定的量化参数与由编码单元622设定的量化参数之间的差别值设定量化参数并执行逆量化。
[5.第五实施例]
[计算机]
上述一系列处理不仅可用硬件执行,而且可用软件执行。当用软件来执行这一系列处理时,软件中包括的程序被安装在计算机中。这里,计算机可以是集成到专用硬件中的计算机或者可通过在计算机中安装各种程序来执行各种功能的通用个人计算机。
图29是示出根据程序执行上述一系列处理的计算机的硬件配置的示例的框图。
在计算机800中,中央处理单元(CPU)801、只读存储器(ROM)802和随机存取存储器(RAM)803通过总线804相互连接。
输入/输出接口805也连接到总线804。输入单元806、输出单元807、存储单元808、通信单元809和驱动器810连接到输入/输出接口805。
输入单元806由键盘、鼠标、麦克风等等形成。输出单元807由显示器、扬声器等等形成。存储单元808由硬盘、非易失性存储器等等形成。通信单元809由网络接口等等形成。驱动器810驱动诸如磁盘、光盘、磁光盘或半导体存储器之类的可移除介质811。
在具有上述配置的计算机中,CPU801在输入/输出接口805和总线804的帮助下把例如存储单元808中存储的程序加载到RAM803中并且执行该程序,从而执行上述一系列处理。
由计算机800(CPU801)执行的程序可例如通过以封装介质之类的形式记录在可移除介质811上来提供。另外,程序可经由诸如局域通信网络、因特网或数字卫星广播之类的有线或无线传送介质来提供。
在计算机中,可通过将可移除介质811安放在驱动器810上来经由输入/输出接口805将程序安装在存储单元808中。另外,程序可经由有线或无线传送介质被通信单元809接收并被安装在存储单元808中。另外,程序可被预先安装在ROM802或存储单元808中。
由计算机执行的程序可以是根据本说明书中描述的过程以时序方式执行处理的程序,并且可以是以并行方式或者在必要时(例如响应于调用)执行处理的程序。
这里,在本说明书中,描述记录介质中记录的程序的步骤不仅包括根据所描述的过程以时序方式执行的处理,而且即使并不总是以时序方式执行,也包括并行地或者甚至分开地执行的处理。
在本说明书中,术语“系统”用于暗示包括多个设备(装置)的装置的整体。
在以上描述中,被描述为一个装置(或处理器)的配置可被分割成多个装置(或处理器)。或者,被描述为多个装置(或处理器)的配置可被集成为单个装置(或处理器)。另外,在每个装置(或每个处理器)的上述配置中可包括除了以上论述的那些以外的配置。如果系统整体上的配置和操作基本相同,则一装置(或处理器)的配置的一部分可被添加到另一装置(或另一处理器)的配置。本技术不限于上述实施例,而是可在不脱离本技术的要旨的范围中进行各种修改。
根据上述实施例的图像编码装置和图像解码装置可应用到各种电子装置,例如在有线广播(例如卫星广播或有线TV)或因特网上分发信号和通过蜂窝通信向终端分发信号的发送器或接收器、在诸如光盘、磁盘或闪存存储器之类的介质上记录图像的记录装置、或者从这些存储介质再现图像的再现装置。下面将描述四个应用例。
[6.应用例]
[第一应用例:电视装置]
图30示出应用了上述实施例的电视装置的示意性配置的示例。电视装置900包括天线901、调谐器902、解复用器903、解码器904、视频信号处理器905、显示单元906、音频信号处理器907、扬声器908、外部接口909、控制器910、用户界面911和总线912。
调谐器902从通过天线901接收的广播信号中提取期望频道的信号并对提取的信号进行解调。然后,调谐器902把通过解调获得的编码比特流输出给解复用器903。也就是说,调谐器902充当电视装置900中的传送单元,其接收其中编码了图像的编码流。
解复用器903从编码比特流中分离出要观看的节目的视频流和音频流并将每个分离出的流输出到解码器904。另外,解复用器903从编码比特流中提取诸如EPG(电子节目指南)之类的辅助数据并将提取的数据提供给控制器910。当编码比特流被加扰时,解复用器903可进行解扰。
解码器904对从解复用器903输入的视频流和音频流进行解码。然后,解码器904把通过解码处理生成的视频数据输出到视频信号处理器905。另外,解码器904把通过解码处理生成的音频数据输出到音频信号处理器907。
视频信号处理器905再现从解码器904输入的视频数据并允许显示单元906显示视频。视频信号处理器905还可允许显示单元906显示通过网络提供的应用画面。视频信号处理器905还可根据设定对视频数据执行诸如噪声去除之类的附加处理。另外,视频信号处理器905可生成诸如菜单、按钮和光标之类的GUI(图形用户界面)图像,并将所生成的图像重叠在输出图像上。
显示单元906被从视频信号处理器905提供来的驱动信号所驱动以在显示装置(例如,液晶显示器、等离子显示器、OELD(有机电致发光显示器(有机EL显示器))等等)的视频画面上显示视频或图像。
音频信号处理器907对从解码器904输入的音频数据执行诸如D/A转换和放大之类的再现处理并允许扬声器908输出音频。音频信号处理器907还可对音频数据执行诸如噪声去除之类的附加处理。
外部接口909是用于连接电视装置900和外部装置或网络的接口。例如,经由外部接口909接收的视频流或音频流可被解码器904解码。也就是说,外部接口909也充当电视装置900中的传送单元,其接收其中编码了图像的编码流。
控制器910包括诸如CPU之类的处理器和诸如RAM和ROM之类的存储器。存储器存储由CPU执行的程序、程序数据、EPG数据、通过网络获得的数据等等。存储在存储器中的程序例如在电视装置900启动时被CPU读取以被执行。CPU通过执行程序根据例如从用户界面911输入的操作信号来控制电视装置900的操作。
用户界面911连接到控制器910。用户界面911例如包括供用户操作电视装置900的按钮和开关、遥控信号的接收器等等。用户界面911通过组件检测用户的操作以生成操作信号并将所生成的操作信号输出到控制器910。
总线912将调谐器902、解复用器903、解码器904、视频信号处理器905、音频信号处理器907、外部接口909和控制器910相互连接。
在以这种方式配置的电视装置900中,解码器904具有根据上述实施例的图像解码装置的功能。因此,当在电视装置900中对图像解码时,可以提高编码效率。
[第二应用例:移动电话]
图31示出应用了上述实施例的移动电话的示意性配置的示例。移动电话920包括天线921、通信单元922、音频编解码器923、扬声器924、麦克风925、相机单元926、图像处理器927、复用/分离单元928、记录/再现单元929、显示单元930、控制器931、操作单元932和总线933。
天线921连接到通信单元922。扬声器924和麦克风925连接到音频编解码器923。操作单元932连接到控制器931。总线933将通信单元922、音频编解码器923、相机单元926、图像处理器927、复用/分离单元928、记录/再现单元929、显示单元930和控制器931相互连接。
移动电话920在包括音频通信模式、数据通信模式、成像模式和电视电话模式在内的各种操作模式中执行诸如音频信号的发送/接收、电子邮件或图像数据的发送/接收、图像拍摄和数据的记录之类的操作。
在音频通信模式中,由麦克风925生成的模拟音频信号被提供给音频编解码器923。音频编解码器923把模拟音频信号转换成音频数据并对转换后的音频数据进行A/D转换以压缩。然后,音频编解码器923把压缩的音频数据输出到通信单元922。通信单元922对音频数据进行编码和调制以生成发送信号。然后,通信单元922把生成的发送信号经由天线921发送到基站(未示出)。另外,通信单元922对经由天线921接收的无线信号进行放大并向其应用频率转换以获得接收信号。然后,通信单元922通过对接收信号进行解调和解码来生成音频数据并将生成的音频数据输出到音频编解码器923。音频编解码器923展开音频数据并对其进行D/A转换以生成模拟音频信号。然后,音频编解码器923把生成的音频信号提供给扬声器924以允许其输出音频。
在数据通信模式中,例如,控制器931根据用户通过操作单元932的操作生成构成电子邮件的字符数据。另外,控制器931允许显示单元930显示字符。控制器931根据通过操作单元932来自用户的发送指令生成电子邮件数据以将生成的电子邮件数据输出到通信单元922。通信单元922对电子邮件数据进行编码和调制以生成发送信号。然后,通信单元922把生成的发送信号经由天线921发送到基站(未示出)。另外,通信单元922对经由天线921接收的无线信号进行放大并对其应用频率转换以获得接收信号。然后,通信单元922对接收信号进行解调和解码以恢复电子邮件数据并将恢复的电子邮件数据输出到控制器931。控制器931允许显示单元930显示电子邮件数据的内容并允许记录/再现单元929的存储介质存储电子邮件数据。
记录/再现单元929包括任意的可读/可写存储介质。例如,存储介质可以是诸如RAM和闪存之类的内置存储介质并且可以是诸如硬盘、磁盘、磁光盘、光盘、USB(Unallocated Space Bitmap,未分配空间位图)存储器和存储卡之类的外部安放存储介质。
在成像模式中,例如,相机单元926拍摄被摄体的图像以生成图像数据并将生成的图像数据输出到图像处理器927。图像处理器927对从相机单元926输入的图像数据进行编码并将编码流存储在记录/再现单元929的存储介质中。
另外,在电视电话模式中,例如,复用/分离单元928复用经图像处理器927编码的视频流和从音频编解码器923输入的音频流并将复用的流输出到通信单元922。通信单元922对该流进行编码和调制以生成发送信号。然后,通信单元922把生成的发送信号经由天线921发送到基站(未示出)。另外,通信单元922对经由天线921接收的无线信号进行放大并对其应用频率转换以获得接收信号。发送信号和接收信号可包括编码比特流。然后,通信单元922通过对接收信号进行解调和解码来恢复流并将恢复的流输出到复用/分离单元928。复用/分离单元928从输入流中分离出视频流和音频流并将视频流和音频流分别输出到图像处理器927和音频编解码器923。图像处理器927对视频流进行解码以生成视频数据。视频数据被提供给显示单元930并且一系列图像被显示单元930显示。音频编解码器923展开音频流并对其进行D/A转换以生成模拟音频信号。然后,音频编解码器923把生成的音频信号提供给扬声器924以允许其输出音频。
在以这种方式配置的移动电话920中,图像处理器927具有根据上述实施例的图像编码装置和图像解码装置的功能。因此,当在移动电话920中对图像进行编码和解码时,可以提高编码效率。
[第三应用例:记录/再现装置]
图32示出应用了上述实施例的记录/再现装置的示意性配置的示例。记录/再现装置940例如对接收到的广播节目的音频数据和视频数据进行编码以记录在记录介质上。另外,记录/再现装置940例如可对从另一装置获得的音频数据和视频数据进行编码以记录在记录介质上。另外,记录/再现装置940根据用户的指令通过监视器和扬声器对记录介质上记录的数据进行再现。在此情况下,记录/再现装置940对音频数据和视频数据进行解码。
记录/再现装置940包括调谐器941、外部接口942、编码器943、HDD(硬盘驱动器)944、盘驱动器945、选择器946、解码器947、OSD(屏上显示)948、控制器949和用户界面950。
调谐器941从通过天线(未示出)接收的广播信号中提取期望频道的信号并对提取的信号进行解调。然后,调谐器941把通过解调获得的编码比特流输出到选择器946。也就是说,调谐器941充当记录/再现装置940中的传送单元。
外部接口942是用于连接记录/再现装置940和外部装置或网络的接口。外部接口942例如可以是IEEE1394接口、网络接口、USB接口、闪存存储器接口等等。例如,经由外部接口942接收的视频数据和音频数据被输入到编码器943。也就是说,外部接口942充当记录/再现装置940中的传送单元。
当从外部接口942输入的视频数据和音频数据未被编码时,编码器943对视频数据和音频数据进行编码。然后,编码器943把编码比特流输出到选择器946。
HDD944在内部硬盘上记录其中压缩了诸如视频和音频之类的内容数据的编码比特流、各种程序和其他数据。HDD944在再现视频和音频时从硬盘读取数据。
盘驱动器945在安放的记录介质上记录数据并从安放的记录介质中读取数据。安放在盘驱动器945上的记录介质例如可以是DVD盘(DVD-视频、DVD-RAM、DVD-R、DVD-RW、DVD+R、DVD+RW等等)、蓝光(注册商标)盘等等。
当记录视频和音频时,选择器946选择从调谐器941或编码器943输入的编码比特流并将所选择的编码比特流输出到HDD944或盘驱动器945。另外,当再现视频和音频时,选择器946把从HDD944或盘驱动器945输入的编码比特流输出到解码器947。
解码器947对编码比特流进行解码以生成视频数据和音频数据。然后,解码器947把生成的视频数据输出到OSD948。另外,解码器904把生成的音频数据输出到外部扬声器。
OSD948再现从解码器947输入的视频数据以显示视频。OSD948还可例如将诸如菜单、按钮和光标之类的GUI图像重叠在显示的视频上。
控制器949包括诸如CPU之类的处理器和诸如RAM和ROM之类的存储器。存储器存储由CPU执行的程序、程序数据等等。存储在存储器中的程序例如在激活记录/再现装置940时被CPU读取以被执行。CPU通过执行程序根据例如从用户界面950输入的操作信号来控制记录/再现装置940的操作。
用户界面950连接到控制器949。用户界面950例如包括供用户操作记录/再现装置940的按钮和开关以及遥控信号的接收器。用户界面950经由组件检测用户的操作以生成操作信号并将所生成的操作信号输出到控制器949。
在以这种方式配置的记录/再现装置940中,编码器943具有根据上述实施例的图像编码装置的功能。另外,解码器947具有根据上述实施例的图像解码装置的功能。因此,当在记录/再现装置940中对图像编码和解码时,可以提高编码效率。
[第四应用例:成像装置]
图33示出应用了上述实施例的成像装置的示意性配置的示例。成像装置960对被摄体成像以生成图像,对图像数据编码,并将其记录在记录介质上。
成像装置960包括光学块961、成像单元962、信号处理器963、图像处理器964、显示单元965、外部接口966、存储器967、介质驱动器968、OSD969、控制器970、用户界面971和总线972。
光学块961连接到成像单元962。成像单元962连接到信号处理器963。显示单元965连接到图像处理器964。用户界面971连接到控制器970。总线972将图像处理器964、外部接口966、存储器967、介质驱动器968、OSD969和控制器970相互连接。
光学块961包括聚焦透镜、光圈机构等等。光学块961在成像单元962的成像面上形成被摄体的光学图像。成像单元962包括诸如CCD(电荷耦合器件)和CMOS(互补金属氧化物半导体)之类的图像传感器并且通过光电转换把在成像面上形成的光学图像转换成作为电信号的图像信号。然后,成像单元962把图像信号输出到信号处理器963。
信号处理器963对从成像单元962输入的图像信号执行各种相机信号处理,例如拐点校正、伽马校正和颜色校正。信号处理器963把相机信号处理后的图像数据输出到图像处理器964。
图像处理器964对从信号处理器963输入的图像数据进行编码以生成编码数据。然后,图像处理器964把生成的编码数据输出到外部接口966或介质驱动器968。另外,图像处理器964对从外部接口966或介质驱动器968输入的编码数据进行解码以生成图像数据。然后,显示单元965将生成的图像数据输出到显示单元965。图像处理器964还可把从信号处理器963输入的图像数据输出到显示单元965以显示图像。图像处理器964还可把从OSD969获得的用于显示的数据重叠在输出到显示单元965的图像上。
OSD969例如生成诸如菜单、按钮和光标之类的GUI图像并将生成的图像输出到图像处理器964。
外部接口966例如被配置为USB输入/输出端子。例如,当打印图像时,外部接口966连接成像装置960和打印机。另外,一驱动器根据需要连接到外部接口966。诸如磁盘和光盘之类的可移除介质例如被安放在驱动器上,并且从可移除介质读取的程序可被安装在成像装置960上。另外,外部接口966可被配置为连接到诸如LAN和因特网之类的网络的网络接口。也就是说,外部接口966充当成像装置960中的传送单元。
安放在介质驱动器968上的记录介质例如可以是诸如磁盘、磁光盘、光盘和半导体存储器之类的任意的可读/可写可移除介质。另外,例如,记录介质可被固定安放在介质驱动器968上以形成诸如内置的硬盘驱动器或SSD(固态驱动器)之类的非便携存储单元。
控制器970包括诸如CPU之类的处理器和诸如RAM和ROM之类的存储器。存储器存储由CPU执行的程序、程序数据等等。存储在存储器中的程序例如在成像装置960启动时被CPU读取以被执行。CPU通过执行程序根据例如从用户界面971输入的操作信号来控制成像装置960的操作。
用户界面971连接到控制器970。用户界面971例如包括供用户操作成像装置960的按钮、开关等等。用户界面971经由组件检测用户的操作以生成操作信号并将所生成的操作信号输出到控制器970。
在以这种方式配置的成像装置960中,图像处理器964具有根据上述实施例的图像编码装置和图像解码装置的功能。因此,当在成像装置960中对图像编码和解码时,可以提高编码效率。
在本说明书中,描述了如下示例:诸如预测模式、预测运动向量的码号、差分运动向量信息和差分量化参数信息之类的各种类型的信息被复用到编码流中并被从编码侧传送到解码侧。然而,传送这些信息项的方法不限于此示例。例如,这些信息项可作为与编码比特流相关联的单独数据而不是通过被复用于编码比特流中来被传送或记录。这里,术语“关联”指的是比特流中包括的图像(或者图像的一部分,例如片和块)和与图像相对应的信息可在解码时与彼此链接。也就是说,该信息可在不同于图像(或比特流)的传送线路上传送。另外,该信息可记录在不同于图像(或比特流)的另一记录介质(或同一记录介质的另一记录区域)上。此外,信息和图像(或比特流)例如可以以诸如多个帧、一个帧或者帧的一部分之类的任选的单位与彼此相关联。
虽然已参考附图详细描述了本公开的优选实施例,但本公开并不限于这些实施例。本领域技术人员将容易领会到,在不脱离如权利要求中限定的技术精神的情况下,可对实施例进行各种修改和变化。因此,所有这种修改和变化都打算被包括在如权利要求中限定的本公开的范围内。
本技术可采取以下配置。
(1)一种图像处理装置,包括:预测运动向量生成单元,其利用位于当前区域周围的周边区域的运动向量生成在对当前区域的运动向量解码时使用的预测运动向量;预测量化参数生成单元,其根据由所述预测运动向量生成单元生成的周边区域的预测运动向量的预测方法生成在对当前区域的量化参数解码时使用的预测量化参数;以及参数解码单元,其利用由所述预测运动向量生成单元生成的当前区域的预测运动向量来对当前区域的运动向量解码并且利用由所述预测量化参数生成单元生成的当前区域的预测量化参数来对当前区域的量化参数解码。
(2)根据(1)所述的图像处理装置,其中,所述预测量化参数生成单元依据周边区域的预测运动向量的预测方法是空间预测还是时间预测来生成当前区域的预测量化参数。
(3)根据(1)或(2)所述的图像处理装置,其中,所述预测量化参数生成单元在周边区域的预测运动向量的预测方法是空间预测时依据对于空间预测参考的参考区域的位置是上方还是左侧来生成当前区域的预测量化参数。
(4)根据(1)至(3)的任何一项所述的图像处理装置,其中,所述预测量化参数生成单元利用根据与预测当前区域的预测运动向量的预测方法相同的预测方法生成的周边区域的预测量化参数来生成当前区域的预测量化参数。
(5)根据(1)至(4)的任何一项所述的图像处理装置,其中,当区域由多个子区域构成时,所述预测量化参数生成单元利用周边区域的位置与位于当前区域左上角的左上子区域邻接的子区域的预测运动向量来生成当前区域的预测量化参数作为邻接区域的对象。
(6)根据(1)至(4)的任何一项所述的图像处理装置,其中,当区域由多个子区域构成时,所述预测量化参数生成单元利用周边区域的在当前区域上方邻接位置处的上方子区域的预测运动向量和周边区域的在当前区域左侧邻接位置处的左侧子区域的预测运动向量来生成当前区域的预测量化参数作为邻接区域的对象。
(7)根据(1)至(6)的任何一项所述的图像处理装置,其中,当对周边区域应用双预测式预测时,所述预测量化参数生成单元根据周边区域的关于List0预测的预测运动向量的预测方法来生成当前区域的预测量化参数。
(8)根据(1)至(6)的任何一项所述的图像处理装置,其中,当对周边区域应用双预测式预测时,所述预测量化参数生成单元在当前图片未被重排序时根据周边区域的关于List0预测的预测运动向量的预测方法来生成当前区域的预测量化参数,并且在当前图片被重排序时根据周边区域的关于List1预测的预测运动向量的预测方法来生成当前区域的预测量化参数。
(9)根据(1)至(6)的任何一项所述的图像处理装置,其中,当对周边区域应用双预测式预测时,所述预测量化参数生成单元根据周边区域的与时间轴上的更近距离的预测有关的预测运动向量的预测方法来生成当前区域的预测量化参数。
(10)根据(1)至(6)的任何一项所述的图像处理装置,其中,所述预测量化参数生成单元根据周边区域的预测运动向量的预测方向和当前区域的预测运动向量的预测方向来生成当前区域的预测量化参数。
(11)根据(1)至(6)的任何一项所述的图像处理装置,还包括:解码单元,其利用由所述参数解码单元解码出的运动向量和量化参数来对比特流进行解码。
(12)根据(1)至(6)的任何一项所述的图像处理装置,其中,比特流是以具有层次结构的单位来编码的,并且所述解码单元以具有层次结构的单位来对比特流解码。
(13)一种图像处理方法,用于使得图像处理装置执行:利用位于当前区域周围的周边区域的运动向量生成在对当前区域的运动向量解码时使用的预测运动向量;根据所生成的周边区域的预测运动向量的预测方法生成在对当前区域的量化参数解码时使用的预测量化参数;以及利用所生成的当前区域的预测运动向量来对当前区域的运动向量解码并且利用所生成的当前区域的预测量化参数来对当前区域的量化参数解码。
(14)一种图像处理装置,包括:预测运动向量生成单元,其利用位于当前区域周围的周边区域的运动向量生成在对当前区域的运动向量编码时使用的预测运动向量;预测量化参数生成单元,其根据由所述预测运动向量生成单元生成的周边区域的预测运动向量的预测方法生成在对当前区域的量化参数编码时使用的预测量化参数;以及参数编码单元,其利用由所述预测运动向量生成单元生成的当前区域的预测运动向量来对当前区域的运动向量编码并且利用由所述预测量化参数生成单元生成的当前区域的预测量化参数来对当前区域的量化参数编码。
(15)根据(14)所述的图像处理装置,其中,所述预测量化参数生成单元依据周边区域的预测运动向量的预测方法是空间预测还是时间预测来生成当前区域的预测量化参数。
(16)根据(14)或(15)所述的图像处理装置,其中,所述预测量化参数生成单元利用根据与预测当前区域的预测运动向量的预测方法相同的预测方法生成的周边区域的预测量化参数来生成当前区域的预测量化参数。
(17)根据(12)至(15)的任何一项所述的图像处理装置,其中,所述预测量化参数生成单元根据周边区域的预测运动向量的预测方向和当前区域的预测运动向量的预测方向来生成对象区域的预测量化参数。
(18)根据(14)至(17)的任何一项所述的图像处理装置,还包括:编码单元,其利用当前区域的运动向量和当前区域的量化参数来对图像编码以生成比特流;以及传送单元,其把经所述参数编码单元编码的运动向量和量化参数与由所述编码单元生成的比特流一起传送。
(19)根据(18)所述的图像处理装置,其中,比特流是以具有层次结构的单位来编码的,并且所述编码单元以具有层次结构的单位来对图像编码以生成比特流。
(20)一种图像处理方法,用于使得图像处理装置执行:利用位于当前区域周围的周边区域的运动向量生成在对当前区域的运动向量编码时使用的预测运动向量;根据所生成的周边区域的预测运动向量的预测方法生成在对当前区域的量化参数编码时使用的预测量化参数;以及利用所生成的当前区域的预测运动向量来对当前区域的运动向量编码并且利用所生成的当前区域的预测量化参数来对对象区域的量化参数编码。
附图标记列表
100:图像编码装置
105:量化单元
106:无损编码单元
115:运动预测/补偿单元
121:运动向量编码单元
122:区域判定单元
151:邻接运动向量缓冲器
152:候选预测运动向量生成单元
153:成本函数值计算单元
154:最优预测运动向量确定单元
161:区域决定单元
162:邻接预测运动向量缓冲器
171:量化器
172:差分QP生成单元
173:邻接QP缓冲器
174:预测QP生成单元
200:图像解码装置
202:无损解码单元
203:逆量化单元
212:运动预测/补偿单元
221:运动向量解码单元
222:区域判定单元
251:预测运动向量信息缓冲器
252:差分运动向量信息缓冲器
253:预测运动向量重构单元
254:运动向量重构单元
255:邻接运动向量缓冲器
261:区域决定单元
262:邻接预测运动向量缓冲器
271:预测QP生成单元
272:邻接QP缓冲器
273:差分QP缓冲器
274:当前QP重构单元
275:逆量化器

Claims (20)

1.一种图像处理装置,包括:
预测运动向量生成单元,其利用位于当前区域周围的周边区域的运动向量生成在对当前区域的运动向量解码时使用的预测运动向量;
预测量化参数生成单元,其根据由所述预测运动向量生成单元生成的周边区域的预测运动向量的预测方法生成在对当前区域的量化参数解码时使用的预测量化参数;以及
参数解码单元,其利用由所述预测运动向量生成单元生成的当前区域的预测运动向量来对当前区域的运动向量解码并且利用由所述预测量化参数生成单元生成的当前区域的预测量化参数来对当前区域的量化参数解码。
2.根据权利要求1所述的图像处理装置,其中
所述预测量化参数生成单元依据周边区域的预测运动向量的预测方法是空间预测还是时间预测来生成当前区域的预测量化参数。
3.根据权利要求2所述的图像处理装置,其中
所述预测量化参数生成单元在周边区域的预测运动向量的预测方法是空间预测时依据对于空间预测参考的参考区域的位置是上方还是左侧来生成当前区域的预测量化参数。
4.根据权利要求2所述的图像处理装置,其中
所述预测量化参数生成单元利用根据与预测当前区域的预测运动向量的预测方法相同的预测方法生成的周边区域的预测量化参数来生成当前区域的预测量化参数。
5.根据权利要求2所述的图像处理装置,其中
当区域由多个子区域构成时,所述预测量化参数生成单元以周边区域为对象利用周边区域的位置与位于当前区域左上角的左上子区域邻接的子区域的预测运动向量来生成当前区域的预测量化参数。
6.根据权利要求2所述的图像处理装置,其中
当区域由多个子区域构成时,所述预测量化参数生成单元以周边区域为对象利用周边区域的在当前区域上方邻接位置处的上方子区域的预测运动向量和周边区域的在当前区域左侧邻接位置处的左侧子区域的预测运动向量来生成当前区域的预测量化参数。
7.根据权利要求2所述的图像处理装置,其中
当对周边区域应用双预测式预测时,所述预测量化参数生成单元根据周边区域的关于List0预测的预测运动向量的预测方法来生成当前区域的预测量化参数。
8.根据权利要求2所述的图像处理装置,其中
当对周边区域应用双预测式预测时,所述预测量化参数生成单元在当前图片未被重排序时根据周边区域的关于List0预测的预测运动向量的预测方法来生成当前区域的预测量化参数,并且在当前图片被重排序时根据周边区域的关于List1预测的预测运动向量的预测方法来生成当前区域的预测量化参数。
9.根据权利要求2所述的图像处理装置,其中
当对周边区域应用双预测式预测时,所述预测量化参数生成单元根据周边区域的关于时间轴上的较近距离的预测的预测运动向量的预测方法来生成当前区域的预测量化参数。
10.根据权利要求2所述的图像处理装置,其中
所述预测量化参数生成单元根据周边区域的预测运动向量的预测方向和当前区域的预测运动向量的预测方向来生成当前区域的预测量化参数。
11.根据权利要求1所述的图像处理装置,还包括:
解码单元,其利用由所述参数解码单元解码出的运动向量和量化参数来对比特流进行解码。
12.根据权利要求11所述的图像处理装置,其中
所述比特流是以具有层次结构的单位来编码的,并且所述解码单元以具有层次结构的单位来对比特流解码。
13.一种图像处理方法,用于使得图像处理装置执行:
利用位于当前区域周围的周边区域的运动向量生成在对当前区域的运动向量解码时使用的预测运动向量;
根据所生成的周边区域的预测运动向量的预测方法生成在对当前区域的量化参数解码时使用的预测量化参数;以及
利用所生成的当前区域的预测运动向量来对当前区域的运动向量解码并且利用所生成的当前区域的预测量化参数来对当前区域的量化参数解码。
14.一种图像处理装置,包括:
预测运动向量生成单元,其利用位于当前区域周围的周边区域的运动向量生成在对当前区域的运动向量编码时使用的预测运动向量;
预测量化参数生成单元,其根据由所述预测运动向量生成单元生成的周边区域的预测运动向量的预测方法生成在对当前区域的量化参数编码时使用的预测量化参数;以及
参数编码单元,其利用由所述预测运动向量生成单元生成的当前区域的预测运动向量来对当前区域的运动向量编码并且利用由所述预测量化参数生成单元生成的当前区域的预测量化参数来对当前区域的量化参数编码。
15.根据权利要求14所述的图像处理装置,其中
所述预测量化参数生成单元依据周边区域的预测运动向量的预测方法是空间预测还是时间预测来生成当前区域的预测量化参数。
16.根据权利要求15所述的图像处理装置,其中
所述预测量化参数生成单元利用根据与预测当前区域的预测运动向量的预测方法相同的预测方法生成的周边区域的预测量化参数来生成当前区域的预测量化参数。
17.根据权利要求15所述的图像处理装置,其中
所述预测量化参数生成单元根据周边区域的预测运动向量的预测方向和对象区域的预测运动向量的预测方向来生成对象区域的预测量化参数。
18.根据权利要求14所述的图像处理装置,还包括:
编码单元,其利用当前区域的运动向量和当前区域的量化参数来对图像编码以生成比特流;以及
传送单元,其把经所述参数编码单元编码的运动向量和量化参数与由所述编码单元生成的比特流一起传送。
19.根据权利要求18所述的图像处理装置,其中
所述编码单元以具有层次结构的单位来对图像编码以生成比特流。
20.一种图像处理方法,用于使得图像处理装置执行:
利用位于当前区域周围的周边区域的运动向量生成在对当前区域的运动向量编码时使用的预测运动向量;
根据所生成的周边区域的预测运动向量的预测方法生成在对当前区域的量化参数编码时使用的预测量化参数;以及
利用所生成的当前区域的预测运动向量来对当前区域的运动向量编码并且利用所生成的当前区域的预测量化参数来对对象区域的量化参数编码。
CN201280048981.6A 2011-10-14 2012-10-05 图像处理装置和方法 Pending CN103843348A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011227023 2011-10-14
JP2011-227023 2011-10-14
PCT/JP2012/075922 WO2013054751A1 (ja) 2011-10-14 2012-10-05 画像処理装置および方法

Publications (1)

Publication Number Publication Date
CN103843348A true CN103843348A (zh) 2014-06-04

Family

ID=48081806

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280048981.6A Pending CN103843348A (zh) 2011-10-14 2012-10-05 图像处理装置和方法

Country Status (4)

Country Link
US (1) US20140233639A1 (zh)
JP (1) JPWO2013054751A1 (zh)
CN (1) CN103843348A (zh)
WO (1) WO2013054751A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105898303A (zh) * 2015-12-24 2016-08-24 乐视云计算有限公司 码率控制方法及装置
CN113242448A (zh) * 2015-06-02 2021-08-10 索尼公司 发送装置和方法、媒体处理装置和方法以及接收装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7983343B2 (en) * 2006-01-12 2011-07-19 Lsi Corporation Context adaptive binary arithmetic decoding for high definition video
CA2681025C (en) * 2007-03-20 2015-10-13 Fujitsu Limited Video encoding and decoding apparatus and method using quantization in sub-blocks
US20110194613A1 (en) * 2010-02-11 2011-08-11 Qualcomm Incorporated Video coding with large macroblocks

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113242448A (zh) * 2015-06-02 2021-08-10 索尼公司 发送装置和方法、媒体处理装置和方法以及接收装置
CN113242448B (zh) * 2015-06-02 2023-07-14 索尼公司 发送装置和方法、媒体处理装置和方法以及接收装置
CN105898303A (zh) * 2015-12-24 2016-08-24 乐视云计算有限公司 码率控制方法及装置

Also Published As

Publication number Publication date
JPWO2013054751A1 (ja) 2015-03-30
US20140233639A1 (en) 2014-08-21
WO2013054751A1 (ja) 2013-04-18

Similar Documents

Publication Publication Date Title
CN109644272B (zh) 用于建构候选列表的几何型优先级
JP5979405B2 (ja) 画像処理装置および方法
CN107295346B (zh) 图像处理设备和方法
EP2806636A1 (en) Image processing device and method
CN103891285A (zh) 图像处理装置和方法
CN103444173B (zh) 图像处理设备和方法
CN103907352B (zh) 图像处理设备和方法
CN103548355A (zh) 图像处理装置及方法
CN103907353A (zh) 图像处理设备和方法
CN103636219A (zh) 图像处理装置和方法
CN103597836A (zh) 图像处理设备和方法
CN114073079A (zh) 带有运动信息采集缓冲器的运动矢量预测
CN103843348A (zh) 图像处理装置和方法
CN103891286A (zh) 图像处理装置和方法
CN103959784A (zh) 图像处理装置和方法
CN103518373B (zh) 图像处理装置和方法
JP2013012860A (ja) 画像処理装置および方法
JP2016201831A (ja) 画像処理装置および方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140604