CN107257483A - 运动图像编码方法、运动图像编码装置 - Google Patents

运动图像编码方法、运动图像编码装置 Download PDF

Info

Publication number
CN107257483A
CN107257483A CN201710520606.1A CN201710520606A CN107257483A CN 107257483 A CN107257483 A CN 107257483A CN 201710520606 A CN201710520606 A CN 201710520606A CN 107257483 A CN107257483 A CN 107257483A
Authority
CN
China
Prior art keywords
predicted motion
motion vectors
motion vector
vectors candidates
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710520606.1A
Other languages
English (en)
Other versions
CN107257483B (zh
Inventor
杉尾敏康
西孝启
柴原阳司
谷川京子
笹井寿郎
松延彻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Patent Trust Inc
Original Assignee
Sun Patent Trust Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Patent Trust Inc filed Critical Sun Patent Trust Inc
Publication of CN107257483A publication Critical patent/CN107257483A/zh
Application granted granted Critical
Publication of CN107257483B publication Critical patent/CN107257483B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/521Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction

Abstract

运动图像编码装置(100)具备:预测运动矢量候选计算部(114),计算预测运动矢量候选及预测运动矢量候选数;帧间预测控制部(111),选择最优的预测运动矢量候选;可变长编码部(116),将预测运动矢量候选数设定为预测运动矢量候选列表尺寸,对在运动矢量编码中使用的预测运动矢量索引分配与预测运动矢量候选列表尺寸相对应的比特序列,进行可变长编码。

Description

运动图像编码方法、运动图像编码装置
本申请是申请日为2012年5月29日、申请号为201280024467.9、名称为“运动图像编码方法、运动图像编码装置、运动图像解码方法、运动图像解码装置及运动图像编码解码装置”的中国专利申请的分案申请。
技术领域
本发明涉及运动图像编码方法及运动图像解码方法。
在运动图像编码处理中,一般利用运动图像具有的空间方向及时间方向的冗余性进行信息量的压缩。这里,一般作为利用空间方向的冗余性的方法而使用向频域的变换。此外,作为利用时间方向的冗余性的方法,使用图片间预测(以后称作“帧间(inter)预测”)编码处理。在帧间预测编码处理中,在将某个图片(picture)编码时,使用相对于编码对象图片在显示时间顺序上处于前方或后方的已编码的图片作为参照图片。并且,通过相对于该参照图片的编码对象图片的运动检测,导出运动矢量。并且,通过计算基于导出的运动矢量进行运动补偿而得到的预测图像数据与编码对象图片的图像数据之间的差分,将时间方向的冗余性去除(例如,参照非专利文献1)。这里,在运动检测中,计算编码图片内的编码对象块与参照图片内的块之间的差分值,决定差分值最小的参照图片内的块作为参照块。并且,使用编码对象块和参照块来检测运动矢量。
现有技术文献
非专利文献
非专利文献1:ITU-T Recommendation H.264“Advanced video coding forgeneric audio visual services”,2010年3月
非专利文献2:JCT-VC,“WD3:Working Draft3of High-Efficiency VideoCoding”,JCTVC-E603,March 2011.
发明概要
发明要解决的问题
但是,在上述以往的技术中,在使用帧间预测的运动图像编码及解码中,希望使编码效率提高。
发明内容
所以,本发明的目的是提供一种在使用帧间预测的运动图像编码及解码中能够使编码效率提高的运动图像编码方法及运动图像解码方法。
用于解决问题的手段
有关本发明的一技术方案的运动图像编码方法,将编码对象块编码,其特征在于,包括如下步骤:确定最大候选数;导出具有根据在第1块的编码中使用的第1运动矢量而导出的第1预测运动矢量的1个以上的第1候选,以使得上述第1候选的总数不超过上述最大候选数;判断上述第1候选的总数是否比上述最大候选数小;在上述第1候选的总数比上述最大候选数小的情况下,导出具有作为零矢量的第2预测运动矢量的第2候选;将与具有预测运动矢量的候选相对应的索引编码;以及生成包含编码后的上述索引的比特流,上述最大候选数被用于上述索引的编码;上述候选是包含上述1个以上的第1候选及上述第2候选在内的多个候选中的一个。
例如,也可以是,在上述运动图像编码方法中,上述编码对象块的运动矢量是上述编码对象块的差分运动矢量与上述预测运动矢量之和。
例如,也可以是,在上述运动图像编码方法中,上述第1预测运动矢量与上述第1运动矢量一致。
例如,也可以是,在上述运动图像编码方法中,上述最大候选数根据标准预先确定。
有关本发明的一技术方案的运动图像编码装置,将编码对象块编码,其特征在于,具备:确定器,确定最大候选数;第1导出器,导出具有根据在第1块的编码中使用的第1运动矢量而导出的第1预测运动矢量的1个以上的第1候选,以使得上述第1候选的总数不超过上述最大候选数;判断器,判断上述第1候选的总数是否比上述最大候选数小;第2导出器,在上述第1候选的总数比上述最大候选数小的情况下,导出具有作为零矢量的第2预测运动矢量的第2候选;编码器,将与具有预测运动矢量的候选相对应的索引编码;以及生成器,生成包含编码后的上述索引的比特流,上述最大候选数被用于上述索引的编码;上述候选是包含上述1个以上的第1候选及上述第2候选在内的多个候选中的一个。
有关本发明的一技术方案的运动图像编码方法,是计算在将编码对象块的运动矢量编码时使用的预测运动矢量、通过将上述编码对象块编码而生成比特流的运动图像编码方法,包括:第1导出步骤,基于在与编码对象块在空间或时间上邻接的块的编码中使用的运动矢量,导出第1预测运动矢量候选;第2导出步骤,导出具有预先设定的矢量作为运动矢量的第2预测运动矢量候选;选择步骤,从上述第1预测运动矢量候选及上述第2预测运动矢量候选中选择在上述编码对象块的上述运动矢量的编码中使用的上述预测运动矢量;编码步骤,将用来确定上述预测运动矢量的索引向上述比特流附加。
另外,这些全面的或具体的形态也可以通过系统、方法、集成电路、计算机程序或计算机可读取的CD-ROM(Compact Disc Read Only Memory)等的记录介质实现,也可以通过系统、方法、集成电路、计算机程序及记录介质的任意的组合来实现。
发明效果
根据本发明的一技术方案,能够使使用帧间预测的运动图像编码及解码的编码效率提高。
附图说明
图1A是用来说明B图片的参照图片列表的一例的图。
图1B是表示B图片的预测方向0的参照图片列表的一例的图。
图1C是表示B图片的预测方向1的参照图片列表的一例的图。
图2是用来说明时间预测运动矢量模式的运动矢量的图。
图3是表示在预测运动矢量指定模式中使用的邻接块的运动矢量的一例的图。
图4是用来说明预测方向0的预测运动矢量候选列表的一例的图。
图5是用来说明预测方向1的预测运动矢量候选列表的一例的图。
图6是表示向预测运动矢量索引的比特序列的分配的一例的图。
图7是表示使用预测运动矢量指定模式的情况下的编码处理的一例的流程图。
图8A是表示预测运动矢量的计算例的图。
图8B是表示预测运动矢量的计算例的图。
图9是表示使用预测运动矢量指定模式将运动图像编码的运动图像编码装置的结构的一例的框图。
图10是表示使用预测运动矢量指定模式的情况下的解码处理的一例的流程图。
图11是表示将使用预测运动矢量指定模式编码的运动图像解码的运动图像解码装置的结构的一例的框图。
图12是表示将预测运动矢量索引向比特流附加时的语法的图。
图13是表示有关实施方式1的运动图像编码装置的结构的框图。
图14是表示有关实施方式1的运动图像编码装置的处理动作的流程图。
图15是表示实施方式1的预测方向0的预测运动矢量候选列表的一例的图。
图16是表示实施方式1的预测方向1的预测运动矢量候选列表的一例的图。
图17是表示实施方式1的预测运动矢量候选及预测运动矢量候选列表尺寸的计算处理的流程图。
图18是表示实施方式1的可预测候选的判断处理的流程图。
图19是表示实施方式1的zero候选的追加处理的流程图。
图20是表示实施方式1的关于预测运动矢量候选的选择的处理的流程图。
图21是用来说明预测方向0的预测运动矢量候选列表的一例的图。
图22是表示有关实施方式2的运动图像编码装置的结构的框图。
图23是表示有关实施方式2的运动图像编码装置的处理动作的流程图。
图24是表示有关实施方式3的运动图像解码装置的结构的框图。
图25是表示有关实施方式3的运动图像解码装置的处理动作的流程图。
图26是表示有关实施方式4的运动图像解码装置的结构的框图。
图27是表示有关实施方式4的运动图像解码装置的处理动作的流程图。
图28是表示有关实施方式5的运动图像编码装置的结构的框图。
图29是表示有关实施方式5的运动图像编码装置的处理动作的流程图。
图30是表示实施方式5的预测方向0的预测运动矢量候选列表的一例的图。
图31是表示实施方式5的预测方向1的预测运动矢量候选列表的一例的图。
图32是表示实施方式5的预测运动矢量候选及预测运动矢量候选列表尺寸的计算处理的流程图。
图33是表示实施方式5的可预测候选数的更新处理的流程图。
图34是表示实施方式5的新候选的追加处理的流程图。
图35是表示实施方式5的关于预测运动矢量候选的选择的处理的流程图。
图36是表示有关实施方式6的运动图像编码装置的结构的框图。
图37是表示有关实施方式6的运动图像编码装置的处理动作的流程图。
图38是表示有关实施方式7的运动图像解码装置的结构的框图。
图39是表示有关实施方式7的运动图像解码装置的处理动作的流程图。
图40是表示实施方式7的可预测候选数的计算处理的流程图。
图41是表示实施方式7的预测运动矢量候选的计算处理的流程图。
图42是表示将预测运动矢量索引向比特流附加时的语法的一例的图。
图43是表示将预测运动矢量候选列表尺寸固定为预测运动矢量候选数的最大值的情况下的语法的一例的图。
图44是表示有关实施方式8的运动图像解码装置的结构的框图。
图45是表示有关实施方式8的运动图像解码装置的处理动作的流程图。
图46是实现内容分发服务的内容供给系统的整体结构图。
图47是数字广播用系统的整体结构图。
图48是表示电视机的结构例的模块图。
图49是表示对作为光盘的记录介质进行信息的读写的信息再现/记录部的结构例的模块图。
图50是表示作为光盘的记录介质的构造例的图。
图51A是表示便携电话的一例的图。
图51B是表示便携电话的结构例的模块图。
图52是表示复用数据的结构的图。
图53是示意地表示各流在复用数据中怎样被复用的图。
图54是更详细地表示在PES包序列中视频流怎样被保存的图。
图55是表示复用数据的TS包和源包的构造的图。
图56是表示PMT的数据结构的图。
图57是表示复用数据信息的内部结构的图。
图58是表示流属性信息的内部结构的图。
图59是表示识别影像数据的步骤的图。
图60是表示实现各实施方式的运动图像编码方法及运动图像解码方法的集成电路的结构例的模块图。
图61是表示切换驱动频率的结构的图。
图62是表示识别影像数据、切换驱动频率的步骤的图。
图63是表示将影像数据的标准与驱动频率建立了对应的查找表的一例的图。
图64A是表示将信号处理部的模块共用的结构的一例的图。
图64B是表示将信号处理部的模块共用的结构的另一例的图。
具体实施方式
(作为本发明的基础的认识)
已经标准化的称作H.264的运动图像编码方式中,为了信息量的压缩,使用I图片、P图片、B图片的3种图片类型。
I图片并不是通过帧间预测编码处理而被编码的。即,I图片是通过图片内预测(以后,称作“帧内(intra)预测”)编码处理而被编码的。P图片参照在显示时间顺序上处于编码对象图片的前方或后方的已经编码的1个图片进行帧间预测编码。B图片参照在显示时间顺序上处于编码对象图片的前方或后方的已经编码的两个图片进行帧间预测编码。
在帧间预测编码中,生成用来确定参照图片的参照图片列表。参照图片列表是对在帧间预测中参照的已编码的参照图片分配了参照图片索引的列表。例如,在B图片中,由于能够参照两个图片进行编码,所以生成两个参照图片列表(L0,L1)。
图1A是用来说明B图片的参照图片列表的一例的图。图1B表示双向预测的预测方向0的参照图片列表0(L0)的一例。这里,在参照图片列表0中,参照图片索引0的值0被分配给显示顺序2的参照图片0。此外,参照图片索引0的值1被分配给显示顺序1的参照图片1。此外,参照图片索引0的值2被分配给显示顺序0的参照图片2。即,相对于编码对象图片而言显示顺序在时间上越接近的参照图片,就被分配具有越小的值的参照图片索引。
另一方面,图1C表示双向预测中的预测方向1的参照图片列表1(L1)的一例。这里,在参照图片列表1中,参照图片索引1的值0被分配给显示顺序1的参照图片1。此外,参照图片索引1的值1被分配给显示顺序2的参照图片0。此外,参照图片索引2的值2被分配给显示顺序0的参照图片2。
这样,能够对各参照图片分配按照每个预测方向而不同的参照图片索引的值(图1A的参照图片0、1),或者分配相同的参照图片索引的值(图1A的参照图片2)。
此外,在称作H.264的运动图像编码方式(非专利文献1)中,作为B图片的各编码对象块的帧间预测的编码模式而使用运动矢量检测模式。在运动矢量检测模式中,将预测图像数据及编码对象块的图像数据的差分值、和在预测图像数据生成中使用的运动矢量编码。此外,在运动矢量检测模式中,作为预测方向而能够选择双向预测和单向预测。在双向预测中,参照处于编码对象图片的前方或后方的已经编码的两个图片而生成预测图像。在单向预测中,参照处于前方或后方的已经编码的1个图片而生成预测图像。
此外,在称作H.264的运动图像编码方式中,在B图片的编码中,在导出运动矢量时,能够选择称作时间预测运动矢量模式的编码模式。使用图2说明时间预测运动矢量模式中的帧间预测编码方法。
图2是用来说明时间预测运动矢量模式的运动矢量的图。具体而言,图2表示将图片B2的块a用时间预测运动矢量模式编码的情况。
这里,利用在作为处于图片B2的后方的参照图片的图片P3内的、处于与块a相同位置的块b(以下,称作“co-located(相同位置)块”)的编码中使用的运动矢量vb。运动矢量vb是在参照图片P1将块b编码时使用的运动矢量。
使用与运动矢量vb平行的运动矢量,从作为前方参照图片的图片P1、和作为后方参照图片的图片P3,取得用于块a的两个参照块。并且,通过基于所取得的两个参照块进行双向预测,将块a编码。即,在将块a编码时使用的运动矢量对于图片P1是运动矢量va1,对于图片P3是运动矢量va2。
此外,作为对B图片或P图片中的各编码对象块的运动矢量进行编码的方法而研究了预测运动矢量指定模式(非专利文献2)。在预测运动矢量指定模式中,根据在编码对象块的邻接块的编码中使用的运动矢量生成预测运动矢量候选。并且,从预测运动矢量候选中选择预测运动矢量,进行编码对象块的运动矢量的编码。此时,将所选择的预测运动矢量的索引等附带到比特流中。由此,能够在解码时选择与在编码时使用的预测运动矢量相同的预测运动矢量。参照图3说明具体例。
图3是表示在预测运动矢量指定模式中使用的邻接块的运动矢量的一例的图。在图3中,邻接块A是编码对象块的左邻接的已编码块。邻接块B是编码对象块的上邻接的已编码块。邻接块C是编码对象块的右上邻接的已编码块。邻接块D是编码对象块的左下邻接的已编码块。
此外,在图3中,编码对象块是通过双向预测编码的块,并且作为运动检测等的结果具有预测方向0的运动矢量MvL0、作为相对于预测方向0的参照图片索引RefL0所表示的参照图片的运动矢量,具有预测方向1的运动矢量MvL1、作为相对于预测方向1的参照图片索引RefL1所表示的参照图片的运动矢量。这里,所谓MvL0,表示对通过参照图片列表0(L0)确定的参照图片进行参照的运动矢量。此外,所谓MvL1,表示对由参照图片列表1(L1)确定的参照图片进行参照的运动矢量。
此外,邻接块A是通过预测方向0的单向预测编码的块。邻接块A作为相对于预测方向0的参照图片索引RefL0_A所表示的参照图片的运动矢量,具有预测方向0的运动矢量MvL0_A。此外,邻接块B是通过预测方向1的单向预测编码的块。邻接块B作为相对于预测方向1的参照图片索引RefL1_B表示的参照图片的运动矢量而具有预测方向1的运动矢量MvL1_B。此外,邻接块C是通过帧内预测编码的块。此外,邻接块D是通过预测方向0的单向预测编码的块。邻接块D作为相对于预测方向0的参照图片索引RefL0_D表示的参照图片的运动矢量而具有预测方向0的运动矢量MvL0_D。
在这样的情况下,例如从根据邻接块A、B、C、D的运动矢量及使用co-located块求出的时间预测运动矢量模式的运动矢量而生产的预测运动矢量候选中,选择能够最有效地对编码对象块的运动矢量进行编码的预测运动矢量。并且,使表示所选择的预测运动矢量的预测运动矢量索引附带到比特流中。例如,在对编码对象块的预测方向0的运动矢量MvL0进行编码时,作为预测运动矢量选择了邻接块A的预测方向0的运动矢量MvL0_A情况下,如图4所示仅使表示使用了根据邻接块A生产的预测运动矢量候选的预测运动矢量索引的值“0”附带到比特流中。由此,能够削减编码对象块的预测方向0的运动矢量MvL0的信息量。
这里,图4是表示预测方向0的预测运动矢量候选列表的一例的图。此外,如图4所示,在预测运动矢量指定模式中,将不能进行预测运动矢量的生成的候选(以下,称作“不可预测候选”)或值与其他预测运动矢量候选一致的候选(以下,称作“重复候选”)从预测运动矢量候选中删除。这样,通过削减预测运动矢量候选数,削减向预测运动矢量索引分配的代码量。这里,不能进行预测运动矢量的生成,表示邻接块是(1)是通过帧内预测被编码的块、(2)是包括编码对象块的切片(slice)或图片边界外的块、或者(3)是还没有被编码的块等。
在图4的例子中,将邻接块C通过帧内预测编码。因此,预测运动矢量索引的值为“3”的预测候选是不可预测候选,被从预测运动矢量候选列表删除。此外,由于从邻接块D生成的预测方向0的预测运动矢量的值与从邻接块A生成的预测方向0的预测运动矢量一致,所以将预测运动矢量索引的值为“4”的预测候选从预测运动矢量候选列表中删除。结果,最终,预测方向0的预测运动矢量候选数为3,预测方向0的预测运动矢量候选列表的列表尺寸被设定为3。
此外,图5是表示预测方向1的预测运动矢量候选列表的一例的图。在图5所示的例子中,通过不可预测候选及重复候选的删除,最终预测方向1的预测运动矢量候选数成为2,预测方向1的预测运动矢量候选列表的列表尺寸被设定为2。
将预测运动矢量索引根据预测运动矢量候选列表尺寸的大小,如图6所示那样分配比特序列,进行可变长编码。此外,在预测运动矢量候选列表尺寸为1的情况下,不使预测运动矢量索引附带到比特流中,在解码侧推测为值0。这样,在预测运动矢量指定模式中,通过使向预测运动矢量索引分配的比特序列根据预测运动矢量候选列表尺寸的大小而变化,削减了代码量。
图7是表示使用预测运动矢量指定模式的情况下的编码处理的一例的流程图。
在步骤S1001中,根据邻接块及co-located块(以下,称作“预测块候选”),计算预测方向X的预测运动矢量候选。这里,X取“0”或“1”的值,分别表示预测方向0或预测方向1。预测方向X的预测运动矢量候选sMvLX使用预测块候选的运动矢量MvLX_N和参照图片索引RefLX_N及编码对象块的参照图片索引RefLX,通过以下的式子计算。
sMvLX=
MvLX_N×(POC(RefLX)-curPOC)/(POC(RefLX_N)-curPOC)…(式1)
这里,POC(RefLX)表示参照图片索引RefLX所表示的参照图片的显示顺序,POC(RefLX_N)表示参照图片索引RefLX_N所表示的参照图片的显示顺序,curPOC表示编码对象图片的显示顺序。另外,在预测块候选不具有预测方向X的运动矢量MvLX_N情况下,使用预测方向(1-X)的运动矢量MvL(1-X)_N和参照图片索引RefL(1-X)_N,通过式2计算预测运动矢量sMvLX。
sMvLX=
MvL(1-X)_N×(POC(RefLX)-curPOC)/(POC(RefL(1-X)_N)-curPOC)…(式2)
在图8A、图8B中是表示式1、式2的预测运动矢量的计算例的图。另外,如式1、式2所示,在POC(RefLX)与POC(RefLX_N)的值相同的情况下,即在参照相同的图片的情况下,能够将缩放(scaling)省略。
在步骤S1002中,从预测方向X的预测运动矢量候选中将重复候选及不可预测候选删除。在步骤S1003中,将删除处理后的预测运动矢量候选数设定为预测运动矢量候选列表尺寸。在步骤S1004中,决定在编码对象块的预测方向X的运动矢量编码中使用的预测运动矢量索引。在步骤S1005中,将所决定的预测运动矢量索引,使用由预测运动矢量候选列表尺寸决定的比特序列进行可变长编码。
图9是表示使用预测运动矢量指定模式将运动图像编码的运动图像编码装置1000的结构的一例的框图。
运动图像编码装置1000如图9所示,具备减法部1001、正交变换部1002、量化部1003、逆量化部1004、逆正交变换部1005、加法部1006,块存储器1007、帧存储器1008、帧内预测部1009、帧间预测部1010、帧间预测控制部1011、图片类型决定部1012、开关1013、预测运动矢量候选计算部1014、colPic存储器1015和可变长编码部1016。
在图9中,预测运动矢量候选计算部1014计算预测运动矢量候选。并且,预测运动矢量候选计算部1014将计算出的预测运动矢量候选数向可变长编码部1016发送。可变长编码部1016将预测运动矢量候选数设定为作为编码参数的预测运动矢量候选列表尺寸。并且,可变长编码部1016对在编码中使用的预测运动矢量索引分配与预测运动矢量候选列表尺寸对应的比特序列,进行可变长编码。
图10是表示使用预测运动矢量指定模式的情况下的解码处理的一例的流程图。
在步骤S2001中,根据邻接块及co-located块(预测块候选)计算预测方向X的预测运动矢量候选。在步骤S2002中,从预测运动矢量候选将重复候选及不可预测候选删除。在步骤S2003中,将删除处理后的预测运动矢量候选数设定为预测运动矢量候选列表尺寸。在步骤S2004中,根据比特流,将在解码对象块的解码中使用的预测运动矢量索引,使用预测运动矢量候选列表尺寸解码。在步骤S2005中,对解码后的预测运动矢量索引表示的预测运动矢量候选加上差分运动矢量来计算运动矢量,使用计算出的运动矢量生成预测图像,进行解码处理。
图11是表示将使用预测运动矢量指定模式编码的运动图像解码的运动图像解码装置的结构的一例的框图。
运动图像解码装置2000如图11所示,具备可变长解码部2001、逆量化部2002、逆正交变换部2003、加法部2004、块存储器2005、帧存储器2006、帧内预测部2007、帧间预测部2008、帧间预测控制部2009、开关2010、预测运动矢量候选计算部2011和colPic存储器2012。
在图11中,预测运动矢量候选计算部2011计算预测运动矢量候选。并且,预测运动矢量候选计算部2011将计算出的预测运动矢量候选数向可变长解码部2001发送。可变长解码部2001将预测运动矢量候选数设定为作为解码参数的预测运动矢量候选列表尺寸。并且,可变长解码部2001将包含在比特流中的预测运动矢量索引使用预测运动矢量候选列表尺寸解码。
图12是表示将预测运动矢量索引向比特流附加时的语法的图。在图12中,inter_pred_flag表示帧间预测的预测方向标志。mvp_idx表示预测运动矢量索引。NumMVPCand表示预测运动矢量候选列表尺寸。该NumMVPCand被设定有从预测运动矢量候选将不可预测候选及重复候选删除后的预测运动矢量候选数。
如以上这样,使用预测运动矢量指定模式将运动图像编码或解码。
但是,在上述预测运动矢量指定模式中,根据在编码对象块的邻接块等中使用的运动矢量,计算将编码对象块的运动矢量编码时的预测运动矢量的候选。由此,例如在邻接块是运动物体区域、编码对象块是静止区域的情况下,编码对象块的预测运动矢量候选受到运动物体区域的影响。因此,在预测运动矢量候选中不存在用来将值比较小的编码对象块的运动矢量有效率地编码的预测运动矢量,有编码效率下降的情况。
所以,本发明的目的是提供一种通过对预测运动矢量候选列表追加静止区域用的预测运动矢量,能够提高编码效率的运动图像编码方法。
所以,有关本发明的一技术方案的运动图像编码方法,计算在将编码对象块的运动矢量编码时使用的预测运动矢量,通过将上述编码对象块编码而生成比特流,其特征在于,包括:第1导出步骤,基于在与编码对象块在空间或时间上邻接的块的编码中使用的运动矢量,导出第1预测运动矢量候选;第2导出步骤,导出具有预先设定的矢量作为运动矢量的第2预测运动矢量候选;选择步骤,从上述第1预测运动矢量候选及上述第2预测运动矢量候选中,选择在上述编码对象块的上述运动矢量的编码中使用的上述预测运动矢量;以及编码步骤,将用来确定上述预测运动矢量的索引向上述比特流附加。
据此,能够将具有预先设定的矢量作为运动矢量的预测运动矢量候选作为第2预测运动矢量候选导出。因而,能够将例如具有静止区域用的运动矢量的预测运动矢量候选作为第2预测运动矢量候选导出。即,能够将具有预先设定的运动的编码对象块有效率地编码,能够使编码效率提高。
例如,上述预先设定的矢量也可以是零矢量。
据此,由于预先设定的矢量是零矢量,所以能够将具有静止区域用的运动矢量的预测运动矢量候选导出。因而,在编码对象块是静止区域的情况下,能够使编码效率提高。
例如,也可以是,上述运动图像编码方法还包括:决定步骤,决定预测运动矢量候选的最大数;以及判断步骤,判断所导出的上述第1预测运动矢量候选的数量是否比上述最大数小;在判断为上述第1预测运动矢量候选的数量比上述最大数小的情况下,在上述第2导出步骤中导出上述第2预测运动矢量候选。
据此,在判断为第1预测运动矢量候选比最大数小的情况下,能够导出第2预测运动矢量候选。因而,能够在不超过最大数的范围内使预测运动矢量候选的数量增加,能够使编码效率提高。
例如,也可以是,在上述编码步骤中,使用所决定的上述最大数将上述索引编码,将编码后的上述索引向上述比特流附加。
据此,能够将用来确定预测运动矢量候选的索引使用所决定的最大数编码。即,能够不依存于实际导出的预测运动矢量候选的数量而将索引编码。因而,即使是丢失了预测运动矢量候选的导出所需要的信息(例如,co-located块等的信息)的情况,在解码侧也能够将索引解码,能够使容错性提高。此外,在解码侧,能够不依存于实际导出的预测运动矢量候选的数量而将索引解码。即,在解码侧,能够不等待预测运动矢量候选的导出处理而进行索引的解码处理。即,能够生成能并行地进行预测运动矢量候选的导出处理和索引的解码处理的比特流。
例如,也可以是,在上述编码步骤中,还将表示所决定的上述最大数的信息向上述比特流附加。
据此,能够将表示所决定的最大数的信息附加到比特流中。因而,能够以适当的单位切换最大数,能够使编码效率提高。
例如,也可以是,在上述第1导出步骤中,将在与上述编码对象块在空间上邻接的块中的除了通过帧内预测而编码后的块、位于包含上述编码对象块的切片或图片的边界外的块和还没有被编码的块以外的块的编码中使用的运动矢量,作为上述第1预测运动矢量候选导出。
据此,为了得到预测运动矢量候选而能够从适当的块导出第1预测运动矢量候选。
例如,也可以是,在上述第1导出步骤中,将与已经导出了运动矢量的第1预测运动矢量候选不重复的预测运动矢量候选,作为上述第1预测运动矢量候选导出。
据此,能够将运动矢量与已经导出的第1预测运动矢量候选重复的预测运动矢量候选从第1预测运动矢量候选中排除。结果,能够使第2预测运动矢量候选的数量增加,能够增加能选择为预测运动矢量候选的运动矢量的种类。因而,能够使编码效率进一步提高。
例如,也可以是,上述运动图像编码方法还包括:切换步骤,将编码处理切换为依据第1标准的第1编码处理或依据第2标准的第2编码处理;以及附加步骤,将表示切换后的上述编码处理所依据的上述第1标准或上述第2标准的识别信息向上述比特流附加;在上述编码处理被切换为上述第1编码处理的情况下,作为上述第1编码处理,进行上述第1导出步骤、上述第2导出步骤、上述选择步骤和上述编码步骤。
据此,能够切换依据第1标准的第1编码处理和依据第2标准的第2编码处理,
此外,有关本发明的一技术方案的运动图像解码方法,计算在将比特流中包含的解码对象块的运动矢量解码时使用的预测运动矢量,将上述解码对象块解码,其特征在于,包括:第1导出步骤,基于在与解码对象块在空间或时间上邻接的块的解码中使用的运动矢量,导出第1预测运动矢量候选;第2导出步骤,导出具有预先设定的矢量作为运动矢量的第2预测运动矢量候选;取得步骤,从上述比特流中取得用来确定上述预测运动矢量候选的索引;以及选择步骤,基于所取得的上述索引,从上述第1预测运动矢量候选及上述第2预测运动矢量候选中,选择在将上述解码对象块解码时使用的预测运动矢量。
据此,能够将具有预先设定的矢量作为运动矢量的预测运动矢量候选作为第2预测运动矢量候选导出。因而,能够将例如具有静止区域用的运动矢量等的预测运动矢量候选作为第2预测运动矢量候选导出。即,能够将有效地编码了具有预先设定的运动的块的比特流适当地解码,能够将提高了编码效率的比特流适当地解码。
例如,上述预先设定的矢量也可以是零矢量。
据此,由于预先设定的矢量是零矢量,所以能够导出具有静止区域用的运动矢量的预测运动矢量候选。因而,能够将提高了编码效率的比特流适当地解码。
例如,也可以是,上述运动图像解码方法还包括:决定步骤,决定预测运动矢量候选的最大数;以及判断步骤,判断所导出的上述第1预测运动矢量候选的数量是否比上述最大数小;在判断为上述第1预测运动矢量候选数比上述最大数小的情况下,在上述第2导出步骤中导出上述第2预测运动矢量候选。
据此,在判断为第1预测运动矢量候选的数量比最大数小的情况下,能够导出第2预测运动矢量候选。因而,能够在不超过最大数的范围内使预测运动矢量候选的数量增加,能够将提高了编码效率的比特流适当地解码。
例如,也可以是,在上述取得步骤中,通过将附加在上述比特流中的编码后的上述索引使用所决定的上述最大数解码,取得上述索引。
据此,能够将用来确定预测运动矢量候选的索引使用所决定的最大数解码。即,能够不依存于实际导出的预测运动矢量候选的数量而将索引解码。因而,即使是丢失了预测运动矢量候选的导出所需要的信息(例如,co-located块等的信息)的情况,也能够将索引解码,能够使容错性提高。进而,能够不等待预测运动矢量候选的导出处理而进行索引的解码处理,能够并行地进行预测运动矢量候选的导出处理和索引的解码处理。
例如,也可以是,在上述决定步骤中,基于附加在上述比特流中的表示最大数的信息,决定上述最大数。
据此,能够基于附加在比特流中的信息决定最大数。因而,能够以适当的单位切换最大数而将编码的图像解码。
例如,也可以是,在上述第1导出步骤中,将在与上述解码对象块在空间上邻接的块中的除了通过帧内预测而解码后的块、位于包含上述解码对象块的切片或图片的边界外的块和还没有被解码的块以外的块的解码中使用的运动矢量,作为上述第1预测运动矢量候选导出。
据此,能够为了得到预测运动矢量候选而从适当的块导出第1预测运动矢量候选。
例如,也可以是,在上述第1导出步骤中,将与已经导出了运动矢量的第1预测运动矢量候选不重复的预测运动矢量候选,作为上述第1预测运动矢量候选导出。
据此,能够将运动矢量与已经导出的第1预测运动矢量候选重复的预测运动矢量候选从第1预测运动矢量候选中排除。结果,能够使第2预测运动矢量候选的数量增加,能够增加能选择为预测运动矢量候选的预测方向、运动矢量及参照图片索引的组合的种类。因而,能够将进一步提高了编码效率的比特流适当地解码。
例如,也可以是,上述运动图像解码方法还包括:切换步骤,根据附加在上述比特流中的表示第1标准或第2标准的识别信息,将解码处理切换为依据上述第1标准的第1解码处理或依据上述第2标准的第2解码处理;在上述解码处理被切换为第1解码处理的情况下,作为上述第1解码处理,进行上述第1导出步骤、上述第2导出步骤、上述取得步骤和上述选择步骤。
据此,能够切换依据第1标准的第1解码处理和依据第2标准的第2解码处理。
另外,这些全面的或具体的形态也可以通过系统、装置、集成电路、计算机程序或计算机可读取的CD-ROM等的记录介质实现,也可以通过系统、装置、集成电路、计算机程序及记录介质的任意的组合来实现。
以下,参照附图对有关本发明的一技术方案的图像编码装置及图像解码装置具体地说明。
另外,以下说明的实施方式都是表示本发明的一具体例的。在以下的实施方式中表示的数值、形状、材料、构成要素、构成要素的配置位置及连接形态、步骤、步骤的顺序等是一例,并不是限定本发明的意思。此外,关于以下的实施方式的构成要素中的、在表示最上位概念的独立权利要求中没有记载的构成要素,作为任意的构成要素进行说明。
(实施方式1)
图13是表示有关实施方式1的运动图像编码装置100的结构的框图。
运动图像编码装置100如图13所示,具备减法部101,正交变换部102,量化部103,逆量化部104,逆正交变换部105、加法部106、块存储器107、帧存储器108、帧内预测部109、帧间预测部110、帧间预测控制部111、图片类型决定部112、开关113、预测运动矢量候选计算部114、colPic存储器115及可变长编码部116。
减法部101通过按照每个块从输入图像序列中包含的输入图像数据减去预测图像数据而生成预测误差数据。正交变换部102对所生成的预测误差数据进行从图像域向频域的变换。量化部103对被变换为频域的预测误差数据进行量化处理。
逆量化部104对由量化部103量化处理后的预测误差数据进行逆量化处理。逆正交变换部105对逆量化处理后的预测误差数据进行从频域向图像域的变换。
加法部106通过按照每个编码对象块将预测图像数据与由逆正交变换部105逆量化处理后的预测误差数据相加而生成重建图像数据。在块存储器107中,以块单位保存重建图像数据。在帧存储器108中,以帧单位保存重建图像数据。
图片类型决定部112决定以I图片、B图片及P图片的哪个图片类型将输入图像数据编码。并且,图片类型决定部112生成图片类型的图片类型信息。帧内预测部109通过使用保存在块存储器107中的块单位的重建图像数据进行帧内预测,从而生成编码对象块的帧内预测图像数据。帧间预测部110通过使用保存在帧存储器108中的帧单位的重建图像数据、和用运动检测等导出的运动矢量进行帧间预测,生成编码对象块的帧间预测图像数据。
开关113在编码对象块被进行帧内预测编码的情况下,将由帧内预测部109生成的帧内预测图像数据作为编码对象块的预测图像数据向减法部101及加法部106输出。另一方面,开关113在编码对象块被进行帧间预测编码的情况下,将由帧间预测部110生成的帧间预测图像数据作为编码对象块的预测图像数据向减法部101及加法部106输出。
预测运动矢量候选计算部114使用编码对象块的邻接块的运动矢量等及保存在colPic存储器115中的co-located块的运动矢量等的colPic信息,导出预测运动矢量指定模式的合并块候选。并且,预测运动矢量候选计算部114用后述的方法计算预测运动矢量候选数。此外,预测运动矢量候选计算部114对导出的预测运动矢量候选分配预测运动矢量索引的值。并且,预测运动矢量候选计算部114将预测运动矢量候选和预测运动矢量索引向帧间预测控制部111发送。此外,预测运动矢量候选计算部114将计算出的预测运动矢量候选数向可变长编码部116发送。
帧间预测控制部111控制帧间预测部110,以便使用利用通过运动检测导出的运动矢量生成的帧间预测图像进行帧间预测编码。此外,帧间预测控制部111用后述的方法选择对在帧间预测编码中使用的运动矢量的编码最适合的预测运动矢量候选。并且,帧间预测控制部111将与所选择的预测运动矢量候选对应的预测运动矢量索引和预测的误差信息(差分运动矢量)向可变长编码部116发送。进而,帧间预测控制部111将包含编码对象块的运动矢量等的colPic信息向colPic存储器115转送。
可变长编码部116通过对量化处理后的预测误差数据、预测方向标志、图片类型信息及差分运动矢量进行可变长编码处理,从而生成比特流。此外,可变长编码部116将预测运动矢量候选数设定为预测运动矢量候选列表尺寸。并且,可变长编码部116对在运动矢量编码中使用的预测运动矢量索引,分配与预测运动矢量候选列表尺寸对应的比特序列,进行可变长编码。
图14是表示有关实施方式1的运动图像编码装置100的处理动作的流程图。
在步骤S101中,帧间预测控制部111通过运动检测决定编码对象块的预测方向、参照图片索引及运动矢量。这里,在运动检测中,例如计算编码图片内的编码对象块与参照图片内的块的差分值,将差分值最小的参照图片内的块决定为参照块。并且,使用根据编码对象块位置和参照块位置求出运动矢量的方法等,求出运动矢量。此外,帧间预测控制部111对预测方向0和预测方向1的参照图片分别进行运动检测,例如通过R-D优化模型的以下的式子等,对选择预测方向0、预测方向1、还是双向预测进行计算。
Cost=D+λ×R…(式3)
在式3中,D表示编码失真,使用用由某个运动矢量生成的预测图像将编码对象块编码及解码得到的像素值与编码对象块的原来的像素值的差分绝对值和等。此外,R表示产生代码量。使用为了将在预测图像生成中使用的运动矢量编码而需要的代码量等作为R。此外,λ是拉格朗日的未定乘数。
在步骤S102中,预测运动矢量候选计算部114根据编码对象块的邻接块及co-located块导出预测运动矢量候选。此外,预测运动矢量候选计算部114用后述的方法计算预测运动矢量候选列表尺寸。
例如,在图3那样的情况下,预测运动矢量候选计算部114作为编码对象块的预测运动矢量候选而选择例如邻接块A、B、C及D具有的运动矢量。进而,预测运动矢量候选计算部114将根据co-located块的运动矢量通过时间预测模式计算出的运动矢量等,计算为预测运动矢量候选。
预测运动矢量候选计算部114如图15(a)及图16(a)那样对预测方向0及预测方向1的预测运动矢量候选分配预测运动矢量索引。并且,预测运动矢量候选计算部114通过用后述的方法进行不可预测候选及重复候选的删除及zero候选,从而计算图15(b)及图16(b)那样的预测运动矢量候选列表及预测运动矢量候选列表尺寸。
预测运动矢量索引的值越小就被分配越短的代码。即,在预测运动矢量索引的值较小的情况下,预测运动矢量索引所需要的信息量变少。另一方面,如果预测运动矢量索引的值变大,则预测运动矢量索引所需要的信息量变大。因而,如果对成为精度更高的预测运动矢量的可能性较高的预测运动矢量候选分配值较小的预测运动矢量索引,则编码效率变高。
所以,预测运动矢量候选计算部114例如也可以将被选择为预测运动矢量的次数按照每个预测运动矢量候选来计测,对其次数较多的预测运动矢量候选分配值较小的预测运动矢量索引。具体而言,可以考虑确定在邻接块中选择的预测运动矢量,在对象块的编码时使对于所确定的预测运动矢量候选的预测运动矢量索引的值变小。
另外,在邻接块不具有运动矢量等的信息的情况下(是通过帧内预测编码的块的情况、是位于图片或切片的边界外等的块的情况、是还没有被编码的块等情况下),不能用作预测运动矢量候选。
在本实施方式中,将不能用作预测运动矢量候选称作不可预测候选。此外,将能够用作预测运动矢量候选称作可预测候选。此外,将在多个预测运动矢量候选中值与其他某个预测运动矢量一致的候选称作重复候选。
在图3的情况下,邻接块C由于是通过帧内预测编码的块,所以为不可预测候选。此外,根据邻接块D生成的预测方向0的预测运动矢量sMvL0_D的值与根据邻接块A生成的预测方向0的预测运动矢量MvL0_A一致,为重复候选。
在步骤S103中,帧间预测控制部111用后述的方法决定在预测方向X的运动矢量编码中使用的预测运动矢量索引的值。
在步骤S104中,可变长编码部116对在预测方向X的运动矢量编码中使用的预测运动矢量候选的预测运动矢量索引,分配与图6所示那样的预测运动矢量候选列表尺寸对应的比特序列,进行可变长编码。
在本实施方式中,如图15(a)及图16(a)那样,作为与邻接块A对应的预测运动矢量索引的值而被分配“0”。此外,作为与邻接块B对应的预测运动矢量索引的值而被分配“1”。此外,作为与co-located块对应的预测运动矢量索引的值而被分配“2”。此外,作为与邻接块C对应的预测运动矢量索引的值而被分配“3”。此外,作为与邻接块D对应的预测运动矢量索引的值而被分配“4”。
另外,预测运动矢量索引的值的分配方式并不一定限定于该例。例如,可变长编码部116在使用后述的方法追加了zero候选等情况下,也可以对原来的预测运动矢量候选分配较小的值,对zero候选分配较大的值。即,可变长编码部116也可以对原来的预测运动矢量候选优先分配较小的值的预测运动矢量块索引。
此外,预测运动矢量候选并不一定限定于邻接块A、B、C、D的位置。例如,也可以使用位于左下邻接块D的上方的邻接块等作为预测运动矢量候选。此外,并不需要一定使用全部的邻接块作为预测运动矢量候选。例如,也可以仅使用邻接块A、B作为预测运动矢量候选。或者,如果邻接块D是不可预测候选,则也可以使用邻接块A等、将邻接块依次扫描。
此外,在本实施方式中,在图14的步骤S104中,可变长编码部116将预测运动矢量索引附加到比特流中,但并不一定需要将预测运动矢量索引附加到比特流中。例如,可变长编码部116在预测运动矢量候选列表尺寸是1的情况下,也可以不将预测运动矢量索引向比特流附加。由此,能够削减预测运动矢量索引的信息量。
图17是表示图14的步骤S102的详细的处理的流程图。具体而言,图17表示计算预测运动矢量候选及预测运动矢量候选列表尺寸的方法。以下,对图17进行说明。
在步骤S111中,预测运动矢量候选计算部114用后述的方法判断预测块候选[N]是否是可预测候选。
这里,N是用来表示各预测块候选的索引值。在本实施方式中,N取0到4的值。具体而言,对预测块候选[0]分配图3的邻接块A。此外,对预测块候选[1]分配图3的邻接块B。此外,对预测块候选[2]分配co-located块。此外,对预测块候选[3]分配图3的邻接块C。此外,对预测块候选[4]分配图3的邻接块D。
在步骤S112中,预测运动矢量候选计算部114根据预测块候选[N],使用上述式1、式2计算预测方向X的预测运动矢量候选,向预测运动矢量候选列表追加。
在步骤S113中,预测运动矢量候选计算部114如图15及图16所示,从预测运动矢量候选列表中搜索不可预测候选及重复候选并删除。
在步骤S114中,预测运动矢量候选计算部114用后述的方法向预测运动矢量候选列表追加zero候选。这里,当追加zero候选时,预测运动矢量候选计算部114也可以进行预测运动矢量索引的值的再分配,以对原来就有的预测运动矢量候选优先分配较小的预测运动矢量索引。即,预测运动矢量候选计算部114也可以进行预测运动矢量索引的值的再分配,以对zero候选分配值较大的预测运动矢量索引。由此,能够削减预测运动矢量索引的代码量。
在步骤S115中,预测运动矢量候选计算部114将在步骤S114中追加zero候选后的预测运动矢量候选数设定为预测运动矢量候选列表尺寸。在图15及图16的例子中,通过后述的方法,将预测方向0的预测运动矢量候选数计算为“4”,对预测方向0的预测运动矢量候选列表尺寸设定“4”。此外,将预测方向1的预测运动矢量候选数计算为“3”,对预测方向1的预测运动矢量候选列表尺寸设定为“3”。
这样,在预测运动矢量候选数没有达到最大预测运动矢量候选数的情况下,预测运动矢量候选计算部114通过追加zero候选,能够提高编码效率。
图18是表示图17的步骤S111的详细的处理的流程图。具体而言,图18表示判断预测块候选[N]是否是可预测候选的方法。以下,对图18进行说明。
在步骤S121中,预测运动矢量候选计算部114判断预测块候选[N]是否是(1)通过帧内预测编码的块、或(2)位于包含编码对象块的切片或图片边界外的块、或(3)还没有被编码的块。
这里,如果步骤S121的判断结果是真(S121的“是”),则在步骤S122中,预测运动矢量候选计算部114将预测块候选[N]设定为不可预测候选。另一方面,如果步骤S121的判断结果是伪(S121的“否”),则在步骤S123中,预测运动矢量候选计算部114将预测块候选[N]设定为可预测候选。
图19是表示图17的步骤S114的详细的处理的流程图。具体而言,图19表示追加zero候选的方法。以下,对图19进行说明。
在步骤S131中,预测运动矢量候选计算部114判断预测运动矢量候选数是否比最大预测运动矢量候选数小。即,预测运动矢量候选计算部114判断预测运动矢量候选数是否没有达到最大预测运动矢量候选数。
这里,如果步骤S131的判断结果是真(S131的“是”),则在步骤S132中,预测运动矢量候选计算部114判断具有值是“0”的运动矢量的zero候选是否不是重复候选。这里,如果步骤S132是真(S132的“是”),则在步骤S133中,预测运动矢量候选计算部114对zero候选分配预测运动矢量索引的值,对预测运动矢量候选列表追加zero候选。进而,在步骤S134中,预测运动矢量候选计算部114对预测运动矢量候选数加1。
另一方面,如果步骤S131或步骤S132的判断结果是伪(S131或S132的“否”),则结束zero候选追加处理。即,在预测运动矢量候选数达到了最大预测运动矢量候选数的情况下,或者在zero候选为重复候选的情况下,结束zero候选追加处理。
图20是表示图14的步骤S103的详细的处理的流程图。具体而言,图20表示关于预测运动矢量候选的选择的处理。以下,对图20进行说明。
在步骤S141中,帧间预测控制部111作为初始化而对预测运动矢量候选索引mvp_idx设定0,对最小差分运动矢量设定值的最大值。
在步骤S142中,帧间预测控制部111判断预测运动矢量候选索引mvp_idx的值是否比预测运动矢量候选数小。即,帧间预测控制部111判断是否计算出了全部的预测运动矢量候选的差分运动矢量。
这里,如果还剩余有预测运动矢量候选(S142的“是”),则在步骤S143中,帧间预测控制部111通过从由运动检测求出的运动矢量(运动检测结果矢量)减去预测运动矢量候选,计算差分运动矢量。
在步骤S144中,帧间预测控制部111判断在步骤S143中求出的差分运动矢量是否值比最小差分运动矢量小。
这里,如果步骤S144的判断结果是真(S144的“是”),则在步骤S145中,帧间预测控制部111将最小差分运动矢量及预测运动矢量索引的值更新。另一方面,如果步骤S144的判断结果是伪(S144的“否”),则帧间预测控制部111不将最小差分运动矢量及预测运动矢量索引的值更新。
在步骤S146中,帧间预测控制部111将预测运动矢量候选索引用+1更新,回到步骤S142,判断是否存在下个预测运动矢量候选。
另一方面,在步骤S2中,如果判断为对全部的预测运动矢量候选计算出了差分运动矢量(S142的“否”),则在步骤S147中,帧间预测控制部111确定最终被设定的最小差分运动矢量及预测运动矢量索引。
这样,根据有关本实施方式的运动图像编码装置100,通过对预测运动矢量候选列表追加静止区域用的预测运动矢量,能够提高编码效率。更具体地讲,运动图像编码装置100在预测运动矢量候选数没有达到最大预测运动矢量候选数的情况,通过将具有值为“0”的运动矢量的zero候选作为预测运动矢量候选追加,能够提高编码效率。
另外,在本实施方式中,表示了运动图像编码装置100作为静止区域用的运动矢量而将具有值为“0”的运动矢量的zero候选向预测运动矢量候选追加的例子,但并不一定限定于此。
例如,运动图像编码装置100也可以为了考虑视频摄影时的微小的摄像机抖动等而将运动矢量(0,1)等、值比“0”的运动矢量(0,0)稍大或稍小的值追加到预测运动矢量候选中。
此外,运动图像编码装置100也可以向例如序列、图片或切片的头等附加偏移量参数(OffsetX,OffsetY)等,将运动矢量(OffsetX,OffsetY)向预测运动矢量候选追加。
此外,运动图像编码装置100例如也可以在制作预测运动矢量候选列表时,如图21(a)所示那样作为预测运动矢量候选列表上的全部的预测运动矢量候选的初始值而设定值为“0”的运动矢量(0,0)。在此情况下,运动图像编码装置100计算预测运动矢量候选,当向预测运动矢量候选列表追加时,作为初始值的运动矢量(0,0)进行覆盖。并且,运动图像编码装置100在将计算出的预测运动矢量候选向预测运动矢量候选列表追加前,进行预测运动矢量候选是否是不可预测候选或重复候选的判断。由此,在有不可预测候选或重复候选的情况下,例如如图21(b)所示,在预测运动矢量候选列表中剩下作为初始值的运动矢量(0,0)。通过这样的方法,也能够将zero候选作为预测运动矢量候选追加。
此外,在本实施方式中,表示了采用从编码对象块的邻接块生成预测运动矢量候选、进行编码对象块的运动矢量的编码的预测运动矢量指定模式的例子,但并不一定限定于此。例如,也可以使用直接模式或跳过模式。在直接模式或跳过合并模式中,也可以从如图15(b)及图16(b)那样制作出的预测运动矢量候选中选择预测运动矢量,通过将所选择的预测运动矢量作为运动矢量直接生成预测图像,不将差分运动矢量附加到比特流中。
(实施方式2)
本实施方式是上述有关实施方式1的运动图像编码装置的变形例。以下,具体地说明有关实施方式2的运动图像编码装置。
图22是表示有关实施方式2的运动图像编码装置200的结构的框图。该运动图像编码装置200通过将图像按照每个块编码而生成比特流。运动图像编码装置200具备预测运动矢量候选导出部210、预测控制部220和编码部230。
预测运动矢量候选导出部210对应于上述实施方式1的预测运动矢量块候选计算部114。预测运动矢量候选导出部210导出预测运动矢量候选。并且,预测运动矢量候选导出部210例如生成将所导出的各预测运动矢量候选与用来确定该预测运动矢量候选的索引(以下,称作“预测运动矢量索引”)建立了对应的预测运动矢量候选列表。
所谓预测运动矢量候选,是在编码对象块的编码中使用的运动矢量的候选。
如图22所示,预测运动矢量候选导出部210具备第1导出部211和第2导出部212。
第1导出部211基于在与编码对象块在空间或时间上邻接的块的编码中使用的运动矢量导出第1预测运动矢量候选。并且,第1导出部211例如将这样导出的第1预测运动矢量候选与预测运动矢量索引建立对应而登记到预测运动矢量候选列表中。
所谓在空间上邻接的块,是包含编码对象块的图片内的块,是与编码对象块邻接的块。具体而言,在空间上邻接的块例如是图3所示的邻接块A~D。
所谓在时间上邻接的块,是在与包含编码对象块的图片不同的图片中包含的块,是与编码对象块对应的块。具体而言,在时间上邻接的块例如是co-located块。
另外,在时间上邻接的块并不需要一定是与编码对象块相同的位置的块(co-located块)。例如,在时间上邻接的块也可以是与co-located块邻接的块。
另外,第1导出部211例如也可以将在与编码对象块在空间上邻接的块中的除了是不可预测候选的块以外的块的编码中使用的运动矢量,作为第1预测运动矢量候选导出。所谓是不可预测候选的块,是通过帧内预测编码的块、位于包含编码对象块的切片或图片边界外的块、或还没有被编码的块。由此,第1导出部211能够为了得到预测运动矢量候选而从适当的块导出第1预测运动矢量候选。
第2导出部212导出具有预先设定的矢量作为运动矢量的第2预测运动矢量候选。预先设定的矢量例如也可以如实施方式1那样是零矢量。由此,第2导出部212能够导出具有静止区域用的运动矢量的预测运动矢量候选。因而,运动图像编码装置200在编码对象块是静止区域的情况下,能够使编码效率提高。另外,预先设定的矢量并不需要一定是零矢量。
进而,第2导出部212例如将这样导出的第2预测运动矢量候选与预测运动矢量索引建立对应而登记到预测运动矢量候选列表中。此时,第2导出部212与实施方式1同样,也可以将第2预测运动矢量候选登记到预测运动矢量候选列表中,以对第1预测运动矢量候选分配比第2预测运动矢量候选小的值的预测运动矢量索引。由此,运动图像编码装置200在与第2预测运动矢量候选相比、第1预测运动矢量候选被选择为在编码中使用的预测运动矢量候选的可能性更高的情况下,能够削减代码量,能够使编码效率提高。
预测控制部220从导出的第1预测运动矢量候选及第2预测运动矢量候选中,选择在编码对象块的编码中使用的预测运动矢量候选。即,预测控制部220从预测运动矢量候选列表中,选择在编码对象块的编码中使用的预测运动矢量候选。
编码部230将用来确定所选择的预测运动矢量候选的索引(预测运动矢量索引)向比特流附加。例如,编码部230使用所导出的第1预测运动矢量候选的数量与第2预测运动矢量候选的数量之和(预测运动矢量候选数),将预测运动矢量索引编码,将编码后的预测运动矢量索引向比特流附加。
接着,对如以上那样构成的运动图像编码装置200的各种动作进行说明。
图23是表示有关实施方式2的运动图像编码装置200的处理动作的流程图。
首先,第1导出部211导出第1预测运动矢量候选(S201)。接着,第2导出部212导出第2预测运动矢量候选(S202)。
并且,预测控制部220从第1预测运动矢量候选及第2预测运动矢量候选中,选择在编码对象块的编码中使用的预测运动矢量(S203)。例如,预测控制部220与实施方式1同样,从预测运动矢量候选列表中选择差分运动矢量为最小的预测运动矢量。
最后,编码部230将用来确定所选择的预测运动矢量候选的索引向比特流附加(S204)。
如以上这样,根据有关本实施方式的运动图像编码装置200,能够将具有预先设定的矢量作为运动矢量的第2预测运动矢量候选导出。因而,运动图像编码装置200能够将例如具有静止区域用的运动矢量等的第2预测运动矢量候选导出。即,运动图像编码装置200能够将具有预先设定的运动的编码对象块有效率地编码,能够使编码效率提高。
另外,运动图像编码装置200与上述实施方式1同样,也可以在制作预测运动矢量候选列表时,作为预测运动矢量候选列表上的全部的预测运动矢量候选的初始值而设定第2预测运动矢量候选。在此情况下,预测运动矢量候选导出部210将第2预测运动矢量候选比第1预测运动矢量候选先导出。通过这样的方法,也能够将第2预测运动矢量候选作为预测运动矢量候选。
(实施方式3)
图24是表示有关实施方式3的运动图像解码装置300的结构的框图。
运动图像解码装置300如图24所示,具备可变长解码部301、逆量化部302、逆正交变换部303、加法部304、块存储器305、帧存储器306、帧内预测部307、帧间预测部308、帧间预测控制部309、开关310、预测运动矢量候选计算部311及colPic存储器312。
可变长解码部301对输入的比特流进行可变长解码处理,生成图片类型信息、预测方向标志、量化系数及差分运动矢量。此外,可变长解码部301使用从预测运动矢量候选计算部311取得的预测运动矢量候选数,进行预测运动矢量索引的可变长解码处理。
逆量化部302对通过可变长解码处理得到的量化系数进行逆量化处理。逆正交变换部303通过将由逆量化处理得到的正交变换系数进行从频域向图像域的变换,生成预测误差数据。在块存储器305中,以块单位保存将预测误差数据与预测图像数据相加而生成的图像数据。在帧存储器306中,以帧单位保存图像数据。
帧内预测部307通过使用保存在块存储器305中的块单位的图像数据进行帧内预测,生成解码对象块的预测图像数据。帧间预测部308通过使用保存在帧存储器306中的帧单位的图像数据进行帧间预测,生成解码对象块的预测图像数据。
开关310在解码对象块被进行帧内预测解码的情况下,将由帧内预测部307生成的帧内预测图像数据作为解码对象块的预测图像数据向加法部304输出。另一方面,开关310在解码对象块被进行帧间预测解码的情况下,将由帧间预测部308生成的帧间预测图像数据作为解码对象块的预测图像数据向加法部304输出。
预测运动矢量候选计算部311使用解码对象块的邻接块的运动矢量等及保存在colPic存储器312中的co-located块的运动矢量等的colPic信息,用后述的方法导出预测运动矢量指定模式的预测运动矢量候选及预测运动矢量候选数。此外,预测运动矢量候选计算部311对所导出的各预测运动矢量候选分配预测运动矢量索引的值。并且,预测运动矢量候选计算部311将预测运动矢量候选及预测运动矢量索引向帧间预测控制部309发送。此外,预测运动矢量候选计算部311将预测运动矢量候选数向可变长解码部301发送。
帧间预测控制部309从预测运动矢量候选中基于解码后的预测运动矢量索引选择在帧间预测中使用的预测运动矢量。并且,帧间预测控制部309根据预测运动矢量及差分运动矢量计算解码对象块的运动矢量。并且,帧间预测控制部309使用计算出的运动矢量使帧间预测部308生成帧间预测图像。此外,帧间预测控制部309将包括解码对象块的运动矢量等的colPic信息向colPic存储器312转送。
最后,加法部304通过将预测图像数据与预测误差数据相加,生成解码图像数据。
图25是表示有关实施方式2的运动图像解码装置的处理动作的流程图。
在步骤S301中,可变长解码部301将预测方向标志及参照图片索引解码。并且,根据解码后的预测方向标志决定预测方向X的值,进行从以下的步骤S302到步骤S305的处理。
在步骤S302中,预测运动矢量候选计算部311通过与图14的步骤S102同样的方法,根据解码对象块的邻接块及co-located块导出预测运动矢量候选。此外,预测运动矢量候选计算部311追加zero候选,计算预测运动矢量候选列表尺寸。
在步骤S303中,可变长解码部301使用计算出的预测运动矢量候选列表尺寸,对比特流中的预测运动矢量索引进行可变长解码。在步骤S304中,帧间预测控制部309对解码后的预测运动矢量索引表示的预测运动矢量候选加上解码后的差分运动矢量,计算运动矢量。并且,帧间预测控制部309使用计算出的运动矢量使帧间预测部308生成帧间预测图像。
另外,在由步骤S302计算出的预测运动矢量候选列表尺寸是“1”的情况下,也可以不将预测运动矢量索引解码而推测为0。
这样,根据有关本实施方式的运动图像解码装置300,通过对预测运动矢量候选列表追加静止区域用的预测运动矢量,能够将提高了编码效率的比特流适当地解码。更具体地讲,运动图像解码装置300在预测运动矢量候选数没有达到最大预测运动矢量候选数的情况下,通过将具有值为“0”的运动矢量的zero候选作为预测运动矢量候选进行追加,能够将提高了编码效率的比特流适当地解码。
另外,在本实施方式中,运动图像解码装置300在预测运动矢量候选数没有达到可预测候选数的情况下,将具有新的预测运动矢量的新候选作为预测运动矢量候选进行追加,但并不限定于此。例如,与上述实施方式1同样,运动图像解码装置300在制作预测运动矢量候选列表时,也可以如图21(a)所示那样,作为预测运动矢量候选列表上的全部的预测运动矢量候选的初始值而设定值为“0”的运动矢量(0,0)。
(实施方式4)
本实施方式是上述有关实施方式3的运动图像解码装置的变形例。以下,具体地说明有关实施方式4的运动图像解码装置。
图26是表示有关实施方式4的运动图像解码装置400的结构的框图。该运动图像解码装置400例如对在由有关实施方式2的运动图像编码装置200生成的比特流中包含的编码图像,按照每个块进行解码。
如图26所示,运动图像解码装置400具备预测运动矢量候选导出部410、解码部420和预测控制部430。
预测运动矢量候选导出部410对应于上述实施方式3的预测运动矢量块候选计算部311。预测运动矢量候选导出部410导出预测运动矢量候选。并且,预测运动矢量候选导出部410例如生成将所导出的各预测运动矢量候选与用来确定该预测运动矢量候选的索引(预测运动矢量索引)建立了对应的预测运动矢量候选列表。
如图26所示,预测运动矢量候选导出部410具备第1导出部411和第2导出部412。
第1导出部411与实施方式2的第1导出部211同样导出第1预测运动矢量候选。具体而言,第1导出部411基于在与解码对象块在空间或时间上邻接的块的解码中使用的运动矢量导出第1预测运动矢量候选。并且,第1导出部411例如将这样导出的第1预测运动矢量候选与预测运动矢量索引建立对应而登记到预测运动矢量候选列表中。
第2导出部412导出具有预先设定的矢量作为运动矢量的第2预测运动矢量候选。具体而言,第2导出部412与实施方式2的第2导出部212同样导出第2预测运动矢量候选。并且,第2导出部212例如将这样导出的第2预测运动矢量候选与预测运动矢量索引建立对应登记到预测运动矢量候选列表中。
预先设定的矢量例如也可以如上述实施方式1那样是零矢量。由此,第2导出部412能够导出具有静止区域用的运动矢量的预测运动矢量候选。因而,运动图像解码装置400能够将提高了编码效率的比特流适当地解码。
解码部420从比特流取得用来确定预测运动矢量候选的索引。例如,解码部420通过使用所导出的第1预测运动矢量候选的数量与第2预测运动矢量候选的数量之和(预测运动矢量候选数)将附加在比特流中的编码的预测运动矢量索引解码,取得预测运动矢量索引。
预测控制部430基于所取得的索引,从第1预测运动矢量候选及第2预测运动矢量候选中,选择在解码对象块的解码中使用的预测运动矢量。即,预测控制部430从预测运动矢量候选列表中选择在解码对象块的解码中使用的预测运动矢量。
接着,对如以上那样构成的运动图像解码装置400的各种动作进行说明。
图27是表示有关实施方式4的运动图像解码装置400的处理动作的流程图。
首先,第1导出部411导出第1预测运动矢量候选(S401)。接着,第2导出部412导出第2预测运动矢量候选(S402)。并且,解码部420从比特流取得预测运动矢量索引(S403)。
最后,预测控制部220基于所取得的索引,从第1预测运动矢量候选及第2预测运动矢量候选中,选择在解码对象块的解码中使用的预测运动矢量(S404)。
如以上这样,根据有关本实施方式的运动图像解码装置400,能够导出具有预先设定的矢量作为运动矢量的第2预测运动矢量候选。因而,运动图像解码装置400例如能够导出具有静止区域用的运动矢量等的第2预测运动矢量候选。即,运动图像解码装置400能够将有效率地编码了具有预先设定的运动的块的图像适当地解码,能够将提高了编码效率的比特流适当地解码。
另外,运动图像解码装置400与上述实施方式2同样,在制作预测运动矢量候选列表时,作为预测运动矢量候选列表上的全部的预测运动矢量候选的初始值,也可以设定第2预测运动矢量候选。在此情况下,预测运动矢量候选导出部410将第2预测运动矢量候选比第1预测运动矢量候选先导出。通过这样的方法,也能够将第2预测运动矢量候选作为预测运动矢量候选。
(实施方式5)
在本实施方式中,对与实施方式1不同的预测运动矢量候选列表尺寸的导出方法详细地说明。
在上述预测运动矢量指定模式中,对于在将预测运动矢量索引编码或解码时使用的预测运动矢量候选列表尺寸设定预测运动矢量候选数。该预测运动矢量候选数在使用包含co-located块等的参照图片信息将不可预测候选或重复候选删除后得到。因此,在运动图像编码装置和运动图像解码装置在预测运动矢量候选数上发生了不一致等情况下,在向预测运动矢量索引分配的比特序列上,在运动图像编码装置和运动图像解码装置中发生不一致。结果,有运动图像编码装置不能将比特流正确地解码的情况。
例如,在因在传送路等中发生的丢包等而丢失了作为co-located块参照的参照图片的信息的情况下,co-located块的运动矢量或参照图片索引变得不明。因此,根据co-located块生成的预测运动矢量候选的信息变得不明。在这样的情况下,在解码时不再能够从预测运动矢量候选将不可预测候选或重复候选正确地删除。结果,运动图像编码装置不能正确地求出预测运动矢量候选列表尺寸,不能将预测运动矢量索引正常地解码。
相对于此,在本实施方式中说明的预测运动矢量候选列表尺寸的导出方法通过不依存于包含co-located块等的参照图片信息的方法计算在将预测运动矢量索引编码或解码时使用的预测运动矢量候选列表尺寸。由此,运动图像编码装置能够提高比特流的容错性。
图28是表示有关实施方式3的运动图像编码装置500的结构的框图。
运动图像编码装置500如图28所示,具备减法部501、正交变换部502、量化部503、逆量化部504、逆正交变换部505、加法部506、块存储器507、帧存储器508、帧内预测部509、帧间预测部510、帧间预测控制部511、图片类型决定部512、开关513、预测运动矢量候选计算部514、colPic存储器515、及可变长编码部516。
减法部501通过按照每个块从包含在输入图像序列中的输入图像数据减去预测图像数据而生成预测误差数据。正交变换部502对所生成的预测误差数据进行从图像域向频域的变换。量化部503对变换为频域的预测误差数据进行量化处理。
逆量化部504对由量化部503量化处理后的预测误差数据进行逆量化处理。逆正交变换部505对逆量化处理后的预测误差数据进行从频域向图像域的变换。
加法部506通过按照每个编码对象块将预测图像数据与由逆正交变换部505逆量化处理后的预测误差数据相加,生成重建图像数据。在块存储器507中,以块单位保存重建图像数据。在帧存储器508中,以帧单位保存重建图像数据。
图片类型决定部512决定以I图片、B图片及P图片的哪个图片类型将输入图像数据编码。并且,图片类型决定部512生成图片类型信息。帧内预测部509通过使用保存在块存储器507中的块单位的重建图像数据进行帧内预测,生成编码对象块的帧内预测图像数据。帧间预测部510通过使用保存在帧存储器508中的帧单位的重建图像数据和通过运动检测等导出的运动矢量进行帧间预测,生成编码对象块的帧间预测图像数据。
开关513在编码对象块被进行帧内预测编码的情况下,将由帧内预测部509生成的帧内预测图像数据作为编码对象块的预测图像数据向减法部501及加法部506输出。另一方面,开关513在编码对象块被进行帧间预测编码的情况下,将由帧间预测部510生成的帧间预测图像数据作为编码对象块的预测图像数据向减法部501及加法部506输出。
预测运动矢量候选计算部514使用编码对象块的邻接块的运动矢量等及保存在colPic存储器515中的co-located块的运动矢量等的colPic信息,导出预测运动矢量指定模式的预测运动矢量候选。并且,预测运动矢量候选计算部514用后述的方法计算可预测候选数。此外,预测运动矢量候选计算部514对所导出的预测运动矢量候选分配预测运动矢量索引的值。并且,预测运动矢量候选计算部514将预测运动矢量候选和预测运动矢量索引向帧间预测控制部511发送。此外,预测运动矢量候选计算部514将计算出的可预测候选数向可变长编码部516发送。
帧间预测控制部511控制帧间预测部510,以使用用通过运动检测导出的运动矢量而生成的帧间预测图像进行帧间预测编码。此外,帧间预测控制部511通过后述的方法选择最适合于在帧间预测编码中使用的运动矢量的编码的预测运动矢量候选。并且,帧间预测控制部511将与所选择的预测运动矢量候选对应的预测运动矢量索引和预测的误差信息(差分运动矢量)向可变长编码部516发送。进而,帧间预测控制部511将包括编码对象块的运动矢量等的colPic信息向colPic存储器515转送。
可变长编码部516通过对量化处理后的预测误差数据、预测方向标志、图片类型信息及差分运动矢量进行可变长编码处理而生成比特流。此外,可变长编码部516将可预测候选数设定为预测运动矢量候选列表尺寸。并且,可变长编码部516对在运动矢量编码中使用的预测运动矢量索引分配与预测运动矢量候选列表尺寸对应的比特序列,进行可变长编码。
图29是表示有关实施方式1的运动图像编码装置的处理动作的流程图。
在步骤S501中,帧间预测控制部511通过运动检测决定编码对象块的预测方向、参照图片索引及运动矢量。这里,在运动检测中,例如计算编码图片内的编码对象块与参照图片内的块的差分值,决定差分值最小的参照图片内的块作为参照块。并且,使用根据编码对象块位置和参照块位置求出运动矢量的方法等,求出运动矢量。此外,帧间预测控制部511对预测方向0和预测方向1的参照图片分别进行运动检测,例如通过R-D优化模型的以下的式子等对选择预测方向0、预测方向1还是双向预测进行计算。
Cost=D+λ×R…(式3)
在式3中,D表示编码失真,使用用由某个运动矢量生成的预测图像将编码对象块编码及解码得到的像素值与编码对象块的原来的像素值的差分绝对值和等。此外,R表示产生代码量。使用为了将在预测图像生成中使用的运动矢量编码而需要的代码量等作为R。此外,λ是拉格朗日的未定乘数。
在步骤S502中,预测运动矢量候选计算部514根据编码对象块的邻接块及co-located块导出预测运动矢量候选。此外,预测运动矢量候选计算部514用后述的方法计算预测运动矢量候选列表尺寸。
例如,在图3那样的情况下,预测运动矢量候选计算部514选择例如邻接块A、B、C及D具有的运动矢量,作为编码对象块的预测运动矢量候选。进而,预测运动矢量候选计算部514根据co-located块的运动矢量通过时间预测模式将计算出的运动矢量等计算为预测运动矢量候选。
预测运动矢量候选计算部514如图30(a)及图31(a)那样对预测方向0及预测方向1的预测运动矢量候选分配预测运动矢量索引。并且,预测运动矢量候选计算部514通过用后述的方法进行不可预测候选及重复候选的删除及新候选追加,计算图30(b)及图31(b)那样的预测运动矢量候选列表及预测运动矢量候选列表尺寸。
预测运动矢量索引的值越小被分配越短的代码。即,在预测运动矢量索引的值较小的情况下,预测运动矢量索引所需要的信息量变少。另一方面,如果预测运动矢量索引的值变大,则预测运动矢量索引所需要的信息量变大。因而,如果对成为精度更高的预测运动矢量的可能性较高的预测运动矢量候选分配值较小的预测运动矢量索引,则编码效率变高。
所以,预测运动矢量候选计算部514例如也可以将被选择为预测运动矢量的次数按照每个预测运动矢量候选进行计测,对其次数较多的块分配值较小的预测运动矢量索引。具体而言,可以考虑确定在邻接块中选择的预测运动矢量,在对象块的编码时使对于所确定的预测运动矢量候选的预测运动矢量索引的值变小。
另外,在邻接块不具有运动矢量等的信息的情况下(是通过帧内预测编码的块的情况、是位于图片或切片的边界外等的块的情况、是还没有被编码的块等情况下),不能用于编码。
在本实施方式中,将不能用作预测运动矢量候选称作不可预测候选。此外,将能够用作预测运动矢量候选称作可预测候选。此外,将在多个预测运动矢量候选中值与其他某个预测运动矢量一致的候选称作重复候选。
在图3的情况下,邻接块C由于是通过帧内预测编码的块,所以为不可预测候选。此外,根据邻接块D生成的预测方向0的预测运动矢量sMvL0_D的值与根据邻接块A生成的预测方向0的预测运动矢量MvL0_A一致,为重复候选。
在步骤S503中,帧间预测控制部511用后述的方法决定在预测方向X的运动矢量编码中使用的预测运动矢量索引的值。
在步骤S504中,可变长编码部516对在预测方向X的运动矢量编码中使用的预测运动矢量候选的预测运动矢量索引分配与图6所示那样的预测运动矢量候选列表尺寸对应的比特序列,进行可变长编码。
在本实施方式中,如图30(a)及图31(a)那样,作为与邻接块A对应的预测运动矢量索引的值而被分配“0”。此外,作为与邻接块B对应的预测运动矢量索引的值而被分配“1”。此外,作为与co-located块对应的预测运动矢量索引的值而被分配“2”。此外,作为与邻接块C对应的预测运动矢量索引的值而被分配“3”。此外,作为与邻接块D对应的预测运动矢量索引的值而被分配“4”。
另外,预测运动矢量索引的值的分配方式并不一定限定于该例。例如,可变长编码部516在使用实施方式1所记载的方法或后述的方法追加了新候选等情况下,也可以对原来的预测运动矢量候选分配较小的值,对新候选分配较大的值。即,可变长编码部516也可以向原来的预测运动矢量候选优先分配较小的值的预测运动矢量块索引。
此外,预测运动矢量候选并不一定限定于邻接块A、B、C、D的位置。例如,也可以使用位于左下邻接块D的上方的邻接块等作为预测运动矢量候选。此外,并不需要一定使用全部的邻接块作为预测运动矢量候选。例如,也可以仅使用邻接块A、B作为预测运动矢量候选。或者,如果邻接块D是不可预测候选,则也可以使用邻接块A等、将邻接块依次扫描。
此外,在本实施方式中,在图29的步骤S504中,可变长编码部516将预测运动矢量索引附加到比特流中,但并不一定需要将预测运动矢量索引附加到比特流中。例如,可变长编码部516在预测运动矢量候选列表尺寸是1的情况下,也可以不将预测运动矢量索引向比特流附加。由此,能够削减预测运动矢量索引的信息量。
图32是表示图29的步骤S502的详细的处理的流程图。具体而言,图32表示计算预测运动矢量候选及预测运动矢量候选列表尺寸的方法。以下,对图32进行说明。
在步骤S511中,预测运动矢量候选计算部514通过后述的方法判断预测块候选[N]是否是可预测候选。并且,预测运动矢量候选计算部514按照判断结果将可预测候选数更新。
这里,N是用来表示各预测块候选的索引值。在本实施方式中,N取0到4的值。具体而言,对预测块候选[0]分配图3的邻接块A。此外,对预测块候选[1]分配图3的邻接块B。此外,对预测块候选[2]分配co-located块。此外,对预测块候选[3]分配图3的邻接块C。此外,对预测块候选[4]分配图3的邻接块D。
在步骤S512中,预测运动矢量候选计算部514根据预测块候选[N],使用上述式1、式2计算预测方向X的预测运动矢量候选,向预测运动矢量候选列表追加。
在步骤S513中,预测运动矢量候选计算部514如图30及图31所示,从预测运动矢量候选列表中搜索不可预测候选及重复候选并删除。
在步骤S514中,预测运动矢量候选计算部514用实施方式1所记载的方法或后述的方法向预测运动矢量候选列表追加新候选。这里,当追加新候选时,预测运动矢量候选计算部514也可以进行预测运动矢量索引的值的再分配,以对原来就有的预测运动矢量候选优先分配较小的预测运动矢量索引。即,预测运动矢量候选计算部514也可以进行预测运动矢量索引的值的再分配,以对新候选分配值较大的预测运动矢量索引。由此,能够削减预测运动矢量索引的代码量。
在步骤S515中,预测运动矢量候选计算部514将在步骤S511中计算出的预测运动矢量候选数设定为预测运动矢量候选列表尺寸。在图30及图31的例子中,通过后述的方法,将预测方向0的预测运动矢量候选数计算为“4”,对预测方向0的预测运动矢量候选列表尺寸设定“4”。此外,将预测方向1的预测运动矢量候选数计算为“4”,对预测方向1的预测运动矢量候选列表尺寸设定为“4”。
另外,步骤S514中的新候选,是通过实施方式1所记载的方法追加的zero候选,或通过后述的方法在预测运动矢量候选数没有达到可预测候选数的情况下对预测运动矢量候选新追加的候选。例如,新候选也可以是根据图3中的位于左下邻接块D的上方的邻接块生成的预测运动矢量。此外,新候选例如也可以是根据与co-located块的邻接块A、B、C、D对应的块生成的预测运动矢量。此外,新候选例如也可以是根据参照图片的画面整体或一定的区域的运动矢量的统计等计算出的预测运动矢量。这样,在预测运动矢量候选数没有达到可预测候选数的情况下,预测运动矢量候选计算部514通过追加新的预测运动矢量作为新候选,能够提高编码效率。
图33是表示图32的步骤S511的详细的处理的流程图。具体而言,图33表示判断预测块候选[N]是否是可预测候选、将可预测候选数更新的方法。以下,对图33进行说明。
在步骤S521中,预测运动矢量候选计算部514判断预测块候选[N]是否是(1)通过帧内预测编码的块、或(2)位于包含编码对象块的切片或图片边界外的块、或(3)还没有被编码的块。
这里,如果步骤S521的判断结果是真(S521的“是”),则在步骤S522中,预测运动矢量候选计算部514将预测块候选[N]设定为不可预测候选。另一方面,如果步骤S521的判断结果是伪(S521的“否”),则在步骤S523中,预测运动矢量候选计算部514将预测块候选[N]设定为可预测候选。
在步骤S524中,预测运动矢量候选计算部514判断预测块候选[N]是否是可预测候选或co-located块候选。这里,如果步骤S524的判断结果是真(S524的“是”),则在步骤S5中,预测运动矢量候选计算部514对可预测候选数加1,将预测运动矢量候选数更新。另一方面,如果步骤S524的判断结果是伪(S524的“否”),则预测运动矢量候选计算部514不将可预测候选数更新。
这样,在预测块候选是co-located块的情况下,预测运动矢量候选计算部514不论co-located块是可预测候选还是不可预测候选,都对可预测候选数加1。由此,即使是因丢包等而丢失了co-located块的信息的情况,在运动图像编码装置和运动图像解码装置中在可预测候选数上也不会发生不一致。
将该可预测候选数在图32的步骤S515中设定为预测运动矢量候选列表尺寸。进而,在图29的S504中,将预测运动矢量候选列表尺寸用在预测运动矢量索引的可变长编码中。由此,即使是丢失了包含co-located块等的参照图片信息的情况,运动图像编码装置500也能够生成能将预测运动矢量索引正常解码的比特流。
图34是表示图32的步骤S514的详细的处理的流程图。具体而言,图34表示追加新候选的方法。以下,对图34进行说明。
在步骤S531中,预测运动矢量候选计算部514判断预测运动矢量候选数是否比可预测候选数小。即,预测运动矢量候选计算部514判断预测运动矢量候选数是否没有达到可预测候选数。
这里,如果步骤S531的判断结果是真(S531的“是”),则在步骤S532中,预测运动矢量候选计算部514判断是否存在能够作为预测运动矢量候选追加到预测运动矢量候选列表中的新候选。这里,如果步骤S532的判断结果是真(S532的“是”),则在步骤S533中,预测运动矢量候选计算部514对新候选分配预测运动矢量索引的值,向预测运动矢量候选列表追加新候选。进而,在步骤S534中,预测运动矢量候选计算部514对预测运动矢量候选数加1。
另一方面,如果步骤S531或步骤S532的判断结果是伪(S531或S532的“否”),则结束新候选追加处理。即,在预测运动矢量候选数达到了可预测候选数的情况下,或在不存在新候选的情况下,结束新候选追加处理。
图35是表示图29的步骤S503的详细的处理的流程图。具体而言,图35表示关于预测运动矢量候选的选择的处理。以下,对图35进行说明。
在步骤S541中,帧间预测控制部511进行初始化,对预测运动矢量候选索引mvp_idx设定0,对最小差分运动矢量设定值的最大值。
在步骤S542中,帧间预测控制部511判断预测运动矢量候选索引mvp_idx的值是否比预测运动矢量候选数小。即,帧间预测控制部511判断是否计算出了全部的预测运动矢量候选的差分运动矢量。
这里,如果还剩余有预测运动矢量候选(S542的“是”),则在步骤S543中,帧间预测控制部511通过从在运动检测中求出的运动矢量(运动检测结果矢量)减去预测运动矢量候选来计算差分运动矢量。
在步骤S544中,帧间预测控制部511判断在步骤S543中求出的差分运动矢量是否值比最小差分运动矢量小。
这里,如果步骤S544的判断结果是真(S544的“是”),则在步骤S545中,帧间预测控制部511将最小差分运动矢量及预测运动矢量索引的值更新。另一方面,步骤S544的判断结果是伪(S544的“否”),则帧间预测控制部511不将最小差分运动矢量及预测运动矢量索引的值更新。
在步骤S546中,帧间预测控制部511将预测运动矢量候选索引通过+1而更新,回到步骤S542,判断是否存在下个预测运动矢量候选。
另一方面,在步骤S2中,如果判断为对全部的预测运动矢量候选计算了差分运动矢量(S542的“否”),则在步骤S547中,帧间预测控制部511确定最终设定的最小差分运动矢量及预测运动矢量索引。
这样,根据有关本实施方式的运动图像编码装置500,能够通过不依存于包含co-located块等的参照图片信息的方法,计算在将预测运动矢量索引编码或解码时使用的预测运动矢量候选列表尺寸。由此,运动图像编码装置500能够提高容错性。
更具体地讲,有关本实施方式的运动图像编码装置500不论co-located块是否是可预测候选,只要预测块候选是co-located块就总是对可预测候选数加1。并且,运动图像编码装置500使用这样计算出的可预测候选数决定向预测运动矢量索引分配的比特序列。由此,运动图像编码装置500即使是丢失了包含co-located块的参照图片信息的情况,也能够生成能将预测运动矢量索引正常地解码的比特流。
此外,有关本实施方式的运动图像编码装置500在预测运动矢量候选数没有达到可预测候选数的情况下,通过将具有新的预测运动矢量的新候选作为预测运动矢量候选追加,能够提高编码效率。
另外,在本实施方式中,运动图像编码装置500不论co-located块是否是可预测候选,只要预测块候选是co-located块,就总是使用加1而计算出的可预测候选数来决定向预测运动矢量索引分配的比特序列,但并不限定于此。例如,运动图像编码装置500在图33的步骤S524中,也可以对于co-located块以外的预测块候选也必定总是使用加1而计算出的可预测候选数,来决定向预测运动矢量索引分配的比特序列。即,运动图像编码装置500也可以使用固定为预测运动矢量候选数的最大值N的预测运动矢量候选列表尺寸,向预测运动矢量索引分配比特序列。即,也可以将全部的预测块候选看作可预测候选,将预测运动矢量候选列表尺寸固定为预测运动矢量候选数的最大值N而将预测运动矢量索引编码。
例如,在本实施方式中,由于预测运动矢量候选数的最大值N是5(邻接块A、邻接块B、co-located块、邻接块C、邻接块D),所以运动图像编码装置500也可以总是对预测运动矢量候选列表尺寸设定5而将预测运动矢量索引编码。此外,例如在预测运动矢量候选数的最大值N是4(邻接块A、邻接块B、邻接块C、邻接块D)的情况下,运动图像编码装置500也可以总是对预测运动矢量候选列表尺寸设定4而将预测运动矢量索引编码。
这样,运动图像编码装置500也可以根据预测运动矢量候选数的最大值来决定预测运动矢量候选列表尺寸。由此,运动图像解码装置500的可变长解码部516能够生成能将比特流中的预测运动矢量索引不参照邻接块或co-located块的信息而解码的比特流,能够削减可变长解码部516的处理量。
此外,在本实施方式中,表示了采用根据编码对象块的邻接块生成预测运动矢量候选、进行编码对象块的运动矢量的编码的预测运动矢量指定模式的例子,但并不一定限定于此。例如也可以使用直接模式或跳过模式。在直接模式或跳过合并模式中,也可以从如图30(b)及图31(b)那样制作出的预测运动矢量候选中选择预测运动矢量,通过将所选择的预测运动矢量作为运动矢量直接生成预测图像,不将差分运动矢量向比特流附加。
(实施方式6)
本实施方式是上述有关实施方式5的运动图像编码装置的变形例。以下,具体地说明有关实施方式6的运动图像编码装置。
图36是表示有关实施方式6的运动图像编码装置600的结构的框图。该运动图像编码装置600通过将图像按照每个块编码而生成比特流。运动图像编码装置600具备预测运动矢量候选导出部610、预测控制部620和编码部630。
预测运动矢量候选导出部610对应于上述实施方式5的预测运动矢量块候选计算部514。预测运动矢量候选导出部610导出预测运动矢量候选。并且,预测运动矢量候选导出部610例如生成将所导出的各预测运动矢量候选与用来确定该预测运动矢量候选的索引建立对应的预测运动矢量候选列表。
如图36所示,预测运动矢量候选导出部610具备决定部611、第1导出部612、确定部613、判断部614和第2导出部615。
决定部611决定预测运动矢量候选的最大数。即,决定部611决定预测块候选数的最大值N。
例如,决定部611基于输入图像序列(序列、图片、切片或块等)的特征,决定预测运动矢量候选的最大数。此外,例如决定部611也可以将预先设定的数量决定为预测运动矢量候选的最大数。
第1导出部612基于在与编码对象块在空间或时间上邻接的块的编码中使用的运动矢量导出第1预测运动矢量候选。这里,第1导出部612导出第1预测运动矢量候选,以使第1预测运动矢量候选的数量不超过最大数。并且,第1导出部612例如将这样导出的第1预测运动矢量候选与预测运动矢量索引建立对应而登记到预测运动矢量候选列表中。
另外,第1导出部612例如也可以将在与编码对象块在空间上邻接的块中的除了是不可预测候选的块以外的块的编码中使用的运动矢量,作为第1预测运动矢量候选导出。所谓是不可预测候选的块,是通过帧内预测编码的块、位于包含编码对象块的切片或图片边界外的块或还没有被编码的块。由此,为了得到预测运动矢量候选而能够从适当的块导出第1预测运动矢量候选。
确定部613在导出了多个第1预测运动矢量候选的情况下,确定运动矢量与其他第1预测运动矢量候选重复的第1预测运动矢量候选(重复候选)。并且,确定部613将所确定的重复候选从预测运动矢量候选列表中删除。
判断部614判断第1预测运动矢量候选的数量是否比所决定的最大数小。这里,判断部614判断除了所确定的重复的第1预测运动矢量候选以外的第1预测运动矢量候选的数量是否比所决定的最大数小。
第2导出部615在判断为第1预测运动矢量候选的数量比所决定的最大数小的情况下,将具有预先设定的矢量作为运动矢量的第2预测运动矢量候选导出。具体而言,第2导出部615导出第2预测运动矢量候选,以使第1预测运动矢量候选的数量与第2预测运动矢量候选的数量之和不超过最大数。这里,第2导出部615导出第2预测运动矢量候选,以使除了重复候选以外的第1预测运动矢量候选的数量与第2预测运动矢量候选的数量之和不超过最大数。
预先设定的矢量例如与上述实施方式1同样,也可以是零矢量。另外,预先设定的矢量并不需要一定是零矢量。
并且,第2导出部615例如将这样导出的第2预测运动矢量候选与预测运动矢量索引建立对应而向预测运动矢量候选列表登记。此时,第2导出部615也可以将第2预测运动矢量候选登记到预测运动矢量候选列表中,以对第1预测运动矢量候选分配比第2预测运动矢量候选小的值的预测运动矢量索引。由此,在与第2预测运动矢量候选相比、第1预测运动矢量候选被选择为在编码中使用的预测运动矢量候选的可能性较高的情况下,运动图像编码装置600能够削减代码量,能够使编码效率提高。
另外,第2导出部615并不需要导出第2预测运动矢量候选以使第1预测运动矢量候选的数量与第2预测运动矢量候选的数量之和必定与所决定的最大数一致。在第1预测运动矢量候选的数量与第2预测运动矢量候选的数量之和比所决定的最大数小的情况下,例如也可以存在没有与预测运动矢量候选建立对应的预测运动矢量索引的值。
预测控制部620从第1预测运动矢量候选及第2预测运动矢量候选中,选择在编码对象块的编码中使用的预测运动矢量。即,预测控制部620从预测运动矢量候选列表中选择在编码对象块的编码中使用的预测运动矢量。
编码部630将用来确定所选择的预测运动矢量候选的索引(预测运动矢量索引)使用所决定的最大数进行编码。具体而言,编码部630如图6所示,对分配给所选择的预测运动矢量候选的索引值的比特序列进行可变长编码。进而,编码部630将编码后的索引向比特流附加。
这里,编码部630也可以还将表示由决定部611决定的最大数的信息向比特流附加。具体而言,编码部630也可以将表示最大数的信息向例如切片头等写入。由此,能够以适当的单位切换最大数,能够使编码效率提高。
另外,编码部630并不需要一定将表示最大数的信息附加到比特流中。例如,在最大数由标准预先决定的情况下、或在最大数与既定值相同等情况下,编码部630也可以不将表示最大数的信息向比特流附加。
接着,对如以上那样构成的运动图像编码装置600的各种动作进行说明。
图37是表示有关实施方式6的运动图像编码装置600的处理动作的流程图。
首先,决定部611决定预测运动矢量候选的最大数(S601)。第1导出部612导出第1预测运动矢量候选(S602)。确定部613在导出了多个第1预测运动矢量候选的情况下,确定运动矢量与其他第1预测运动矢量候选重复的第1预测运动矢量候选(重复候选)(S603)。
判断部614判断除了重复候选以外的第1预测运动矢量候选的数是否比所决定的最大数小(S604)。这里,在判断为除了重复候选以外的第1预测运动矢量候选的数量比所决定的最大数小的情况下(S604的“是”),第2导出部615导出具有预先设定的矢量作为运动矢量的第2预测运动矢量候选(S605)。另一方面,在没有判断为除了重复候选以外的第1预测运动矢量候选的数量比所决定的最大数小的情况下(S604的“否”),第2导出部615不导出第2预测运动矢量候选。这些步骤S604及步骤S605相当于实施方式5的步骤S514。
预测控制部620从第1预测运动矢量候选及第2预测运动矢量候选中,选择在编码对象块的编码中使用的预测运动矢量(S606)。例如,预测控制部620与实施方式1同样,从预测运动矢量候选列表中选择差分运动矢量为最小的预测运动矢量。
编码部630将用来确定所选择的预测运动矢量候选的索引,使用所决定的最大数进行编码(S607)。进而,编码部630将编码后的索引向比特流附加。
如以上这样,根据有关本实施方式的运动图像编码装置600,能够导出具有预先设定的矢量作为运动矢量的第2预测运动矢量候选。因而,运动图像编码装置600能够将例如具有静止区域用的运动矢量等的预测运动矢量候选作为第2预测运动矢量候选导出。即,运动图像编码装置600能够将具有预先设定的运动的编码对象块有效率地编码,能够使编码效率提高。
进而,根据有关本实施方式的运动图像编码装置600,能够将用来确定预测运动矢量候选的索引使用所决定的最大数进行编码。即,能够不依存于实际导出的预测运动矢量候选的数量而将索引编码。因而,即使是丢失了预测运动矢量候选的导出所需要的信息(例如,co-located块等的信息)的情况,在解码侧也能够将索引解码,能够使容错性提高。此外,在解码侧,能够不依存于实际导出的预测运动矢量候选的数量而将索引解码。即,在解码侧,能够不等待预测运动矢量候选的导出处理而进行索引的解码处理。即,能够生成能并行进行预测运动矢量候选的导出处理和索引的解码处理的比特流。
进而,根据有关本实施方式的运动图像编码装置600,在判断为第1预测运动矢量候选的数量比最大数小的情况下,能够导出第2预测运动矢量候选。因而,能够在不超过最大数的范围中使预测运动矢量候选的数量增加,能够使编码效率提高。
此外,根据有关本实施方式的运动图像编码装置600,能够根据除了重复的第1预测运动矢量候选以外的第1预测运动矢量候选的数量导出第2预测运动矢量候选。结果,能够使第2预测运动矢量候选的数量增加,能够增加能选择为预测运动矢量候选的运动矢量的种类。因而,能够进一步使编码效率提高。
另外,在本实施方式中,运动图像编码装置600具备确定部613,但并不需要一定具备确定部613。即,在图37所示的流程图中,并不需要一定包含步骤S603。即使是这样的情况,运动图像编码装置600也能够将用来确定预测运动矢量候选的索引使用所决定的最大数编码,所以能够使容错性提高。
此外,在本实施方式中,如图37所示,在第1导出部612导出第1预测运动矢量候选后,确定部613确定重复候选,但并不需要一定这样依次处理。例如,第1导出部612也可以在导出第1预测运动矢量候选的过程中确定重复候选,导出第1预测运动矢量候选以使所确定的重复候选不包含在第1预测运动矢量候选中。即,第1导出部612也可以将运动矢量与已经导出的第1预测运动矢量候选不重复的预测运动矢量候选作为第1预测运动矢量候选导出。更具体地讲,例如也可以是,在基于左邻接块的预测运动矢量候选已经被作为第1预测运动矢量候选导出的情况下,如果基于上邻接块的预测运动矢量候选与基于左邻接块的预测运动矢量候选不重复,则第1导出部612将基于上邻接块的预测运动矢量候选作为第1预测运动矢量候选导出。由此,第1导出部612能够将运动矢量与已经导出的第1预测运动矢量候选重复的预测运动矢量候选从第1预测运动矢量候选中排除。结果,运动图像编码装置600能够使第2预测运动矢量候选的数量增加,能够增加能选择为预测运动矢量候选的运动矢量的种类。因而,能够使编码效率进一步提高。
(实施方式7)
在本实施方式中,对与实施方式2不同的预测运动矢量候选列表尺寸的导出方法详细地说明。
图38是表示有关本实施方式4的运动图像解码装置700的结构的框图。
运动图像解码装置700如图38所示,具备可变长解码部701、逆量化部702、逆正交变换部703、加法部704、块存储器705、帧存储器706、帧内预测部707、帧间预测部708、帧间预测控制部709、开关710、预测运动矢量候选计算部711及colPic存储器712。
可变长解码部701对输入的比特流进行可变长解码处理,生成图片类型信息、预测方向标志、量化系数及差分运动矢量。此外,可变长解码部701使用后述的可预测候选数进行预测运动矢量索引的可变长解码处理。
逆量化部702对通过可变长解码处理得到的量化系数进行逆量化处理。逆正交变换部703通过将由逆量化处理得到的正交变换系数进行从频域向图像域的变换,生成预测误差数据。在块存储器705中,以块单位保存将预测误差数据与预测图像数据相加而生成的图像数据。在帧存储器706中,以帧单位保存图像数据。
帧内预测部707通过使用保存在块存储器705中的块单位的图像数据进行帧内预测,从而生成解码对象块的预测图像数据。帧间预测部708通过使用保存在帧存储器706中的帧单位的图像数据进行帧间预测,从而生成解码对象块的预测图像数据。
开关710在解码对象块被进行帧内预测解码的情况下,将通过帧内预测部707生成的帧内预测图像数据作为解码对象块的预测图像数据向加法部704输出。另一方面,开关710在解码对象块被进行帧间预测解码的情况下,将由帧间预测部708生成的帧间预测图像数据作为解码对象块的预测图像数据向加法部704输出。
预测运动矢量候选计算部711使用解码对象块的邻接块的运动矢量等及保存在colPic存储器712中的co-located块的运动矢量等的colPic信息,将预测运动矢量指定模式的预测运动矢量候选用后述的方法导出。此外,预测运动矢量候选计算部711对导出的各预测运动矢量候选分配预测运动矢量索引的值。并且,预测运动矢量候选计算部711将预测运动矢量候选和预测运动矢量索引向帧间预测控制部709发送。
帧间预测控制部709从预测运动矢量候选中,基于解码后的预测运动矢量索引,选择在帧间预测中使用的预测运动矢量。并且,帧间预测控制部709根据预测运动矢量及差分运动矢量计算解码对象块的运动矢量。并且,帧间预测控制部709使用计算出的运动矢量使帧间预测部708生成帧间预测图像。此外,帧间预测控制部709将包含解码对象块的运动矢量等的colPic信息向colPic存储器712转送。
最后,加法部704通过将预测图像数据与预测误差数据相加,生成解码图像数据。
图39是表示有关实施方式2的运动图像解码装置的处理动作的流程图。
在步骤S701中,可变长解码部701将预测方向标志及参照图片索引解码。并且,根据解码后的预测方向标志决定预测方向X的值,进行以下的步骤S702到步骤S705的处理。
在步骤S702中,预测运动矢量候选计算部711通过实施方式1及实施方式2所记载的方法或后述的方法计算可预测候选数。并且,预测运动矢量候选计算部711将计算出的可预测候选数设定为预测运动矢量候选列表尺寸。
在步骤S703中,可变长解码部701使用计算出的预测运动矢量候选列表尺寸对比特流中的预测运动矢量索引进行可变长解码。在步骤S704中,预测运动矢量候选计算部711用后述的方法根据解码对象块的邻接块及co-located块生成预测运动矢量候选。在步骤S705中,帧间预测控制部709对解码后的预测运动矢量索引表示的预测运动矢量候选加上解码后的差分运动矢量,计算运动矢量。并且,帧间预测控制部709使用计算出的运动矢量,使帧间预测部708生成帧间预测图像。
另外,在由步骤S702计算出的预测运动矢量候选列表尺寸是“1”的情况下,也可以将预测运动矢量索引不解码而推测为0。
图40是表示图39的步骤S702的详细的处理的流程图。具体而言,图40表示判断预测块候选[N]是否是可预测候选、计算可预测候选数的方法。以下,对图40进行说明。
在步骤S711中,预测运动矢量候选计算部711判断预测块候选[N]是否是(1)通过帧内预测解码的块、或(2)位于包含解码对象块的切片或图片边界外的块、或(3)还没有被解码的块。
这里,如果步骤S711的判断结果是真(S711的“是”),则在步骤S712中,预测运动矢量候选计算部711将预测块候选[N]设定为不可预测候选。另一方面,如果步骤S711的判断结果是伪(S711的“否”),则在步骤S713中,预测运动矢量候选计算部711将预测块候选[N]设定为可预测候选。
在步骤S714中,预测运动矢量候选计算部711判断预测块候选[N]是否是可预测候选或co-located块候选。这里,如果步骤S714的判断结果是真(S714的“是”),则在步骤S5中,预测运动矢量候选计算部711对可预测候选数加1,将值更新。另一方面,如果步骤S714是伪(S714的“否”),则预测运动矢量候选计算部711不将可预测候选数更新。
这样,在预测块候选是co-located块的情况下,预测运动矢量候选计算部711不论co-located块是可预测候选还是不可预测候选,都对可预测候选数加1。由此,即使是因丢包等而丢失了co-located块的信息的情况,在运动图像编码装置和运动图像解码装置中在可预测候选数上也不会发生不一致。
将该可预测候选数在图39的步骤S702中设定为预测运动矢量候选列表尺寸。进而,在图39的S703中,将预测运动矢量候选列表尺寸用在预测运动矢量索引的可变长解码中。由此,即使是丢失了包含co-located块等的参照图片信息的情况,运动图像解码装置700也能够将预测运动矢量索引正常地解码。
图41是表示图39的步骤S704的详细的处理的流程图。具体而言,图41表示计算预测运动矢量候选的方法。以下,对图41进行说明。
在步骤S721中,预测运动矢量候选计算部711根据预测块候选[N],使用上述式1、式2计算预测方向X的预测运动矢量候选,向预测运动矢量候选列表追加。
在步骤S722中,预测运动矢量候选计算部711如图30及图31所示,从预测运动矢量候选列表中搜索不可预测候选及重复候选并删除。
在步骤S723中,预测运动矢量候选计算部711通过与图34同样的方法,向预测运动矢量候选列表追加新候选。
图42是表示将预测运动矢量索引向比特流附加时的语法的一例的图。在图42中,inter_pred_flag表示预测方向标志,mvp_idx表示预测运动矢量索引。NumMVPCand表示预测运动矢量候选列表尺寸,在本实施方式中被设定通过图40的处理流程计算出的可预测候选数。
这样,根据有关本实施方式的运动图像解码装置700,能够通过不依存于包含co-located块等的参照图片信息的方法计算在将预测运动矢量索引编码或解码时使用的预测运动矢量候选列表尺寸。由此,运动图像解码装置700能够将提高了容错性的比特流适当地解码。
更具体地讲,有关本实施方式的运动图像解码装置700不论co-located块是否是可预测候选,只要预测块候选是co-located块,就总是对可预测候选数加1。并且,运动图像解码装置700使用这样计算出的可预测候选数决定向预测运动矢量索引分配的比特序列。由此,运动图像解码装置700即使是丢失了包含co-located块的参照图片信息的情况,也能够将预测运动矢量索引正常地解码。
此外,有关本实施方式的运动图像解码装置700在预测运动矢量候选数没有达到可预测候选数的情况下,通过追加具有新的预测运动矢量的新候选作为预测运动矢量候选,能够将提高了编码效率的比特流适当地解码。
另外,在本实施方式中,运动图像解码装置700不论co-located块是否是可预测候选,只要预测块候选是co-located块,就总是使用加1而计算出的可预测候选数来决定向预测运动矢量索引分配的比特序列,但并不限定于此。例如,运动图像解码装置700也可以在图40的步骤S714中对co-located块以外的预测块候选也使用必定总是加1而计算出的可预测候选数来决定向预测运动矢量索引分配的比特序列。即,运动图像解码装置700也可以使用固定为预测运动矢量候选数的最大值N的预测运动矢量候选列表尺寸向预测运动矢量索引分配比特序列。即,也可以将全部的预测块候选看作可预测候选,将预测运动矢量候选列表尺寸固定为预测运动矢量候选数的最大值N,将预测运动矢量索引解码。
例如,在本实施方式中,由于预测运动矢量候选数的最大值N是5(邻接块A、邻接块B、co-located块、邻接块C、邻接块D),所以运动图像解码装置700也可以总是对预测运动矢量候选列表尺寸设定5,将预测运动矢量索引解码。由此,运动图像解码装置700的可变长解码部701能够将比特流中的预测运动矢量索引不参照邻接块或co-located块的信息而解码。结果,例如能够将图40的步骤S714及步骤S715的处理等省略,能够削减可变长解码部701的处理量。
图43是表示将预测运动矢量候选列表尺寸固定为预测运动矢量候选数的最大值的情况下的语法的一例的图。在如图43那样将预测运动矢量候选列表尺寸固定为预测运动矢量候选数的最大值的情况下,能够将NumMVPCand从语法中删除。
(实施方式8)
本实施方式是上述有关实施方式7的运动图像解码装置的变形例。以下,具体地说明有关本实施方式8的运动图像解码装置。
图44是表示有关实施方式8的运动图像解码装置800的结构的框图。该运动图像解码装置800将比特流中包含的编码图像按照每个块解码。具体而言,运动图像解码装置800例如将由有关实施方式6的运动图像编码装置600生成的比特流中所包含的编码图像按照每个块解码。运动图像解码装置800具备预测运动矢量候选导出部810、解码部820和预测控制部830。
预测运动矢量候选导出部810对应于上述实施方式7的预测运动矢量块候选计算部711。预测运动矢量候选导出部810导出预测运动矢量候选。并且,预测运动矢量候选导出部810例如生成将所导出的各预测运动矢量候选与用来确定该预测运动矢量候选的索引(预测运动矢量索引)建立对应的预测运动矢量候选列表。
如图44所示,预测运动矢量候选导出部810具备决定部811、第1导出部812、确定部813、判断部814和第2导出部815。
决定部811决定预测运动矢量候选的最大数。即,决定部811决定预测块候选数的最大值N。
例如,决定部811也可以通过与实施方式6的决定部611同样的方法决定预测运动矢量候选的最大数。此外,例如决定部811也可以基于附加在比特流中的表示最大数的信息来决定最大数。由此,运动图像解码装置800能够以适当的单位切换最大数而将编码的图像解码。
另外,这里,决定部811装备在预测运动矢量候选导出部810中,但也可以装备在解码部820中。
第1导出部812与实施方式6的第1导出部612同样,导出第1预测运动矢量候选。具体而言,第1导出部812基于在与解码对象块在空间或时间上邻接的块的解码中使用的运动矢量,导出第1预测运动矢量候选。并且,第1导出部812例如将这样导出的第1预测运动矢量候选与预测运动矢量索引建立对应而登记到预测运动矢量候选列表中。
另外,第1导出部812例如也可以将在与解码对象块在空间上邻接的块中的除了是不可预测候选的块以外的块的解码中使用的运动矢量作为第1预测运动矢量候选导出。由此,为了得到预测运动矢量候选,能够从适当的块导出第1预测运动矢量候选。
确定部813在导出了多个第1预测运动矢量候选的情况下,确定运动矢量与其他第1预测运动矢量候选重复的第1预测运动矢量候选(重复候选)。并且,确定部813将所确定的重复候选从预测运动矢量候选列表中删除。
判断部814判断第1预测运动矢量候选的数量是否比所决定的最大数小。这里,判断部814判断除了所确定的重复的第1预测运动矢量候选以外的第1预测运动矢量候选的数量是否比所决定的最大数小。
第2导出部815在判断为第1预测运动矢量候选的数量比所决定的最大数小的情况下,导出具有预先设定的矢量作为运动矢量的第2预测运动矢量候选。具体而言,第2导出部815导出第2预测运动矢量候选,以使第1预测运动矢量候选的数量与第2预测运动矢量候选的数量之和不超过最大数。这里,第2导出部815导出第2预测运动矢量候选,以使除了重复候选以外的第1预测运动矢量候选的数量与第2预测运动矢量候选的数量之和不超过最大数。
预先设定的矢量例如与上述实施方式3同样,也可以是零矢量。由此,第2导出部815能够将具有静止区域用的运动矢量的预测运动矢量候选导出。因而,运动图像解码装置800能够将提高了编码效率的比特流适当地解码。另外,预先设定的矢量并不需要一定是零矢量。
并且,第2导出部815例如将这样导出的第2预测运动矢量候选与预测运动矢量索引建立对应而登记到预测运动矢量候选列表中。此时,第2导出部815也可以将第2预测运动矢量候选登记到预测运动矢量候选列表中,以对第1预测运动矢量候选分配值比第2预测运动矢量候选小的预测运动矢量索引。由此,运动图像解码装置800能够将提高了编码效率的比特流适当地解码。
另外,第2导出部815并不需要将第2预测运动矢量候选导出以使第1预测运动矢量候选的数量与第2预测运动矢量候选的数量之和必定与所决定的最大数一致。在第1预测运动矢量候选的数量与第2预测运动矢量候选的数量之和比所决定的最大数小的情况下,例如也可以存在没有与预测运动矢量候选建立对应的预测运动矢量索引的值。
解码部820将作为附加在比特流中的编码的索引的、用来确定预测运动矢量候选的索引,使用所决定的最大数解码。
预测控制部830基于解码后的索引,从第1预测运动矢量候选及第2预测运动矢量候选中,选择在解码对象块的解码中使用的预测运动矢量。即,预测控制部830从预测运动矢量候选列表中选择在解码对象块的解码中使用的预测运动矢量。
接着,对如以上那样构成的运动图像解码装置800的各种动作进行说明。
图45是表示有关实施方式8的运动图像解码装置800的处理动作的流程图。
首先,决定部811决定预测运动矢量候选的最大数(S801)。第1导出部812导出第1预测运动矢量候选(S802)。确定部813在导出了多个第1预测运动矢量候选的情况下,确定运动矢量与其他第1预测运动矢量候选重复的第1预测运动矢量候选(重复候选)(S803)。
判断部814判断除了重复候选以外的第1预测运动矢量候选的数量是否比所决定的最大数小(S804)。这里,在判断为除了重复候选以外的第1预测运动矢量候选的数量比所决定的最大数小的情况下(S804的“是”),第2导出部815将第2预测运动矢量候选导出(S805)。另一方面,在没有判断为除了重复候选以外的第1预测运动矢量候选的数量比所决定的最大数小的情况下(S804的“否”),第2导出部815不导出第2预测运动矢量候选。
解码部820将作为附加在比特流中的编码后的索引的、用来确定预测运动矢量候选的索引,使用所决定的最大数解码(S806)。
预测控制部830基于解码后的索引,从第1预测运动矢量候选及第2预测运动矢量候选中,选择在解码对象块的解码中使用的预测运动矢量(S807)。
另外,这里,索引的解码处理(S806)在将预测运动矢量候选导出后进行,但并不需要一定以这样的顺序进行。例如,也可以在索引的解码处理(S806)后进行预测运动矢量候选的导出处理(S802~S805)。此外,索引的解码处理(S806)和预测运动矢量候选的导出处理(S802~S805)也可以并行进行。由此,能够使解码的处理速度提高。
如以上这样,根据有关本实施方式的运动图像解码装置800,能够导出具有预先设定的矢量作为运动矢量的第2预测运动矢量候选。因而,运动图像解码装置800能够将例如具有静止区域用的运动矢量等的预测运动矢量候选作为第2预测运动矢量候选导出。即,运动图像解码装置800能够将有效率地编码了具有预先设定的运动的块的比特流适当地解码,能够将提高了编码效率的比特流适当地解码。
进而,根据有关本实施方式的运动图像解码装置800,能够将用来确定预测运动矢量候选的索引使用所决定的最大数解码。即,能够不依存于实际导出的预测运动矢量候选的数量而将索引解码。因而,即使是丢失了预测运动矢量候选的导出所需要的信息(例如,co-located块等的信息)的情况,运动图像解码装置800也能够将索引解码,能够使容错性提高。进而,运动图像解码装置800能够不等待预测运动矢量候选的导出处理而进行索引的解码处理,能够并行地进行预测运动矢量候选的导出处理和索引的解码处理。
进而,根据有关本实施方式的运动图像解码装置800,在判断为第1预测运动矢量候选的数量比最大数小的情况下,能够导出第2预测运动矢量候选。因而,运动图像解码装置800能够在不超过最大数的范围中使预测运动矢量候选的数量增加,能够将提高了编码效率的比特流适当地解码。
此外,根据有关本实施方式的运动图像解码装置800,能够根据除了重复的第1预测运动矢量候选以外的第1预测运动矢量候选的数量导出第2预测运动矢量候选。结果,运动图像解码装置800能够使第2预测运动矢量候选的数量增加,能够增加能选择为预测运动矢量候选的运动矢量的种类。因而,运动图像解码装置800能够将进一步提高了编码效率的比特流适当地解码。
另外,在本实施方式中,运动图像解码装置800具备确定部813,但与实施方式6同样,并不需要一定具备确定部813。即,在图45所示的流程图中不需要必定包括步骤S803。即使是这样的情况,运动图像解码装置800也能够将用来确定预测运动矢量候选的索引使用所决定的最大数解码,所以能够使容错性提高。
此外,在本实施方式中,如图45所示,在第1导出部812导出第1预测运动矢量候选后,确定部813确定重复候选,但并不需要一定这样依次处理。例如,第1导出部812也可以导出与已经导出了运动矢量的第1预测运动矢量候选不重复的预测运动矢量候选,作为第1预测运动矢量候选。由此,第1导出部812能够将与已经导出了运动矢量的第1预测运动矢量候选重复的预测运动矢量候选从第1预测运动矢量候选中排除。结果,运动图像解码装置800能够使第2预测运动矢量候选的数量增加,能够增加能选择为预测运动矢量候选的运动矢量的种类。因而,运动图像解码装置800能够将进一步提高了编码效率的比特流适当地解码。
以上,基于实施方式对有关本发明的1个或多个技术方案的运动图像编码装置及运动图像解码装置进行了说明,但本发明并不限定于该实施方式。只要不脱离本发明的主旨,对本实施方式实施了本领域的技术人员想到的各种变形后的形态、或将不同的实施方式的构成要素组合而构建的形态也包含在本发明的1个或多个技术方案的范围内。
另外,在上述各实施方式中,各构成要素也可以由专用的硬件构成、或者通过执行适合于各构成要素的软件程序来实现。各构成要素也可以通过CPU或处理器等的程序执行部将记录在硬盘或半导体存储器等的记录介质中的软件程序并执行来实现。这里,实现上述各实施方式的运动图像编码装置或运动图像解码装置等的软件是以下这样的程序。
即,该程序使计算机执行运动图像编码方法,是计算在将编码对象块的运动矢量编码时使用的预测运动矢量、通过将上述编码对象块编码而生成比特流的运动图像编码方法,包括:第1导出步骤,基于在与编码对象块在空间或时间上邻接的块的编码中使用的运动矢量,导出第1预测运动矢量候选;第2导出步骤,导出具有预先设定的矢量作为运动矢量的第2预测运动矢量候选;选择步骤,从上述第1预测运动矢量候选及上述第2预测运动矢量候选中选择在上述编码对象块的上述运动矢量的编码中使用的上述预测运动矢量;编码步骤,将用来确定上述预测运动矢量的索引向上述比特流附加。
或者,该程序使计算机执行运动图像解码方法,是计算在将比特流中包含的解码对象块的运动矢量解码时使用的预测运动矢量、将上述解码对象块解码的运动图像解码方法,包括:第1导出步骤,基于在与解码对象块在空间或时间上邻接的块的解码中使用的运动矢量,导出第1预测运动矢量候选;第2导出步骤,导出具有预先设定的矢量作为运动矢量的第2预测运动矢量候选;取得步骤,从上述比特流中取得用来确定上述预测运动矢量候选的索引;选择步骤,基于所取得的上述索引,从上述第1预测运动矢量候选及上述第2预测运动矢量候选中,选择在将上述解码对象块解码时使用的预测运动矢量。
(实施方式9)
通过将用来实现上述各实施方式所示的运动图像编码方法(图像编码方法)或运动图像解码方法(图像解码方法)的结构的程序记录到存储介质中,能够将上述各实施方式所示的处理在独立的计算机系统中简单地实施。存储介质是磁盘、光盘、光磁盘、IC卡、半导体存储器等,只要是能够记录程序的介质就可以。
进而,这里说明在上述各实施方式中示出的运动图像编码方法(图像编码方法)及运动图像解码方法(图像解码方法)的应用例和使用它的系统。该系统的特征在于,具有由使用图像编码方法的图像编码装置及使用图像解码方法的图像解码装置构成的图像编码解码装置。关于系统的其他结构,可以根据情况而适当变更。
图46是表示实现内容分发服务的内容供给系统ex100的整体结构的图。将通信服务的提供区划分为希望的大小,在各小区内分别设置有作为固定无线站的基站ex106、ex107、ex108、ex109、ex110。
该内容供给系统ex100在因特网ex101上经由因特网服务提供商ex102及电话网ex104、及基站ex107~ex110连接着计算机ex111、PDA(Personal Digital Assistant)ex112、照相机ex113、便携电话ex114、游戏机ex115等的各设备。
但是,内容供给系统ex100并不限定于图46那样的结构,也可以将某些要素组合连接。此外,也可以不经由作为固定无线站的基站ex107~ex110将各设备直接连接在电话网ex104上。此外,也可以将各设备经由近距离无线等直接相互连接。
照相机ex113是能够进行数字摄像机等的运动图像摄影的设备,照相机ex116是能够进行数字照相机等的静止图像摄影、运动图像摄影的设备。此外,便携电话ex114是GSM(Global System for Mobile Communications)方式、CDMA(Code Division MultipleAccess)方式、W-CDMA(Wideband-Code Division Multiple Access)方式、或LTE(LongTerm Evolution)方式、HSPA(High Speed Packet Access)的便携电话机、或PHS(PersonalHandyphone System)等,是哪种都可以。
在内容供给系统ex100中,通过将照相机ex113等经由基站ex109、电话网ex104连接在流媒体服务器ex103上,能够进行现场转播等。在现场转播中,对用户使用照相机ex113摄影的内容(例如音乐会现场的影像等)如在上述各实施方式中说明那样进行编码处理(即,作为本发明的一个方式的图像编码装置发挥作用),向流媒体服务器ex103发送。另一方面,流媒体服务器ex103将发送来的内容数据对有请求的客户端进行流分发。作为客户端,有能够将上述编码处理后的数据解码的计算机ex111、PDAex112、照相机ex113、便携电话ex114、游戏机ex115等。在接收到分发的数据的各设备中,将接收到的数据解码处理而再现(即,作为本发明的一个方式的图像解码装置发挥作用)。
另外,摄影的数据的编码处理既可以由照相机ex113进行,也可以由进行数据的发送处理的流媒体服务器ex103进行,也可以相互分担进行。同样,分发的数据的解码处理既可以由客户端进行,也可以由流媒体服务器ex103进行,也可以相互分担进行。此外,并不限于照相机ex113,也可以将由照相机ex116摄影的静止图像及/或运动图像数据经由计算机ex111向流媒体服务器ex103发送。此情况下的编码处理由照相机ex116、计算机ex111、流媒体服务器ex103的哪个进行都可以,也可以相互分担进行。
此外,这些编码解码处理一般在计算机ex111或各设备具有的LSIex500中处理。LSIex500既可以是单芯片,也可以是由多个芯片构成的结构。另外,也可以将运动图像编码解码用的软件装入到能够由计算机ex111等读取的某些记录介质(CD-ROM、软盘、硬盘等)中、使用该软件进行编码解码处理。进而,在便携电话ex114是带有照相机的情况下,也可以将由该照相机取得的运动图像数据发送。此时的运动图像数据是由便携电话ex114具有的LSIex500编码处理的数据。
此外,也可以是,流媒体服务器ex103是多个服务器或多个计算机,是将数据分散处理、记录、及分发的。
如以上这样,在内容供给系统ex100中,客户端能够接收编码的数据而再现。这样,在内容供给系统ex100中,客户端能够将用户发送的信息实时地接收、解码、再现,即使是没有特别的权利或设备的用户也能够实现个人广播。
另外,并不限定于内容供给系统ex100的例子,如图47所示,在数字广播用系统ex200中也能够装入上述实施方式的至少运动图像编码装置(图像编码装置)或运动图像解码装置(图像解码装置)的某个。具体而言,在广播站ex201中,将对影像数据复用了音乐数据等而得到的复用数据经由电波向通信或广播卫星ex202传送。该影像数据是通过上述各实施方式中说明的运动图像编码方法编码后的数据(即,通过本发明的一个方式的图像编码装置编码后的数据)。接受到该数据的广播卫星ex202发出广播用的电波,能够对该电波进行卫星广播接收的家庭的天线ex204接收该电波,通过电视机(接收机)ex300或机顶盒(STB)ex217等的装置将接收到的复用数据解码并将其再现(即,作为本发明的一个方式的图像解码装置发挥作用)。
此外,也可以是,在将记录在DVD、BD等的记录介质ex215中的复用数据读取并解码、或将影像数据编码再根据情况与音乐信号复用而写入记录介质ex215中的读取器/记录器ex218中也能够安装上述各实施方式所示的运动图像解码装置或运动图像编码装置。在此情况下,可以将再现的影像信号显示在监视器ex219上,通过记录有复用数据的记录介质ex215在其他装置或系统中能够再现影像信号。此外,也可以是,在连接在有线电视用的线缆ex203或卫星/地面波广播的天线ex204上的机顶盒ex217内安装运动图像解码装置,将其用电视机的监视器ex219显示。此时,也可以不是在机顶盒、而在电视机内装入运动图像解码装置。
图48是表示使用在上述各实施方式中说明的运动图像解码方法及运动图像编码方法的电视机(接收机)ex300的图。电视机ex300具备经由接收上述广播的天线ex204或线缆ex203等取得或者输出对影像数据复用了声音数据的复用数据的调谐器ex301、将接收到的复用数据解调或调制为向外部发送的编码数据的调制/解调部ex302、和将解调后的复用数据分离为影像数据、声音数据或将在信号处理部ex306中编码的影像数据、声音数据复用的复用/分离部ex303。
此外,电视机ex300具备:具有将声音数据、影像数据分别解码、或将各自的信息编码的声音信号处理部ex304和影像信号处理部ex305(即,作为本发明的一个方式的图像编码装置或图像解码装置发挥作用)的信号处理部ex306;具有将解码后的声音信号输出的扬声器ex307及显示解码后的影像信号的显示器等的显示部ex308的输出部ex309。进而,电视机ex300具备具有受理用户操作的输入的操作输入部ex312等的接口部ex317。进而,电视机ex300具有合并控制各部的控制部ex310、对各部供给电力的电源电路部ex311。接口部ex317也可以除了操作输入部ex312以外,还具有与读取器/记录器ex218等的外部设备连接的桥接部ex313、用来能够安装SD卡等的记录介质ex216的插槽部ex314、用来与硬盘等的外部记录介质连接的驱动器ex315、与电话网连接的调制解调器ex316等。另外,记录介质ex216是能够通过收存的非易失性/易失性的半导体存储元件电气地进行信息的记录的结构。电视机ex300的各部经由同步总线相互连接。
首先,对电视机ex300将通过天线ex204等从外部取得的复用数据解码、再现的结构进行说明。电视机ex300接受来自遥控器ex220等的用户操作,基于具有CPU等的控制部ex310的控制,将由调制/解调部ex302解调的复用数据用复用/分离部ex303分离。进而,电视机ex300将分离的声音数据用声音信号处理部ex304解码,将分离的影像数据用影像信号处理部ex305使用在上述各实施方式中说明的解码方法解码。将解码后的声音信号、影像信号分别从输出部ex309朝向外部输出。在输出时,可以暂时将这些信号储存到缓冲器ex318、ex319等中,以使声音信号和影像信号同步再现。此外,电视机ex300也可以不是从广播等、而从磁/光盘、SD卡等的记录介质ex215、ex216读出编码的复用数据。接着,对电视机ex300将声音信号或影像信号编码、向外部发送或写入到记录介质等中的结构进行说明。电视机ex300接受来自遥控器ex220等的用户操作,基于控制部ex310的控制,由声音信号处理部ex304将声音信号编码,由影像信号处理部ex305将影像信号使用在上述各实施方式中说明的编码方法编码。将编码后的声音信号、影像信号用复用/分离部ex303复用,向外部输出。在复用时,可以暂时将这些信号储存到缓冲器ex320、ex321等中,以使声音信号和影像信号同步再现。另外,缓冲器ex318、ex319、ex320、ex321既可以如图示那样具备多个,也可以是共用一个以上的缓冲器的结构。进而,在图示以外,也可以是,在例如调制/解调部ex302或复用/分离部ex303之间等也作为避免系统的上溢、下溢的缓冲部而在缓冲器中储存数据。
此外,电视机ex300除了从广播等或记录介质等取得声音数据、影像数据以外,也可以具备受理麦克风或照相机的AV输入的结构,对从它们中取得的数据进行编码处理。另外,这里,将电视机ex300作为能够进行上述编码处理、复用、及外部输出的结构进行了说明,但也可以是,不能进行这些处理,而是仅能够进行上述接收、解码处理、外部输出的结构。
此外,在由读取器/记录器ex218从记录介质将复用数据读出、或写入的情况下,上述解码处理或编码处理由电视机ex300、读取器/记录器ex218的哪个进行都可以,也可以是电视机ex300和读取器/记录器ex218相互分担进行。
作为一例,将从光盘进行数据的读入或写入的情况下的信息再现/记录部ex400的结构表示在图49中。信息再现/记录部ex400具备以下说明的单元ex401、ex402、ex403、ex404、ex405、ex406、ex407。光头ex401对作为光盘的记录介质ex215的记录面照射激光斑而写入信息,检测来自记录介质ex215的记录面的反射光而读入信息。调制记录部ex402电气地驱动内置在光头ex401中的半导体激光器,根据记录数据进行激光的调制。再现解调部ex403将由内置在光头ex401中的光检测器电气地检测到来自记录面的反射光而得到的再现信号放大,将记录在记录介质ex215中的信号成分分离并解调,再现所需要的信息。缓冲器ex404将用来记录到记录介质ex215中的信息及从记录介质ex215再现的信息暂时保持。盘马达ex405使记录介质ex215旋转。伺服控制部ex406一边控制盘马达ex405的旋转驱动一边使光头ex401移动到规定的信息轨道,进行激光斑的追踪处理。系统控制部ex407进行信息再现/记录部ex400整体的控制。上述的读出及写入的处理由系统控制部ex407利用保持在缓冲器ex404中的各种信息、此外根据需要而进行新的信息的生成、追加、并且一边使调制记录部ex402、再现解调部ex403、伺服控制部ex406协调动作、一边通过光头ex401进行信息的记录再现来实现。系统控制部ex407例如由微处理器构成,通过执行读出写入的程序来执行它们的处理。
以上,假设光头ex401照射激光斑而进行了说明,但也可以是使用近场光进行高密度的记录的结构。
在图50中表示作为光盘的记录介质ex215的示意图。在记录介质ex215的记录面上,以螺旋状形成有导引槽(沟),在信息轨道ex230中,预先通过沟的形状的变化而记录有表示盘上的绝对位置的地址信息。该地址信息包括用来确定作为记录数据的单位的记录块ex231的位置的信息,通过在进行记录及再现的装置中将信息轨道ex230再现而读取地址信息,能够确定记录块。此外,记录介质ex215包括数据记录区域ex233、内周区域ex232、外周区域ex234。为了记录用户数据而使用的区域是数据记录区域ex233,配置在比数据记录区域ex233靠内周或外周的内周区域ex232和外周区域ex234用于用户数据的记录以外的特定用途。信息再现/记录部ex400对这样的记录介质ex215的数据记录区域ex233进行编码的声音数据、影像数据或复用了这些数据的编码数据的读写。
以上,举1层的DVD、BD等的光盘为例进行了说明,但并不限定于这些,也可以是多层构造、在表面以外也能够记录的光盘。此外,也可以是在盘的相同的地方使用不同波长的颜色的光记录信息、或从各种角度记录不同的信息的层等、进行多维的记录/再现的构造的光盘。
此外,在数字广播用系统ex200中,也可以由具有天线ex205的车ex210从卫星ex202等接收数据、在车ex210具有的车载导航仪ex211等的显示装置上再现运动图像。另外,车载导航仪ex211的结构可以考虑例如在图48所示的结构中添加GPS接收部的结构,在计算机ex111及便携电话ex114等中也可以考虑同样的结构。
图51A是表示使用在上述实施方式中说明的运动图像解码方法和运动图像编码方法的便携电话ex114的图。便携电话ex114具有由用来在与基站ex110之间收发电波的天线ex350、能够拍摄影像、静止图像的照相机部ex365、显示将由照相机部ex365摄影的影像、由天线ex350接收到的影像等解码后的数据的液晶显示器等的显示部ex358。便携电话ex114还具有包含操作键部ex366的主体部、用来进行声音输出的扬声器等的声音输出部ex357、用来进行声音输入的麦克风等的声音输入部ex356、保存拍摄到的影像、静止图像、录音的声音、或者接收到的影像、静止图像、邮件等的编码后的数据或者解码后的数据的存储器部ex367、或者作为与同样保存数据的记录介质之间的接口部的插槽部ex364。
进而,使用图51B对便携电话ex114的结构例进行说明。便携电话ex114对于合并控制具备显示部ex358及操作键部ex366的主体部的各部的主控制部ex360,将电源电路部ex361、操作输入控制部ex362、影像信号处理部ex355、照相机接口部ex363、LCD(LiquidCrystal Display:液晶显示器)控制部ex359、调制/解调部ex352、复用/分离部ex353、声音信号处理部ex354、插槽部ex364、存储器部ex367经由总线ex370相互连接。
电源电路部ex361如果通过用户的操作使通话结束及电源键成为开启状态,则通过从电池组对各部供给电力,便携电话ex114起动为能够动作的状态。
便携电话ex114基于具有CPU、ROM及RAM等的主控制部ex360的控制,在语音通话模式时,将由声音输入部ex356集音的声音信号通过声音信号处理部ex354变换为数字声音信号,将其用调制/解调部ex352进行波谱扩散处理,由发送/接收部ex351实施数字模拟变换处理及频率变换处理后经由天线ex350发送。此外,便携电话ex114在语音通话模式时,将由天线ex350接收到的接收数据放大并实施频率变换处理及模拟数字变换处理,用调制/解调部ex352进行波谱逆扩散处理,通过声音信号处理部ex354变换为模拟声音数据后,将其经由声音输出部ex357输出。
进而,在数据通信模式时发送电子邮件的情况下,将通过主体部的操作键部ex366等的操作输入的电子邮件的文本数据经由操作输入控制部ex362向主控制部ex360送出。主控制部ex360将文本数据用调制/解调部ex352进行波谱扩散处理,由发送/接收部ex351实施数字模拟变换处理及频率变换处理后,经由天线ex350向基站ex110发送。在接收电子邮件的情况下,对接收到的数据执行上述处理的大致逆处理,并输出到显示部ex350。
在数据通信模式时,在发送影像、静止图像、或者影像和声音的情况下,影像信号处理部ex355将从照相机部ex365供给的影像信号通过上述各实施方式所示的运动图像编码方法进行压缩编码(即,作为本发明的一个方式的图像编码装置发挥作用),将编码后的影像数据送出至复用/分离部ex353。另外,声音信号处理部ex354对通过照相机部ex365拍摄影像、静止图像等的过程中用声音输入部ex356集音的声音信号进行编码,将编码后的声音数据送出至复用/分离部ex353。
复用/分离部ex353通过规定的方式,对从影像信号处理部ex355供给的编码后的影像数据和从声音信号处理部ex354供给的编码后的声音数据进行复用,将其结果得到的复用数据用调制/解调部(调制/解调电路部)ex352进行波谱扩散处理,由发送/接收部ex351实施数字模拟变换处理及频率变换处理后,经由天线ex350发送。
在数据通信模式时接收到链接到主页等的运动图像文件的数据的情况下,或者接收到附加了影像或者声音的电子邮件的情况下,为了对经由天线ex350接收到的复用数据进行解码,复用/分离部ex353通过将复用数据分离,分为影像数据的比特流和声音数据的比特流,经由同步总线ex370将编码后的影像数据向影像信号处理部ex355供给,并将编码后的声音数据向声音信号处理部ex354供给。影像信号处理部ex355通过与上述各实施方式所示的运动图像编码方法相对应的运动图像解码方法进行解码,由此对影像信号进行解码(即,作为本发明的一个方式的图像解码装置发挥作用),经由LCD控制部ex359从显示部ex358显示例如链接到主页的运动图像文件中包含的影像、静止图像。另外,声音信号处理部ex354对声音信号进行解码,从声音输出部ex357输出声音。
此外,上述便携电话ex114等的终端与电视机ex300同样,除了具有编码器、解码器两者的收发型终端以外,还可以考虑只有编码器的发送终端、只有解码器的接收终端的3种安装形式。另外,在数字广播用系统ex200中,设为发送、接收在影像数据中复用了音乐数据等得到的复用数据而进行了说明,但除声音数据之外复用了与影像关联的字符数据等的数据也可以,不是复用数据而是影像数据本身也可以。
这样,将在上述各实施方式中表示的运动图像编码方法或运动图像解码方法用在上述哪种设备、系统中都可以,通过这样,能够得到在上述各实施方式中说明的效果。
此外,本发明并不限定于这样的上述实施方式,能够不脱离本发明的范围而进行各种变形或修正。
(实施方式10)
也可以通过将在上述各实施方式中示出的运动图像编码方法或装置、与依据MPEG-2、MPEG4-AVC、VC-1等不同的标准的运动图像编码方法或装置根据需要而适当切换,来生成影像数据。
这里,在生成分别依据不同的标准的多个影像数据的情况下,在解码时,需要选择对应于各个标准的解码方法。但是,由于不能识别要解码的影像数据依据哪个标准,所以产生不能选择适当的解码方法的问题。
为了解决该问题,在影像数据中复用了声音数据等的复用数据采用包含表示影像数据依据哪个标准的识别信息的结构。以下,说明包括通过在上述各实施方式中示出的运动图像编码方法或装置生成的影像数据在内的复用数据的具体的结构。复用数据是MPEG-2传输流形式的数字流。
图52是表示复用数据的结构的图。如图52所示,复用数据通过将视频流、音频流、演示图形流(PG)、交互图形流中的1个以上进行复用而得到。视频流表示电影的主影像及副影像,音频流(IG)表示电影的主声音部分和与该主声音混合的副声音,演示图形流表示电影的字幕。这里,所谓主影像,表示显示在画面上的通常的影像,所谓副影像,是在主影像中用较小的画面显示的影像。此外,交互图形流表示通过在画面上配置GUI部件而制作的对话画面。视频流通过在上述各实施方式中示出的运动图像编码方法或装置、依据以往的MPEG-2、MPEG4-AVC、VC-1等标准的运动图像编码方法或装置编码。音频流由杜比AC-3、Dolby Digital Plus、MLP、DTS、DTS-HD、或线性PCM等的方式编码。
包含在复用数据中的各流通过PID被识别。例如,对在电影的影像中使用的视频流分配0x1011,对音频流分配0x1100到0x111F,对演示图形分配0x1200到0x121F,对交互图形流分配0x1400到0x141F,对在电影的副影像中使用的视频流分配0x1B00到0x1B1F,对与主声音混合的副声音中使用的音频流分配0x1A00到0x1A1F。
图53是示意地表示复用数据怎样被复用的图。首先,将由多个视频帧构成的视频流ex235、由多个音频帧构成的音频流ex238分别变换为PES包序列ex236及ex239,并变换为TS包ex237及ex240。同样,将演示图形流ex241及交互图形ex244的数据分别变换为PES包序列ex242及ex245,再变换为TS包ex243及ex246。复用数据ex247通过将这些TS包复用到1条流中而构成。
图54更详细地表示在PES包序列中怎样保存视频流。图54的第1段表示视频流的视频帧序列。第2段表示PES包序列。如图54的箭头yy1、yy2、yy3、yy4所示,视频流中的多个作为Video Presentation Unit的I图片、B图片、P图片按每个图片被分割并保存到PES包的有效载荷中。各PES包具有PES头,在PES头中,保存有作为图片的显示时刻的PTS(Presentation Time-Stamp)及作为图片的解码时刻的DTS(Decoding Time-Stamp)。
图55表示最终写入在复用数据中的TS包的形式。TS包是由具有识别流的PID等信息的4字节的TS头和保存数据的184字节的TS有效载荷构成的188字节固定长度的包,上述PES包被分割并保存到TS有效载荷中。在BD-ROM的情况下,对于TS包赋予4字节的TP_Extra_Header,构成192字节的源包,写入到复用数据中。在TP_Extra_Header中记载有ATS(Arrival_Time_Stamp)等信息。ATS表示该TS包向解码器的PID滤波器的转送开始时刻。在复用数据中,源包如图55下段所示排列,从复用数据的开头起递增的号码被称作SPN(源包号)。
此外,在复用数据所包含的TS包中,除了影像、声音、字幕等的各流以外,还有PAT(Program Association Table)、PMT(Program Map Table)、PCR(Program ClockReference)等。PAT表示在复用数据中使用的PMT的PID是什么,PAT自身的PID被登记为0。PMT具有复用数据所包含的影像、声音、字幕等的各流的PID、以及与各PID对应的流的属性信息,还具有关于复用数据的各种描述符。在描述符中,有指示许可/不许可复用数据的拷贝的拷贝控制信息等。PCR为了取得作为ATS的时间轴的ATC(Arrival Time Clock)与作为PTS及DTS的时间轴的STC(System Time Clock)的同步,拥有与该PCR包被转送至解码器的ATS对应的STC时间的信息。
图56是详细地说明PMT的数据构造的图。在PMT的开头,配置有记述了包含在该PMT中的数据的长度等的PMT头。在其后面,配置有多个关于复用数据的描述符。上述拷贝控制信息等被记载为描述符。在描述符之后,配置有多个关于包含在复用数据中的各流的流信息。流信息由记载有用来识别流的压缩编解码器的流类型、流的PID、流的属性信息(帧速率、纵横比等)的流描述符构成。流描述符存在复用数据中存在的流的数量。
在记录到记录介质等中的情况下,将上述复用数据与复用数据信息文件一起记录。
复用数据信息文件如图57所示,是复用数据的管理信息,与复用数据一对一地对应,由复用数据信息、流属性信息以及入口映射构成。
复用数据信息如图57所示,由系统速率、再现开始时刻、再现结束时刻构成。系统速率表示复用数据的向后述的系统目标解码器的PID滤波器的最大转送速率。包含在复用数据中的ATS的间隔设定为成为系统速率以下。再现开始时刻是复用数据的开头的视频帧的PTS,再现结束时刻设定为对复用数据的末端的视频帧的PTS加上1帧量的再现间隔的值。
流属性信息如图58所示,按每个PID登记有关于包含在复用数据中的各流的属性信息。属性信息具有按视频流、音频流、演示图形流、交互图形流而不同的信息。视频流属性信息具有该视频流由怎样的压缩编解码器压缩、构成视频流的各个图片数据的分辨率是多少、纵横比是多少、帧速率是多少等的信息。音频流属性信息具有该音频流由怎样的压缩编解码器压缩、包含在该音频流中的声道数是多少、对应于哪种语言、采样频率是多少等的信息。这些信息用于在播放器再现之前的解码器的初始化等中。
在本实施方式中,使用上述复用数据中的、包含在PMT中的流类型。此外,在记录介质中记录有复用数据的情况下,使用包含在复用数据信息中的视频流属性信息。具体而言,在上述各实施方式示出的运动图像编码方法或装置中,设置如下步骤或单元,该步骤或单元对包含在PMT中的流类型、或视频流属性信息,设定表示是通过在上述各实施方式中示出的运动图像编码方法或装置生成的影像数据的固有信息。通过该结构,能够识别通过在上述各实施方式中示出的运动图像编码方法或装置生成的影像数据、和依据其他标准的影像数据。
此外,在图59中表示本实施方式的运动图像解码方法的步骤。在步骤exS100中,从复用数据中取得包含在PMT中的流类型、或包含在复用数据信息中的视频流属性信息。接着,在步骤exS101中,判断流类型、或视频流属性信息是否表示是通过在上述各实施方式中示出的运动图像编码方法或装置生成的复用数据。并且,在判断为流类型、或视频流属性信息是通过在上述各实施方式中示出的运动图像编码方法或装置生成的复用数据情况下,在步骤exS102中,通过在上述各实施方式中示出的运动图像解码方法进行解码。此外,在流类型、或视频流属性信息表示是依据以往的MPEG-2、MPEG4-AVC、VC-1等的标准的复用数据的情况下,在步骤exS103中,通过依据以往的标准的运动图像解码方法进行解码。
这样,通过在流类型、或视频流属性信息中设定新的固有值,在解码时能够判断是否能够通过在上述各实施方式中示出的运动图像解码方法或装置解码。因而,在被输入了依据不同的标准的复用数据的情况下,也能够选择适当的解码方法或装置,所以能够不发生错误地进行解码。此外,将在本实施方式中示出的运动图像编码方法或装置、或者运动图像解码方法或装置用在上述任何设备、系统中。
(实施方式11)
在上述各实施方式中示出的运动图像编码方法及装置、运动图像解码方法及装置典型地可以由作为集成电路的LSI实现。作为一例,在图60中表示1芯片化的LSIex500的结构。LSIex500具备以下说明的单元ex501、ex502、ex503、ex504、ex505、ex506、ex507、ex508、ex509,各单元经由总线ex510连接。电源电路部ex505通过在电源是开启状态的情况下对各部供给电力,起动为能够动作的状态。
例如在进行编码处理的情况下,LSIex500基于具有CPUex502、存储器控制器ex503、流控制器ex504、驱动频率控制部ex512等的控制部ex501的控制,通过AV I/Oex509从麦克风ex117及照相机ex113等输入AV信号。被输入的AV信号暂时储存在SDRAM等的外部的存储器ex511中。基于控制部ex501的控制,将储存的数据根据处理量及处理速度适当地分为多次等,向信号处理部ex507发送,在信号处理部ex507中进行声音信号的编码及/或影像信号的编码。这里,影像信号的编码处理是在上述各实施方式中说明的编码处理。在信号处理部ex507中,还根据情况而进行将编码的声音数据和编码的影像数据复用等的处理,从流I/Oex506向外部输出。将该输出的比特流向基站ex107发送、或写入到记录介质ex215中。另外,在复用时,可以暂时将数据储存到缓冲器ex508中以使其同步。
另外,在上述中,设存储器ex511为LSIex500的外部的结构进行了说明,但也可以是包含在LSIex500的内部中的结构。缓冲器ex508也并不限定于一个,也可以具备多个缓冲器。此外,LSIex500既可以形成1个芯片,也可以形成多个芯片。
此外,在上述中,假设控制部ex510具有CPUex502、存储器控制器ex503、流控制器ex504、驱动频率控制部ex512等,但控制部ex510的结构并不限定于该结构。例如,也可以是信号处理部ex507还具备CPU的结构。通过在信号处理部ex507的内部中也设置CPU,能够进一步提高处理速度。此外,作为其他例,也可以是CPUex502具备信号处理部ex507、或作为信号处理部ex507的一部分的例如声音信号处理部的结构。在这样的情况下,控制部ex501为具备具有信号处理部ex507或其一部分的CPUex502的结构。
另外,这里设为LSI,但根据集成度的差异,也有称作IC、系统LSI、超级(super)LSI、特级(ultra)LSI的情况。
此外,集成电路化的方法并不限定于LSI,也可以由专用电路或通用处理器实现。也可以利用在LSI制造后能够编程的FPGA(Field Programmable Gate Array)、或能够重构LSI内部的电路单元的连接及设定的可重构处理器。
进而,如果因半导体技术的进步或派生的其他技术而出现代替LSI的集成电路化的技术,则当然也可以使用该技术进行功能模块的集成化。有可能是生物技术的应用等。
(实施方式12)
在将通过在上述各实施方式中示出的运动图像编码方法或装置生成的影像数据解码的情况下,考虑到与将依据以往的MPEG-2、MPEG4-AVC、VC-1等标准的影像数据的情况相比处理量会增加。因此,在LSIex500中,需要设定为比将依据以往的标准的影像数据解码时的CPUex502的驱动频率更高的驱动频率。但是,如果将驱动频率设得高,则发生消耗电力变高的问题。
为了解决该问题,电视机ex300、LSIex500等的运动图像解码装置采用识别影像数据依据哪个标准、并根据标准切换驱动频率的结构。图61表示本实施方式的结构ex800。驱动频率切换部ex803在影像数据是通过在上述各实施方式中示出的运动图像编码方法或装置生成的情况下,将驱动频率设定得高。并且,对执行在上述各实施方式中示出的运动图像解码方法的解码处理部ex801指示将影像数据解码。另一方面,在影像数据是依据以往的标准的影像数据的情况下,与影像数据是通过在上述各实施方式中示出的运动图像编码方法或装置生成的数据的情况相比,将驱动频率设定得低。并且,对依据以往的标准的解码处理部ex802指示将影像数据解码。
更具体地讲,驱动频率切换部ex803由图60的CPUex502和驱动频率控制部ex512构成。此外,执行在上述各实施方式中示出的运动图像解码方法的解码处理部ex801、以及依据以往的标准的解码处理部ex802对应于图60的信号处理部ex507。CPUex502识别影像数据依据哪个标准。并且,基于来自CPUex502的信号,驱动频率控制部ex512设定驱动频率。此外,基于来自CPUex502的信号,信号处理部ex507进行影像数据的解码。这里,可以考虑在影像数据的识别中使用例如在实施方式10中记载的识别信息。关于识别信息,并不限定于在实施方式10中记载的信息,只要是能够识别影像数据依据哪个标准的信息就可以。例如,在基于识别影像数据利用于电视机还是利用于盘等的外部信号,来能够识别影像数据依据哪个标准的情况下,也可以基于这样的外部信号进行识别。此外,CPUex502的驱动频率的选择例如可以考虑如图63所示的将影像数据的标准与驱动频率建立对应的查找表进行。将查找表预先保存到缓冲器ex508、或LSI的内部存储器中,CPUex502通过参照该查找表,能够选择驱动频率。
图62表示实施本实施方式的方法的步骤。首先,在步骤exS200中,在信号处理部ex507中,从复用数据中取得识别信息。接着,在步骤exS201中,在CPUex502中,基于识别信息识别影像数据是否是通过在上述各实施方式中示出的编码方法或装置生成的数据。在影像数据是通过在上述各实施方式中示出的编码方法或装置生成的数据的情况下,在步骤exS202中,CPUex502向驱动频率控制部ex512发送将驱动频率设定得高的信号。并且,在驱动频率控制部ex512中设定为高的驱动频率。另一方面,在表示是依据以往的MPEG-2、MPEG4-AVC、VC-1等的标准的影像数据的情况下,在步骤exS203中,CPUex502向驱动频率控制部ex512发送将驱动频率设定得低的信号。并且,在驱动频率控制部ex512中,设定为与影像数据是通过在上述各实施方式中示出的编码方法或装置生成的数据的情况相比更低的驱动频率。
进而,通过与驱动频率的切换连动而变更对LSIex500或包括LSIex500的装置施加的电压,由此能够进一步提高节电效果。例如,在将驱动频率设定得低的情况下,随之,可以考虑与将驱动频率设定得高的情况相比,将对LSIex500或包括LSIex500的装置施加的电压设定得低。
此外,驱动频率的设定方法只要是在解码时的处理量大的情况下将驱动频率设定得高、在解码时的处理量小的情况下将驱动频率设定得低就可以,并不限定于上述的设定方法。例如,可以考虑在将依据MPEG4-AVC标准的影像数据解码的处理量大于将通过在上述各实施方式中示出的运动图像编码方法或装置生成的影像数据解码的处理量的情况下,与上述的情况相反地进行驱动频率的设定。
进而,驱动频率的设定方法并不限定于使驱动频率低的结构。例如,也可以考虑在识别信息是通过在上述各实施方式中示出的运动图像编码方法或装置生成的影像数据的情况下,将对LSIex500或包括LSIex500的装置施加的电压设定得高,在表示是依据以往的MPEG-2、MPEG4-AVC、VC-1等的标准的影像数据的情况下,将对LSIex500或包括LSIex500的装置施加的电压设定得低。此外,作为另一例,也可以考虑在识别信息表示是通过在上述各实施方式中示出的运动图像编码方法或装置生成的影像数据的情况下,不使CPUex502的驱动停止,在表示是依据以往的MPEG-2、MPEG4-AVC、VC-1等的标准的影像数据的情况下,由于在处理中有富余,所以使CPUex502的驱动暂停。也可以考虑在识别信息表示是通过在上述各实施方式中示出的运动图像编码方法或装置生成的影像数据的情况下,也只要在处理中有富余则使CPUex502的驱动暂停。在此情况下,可以考虑与表示是依据以往的MPEG-2、MPEG4-AVC、VC-1等的标准的影像数据的情况相比,将停止时间设定得短。
这样,根据影像数据所依据的标准来切换驱动频率,由此能够实现节电化。此外,在使用电池来驱动LSIex500或包括LSIex500的装置的情况下,能够随着节电而延长电池的寿命。
(实施方式13)
在电视机、便携电话等上述的设备、系统中,有时被输入依据不同的标准的多个影像数据。这样,为了使得在被输入了依据不同的标准的多个影像数据的情况下也能够解码,LSIex500的信号处理部ex507需要对应于多个标准。但是,如果单独使用对应于各个标准的信号处理部ex507,则发生LSIex500的电路规模变大、此外成本增加的问题。
为了解决该问题,采用将用来执行在上述各实施方式中示出的运动图像解码方法的解码处理部、和依据以往的MPEG-2、MPEG4-AVC、VC-1等的标准的解码处理部一部分共用的结构。图64A的ex900表示该结构例。例如,在上述各实施方式中示出的运动图像解码方法和依据MPEG4-AVC标准的运动图像解码方法在熵编码、逆量化、解块滤波器、运动补偿等的处理中有一部分处理内容共通。可以考虑如下结构:关于共通的处理内容,共用对应于MPEG4-AVC标准的解码处理部ex902,关于不对应于MPEG4-AVC标准的本发明的一个方式所特有的其他的处理内容,使用专用的解码处理部ex901。特别是,本发明的一个方式在运动补偿方面具有特征,因此可以考虑例如对于运动补偿使用专用的解码处理部ex901,对于除此之外的熵解码、解块滤波、逆量化中的某一个或者全部的处理,共用解码处理部。关于解码处理部的共用,也可以是如下结构:关于共通的处理内容,共用用来执行在上述各实施方式中示出的运动图像解码方法的解码处理部,关于MPEG4-AVC标准所特有的处理内容,使用专用的解码处理部。
此外,用图64B的ex1000表示将处理一部分共用的另一例。在该例中,采用使用与本发明的一个方式所特有的处理内容对应的专用的解码处理部ex1001、和与其他的以往标准所特有的处理内容对应的专用的解码处理部ex1002、和与在本发明的一个方式的运动图像解码方法和其他的以往标准的运动图像解码方法中共通的处理内容对应的共用的解码处理部ex1003的结构。这里,专用的解码处理部ex1001、ex1002并不一定是为本发明的一个方式、或者其他的以往标准所特有的处理内容而特殊化的,可以是能够执行其他的通用处理的结构。此外,也能够由LSIex500安装本实施方式的结构。
这样,对于在本发明的一个方式的运动图像解码方法和以往的标准的运动图像解码方法中共通的处理内容,共用解码处理部,由此能够减小LSI的电路规模并且降低成本。
产业上的可利用性
有关本发明的运动图像编码方法及运动图像解码方法能够应用于所有的多媒体数据,能够使编码效率提高,例如作为使用便携电话、DVD装置及个人计算机等的储存、传送、通信等中的运动图像编码方法及运动图像解码方法是有用的。
标号说明
100、200、500、600 运动图像编码装置
101、501 减法部
102、502 正交变换部
103、503 量化部
104、302、504、702 逆量化部
105、303、505、703 逆正交变换部
106、304、506、704 加法部
107、305、507、705 块存储器
108、306、508、706 帧存储器
109、307、509、707 帧内预测部
110、308、510、708 帧间预测部
111、309、511、709 帧间预测控制部
112、512 图片类型决定部
113、310、513、710 开关
114、311、514、711 预测运动矢量候选计算部
115、312、515、712colPic 存储器
116、516 可变长编码部
210、410、610、810 预测运动矢量候选导出部
211、411、612、812 第1导出部
212、412、615、815 第2导出部
220、430、620、830 预测控制部
230、630 编码部
300、400、700、800 运动图像解码装置
301、701 可变长解码部
420、820 解码部
611、811 决定部
613、813 确定部
614、814 判断部

Claims (5)

1.一种运动图像编码方法,将编码对象块编码,其特征在于,包括如下步骤:
确定最大候选数;
导出具有根据在第1块的编码中使用的第1运动矢量而导出的第1预测运动矢量的1个以上的第1候选,以使得上述第1候选的总数不超过上述最大候选数;
判断上述第1候选的总数是否比上述最大候选数小;
在上述第1候选的总数比上述最大候选数小的情况下,导出具有作为零矢量的第2预测运动矢量的第2候选;
将与具有预测运动矢量的候选相对应的索引编码;以及
生成包含编码后的上述索引的比特流,
上述最大候选数被用于上述索引的编码;
上述候选是包含上述1个以上的第1候选及上述第2候选在内的多个候选中的一个。
2.如权利要求1所述的运动图像编码方法,其特征在于,
上述编码对象块的运动矢量是上述编码对象块的差分运动矢量与上述预测运动矢量之和。
3.如权利要求1所述的运动图像编码方法,其特征在于,
上述第1预测运动矢量与上述第1运动矢量一致。
4.如权利要求1所述的运动图像编码方法,其特征在于,
上述最大候选数根据标准预先确定。
5.一种运动图像编码装置,将编码对象块编码,其特征在于,
具备:
确定器,确定最大候选数;
第1导出器,导出具有根据在第1块的编码中使用的第1运动矢量而导出的第1预测运动矢量的1个以上的第1候选,以使得上述第1候选的总数不超过上述最大候选数;
判断器,判断上述第1候选的总数是否比上述最大候选数小;
第2导出器,在上述第1候选的总数比上述最大候选数小的情况下,导出具有作为零矢量的第2预测运动矢量的第2候选;
编码器,将与具有预测运动矢量的候选相对应的索引编码;以及
生成器,生成包含编码后的上述索引的比特流,
上述最大候选数被用于上述索引的编码;
上述候选是包含上述1个以上的第1候选及上述第2候选在内的多个候选中的一个。
CN201710520606.1A 2011-05-31 2012-05-29 运动图像编码方法、运动图像编码装置 Active CN107257483B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161491381P 2011-05-31 2011-05-31
US61/491,381 2011-05-31
CN201280024467.9A CN103548351B (zh) 2011-05-31 2012-05-29 运动图像解码方法及运动图像解码装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201280024467.9A Division CN103548351B (zh) 2011-05-31 2012-05-29 运动图像解码方法及运动图像解码装置

Publications (2)

Publication Number Publication Date
CN107257483A true CN107257483A (zh) 2017-10-17
CN107257483B CN107257483B (zh) 2020-01-21

Family

ID=47258784

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201710520606.1A Active CN107257483B (zh) 2011-05-31 2012-05-29 运动图像编码方法、运动图像编码装置
CN201280024467.9A Active CN103548351B (zh) 2011-05-31 2012-05-29 运动图像解码方法及运动图像解码装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201280024467.9A Active CN103548351B (zh) 2011-05-31 2012-05-29 运动图像解码方法及运动图像解码装置

Country Status (12)

Country Link
US (8) US8989271B2 (zh)
EP (3) EP3629583B1 (zh)
JP (4) JP5937589B2 (zh)
KR (1) KR101889582B1 (zh)
CN (2) CN107257483B (zh)
CA (1) CA2834191C (zh)
ES (1) ES2779226T3 (zh)
MX (1) MX2013012209A (zh)
PL (2) PL3629583T3 (zh)
RU (1) RU2614542C2 (zh)
TW (1) TW201304552A (zh)
WO (1) WO2012164908A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020135467A1 (zh) * 2018-12-29 2020-07-02 华为技术有限公司 帧间预测方法、装置以及相应的编码器和解码器

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2487200A (en) 2011-01-12 2012-07-18 Canon Kk Video encoding and decoding with improved error resilience
US9066110B2 (en) 2011-03-08 2015-06-23 Texas Instruments Incorporated Parsing friendly and error resilient merge flag coding in video coding
WO2012140821A1 (ja) 2011-04-12 2012-10-18 パナソニック株式会社 動画像符号化方法、動画像符号化装置、動画像復号化方法、動画像復号化装置、および動画像符号化復号化装置
GB2491589B (en) * 2011-06-06 2015-12-16 Canon Kk Method and device for encoding a sequence of images and method and device for decoding a sequence of image
CA2838214C (en) * 2011-06-13 2019-02-12 Panasonic Corporation Image decoding method, image coding method, image decoding apparatus, image coding apparatus, and image coding and decoding apparatus
US10264276B2 (en) 2011-06-14 2019-04-16 Samsung Electronics Co., Ltd. Method and apparatus for encoding motion information and method and apparatus for decoding same
US9866859B2 (en) * 2011-06-14 2018-01-09 Texas Instruments Incorporated Inter-prediction candidate index coding independent of inter-prediction candidate list construction in video coding
AU2015200192B2 (en) * 2011-06-14 2016-08-04 Samsung Electronics Co., Ltd. Method and apparatus for encoding motion information and method and apparatus for decoding same
CN103621090B (zh) 2011-06-24 2017-09-15 寰发股份有限公司 移除运动向量预测子中冗余的方法与装置
JP6322136B2 (ja) 2011-06-27 2018-05-09 サムスン エレクトロニクス カンパニー リミテッド 動き情報の符号化方法及び該装置、その復号化方法及び該装置
WO2013001749A1 (ja) 2011-06-29 2013-01-03 パナソニック株式会社 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置および画像符号化復号装置
JP2013012905A (ja) * 2011-06-29 2013-01-17 Sony Corp 画像処理装置および方法
CN103636218B (zh) * 2011-06-30 2017-07-28 Jvc建伍株式会社 图像解码装置和图像解码方法
CN106851269B (zh) 2011-06-30 2019-11-15 太阳专利托管公司 图像解码方法及装置、图像编码方法及装置、编解码装置
MY167857A (en) 2011-08-11 2018-09-26 Sun Patent Trust Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus
KR20130030181A (ko) * 2011-09-16 2013-03-26 한국전자통신연구원 움직임 벡터 예측기를 이용한 움직임 벡터 부호화/복호화 방법 및 장치
TWI586155B (zh) 2011-09-28 2017-06-01 Jvc Kenwood Corp A motion picture decoding apparatus, a motion picture decoding method, and a recording medium
JP5884697B2 (ja) * 2011-09-28 2016-03-15 株式会社Jvcケンウッド 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、送信装置、送信方法及び送信プログラム
JP5488666B2 (ja) * 2011-09-28 2014-05-14 株式会社Jvcケンウッド 動画像復号装置、動画像復号方法、動画像復号プログラム、受信装置、受信方法及び受信プログラム
CN108881903B (zh) 2011-10-19 2022-01-04 太阳专利托管公司 图像编码方法及装置、图像解码方法及装置、编解码装置
JP5942782B2 (ja) * 2011-10-31 2016-06-29 株式会社Jvcケンウッド 動画像復号装置、動画像復号方法、動画像復号プログラム、受信装置、受信方法及び受信プログラム
US20130177084A1 (en) * 2012-01-10 2013-07-11 Qualcomm Incorporated Motion vector scaling in video coding
WO2013107028A1 (en) * 2012-01-19 2013-07-25 Mediatek Singapore Pte. Ltd. Methods and apparatuses of amvp simplification
EP3716621B1 (en) 2012-04-12 2021-12-01 JVCKENWOOD Corporation Moving picture coding device, moving picture coding method, moving picture coding program, and moving picture decoding device, moving picture decoding method, moving picture decoding program
JP5633597B2 (ja) * 2012-04-12 2014-12-03 株式会社Jvcケンウッド 動画像復号装置、動画像復号方法、動画像復号プログラム、受信装置、受信方法及び受信プログラム
JP6020323B2 (ja) * 2012-04-12 2016-11-02 株式会社Jvcケンウッド 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、送信装置、送信方法及び送信プログラム
JP6157114B2 (ja) * 2012-12-28 2017-07-05 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
US9826239B2 (en) 2013-01-07 2017-11-21 Lg Electronics Inc. Video signal processing method and device
CN103079067B (zh) * 2013-01-09 2016-03-09 华为技术有限公司 运动矢量预测值列表构建方法和视频编解码方法及装置
EP3308540B1 (en) 2015-06-09 2020-04-15 Microsoft Technology Licensing, LLC Robust encoding/decoding of escape-coded pixels in palette mode
US10560718B2 (en) * 2016-05-13 2020-02-11 Qualcomm Incorporated Merge candidates for motion vector prediction for video coding
WO2018181252A1 (en) * 2017-03-28 2018-10-04 Panasonic Intellectual Property Corporation Of America Encoding apparatus, decoding apparatus, encoding method, and decoding method
US10284869B2 (en) 2017-09-28 2019-05-07 Google Llc Constrained motion field estimation for hardware efficiency
US10880573B2 (en) * 2017-08-15 2020-12-29 Google Llc Dynamic motion vector referencing for video coding
CN110662052B (zh) * 2018-06-29 2022-07-08 北京字节跳动网络技术有限公司 更新查找表(lut)的条件
TWI744661B (zh) 2018-06-29 2021-11-01 大陸商北京字節跳動網絡技術有限公司 要根據模式檢查的查找表中的運動候選的數量
KR20210025537A (ko) 2018-06-29 2021-03-09 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 하나 또는 다수의 룩업 테이블들을 사용하여 이전에 코딩된 모션 정보를 순서대로 저장하고 이를 사용하여 후속 블록들을 코딩하는 개념
BR112020024142A2 (pt) 2018-06-29 2021-03-02 Beijing Bytedance Network Technology Co., Ltd. método para processamento de vídeo, aparelho para codificação de dados de vídeo, meio de armazenamento e meio de gravação legíveis por computador não transitório
KR20240005239A (ko) 2018-06-29 2024-01-11 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 Lut와 amvp 사이의 상호작용
CN114845108A (zh) 2018-06-29 2022-08-02 抖音视界(北京)有限公司 查找表的更新:fifo、约束的fifo
CN110662056B (zh) 2018-06-29 2022-06-07 北京字节跳动网络技术有限公司 哪个查找表需要更新或不更新
CN114885173A (zh) 2018-06-29 2022-08-09 抖音视界(北京)有限公司 Lut中的运动候选的检查顺序
TWI731364B (zh) 2018-07-02 2021-06-21 大陸商北京字節跳動網絡技術有限公司 Hmvp+非相鄰運動
GB2590310B (en) 2018-09-12 2023-03-22 Beijing Bytedance Network Tech Co Ltd Conditions for starting checking HMVP candidates depend on total number minus K
US11317099B2 (en) * 2018-10-05 2022-04-26 Tencent America LLC Method and apparatus for signaling an offset in video coding for intra block copy and/or inter prediction
KR20240010576A (ko) 2019-01-10 2024-01-23 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 Lut 업데이트의 호출
WO2020143824A1 (en) 2019-01-13 2020-07-16 Beijing Bytedance Network Technology Co., Ltd. Interaction between lut and shared merge list
WO2020147773A1 (en) 2019-01-16 2020-07-23 Beijing Bytedance Network Technology Co., Ltd. Inserting order of motion candidates in lut
CN113615193A (zh) 2019-03-22 2021-11-05 北京字节跳动网络技术有限公司 Merge列表构建和其他工具之间的交互
WO2020224639A1 (en) * 2019-05-09 2020-11-12 Beijing Bytedance Network Technology Co., Ltd. Improvement on hmvp table

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008283490A (ja) * 2007-05-10 2008-11-20 Ntt Docomo Inc 動画像符号化装置、方法及びプログラム、並びに動画像復号化装置、方法及びプログラム
US20090304084A1 (en) * 2008-03-19 2009-12-10 Nokia Corporation Combined motion vector and reference index prediction for video coding

Family Cites Families (146)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0314018B1 (en) 1987-10-30 1993-09-01 Nippon Telegraph And Telephone Corporation Method and apparatus for multiplexed vector quantization
FR2725577B1 (fr) 1994-10-10 1996-11-29 Thomson Consumer Electronics Procede de codage ou de decodage de vecteurs mouvement et dispositif de codage ou de decodage mettant en oeuvre ledit procede
US5995080A (en) 1996-06-21 1999-11-30 Digital Equipment Corporation Method and apparatus for interleaving and de-interleaving YUV pixel data
JP3263807B2 (ja) 1996-09-09 2002-03-11 ソニー株式会社 画像符号化装置および画像符号化方法
US6148026A (en) 1997-01-08 2000-11-14 At&T Corp. Mesh node coding to enable object based functionalities within a motion compensated transform video coder
JPH10224800A (ja) 1997-02-07 1998-08-21 Matsushita Electric Ind Co Ltd 動きベクトル符号化方法および復号化方法
US6043838A (en) 1997-11-07 2000-03-28 General Instrument Corporation View offset estimation for stereoscopic video coding
JP4004653B2 (ja) 1998-08-03 2007-11-07 カスタム・テクノロジー株式会社 動きベクトル検出方法および装置、記録媒体
US6192148B1 (en) 1998-11-05 2001-02-20 Winbond Electronics Corp. Method for determining to skip macroblocks in encoding video
US6192080B1 (en) 1998-12-04 2001-02-20 Mitsubishi Electric Research Laboratories, Inc. Motion compensated digital video signal processing
US6594313B1 (en) * 1998-12-23 2003-07-15 Intel Corporation Increased video playback framerate in low bit-rate video applications
JP4487374B2 (ja) 1999-06-01 2010-06-23 ソニー株式会社 符号化装置及び符号化方法並びに多重化装置及び多重化方法
US6842483B1 (en) 2000-09-11 2005-01-11 The Hong Kong University Of Science And Technology Device, method and digital video encoder for block-matching motion estimation
JP2002152750A (ja) 2000-11-10 2002-05-24 Matsushita Electric Ind Co Ltd 動きベクトル検出方法および装置
EP2271110B1 (en) 2001-11-06 2016-09-21 Panasonic Intellectual Property Corporation of America Moving picture coding method and moving picture decoding method
JP4015934B2 (ja) 2002-04-18 2007-11-28 株式会社東芝 動画像符号化方法及び装置
JP2004088722A (ja) 2002-03-04 2004-03-18 Matsushita Electric Ind Co Ltd 動画像符号化方法および動画像復号化方法
TWI259726B (en) 2002-04-19 2006-08-01 Matsushita Electric Ind Co Ltd Motion vector derivation method
PT3525465T (pt) 2002-04-19 2021-05-10 Panasonic Ip Corp America Método e aparelho de descodificação de imagens
EP3525467B1 (en) 2002-04-19 2021-02-24 Panasonic Intellectual Property Corporation of America Bitstream decoding method and apparatus
US20040001546A1 (en) 2002-06-03 2004-01-01 Alexandros Tourapis Spatiotemporal prediction for bidirectionally predictive (B) pictures and motion vector prediction for multi-picture reference motion compensation
CN1666532A (zh) 2002-07-02 2005-09-07 松下电器产业株式会社 图像编码方法和图像解码方法
US8406301B2 (en) 2002-07-15 2013-03-26 Thomson Licensing Adaptive weighting of reference pictures in video encoding
CA2448064C (en) 2002-07-11 2012-08-07 Matsushita Electric Industrial Co., Ltd. Filtering strength determination method, moving picture coding method and moving picture decoding method
CN101043626B (zh) 2002-07-15 2010-06-09 株式会社日立制作所 动态图像编码方法
US7154952B2 (en) 2002-07-19 2006-12-26 Microsoft Corporation Timestamp-independent motion vector prediction for predictive (P) and bidirectionally predictive (B) pictures
US7023921B2 (en) 2002-08-06 2006-04-04 Motorola, Inc. Method and apparatus for determining block match quality
CN1568622B (zh) 2002-08-08 2010-05-26 松下电器产业株式会社 图像编码方法及图像编码装置
KR100506864B1 (ko) * 2002-10-04 2005-08-05 엘지전자 주식회사 모션벡터 결정방법
EP1562385B1 (en) 2002-11-01 2014-07-02 Panasonic Corporation Motion picture encoding method and motion picture decoding method
BRPI0307197B1 (pt) 2002-11-25 2018-06-19 Godo Kaisha Ip Bridge 1 Método de compensação de movimento, método de codificação de imagem e método de decodificação de imagem
AU2004214313B2 (en) 2003-02-18 2010-05-20 Nokia Technologies Oy Picture coding method
KR100693669B1 (ko) 2003-03-03 2007-03-09 엘지전자 주식회사 피일드 매크로 블록의 레퍼런스 픽쳐 결정 방법
US7266147B2 (en) 2003-03-31 2007-09-04 Sharp Laboratories Of America, Inc. Hypothetical reference decoder
MXPA06000555A (es) 2003-07-15 2006-07-10 Thomson Licensing Calculo de movimiento con coincidencia del bloque de busqueda rapida.
US7426308B2 (en) 2003-07-18 2008-09-16 Microsoft Corporation Intraframe and interframe interlace coding and decoding
KR100579542B1 (ko) 2003-07-29 2006-05-15 삼성전자주식회사 블럭 간의 상관성을 고려한 움직임 추정 장치 및 방법
CN100469142C (zh) 2003-08-05 2009-03-11 Nxp股份有限公司 视频编码和解码方法以及相应的设备
US8064520B2 (en) * 2003-09-07 2011-11-22 Microsoft Corporation Advanced bi-directional predictive coding of interlaced video
CN1225127C (zh) 2003-09-12 2005-10-26 中国科学院计算技术研究所 一种用于视频编码的编码端/解码端双向预测方法
FR2860678A1 (fr) 2003-10-01 2005-04-08 Thomson Licensing Sa Procede de codage differentiel
GB2407006A (en) 2003-10-08 2005-04-13 Sony Uk Ltd Communicating streamed payload data and packet based auxiliary data
JP3675464B2 (ja) 2003-10-29 2005-07-27 ソニー株式会社 動画像符号化装置および動画像符号化制御方法
TWI330976B (en) 2003-12-05 2010-09-21 Trident Microsystems Far East Method and apparatus for encoding/decoding dynamic graphic content
US7301482B1 (en) 2003-12-12 2007-11-27 Marvell International Ltd. Circuits, architectures, systems, methods, algorithms and software for conditional modulation coding
JP2005184042A (ja) 2003-12-15 2005-07-07 Sony Corp 画像復号装置及び画像復号方法並びに画像復号プログラム
KR100608050B1 (ko) 2004-01-14 2006-08-02 삼성전자주식회사 사용자의 요구에 의해 활성화되는 인터랙티브 그래픽스트림을 저장한 저장 매체, 재생 장치 및 그 재생 방법
US8175444B2 (en) 2004-01-14 2012-05-08 Samsung Electronics Co., Ltd. Method of reproducing from storage medium storing interactive graphics stream activated in response to user's command
EP1583367A1 (en) 2004-03-30 2005-10-05 Matsushita Electric Industrial Co., Ltd. Motion estimation employing line and column vectors
DE602004030993D1 (de) 2004-04-30 2011-02-24 Panasonic Corp Bewegungsschätzung unter Verwendung von adaptiven räumlichen Verfeinerungsvektoren
JP4145275B2 (ja) 2004-07-27 2008-09-03 富士通株式会社 動きベクトル検出・補償装置
TWI250423B (en) * 2004-07-30 2006-03-01 Ind Tech Res Inst Method for processing video images
TWI268715B (en) 2004-08-16 2006-12-11 Nippon Telegraph & Telephone Picture encoding method, picture decoding method, picture encoding apparatus, and picture decoding apparatus
EP1638333A1 (en) 2004-09-17 2006-03-22 Mitsubishi Electric Information Technology Centre Europe B.V. Rate adaptive video coding
JP4375305B2 (ja) 2004-10-26 2009-12-02 ソニー株式会社 情報処理装置および情報処理方法、記録媒体、並びに、プログラム
JP4148228B2 (ja) 2005-02-10 2008-09-10 ソニー株式会社 画像記録装置、画像再生制御装置、画像記録再生制御装置、これらの装置の処理方法およびその方法をコンピュータに実行させるプログラム
US7660354B2 (en) 2005-05-11 2010-02-09 Fang Shi Temporal error concealment for bi-directionally predicted frames
US8761258B2 (en) 2005-06-17 2014-06-24 The Hong Kong University Of Science And Technology Enhanced block-based motion estimation algorithms for video compression
US9661376B2 (en) 2005-07-13 2017-05-23 Polycom, Inc. Video error concealment method
EP1753242A2 (en) 2005-07-18 2007-02-14 Matsushita Electric Industrial Co., Ltd. Switchable mode and prediction information coding
US7697783B2 (en) 2005-07-26 2010-04-13 Sony Corporation Coding device, coding method, decoding device, decoding method, and programs of same
JP2008011455A (ja) * 2006-06-30 2008-01-17 Sanyo Electric Co Ltd 符号化方法
US20070025444A1 (en) 2005-07-28 2007-02-01 Shigeyuki Okada Coding Method
JP4401336B2 (ja) 2005-08-31 2010-01-20 三洋電機株式会社 符号化方法
JP4570532B2 (ja) 2005-08-02 2010-10-27 パナソニック株式会社 動き検出装置、動き検出方法、集積回路およびプログラム
US20070030894A1 (en) 2005-08-03 2007-02-08 Nokia Corporation Method, device, and module for improved encoding mode control in video encoding
JP2007142637A (ja) 2005-11-16 2007-06-07 Matsushita Electric Ind Co Ltd 画像情報符号化装置
WO2007092192A2 (en) 2006-02-02 2007-08-16 Thomson Licensing Method and apparatus for motion estimation using combined reference bi-prediction
US8498336B2 (en) 2006-02-02 2013-07-30 Thomson Licensing Method and apparatus for adaptive weight selection for motion compensated prediction
US20070200949A1 (en) 2006-02-21 2007-08-30 Qualcomm Incorporated Rapid tuning in multimedia applications
JP4757080B2 (ja) 2006-04-03 2011-08-24 パナソニック株式会社 動き検出装置、動き検出方法、動き検出集積回路および画像符号化装置
US7672377B2 (en) 2006-04-21 2010-03-02 Dilithium Holdings, Inc. Method and system for video encoding and transcoding
CN101090491B (zh) 2006-06-16 2016-05-18 香港科技大学 用于视频压缩的增强的基于块的运动估计算法
KR20070120416A (ko) 2006-06-19 2007-12-24 엘지전자 주식회사 비디오 신호 디코딩 방법 및 장치, 비디오 신호 인코딩방법 및 장치
WO2007148906A1 (en) 2006-06-19 2007-12-27 Lg Electronics, Inc. Method and apparatus for processing a vedeo signal
US8250618B2 (en) 2006-09-18 2012-08-21 Elemental Technologies, Inc. Real-time network adaptive digital video encoding/decoding
DE102006043707A1 (de) 2006-09-18 2008-03-27 Robert Bosch Gmbh Verfahren zur Datenkompression in einer Videosequenz
US8213509B2 (en) 2006-10-06 2012-07-03 Calos Fund Limited Liability Company Video coding on parallel processing systems
US8565314B2 (en) 2006-10-12 2013-10-22 Qualcomm Incorporated Variable length coding table selection based on block type statistics for refinement coefficient coding
US8325819B2 (en) 2006-10-12 2012-12-04 Qualcomm Incorporated Variable length coding table selection based on video block type for refinement coefficient coding
US9319700B2 (en) 2006-10-12 2016-04-19 Qualcomm Incorporated Refinement coefficient coding based on history of corresponding transform coefficient values
US8599926B2 (en) 2006-10-12 2013-12-03 Qualcomm Incorporated Combined run-length coding of refinement and significant coefficients in scalable video coding enhancement layers
JP4999859B2 (ja) 2006-10-30 2012-08-15 日本電信電話株式会社 予測参照情報生成方法、動画像符号化及び復号方法、それらの装置、及びそれらのプログラム並びにプログラムを記録した記憶媒体
JP2008199587A (ja) 2007-01-18 2008-08-28 Matsushita Electric Ind Co Ltd 画像符号化装置、画像復号化装置および方法
JP5025286B2 (ja) * 2007-02-28 2012-09-12 シャープ株式会社 符号化装置及び復号装置
TW200845758A (en) 2007-05-03 2008-11-16 Nat Univ Chung Cheng Fast intra coding algorithms for dynamic definition adjustment
KR101403341B1 (ko) 2007-03-28 2014-06-09 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
BRPI0809512A2 (pt) 2007-04-12 2016-03-15 Thomson Licensing método e aparelho para mesclagem dependente de contexto para modos salto-direto para codificação e decodificação de vídeo
US20100086053A1 (en) 2007-04-26 2010-04-08 Panasonic Corporation Motion estimation device, motion estimation method, and motion estimation program
EP2160900A1 (en) 2007-06-12 2010-03-10 Thomson Licensing Methods and apparatus supporting multi-pass video syntax structure for slice data
KR101495886B1 (ko) 2007-07-19 2015-02-26 한국전자통신연구원 하향링크 프레임 생성 방법 및 셀 탐색 방법
KR101946376B1 (ko) * 2007-10-16 2019-02-11 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
KR101228020B1 (ko) 2007-12-05 2013-01-30 삼성전자주식회사 사이드 매칭을 이용한 영상의 부호화 방법 및 장치, 그복호화 방법 및 장치
CN101198064A (zh) 2007-12-10 2008-06-11 武汉大学 一种分辨率分层技术中的运动矢量预测方法
KR20090095012A (ko) 2008-03-04 2009-09-09 삼성전자주식회사 연속적인 움직임 추정을 이용한 영상 부호화, 복호화 방법및 장치
JP2009218873A (ja) 2008-03-11 2009-09-24 Nec Personal Products Co Ltd デジタル放送受信機、および、プログラム
CN102067601B (zh) 2008-04-11 2014-03-12 汤姆森特许公司 视频编码和解码中模板匹配预测(tmp)的方法和装置
WO2009136743A2 (ko) 2008-05-07 2009-11-12 Lg전자 비디오 신호의 디코딩 방법 및 장치
PT104083A (pt) 2008-06-02 2009-12-02 Inst Politecnico De Leiria Método para transcodificar imagens de vídeo h.264/avc em mpeg-2
WO2010090629A1 (en) 2009-02-05 2010-08-12 Thomson Licensing Methods and apparatus for adaptive mode video encoding and decoding
CN101931803B (zh) 2009-06-26 2013-01-09 华为技术有限公司 视频图像运动信息获取方法、装置及设备、模板构造方法
KR101452859B1 (ko) 2009-08-13 2014-10-23 삼성전자주식회사 움직임 벡터를 부호화 및 복호화하는 방법 및 장치
US9060176B2 (en) 2009-10-01 2015-06-16 Ntt Docomo, Inc. Motion vector prediction in video coding
CN102577389A (zh) 2009-10-16 2012-07-11 夏普株式会社 运动图像编码装置和运动图像解码装置
TWI566586B (zh) 2009-10-20 2017-01-11 湯姆生特許公司 一序列形象的現時區塊之寫碼方法和重建方法
KR101459714B1 (ko) 2009-10-28 2014-11-13 에스케이텔레콤 주식회사 공간 분할을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
KR101441905B1 (ko) 2009-11-18 2014-09-24 에스케이텔레콤 주식회사 후보 예측 움직임 벡터 집합 선택을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
JPWO2011061880A1 (ja) 2009-11-19 2013-04-04 三菱電機株式会社 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
US9288495B2 (en) 2009-11-24 2016-03-15 Sk Telecom Co., Ltd. Adaptive secondary prediction-based image encoding/decoding method, device and recording medium
WO2011064673A1 (en) 2009-11-30 2011-06-03 France Telecom Method of and apparatus for encoding video frames, method of and apparatus for decoding video frames
CN101860754B (zh) 2009-12-16 2013-11-13 香港应用科技研究院有限公司 运动矢量编码和解码的方法和装置
JP2013514718A (ja) 2009-12-17 2013-04-25 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 映像符号化の方法及び装置
US9036692B2 (en) 2010-01-18 2015-05-19 Mediatek Inc. Motion prediction method
BR112012019560B1 (pt) 2010-02-05 2021-08-24 Telefonaktiebolaget Lm Ericsson Método para gerenciar candidatos a vetor de movimento predito, e, aparelhos de codificação e de decodificação de vídeo
CN102754442A (zh) 2010-02-10 2012-10-24 Lg电子株式会社 处理视频信号的方法和装置
US8995527B2 (en) 2010-02-19 2015-03-31 Qualcomm Incorporated Block type signalling in video coding
CN102439978A (zh) 2010-03-12 2012-05-02 联发科技(新加坡)私人有限公司 运动预测方法
CN102210910B (zh) 2010-04-02 2013-02-13 重庆融海超声医学工程研究中心有限公司 一种超声换能器
KR101752418B1 (ko) 2010-04-09 2017-06-29 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
PL3739883T3 (pl) * 2010-05-04 2023-04-11 Lg Electronics Inc. Sposób i aparat do kodowania i dekodowania sygnału wideo
US9124898B2 (en) 2010-07-12 2015-09-01 Mediatek Inc. Method and apparatus of temporal motion vector prediction
KR102080892B1 (ko) 2010-09-02 2020-02-24 엘지전자 주식회사 영상 부호화 및 복호화 방법과 이를 이용한 장치
US20120082228A1 (en) 2010-10-01 2012-04-05 Yeping Su Nested entropy encoding
US10104391B2 (en) 2010-10-01 2018-10-16 Dolby International Ab System for nested entropy encoding
JP2012109720A (ja) 2010-11-16 2012-06-07 Panasonic Corp 画像変換装置、画像再生装置及び画像変換方法
US8824558B2 (en) 2010-11-23 2014-09-02 Mediatek Inc. Method and apparatus of spatial motion vector prediction
US8976873B2 (en) 2010-11-24 2015-03-10 Stmicroelectronics S.R.L. Apparatus and method for performing error concealment of inter-coded video frames
US8711940B2 (en) 2010-11-29 2014-04-29 Mediatek Inc. Method and apparatus of motion vector prediction with extended motion vector predictor
CN102986224B (zh) 2010-12-21 2017-05-24 英特尔公司 用于增强的解码器侧运动向量导出处理的系统及方法
US9049455B2 (en) 2010-12-28 2015-06-02 Panasonic Intellectual Property Corporation Of America Image coding method of coding a current picture with prediction using one or both of a first reference picture list including a first current reference picture for a current block and a second reference picture list including a second current reference picture for the current block
EP4135329A3 (en) 2011-01-07 2023-04-05 LG Electronics Inc. Method for encoding and decoding image information and device using same
WO2012095467A1 (en) 2011-01-12 2012-07-19 Canon Kabushiki Kaisha Video encoding and decoding with low complexity
US9319716B2 (en) 2011-01-27 2016-04-19 Qualcomm Incorporated Performing motion vector prediction for video coding
US9066110B2 (en) * 2011-03-08 2015-06-23 Texas Instruments Incorporated Parsing friendly and error resilient merge flag coding in video coding
EP2687015A4 (en) 2011-03-14 2014-12-17 Mediatek Inc METHOD AND DEVICE FOR OBTAINING PREDICTIONS FOR TEMPORARY MOTION VECTORS
US9648334B2 (en) 2011-03-21 2017-05-09 Qualcomm Incorporated Bi-predictive merge mode based on uni-predictive neighbors in video coding
US9143795B2 (en) 2011-04-11 2015-09-22 Texas Instruments Incorporated Parallel motion estimation in video coding
WO2012140821A1 (ja) 2011-04-12 2012-10-18 パナソニック株式会社 動画像符号化方法、動画像符号化装置、動画像復号化方法、動画像復号化装置、および動画像符号化復号化装置
KR102015674B1 (ko) 2011-05-24 2019-08-28 벨로스 미디어 인터내셔널 리미티드 화상 부호화 방법, 화상 부호화 장치, 화상 복호 방법, 화상 복호 장치, 및, 화상 부호화 복호 장치
US9866859B2 (en) 2011-06-14 2018-01-09 Texas Instruments Incorporated Inter-prediction candidate index coding independent of inter-prediction candidate list construction in video coding
US10264276B2 (en) 2011-06-14 2019-04-16 Samsung Electronics Co., Ltd. Method and apparatus for encoding motion information and method and apparatus for decoding same
US9131239B2 (en) 2011-06-20 2015-09-08 Qualcomm Incorporated Unified merge mode and adaptive motion vector prediction mode candidates selection
CN103636218B (zh) 2011-06-30 2017-07-28 Jvc建伍株式会社 图像解码装置和图像解码方法
KR102365353B1 (ko) 2011-06-30 2022-02-23 가부시키가이샤 제이브이씨 켄우드 화상 부호화 장치, 화상 부호화 방법, 화상 부호화 프로그램, 화상 복호 장치, 화상 복호 방법 및 화상 복호 프로그램
AU2012323631B2 (en) 2011-10-11 2015-09-17 Mediatek Inc. Method and apparatus of motion and disparity vector derivation for 3D video coding and HEVC
JP5870047B2 (ja) 2013-01-08 2016-02-24 住友ゴム工業株式会社 空気入りタイヤ

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008283490A (ja) * 2007-05-10 2008-11-20 Ntt Docomo Inc 動画像符号化装置、方法及びプログラム、並びに動画像復号化装置、方法及びプログラム
US20090304084A1 (en) * 2008-03-19 2009-12-10 Nokia Corporation Combined motion vector and reference index prediction for video coding

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GUILLAUME LAROCHE等: ""Robust solution for the AMVP parsing issue"", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING(JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11,5TH MEETING: GENEVA:JCTVC-E219》 *
THOMAS WIEGAND等: ""WD3:Working Draft3 of High-Efficiency Video Coding"", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING(JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11,5TH MEETING: GENEVA:JCTVC-E219》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020135467A1 (zh) * 2018-12-29 2020-07-02 华为技术有限公司 帧间预测方法、装置以及相应的编码器和解码器
US11956444B2 (en) 2018-12-29 2024-04-09 Huawei Technologies Co., Ltd. Inter prediction method and apparatus, and corresponding encoder and decoder

Also Published As

Publication number Publication date
US20210289228A1 (en) 2021-09-16
US10652573B2 (en) 2020-05-12
US10645413B2 (en) 2020-05-05
JP6435574B2 (ja) 2018-12-12
EP2717579A1 (en) 2014-04-09
EP4270953A2 (en) 2023-11-01
US20150181220A1 (en) 2015-06-25
US20180035130A1 (en) 2018-02-01
WO2012164908A1 (ja) 2012-12-06
CA2834191A1 (en) 2012-12-06
JP2019033529A (ja) 2019-02-28
JP6754978B2 (ja) 2020-09-16
TWI562622B (zh) 2016-12-11
CN103548351A (zh) 2014-01-29
EP2717579A4 (en) 2014-11-05
US11509928B2 (en) 2022-11-22
EP4270953A3 (en) 2023-11-22
JP5937589B2 (ja) 2016-06-22
RU2614542C2 (ru) 2017-03-28
US20230033242A1 (en) 2023-02-02
PL3629583T3 (pl) 2024-03-25
EP3629583B1 (en) 2023-10-25
PL2717579T3 (pl) 2020-07-27
EP3629583A1 (en) 2020-04-01
US11057639B2 (en) 2021-07-06
US20120307903A1 (en) 2012-12-06
JPWO2012164908A1 (ja) 2015-02-23
KR101889582B1 (ko) 2018-08-20
US9819961B2 (en) 2017-11-14
MX2013012209A (es) 2013-11-01
US20190124358A1 (en) 2019-04-25
JP2016174391A (ja) 2016-09-29
JP6150189B2 (ja) 2017-06-21
US8989271B2 (en) 2015-03-24
US11917192B2 (en) 2024-02-27
ES2779226T3 (es) 2020-08-14
US20160241873A1 (en) 2016-08-18
KR20140026430A (ko) 2014-03-05
CN107257483B (zh) 2020-01-21
RU2013147813A (ru) 2015-07-10
US9609356B2 (en) 2017-03-28
TW201304552A (zh) 2013-01-16
JP2017169224A (ja) 2017-09-21
CA2834191C (en) 2019-04-09
EP2717579B1 (en) 2020-01-22
CN103548351B (zh) 2017-07-11
US20190116377A1 (en) 2019-04-18

Similar Documents

Publication Publication Date Title
CN103548351B (zh) 运动图像解码方法及运动图像解码装置
CN103518376B (zh) 图像编码方法、图像编码装置、图像解码方法、图像解码装置及图像编码解码装置
CN103563385B (zh) 图像编码方法、图像编码装置、图像解码方法、图像解码装置及图像编码解码装置
CN103563384B (zh) 运动图像编码方法、运动图像编码装置、运动图像解码方法、运动图像解码装置、及运动图像编解码装置
CN103718558B (zh) 运动图像编码方法及装置、解码方法及装置和编解码装置
CN106851269B (zh) 图像解码方法及装置、图像编码方法及装置、编解码装置
CN106878749B (zh) 图像解码方法、图像解码装置
CN103444181B (zh) 运动图像编码方法、运动图像编码装置、运动图像解码方法、运动图像解码装置及运动图像编码解码装置
CN103858428B (zh) 图像编码方法、图像编码装置、图像解码方法及图像解码装置
CN103828373B (zh) 图像解码方法以及图像解码装置
CN103503450B (zh) 图像编码方法、图像编码装置、图像解码方法、图像解码装置及图像编解码装置
CN103650507B (zh) 运动图像编码方法及装置、运动图像解码方法及装置
CN103609110B (zh) 图像解码方法、图像编码方法、图像解码装置、图像编码装置及图像编码解码装置
CN103477637B (zh) 动态图像编码方法、动态图像编码装置
CN107071462B (zh) 动态图像解码方法和动态图像解码装置
CN103563373B (zh) 图像编码方法及图像编码装置
CN103650497B (zh) 图像编码方法、图像解码方法、图像编码装置、图像解码装置及图像编码解码装置
CN106878742A (zh) 动态图像编解码装置
CN105592317B (zh) 图像解码方法及图像解码装置
CN103004204B (zh) 图像编码方法
CN103004204A (zh) 图像编码方法及图像解码方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant