CN107371025B - 解码方法及解码装置 - Google Patents

解码方法及解码装置 Download PDF

Info

Publication number
CN107371025B
CN107371025B CN201710800325.1A CN201710800325A CN107371025B CN 107371025 B CN107371025 B CN 107371025B CN 201710800325 A CN201710800325 A CN 201710800325A CN 107371025 B CN107371025 B CN 107371025B
Authority
CN
China
Prior art keywords
data
decoding
component
binary data
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710800325.1A
Other languages
English (en)
Other versions
CN107371025A (zh
Inventor
笹井寿郎
西孝启
柴原阳司
杉尾敏康
谷川京子
松延彻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Patent Trust Inc
Original Assignee
Velos Media LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Velos Media LLC filed Critical Velos Media LLC
Publication of CN107371025A publication Critical patent/CN107371025A/zh
Application granted granted Critical
Publication of CN107371025B publication Critical patent/CN107371025B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/521Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1887Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a variable length codeword
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream

Abstract

提供解码方法及解码装置。该方法包括:取得步骤,取得包含表示差分矢量的水平、垂直成分是否为0的组合的标志、且包含表示水平、垂直成分的第1、第2二值数据的编码数据;和解码步骤,将编码数据解码;该标志,在水平、垂直成分都是0时被分配0;水平成分不是0垂直成分为0时被分配10;水平成分为0垂直成分不是0时被分配110;都不是0时被分配111;第1/第2二值数据仅包含前缀数据即第1/第2部分或包含第1/第2部分和后缀数据即第3/第4部分;解码步骤中,水平、垂直成分都不是0的情况下,在编码数据仅包含第1、第2部分时,以第1、第2部分的顺序解码;在编码数据包含第3、第4部分时,以第1至第4部分的顺序解码。

Description

解码方法及解码装置
本申请是申请日为2012年6月21日、申请号为201280001995.2、发明名称为“图像编码方法、图像解码方法、图像编码装置、图像解码装置及图像编解码装置”的发明专利申请的分案。
技术领域
本发明涉及使用运动矢量对图像进行编码的图像编码方法。
背景技术
作为涉及使用运动矢量对图像进行编码的图像编码方法的技术,有在非专利文献1及非专利文献2中记载的技术。
现有技术文献
非专利文献
非专利文献1:ITU-T Recommendation H.264"Advanced video coding forgeneric audio visual services",2010年3月
非专利文献2:JCT-VC"WD3:Working Draft3of High-Efficiency VideoCoding",JCTVC-E603,March 2011.
发明内容
发明要解决的问题
但是,图像的低效率的编码导致处理的延迟,对图像的解码也带来影响。
所以,本发明的目的是提供一种将构成图像的信息高效率地编码的图像编码方法。
用于解决问题的手段
为了达到上述目的,有关本发明的一形态的图像编码方法,使用运动矢量将图像编码,包括将差分矢量编码的编码步骤,该差分矢量表示作为上述运动矢量的预测值的预测运动矢量与上述运动矢量之差;在上述编码步骤中,将作为上述差分矢量的水平成分及垂直成分中的第1成分的一部分的第1部分编码;将作为上述水平成分及上述垂直成分中的与上述第1成分不同的第2成分的一部分的第2部分编码;将第3部分编码,该第3部分是上述第1成分的一部分、并且是与上述第1部分不同的部分;将第4部分编码,该第4部分是上述第2成分的一部分、并且是与上述第2部分不同的部分;生成以上述第1部分、上述第2部分、上述第3部分及上述第4部分的顺序包括上述第1部分、上述第2部分、上述第3部分及上述第4部分的编码序列。
另外,这些全部或具体的形态既可以通过装置、系统、集成电路、计算机程序或计算机可读取的CD-ROM等的非暂时性的记录介质实现,也可以通过装置、系统、集成电路、计算机程序及记录介质的任意的组合实现。
发明效果
通过本发明,能够将构成图像的信息高效率地编码。
附图说明
图1是表示以往的差分矢量解码方法的结构的一例的模块图。
图2是表示以往的差分矢量解码方法的动作的流程的流程图。
图3是表示以往的算术解码方法的上下文自适应算术解码处理的流程图。
图4是表示以往的算术解码方法的旁路算术解码处理的流程图。
图5是表示以往的算术解码方法的正规化处理的流程图。
图6是表示差分矢量的二值化序列的例子的示意图。
图7是表示有关实施方式1的解码装置的功能结构的模块图。
图8是表示有关实施方式1的解码装置的处理动作的流程图。
图9是用来说明实施方式1的执行处理的一例的图。
图10是表示有关实施方式1的图像解码装置的结构的一例的模块图。
图11A是表示有关实施方式1的变形例的二值化编码序列的一例的表。
图11B是表示有关实施方式1的变形例的解码装置的处理动作的流程图。
图12是表示有关实施方式2的编码装置的处理动作的流程图。
图13是表示数据构造的一例的句法表。
图14是表示有关实施方式2的图像编码装置的结构的一例的模块图。
图15A是表示有关实施方式3的图像编码装置的结构的一例的模块图。
图15B是表示有关实施方式3的图像编码装置的处理动作的流程图。
图16A是表示有关实施方式3的图像解码装置的结构的一例的模块图。
图16B是表示有关实施方式3的图像解码装置的处理动作的流程图。
图17是表示与差分矢量对应的编码序列的数据构造的一例的句法表。
图18是实现内容分发服务的内容供给系统的整体结构图。
图19是数字广播用系统的整体结构图。
图20是表示电视机的结构例的模模块图。
图21是表示对作为光盘的记录介质进行信息的读写的信息再现/记录部的结构例的模模块图。
图22是表示作为光盘的记录介质的构造例的图。
图23A是表示便携电话的一例的图。
图23B是表示便携电话的结构例的模模块图。
图24是表示复用数据的结构的图。
图25是示意地表示各流在复用数据中怎样被复用的图。
图26是更详细地表示在PES包序列中视频流怎样被保存的图。
图27是表示复用数据的TS包和源包的构造的图。
图28是表示PMT的数据结构的图。
图29是表示复用数据信息的内部结构的图。
图30是表示流属性信息的内部结构的图。
图31是表示识别影像数据的步骤的图。
图32是表示实现各实施方式的动态图像编码方法及动态图像解码方法的集成电路的结构例的模模块图。
图33是表示切换驱动频率的结构的图。
图34是表示识别影像数据、切换驱动频率的步骤的图。
图35是表示将影像数据的标准与驱动频率建立了对应的查找表的一例的图。
图36A是表示将信号处理部的模块共用的结构的一例的图。
图36B是表示将信号处理部的模块共用的结构的另一例的图。
具体实施方式
(本发明的基础知识)
用于包括经由因特网的视频会议、数字视频广播以及影像内容的流动的、例如视频点播型的服务的应用的数量递增,这些应用依赖于影像信息的发送。在发送并记录影像数据时,相当量的数据通过有限的带宽的以往的传送路径而被发送,或者存储在有限的数据容量的以往的存储介质中。为了在以往的传送信道以及存储介质中发送及存储影像信息,将数字数据的量进行压缩或削减是必须的。
因此,为了压缩影像数据,开发了多个影像编码标准。这样的影像编码标准例如是由H.26x表示的ITU-T(国际电气通信联合电气通信标准化部门)标准、以及由MPEG-x表示的ISO/IEC标准。最新且最先进的影像编码标准是目前由H.264/AVC或MPEG-4AVC表示的标准(参照非专利文献1及非专利文献2)。
作为这些标准的大部分标准的基础的编码方法基于包括由以下的(a)~(d)表示的主要阶段的预测编码。(a)为了将影像帧分别以块级进行数据压缩,将影像帧划分为像素的块。(b)根据先被编码的影像数据,预测各个块,由此确定时间的及空间的冗余性。(c)通过从影像数据减去预测数据,将所确定的冗余性除去。(d)通过傅立叶变换、量化及熵编码,将其余的数据(残差块)压缩。
在上述(a)的工序中,在当前的影像编码标准中,在预测各宏块时使用的预测模式不同。大部分的影像编码标准为了根据先被编码及解码的帧来预测影像数据而使用运动检测及运动补偿(帧间预测)。或者,块数据也可以从相同帧的相邻的块被外插(帧内预测)。
例如,在通过帧间预测将编码对象图片编码的情况下,图像编码装置按显示顺序使用编码对象图片的前方或后方的已编码图片作为参照图片。并且,图像编码装置通过进行编码对象图片相对于该参照图片的运动检测,导出各块的运动矢量。图像编码装置通过使用这样导出的运动矢量进行运动补偿,生成预测图像数据。并且,图像编码装置通过将所生成的预测图像数据与编码对象图片的图像数据的差分进行编码,削减时间方向的冗余性。
此外,研究了在将B图片或P图片的编码对象块的运动矢量进行编码时使用预测运动矢量指定模式的技术(非专利文献2)。使用预测运动矢量指定模式的图像编码装置基于与编码对象块相邻的已编码块生成多个预测运动矢量的候选。并且,图像编码装置从所生成的多个候选中选择预测运动矢量。
图像编码装置使用所选择的预测运动矢量将编码对象块的运动矢量编码。具体而言,对编码对象块的运动矢量与所选择的预测运动矢量的差分矢量进行可变长度编码。
此外,图像编码装置将所选择的预测运动矢量的索引(也称作预测运动矢量索引)追加到编码比特流中。由此,图像解码装置在解码时能够选择与编码时选择的预测运动矢量相同的预测运动矢量。
另外,使用图1及图2更具体地说明差分矢量的可变长度解码方法。图1是表示以往的差分矢量的可变长度解码方法的结构的一例的模块图。图2是表示以往的差分矢量的可变长度解码方法的动作的流程的一例的流程图。
此外,差分矢量值被二值化,构成二值化序列。二值化序列分为表示正负符号的标志、差分矢量的绝对值的与TH值(阈值)以下的部分对应的前缀(prefix)部、以及与比TH值靠上的部分对应的后缀(suffix)部(参照图6)。
正负符号是+或-。例如,在正负符号是+的情况下,表示正负符号的标志是0。在正负符号是-的情况下,表示正负符号的标志是1。此外,例如TH值是8。在此情况下,前缀部在差分矢量的绝对值的二值化序列中与构成8以下的部分对应。并且,后缀部在差分矢量的绝对值的二值化序列中与构成9以上的部分对应。
针对正负符号的标志、前缀部及后缀部,算术编解码方法分别不同。关于算术编解码方法在后面叙述。
差分矢量可变长度解码部A00取得包括差分矢量信息的比特流BS,对差分矢量复原控制部A01和差分矢量0判断部A02输入。另外,这里,差分矢量复原控制部A01按所取得的差分矢量信息的X成分(水平成分)、Y成分(垂直成分)的顺序取入,管理解码处理中的差分矢量信息是X成分还是Y成分。
差分矢量0判断部A02从所取得的比特流将表示差分矢量的X成分是否是0的标志解码(步骤SB00)。在差分矢量的X成分不是0的情况下(步骤SB01中否),由差分矢量前缀部解码部A03将差分矢量的X成分的前缀部分解码(步骤SB02)。接着,在有差分矢量的X成分的后缀部的情况下(步骤SB03中是),由差分矢量后缀部解码部A04将差分矢量的X成分的后缀部解码(SB04)。在没有后缀部的情况下(SB03中否),将后缀解码处理跳过。接着,在差分矢量正负符号解码部A05中,进行差分矢量的X成分的正负符号的解码,在差分矢量复原部A06中,将差分矢量的X成分复原并设置(SB05)。
另一方面,在差分矢量的X成分是0的情况下(步骤SB01中是),在差分矢量复原部A06中,在差分矢量的X成分中设置0(步骤SB06)。这里,由差分矢量复原控制部A01将开关A07切换为表示是X成分的一侧(图1中上侧的端子),将差分矢量的X成分输出。
接着,与X成分同样,将差分矢量的Y成分解码。另外,在以下的动作的过程中,步骤SB07对应于步骤SB00,步骤SB08对应于步骤SB01,步骤SB09对应于步骤SB02,步骤SB10对应于步骤SB03,步骤SB11对应于步骤SB04,步骤SB12对应于步骤SB05,步骤SB13对应于步骤SB06。它们除了成分不同以外是相同的动作,所以详细说明省略。
在全部的步骤结束的阶段,差分矢量的X成分、Y成分被复原。
接着,对预测图像数据与编码对象图片的图像数据的差分、以及预测运动矢量与运动矢量的差分矢量等的可变长度编码进行说明。在H.264中,作为可变长度编码方法的1种,有上下文自适应算术编码(CABAC:Context Adaptive Binary Arithmetic Coding,上下文自适应二进制算术编码)。关于该CABAC,以下使用图3、图4、图5进行说明。
图3是表示上述的以往的上下文自适应的算术解码处理的流程的图。另外,该图是从非专利文献1摘录的,只要没有特别说明,则如非专利文献1中所记载。
算术解码处理首先输入基于信号种类决定的上下文(ctxIdx)。
接着,计算从表示当前时点的算术解码装置内的状态的参数codIRange导出的值qCodIRangeIdx,取得与ctxIdx对应的状态值即pStateIdx值。根据这两个值,参照表(rangeTableLPS),取得codIRangeLPS。另外,该codIRangeLPS表示与第1参数codIRange对应的值,该第1参数codIRange表示发生了LPS(符号0及1中的发生概率较低的符号)的情况下的算术解码装置内的状态。
此外,在codIRange中,放入从当前的codIRange减去上述codIRangeLPS后的值(步骤SC01)。接着,将计算出的codIRange、与表示算术解码装置内的状态的第2参数codIOffset比较(步骤SC02)。
在codIOffset大或相等的情况下(SC02中是),判断为发生了LPS的符号。并且,在作为解码输出值的binVal中,设置与valMPS(表示符号0及1中的发生概率较高的符号的MPS的具体的值0或1)不同的值(valMPS=1时为0,valMPS=0时为1)。此外,在表示算术解码装置内的状态的第2参数codIOffset中,设置减去codIRange后的值。在表示算术解码装置内的状态的第1参数codIRange中,由于发生了LPS,所以设置在步骤SC01中计算出的codIRangeLPS的值(步骤SC03)。
另外,这里,与上述ctxIdx对应的状态值即pStateIdx值是0的情况下(步骤SC05中是),表示LPS的概率高于MPS的概率的情况。因此,替换valMPS(valMPS=1时为0,valMPS=0时为1)(步骤SC06)。另一方面,在pStateIdx值不是0的情况下(步骤SC05中否),将pStateIdx值基于发生了LPS的情况下的变换表transIdxLPS进行更新(步骤SC07)。
此外,在codIOffset较小的情况下(SC02中否),判断为发生了MPS的符号。并且,在作为解码输出值的binVal中设置valMPS,将pStateIdx值基于发生了MPS的情况下的变换表transIdxMPS进行更新(步骤SC04)。
最后,进行正规化处理(RenormD)(步骤SC08),结束算术解码。
这样,在上下文自适应算术解码处理中,将作为2值符号的发生概率的符号发生概率与上下文索引建立对应而保持多个,根据条件(例如参照相邻块的值)切换。因此,需要维持处理的顺序。
图4是表示以往的旁路处理用的算术解码处理的流程的图。另外,该图是从非专利文献1摘录的,只要没有特别说明,则如非专利文献1中所记载。
首先,将表示当前时点的算术解码装置内的状态的第2参数codIOffset左移(2倍),从比特流读出1比特。如果该读出比特是1,则对2倍后的codIOffset加1。如果是0,则设置原样(2倍)的值(SD01)。
接着,在codIOffset与表示算术解码装置内的状态的第1参数codIRange相等或更大的情况下(SD02中是),在作为解码输出值的binVal中设置“1”。并且,在codIOffset中设置减去codIRange后的值(步骤SD03)。另一方面,在codIOffset比表示算术解码装置内的状态的第1参数codIRange小的情况下(SD02中否),在作为解码输出值的binVal中设置“0”(步骤SD04)。
图5是用来详细地说明由图3的步骤SC08表示的正规化处理(RenormD)的流程图。该图是从非专利文献1摘录的,只要没有特别说明,则如非专利文献1中所记载。
在算术解码处理中,在表示算术解码装置内的状态的第1参数codIRange比0x100(16进制:256(10进制))小的情况下(步骤SE01中是),将codIRange左移(2倍),将表示算术解码装置内的状态的第2参数codIOffset左移(2倍)。并且,从比特流读出1比特。如果该读出比特是1,则对2倍后的codIOffset加上1。如果是0,则设置原样(2倍)的值(SE02)。
在该处理中,在最终codIRange成为256以上的阶段(步骤SE01中否),结束。
通过进行上述图3、图4及图5所示的处理,进行差分矢量的算术解码。
但是,以往在对预测运动矢量与运动矢量的差分矢量进行算术编码的情况下,将差分矢量的X成分和Y成分依次编码。即,在编码流上分别保存差分矢量的X成分和差分矢量的Y成分。也就是说,针对X成分及Y成分,在编码时分别交替地执行上下文自适应算术编码和旁路编码,在解码时分别交替地执行上下文自适应算术解码和旁路解码。因此,有不能充分进行作为旁路编码及旁路解码的优点的并行处理的问题。
所以,有关本发明的一形态的图像编码方法,使用运动矢量对图像进行编码,包括对差分矢量进行编码的编码步骤,该差分矢量表示作为上述运动矢量的预测值的预测运动矢量与上述运动矢量之差;在上述编码步骤中,将作为上述差分矢量的水平成分及垂直成分中的第1成分的一部分的第1部分编码;将作为上述水平成分及上述垂直成分中的与上述第1成分不同的第2成分的一部分的第2部分编码;将第3部分编码,该第3部分是上述第1成分的一部分、并且是与上述第1部分不同的部分;将第4部分编码,该第4部分是上述第2成分的一部分、并且是与上述第2部分不同的部分;生成以上述第1部分、上述第2部分、上述第3部分及上述第4部分的顺序包括上述第1部分、上述第2部分、上述第3部分及上述第4部分的编码序列。
由此,将差分矢量的水平成分的一部分与差分矢量的垂直成分的一部分在编码序列中组合。例如,在将水平成分中的使用旁路解码的部分与垂直成分中的使用旁路解码的部分在编码序列中组合的情况下,解码处理的并行度有可能提高。即,通过将水平成分的一部分与垂直成分的一部分组合,将差分矢量高效率地编码。
例如,也可以是,在上述编码步骤中,将包含上述第1成分的正负符号的上述第3部分编码,将包含上述第2成分的正负符号的上述第4部分编码;生成以上述第1部分、上述第2部分、上述第3部分及上述第4部分的顺序包括上述第1部分、上述第2部分、上述第3部分及上述第4部分的上述编码序列。
由此,将水平成分的正负符号与垂直成分的正负符号在编码序列中组合。典型地,在这些正负符号的解码中使用旁路解码。因而,解码处理的并行度有可能提高。
此外,例如也可以是,在上述编码步骤中,将包含表示上述第1成分是否是0的标志的上述第1部分编码,将包含表示上述第2成分是否是0的标志的上述第2部分编码;生成以上述第1部分、上述第2部分、上述第3部分及上述第4部分的顺序包括上述第1部分、上述第2部分、上述第3部分及上述第4部分的上述编码序列。
由此,将表示水平成分是否是0的标志与表示垂直成分是否是0的标志在编码序列中组合。典型地,在这些标志的解码中使用上下文自适应算术解码。通过将这些标志在编码序列中组合,将使用旁路解码的不同的多个部分在编码序列中组合。因而,解码处理的并行度有可能提高。
此外,例如也可以是,在上述编码步骤中,上述第1成分的绝对值比阈值大的情况下,将包含上述第1成分的绝对值与上述阈值之差的上述第3部分编码;在上述第2成分的绝对值比上述阈值大的情况下,将包含上述第2成分的绝对值与上述阈值之差的上述第4部分编码;生成以上述第1部分、上述第2部分、上述第3部分及上述第4部分的顺序包括上述第1部分、上述第2部分、上述第3部分及上述第4部分的上述编码序列。
由此,将水平成分的绝对值与阈值之差、以及垂直成分的绝对值与阈值之差在编码序列中组合。典型地,在这些差的解码中使用旁路解码。因而,解码处理的并行度有可能提高。
此外,例如也可以是,在上述编码步骤中,通过上下文自适应算术编码,将上述第1部分及上述第2部分编码,生成以上述第1部分、上述第2部分、上述第3部分及上述第4部分的顺序包括上述第1部分、上述第2部分、上述第3部分及上述第4部分的上述编码序列,上述上下文自适应算术编码是利用基于已编码数据进行更新后的变动概率的算术编码。
由此,将使用上下文自适应算术解码的多个部分在编码序列中组合。在此情况下,将使用旁路解码的不同的多个部分在编码序列中组合。因而,解码处理的并行度有可能提高。
此外,例如也可以是,在上述编码步骤中,通过旁路编码,将上述第3部分及上述第4部分编码,生成以上述第1部分、上述第2部分、上述第3部分及上述第4部分的顺序包括上述第1部分、上述第2部分、上述第3部分及上述第4部分的上述编码序列,上述旁路编码是利用预先设定的固定概率的算术编码。
由此,将使用旁路解码的多个部分在编码序列中组合。因而,解码处理的并行度有可能提高。
此外,例如也可以是,在上述编码步骤中,将上述第3部分及上述第4部分并行编码。
由此,将水平成分的一部分和垂直成分的一部分并行地编码。因而,将差分矢量高效率地编码。
此外,例如也可以是,在上述编码步骤中,将编码处理切换为依据第1标准的第1编码处理或依据第2标准的第2编码处理,生成包括表示切换后的上述编码处理所依据的上述第1标准或上述第2标准的识别信息的比特流;在上述编码处理被切换为上述第1编码处理的情况下,生成以上述第1部分、上述第2部分、上述第3部分及上述第4部分的顺序包括上述第1部分、上述第2部分、上述第3部分及上述第4部分的上述编码序列,生成包含表示上述第1标准的上述识别信息和上述编码序列的上述比特流。
由此,向解码侧通知差分矢量的水平成分的一部分与差分矢量的垂直成分的一部分是否在编码序列中组合。因而,能够进行解码处理的适当的切换。
此外,有关本发明的一形态的图像解码方法,使用运动矢量将图像解码,包括将差分矢量解码的解码步骤,该差分矢量表示上述运动矢量的预测值即预测运动矢量与上述运动矢量之差;在上述解码步骤中,取得以(i)作为上述差分矢量的水平成分及垂直成分中的第1成分的一部分的第1部分、(ii)作为上述水平成分及上述垂直成分中的与上述第1成分不同的第2成分的一部分的第2部分、(iii)作为上述第1成分的一部分、且为与上述第1部分不同的部分的第3部分、以及(iv)作为上述第2成分的一部分、且为与上述第2部分不同的部分的第4部分的顺序包括上述第1部分、上述第2部分、上述第3部分及上述第4部分的编码序列;将包含在上述编码序列中的上述第1部分解码,将包含在上述编码序列中的上述第2部分解码,将包含在上述编码序列中的上述第3部分解码,将包含在上述编码序列中的上述第4部分解码。
由此,取得将差分矢量的水平成分的一部分与差分矢量的垂直成分的一部分组合的编码序列。例如,在将水平成分中的使用旁路解码的部分与垂直成分中的使用旁路解码的部分在编码序列中组合的情况下,解码处理的并行度有可能提高。即,通过将水平成分的一部分与垂直成分的一部分组合的编码序列,将差分矢量高效率地解码。
例如,也可以是,在上述解码步骤中,取得以(i)上述第1部分、(ii)上述第2部分、(iii)包含上述第1成分的正负符号的上述第3部分、以及(iv)包含上述第2成分的正负符号的上述第4部分的顺序包括上述第1部分、上述第2部分、上述第3部分及上述第4部分的上述编码序列;将包含在上述编码序列中的上述第1部分解码,将包含在上述编码序列中的上述第2部分解码,将包含在上述编码序列中的上述第3部分解码,将包含在上述编码序列中的上述第4部分解码。
由此,取得将水平成分的正负符号与垂直成分的正负符号组合的编码序列。典型地,在这些正负符号的解码中使用旁路解码。因而,解码处理的并行度有可能提高。
此外,例如也可以是,在上述解码步骤中,取得以(i)包含表示上述第1成分是否是0的标志的上述第1部分、(ii)包含表示上述第2成分是否是0的标志的上述第2部分、(iii)上述第3部分、以及(iv)上述第4部分的顺序包括上述第1部分、上述第2部分、上述第3部分及上述第4部分的上述编码序列;将包含在上述编码序列中的上述第1部分解码,将包含在上述编码序列中的上述第2部分解码,将包含在上述编码序列中的上述第3部分解码,将包含在上述编码序列中的上述第4部分解码。
由此,取得将表示水平成分是否是0的标志、与表示垂直成分是否是0的标志组合的编码序列。典型地,在这些标志的解码中使用上下文自适应算术解码。通过将这些标志在编码序列中组合,将使用旁路解码的不同的多个部分在编码序列中组合。因而,解码处理的并行度有可能提高。
此外,例如也可以是,在上述解码步骤中,取得以(i)上述第1部分、(ii)上述第2部分、(iii)在上述第1成分的绝对值比阈值大的情况下包含上述第1成分的绝对值与上述阈值之差的上述第3部分、以及(iv)在上述第2成分的绝对值比上述阈值大的情况下包含上述第2成分的绝对值与上述阈值之差的上述第4部分的顺序包括上述第1部分、上述第2部分、上述第3部分及上述第4部分的上述编码序列;将包含在上述编码序列中的上述第1部分解码,将包含在上述编码序列中的上述第2部分解码,将包含在上述编码序列中的上述第3部分解码,将包含在上述编码序列中的上述第4部分解码。
由此,取得将水平成分的绝对值与阈值之差、以及垂直成分的绝对值与阈值之差组合的编码序列。典型地,在这些差的解码中使用旁路解码。因而,解码处理的并行度有可能提高。
此外,例如也可以是,在上述解码步骤中,取得以(i)要通过作为利用基于已解码数据进行更新后的变动概率的算术解码的上下文自适应算术解码来解码的上述第1部分、(ii)要通过上述上下文自适应算术解码来解码的上述第2部分、(iii)上述第3部分、以及(iv)上述第4部分的顺序包括上述第1部分、上述第2部分、上述第3部分及上述第4部分的上述编码序列;将包含在上述编码序列中的上述第1部分通过上述上下文自适应算术解码来解码,将包含在上述编码序列中的上述第2部分通过上述上下文自适应算术解码来解码,将包含在上述编码序列中的上述第3部分解码,将包含在上述编码序列中的上述第4部分解码。
由此,取得将使用上下文自适应算术解码的多个部分组合的编码序列。在此情况下,将使用旁路解码的不同的多个部分在编码序列中组合。因而,解码处理的并行度有可能提高。
此外,例如也可以是,在上述解码步骤中,取得以(i)上述第1部分、(ii)上述第2部分、(iii)要通过作为利用预先设定的固定概率的算术解码的旁路解码来解码的上述第3部分、以及(iv)要通过上述旁路解码来解码的上述第4部分的顺序包括上述第1部分、上述第2部分、上述第3部分及上述第4部分的上述编码序列;将包含在上述编码序列中的上述第1部分解码,将包含在上述编码序列中的上述第2部分解码,将包含在上述编码序列中的上述第3部分通过上述旁路解码来解码,将包含在上述编码序列中的上述第4部分通过上述旁路解码来解码。
由此,取得将使用旁路解码的多个部分组合的编码序列。因而,解码处理的并行度有可能提高。
此外,例如也可以是,在上述解码步骤中,将上述第3部分及上述第4部分并行解码。
由此,将水平成分的一部分和垂直成分的一部分并行地解码。因而,将差分矢量高效率地解码。
此外,例如也可以是,在上述解码步骤中,取得包含表示第1标准或第2标准的识别信息的比特流,基于上述识别信息将解码处理切换为依据上述第1标准的第1解码处理或依据上述第2标准的第2解码处理;在上述解码处理被切换为上述第1解码处理的情况下,从上述比特流取得上述编码序列,将包含在上述编码序列中的上述第1部分解码,将包含在上述编码序列中的上述第2部分解码,将包含在上述编码序列中的上述第3部分解码,将包含在上述编码序列中的上述第4部分解码。
由此,根据差分矢量的水平成分的一部分与差分矢量的垂直成分的一部分是否在编码序列中被组合,适当地切换解码处理。
进而,这些全部或具体的形态既可以通过装置、系统、集成电路、计算机程序或计算机可读取的CD-ROM等的非暂时性的记录介质实现,也可以通过装置、系统、集成电路、计算机程序及记录介质的任意的组合实现。
以下,使用附图对有关本发明的一形态的图像编码方法及图像解码方法详细地说明。另外,以下说明的实施方式都表示本发明的一具体例。即,在以下的实施方式中表示的数值、形状、材料、构成要素、构成要素的配置及连接形态、步骤、步骤的顺序等是一例,并不是限定本发明的意思。此外,关于以下的实施方式的构成要素中的、在表示最上位概念的独立权利要求中没有记载的构成要素,作为任意的构成要素进行说明。
(实施方式1)
图7是表示有关实施方式1的差分矢量解码部100的功能结构的模块图。
有关本实施方式的差分矢量解码部100由前缀部解码部110、后缀部解码部120、差分矢量复原控制部101及差分矢量复原部106构成。其中,前缀部解码部110由差分矢量0判断部102及差分矢量前缀部解码部103构成。此外,后缀部解码部120由差分矢量后缀部解码部104及差分矢量正负符号解码部105构成。并且,差分矢量解码部100根据比特流BS复原差分矢量的X成分MVDX和Y成分MVDY的信息。
使用图8对本实施方式的差分矢量解码部100的动作详细地说明。图8是表示有关本实施方式的差分矢量解码部100的动作的流程的一例的流程图。
首先,差分矢量0判断部102从所取得的比特流将表示差分矢量的X成分是否是0的标志解码(S200)。这里,在差分矢量的X成分不是0的情况下(S201中否),通过差分矢量前缀部解码部103将差分矢量的X成分的前缀部解码(S202)。另一方面,在差分矢量的X成分是0的情况下(S201中是),在差分矢量的X成分中设置0(S203)。
接着,回到循环,差分矢量0判断部102将表示差分矢量的Y成分是否是0的标志解码(S204)。这里,在差分矢量的Y成分不是0的情况下(S205中否),通过差分矢量前缀部解码部103将差分矢量的Y成分的前缀部解码(S206)。另一方面,在差分矢量的Y成分是0的情况下(S205中是),在差分矢量的Y成分中设置0(S207)。另外,到此为止的处理是差分矢量前缀部解码部103的动作(S280)。
接着,在根据已解码的差分矢量的X成分的信息判断为X成分不是0(S208中否)、有后缀部的情况下(S209中是),差分矢量后缀部解码部104从比特流将差分矢量的X成分的后缀部解码(S210)。另外,在没有后缀部的情况下(S209中否),将后缀部的解码处理跳过。这里,关于后缀部的有无,由于在例如图6所示的二值化序列中分为前缀部和后缀部,所以在前缀部全部是1的情况下,判断为有后缀部。
接着,差分矢量正负符号解码部105根据比特流将差分矢量的正负符号解码,通过差分矢量复原部106将差分矢量的X成分复原(S211)。另一方面,在X成分是0的情况下(S208中是),由于差分矢量的X成分已经复原完,所以将X成分的后缀部的解码处理跳过。
接着,在根据已解码的差分矢量的Y成分的信息判断为Y成分不是0(S212中否)、有后缀部的情况下(S213中是),差分矢量后缀部解码部104从比特流将差分矢量的Y成分的后缀部解码(S214)。另外,在没有后缀部的情况下(S213中否),将后缀部的解码处理跳过。这里,后缀部的有无也可以与X成分同样地判断。接着,差分矢量正负符号解码部105根据比特流将差分矢量的Y成分的正负符号解码,通过差分矢量复原部106将差分矢量的Y成分复原(S215)。另一方面,在Y成分是0的情况下(S212中是),由于差分矢量的Y成分已经复原完,所以将Y成分的后缀部的解码处理跳过。
另外,关于前缀部分,由于差分矢量的信息的偏倚较大(有0矢量变多的倾向),所以通过进行上述上下文自适应的算术编码,编码效率提高。因此,在解码时执行上下文自适应算术解码处理(图3)。
另一方面,后缀部分对应于较大的差分矢量的下位比特。因而,能够取的值的范围较大(例如9~1024),关于二值化序列的符号的发生频度,偏倚较小。因此,将符号发生概率看作50%,通过进行旁路编码来削减处理量。即,在后缀部分的解码中,执行旁路解码(图4)。另外,在差分矢量中包含正负符号的情况下,对其也进行旁路编码,所以执行旁路解码。
这里,使用图9说明图8所示的解码处理的动作例。
图9是用来说明实施方式1的执行处理步骤的例子的图。图9(a)是将实施方式1的执行处理以1并行实施的情况下的例子。以差分矢量的X成分的前缀部分的解码(MVDX_PREFIX)、Y成分的前缀部分的解码(MVDY_PREFIX)、X成分的后缀部分的解码(MVDX_SUFFIX)、X成分的正负符号的解码(MVDX_SIGN)、Y成分的后缀部分的解码(MVDY_SUFFIX)、Y成分的正负符号的解码(MVDY_SIGN)的顺序进行处理。
但是,由于在所利用的图像分辨率的扩大及高速度的实时通信扩展的过程中需要高速处理,所以进行使处理并行化的安装。但是,前缀部分由于被进行上下文自适应的算术编码处理,所以需要依次进行符号发生概率的读入处理及更新处理。因此不能并行化。但是,关于旁路处理部分,能够如图9(b)所示以比特单位进行并行化。
另一方面,图9(c)及图9(d)是以往的结构中的执行处理的并行化的例子。图9(c)对应于图9(a),图9(d)对应于图9(b)。同样,前缀部分、即上下文自适应算术解码处理部分为串行处理,后缀部分、即旁路处理部分能够并行化。但是,由于X成分与Y成分交叉(入れ違う),所以能够并行的部分被中断。因此,不能充分地高速化(图9(d))。此外,由于上下文自适应算术解码与旁路解码的切换较多,所以处理的负荷及延迟也较大。
另外,有关实施方式1的差分矢量解码部100装备在将被压缩编码的编码图像数据解码的图像解码装置中。图10是表示有关实施方式1的图像解码装置400的结构的一例的模块图。
图像解码装置400将被压缩编码的编码图像数据解码。例如,在图像解码装置400中,作为解码对象信号而按每个块输入编码图像数据。图像解码装置400通过对输入的解码对象信号进行可变长度解码、逆量化及逆变换,将图像数据复原。
如图10所示,图像解码装置400具备熵解码部410、逆量化逆变换部420、加法器425、解块滤波器430、存储器440、帧内预测部450、运动补偿部460、帧内/帧间切换开关470。
熵解码部410通过将输入信号(输入流)进行可变长度解码,将量化系数复原。另外,这里输入信号(输入流)是解码对象信号,相当于编码图像数据的各块的数据。此外,熵解码部410从输入信号取得运动数据,将所取得的运动数据向运动补偿部460输出。
逆量化逆变换部420通过将由熵解码部410复原后的量化系数进行逆量化,将变换系数复原。并且,逆量化逆变换部420通过对复原后的变换系数进行逆变换,将预测误差复原。
加法器425通过将复原后的预测误差与预测信号相加,生成解码图像。
解块滤波器430对所生成的解码图像进行解块滤波处理。将解块滤波处理后的解码图像作为解码信号输出。
存储器440是用来保存在运动补偿中使用的参照图像的存储器。具体而言,存储器440保存实施了解块滤波处理后的解码图像。
帧内预测部450通过进行帧内预测而生成预测信号(帧内预测信号)。具体而言,帧内预测部450通过参照由加法器425生成的解码图像中的、解码对象块(输入信号)的周围的图像进行帧内预测,来生成帧内预测信号。
运动补偿部460通过基于从熵解码部410输出的运动数据进行运动补偿,来生成预测信号(帧间预测信号)。
帧内/帧间切换开关470选择帧内预测信号及帧间预测信号中的某一个,将所选择的信号作为预测信号向加法器425输出。
通过以上的结构,有关实施方式1的图像解码装置400将被压缩编码的编码图像数据解码。
另外,在图像解码装置400中,熵解码部410具备有关实施方式1的差分矢量解码部100。
如以上那样,根据有关实施方式1的图像解码装置及图像解码方法,能够进行高速的差分矢量的解码。
具体而言,如实施方式1所示,将差分矢量值的X成分及Y成分合并,将差分矢量值分为上下文自适应算术解码部分和旁路处理部分。由此,能够进行并行运算的部分变长。因而,能够进行并行处理、即高速的解码。
另外,在上述说明中,分为X成分、Y成分说明了后缀部的解码处理和正负符号解码处理,但并不限定于此。例如也可以在X成分的后缀部解码处理之后进行Y成分的后缀部解码处理、X成分的正负符号解码处理、Y成分的正负符号解码处理。即使是该结构,也由于旁路处理的部分连续,所以能够期待效果。此外,对于前缀部分,也可以将表示X成分是否是0的信息和表示Y成分是否是0的信息连续解码。这是因为,不论怎样,上下文算术解码处理部分的制约(需要串行处理)都没有变化。
另外,关于图6所示的二值化序列及上下文自适应算术解码的长度是一例,并不一定需要与上述一致。例如,也可以将绝对值0、1或2的差分矢量作为前缀部分、将3以上的差分矢量值作为后缀部分解码(当然,在生成该比特流的编码装置中也进行同样的处理)。通过这样决定二值化序列,并行度提高,能够进行更高速的解码处理。
(实施方式1的变形例)
另外,在实施方式1中,针对与上下文自适应算术解码处理对应的前缀部和与旁路解码处理对应的后缀部,不论X成分及Y成分如何,都将差分矢量分割。由此,实现高速处理。在保持这一点的同时,可以考虑以下这样的变形例。
使用图11A及图11B对实施方式1的变形例详细地说明。图11A是表示实施方式1的变形例的差分矢量的X成分、Y成分是否是0的标志的对应表。图11B是表示实施方式1的变形例的处理的流程的一例的流程图。
在实施方式1中,设差分矢量的X成分是否是0、差分矢量的Y成分是否是0为不同的标志而进行说明。但是,在实施方式1中,由于实现了将差分矢量的X成分与Y成分组合解码,所以通过将该标志组合,能够进一步实现编码效率的提高。
例如,如图11A所示,对X成分是否是0(MVDX_EXIST)和Y成分是否是0(MVDY_EXIST)的组合分配符号(MVDXY_EXIST)。
在X成分和Y成分都是0的情况下分配“0”,在X成分和Y成分都不是0的情况下分配“111”,在X成分是0而Y成分不是0的情况下分配“110”,在Y成分是0而X成分不是0的情况下分配“10”。
如上述那样,作为差分矢量的导出方法,可以考虑用索引指定从周围的矢量的导出方法的方法。因此,与以往的图像编码相比,差分矢量的成分为“0”的概率更高。在X成分和Y成分都为“0”的情况下,以往二值化序列信号需要2比特,而在本变形例中用1比特表现。本变形例的差分矢量解码部100的处理的流程如图11B所述。
在步骤S501中,取得表示差分矢量的X成分、Y成分是否是0的编码序列(S501)。这里,例如通过图11A的对应表,分配X成分、Y成分是否是0的结果。另外,除了图8的S200和S204的部分成为步骤S501以外,与图8相同,所以以后的说明省略。
另外,图11A所示的对应表是一例。在该例的情况下,一般由于在水平方向上运动的影像较多,所以在差分矢量的X成分为0的可能性较低的前提下决定二值化序列。例如,差分矢量编码部也可以根据符号的发生频度切换该对应表,在比特流中记录用哪个对应表进行了编码的索引。并且,差分矢量解码部100也可以通过将该索引解码来取得图11A的对应表。
通过该变形例,能够在实现高速处理的同时使编码效率提高。
(实施方式2)
对本实施方式的算术编码方法的概要进行说明。本实施方式的算术编码方法的特征在于,不是将差分矢量划分为X成分和Y成分,而是划分为与上下文自适应算术编码对应的前缀部和与旁路处理编码对应的后缀部。由此,实现处理的并行化,实现高速的编码。
以上是对本实施方式的算术编码方法的概要的说明。在没有特别说明的情况下,表示也可以采取与以往的算术编码方法相同的方法。
接着,说明进行本实施方式的差分矢量编码方法的差分矢量编码部的处理的流程说明。
图12是表示有关实施方式2的差分矢量编码部的处理的流程的流程图。
差分矢量编码部首先取得作为编码对象的差分矢量的X成分和Y成分的信息,判断差分矢量的X成分是否是0(S601)。在差分矢量的X成分不是0的情况下(S601中否),进行差分矢量的X成分的前缀部的编码处理(S602)。另外,这里的前缀部的编码处理将图6所示的二值化序列利用后述的上下文自适应算术编码方法编码。上下文自适应算术编码是与图3的算术解码方法成对的方法,是根据条件切换上下文、取得符号发生概率、根据被编码的符号将该概率值更新的算术编码的一种(参照非专利文献1)。另外,以下在没有明述的情况下,在前缀部的编码中实施上下文自适应算术编码方法。
接着,在差分矢量的X成分是0的情况下(S601中是),进行表示差分矢量的X成分是0的标志的编码(S603)。接着,判断差分矢量的Y成分是否是0(S604)。在差分矢量的Y成分不是0的情况下(S604中否),进行差分矢量的Y成分的前缀部的编码处理(与X成分同样,S605)。另一方面,在差分矢量的Y成分是0的情况下,将表示差分矢量的Y成分是0的标志编码(S606)。
接着,判断差分矢量的X成分是否是TH值以上,即是否有后缀(S607)。例如,在使用图6的二值化序列表的情况下,判断为TH=9。另外,在本实施方式中,不论该二值化序列表如何,只要判断前缀(上下文自适应算术编码)部分和后缀(旁路处理编码)部分的边界就可以。
这里,如果有X成分的后缀部(S607中是),则实施差分矢量的X成分的后缀部分的编码(S608)。另外,后缀部分的编码中进行算术编码的旁路处理。具体而言是通过固定为概率50%来省略运算的方法,是与图4所示的旁路解码方法成对的方法(参照非专利文献1)。此后在没有明述的情况下,设为在后缀部的编码中使用旁路编码。接着,进行差分矢量的X成分的正负符号的编码。另外,对于该处理也实施旁路编码(S610)。另外,X成分的正负符号的编码在没有后缀部分(S607中否)、X成分不是0的情况下(S609中否)也进行。在X成分的后缀编码处理结束后(S610及S609中是),进行对Y成分的后缀编码处理。
接着,判断差分矢量的Y成分是否是TH值以上,即是否有后缀(S611)。由于判断与X成分相同,所以详细说明省略。
这里,如果有Y成分的后缀部(S611中是),实施差分矢量的Y成分的后缀部分的编码(S612)。另外,在后缀部分的编码中进行算术编码的旁路处理。接着,进行差分矢量的Y成分的正负符号的编码。另外,对于该处理也实施旁路编码(S614)。另外,Y成分的正负符号的编码在没有后缀部分(S611中否)、Y成分不是0的情况下(S613中否)也进行。由此,Y成分的后缀编码处理结束,结束差分矢量的X成分、Y成分的编码处理。
另外,在差分矢量的编码方法中,也能够如在实施方式1中说明的图9(b)那样进行处理的并行化,所以能够使编码装置高速化。另外,作为对于实施方式1的变形例的编码方法,将图12的处理流程中的S601和S604最先实施。并且,代替S603和S606,基于图11A的对应表,将表示差分矢量的X成分、Y成分是否是0的组合的二值化序列编码。另外,对于该情况下的编码也进行前缀编码、即上下文自适应型的算术编码方法。由此,能够在提高编码效率的同时实现高速的编码。
另外,图13是说明表示数据结构的例子的句法的示意图。另外,该句法表从非专利文献2引例,是将701、702、703的部分通过实施方式2(及1)中的差分矢量的编码(解码)方法生成的数据构造的例子。
如701至703所示,表示差分矢量的mvd_l?表现为表示X成分及Y成分双方的参数。另外,mvd_l?的?对应于参照索引,具体而言,是c、0或1(细节参照非专利文献2)。
以往,差分矢量表现为mvd_l?[x0][y0][0]及mvd_l?[x0][y0][1]。这里,最后的要素的[0]表示X成分,[1]表示Y成分。有关实施方式2(及1)的差分矢量的X成分及Y成分组合记载在流中。因此,有关实施方式2(及1)的差分矢量表述为mvd_l?[x0][y0]。
通过生成这样的结构的数据,能够实现高速的编码及解码。
另外,有关实施方式2的差分矢量编码部装备在将图像数据压缩编码的图像编码装置中。图14是表示有关实施方式2的图像编码装置200的结构的一例的模块图。
图像编码装置200将图像数据压缩编码。例如,在图像编码装置200中,将图像数据按每个块作为输入信号输入。图像编码装置200通过对输入的输入信号进行变换、量化及可变长度编码,生成编码信号。
如图14所示,图像编码装置200具备减法器205、变换量化部210、熵编码部220、逆量化逆变换部230、加法器235、解块滤波器240、存储器250、帧内预测部260、运动检测部270、运动补偿部280和帧内/帧间切换开关290。
减法器205计算输入信号与预测信号的差,即预测误差。
变换量化部210通过对空间域的预测误差进行变换,生成频率域的变换系数。例如,变换量化部210通过对预测误差进行DCT(Discrete Cosine Transform)变换,生成变换系数。进而,变换量化部210通过将变换系数量化,生成量化系数。
熵编码部220通过对量化系数进行可变长度编码,生成编码信号。此外,熵编码部220将由运动检测部270检测出的运动数据(例如运动矢量)编码,包含在编码信号中而输出。
逆量化逆变换部230通过将量化系数逆量化,将变换系数复原。进而,逆量化逆变换部230通过对复原后的变换系数进行逆变换,将预测误差复原。另外,由于复原后的预测误差通过量化而丢失了信息,所以与减法器205生成的预测误差不一致。即,复原后的预测误差包含量化误差。
加法器235通过将复原后的预测误差与预测信号相加,生成局部(local)解码图像。
解块滤波器240对所生成的局部解码图像进行解块滤波处理。
存储器250是用来保存在运动补偿中使用的参照图像的存储器。具体而言,存储器250保存实施了解块滤波处理的局部解码图像。
帧内预测部260通过进行帧内预测而生成预测信号(帧内预测信号)。具体而言,帧内预测部260通过参照由加法器235生成的局部解码图像中的、编码对象块(输入信号)的周围的图像进行帧内预测,生成帧内预测信号。
运动检测部270检测输入信号与保存在存储器250中的参照图像之间的运动数据(例如运动矢量)。
运动补偿部280基于检测出的运动数据进行运动补偿,从而生成预测信号(帧间预测信号)。
帧内/帧间切换开关290选择帧内预测信号及帧间预测信号中的某一个,将所选择的信号作为预测信号向减法器205及加法器235输出。
通过以上的结构,有关实施方式2的图像编码装置200将图像数据压缩编码。
(实施方式3)
在本实施方式中,提示性地表示包含在实施方式1或实施方式2中的特征性的结构及顺序。有关本实施方式的结构及顺序对应于实施方式1或实施方式2所示的结构及顺序。即,在实施方式1及实施方式2中表示的概念包括有关本实施方式的结构及顺序。
图15A是表示有关本实施方式的图像编码装置的结构的一例的模块图。图15A所示的图像编码装置800使用运动矢量将图像编码。此外,图像编码装置800包括编码部801。
图15B是表示图15A所示的图像编码装置800的处理动作的流程图。编码部801将差分矢量编码(S801)。差分矢量表示预测运动矢量与运动矢量的差。预测运动矢量是运动矢量的预测值。编码部801在将差分矢量编码时,将第1部分、第2部分、第3部分及第4部分编码。
第1部分是差分矢量的水平成分及垂直成分中的第1成分的一部分。第2部分是差分矢量的水平成分及垂直成分中的与第1成分不同的第2成分的一部分。第3部分是第1成分的一部分,并且是与第1部分不同的部分。第4部分是第2成分的一部分,并且是与第2部分不同的部分。典型地讲,各成分的一部分是与该成分对应的2值数据的一部分。
并且,编码部801生成以第1部分、第2部分、第3部分及第4部分的顺序包括第1部分、第2部分、第3部分及第4部分的编码序列。
由此,将差分矢量的水平成分的一部分与差分矢量的垂直成分的一部分在编码序列中组合。并且,通过将水平成分的一部分与垂直成分的一部分组合,将差分矢量高效率地编码。
例如,第1部分可以包括表示第1成分是否是0的标志。第2部分可以包括表示第2成分是否是0的标志。第3部分可以包括第1成分的正负符号。第4部分可以包括第2成分的正负符号。
此外,例如在第1成分的绝对值比阈值大的情况下,第3部分可以包含第1成分的绝对值与阈值的差。在第2成分的绝对值比阈值大的情况下,第4部分可以包含第2成分的绝对值与阈值的差。
此外,例如编码部801可以通过上下文自适应算术编码将第1部分及第2部分编码。并且,编码部801可以通过旁路编码将第3部分及第4部分编码。上下文自适应算术编码是使用基于已编码数据更新后的变动概率的算术编码。旁路编码是使用预先设定的固定概率的算术编码。此外,编码部801可以将第3部分及第4部分并行地编码。
此外,例如编码部801可以以第1部分、第2部分、第3部分及第4部分的顺序将第1部分、第2部分、第3部分及第4部分编码。
此外,例如编码部801可以将编码处理切换为依据第1标准的第1编码处理或依据第2标准的第2编码处理。并且,编码部801也可以生成包含表示切换后的编码处理所依据的第1标准或第2标准的识别信息的比特流。
并且,在编码处理被切换为第1编码处理的情况下,编码部801也可以生成以第1部分、第2部分、第3部分及第4部分的顺序包括第1部分、第2部分、第3部分及第4部分的编码序列。此外,在此情况下,编码部801也可以生成包含表示第1标准的识别信息和编码序列的比特流。
图16A是表示有关本实施方式的图像解码装置的结构的一例的模块图。图16A所示的图像解码装置900使用运动矢量将图像解码。此外,图像解码装置900包括解码部901。
图16B是表示图16A所示的图像解码装置900的处理动作的流程图。解码部901将差分矢量解码(S901)。预测运动矢量是运动矢量的预测值。差分矢量表示预测运动矢量与运动矢量之差。
解码部901在将差分矢量解码时,取得编码序列。并且,解码部901将包含在编码序列中的第1部分解码,将包含在编码序列中的第2部分解码,将包含在编码序列中的第3部分解码,将包含在编码序列中的第4部分解码。
第1部分是差分矢量的水平成分及垂直成分中的第1成分的一部分。第2部分是水平成分及垂直成分中的、与第1成分不同的第2成分的一部分。第3部分是第1成分的一部分,且是与第1部分不同的部分。第4部分是第2成分的一部分,且是与第2部分不同的部分。典型地,各成分的一部分是与该成分对应的2值数据的一部分。
编码序列以第1部分、第2部分、第3部分及第4部分的顺序包括第1部分、第2部分、第3部分及第4部分。
即,解码部901取得将差分矢量的水平成分的一部分与差分矢量的垂直成分的一部分组合的编码序列。并且,通过将水平成分的一部分与垂直成分的一部分组合的编码序列,将差分矢量高效率地解码。
例如,第1部分可以包含表示第1成分是否是0的标志。第2部分可以包含表示第2成分是否是0的标志。第3部分可以包含第1成分的正负的符号。第4部分可以包含第2成分的正负的符号。
此外,例如在第1成分的绝对值比阈值大的情况下,第3部分可以包含第1成分的绝对值与阈值的差。在第2成分的绝对值比阈值大的情况下,第4部分可以包含第2成分的绝对值与阈值的差。
此外,例如解码部901可以通过上下文自适应算术解码将第1部分及第2部分解码。并且,解码部901可以通过旁路解码将第3部分及第4部分解码。上下文自适应算术解码是使用基于已解码数据更新后的变动概率的算术解码。旁路解码是使用预先设定的固定概率的算术解码。此外,解码部901可以将第3部分及第4部分并行地解码。
此外,例如解码部901可以以第1部分、第2部分、第3部分及第4部分的顺序将第1部分、第2部分、第3部分及第4部分解码。
此外,例如解码部901也可以取得包含表示第1标准或第2标准的识别信息的比特流。并且,解码部901也可以基于识别信息将解码处理切换为依据第1标准的第1解码处理或依据第2标准的第2解码处理。
并且,在解码处理被切换为第1解码处理的情况下,解码部901也可以从比特流取得以第1部分、第2部分、第3部分及第4部分的顺序包括第1部分、第2部分、第3部分及第4部分的编码序列。
此外,例如图像编码装置800及图像解码装置900也可以构成图像编解码装置。
此外,例如与差分矢量的编码序列对应的数据构造也可以是由图17表示的数据构造。
图17是表示与差分矢量的编码序列对应的数据构造的一例的句法表。图17的[0]表示水平成分,[1]表示垂直成分。
abs_mvd_greater0_flag是表示差分矢量的水平成分或垂直成分的绝对值是否比0大的标志。abs_mvd_greater1_flag是表示差分矢量的水平成分或垂直成分的绝对值是否比1大的标志。abs_mvd_minus2是从差分矢量的水平成分或垂直成分的绝对值减去2而得到的值。mvd_sign_flag是差分矢量的水平成分或垂直成分的符号。
abs_mvd_greater0_flag及abs_mvd_greater1_flag对应于前缀部。abs_mvd_minus2对应于后缀部。典型地,在abs_mvd_greater0_flag及abs_mvd_greater1_flag的编码(解码)中使用上下文自适应算术编码(解码)。并且,在abs_mvd_minus2及mvd_sign_flag的编码(解码)中使用旁路编码(解码)。
另外,在上述各实施方式中,各构成要素也可以由专用的硬件构成,或者通过执行适合于各构成要素的软件程序来实现。各构成要素也可以通过由CPU或处理器等的程序执行部将记录在硬盘或半导体存储器等的记录介质中的软件程序读出并执行来实现。这里,实现上述各实施方式的图像编码装置等的软件是以下这样的程序。
即,该程序使计算机执行图像编码方法,该图像编码方法使用运动矢量将图像编码,包括将表示上述运动矢量的预测值即预测运动矢量与上述运动矢量之差的差分矢量编码的编码步骤;在上述编码步骤中,将作为上述差分矢量的水平成分及垂直成分中的第1成分的一部分的第1部分编码;将作为上述水平成分及上述垂直成分中的与上述第1成分不同的第2成分的一部分的第2部分编码;将第3部分编码,该第3部分是上述第1成分的一部分、并且是与上述第1部分不同的部分;将第4部分编码,该第4部分是上述第2成分的一部分、并且是与上述第2部分不同的部分;生成以上述第1部分、上述第2部分、上述第3部分及上述第4部分的顺序包括上述第1部分、上述第2部分、上述第3部分及上述第4部分的编码序列。
以上,基于实施方式对有关本发明的一个或多个形态的图像编码方法进行了说明,但本发明并不限定于该实施方式。只要不脱离本发明的主旨,对本实施方式实施了本领域的技术人员想到的各种变形后的形态、或将不同的实施方式的构成要素组合而构建的形态也可以包含在本发明的1个或多个形态的范围内。
(实施方式4)
通过将用来实现上述各实施方式所示的动态图像编码方法(图像编码方法)或动态图像解码方法(图像解码方法)的结构的程序记录到存储介质中,能够将上述各实施方式所示的处理在独立的计算机系统中简单地实施。存储介质是磁盘、光盘、光磁盘、IC卡、半导体存储器等,只要是能够记录程序的介质就可以。
进而,这里说明在上述各实施方式中示出的动态图像编码方法(图像编码方法)及动态图像解码方法(图像解码方法)的应用例和使用它的系统。该系统的特征在于,具有由使用图像编码方法的图像编码装置及使用图像解码方法的图像解码装置构成的图像编解码装置。关于系统的其他结构,可以根据情况而适当变更。
图18是表示实现内容分发服务的内容供给系统ex100的整体结构的图。将通信服务的提供区划分为希望的大小,在各小区内分别设置有作为固定无线站的基站ex106、ex107、ex108、ex109、ex110。
该内容供给系统ex100在因特网ex101上经由因特网服务提供商ex102及电话网ex104、及基站ex106~ex110连接着计算机ex111、PDA(Personal Digital Assistant)ex112、照相机ex113、便携电话ex114、游戏机ex115等的各设备。
但是,内容供给系统ex100并不限定于图18那样的结构,也可以将某些要素组合连接。此外,也可以不经由作为固定无线站的基站ex106~ex110将各设备直接连接在电话网ex104上。此外,也可以将各设备经由近距离无线等直接相互连接。
照相机ex113是数字摄像机等的能够进行动态图像摄影的设备,照相机ex116是能够进行数字照相机等的静止图像摄影、动态图像摄影的设备。此外,便携电话ex114是GSM(Global System for Mobile Communications)方式、CDMA(Code Division MultipleAccess)方式、W-CDMA(Wideband-Code Division Multiple Access)方式、或LTE(LongTerm Evolution)方式、HSPA(High Speed Packet Access)的便携电话机、或PHS(PersonalHandyphone System)等,是哪种都可以。
在内容供给系统ex100中,通过将照相机ex113等经由基站ex109、电话网ex104连接在流介质服务器ex103上,能够进行现场分发等。在现场分发中,对用户使用照相机ex113摄影的内容(例如音乐会现场的影像等)如在上述各实施方式中说明那样进行编码处理(即,作为本发明的一个方式的图像编码装置发挥作用),向流介质服务器ex103发送。另一方面,流介质服务器ex103将发送来的内容数据对有请求的客户端进行流分发。作为客户端,有能够将上述编码处理后的数据解码的计算机ex111、PDAex112、照相机ex113、便携电话ex114、游戏机ex115等。在接收到分发的数据的各设备中,将接收到的数据解码处理而再现(即,作为本发明的一个方式的图像解码装置发挥作用)。
另外,摄影的数据的编码处理既可以由照相机ex113进行,也可以由进行数据的发送处理的流介质服务器ex103进行,也可以相互分担进行。同样,分发的数据的解码处理既可以由客户端进行,也可以由流介质服务器ex103进行,也可以相互分担进行。此外,并不限于照相机ex113,也可以将由照相机ex116摄影的静止图像及/或动态图像数据经由计算机ex111向流介质服务器ex103发送。此情况下的编码处理由照相机ex116、计算机ex111、流介质服务器ex103的哪个进行都可以,也可以相互分担进行。
此外,这些编解码处理一般在计算机ex111或各设备具有的LSIex500中处理。LSIex500既可以是单芯片,也可以是由多个芯片构成的结构。另外,也可以将动态图像编解码用的软件装入到能够由计算机ex111等读取的某些记录介质(CD-ROM、软盘、硬盘等)中、使用该软件进行编解码处理。进而,在便携电话ex114是带有照相机的情况下,也可以将由该照相机取得的动态图像数据发送。此时的动态图像数据是由便携电话ex114具有的LSIex500编码处理的数据。
此外,也可以是,流介质服务器ex103是多个服务器或多个计算机,是将数据分散处理、记录、及分发的。
如以上这样,在内容供给系统ex100中,客户端能够接收编码的数据而再现。这样,在内容供给系统ex100中,客户端能够将用户发送的信息实时地接收、解码、再现,即使是没有特别的权利或设备的用户也能够实现个人广播。
另外,并不限定于内容供给系统ex100的例子,如图19所示,在数字广播用系统ex200中也能够装入上述实施方式的至少动态图像编码装置(图像编码装置)或动态图像解码装置(图像解码装置)的某个。具体而言,在广播站ex201中,将对影像数据复用了音乐数据等而得到的复用数据经由电波向通信或广播卫星ex202传送。该影像数据是通过上述各实施方式中说明的动态图像编码方法编码后的数据(即,通过本发明的一个方式的图像编码装置编码后的数据)。接受到该数据的广播卫星ex202发出广播用的电波,能够对该电波进行卫星广播接收的家庭的天线ex204接收该电波,通过电视机(接收机)ex300或机顶盒(STB)ex217等的装置将接收到的复用数据解码并将其再现(即,作为本发明的一个方式的图像解码装置发挥作用)。
此外,可以在将记录在DVD、BD等的记录介质ex215中的复用数据读取并解码、或将影像数据编码再根据情况与音乐信号复用而写入记录介质ex215中的读取器/记录器ex218中也能够安装上述各实施方式所示的动态图像解码装置或动态图像编码装置。在此情况下,可以将再现的影像信号显示在监视器ex219上,通过记录有复用数据的记录介质ex215在其他装置或系统中能够再现影像信号。此外,也可以在连接在有线电视用的线缆ex203或卫星/地面波广播的天线ex204上的机顶盒ex217内安装动态图像解码装置,将其用电视机的监视器ex219显示。此时,也可以不是在机顶盒、而在电视机内装入动态图像解码装置。
图20是表示使用在上述各实施方式中说明的动态图像解码方法及动态图像编码方法的电视机(接收机)ex300的图。电视机ex300具备经由接收上述广播的天线ex204或线缆ex203等取得或者输出对影像数据复用了声音数据的复用数据的调谐器ex301、将接收到的复用数据解调或调制为向外部发送的编码数据的调制/解调部ex302、和将解调后的复用数据分离为影像数据、声音数据或将在信号处理不ex306中编码的影像数据、声音数据复用的复用/分离部ex303。
此外,电视机ex300具备:具有将声音数据、影像数据分别解码、或将各自的信息编码的声音信号处理部ex304和影像信号处理部ex305(即,作为本发明的一个方式的图像编码装置或图像解码装置发挥作用)的信号处理部ex306;具有将解码后的声音信号输出的扬声器ex307及显示解码后的影像信号的显示器等的显示部ex308的输出部ex309。进而,电视机ex300具备具有受理用户操作的输入的操作输入部ex312等的接口部ex317。进而,电视机ex300具有合并控制各部的控制部ex310、对各部供给电力的电源电路部ex311。接口部ex317也可以除了操作输入部ex312以外,还具有与读取器/记录器ex218等的外部设备连接的桥接部ex313、用来能够安装SD卡等的记录介质ex216的插槽部ex314、用来与硬盘等的外部记录介质连接的驱动器ex315、与电话网连接的调制解调器ex316等。另外,记录介质ex216是能够通过收存的非易失性/易失性的半导体存储元件电气地进行信息的记录的结构。电视机ex300的各部经由同步总线相互连接。
首先,对电视机ex300将通过天线ex204等从外部取得的复用数据解码、再现的结构进行说明。电视机ex300接受来自遥控器ex220等的用户操作,基于具有CPU等的控制部ex310的控制,将由调制/解调部ex302解调的复用数据用复用/分离部ex303分离。进而,电视机ex300将分离的声音数据用声音信号处理部ex304解码,将分离的影像数据用影像信号处理部ex305使用在上述各实施方式中说明的解码方法解码。将解码后的声音信号、影像信号分别从输出部ex309朝向外部输出。在输出时,可以暂时将这些信号储存到缓冲器ex318、ex319等中,以使声音信号和影像信号同步再现。此外,电视机ex300也可以不是从广播等、而从磁/光盘、SD卡等的记录介质ex215、ex216读出编码的复用数据。接着,对电视机ex300将声音信号或影像信号编码、向外部发送或写入到记录介质等中的结构进行说明。电视机ex300接受来自遥控器ex220等的用户操作,基于控制部ex310的控制,由声音信号处理部ex304将声音信号编码,由影像信号处理部ex305将影像信号使用在上述各实施方式中说明的编码方法编码。将编码后的声音信号、影像信号用复用/分离部ex303复用,向外部输出。在复用时,可以暂时将这些信号储存到缓冲器ex320、ex321等中,以使声音信号和影像信号同步再现。另外,缓冲器ex318、ex319、ex320、ex321既可以如图示那样具备多个,也可以是共用一个以上的缓冲器的结构。进而,在图示以外,也可以在例如调制/解调部ex302或复用/分离部ex303之间等也作为避免系统的上溢、下溢的缓冲部而在缓冲器中储存数据。
此外,电视机ex300除了从广播等或记录介质等取得声音数据、影像数据以外,也可以具备受理麦克风或照相机的AV输入的结构,对从它们中取得的数据进行编码处理。另外,这里,将电视机ex300作为能够进行上述编码处理、复用、及外部输出的结构进行了说明,但也可以不能进行这些处理,而是仅能够进行上述接收、解码处理、外部输出的结构。
此外,在由读取器/记录器ex218从记录介质将复用数据读出、或写入的情况下,上述解码处理或编码处理由电视机ex300、读取器/记录器ex218的哪个进行都可以,也可以是电视机ex300和读取器/记录器ex218相互分担进行。
作为一例,将从光盘进行数据的读入或写入的情况下的信息再现/记录部ex400的结构表示在图21中。信息再现/记录部ex400具备以下说明的单元ex401、ex402、ex403、ex404、ex405、ex406、ex407。光头ex401对作为光盘的记录介质ex215的记录面照射激光斑而写入信息,检测来自记录介质ex215的记录面的反射光而读入信息。调制记录部ex402电气地驱动内置在光头ex401中的半导体激光器,根据记录数据进行激光的调制。再现解调部ex403将由内置在光头ex401中的光检测器电气地检测到来自记录面的反射光而得到的再现信号放大,将记录在记录介质ex215中的信号成分分离并解调,再现所需要的信息。缓冲器ex404将用来记录到记录介质ex215中的信息及从记录介质ex215再现的信息暂时保持。盘马达ex405使记录介质ex215旋转。伺服控制部ex406一边控制盘马达ex405的旋转驱动一边使光头ex401移动到规定的信息轨道,进行激光斑的追踪处理。系统控制部ex407进行信息再现/记录部ex400整体的控制。上述的读出及写入的处理由系统控制部ex407利用保持在缓冲器ex404中的各种信息、此外根据需要而进行新的信息的生成、追加、并且一边使调制记录部ex402、再现解调部ex403、伺服控制部ex406协调动作、一边通过光头ex401进行信息的记录再现来实现。系统控制部ex407例如由微处理器构成,通过执行读出写入的程序来执行它们的处理。
以上,假设光头ex401照射激光斑而进行了说明,但也可以是使用接近场光进行高密度的记录的结构。
在图22中表示作为光盘的记录介质ex215的示意图。在记录介质ex215的记录面上,以螺旋状形成有导引槽(沟),在信息轨道ex230中,预先通过沟的形状的变化而记录有表示盘上的绝对位置的地址信息。该地址信息包括用来确定作为记录数据的单位的记录块ex231的位置的信息,通过在进行记录及再现的装置中将信息轨道ex230再现而读取地址信息,能够确定记录块。此外,记录介质ex215包括数据记录区域ex233、内周区域ex232、外周区域ex234。为了记录用户数据而使用的区域是数据记录区域ex233,配置在比数据记录区域ex233靠内周或外周的内周区域ex232和外周区域ex234用于用户数据的记录以外的特定用途。信息再现/记录部ex400对这样的记录介质ex215的数据记录区域ex233进行编码的声音数据、影像数据或复用了这些数据的编码数据的读写。
以上,举1层的DVD、BD等的光盘为例进行了说明,但并不限定于这些,也可以是多层构造、在表面以外也能够记录的光盘。此外,也可以是在盘的相同的地方使用不同波长的颜色的光记录信息、或从各种角度记录不同的信息的层等、进行多维的记录/再现的构造的光盘。
此外,在数字广播用系统ex200中,也可以由具有天线ex205的车ex210从卫星ex202等接收数据、在车ex210具有的车载导航仪ex211等的显示装置上再现动态图像。另外,车载导航仪ex211的结构可以考虑例如在图20所示的结构中添加GPS接收部的结构,在计算机ex111及便携电话ex114等中也可以考虑同样的结构。
图23A是表示使用在上述实施方式中说明的动态图像解码方法和动态图像编码方法的便携电话ex114的图。便携电话ex114具有由用来在与基站ex110之间收发电波的天线ex350、能够拍摄影像、静止图像的照相机部ex365、显示将由照相机部ex365摄影的影像、由天线ex350接收到的影像等解码后的数据的液晶显示器等的显示部ex358。便携电话ex114还具有包含操作键部ex366的主体部、用来进行声音输出的扬声器等的声音输出部ex357、用来进行声音输入的麦克风等的声音输入部ex356、保存拍摄到的影像、静止图像、录音的声音、或者接收到的影像、静止图像、邮件等的编码后的数据或者解码后的数据的存储器部ex367、或者作为与同样保存数据的记录介质之间的接口部的插槽部ex364。
进而,使用图23B对便携电话ex114的结构例进行说明。便携电话ex114对于合并控制具备显示部ex358及操作键部ex366的主体部的各部的主控制部ex360,将电源电路部ex361、操作输入控制部ex362、影像信号处理部ex355、照相机接口部ex363、LCD(LiquidCrystal Display:液晶显示器)控制部ex359、调制/解调部ex352、复用/分离部ex353、声音信号处理部ex354、插槽部ex364、存储器部ex367经由总线ex370相互连接。
电源电路部ex361如果通过用户的操作使通话结束及电源键成为开启状态,则通过从电池组对各部供给电力,便携电话ex114起动为能够动作的状态。
便携电话ex114基于具有CPU、ROM及RAM等的主控制部ex360的控制,在语音通话模式时,将由声音输入部ex356集音的声音信号通过声音信号处理部ex354变换为数字声音信号,将其用调制/解调部ex352进行波谱扩散处理,由发送/接收部ex351实施数字模拟变换处理及频率变换处理后经由天线ex350发送。此外,便携电话ex114在语音通话模式时,将由天线ex350接收到的接收数据放大并实施频率变换处理及模拟数字变换处理,用调制/解调部ex352进行波谱逆扩散处理,通过声音信号处理部ex354变换为模拟声音信号后,将其经由声音输出部ex357输出。
进而,在数据通信模式时发送电子邮件的情况下,将通过主体部的操作键部ex366等的操作输入的电子邮件的文本数据经由操作输入控制部ex362向主控制部ex360送出。主控制部ex360将文本数据用调制/解调部ex352进行波谱扩散处理,由发送/接收部ex351实施数字模拟变换处理及频率变换处理后,经由天线ex350向基站ex110发送。在接收电子邮件的情况下,对接收到的数据执行上述处理的大致逆处理,并输出到显示部ex358。
在数据通信模式时,在发送影像、静止图像、或者影像和声音的情况下,影像信号处理部ex355将从照相机部ex365供给的影像信号通过上述各实施方式所示的动态图像编码方法进行压缩编码(即,作为本发明的一个方式的图像编码装置发挥作用),将编码后的影像数据送出至复用/分离部ex353。另外,声音信号处理部ex354对通过照相机部ex365拍摄影像、静止图像等的过程中用声音输入部ex356集音的声音信号进行编码,将编码后的声音数据送出至复用/分离部ex353。
复用/分离部ex353通过规定的方式,对从影像信号处理部ex355供给的编码后的影像数据和从声音信号处理部ex354供给的编码后的声音数据进行复用,将其结果得到的复用数据用调制/解调部(调制/解调电路部)ex352进行波谱扩散处理,由发送/接收部ex351实施数字模拟变换处理及频率变换处理后,经由天线ex350发送。
在数据通信模式时接收到链接到主页等的动态图像文件的数据的情况下,或者接收到附加了影像或者声音的电子邮件的情况下,为了对经由天线ex350接收到的复用数据进行解码,复用/分离部ex353通过将复用数据分离,分为影像数据的比特流和声音数据的比特流,经由同步总线ex370将编码后的影像数据向影像信号处理部ex355供给,并将编码后的声音数据向声音信号处理部ex354供给。影像信号处理部ex355通过与上述各实施方式所示的动态图像编码方法相对应的动态图像解码方法进行解码,由此对影像信号进行解码(即,作为本发明的一个方式的图像解码装置发挥作用),经由LCD控制部ex359从显示部ex358显示例如链接到主页的动态图像文件中包含的影像、静止图像。另外,声音信号处理部ex354对声音信号进行解码,从声音输出部ex357输出声音。
此外,上述便携电话ex114等的终端与电视机ex300同样,除了具有编码器、解码器两者的收发型终端以外,还可以考虑只有编码器的发送终端、只有解码器的接收终端的3种安装形式。另外,在数字广播用系统ex200中,设为发送、接收在影像数据中复用了音乐数据等得到的复用数据而进行了说明,但除声音数据之外复用了与影像关联的字符数据等的数据也可以,不是复用数据而是影像数据本身也可以。
这样,将在上述各实施方式中表示的动态图像编码方法或动态图像解码方法用在上述哪种设备、系统中都可以,通过这样,能够得到在上述各实施方式中说明的效果。
此外,本发明并不限定于这样的上述实施方式,能够不脱离本发明的范围而进行各种变形或修正。
(实施方式5)
也可以通过将在上述各实施方式中示出的动态图像编码方法或装置、与依据MPEG-2、MPEG4-AVC、VC-1等不同的标准的动态图像编码方法或装置根据需要而适当切换,来生成影像数据。
这里,在生成分别依据不同的标准的多个影像数据的情况下,在解码时,需要选择对应于各个标准的解码方法。但是,由于不能识别要解码的影像数据依据哪个标准,所以产生不能选择适当的解码方法的问题。
为了解决该问题,在影像数据中复用了声音数据等的复用数据采用包含表示影像数据依据哪个标准的识别信息的结构。以下,说明包括通过在上述各实施方式中示出的动态图像编码方法或装置生成的影像数据在内的复用数据的具体的结构。复用数据是MPEG-2传输流形式的数字流。
图24是表示复用数据的结构的图。如图24所示,复用数据通过将视频流、音频流、演示图形流(PG)、交互图形流中的1个以上进行复用而得到。视频流表示电影的主影像及副影像,音频流(IG)表示电影的主声音部分和与该主声音混合的副声音,演示图形流表示电影的字幕。这里,所谓主影像,表示显示在画面上的通常的影像,所谓副影像,是在主影像中用较小的画面显示的影像。此外,交互图形流表示通过在画面上配置GUI部件而制作的对话画面。视频流通过在上述各实施方式中示出的动态图像编码方法或装置、依据以往的MPEG-2、MPEG4-AVC、VC-1等标准的动态图像编码方法或装置编码。音频流由杜比AC-3、Dolby Digital Plus、MLP、DTS、DTS-HD、或线性PCM等的方式编码。
包含在复用数据中的各流通过PID被识别。例如,对在电影的影像中使用的视频流分配0x1011,对音频流分配0x1100到0x111F,对演示图形分配0x1200到0x121F,对交互图形流分配0x1400到0x141F,对在电影的副影像中使用的视频流分配0x1B00到0x1B1F,对与主声音混合的副声音中使用的音频流分配0x1A00到0x1A1F。
图25是示意地表示复用数据怎样被复用的图。首先,将由多个视频帧构成的视频流ex235、由多个音频帧构成的音频流ex238分别变换为PES包序列ex236及ex239,并变换为TS包ex237及ex240。同样,将演示图形流ex241及交互图形ex244的数据分别变换为PES包序列ex242及ex245,再变换为TS包ex243及ex246。复用数据ex247通过将这些TS包复用到1条流中而构成。
图26更详细地表示在PES包序列中怎样保存视频流。图26的第1段表示视频流的视频帧序列。第2段表示PES包序列。如图26的箭头yy1、yy2、yy3、yy4所示,视频流中的多个作为Video Presentation Unit的I图片、B图片、P图片按每个图片被分割并保存到PES包的有效载荷中。各PES包具有PES头,在PES头中,保存有作为图片的显示时刻的PTS(Presentation Time-Stamp)及作为图片的解码时刻的DTS(Decoding Time-Stamp)。
图27表示最终写入在复用数据中的TS包的形式。TS包是由具有识别流的PID等信息的4字节的TS头和保存数据的184字节的TS有效载荷构成的188字节固定长度的包,上述PES包被分割并保存到TS有效载荷中。在BD-ROM的情况下,对于TS包赋予4字节的TP_Extra_Header,构成192字节的源包,写入到复用数据中。在TP_Extra_Header中记载有ATS(Arrival_Time_Stamp)等信息。ATS表示该TS包向解码器的PID滤波器的转送开始时刻。在复用数据中,源包如图27下段所示排列,从复用数据的开头起递增的号码被称作SPN(源包号)。
此外,在复用数据所包含的TS包中,除了影像、声音、字幕等的各流以外,还有PAT(Program Association Table)、PMT(Program Map Table)、PCR(Program ClockReference)等。PAT表示在复用数据中使用的PMT的PID是什么,PAT自身的PID被登记为0。PMT具有复用数据所包含的影像、声音、字幕等的各流的PID、以及与各PID对应的流的属性信息,还具有关于复用数据的各种描述符。在描述符中,有指示许可/不许可复用数据的拷贝的拷贝控制信息等。PCR为了取得作为ATS的时间轴的ATC(Arrival Time Clock)与作为PTS及DTS的时间轴的STC(System Time Clock)的同步,拥有与该PCR包被转送至解码器的ATS对应的STC时间的信息。
图28是详细地说明PMT的数据构造的图。在PMT的开头,配置有记述了包含在该PMT中的数据的长度等的PMT头。在其后面,配置有多个关于复用数据的描述符。上述拷贝控制信息等被记载为描述符。在描述符之后,配置有多个关于包含在复用数据中的各流的流信息。流信息由记载有用来识别流的压缩编解码器的流类型、流的PID、流的属性信息(帧速率、纵横比等)的流描述符构成。流描述符存在复用数据中存在的流的数量。
在记录到记录介质等中的情况下,将上述复用数据与复用数据信息文件一起记录。
复用数据信息文件如图29所示,是复用数据的管理信息,与复用数据一对一地对应,由复用数据信息、流属性信息以及入口映射构成。
复用数据信息如图29所示,由系统速率、再现开始时刻、再现结束时刻构成。系统速率表示复用数据的向后述的系统目标解码器的PID滤波器的最大转送速率。包含在复用数据中的ATS的间隔设定为成为系统速率以下。再现开始时刻是复用数据的开头的视频帧的PTS,再现结束时刻设定为对复用数据的末端的视频帧的PTS加上1帧量的再现间隔的值。
流属性信息如图30所示,按每个PID登记有关于包含在复用数据中的各流的属性信息。属性信息具有按视频流、音频流、演示图形流、交互图形流而不同的信息。视频流属性信息具有该视频流由怎样的压缩编解码器压缩、构成视频流的各个图片数据的分辨率是多少、纵横比是多少、帧速率是多少等的信息。音频流属性信息具有该音频流由怎样的压缩编解码器压缩、包含在该音频流中的声道数是多少、对应于哪种语言、采样频率是多少等的信息。这些信息用于在播放器再现之前的解码器的初始化等中。
在本实施方式中,使用上述复用数据中的、包含在PMT中的流类型。此外,在记录介质中记录有复用数据的情况下,使用包含在复用数据信息中的视频流属性信息。具体而言,在上述各实施方式示出的动态图像编码方法或装置中,设置如下步骤或单元,该步骤或单元对包含在PMT中的流类型、或视频流属性信息,设定表示是通过在上述各实施方式中示出的动态图像编码方法或装置生成的影像数据的固有信息。通过该结构,能够识别通过在上述各实施方式中示出的动态图像编码方法或装置生成的影像数据、和依据其他标准的影像数据。
此外,在图31中表示本实施方式的动态图像解码方法的步骤。在步骤exS100中,从复用数据中取得包含在PMT中的流类型、或包含在复用数据信息中的视频流属性信息。接着,在步骤exS101中,判断流类型、或视频流属性信息是否表示是通过在上述各实施方式中示出的动态图像编码方法或装置生成的复用数据。并且,在判断为流类型、或视频流属性信息是通过在上述各实施方式中示出的动态图像编码方法或装置生成的复用数据情况下,在步骤exS102中,通过在上述各实施方式中示出的动态图像解码方法进行解码。此外,在流类型、或视频流属性信息表示是依据以往的MPEG-2、MPEG4-AVC、VC-1等的标准的复用数据的情况下,在步骤exS103中,通过依据以往的标准的动态图像解码方法进行解码。
这样,通过在流类型、或视频流属性信息中设定新的固有值,在解码时能够判断是否能够通过在上述各实施方式中示出的动态图像解码方法或装置解码。因而,在被输入了依据不同的标准的复用数据的情况下,也能够选择适当的解码方法或装置,所以能够不发生错误地进行解码。此外,将在本实施方式中示出的动态图像编码方法或装置、或者动态图像解码方法或装置用在上述任何设备、系统中。
(实施方式6)
在上述各实施方式中示出的动态图像编码方法及装置、动态图像解码方法及装置典型地可以由作为集成电路的LSI实现。作为一例,在图32中表示1芯片化的LSIex500的结构。LSIex500具备以下说明的单元ex501、ex502、ex503、ex504、ex505、ex506、ex507、ex508、ex509,各单元经由总线ex510连接。电源电路部ex505通过在电源是开启状态的情况下对各部供给电力,起动为能够动作的状态。
例如在进行编码处理的情况下,LSIex500基于具有CPUex502、存储器控制器ex503、流控制器ex504、驱动频率控制部ex512等的控制部ex501的控制,通过AV I/Oex509从麦克风ex117及照相机ex113等输入AV信号。被输入的AV信号暂时储存在SDRAM等的外部的存储器ex511中。基于控制部ex501的控制,将储存的数据根据处理量及处理速度适当地分为多次等,向信号处理部ex507发送,在信号处理部ex507中进行声音信号的编码及/或影像信号的编码。这里,影像信号的编码处理是在上述各实施方式中说明的编码处理。在信号处理部ex507中,还根据情况而进行将编码的声音数据和编码的影像数据复用等的处理,从流I/Oex506向外部输出。将该输出的比特流向基站ex107发送、或写入到记录介质ex215中。另外,在复用时,可以暂时将数据储存到缓冲器ex508中以使其同步。
另外,在上述中,设存储器ex511为LSIex500的外部的结构进行了说明,但也可以是包含在LSIex500的内部中的结构。缓冲器ex508也并不限定于一个,也可以具备多个缓冲器。此外,LSIex500既可以形成1个芯片,也可以形成多个芯片。
此外,在上述中,假设控制部ex501具有CPUex502、存储器控制器ex503、流控制器ex504、驱动频率控制部ex512等,但控制部ex501的结构并不限定于该结构。例如,也可以是信号处理部ex507还具备CPU的结构。通过在信号处理部ex507的内部中也设置CPU,能够进一步提高处理速度。此外,作为其他例,也可以是CPUex502具备信号处理部ex507、或作为信号处理部ex507的一部分的例如声音信号处理部的结构。在这样的情况下,控制部ex501为具备具有信号处理部ex507或其一部分的CPUex502的结构。
另外,这里设为LSI,但根据集成度的差异,也有称作IC、系统LSI、超级(super)LSI、特级(ultra)LSI的情况。
此外,集成电路化的方法并不限定于LSI,也可以由专用电路或通用处理器实现。也可以利用在LSI制造后能够编程的FPGA(Field Programmable Gate Array)、或能够重构LSI内部的电路单元的连接及设定的可重构处理器。
进而,如果因半导体技术的进步或派生的其他技术而出现代替LSI的集成电路化的技术,则当然也可以使用该技术进行功能模块的集成化。有可能是生物技术的应用等。
(实施方式7)
在将通过在上述各实施方式中示出的动态图像编码方法或装置生成的影像数据解码的情况下,考虑到与将依据以往的MPEG-2、MPEG4-AVC、VC-1等标准的影像数据的情况相比处理量会增加。因此,在LSIex500中,需要设定为比将依据以往的标准的影像数据解码时的CPUex502的驱动频率更高的驱动频率。但是,如果将驱动频率设得高,则发生消耗电力变高的问题。
为了解决该问题,电视机ex300、LSIex500等的动态图像解码装置采用识别影像数据依据哪个标准、并根据标准切换驱动频率的结构。图33表示本实施方式的结构ex800。驱动频率切换部ex803在影像数据是通过在上述各实施方式中示出的动态图像编码方法或装置生成的情况下,将驱动频率设定得高。并且,对执行在上述各实施方式中示出的动态图像解码方法的解码处理部ex801指示将影像数据解码。另一方面,在影像数据是依据以往的标准的影像数据的情况下,与影像数据是通过在上述各实施方式中示出的动态图像编码方法或装置生成的数据的情况相比,将驱动频率设定得低。并且,对依据以往的标准的解码处理部ex802指示将影像数据解码。
更具体地讲,驱动频率切换部ex803由图32的CPUex502和驱动频率控制部ex512构成。此外,执行在上述各实施方式中示出的动态图像解码方法的解码处理部ex801、以及依据以往的标准的解码处理部ex802对应于图32的信号处理部ex507。CPUex502识别影像数据依据哪个标准。并且,基于来自CPUex502的信号,驱动频率控制部ex512设定驱动频率。此外,基于来自CPUex502的信号,信号处理部ex507进行影像数据的解码。这里,可以考虑在影像数据的识别中使用例如在实施方式5中记载的识别信息。关于识别信息,并不限定于在实施方式5中记载的信息,只要是能够识别影像数据依据哪个标准的信息就可以。例如,在基于识别影像数据利用于电视机还是利用于盘等的外部信号,来能够识别影像数据依据哪个标准的情况下,也可以基于这样的外部信号进行识别。此外,CPUex502的驱动频率的选择例如可以考虑如图35所示的将影像数据的标准与驱动频率建立对应的查找表进行。将查找表预先保存到缓冲器ex508、或LSI的内部存储器中,CPUex502通过参照该查找表,能够选择驱动频率。
图34表示实施本实施方式的方法的步骤。首先,在步骤exS200中,在信号处理部ex507中,从复用数据中取得识别信息。接着,在步骤exS201中,在CPUex502中,基于识别信息识别影像数据是否是通过在上述各实施方式中示出的编码方法或装置生成的数据。在影像数据是通过在上述各实施方式中示出的编码方法或装置生成的数据的情况下,在步骤exS202中,CPUex502向驱动频率控制部ex512发送将驱动频率设定得高的信号。并且,在驱动频率控制部ex512中设定为高的驱动频率。另一方面,在表示是依据以往的MPEG-2、MPEG4-AVC、VC-1等的标准的影像数据的情况下,在步骤exS203中,CPUex502向驱动频率控制部ex512发送将驱动频率设定得低的信号。并且,在驱动频率控制部ex512中,设定为与影像数据是通过在上述各实施方式中示出的编码方法或装置生成的数据的情况相比更低的驱动频率。
进而,通过与驱动频率的切换连动而变更对LSIex500或包括LSIex500的装置施加的电压,由此能够进一步提高节电效果。例如,在将驱动频率设定得低的情况下,随之,可以考虑与将驱动频率设定得高的情况相比,将对LSIex500或包括LSIex500的装置施加的电压设定得低。
此外,驱动频率的设定方法只要是在解码时的处理量大的情况下将驱动频率设定得高、在解码时的处理量小的情况下将驱动频率设定得低就可以,并不限定于上述的设定方法。例如,可以考虑在将依据MPEG4-AVC标准的影像数据解码的处理量大于将通过在上述各实施方式中示出的动态图像编码方法或装置生成的影像数据解码的处理量的情况下,与上述的情况相反地进行驱动频率的设定。
进而,驱动频率的设定方法并不限定于使驱动频率低的结构。例如,也可以考虑在识别信息是通过在上述各实施方式中示出的动态图像编码方法或装置生成的影像数据的情况下,将对LSIex500或包括LSIex500的装置施加的电压设定得高,在表示是依据以往的MPEG-2、MPEG4-AVC、VC-1等的标准的影像数据的情况下,将对LSIex500或包括LSIex500的装置施加的电压设定得低。此外,作为另一例,也可以考虑在识别信息表示是通过在上述各实施方式中示出的动态图像编码方法或装置生成的影像数据的情况下,不使CPUex502的驱动停止,在表示是依据以往的MPEG-2、MPEG4-AVC、VC-1等的标准的影像数据的情况下,由于在处理中有富余,所以使CPUex502的驱动暂停。也可以考虑在识别信息表示是通过在上述各实施方式中示出的动态图像编码方法或装置生成的影像数据的情况下,也只要在处理中有富余则使CPUex502的驱动暂停。在此情况下,可以考虑与表示是依据以往的MPEG-2、MPEG4-AVC、VC-1等的标准的影像数据的情况相比,将停止时间设定得短。
这样,根据影像数据所依据的标准来切换驱动频率,由此能够实现节电化。此外,在使用电池来驱动LSIex500或包括LSIex500的装置的情况下,能够随着节电而延长电池的寿命。
(实施方式8)
在电视机、便携电话等上述的设备、系统中,有时被输入依据不同的标准的多个影像数据。这样,为了使得在被输入了依据不同的标准的多个影像数据的情况下也能够解码,LSIex500的信号处理部ex507需要对应于多个标准。但是,如果单独使用对应于各个标准的信号处理部ex507,则发生LSIex500的电路规模变大、此外成本增加的问题。
为了解决该问题,采用将用来执行在上述各实施方式中示出的动态图像解码方法的解码处理部、和依据以往的MPEG-2、MPEG4-AVC、VC-1等的标准的解码处理部一部分共用的结构。图36A的ex900表示该结构例。例如,在上述各实施方式中示出的动态图像解码方法和依据MPEG4-AVC标准的动态图像解码方法在熵编码、逆量化、解块滤波器、运动补偿等的处理中有一部分处理内容共通。可以考虑如下结构:关于共通的处理内容,共用对应于MPEG4-AVC标准的解码处理部ex902,关于不对应于MPEG4-AVC标准的本发明的一个方式所特有的其他的处理内容,使用专用的解码处理部ex901。特别是,本发明的一个方式在熵解码方面具有特征,因此可以考虑例如对于熵解码使用专用的解码处理部ex901,对于除此之外的逆量化、解块滤波、运动补偿中的某一个或者全部的处理,共用解码处理部。关于解码处理部的共用,也可以是如下结构:关于共通的处理内容,共用用来执行在上述各实施方式中示出的动态图像解码方法的解码处理部,关于MPEG4-AVC标准所特有的处理内容,使用专用的解码处理部。
此外,用图36B的ex1000表示将处理一部分共用的另一例。在该例中,采用使用与本发明的一个方式所特有的处理内容对应的专用的解码处理部ex1001、和与其他的以往标准所特有的处理内容对应的专用的解码处理部ex1002、和与在本发明的一个方式的动态图像解码方法和其他的以往标准的动态图像解码方法中共通的处理内容对应的共用的解码处理部ex1003的结构。这里,专用的解码处理部ex1001、ex1002并不一定是为本发明的一个方式、或者其他的以往标准所特有的处理内容而特殊化的,可以是能够执行其他的通用处理的结构。此外,也能够由LSIex500安装本实施方式的结构。
这样,对于在本发明的一个方式的动态图像解码方法和以往的标准的动态图像解码方法中共通的处理内容,共用解码处理部,由此能够减小LSI的电路规模并且降低成本。
工业实用性
有关本发明的一相同的图像编码方法及图像解码方法例如可以在电视接收机、数字视频记录机、汽车导航仪、便携电话、数字照相机或数字摄像机等中使用。
标号说明
100 差分矢量解码部
101、A01 差分矢量复原控制部
102、A02 差分矢量0判断部
103、A03 差分矢量前缀部解码部
104、A04 差分矢量后缀部解码部
105、A05 差分矢量正负符号解码部
106、A06 差分矢量复原部
110 前缀部解码部
120 后缀部解码部
200、800 图像编码装置
205 减法器
210 变换量化部
220 熵编码部
230、420 逆量化逆变换部
235、425 加法器
240、430 解块滤波器
250、440 存储器
260、450 帧内预测部
270 运动检测部
280、460 运动补偿部
290、470 帧内/帧间切换开关
400、900 图像解码装置
410 熵解码部
801 编码部
901 解码部
A00 差分矢量可变长度解码部
A07 开关

Claims (5)

1.一种解码方法,将差分矢量解码,该差分矢量表示用于图像的预测的运动矢量与作为上述运动矢量的预测的预测运动矢量之差,
上述解码方法包括:
取得步骤,取得编码数据,该编码数据包含第一标志和第二标志,并且包含分别表示上述差分矢量的水平成分和垂直成分的第1二值数据和第2二值数据;以及
解码步骤,将上述编码数据解码;
其中,
上述第一标志表示上述差分矢量的水平成分是否为0,上述第二标志表示上述差分矢量的垂直成分是否不为0;
上述解码步骤包括通过进行利用变动概率的上下文自适应算数解码来解码上述第一标志和上述第二标志;
上述第1二值数据,(1)仅包含作为上述第1二值数据的前缀数据的第1部分,或者(2)包含上述第1部分和作为上述第1二值数据的后缀数据的第3部分,其中上述第1二值数据的前缀数据不同于上述第1二值数据的后缀数据;
上述第2二值数据,(1)仅包含作为上述第2二值数据的前缀数据的第2部分,或者(2)包含上述第2部分和作为上述第2二值数据的后缀数据的第4部分,其中上述第2二值数据的前缀数据不同于上述第2二值数据的后缀数据;
在上述解码步骤中,在上述水平成分和上述垂直成分都不是0的情况下,
在上述编码数据仅包含上述第1部分、上述第2部分时,以上述第1部分、上述第2部分的顺序解码;
在上述编码数据包含上述第3部分、上述第4部分时,以上述第1部分、上述第2部分、上述第3部分、上述第4部分的顺序解码。
2.如权利要求1所述的解码方法,
还包括导出步骤,在该导出步骤中,从解码后的上述第1部分和解码后的上述第3部分,导出上述差分矢量的水平成分,从解码后的上述第2部分和解码后的上述第4部分,导出上述差分矢量的垂直成分。
3.如权利要求1或2所述的解码方法,
在上述解码步骤中,
对上述第1部分及上述第2部分进行利用变动概率的上下文自适应算术解码;
对上述第3部分及上述第4部分进行利用固定概率的旁路解码。
4.一种解码装置,将差分矢量解码,该差分矢量表示用于图像的预测的运动矢量与作为上述运动矢量的预测的预测运动矢量之差,
上述解码装置具备:
取得部,取得编码数据,该编码数据包含表示上述差分矢量的水平成分是否为0和垂直成分是否为0的组合的标志,并且包含分别表示上述差分矢量的水平成分和垂直成分的第1二值数据和第2二值数据;以及
解码部,将上述编码数据解码;
在上述水平成分和上述垂直成分都是0的情况下,上述标志被分配0;
在上述水平成分不是0而上述垂直成分为0的情况下,上述标志被分配10;
在上述水平成分为0而上述垂直成分不是0的情况下,上述标志被分配110;
在上述水平成分和上述垂直成分都不是0的情况下,上述标志被分配111;
上述第1二值数据,(1)仅包含作为上述第1二值数据的前缀数据的第1部分,或者(2)包含上述第1部分和作为上述第1二值数据的后缀数据的第3部分,其中上述第1二值数据的前缀数据不同于上述第1二值数据的后缀数据;
上述第2二值数据,(1)仅包含作为上述第2二值数据的前缀数据的第2部分,或者(2)包含上述第2部分和作为上述第2二值数据的后缀数据的第4部分,其中上述第2二值数据的前缀数据不同于上述第2二值数据的后缀数据;
上述解码部在上述水平成分和上述垂直成分都不是0的情况下,
在上述编码数据仅包含上述第1部分、上述第2部分时,以上述第1部分、上述第2部分的顺序解码;
在上述编码数据包含上述第3部分、上述第4部分时,以上述第1部分、上述第2部分、上述第3部分、上述第4部分的顺序解码。
5.一种解码装置,将差分矢量解码,该差分矢量表示用于图像的预测的运动矢量与作为上述运动矢量的预测的预测运动矢量之差,上述解码装置具备处理电路和与上述处理电路连接的存储部:
上述处理电路利用上述存储部进行以下处理:
取得编码数据,该编码数据包含表示上述差分矢量的水平成分是否为0和垂直成分是否为0的组合的标志,并且包含分别表示上述差分矢量的水平成分和垂直成分的第1二值数据和第2二值数据;以及
将上述编码数据解码;
在上述水平成分和上述垂直成分都是0的情况下,上述标志被分配0;
在上述水平成分不是0而上述垂直成分为0的情况下,上述标志被分配10;
在上述水平成分为0而上述垂直成分不是0的情况下,上述标志被分配110;
在上述水平成分和上述垂直成分都不是0的情况下,上述标志被分配111;
上述第1二值数据,(1)仅包含作为上述第1二值数据的前缀数据的第1部分,或者(2)包含上述第1部分和作为上述第1二值数据的后缀数据的第3部分,其中上述第1二值数据的前缀数据不同于上述第1二值数据的后缀数据;
上述第2二值数据,(1)仅包含作为上述第2二值数据的前缀数据的第2部分,或者(2)包含上述第2部分和作为上述第2二值数据的后缀数据的第4部分,其中上述第2二值数据的前缀数据不同于上述第2二值数据的后缀数据;
上述处理电路在上述水平成分和上述垂直成分都不是0的情况下,
在上述编码数据仅包含上述第1部分、上述第2部分时,以上述第1部分、上述第2部分的顺序解码;
在上述编码数据包含上述第3部分、上述第4部分时,以上述第1部分、上述第2部分、上述第3部分、上述第4部分的顺序解码。
CN201710800325.1A 2011-06-24 2012-06-21 解码方法及解码装置 Active CN107371025B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161500805P 2011-06-24 2011-06-24
US61/500,805 2011-06-24
CN201280001995.2A CN103004207B (zh) 2011-06-24 2012-06-21 图像解码方法及图像解码装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201280001995.2A Division CN103004207B (zh) 2011-06-24 2012-06-21 图像解码方法及图像解码装置

Publications (2)

Publication Number Publication Date
CN107371025A CN107371025A (zh) 2017-11-21
CN107371025B true CN107371025B (zh) 2020-04-14

Family

ID=47361842

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201280001995.2A Active CN103004207B (zh) 2011-06-24 2012-06-21 图像解码方法及图像解码装置
CN201710800325.1A Active CN107371025B (zh) 2011-06-24 2012-06-21 解码方法及解码装置
CN201710800531.2A Active CN107396107B (zh) 2011-06-24 2012-06-21 图像编码方法、图像编码装置以及编码方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201280001995.2A Active CN103004207B (zh) 2011-06-24 2012-06-21 图像解码方法及图像解码装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201710800531.2A Active CN107396107B (zh) 2011-06-24 2012-06-21 图像编码方法、图像编码装置以及编码方法

Country Status (13)

Country Link
US (7) US8855207B2 (zh)
EP (5) EP4220966A1 (zh)
JP (9) JP5362129B2 (zh)
KR (2) KR20140032930A (zh)
CN (3) CN103004207B (zh)
AU (1) AU2012274765B2 (zh)
BR (1) BR112013002450B1 (zh)
CA (1) CA2806796C (zh)
ES (2) ES2952761T3 (zh)
MX (1) MX2013001167A (zh)
PL (2) PL3309970T3 (zh)
TW (1) TWI565304B (zh)
WO (1) WO2012176450A1 (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9076239B2 (en) * 2009-04-30 2015-07-07 Stmicroelectronics S.R.L. Method and systems for thumbnail generation, and corresponding computer program product
EP4220966A1 (en) * 2011-06-24 2023-08-02 Sun Patent Trust Image decoding device,
US10536701B2 (en) 2011-07-01 2020-01-14 Qualcomm Incorporated Video coding using adaptive motion vector resolution
US9088796B2 (en) * 2011-11-07 2015-07-21 Sharp Kabushiki Kaisha Video decoder with enhanced CABAC decoding
KR20140097969A (ko) 2011-11-07 2014-08-07 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치, 및 화상 부호화 복호 장치
WO2014107029A1 (ko) * 2013-01-02 2014-07-10 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
GB2513110A (en) * 2013-04-08 2014-10-22 Sony Corp Data encoding and decoding
US9225988B2 (en) 2013-05-30 2015-12-29 Apple Inc. Adaptive color space transform coding
US9706229B2 (en) * 2013-06-05 2017-07-11 Texas Instruments Incorporated High definition VP8 decoder
EP2854405A1 (en) * 2013-09-26 2015-04-01 Thomson Licensing Method and apparatus for encoding and decoding a motion vector representation in interlaced video using progressive video coding tools
CN110636292B (zh) * 2013-10-18 2022-10-25 松下控股株式会社 图像编码方法以及图像解码方法
US20150189321A1 (en) * 2014-01-02 2015-07-02 Mediatek Inc. Method of Binarization and Context Adaptive Binary Arithmetic Coding of Depth Coding Syntax
JP6346445B2 (ja) 2014-01-10 2018-06-20 キヤノン株式会社 処理装置、処理装置の制御方法、およびプログラム
CN106031170B (zh) * 2014-04-01 2019-04-26 联发科技股份有限公司 运动信息编码的方法
JP6352452B2 (ja) * 2014-06-20 2018-07-04 寰發股▲ふん▼有限公司HFI Innovation Inc. ビデオ符号化における構文の2値化とコンテキスト適応型符号化の方法と装置
EP3396188A1 (en) * 2014-07-23 2018-10-31 Nachi-Fujikoshi Corp. Rolling bearing
EP3270594A1 (en) * 2016-07-15 2018-01-17 Thomson Licensing Method and apparatus for advanced cabac context adaptation for last coefficient coding
CN116016921A (zh) 2017-07-07 2023-04-25 三星电子株式会社 用于对运动矢量进行编码和解码的设备和方法
EP3691274A4 (en) 2017-09-28 2021-04-28 Samsung Electronics Co., Ltd. CODING METHOD AND DEVICE FOR IT AND DECODING METHOD AND DEVICE FOR IT
WO2019150411A1 (ja) * 2018-01-30 2019-08-08 富士通株式会社 映像符号化装置、映像符号化方法、映像復号装置、映像復号方法、及び映像符号化システム
KR102220474B1 (ko) 2018-02-28 2021-02-25 삼성전자주식회사 부호화 방법 및 그 장치, 복호화 방법 및 그 장치
CN108810553B (zh) * 2018-05-02 2021-01-12 上海大学 一种基于稀疏化处理的移动节点监测数据序列压缩方法
WO2019225933A1 (ko) * 2018-05-21 2019-11-28 엘지전자 주식회사 영상 코딩 시스템에서 lut를 기반으로 도출된 mvd 를 사용하는 영상 디코딩 방법 및 그 장치
WO2020004682A1 (ko) * 2018-06-26 2020-01-02 삼성전자 주식회사 움직임 정보의 부호화 장치 및 부호화 방법, 및 움직임 정보의 복호화 장치 및 복호화 방법
WO2020143643A1 (en) * 2019-01-07 2020-07-16 Beijing Bytedance Network Technology Co., Ltd. Control method for merge with mvd

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1529510A (zh) * 2003-09-27 2004-09-15 浙江大学 一种视频编解码中的运动矢量预测方法和装置
CN1630374A (zh) * 2003-09-07 2005-06-22 微软公司 用于前向预测的隔行扫描视频帧的场的预测运动矢量
EP1549076A2 (en) * 2003-12-17 2005-06-29 Sony Corporation Coding apparatus, program and data processing method
CN1984336A (zh) * 2005-12-05 2007-06-20 华为技术有限公司 一种二进制化方法及装置
EP1820281A2 (en) * 2004-12-10 2007-08-22 Tut Systems, Inc. Parallel rate control for digital video encoder with multi-processor architecture and picture-based look-ahead window
CN102187672A (zh) * 2008-08-19 2011-09-14 汤姆森特许公司 压缩视频中的语法元素的兼容cabac/avc的水印加注
CN102187583A (zh) * 2008-08-19 2011-09-14 汤姆森特许公司 基于上下文的自适应二进制算术编码(cabac)的视频流兼容性

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5381145A (en) * 1993-02-10 1995-01-10 Ricoh Corporation Method and apparatus for parallel decoding and encoding of data
GB2319689B (en) * 1994-02-23 1998-07-15 Ricoh Kk Compression of palletized images
EP3525467B1 (en) * 2002-04-19 2021-02-24 Panasonic Intellectual Property Corporation of America Bitstream decoding method and apparatus
KR100645735B1 (ko) * 2004-10-14 2006-11-15 주식회사 팬택 모바일 플랫폼의 컨텐츠 오동작 통신 검출 장치 및 방법
EP1962514A4 (en) * 2005-12-05 2012-02-15 Huawei Tech Co Ltd BINARIZATION METHOD AND ASSOCIATED DEVICE
JP5025286B2 (ja) * 2007-02-28 2012-09-12 シャープ株式会社 符号化装置及び復号装置
US9299120B2 (en) * 2007-03-23 2016-03-29 Thomson Licensing Llc Modifying a coded bitstream
US8782379B2 (en) * 2007-09-27 2014-07-15 Qualcomm Incorporated H.264 video decoder CABAC core optimization techniques
US8891615B2 (en) * 2008-01-08 2014-11-18 Qualcomm Incorporated Quantization based on rate-distortion modeling for CABAC coders
JP2010050697A (ja) * 2008-08-21 2010-03-04 Toshiba Corp 画像圧縮伸張装置および画像圧縮伸張方法
EP2164176A1 (en) * 2008-09-12 2010-03-17 Thomson Licensing Method for lossless compressing prefix-suffix-codes, method for decompressing a bit sequence representing integers or symbols encoded in compressed prefix-suffix-codes and storage medium or signal carrying compressed prefix-suffix-codes
TWI455587B (zh) * 2009-04-10 2014-10-01 Asustek Comp Inc 具有多格式影像編解碼功能的資料處理電路及處理方法
JP5258664B2 (ja) * 2009-04-14 2013-08-07 株式会社エヌ・ティ・ティ・ドコモ 画像符号化装置、方法およびプログラム、並びに、画像復号装置、方法およびプログラム
JP2010278668A (ja) * 2009-05-27 2010-12-09 Sony Corp 符号化装置及び符号化方法、並びに復号装置及び復号方法
JPWO2011034148A1 (ja) * 2009-09-18 2013-02-14 シャープ株式会社 符号化装置、復号装置、動画像符号化装置、動画像復号装置、および符号化データ
US9060176B2 (en) * 2009-10-01 2015-06-16 Ntt Docomo, Inc. Motion vector prediction in video coding
US9591320B2 (en) 2010-07-15 2017-03-07 Texas Instruments Incorporated Context and bypass encoding video
US9532066B2 (en) * 2011-01-21 2016-12-27 Qualcomm Incorporated Motion vector prediction
US9106913B2 (en) * 2011-03-08 2015-08-11 Qualcomm Incorporated Coding of transform coefficients for video coding
RS64604B1 (sr) 2011-06-16 2023-10-31 Ge Video Compression Llc Entropijsko kodiranje razlika vektora kretanja
EP4220966A1 (en) * 2011-06-24 2023-08-02 Sun Patent Trust Image decoding device,
US10536701B2 (en) * 2011-07-01 2020-01-14 Qualcomm Incorporated Video coding using adaptive motion vector resolution

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1630374A (zh) * 2003-09-07 2005-06-22 微软公司 用于前向预测的隔行扫描视频帧的场的预测运动矢量
CN1529510A (zh) * 2003-09-27 2004-09-15 浙江大学 一种视频编解码中的运动矢量预测方法和装置
EP1549076A2 (en) * 2003-12-17 2005-06-29 Sony Corporation Coding apparatus, program and data processing method
EP1820281A2 (en) * 2004-12-10 2007-08-22 Tut Systems, Inc. Parallel rate control for digital video encoder with multi-processor architecture and picture-based look-ahead window
CN1984336A (zh) * 2005-12-05 2007-06-20 华为技术有限公司 一种二进制化方法及装置
CN102187672A (zh) * 2008-08-19 2011-09-14 汤姆森特许公司 压缩视频中的语法元素的兼容cabac/avc的水印加注
CN102187583A (zh) * 2008-08-19 2011-09-14 汤姆森特许公司 基于上下文的自适应二进制算术编码(cabac)的视频流兼容性

Also Published As

Publication number Publication date
US20220329848A1 (en) 2022-10-13
AU2012274765A2 (en) 2013-03-28
JP6229909B2 (ja) 2017-11-15
US9648324B2 (en) 2017-05-09
KR20140032930A (ko) 2014-03-17
JP6612416B2 (ja) 2019-11-27
ES2944949T3 (es) 2023-06-27
JP2019047517A (ja) 2019-03-22
MX2013001167A (es) 2013-02-15
ES2952761T3 (es) 2023-11-03
US20140029673A1 (en) 2014-01-30
JP2016226026A (ja) 2016-12-28
EP3309969A1 (en) 2018-04-18
EP3309969B1 (en) 2023-04-19
BR112013002450A2 (pt) 2018-01-23
PL3309969T3 (pl) 2023-09-18
AU2012274765B2 (en) 2016-06-30
PL3309970T3 (pl) 2023-09-25
CN107371025A (zh) 2017-11-21
EP2725796A4 (en) 2014-11-12
JP5362129B2 (ja) 2013-12-11
US20170230681A1 (en) 2017-08-10
CN107396107A (zh) 2017-11-24
JP5390727B1 (ja) 2014-01-15
EP3309970B1 (en) 2023-06-07
JP5999563B2 (ja) 2016-09-28
US11743490B2 (en) 2023-08-29
US8855207B2 (en) 2014-10-07
JP6443847B2 (ja) 2018-12-26
JP2020018013A (ja) 2020-01-30
KR102258753B1 (ko) 2021-05-31
JP6821766B2 (ja) 2021-01-27
TW201306599A (zh) 2013-02-01
US20140029674A1 (en) 2014-01-30
CA2806796C (en) 2020-08-25
KR20200067219A (ko) 2020-06-11
BR112013002450B1 (pt) 2022-10-25
US10382779B2 (en) 2019-08-13
JPWO2012176450A1 (ja) 2015-02-23
US20230353775A1 (en) 2023-11-02
EP4220966A1 (en) 2023-08-02
EP3309970A1 (en) 2018-04-18
JP2014003698A (ja) 2014-01-09
CA2806796A1 (en) 2012-12-27
JP5415648B2 (ja) 2014-02-12
EP2725796A1 (en) 2014-04-30
JP2021069124A (ja) 2021-04-30
JP7033675B2 (ja) 2022-03-10
CN107396107B (zh) 2021-02-02
WO2012176450A1 (ja) 2012-12-27
US9681130B2 (en) 2017-06-13
CN103004207A (zh) 2013-03-27
JP2014014130A (ja) 2014-01-23
CN103004207B (zh) 2017-09-29
US11330292B2 (en) 2022-05-10
US20120328022A1 (en) 2012-12-27
EP3522377A1 (en) 2019-08-07
TWI565304B (zh) 2017-01-01
US20190349600A1 (en) 2019-11-14
JP2014014146A (ja) 2014-01-23
AU2012274765A1 (en) 2013-02-07
JP2017229103A (ja) 2017-12-28

Similar Documents

Publication Publication Date Title
JP7033675B2 (ja) 復号方法、復号装置、符号化方法及び符号化装置
JP6238215B2 (ja) 復号方法および復号装置
CN107257463B (zh) 图像编码方法和图像编码装置
CN107846598B (zh) 运动图像编码方法及装置、运动图像编码解码装置
CN107087187B (zh) 图像编码方法及图像编码装置
CN107105246B (zh) 图像编码方法以及图像编码装置
CN108683917B (zh) 图像编码方法及图像编码装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20181023

Address after: Dublin, Ireland

Applicant after: Velos Media, LLC

Address before: American New York

Applicant before: Sun patent hosting Co.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230428

Address after: New York, United States

Patentee after: Sun patent hosting Co.

Address before: Irish Dublin

Patentee before: Velos Media, LLC

TR01 Transfer of patent right