CN101742331A - 图像解码方法 - Google Patents

图像解码方法 Download PDF

Info

Publication number
CN101742331A
CN101742331A CN200910224932A CN200910224932A CN101742331A CN 101742331 A CN101742331 A CN 101742331A CN 200910224932 A CN200910224932 A CN 200910224932A CN 200910224932 A CN200910224932 A CN 200910224932A CN 101742331 A CN101742331 A CN 101742331A
Authority
CN
China
Prior art keywords
image
zone
picture
decoder object
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910224932A
Other languages
English (en)
Other versions
CN101742331B (zh
Inventor
斋藤升平
高桥昌史
山口宗明
伊藤浩朗
浜田宏一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maxell Ltd
Original Assignee
Hitachi Consumer Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Consumer Electronics Co Ltd filed Critical Hitachi Consumer Electronics Co Ltd
Publication of CN101742331A publication Critical patent/CN101742331A/zh
Application granted granted Critical
Publication of CN101742331B publication Critical patent/CN101742331B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种图像解码方法,提高数据压缩率。在动态图像的解码方法中,包括:运动估计步骤,对于解码对象帧的解码对象区域,使用已解码的多个帧的图像进行运动估计;和判定步骤,根据所述运动估计的结果,判定是通过插补处理来生成所述解码对象区域的图像、还是通过使用了编码流中包含的数据的运动补偿来生成解码图像。

Description

图像解码方法
技术领域
本发明涉及图像数据的编码技术、解码技术。
背景技术
以往,作为将图像数据压缩并传输的编码技术、解码技术,有以MPEG(Moving Picture Experts Group:运动图像专家组)为代表的国际标准编码标准。例如,在国际标准编码标准中,H.264/AVC(Advanced Video Coding:高级视频编码)标准的编码效率非常高,被广泛用作地面数字广播、数字视频摄像机、下一代记录介质、手机等的动态图像压缩标准。按照这种标准压缩后的数据通过电视接收机或DVD播放器等被解码,并在显示器上显示解码后的影像数据。
在此,专利文献1公开了以下内容,在显示解码后的影像数据时,为了消除动态图像模糊或运动的不自然状态,使用将编码流解码得到的运动量(运动矢量)和解码图像进行帧速率变换。
【专利文献1】日本特开2003-333540
在专利文献1公开的技术中,对解码后的影像数据进行帧速率变换处理。但是,该处理是以从编码侧向解码侧传输运动矢量或差分图像为前提的帧速率变换处理,该帧速率变换处理无助于传输数据量的削减,存在不能充分提高数据压缩率的问题。
发明内容
本发明就是为了解决上述问题而提出的,其目的在于提高数据压缩率。
为了解决上述问题,本发明的一个实施方式例如可以按照权利要求书所记述的那样构成。
根据本发明能够提高数据压缩率。
附图说明
图1是实施例1的图像编码装置的结构图。
图2是图1中的编码部的结构图。
图3是图1中的插补图像生成部的结构图。
图4是在实施例1中根据图片类型确定插补帧和编码帧的示例。
图5是实施例1中的运动估计部的运动估计方法的一例。
图6是图3中的运动估计部的结构图。
图7是图1中的插补图像生成部的动作流程图。
图8是在实施例1的编码数据存储部中存储的数据的一例。
图9是本发明的运动预测矢量的计算示例。
图10是实施例1的图像解码装置的结构图。
图11是图10中的插补图像生成部的结构图。
图12是实施例1中的图像解码装置的动作流程图。
图13是实施例2的模式选择部的结构图。
图14是在实施例的编码数据存储部中存储的数据的一例。
图15是实施例2的图像解码装置的动作流程图。
图16是在实施例3中根据图片类型确定插补帧和编码帧的示例。
图17是实施例3中的运动估计部的运动估计方法的一例。
图18是实施例3的插补方向确定部的结构图。
图19是在实施例3的编码数据存储部中存储的数据的一例。
图20是实施例3的图像解码装置的运动估计部的结构图。
图21是实施例3的图像解码装置的动作流程图。
图22是在实施例4的编码数据存储部中存储的数据的一例。
图23是实施例4的图像解码装置的动作流程图。
图24是实施例5中的编码数据存储部中存储的数据的一例。
图25是实施例6中的编码数据存储部中存储的数据的一例。
图26是插补图像的生成方法的第1变形例的一例。
图27是插补图像的生成方法的第2变形例的一例。
图28是插补图像的生成方法的第3变形例的一例。
标号说明
101影像输入部;102区域分割部;103编码部;104插补图像生成部;105模式选择部;106编码数据存储部;107可变长度编码部;201减法器;202频率变换/量化部;203逆量化/逆频率变换部;204加法器;205解码图像存储部;206画面内预测部;207画面间预测部;208画面内/画面间预测图像选择部;301插补帧确定部;302运动估计部;303插补像素生成部;601预测误差计算部;602运动矢量确定部;1001可变长度解码部;1002句法分析部;1003逆量化/逆频率变换部;1004加法器;1005解码图像存储部;1006运动补偿部;1007插补图像生成部;1008输出部;1009模式判定部;1101运动估计部;1102插补像素生成部;1301、1302差分绝对值计算部;1303判定部;1801、1802、1803差分绝对值计算部;1804运动估计方向判定部;1805插补方向确定部;2001运动估计方法确定部;2002运动估计部;2003预测误差计算部;2004运动矢量确定部;2005运动估计部。
具体实施方式
以下,使用附图说明本发明的实施例。
【实施例1】
图1表示本发明的实施例1的图像编码装置的示例。实施例1的图像编码装置例如具有:输入图像的影像输入部101;区域分割部102,其将输入图像分割为编码对象区域;编码部103,其对由区域分割部分割后的输入图像数据进行编码及局部解码;插补图像生成部104,其按照时间方向对由编码部103局部解码后的图像(编码图像)进行约简(間引き,即:间隔剔除),并生成用于插补该约简后的图像的插补图像;模式选择部105,其选择编码图像或是插补图像;编码数据存储部106,其记录编码图像数据或标志数据;可变长度编码部107,其对存储在编码数据存储部106中的数据进行可变长度编码,并输出编码流。下面,具体说明实施例1的图像编码装置中的各个处理部的动作。
首先,在影像输入部101中,按照将要编码的顺序重排输入图像。顺序的重排是按照图片类型由显示顺序替换排列为编码顺序。然后,在区域分割部102中,把编码对象帧分割为编码对象区域。将要分割的区域尺寸可以是正方形、长方形区域那样的块单位,也可以是使用watershed法那样的方法提取的对象单位。由区域分割部102分割后的图像被发送给编码部103。
在此,图2表示编码部103的具体结构。编码部103例如具有:差分器201,其计算由区域分割部102分割后的图像与由画面内/画面间预测图像选择部208所选择的预测图像之间的差分;频率变换/量化部202,其对由差分器201生成的差分数据实施频率变换及量化;逆量化/逆频率变换部203,其对频率变换/量化部202输出的数据实施逆量化及逆频率变换;加法器204,其将由频率变换/量化部202解码后的数据与由画面内/画面间预测图像选择部208选择的预测图像相加;解码图像存储部205,其存储由加法器204相加后的图像;画面内预测部206,其根据编码对象区域的周边像素生成预测图像;画面间预测部207,其通过匹配(matching)处理,从属于与编码对象区域不同的帧的区域中检测接近编码对象区域的图像(参照图像),并生成为预测图像;画面内/画面间预测图像选择部208,其选择画面内预测图像或画面间预测图像中编码效率高的一方。
下面,说明编码部103的各个处理部分的具体动作。在频率变换/量化部202中,使用DCT(Discrete Cosine transform:离散余弦变换)或小波变换等对差分图像进行频率变换,对频率变换后的系数进行量化。量化后的数据被发送给模式选择部105和逆量化/逆频率变换部203。在逆量化/逆频率变换部203中,进行由频率变换/量化部202进行的处理的逆处理。然后,加法器204将由画面内/画面间预测图像选择部208选择的预测图像、与通过逆量化/逆频率变换部203的逆量化/逆频率变换而生成的差分图像相加,并生成解码图像。所生成的解码图像被存储在解码图像存储部205中。画面内预测部206使用存储在解码图像存储部205中的已解码的周边区域的像素,生成预测图像。并且,画面间预测部207通过由解码图像存储部205存储的已解码的帧内的数据与输入图像之间的匹配处理,生成预测图像。并且,解码图像存储部205向插补图像生成部104发送解码图像。
在此,图3表示插补图像生成部104的具体结构。插补图像生成部104例如具有插补帧确定部301、运动估计部302和插补像素生成部303。在插补帧确定部301中,例如按照帧单位确定根据图片类型插补的帧(插补帧)、和不插补而进行通常的编码的帧(编码帧)。
在此,图4表示由插补图像生成部104的插补帧确定部301进行的插补帧确定的具体示例。图4中的横轴表示编码时的图像的输入顺序,即解码时的图像的显示顺序。与此相对,编码时的编码处理顺序/解码时的解码处理顺序是如图4所示的顺序。即,B图片(B picture)在显示顺序位于该B图片之后的P图片(P picture)之后进行编码处理、解码处理。
在此,如后面在图5的说明中叙述的那样,在实施例1的插补像素生成部303中,根据先进行编码处理(在解码时先进行解码处理)的多个图片,通过插补处理生成作为显示顺序位于该多个图片之间的图片的、帧的像素。即,实施例1的插补像素生成部303的插补像素生成处理是在编码处理时或解码处理时,适合于前后显示顺序的图片是已编码处理或已解码处理的B图片的处理。在图4的示例中,在B图片402的编码处理时或解码处理时,显示顺序在前的I图片401和显示顺序在后的P图片403已经完成编码处理或解码处理。另外,在B图片404的编码处理时或解码处理时,显示顺序在前的P图片403和显示顺序在后的P图片405已经完成编码处理或解码处理。
因此,插补帧确定部301按照图4所示,例如把B图片设为插补帧,把I图片和P图片设为编码帧。由此,在插补像素生成部303中,根据最接近B图片的前向或向的I图片及P图片,通过后面叙述的图5所示的插补处理,能够生成该B图片的像素值。
另外,在图4的示例中,示出了在I图片-P图片之间、P图片-P图片之间插入1个B图片的图片结构,但也可以在编码时计算帧之间的亮度、色差差分,在差分小时判定为帧之间的相关性高,增加插入I或P图片之间的B图片的数量。该情况时,可以把B图片设为插补帧,把I图片或P图片设为编码帧。此时,在插补像素生成部303中,根据最接近B图片的前向或后向的I图片及P图片,通过插补处理生成各个B图片的像素值。
下面,使用图6说明运动估计部302的具体结构。运动估计部302如图6所示,具有预测误差计算部601和运动矢量确定部602。在由插补帧确定部301确定插补帧后,运动估计部302进行用于计算插补帧的像素的像素值的运动估计。关于运动估计方法,可以采用一般广为使用的区域匹配法。
下面,使用图5具体说明由运动估计部302的预测误差计算部601、运动矢量确定部602、以及插补像素生成部303进行的插补帧的像素生成处理。
在图5中,首先,预测误差计算部601对于插补帧n的插补对象像素501,使用显示顺序在插补帧n之前的编码帧n-1内的像素500的像素值fn-1(x-dx,y-dy)、和显示顺序在插补帧n之后的编码帧n+1内的像素502的像素值fn+1(x+dx,y+dy),求出式1所示的预测误差绝对值之和SADn(x,y)。其中,像素500、502被设定成为在时间空间坐标中和插补对象像素501(x,y)位于同一直线上。其中,R表示插补对象像素所属的图像区域尺寸,n表示帧序号,x、y表示像素坐标,dx、dy、i、j表示像素表的差分,a、b表示插补对象像素所属的图像区域的序号。
式1
SAD n ( a , b ) = Σ i , j ∈ R | f n - 1 ( x - dx + i , y - dy + j ) - f n + 1 ( x + dx + i , y + dy + j ) |
然后,运动矢量确定部602求出式1所示的预测误差绝对值之和SADn(x,y)为最小的值的组合(dx0,dy0),计算将显示顺序在插补帧n之前的编码帧n-1内的坐标(x-dx0,y-dy0)的像素、与显示顺序在插补帧n之后的编码帧n+1内的像素(x+dx0,y+dy0)的像素相连接得到的运动矢量。
在计算运动矢量后,插补像素生成部303使用式2,计算插补帧前后的编码帧内的像素的像素值fn-1(x-dx0,y-dy0)、fn+1(x+dx0,y+dy0)的平均值,生成插补对象像素(x,y)的像素值fn(x,y)。
式2
f n ( x , y ) = f n - 1 ( x - dx 0 , y - dy 0 ) + f n + 1 ( x + dx 0 , y + dy 0 ) 2
根据以上说明的图5所示的插补帧的像素生成处理,能够根据显示顺序位于编码对象帧前后的编码帧内的像素值生成插补帧的像素。
另外,在式2的示例中,利用单纯平均值计算插补像素值,但本发明的插补像素计算方法不限于单纯平均值。例如,在编码帧n-1和编码帧n的时间距离、与编码帧n和编码帧n+1的时间距离不是相等间隔时,也可以向各自的像素值乘以对应各个时间距离的加权系数后进行相加。即,只要是利用把编码帧n-1上的像素值fn-1(x-dx0,y-dy0)、和编码帧n+1上的像素值fn+1(x+dx0,y+dy0)设为变量的函数算出的像素值,则可以使用任何方法。
下面,使用图7具体说明模式选择部105的模式选择处理。模式选择部105对于插补帧的多个分割区域的各个区域,确定选择由编码部103生成的编码图像和由插补图像生成部104生成的插补像素所构成的插补图像中的哪个图像。
首先,模式选择部105对于编码对象区域,例如按照式3所示计算由运动估计部302计算的预测误差与编码对象区域的周边的预测误差之间的差分f’(SADn(a,b))(S701)。其中,n表示帧序号,a、b表示插补对象像素所属的图像区域的序号,k、l是表示周边图像区域与插补对象像素所属的图像区域的序号之差的变量。
式3
f ′ ( SAD n ( a , b ) ) = Σ k = - 1 1 Σ l = - 1 1 | SAD n ( a + k , b + l ) - SAD n ( a , b ) |
然后,由运动估计部302判定根据式1求出的最小的预测误差绝对值之和SADn(a,b)是否为阈值S1以下、或者式3所示的预测误差差分绝对值之和f’(SADn(a,b))是否为阈值S2以上(S702)。这是因为在预测误差绝对值之和SADn(a,b)小时,认为生成插补图像时的运动检测结果的可靠性比较高。并且,认为在预测误差差分绝对值之和f’(SADn(a,b))大时,虽然在通常的编码图像中产生较多的编码量,但是在图案复杂的区域的画质多少恶化时,在视觉上也不明显,所以选择插补图像比较有利。
在此,当在步骤702满足条件时,选择插补图像(S703)。此时,不输出预测区域的种类等头(head)信息、运动矢量、预测误差数据等而结束处理(S705)。另一方面,当在步骤702不满足条件时,选择编码图像(S706)。此时,向编码数据存储部106输出预测区域的种类等头信息、运动矢量、预测误差数据,并结束处理。
即,在选择了编码图像时,与通常的编码技术相同,编码流中包含预测区域的种类等头信息、运动矢量、预测误差数据等。与此相对,在选择了插补图像时,在解码侧即使没有这些数据,也能够通过在图17中说明的插补处理来生成解码图像,所以编码流中不包含这些数据。因此,在选择了插补图像时,能够减少编码数据量,能够提高压缩率。
关于以上说明的编码图像、插补图像的模式选择,列举帧单位下的选择示例进行了说明。但是,也可以把被选择为插补帧的B图片中的一部分区域选择为编码图像,把其他区域选择为插补图像。该区域例如可以采用块单位等。
下面,使用图8说明利用以往的编码技术编码的帧、和利用实施例1的图像编码装置及图像编码方法编码的帧的编码数据量的比较示例。在图8中,灰色区域表示选择了编码图像的区域,白色区域表示选择了插补图像的区域。
图8(a1)表示利用以往的编码技术编码的帧。在以往的编码技术中,由于不存在插补图像区域,所以各个区域都是编码图像。在图8(a1)的示例中,24个区域全部是编码图像。在此,在以往的编码技术中,原则上对于图8(a)中的帧的全部区域,把预测区域的种类等头信息、运动矢量、预测误差数据等信息存储在编码流中。在此,利用以往的编码技术编码的帧的编码流如图8(a2)所示。在图8(a2)的示例中,对于24个编码图像的全部区域,把预测区域的种类等头信息、运动矢量、预测误差数据等信息存储在编码流中。
与此相对,图8(b1)表示利用实施例1的图像编码装置及图像编码方法编码的帧的示例。在图8(b1)的示例中,只在24个区域中的8个区域中选择编码图像。在剩余16个区域中选择插补图像。在此,对应图8(b1)的示例的编码流如图8(b2)所示。即,在实施例1的图像编码装置及图像编码方法的编码处理中,对于选择了插补图像的区域,在解码侧不需要预测区域的种类等头信息、运动矢量、预测误差数据等信息,所以编码流中不包含这些信息。在图8(b2)的示例中,编码流中包含有关编码图像区域中的8个区域的预测区域的种类等头信息、运动矢量、预测误差数据等信息。
因此,根据实施例1的图像编码装置及图像编码方法,与以往的编码技术相比,能够减少编码流中包含的编码数据的量,能够提高编码压缩率。
下面,使用图9和图8,说明本发明的实施例1的图像编码装置的可变长度编码部106中的运动矢量的编码处理。
首先,在作为以往的编码技术的H.264标准中,在编码对象区域的运动矢量的编码处理中,根据编码对象区域的周边区域的运动矢量的中间值计算运动预测矢量,只把编码对象区域的运动矢量与运动预测矢量之间的差分作为编码数据,由此削减数据量。
在实施例1的可变长度编码部106中,计算运动预测矢量(PMV),计算编码对象区域的运动矢量(MV)与运动预测矢量(PMV)之间的差分矢量(DMV),把差分矢量(DMV)作为编码数据。但是,如图8(b1)所示,在利用实施例1的图像编码装置及图像编码方法编码的帧中,混合存在编码图像区域和插补图像区域,所以运动预测矢量(PMV)的计算方法采用与作为以往的编码技术的H.264标准不同的方法。
首先,图9(a)表示以往的H.264标准的相应技术的具体示例。在H.264标准中,如图9(a)所示,使用在编码对象区域X的邻近区域、即在编码对象区域X之前先编码的区域A、B、C中用于编码处理的运动矢量的中间值(median),计算编码对象区域X的运动预测矢量(PMV)。该运动预测矢量的计算需要在编码处理和解码处理中进行相同的处理。
在此,说明本发明的实施例1的运动矢量的编码处理。本发明的实施例1的运动矢量的编码处理是只对编码图像区域和插补图像区域中的编码图像区域进行的处理。关于插补图像区域,由于在解码侧进行插补图像用的运动估计,所以不需要运动矢量的编码处理。
在此,在本发明的实施例1的运动矢量的编码处理中,根据图9中与编码对象区域X邻近的块A、B、C、D分别是编码图像区域还是插补图像区域,变更在运动矢量的编码处理中使用的预测矢量的计算处理。下面,说明有关各个情况的具体处理。
首先,例如如图9(a)所示,在周边区域A、B、C都是编码图像区域时,与以往的H.264标准相同,使用在周边区域A、B、C中用于编码处理的预测矢量(MVA、MVB、MVC)的中间值(median),计算运动预测矢量。
下面,说明编码对象区域X的周边区域包含插补图像区域的情况(图9(b)(c))。如上所述,对于插补图像区域不对运动矢量进行编码,即,不向解码侧发送在编码处理中使用的运动矢量。因此,如果把在编码处理中使用的运动矢量用于计算预测运动矢量(PMV),则在解码时不能计算预测运动矢量(PMV)。因此,在实施例1中按照下面所述进行预测运动矢量(PMV)的计算。
首先,在编码对象区域X的周边区域都是插补图像区域时(图9(b)),使用在插补图像生成处理中使用的运动矢量、即由插补图像生成部104的运动估计部302计算的运动矢量(MVCA、MVCB、MVCC)。在运动估计部302的运动估计是像素单位等情况下,对于各个区域,由于存在多个运动矢量,所以使用该多个运动矢量的平均值计算运动矢量(MVCA、MVCB、MVCC)。并且,计算运动矢量(MVCA、MVCB、MVCC)的中间值作为预测运动矢量(PMV)。
然后,在编码对象区域X的周边区域A、B、C的一部分是编码图像区域、一部分是插补图像区域时(图9(c)),对于编码图像区域使用在编码处理中使用的运动矢量MV、对于插补图像区域使用在插补图像生成处理中使用的运动矢量MVC,计算它们的中间值作为预测运动矢量(PMV)。
即,在图9(c)的示例中,周边区域A、C是编码图像区域,周边区域B是插补图像区域。该情况时,如图9(c)(1)所示,计算运动矢量(MVA、MVCB、MVC)的中间值作为预测运动矢量(PMV)。
并且,作为在编码对象区域X的周边区域A、B、C的一部分是编码图像区域、一部分是插补图像区域时(图9(c))计算预测运动矢量(PMV)的变形例,也可以优先选择使用编码图像区域的运动矢量。例如,在图9(c)的示例中,在位于编码对象区域X的左上方的周边区域D是编码图像区域时,不使用作为插补图像区域的周边区域B的MVCB,而使用在周边区域D的编码处理中使用的运动矢量MVD。并且,计算运动矢量(MVA、MVC、MVD)的中间值作为预测运动矢量(PMV)。
并且,在周边区域A、B、C、D中有两个编码图像区域时,可以把这两个区域的运动矢量MV的平均值作为预测运动矢量(PMV)。并且,在周边区域A、B、C、D中有一个编码图像区域时,可以把有关该区域的运动矢量MV本身作为预测运动矢量(PMV)。
这样,通过优先选择编码图像区域的运动矢量,能够降低编码侧的插补图像生成处理的运动估计与解码侧的插补图像生成处理的运动估计之间的估计误差的影响。
根据以上说明的实施例1的图像编码装置及图像编码方法,相比以往的编码装置及编码方法,能够提高数据压缩率。
下面,使用图10说明实施例1的图像解码装置。实施例1的图像解码装置例如具有:可变长度解码部1001,其对从编码侧发送的编码数据进行解码;句法分析部1002,其对实施了可变长度解码的数据进行句法分析;模式判定部1009,其根据句法分析部1002的分析结果及插补图像生成部1007的预测误差计算结果等,判定是进行解码处理还是进行插补图像生成处理;逆量化/逆频率变换部1003,其对句法分析部1002发送的数据实施逆量化/逆频率变换;加法器1004,其将逆量化/逆频率变换部1003输出的数据与由运动补偿部1006生成的预测图像相加;解码图像存储部1005,其存储由加法器1004输出的数据;运动补偿部1006,其在由解码图像存储部1005存储的数据之间进行运动补偿;插补图像生成部1007,其使用从句法分析部1002和解码图像存储部1005获取的数据,进行运动估计处理和插补图像生成处理,并生成插补图像;输出部1008,其向影像显示装置等输出由插补图像生成部1007生成的插补图像、或者由加法器1004生成的解码图像中的任一方。
下面,具体说明实施例1的图像解码装置的各个处理部分的动作。
首先,使用图11具体说明插补图像生成部1007。插补图像生成部1007具有运动估计部1101和插补像素生成部1102。运动估计部1101进行与图3中的运动估计部302相同的处理,插补像素生成部1102进行与图3中的插补像素生成部303相同的处理。并且,运动估计部1101与运动估计部302相同,具有图6所示的预测误差计算部601和运动矢量确定部602,进行与编码处理时相同的预测误差计算处理和运动矢量计算处理。关于该预测误差计算处理和运动矢量计算处理、以及由运动估计部302和插补像素生成部303进行的插补图像生成处理,已经使用图5等进行了说明,所以省略说明。
下面,使用图12说明实施例1的图像解码装置的图像解码方法的处理流程。该处理例如对每个区域实施。首先,由可变长度解码部1001对编码流进行解码,并发送给句法分析部1002(S1201)。然后,由句法分析部1002进行解码后的流数据的句法拆分(構文分け),并向逆量化/逆频率变换部1003和插补图像生成部1007发送编码数据(S1202)。然后,由句法分析部1002判定编码对象帧的图片类型,判定编码对象帧是编码帧还是插补帧(S1203)。在编码对象帧是插补帧时,插补图像生成部1007对于解码对象区域,使用显示时间顺序位于对象帧前后的多个已解码图像区域,进行运动估计处理(S1204)。在运动估计部1101中,通过与图3中的运动估计部302相同的处理,计算最小的预测误差绝对值之和SADn(a,b)并确定运动矢量。然后,模式判定部1009计算由运动估计部1101算出的预测误差绝对值之和与解码对象区域的周边的预测误差绝对值之和之间的差分f’(SADn(a,b))(S1205)。然后,模式判定部1009判定由运动估计部1101算出的最小的预测误差绝对值之和SADn(a,b)是否为阈值S1以下、或者与周边的预测误差绝对值之和的差分f’(SADn(a,b))是否为阈值S2以上(S1206)。在预测误差绝对值之和SADn(a,b)为阈值S1以下时、或者预测误差差分绝对值之和f’(SADn(a,b))为阈值S2以上时,判定为解码对象区域是插补图像区域。在其他情况时,判定为解码对象区域是作为编码图像区域而被编码的区域。
在此,在由模式判定部1009判定为解码对象区域是插补图像区域时,插补图像生成部1007的插补像素生成部1102生成插补像素,通过插补图像的生成处理,生成图像,并存储在解码图像存储部106中(S1207)。
另一方面,在编码对象帧不是插补帧时(是编码帧时),或者,在由模式判定部1009判定为解码对象区域是作为编码图像区域而被编码的区域时,逆量化/逆频率变换部1003对从句法分析部1002获取的编码数据进行逆量化/逆频率变换处理,并对差分数据进行解码(S1208)。然后,运动补偿部1006使用从句法分析部1002获取的头信息、运动矢量等,进行运动补偿处理并生成预测图像(S1209)。然后,加法器1004将运动补偿部1006生成的预测图像与逆量化/逆频率变换部1003输出的差分数据相加,生成解码图像并存储在解码图像存储部106中(S1210)。最后,由输出部1008输出在步骤1207生成的插补图像或在步骤1210生成的解码图像(S1211),并结束处理。
另外,在步骤1209,在该编码区域是画面间预测时,运动补偿部1006根据解码对象区域的周边区域的运动矢量计算运动预测矢量(PMV),并与存储在编码数据中的差分矢量(DMV)相加,生成解码对象区域的运动矢量(MV),根据该运动矢量(MV)进行运动补偿处理。在此,关于上述运动预测矢量(PMV)的计算处理,可以进行与使用图9说明的在编码侧进行的运动预测矢量(PMV)的计算处理相同的处理,所以省略说明。
根据以上说明的实施例1的图像解码装置及图像解码方法,能够适合对利用相比以往的编码装置及编码方法能够提高数据压缩率的编码方法编码后的数据进行解码。
根据以上说明的实施例1的图像编码装置和图像编码方法、以及图像解码装置和图像解码方法,能够生成提高了数据压缩率的编码数据,并适合对该编码数据进行解码。
【实施例2】
下面,说明本发明的实施例2。在本发明的实施例2中,与实施例1不同,在编码流中包含表示在编码侧对于每个编码对象区域选择了编码图像还是选择了插补图像的标志数据。由此,在解码侧,对于解码对象区域,能够容易判别是选择了编码图像的区域还是选择了插补图像的区域。因此,能够简化解码时的处理,并减少处理量。下面具体说明实施例2。
实施例2的图像编码装置把实施例1的图像编码装置中的图1所示的模式选择部105替换为图13所示的模式选择部1304。其他部分的结构、动作与实施例1的动作相同,所以省略说明。
在模式选择部1304中,首先,由差分绝对值计算部1301计算由区域分割部102分割后的输入图像与由插补图像生成部104生成的插补图像之间的差分。同样,由差分绝对值计算部1302计算由区域分割部102分割后的输入图像与由编码部103生成的编码图像之间的差分。然后,由判定部1303选择由差分绝对值计算部1301、1302计算的差分绝对值中较小的一方,并输出判定标志(模式判定标志)。例如,在选择了编码图像时,模式判定标志为0,在选择了插补图像时,模式判定标志为1。
在此,图14表示实施例2的图像编码装置的编码数据存储部106中的数据的一例。如图14所示,采取按每个编码对象区域,附加表示选择了编码图像还是选择了插补图像的1比特的标志数据的形式。即,在从实施例2的图像编码装置输出的编码流中,包含按每个编码对象区域表示选择了编码图像还是选择了插补图像的标志数据。由此,在解码侧,即使不进行实施例1所示的预测误差绝对值之和SADn(a,b)及预测误差差分f’(SADn(a,b))的计算处理及比较处理,也能够判别解码对象区域是选择了编码图像的区域还是选择了插补图像的区域。因此,能够简化解码时的处理,并减少处理量。
根据以上说明的实施例2的图像编码装置和图像编码方法,与实施例1不同,在输出编码流中包含按每个编码对象区域表示是选择了编码图像还是选择了插补图像的标志数据。因此,在解码侧,能够容易判别解码对象区域是选择了编码图像的区域还是选择了插补图像的区域。因此,能够简化解码时的处理,并减少处理量。
下面,说明实施例2的图像解码装置。实施例2的解码装置的结构与实施例1的图10相同,所以省略说明。
在此,使用图15说明实施例2的图像解码装置的处理流程。
实施例2的图像解码装置被输入了图14所示的编码流,该编码流包含按每个编码对象区域表示选择了编码图像还是选择了插补图像的标志数据。首先,由可变长度解码部1001对该编码流进行解码,并发送给句法分析部1002(S1501)。然后,由句法分析部1002进行解码后的流数据的句法拆分,向模式判定部1009发送头信息及模式判定标志,并向逆量化/逆频率变换部1003发送编码数据(S1502)。然后,由句法分析部1002或模式判定部1009,根据编码对象帧的图片类型,判定编码对象帧是编码帧还是插补帧(S1503)。
在此,在编码对象帧是插补帧时,模式判定部1009对于解码对象区域,进行由句法分析部1002发送的模式判定是1还是0的判定(S1504)。在模式判定标志是1时(表示选择了插补图像的区域),判定解码对象区域是插补图像区域。在模式判定标志是0时(表示选择了编码图像的区域),判定解码对象区域是作为编码图像区域而被编码的区域。
在此,在由模式判定部1009判定为解码对象区域是插补图像区域时,插补图像生成部1007的运动估计部1101进行运动估计(S1505)。然后,根据运动估计部1101的运动估计结果,插补像素生成部1102生成插补像素,通过插补图像的生成处理,生成图像并存储在解码图像存储部106中(S1506)。
另一方面,在编码对象帧不是插补帧时(是编码帧时),或者,在由模式判定部1009判定为解码对象区域是作为编码图像区域而被编码的区域时,逆量化/逆频率变换部1003对从句法分析部1002获取的编码数据进行逆量化/逆频率变换处理,并对差分数据进行解码(S1507)。然后,运动补偿部1006使用从句法分析部1002获取的头信息、运动矢量等,进行运动补偿处理并生成预测图像(S1508)。然后,加法器1004将运动补偿部1006生成的预测图像与逆量化/逆频率变换部1003输出的差分数据相加,生成解码图像并存储在解码图像存储部106中(S12509)。最后,由输出部1008输出在步骤1207生成的插补图像或在步骤1210生成的解码图像(S1510),并结束处理。
根据以上说明的实施例2的图像解码装置及图像解码方法,在实施例1的效果的基础上,即使不进行实施例1所示的预测误差绝对值之和SADn(a,b)或预测误差差分绝对值之和f’(SADn(a,b))的计算处理及比较处理,对于解码对象区域,也能够判别是选择了编码图像的区域还是选择了插补图像的区域。因此,能够简化解码时的处理,并减少处理量。
根据以上说明的实施例2的图像编码装置和图像编码方法、以及图像解码装置和图像解码方法,能够生成提高了数据压缩率的编码数据,并适合对该编码数据进行解码。
【实施例3】
下面,说明本发明的实施例3。在本发明的实施例1中,在插补图像生成部104中,按照图4和图5所示,根据先进行编码处理(在解码时先进行解码处理)的多个图片,通过插补处理(以下称为内插插补)生成作为显示顺序位于该多个图片之间的图片的、帧的像素。
与此相对,在本发明的实施例3中,追加了下述的插补处理(以下称为外插插补),即,根据先进行编码处理(在解码时先进行解码处理)的多个图片,通过插补处理生成作为显示顺序位于该多个图片之前或之后的图片的、帧的像素。
下面,说明实施例3的图像编码装置的具体结构及动作。
实施例3的图像编码装置在实施例1的图像编码装置中,对插补图像生成部104追加了后面叙述的基于后方插补的插补图像生成处理动作,并在该插补图像生成部104的后面追加了插补方向确定部1805。其他部分的结构和动作与实施例1的动作相同,所以省略说明。
在此,所追加的外插插补处理有前方插补处理和后方插补处理这两种。说明图像编码装置的插补图像生成部104在各个插补处理中的动作。
首先,说明前方插补处理。在此,说明以下示例,即,使用在图16(a)所示的输入图像中显示顺序位于插补帧1603前方的两个编码帧1601、1602,生成插补帧1603(B图片)的插补图像。
该情况时,为了求出插补帧的像素,在运动估计部302进行下面叙述的运动估计。如图17(a)所示,使用在插补帧1603之前显示的两个编码帧(1601、1602)内的像素值,求出式4所示的预测误差绝对值之和SADn(a,b)。具体地讲,使用编码帧1601上的像素1700的像素值fn-2(x-2dx,y-2dy)、和编码帧1602上的像素1701的像素值fn-1(x-dx,y-dy)。其中,R表示插补对象像素所属的对象区域的尺寸。
在此,编码帧1601上的像素1700和编码帧1602上的像素1701被设定成为在时间空间坐标上和插补帧1603上的插补对象像素1702位于同一直线上。
式4
SAD n ( a , b ) = Σ i , j ∈ R | f n - 1 ( x - dx + i , y - dy + j ) - f n - 2 ( x - 2 dx + i , y - 2 dy + j ) |
然后,求出式4所示的预测误差绝对值之和为最小的位置(dx,dy),通过与在实施例1中叙述的插补像素生成部303相同的处理,生成插补像素。
通过以上步骤,能够通过前方插补处理来生成插补像素。
另外,上述的前方插补处理只要显示顺序位于前面的两个编码帧先被编码、解码,就能够适用,所以也能够适用于如图16(b)所示的插补帧1603(P图片)的情况。
下面,说明后方插补处理。在此,说明以下示例,即,使用在图16(a)所示的输入图像中显示顺序位于插补帧1603后方的两个编码帧1603、1604,生成插补帧1603的插补图像。
该情况时,为了求出插补帧的像素,在运动估计部302进行下面叙述的运动估计。如图17(b)所示,使用在插补帧1603之后显示的两个编码帧(1604、1605)内的像素,求出式5所示的预测误差绝对值之和SADn(x,y)。具体地讲,使用编码帧1604上的像素1711的像素值fn+1(x+dx,y+dy)、和编码帧1605上的像素1712的像素值fn+2(x+2dx,y+2dy)。其中,R表示插补对象像素所属的对象区域的尺寸。
在此,编码帧1604上的像素1711和编码帧1605上的像素1712被设定成为在时间空间坐标上和插补帧1603上的插补对象像素1710位于同一直线上。
式5
SAD n ( a , b ) = Σ i , j ∈ R | f n - 1 ( x + dx + i , y + dy + j ) - f n + 1 ( x + 2 dx + i , y + 2 dy + j ) |
然后,求出式5所示的预测误差绝对值之和为最小的位置(dx,dy),通过与在实施例1中叙述的插补像素生成部303相同的处理,生成插补像素。
通过以上步骤,能够通过后方插补处理来生成插补像素。
在插补图像生成部104中,进行上述的后方插补处理和与实施例1相同的前方插补处理这两种处理,生成三种插补图像。
然后,由图18所示的插补方向确定部1805进行运动估计方法的判定。下面,说明插补方向确定部1805的处理。首先,由差分绝对值计算部1801计算通过进行在实施例1中叙述的双向运动估计而生成的插补图像与输入图像之间的差分绝对值。然后,由差分绝对值计算部1802计算通过进行在本实施例中叙述的前向的运动估计而生成的插补图像与输入图像之间的差分绝对值。并且,由差分绝对值计算部1803计算通过进行后向的运动估计而生成的插补图像与输入图像之间的差分绝对值。然后,由运动估计方向判定部1804选择输入图像与插补图像之间的差分变小的插补图像,把所选择的结果作为运动估计方向判定标志输出。运动估计方向判定标志可以设为2比特的数据,例如在是双向时为00,在是前向时为01,在是后向时为10。这样生成的运动估计方向判定标志被发送给编码数据存储部106。
图19表示存储在编码数据存储部106中存储的数据的一例。如图19所示,在插补像素区域中附加了判定根据哪个方向生成插补图像的标志数据。即,在从实施例3的图像编码装置输出的编码流中,包含表示对于选择了插补图像的区域生成插补图像用的插补方向的标志数据。
由此,能够增加插补图像的生成方法的种类,除B图片外,P图片也能够设为插补图像帧,所以能够进一步削减数据。
并且,在B图片中,在基于插补对象帧的前后的帧的、双向插补的基础上,还能够进行从前方的两个编码帧生成插补图像的前方插补、和从后方的两个编码帧生成插补图像的后方插补,所以能够期待画质提高。
尤其在根据背景和前景进行不同的运动的图像中,在只从双向生成插补图像时,在背景隐藏于前景后面而看不到的区域(遮挡(occlusion)区域)中,画质恶化变明显,但通过前方或后方外插插补,能够解决这种画质恶化的问题。
根据以上说明的实施例3的图像编码装置及图像编码方法,与实施例1不同,输出编码流中包含表示用于生成插补图像的插补方向的标志数据。由此,能够增加在解码侧进行的插补处理的种类,除B图片外,P图片也能够设为插补图像帧,所以能够进一步削减数据。并且,也能够实现B图片的插补图像的高画质。
下面,说明实施例3的图像解码装置。关于实施例3的图像解码装置的结构,把实施例1中的图11所示的运动估计部1101替换为图20所示的运动估计部2005,其他部分与实施例1相同,所以省略说明。
实施例3的解码装置的运动估计部2005由运动估计方法确定部2001、运动估计部2002、预测误差计算部2003和运动矢量确定部2004构成。在运动估计方法确定部2001中,根据由句法分析部1002发送的运动估计方向判定标志的信息,确定双向、前向、后向的运动估计方法。在确定运动估计方法后,由运动估计部2002、预测误差计算部2003、运动矢量确定部2004进行运动估计、预测误差计算、运动矢量确定。关于双向估计与实施例1相同,关于前向估计、后向估计,进行与本实施例的图像编码装置的前向估计、后向估计相同的处理即可。
下面,图21表示实施例3的图像解码装置的处理流程。
首先,由可变长度解码部1001对编码流进行可变长度解码,并发送给句法分析部1002(S2101)。然后,由句法分析部1002进行解码后的流数据的句法拆分,向逆量化/逆频率变换部1003、插补图像生成部1007发送编码数据(S2102)。然后,由句法分析部1002判定编码对象帧的图片类型(S2103)。在编码对象帧是插补帧时,对于解码对象区域,根据由句法分析部1002发送的运动估计方向判定标志,由运动估计方法确定部2001根据双向、前向或后向等运动估计方向,确定使用一个运动估计方向的运动估计方法(S2104)。在确定运动估计方法后,由运动估计部2005实施运动估计(S2105)。在运动估计部2005中,计算预测误差绝对值之和及运动矢量,并且通过与实施例1的运动估计部1101相同的处理,计算预测误差差分绝对值之和(S2106)。然后,在预测误差绝对值之和差分为阈值S1以下或者预测误差差分绝对值之和为阈值S2以上时,插补图像生成部1102通过与实施例1相同的处理,生成插补像素(S2108)。另一方面,在编码对象帧不是插补帧时、和不满足S2107的条件时,由逆量化/逆频率变换部1003进行逆量化/逆频率变换,并加算来自运动补偿部1006的数据,然后将数据存储在解码图像存储部1005中。然后,使用存储在解码图像存储部1006中的数据,由运动补偿部1006进行运动补偿(S2109)。在运动补偿部1006中,使用由解码图像存储部1005存储的解码图像和由句法分析部1002发送的运动矢量,进行运动补偿并生成解码图像,存储在解码图像存储部1005中(S2111)。将利用上述方法生成的解码图像或插补图像输出给影像显示装置1008(S2111),并结束处理。
根据以上说明的实施例3的图像解码装置及图像解码方法,通过进行使用了编码流中包含的运动估计方向判定标志的处理,能够应对多种插补处理。另外,能够在解码侧一次完成该多种插补处理的运动估计处理,能够大量削减处理量。
根据以上说明的实施例3的图像编码装置和图像编码方法、以及图像解码装置和图像解码方法,能够生成提高了数据压缩率的编码数据,并适合对该编码数据进行解码。
【实施例4】
下面,说明本发明的实施例4的图像编码装置。实施例4的图像编码装置是在实施例1的图像编码装置中,还设置了实施例2的模式选择部1304、和实施例3的运动估计部302及插补方向确定部1805的编码装置。即,实施例4的图像编码装置使编码流包含模式判定标志和运动估计方向判定标志并输出。
实施例4的编码装置的各个构成部分和各个处理内容,与实施例1、实施例2、实施例3记述的各个构成部分和各个处理内容相同,所以省略说明。
在此,图22表示在实施gh例4的编码数据存储部106中存储的数据的一例。如图22所示,在各个分割区域中附加用于判定是编码图像区域还是插补图像区域的模式判定标志,还在插补图像区域中附加用于进行判定双向、前向、后向的运动估计方法的运动估计方法判定标志。
由此,能够实现具有实施例2的效果和实施例3的效果的图像编码装置及图像编码方法,实施例2的效果是能够简化解码时的处理,并减少数据量,实施例3的效果是除B图片之外,P图片也能够作为插补对象帧,并进一步减少数据量,提高B图片的画质。
下面,说明实施例4的图像解码装置。实施例4的图像解码装置的结构与实施例3相同,所以省略说明。
使用图23说明实施例4的解码装置的解码对象区域图像处理的流程。首先,由可变长度解码部1001对编码流进行解码,并发送给句法分析部1002(S2301)。然后,由句法分析部1002进行解码后的流数据的句法拆分,向逆量化/逆频率变换部1003、插补图像生成部1007发送模式判定标志及运动估计方法判定标志、编码数据(S2302)。然后,由句法分析部1002根据编码对象帧的图片类型,判定编码对象帧是编码帧还是插补帧(S2303)。在编码对象帧是插补帧时,对于解码对象区域,判定由句法分析部1002发送的模式判定标志是否是1(表示解码对象区域是插补图像)(S2304)。在模式判定标志是1时,运动估计方法确定部2001根据由句法分析部1002发送的运动估计方向判定标志,确定有关插补处理的运动估计方向(S2305),运动估计部2002、预测误差计算部2003、运动矢量确定部2004进行运动估计、预测误差计算、运动矢量确定(S2306),插补像素生成部1102使用所确定的运动矢量,生成插补像素,由此生成插补图像(S2307)。
另一方面,在编码对象帧不是插补帧时、和不满足S2107的条件时,由逆量化/逆频率变换部1003进行逆量化/逆频率变换,并加算来自运动补偿部1006的数据,然后将数据存储在解码图像存储部1005中。然后,使用存储在解码图像存储部1006中的数据,由运动补偿部1006进行运动补偿(S2309)。在运动补偿部1006中,使用由解码图像存储部1005存储的解码图像和由句法分析部1002发送的运动矢量,进行运动补偿并生成解码图像,存储在解码图像存储部1005中(S2310)。将利用上述方法生成的解码图像或插补图像输出给影像显示装置1008(S2311),并结束处理。
根据以上说明的实施例4的图像解码装置及图像解码方法,能够实现具有实施例2的效果和实施例3的效果的图像编码装置及图像编码方法,实施例2的效果是简化解码时的处理,并减少数据量,实施例3的效果是通过进行使用了编码流中包含的运动估计方向判定标志的处理,能够应对多种插补处理,能够在解码侧一次完成该多种插补处理的运动估计处理,能够大量削减处理量。
根据以上说明的实施例4的图像编码装置和图像编码方法、以及图像解码装置和图像解码方法,能够生成提高了数据压缩率的编码数据,并适合对该编码数据进行解码。
【实施例5】
下面,说明本发明的实施例5的图像编码装置。实施例5的图像编码装置具有与实施例2的图像编码装置相同的结构,但实施例2的模式选择部1304按每个图像块生成模式判定标志,而实施例5的模式选择部1304是在连续存在多个解码对象区域是插补图像的块(插补图像模式块)的情况下,生成表示该插补图像模式块连续的数量的标志(插补图像模式连续块数量标志),对于该多个连续的插补图像模式块,将一个插补图像模式连续块数量标志包含在编码流中进行输出。实施例5的图像编码装置的其他各个结构及各个处理内容,与实施例1和实施例2记载的各个结构及各个处理内容相同,所以省略说明。
并且,对于解码对象区域是编码图像的块,生成表示该块是除插补图像模式之外的模式的非插补图像模式的模式标志并输出。非插补图像模式的模式标志可以单纯表示除插补图像模式之外的模式,也可以表示编码模式的种类自身(宏块类型等)。
在此,图24表示实施例5的图像编码装置的编码数据存储部106的数据的一例。图24(a)表示实施例2的图像编码装置生成的数据,图24(b)表示实施例5的图像编码装置生成的数据。
如图所示,在图24(a)所示的实施例2的数据中,存在多个连续的模式判定标志。与此相对,在图24(b)所示的实施例5的数据中,只在插补图像模式块连续的部分中插入了一个插补图像模式连续块数量标志。在图24(b)的示例中,对应于插补图像模式连续块数量标志利用箭头示出的数字,是插补图像模式连续块数量标志表示的连续的插补图像模式块的数量的示例。具体地讲,在图24(b)的示例中,插补图像模式连续块数量标志2401表示数“4”,其表示4个块a、b、c、d是连续的插补图像模式块。同样,插补图像模式连续块数量标志2402表示数“1”,其表示只有一个块e是插补图像模式块。同样,插补图像模式连续块数量标志2403表示数“5”,其表示5个块f、g、h、i、j是连续的插补图像模式块。图24(b)所示的实施例5的数据使用这种插补图像模式连续块数量标志,相比对每个块附加模式判定标志的图24(a)所示的实施例2的数据,能够削减数据量。另外,对于解码对象区域是编码图像的块中的各个块,插入非插补图像模式的模式标志。
根据以上说明的实施例5的图像编码装置及图像编码方法,除了实施例2的效果、即简化解码时的处理并减少处理量之外,还能够根据插补图像模式连续块数量标志,利用一个标志表示多个块的模式,能够削减编码数据量。
下面,说明本发明的实施例5的图像解码装置。本发明的实施例5的图像解码装置的结构与实施例2的图像解码装置的结构相同,所以省略说明。但是,关于本发明的实施例5的图像解码装置的处理流程,以下几点与图15所示的实施例2的图像解码装置的处理流程不同。除以下几点之外,其他与图15所示的流程相同,所以省略利用其他附图进行说明。即,在实施例2中,在图15中的S1504,如果模式判定标志是1,则进行S1505以后的插补图像的生成处理,如果模式判定标志是0,则进行S1507以后的图像解码处理。
与此相对,在实施例5中,在图15中的S1504检测标志,并判定是插补图像模式连续块数量标志还是非插补图像模式的模式标志。在检测到的标志是插补图像模式连续块数量标志的情况下,对于该插补图像模式连续块数量标志所表示的数量的连续的块,进行S1505以后的插补图像的生成处理。在标志是非插补图像模式的模式标志的情况下,对该标志所对应的块进行S1507以后的图像解码处理。由此,在标志是插补图像模式连续块数量标志,而且该标志表示2以上的数字的情况下,通过一次判定处理即可确定有关多个块的图像生成处理。
由此,实施例5的图像解码装置相比实施例2,能够进一步简化解码时的处理,并减少处理量。
根据以上说明的实施例5的图像解码装置和图像解码方法,对应于编码流中包含的插补图像模式连续块数量标志,通过一次判定处理即可确定有关多个块的图像生成处理。由此,具有相比实施例2能够进一步简化解码时的处理和减少处理量的效果。
【实施例6】
下面,说明本发明的实施例6的图像编码装置。实施例6的图像编码装置具有与实施例4的图像编码装置相同的结构,但实施例4的模式选择部1304按每个图像块生成模式判定标志和运动估计方向判定标志,而实施例6的模式选择部1304则与实施例5相同,生成插补图像模式连续块数量标志或非插补图像模式的模式标志,按每个插补图像模式连续块数量标志,生成运动估计方向判定标志。有关运动估计方向判定标志的具体说明与实施例3和实施例4相同,所以省略说明。另外,有关插补图像模式连续块数量标志或非插补图像模式的模式标志的具体说明与实施例5相同,所以省略说明。实施例6的图像编码装置的其他各个结构及各个处理内容,与实施例1~5记载的各个结构及各个处理内容相同,所以省略说明。
在此,图25表示实施例6的图像编码装置的编码数据存储部106的数据的一例。图25(a)表示实施例4的图像编码装置生成的数据,图25(b)表示实施例6的图像编码装置生成的数据。图25(b)与图24(b)相同,对应于插补图像模式连续块数量标志利用箭头示出的数字,示出插补图像模式连续块数量标志表示的连续的插补图像模式块的数量的示例。在图25(b)的示例中,插补图像模式连续块数量标志2401表示数“4”,其表示4个块a、b、c、d是连续的插补图像模式块。这与实施例5相同。在此,在实施例6中,对每个插补图像模式连续块数量标志生成运动估计方向判定标志,所以在插补图像模式连续块数量标志2501后面插入运动估计方向判定标志2502。在此,对于通过插补图像模式连续块数量标志2501表示为连续的插补图像模式块的4个块a、b、c、d,使用根据插补图像模式连续块数量标志2501附带的运动估计方向判定标志2502所表示的运动估计方向而确定的运动估计方法,生成插补图像。
图25(b)所示的实施例5的数据使用这种插补图像模式连续块数量标志,对每个插补图像模式连续块数量标志,将运动估计方向判定标志插入到编码数据中。由此,相比对每个块附加模式判定标志和运动估计方向判定标志的、图25(a)所示的实施例4的数据,能够削减数据量。另外,对于解码对象区域是编码图像的块中的每个块,插入非插补图像模式的模式标志,这一点与实施例5相同。
根据以上说明的实施例6的图像编码装置及图像编码方法,具有实施例4的效果,即,简化解码时的处理,减少处理量,除B图片之外,P图片也被作为插补对象帧,能够进一步减少数据量,并提高B图片的画质,除实施例4的效果之外,还能够根据插补图像模式连续块数量标志,利用一个标志分别表示多个块的模式和运动估计方向,能够削减编码数据量。
下面,说明本发明的实施例6的图像解码装置。本发明的实施例6的图像解码装置的结构与实施例4的图像解码装置的结构相同,所以省略说明。但是,关于本发明的实施例6的图像解码装置的处理流程,以下几点与图23所示的实施例4的图像解码装置的处理流程不同。除以下几点之外,其他与图23所示的流程相同,所以省略利用其他附图进行说明。即,在实施例4中,在图23中的S2304,如果模式判定标志是1,则进行S2305以后的插补图像的生成处理,此时在S2305根据有关各个块的运动估计方向判定标志来确定运动估计方法,并进行S2306的运动估计。并且,如果在S2304模式判定标志是0,则进行S2308以后的图像解码处理。
与此相对,在实施例6中,在图23中的S2304检测标志,并判定是插补图像模式连续块数量标志还是非插补图像模式的模式标志。在检测到的标志是插补图像模式连续块数量标志的情况下,对于该插补图像模式连续块数量标志所表示的数量的连续的块,进行S2305以后的插补图像的生成处理。此时在S2305根据该插补图像模式连续块数量标志附带的运动估计方向判定标志,确定有关对该连续的多个块生成插补图像时的运动估计方法。在S2306,利用对该连续的多个块所确定的运动估计方法来进行运动估计。在S2307,根据该估计结果生成插补图像。并且,在S2304,在标志是非插补图像模式的模式标志的情况下,对该标志所对应的块进行S1507以后的图像解码处理。
根据以上流程,通过使用了运动估计方向判定标志的处理,能够应对多种插补处理,同时在标志是插补图像模式连续块数量标志,而且该标志表示2以上的数字的情况下,通过一次判定处理即可确定有关多个块的图像生成处理。
由此,实施例6的图像解码装置除了实施例4的效果、即应对多种插补处理之外,相比实施例4能够进一步简化解码时的处理,并减少处理量。
根据以上说明的实施例6的图像解码装置和图像解码方法,能够应对多种插补处理,并对应编码流中包含的插补图像模式连续块数量标志,通过一次判定处理即可确定有关多个块的图像生成处理。由此,具有相比实施例4能够进一步简化解码时的处理和减少处理量的效果。
另外,在把以上说明的各个实施例的插补图像的生成方法变更为下述的第1变形例、第2变形例或第3变形例时,也能够实现为一种实施方式。
使用图26说明第1变形例。图26是表示第1变形例的插补图像的生成方法的图。第1变形例表示编码/解码对象帧是存在于参照帧之间的一个B图片的情况。在图26中,fn表示编码/解码对象帧,fn-1表示显示顺序在前、而且位于最接近编码/解码对象帧的位置的已编码/解码的参照帧,fn+1表示显示顺序在后、而且位于最接近编码/解码对象帧的位置的已编码/解码的参照帧。
在第1变形例中,按照以下所述执行运动矢量MV(u,v)的估计方法和插补像素值fn(x,y)的计算方法。
第1变形例中的运动估计按照块单位进行。例如,在帧fn-1中从左上端开始运动估计,在帧fn+1中从右下端开始运动估计,左右上下对称地进行估计。计算两个块的绝对误差之和(SAD)的合计值,选择SAD为最小、而且MV为最小的块的组合。在此,例如在1/4像素精度平面中进行运动估计。在1/4像素精度平面中,运动估计的块尺寸为64×64像素,把其中跳过4像素的16像素用作采样点。运动估计范围以编码对象块的中心为基准。
关于第1变形例中的编码/解码对象帧内的插补像素值fn(x,y)的计算,使用帧fn-1和帧fn+1之间的运动矢量MV(u,v),根据下式6进行计算。
式6
f n ( x , y ) = { f n - 1 ( x - 1 2 u , y - 1 2 v ) + f n + 1 ( x + 1 2 u , y + 1 2 v ) } / 2
在式6中,利用作为MV(u,v)的起始点和终止点的参照帧fn-1和参照帧fn+1上的像素的平均值,计算fn(x,y)。这是因为在第1变形例中,编码/解码对象帧是一个位于多个参照帧的中央的B图片,其距两个参照帧的时间距离相等。另外,在距两个参照帧的时间距离有偏差的情况下,可以根据该偏差对在式6中向u和v乘以的系数1/2进行变更。该情况时,距参照帧的时间距离越近,该系数越小。此时,还可以向参照帧fn-1上的像素值和参照帧fn+1上的像素值分别乘以对应于时间距离而偏差的系数。该情况时,距参照帧的时间距离越近,该系数越大。
以上是第1变形例的运动矢量MV(u,v)的估计方法和插补像素值fn(x,y)的计算方法。
下面,使用图27说明第2变形例。第2变形例表示编码/解码对象帧是存在于参照帧之间的两个B图片中的任一图片的情况。该情况时,对所存在的这两个B图片只进行一次运动估计。在图27(a)中,fn表示第1编码/解码对象帧,fn+1表示第2编码/解码对象帧,fn-1表示显示顺序在前、而且位于最接近编码/解码对象帧的位置的已编码/解码的参照帧,fn+2表示显示顺序在后、而且位于最接近编码/解码对象帧的位置的已编码/解码的参照帧,fc表示虚拟的中心图片。
在第2变形例中,按照以下所述执行运动矢量MV(u,v)的估计方法、和第1编码/解码对象帧的插补像素值fn(x,y)及第2编码/解码对象帧的插补像素值fn+1(x,y)的计算方法。
首先,第2变形例中的运动估计的运动估计范围的中心,是把虚拟中心图片fc的编码/解码对象帧位置(x,y)定义为中心。关于运动矢量MV(u,v)的计算的其他具体情况,与第1变形例相同,所以省略说明。
关于第1编码/解码对象帧的插补像素值fn(x,y)和第2编码/解码对象帧的插补像素值fn+1(x,y),可以使用帧fn-1和帧fn+2之间的运动矢量MV(u,v),分别利用下式7和式8进行计算。
式7
f n ( x , y ) = { 2 f n - 1 ( x - 1 3 u , y - 1 3 v ) + f n + 2 ( x + 2 3 u , y + 2 3 v ) } / 3
式8
f n + 1 ( x , y ) = { f n - 1 ( x - 2 3 u , y - 2 3 v ) + 2 f n + 2 ( x + 1 3 u , y + 1 3 v ) } / 3
使用图27(b)说明式7的计算方法。图27(b)是平面地表示图27(a)的示例。在此,表示使用通过把虚拟的中心图片fc的位置(x,y)作为基准的运动估计而算出的运动矢量MV(u,v),计算第1编码/解码对象帧fn的位置(x,y)上的像素值的情况。在图27(b)的示例中,第1编码/解码对象帧fn处于在从参照帧fn-1到参照帧fn+2的时间距离中、相距参照帧fn-1为1/3相距参照帧fn+2为2/3的位置。因此,在式7中,把第1编码/解码对象帧fn的位置(x,y)作为基准,对于使用向运动矢量MV乘以1/3后的1/3MV来表示的参照帧fn-1上的像素的像素值、和使用向运动矢量MV乘以2/3后的2/3MV来表示的参照帧fn+2上的像素的像素值,乘以与各自相距参照帧的时间距离对应的加权系数并相加,由此,计算第1编码/解码对象帧fn(x,y)的像素值。其中,只要距参照帧的时间距离越近,该加权系数越大即可,在图27(b)的示例中,向参照帧fn-1上的像素的像素值乘以2/3,向参照帧fn+2上的像素的像素值乘以1/3。
下面,图27(c)表示式8的计算方法。在式8的计算方法中,也使用运动矢量MV(u,v),并且,把第2编码/解码对象帧fn+1的位置(x,y)作为基准,使用根据从编码/解码对象帧到参照帧的时间距离向运动矢量MV(u,v)乘以系数后的运动矢量,来选择参照帧上的像素,而且,向所选择的像素值乘以与距参照帧的时间距离对应的加权系数并相加,这三点都与式7的计算方法相同。图27(c)相对于图27(b)的不同之处仅仅是从编码/解码对象帧到参照帧的时间距离的关系不同,由此向运动矢量MV(u,v)乘以的系数也不同,所以省略具体说明。
另外,像第2变形例这样,当参照帧之间存在两个B图片时,在B图片的时间位置不是将参照帧之间三等分之后的位置时,也可以根据距参照帧的时间距离来变更系数。
以上是第2变形例的运动矢量MV(u,v)的估计方法、和第1编码/解码对象帧的插补像素值fn(x,y)及第2编码/解码对象帧的插补像素值fn+1(x,y)的计算方法。
即,根据第2变形例,通过一次运动估计,即可对位于参照帧之间的两个编码/解码对象帧上处于相同位置的每个像素,计算插补像素值。
下面,使用图28说明第3变形例。第3变形例是将第1变形例和第2变形例普通化(一般化)后形成的示例,表示在两个参照帧之间存在m个B图片的情况。在图28中,在参照帧fA和参照帧fB之间插入有从f1(第1个B图片)到fm(第m个B图片)的m个B图片。其中,fc是虚拟的中心图片,并且与第2变形例相同,被作为计算运动矢量MV(u,v)时的基准。
在第3变形例中,可以根据式9计算图28所示的第k个B图片fk是编码/解码对象帧时的插补像素值fk(x,y)。
式9
f k ( x , y ) = { ( m + 1 - k ) × f A ( x - k m + 1 u , y - k m + 1 v ) + k × f B ( x + m + 1 - k m + 1 u , y + m + 1 - k m + 1 v ) } / ( m + 1 )
在式9的计算方法中,也使用运动矢量MV(u,v),并且,把编码/解码对象帧fk的位置(x,y)作为基准,使用根据从编码/解码对象帧到参照帧的时间距离向运动矢量MV(u,v)乘以系数后的运动矢量来选择参照帧上的像素,而且,向所选择的像素值乘以与距参照帧的时间距离对应的加权系数并相加,这三点都与式7或式8的计算方法相同。
以上是第3变形例的编码/解码对象帧的插补像素值fk(x,y)的计算方法。
即,根据第3变形例,通过一次运动估计,即可对位于参照帧之间的m个编码/解码对象帧上处于相同位置的每个像素,计算插补像素值。
在以上的实施例中说明的插补图像帧、插补图像区域、插补图像模式、插补图像模式块,都是通过基于参照图像间的运动预测的插补处理来生成插补图像,所以可以分别表述为参照图像间运动预测帧、参照图像间运动预测区域、参照图像间运动预测模式、参照图像间运动预测模式块。
并且,在以上的实施例中说明的使用了插补图像的图像编码/图像解码技术、即基于参照图像间运动预测的图像编码/图像解码技术,相比现有技术,其效果如下所述。
即,在H.264/AVC中的双向运动补偿预测中,采用根据已编码的块的运动信息来预测生成运动信息的跳跃(skip)模式和直接(direct)模式。跳跃模式和直接模式不需要传输运动信息,所以是对削减编码量有效的技术。但是,跳跃模式和直接模式有时运动信息的预测精度会下降。例如,在利用时间方向的运动信息的相关性的时间直接模式中,利用和在显示顺序中位于编码对象图像后方最近的参照图像内的编码对象块处于相同位置的块(锚定块:anchor block)的运动矢量,在锚定块被实施画面内编码的图像中,将不能获取运动信息,所以预测精度下降。并且,在利用空间方向的运动信息的相关性的空间直接模式中,利用编码对象块的周边块的运动矢量,在周边块分别进行不同的运动的图像中,运动信息的空间相关性下降,所以预测精度下降。
与此相对,在以上各个实施例中说明的使用了插补图像的图像编码/图像解码技术、即基于参照图像间运动预测的图像编码/图像解码技术中,检测在前向参照图像和后向图像之间相关性较高的块,并使用该检测到的运动矢量。因此,即使是作为在跳跃模式或直接模式中容易产生预测精度下降的图像的、编码对象帧在运动的图像、而且是锚定块被实施了画面内编码的图像,也能够抑制预测精度的下降。
并且,同样,在以上各个实施例中说明的使用了插补图像的图像编码/图像解码技术中,在预测运动矢量时,不使用编码对象块的周边块的运动矢量。因此,即使是作为在跳跃模式或直接模式中容易产生预测精度下降的图像的、周边块分别进行不同的运动的图像,也能够抑制预测精度的下降。
即,根据本发明的各个实施例的图像编码、图像解码技术,相比以往的跳跃模式或直接模式,更能适合于实现数据压缩率的提高。

Claims (20)

1.一种图像解码方法,是动态图像的解码方法,其特征在于,
包括:
运动估计步骤,对于解码对象帧的解码对象区域,使用已解码的多个帧的图像进行运动估计;和
判定步骤,根据所述运动估计的结果,判定是通过插补处理来生成所述解码对象区域的图像、还是通过使用了编码流中包含的数据的运动补偿来生成解码图像。
2.根据权利要求1所述的图像解码方法,其特征在于,
包括如下步骤:在所述判定步骤中对所述解码对象区域的图像判定为通过使用了编码流中包含的数据的运动补偿来生成解码图像的情况下,根据与所述解码对象帧的解码对象区域邻接的多个图像区域中的每个图像区域是在编码时作为编码图像区域而被处理的区域、还是在编码时作为插补图像区域而被处理的区域,变更预测矢量的计算方法,来进行运动补偿,并生成解码图像。
3.根据权利要求1所述的图像解码方法,其特征在于,
包括如下步骤:在所述判定步骤中对所述解码对象区域的图像判定为通过使用了编码流中包含的数据的运动补偿来生成解码图像、而且与所述解码对象帧的解码对象区域邻接的多个图像区域都是在编码时作为插补图像区域而被处理的区域的情况下,根据在所述邻接的多个图像区域的解码时的插补处理中使用的运动矢量来计算预测矢量,使用该预测矢量来进行运动补偿,并生成解码图像。
4.根据权利要求1所述的图像解码方法,其特征在于,
包括如下步骤:在所述判定步骤中对所述解码对象区域的图像判定为通过使用了编码流中包含的数据的运动补偿来生成解码图像、而且与所述解码对象帧的解码对象区域邻接的多个图像区域都是在编码时作为插补图像区域而被处理的区域的情况下,计算在所述邻接的多个图像区域的解码时的插补处理中使用的运动矢量的中间值矢量,作为预测矢量,使用该预测矢量来进行运动补偿,并生成解码图像。
5.根据权利要求1所述的图像解码方法,其特征在于,
包括如下步骤:在所述判定步骤中对所述解码对象区域的图像判定为通过使用了编码流中包含的数据的运动补偿来生成解码图像、而且与所述解码对象帧的解码对象区域邻接的多个图像区域中的一部分是在编码时作为编码图像区域而被处理的区域、所述邻接的多个图像区域中的剩余图像区域是在编码时作为插补图像区域而被处理的区域的情况下,根据在所述编码时作为编码图像区域而被处理的区域中在解码时的运动补偿中使用的运动矢量、和在所述编码时作为插补图像区域而被处理的区域中在解码时的插补处理中使用的运动矢量,计算预测矢量,使用该预测矢量来进行运动补偿,并生成解码图像。
6.根据权利要求1所述的图像解码方法,其特征在于,
包括如下步骤:在所述判定步骤中对所述解码对象区域的图像判定为通过使用了编码流中包含的数据的运动补偿来生成解码图像、而且与所述解码对象帧的解码对象区域邻接的多个图像区域中的一部分是在编码时作为编码图像区域而被处理的区域、所述邻接的多个图像区域中的剩余图像区域是在编码时作为插补图像区域而被处理的区域的情况下,根据在所述编码时作为编码图像区域而被处理的区域中在解码时的运动补偿中使用的运动矢量、和在所述编码时作为插补图像区域而被处理的区域中在解码时的插补处理中使用的运动矢量,计算中间值矢量作为预测矢量,使用该预测矢量来进行运动补偿,并生成解码图像。
7.根据权利要求1所述的图像解码方法,其特征在于,
包括插补图像生成步骤,该插补图像生成步骤为:在所述判定步骤中判定为通过插补处理来生成所述解码对象区域的图像的情况下,对于所述解码对象区域的图像,使用在所述运动估计步骤中使用的所述已解码的多个帧的图像上的像素值,计算所述解码对象区域的图像上的像素值,来生成所述解码对象区域的插补图像。
8.根据权利要求1所述的图像解码方法,其特征在于,
在所述运动估计步骤中,计算在时间空间上与所述解码对象区域中包含的对象像素位于同一直线上、并且位于所述已解码的多个帧的图像上的多个像素之间的像素值的绝对差,对所述解码对象区域中包含的像素计算该像素值的绝对差之和,将该绝对差之和为最小的运动矢量、以及所述最小的绝对值之和作为运动矢量估计结果,
在所述判定步骤中,通过所述最小的绝对值之和与预定值之间的比较,判定是否通过插补处理来生成所述解码对象区域的图像。
9.根据权利要求1所述的图像解码方法,其特征在于,
在所述运动估计步骤中,计算在时间空间上与所述解码对象区域中包含的对象像素位于同一直线上、并且位于所述已解码的多个帧的图像上的多个像素之间的像素值差,对所述解码对象区域中包含的像素计算该像素值的绝对差之和,确定所述绝对差之和为最小的运动矢量,计算差分的绝对值之和,该差分是所述最小的绝对值之和与所述解码对象区域的周边区域的绝对值之和的差分,并将所述运动矢量、以及所述最小的绝对值之和与所述解码对象区域的周边区域的绝对值之和的差分的绝对值之和,作为运动矢量估计结果,
在所述判定步骤中,通过所述最小的绝对值之和与所述解码对象区域的周边区域的绝对值之和的差分的绝对值之和、与预定值之间的比较,判定是否通过插补处理来生成所述解码对象区域的图像。
10.根据权利要求1所述的图像解码方法,其特征在于,
在所述运动估计步骤中,根据编码流中包含的运动估计方法判定标志,来确定运动估计的时间方向。
11.一种图像解码方法,是动态图像的解码方法,其特征在于,
包括:
判定步骤,根据编码流中包含的模式判定标志,判定是通过使用了已解码图像的插补处理来生成解码对象区域的图像、还是通过使用了编码流中包含的数据的运动补偿处理来生成解码图像;和
图像生成步骤,根据所述判定步骤的判定结果,对使用了已解码图像的插补处理和使用了编码流中包含的数据的运动补偿处理进行切换,并生成解码图像。
12.根据权利要求11所述的图像解码方法,其特征在于,
在所述判定步骤中对所述解码对象区域的图像判定为通过使用了编码流中包含的数据的运动补偿来生成解码图像的情况下,在所述图像生成步骤中,根据与所述解码对象帧的解码对象区域邻接的多个图像区域中的每个图像区域是在编码时作为编码图像区域而被处理的区域、还是在编码时作为插补图像区域而被处理的区域,变更预测矢量的计算方法,来进行运动补偿,并生成解码图像。
13.根据权利要求11所述的图像解码方法,其特征在于,
在所述判定步骤中对所述解码对象区域的图像判定为通过使用了编码流中包含的数据的运动补偿来生成解码图像、而且与所述解码对象帧的解码对象区域邻接的多个图像区域都是在编码时作为插补图像区域而被处理的区域的情况下,在所述图像生成步骤中,根据在所述邻接的多个图像区域的解码时的插补处理中使用的运动矢量来计算预测矢量,使用该预测矢量来进行运动补偿,并生成解码图像。
14.根据权利要求11所述的图像解码方法,其特征在于,
在所述判定步骤中对所述解码对象区域的图像判定为通过使用了编码流中包含的数据的运动补偿来生成解码图像、而且与所述解码对象帧的解码对象区域邻接的多个图像区域中的一部分是在编码时作为编码图像区域而被处理的区域、所述邻接的多个图像区域中的剩余图像区域是在编码时作为插补图像区域而被处理的区域的情况下,在所述图像生成步骤中,根据在所述编码时作为编码图像区域而被处理的区域中在解码时的运动补偿中使用的运动矢量、和在所述编码时作为插补图像区域而被处理的区域中在解码时的插补处理中使用的运动矢量,计算预测矢量,使用该预测矢量来进行运动补偿,并生成解码图像。
15.根据权利要求11所述的图像解码方法,其特征在于,
在所述判定步骤中判定为通过使用了已解码图像的插补处理来生成所述解码对象区域的图像的情况下,在所述图像生成步骤中,根据编码流中包含的运动估计方法判定标志来确定运动估计方法,并根据该确定的运动估计方法,使用已解码的多个帧的图像来进行运动估计,根据通过该运动估计而确定的运动矢量所表示的所述已解码的多个帧上的像素的像素值,计算插补对象像素的像素值,并生成插补图像。
16.一种图像解码方法,是动态图像的解码方法,其特征在于,
编码流中包含第1标志和第2标志,该第1标志表示在解码对象区域中通过使用了已解码图像的插补处理生成的图像块连续存在的数量,该第2标志表示对解码对象区域的图像块通过使用了编码流中包含的数据的运动补偿处理来生成解码图像,
该图像解码方法包括:
判定步骤,从所述编码流中检测标志,并判定所检测出的标志是第1标志还是第2标志;和
图像生成步骤,根据所述判定步骤的判定结果,对以下两个处理进行切换并生成解码图像,这两个处理是:对第1标志所对应的多个图像块进行的使用了已解码图像的插补处理,和对第2标志所对应的多个图像块进行的使用了编码流中包含的数据的运动补偿处理。
17.根据权利要求1所述的图像解码方法,其特征在于,
包括插补图像生成步骤,该插补图像生成步骤为:
在所述已解码的多个帧之间存在1个B图片,该B图片是所述解码对象帧,而且在所述判定步骤中判定为通过插补处理来生成所述解码对象区域的图像的情况下,
使用在所述运动估计步骤中所使用的所述已解码的多个帧的图像上的多个像素值的平均值、或者对该多个像素值中的每一个像素值乘以系数之后的值,来计算所述解码对象区域的图像上的像素值,并生成所述解码对象区域的插补图像,其中所述系数与从所述解码对象帧到所述已解码的多个帧中的每一个帧的距离相对应。
18.根据权利要求1所述的图像解码方法,其特征在于,
包括插补图像生成步骤,该插补图像生成步骤为:
在所述已解码的多个帧之间存在m个B图片,该m个B图片中的一个图片是所述解码对象帧,而且在所述判定步骤中判定为通过插补处理来生成所述解码对象区域的图像的情况下,
使用对在所述运动估计步骤中所使用的所述已解码的多个帧的图像上的多个像素值中的每一个像素值乘以系数之后的值,来计算所述解码对象区域的图像上的像素值,并生成所述解码对象区域的插补图像,其中所述系数与从所述解码对象帧到所述已解码的多个帧中的每一个帧的距离相对应。
19.根据权利要求11所述的图像解码方法,其特征在于,
包括插补图像生成步骤,该插补图像生成步骤为:
在所述已解码的多个帧之间存在1个B图片,该B图片是所述解码对象帧,而且在所述判定步骤中判定为通过插补处理来生成所述解码对象区域的图像的情况下,
使用在所述运动估计步骤中所使用的所述已解码的多个帧的图像上的多个像素值的平均值、或者对该多个像素值中的每一个像素值乘以系数之后的值,来计算所述解码对象区域的图像上的像素值,并生成所述解码对象区域的插补图像,其中所述系数与从所述解码对象帧到所述已解码的多个帧中的每一个帧的距离相对应。
20.根据权利要求11所述的图像解码方法,其特征在于,
包括插补图像生成步骤,该插补图像生成步骤为:
在所述已解码的多个帧之间存在m个B图片,该m个B图片中的一个图片是所述解码对象帧,而且在所述判定步骤中判定为通过插补处理来生成所述解码对象区域的图像的情况下,
使用对在所述运动估计步骤中所使用的所述已解码的多个帧的图像上的多个像素值中的每一个像素值乘以系数之后的值,来计算所述解码对象区域的图像上的像素值,并生成所述解码对象区域的插补图像,其中所述系数与从所述解码对象帧到所述已解码的多个帧中的每一个帧的距离相对应。
CN2009102249323A 2008-11-26 2009-11-26 图像解码方法 Active CN101742331B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2008300342 2008-11-26
JP300342/2008 2008-11-26
JP089678/2009 2009-04-02
JP2009089678A JP5325638B2 (ja) 2008-11-26 2009-04-02 画像復号化方法

Publications (2)

Publication Number Publication Date
CN101742331A true CN101742331A (zh) 2010-06-16
CN101742331B CN101742331B (zh) 2013-01-16

Family

ID=41820402

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009102249323A Active CN101742331B (zh) 2008-11-26 2009-11-26 图像解码方法

Country Status (5)

Country Link
US (1) US8798153B2 (zh)
EP (2) EP2466893A1 (zh)
JP (1) JP5325638B2 (zh)
CN (1) CN101742331B (zh)
BR (1) BRPI0904534A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103416064A (zh) * 2011-03-18 2013-11-27 索尼公司 图像处理设备、图像处理方法和程序

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4518111B2 (ja) * 2007-07-13 2010-08-04 ソニー株式会社 映像処理装置、映像処理方法、及びプログラム
EP3913923A1 (en) 2010-01-19 2021-11-24 Samsung Electronics Co., Ltd. Method and apparatus for encoding/decoding images using a motion vector of a previous block as a motion vector for the current block
WO2011142221A1 (ja) * 2010-05-11 2011-11-17 シャープ株式会社 符号化装置、および、復号装置
CN102972027B (zh) * 2010-05-13 2016-12-21 夏普株式会社 预测图像生成装置、动图像解码装置、动图像编码装置以及预测图像生成方法
JPWO2012147621A1 (ja) * 2011-04-28 2014-07-28 ソニー株式会社 符号化装置および符号化方法、並びに、復号装置および復号方法
TW201345262A (zh) * 2012-04-20 2013-11-01 Novatek Microelectronics Corp 影像處理電路及影像處理方法
CN103634606B (zh) * 2012-08-21 2015-04-08 腾讯科技(深圳)有限公司 视频编码方法和装置
US9524008B1 (en) * 2012-09-11 2016-12-20 Pixelworks, Inc. Variable frame rate timing controller for display devices
JP2014082541A (ja) * 2012-10-12 2014-05-08 National Institute Of Information & Communication Technology 互いに類似した情報を含む複数画像のデータサイズを低減する方法、プログラムおよび装置
WO2018142596A1 (ja) * 2017-02-03 2018-08-09 三菱電機株式会社 符号化装置、符号化方法および符号化プログラム
US11032541B2 (en) * 2018-10-22 2021-06-08 Tencent America LLC Method and apparatus for video coding
CN112738527A (zh) * 2020-12-29 2021-04-30 深圳市天视通视觉有限公司 一种视频解码检测方法、装置、电子设备及存储介质

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6907073B2 (en) 1999-12-20 2005-06-14 Sarnoff Corporation Tweening-based codec for scaleable encoders and decoders with varying motion computation capability
US6816552B2 (en) 2001-07-11 2004-11-09 Dolby Laboratories Licensing Corporation Interpolation of video compression frames
JP2004007379A (ja) * 2002-04-10 2004-01-08 Toshiba Corp 動画像符号化方法及び動画像復号化方法
PT1486065E (pt) 2002-03-15 2016-03-30 Nokia Technologies Oy Método para codificação de movimento numa sequência de vídeo
JP2003333540A (ja) 2002-05-13 2003-11-21 Hitachi Ltd フレームレート変換装置及びそれを用いた映像表示装置、テレビジョン放送受信装置
JP2004023458A (ja) * 2002-06-17 2004-01-22 Toshiba Corp 動画像符号化/復号化方法及び装置
CN100438609C (zh) * 2002-10-22 2008-11-26 皇家飞利浦电子股份有限公司 带有降质的图像处理单元
US8160143B2 (en) * 2004-02-03 2012-04-17 Panasonic Corporation Decoding device, encoding device, interpolation frame creating system, integrated circuit device, decoding program, and encoding program
JP4854046B2 (ja) 2005-04-06 2012-01-11 トムソン ライセンシング エンハンスメント層ビデオ・データを符号化する方法および装置
JP2007082030A (ja) 2005-09-16 2007-03-29 Hitachi Ltd 映像表示装置
US8750387B2 (en) * 2006-04-04 2014-06-10 Qualcomm Incorporated Adaptive encoder-assisted frame rate up conversion
JP2008135980A (ja) 2006-11-28 2008-06-12 Toshiba Corp 補間フレーム作成方法および補間フレーム作成装置
JP2008277932A (ja) 2007-04-26 2008-11-13 Hitachi Ltd 画像符号化方法及びその装置
US20080285656A1 (en) * 2007-05-17 2008-11-20 The Hong Kong University Of Science And Technology Three-loop temporal interpolation for error concealment of multiple description coding
JP2009071809A (ja) * 2007-08-20 2009-04-02 Panasonic Corp 映像表示装置ならびに補間画像生成回路および方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103416064A (zh) * 2011-03-18 2013-11-27 索尼公司 图像处理设备、图像处理方法和程序

Also Published As

Publication number Publication date
EP2192782A2 (en) 2010-06-02
US8798153B2 (en) 2014-08-05
BRPI0904534A2 (pt) 2011-02-08
EP2192782A3 (en) 2011-01-12
CN101742331B (zh) 2013-01-16
EP2466893A1 (en) 2012-06-20
JP2010154490A (ja) 2010-07-08
US20100128792A1 (en) 2010-05-27
JP5325638B2 (ja) 2013-10-23

Similar Documents

Publication Publication Date Title
CN101742331B (zh) 图像解码方法
US9749653B2 (en) Motion vector encoding/decoding method and device and image encoding/decoding method and device using same
CA2797569C (en) Method and device for video predictive encoding
TWI468019B (zh) 解碼影像的方法
CN101595735B (zh) 对视频进行编码和解码的方法和设备
US8259805B2 (en) Method and apparatus for generating coded picture data and for decoding coded picture data
US8824553B2 (en) Video compression method
RU2518435C2 (ru) Оптимизация кодера в системах доставки стереоскопического видео
CN1156167C (zh) 运动图象编码方法和运动图象编码设备
CN103782596A (zh) 使用图像的亮度分量的对图像的色度分量的预测方法和设备
CN103238334A (zh) 图像帧内预测方法和设备
CN102084655A (zh) 通过过滤器选择进行的视频编码
US8855206B2 (en) Method and device for encoding a sequence of images implementing a temporal prediction, corresponding signal, data storage medium, method and decoding device and computer program products
CN1794816B (zh) 运动图像压缩编码方法、运动图像压缩编码装置以及程序
CN1695381A (zh) 在数字视频信号的后处理中使用编码信息和局部空间特征的清晰度增强
JP4391810B2 (ja) 画像のシーケンスを適応的に符号化するシステムおよび方法
JP2006279917A (ja) 動画像符号化装置、動画像復号装置及び動画像伝送システム
JP2001285881A (ja) ディジタル情報変換装置および方法、並びに画像情報変換装置および方法
CN100586185C (zh) 一种h.264视频降低分辨率转码的模式选择方法
JP4078906B2 (ja) 画像信号の処理装置および処理方法、画像表示装置、それに使用される係数データの生成装置および生成方法、並びに各方法を実行するためのプログラムおよびそのプログラムを記録したコンピュータ読み取り可能な媒体
CN103004200A (zh) 使用扩展的块滤波对视频编码和解码的方法和设备
CN103188490A (zh) 视频编码中的合并补偿模式
CN102132567A (zh) 图像显示装置、录像再生装置、以及图像处理方法
JP4113696B2 (ja) 動画像可逆符号化方法とその復号化方法、及びそれらの装置
Wu et al. Combined adaptive-fixed interpolation with multi-directional filters

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: HITACHI MAXELL LTD.

Free format text: FORMER OWNER: HITACHI LTD.

Effective date: 20150326

C41 Transfer of patent application or patent right or utility model
C56 Change in the name or address of the patentee
CP02 Change in the address of a patent holder

Address after: Kanagawa, Japan

Patentee after: Hitachi Consumer Electronics Co.,Ltd.

Address before: Tokyo, Japan

Patentee before: Hitachi Consumer Electronics Co.,Ltd.

TR01 Transfer of patent right

Effective date of registration: 20150326

Address after: Osaka Japan

Patentee after: Hitachi Maxell, Ltd.

Address before: Kanagawa, Japan

Patentee before: Hitachi Consumer Electronics Co.,Ltd.

TR01 Transfer of patent right

Effective date of registration: 20180125

Address after: Kyoto Japan

Patentee after: MAXELL, Ltd.

Address before: Osaka Japan

Patentee before: Hitachi Maxell, Ltd.

TR01 Transfer of patent right
CP01 Change in the name or title of a patent holder

Address after: Kyoto Japan

Patentee after: MAXELL, Ltd.

Address before: Kyoto Japan

Patentee before: MAXELL HOLDINGS, Ltd.

CP01 Change in the name or title of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20220601

Address after: Kyoto Japan

Patentee after: MAXELL HOLDINGS, Ltd.

Address before: Kyoto, Japan

Patentee before: MAXELL, Ltd.

TR01 Transfer of patent right