CN1794816B - 运动图像压缩编码方法、运动图像压缩编码装置以及程序 - Google Patents

运动图像压缩编码方法、运动图像压缩编码装置以及程序 Download PDF

Info

Publication number
CN1794816B
CN1794816B CN2005101322588A CN200510132258A CN1794816B CN 1794816 B CN1794816 B CN 1794816B CN 2005101322588 A CN2005101322588 A CN 2005101322588A CN 200510132258 A CN200510132258 A CN 200510132258A CN 1794816 B CN1794816 B CN 1794816B
Authority
CN
China
Prior art keywords
signal
predictive mode
prediction
block size
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2005101322588A
Other languages
English (en)
Other versions
CN1794816A (zh
Inventor
渡边一辉
小泽一范
出井洋明
小山和広
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN1794816A publication Critical patent/CN1794816A/zh
Application granted granted Critical
Publication of CN1794816B publication Critical patent/CN1794816B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明提供一种在帧内预测中可以高速处理使用编码效率高的评价尺度的模式选择的装置和方法。该装置中包括:根据由预测信息生成器(103)生成的预测信号和输入运动图像压缩编码装置中的运动图像信号(12)的差量信息来生成代价值的代价计算机(104);根据代价值来至少选择两种预测模式并输出给代价计算机(106)的预选器(105);关于从预选器(105)中输出的预测模式,对差量信息进行频率转换从而生成新代价值的代价计算机(106);以及根据所述频率转换后的代价值来选择最优预测模式的预测模式选择器(107)。

Description

运动图像压缩编码方法、运动图像压缩编码装置以及程序
技术领域
本发明涉及运动图像压缩编码技术,特别是涉及使用多种类的评价值来选择帧内预测的模式并进行编码的运动图像压缩编码方法和装置、以及程序。
背景技术
在H.264/MPEG-4Part 10(ISO/IEC 14496-10)(称为“H.264”)(非专利文献1)中,帧内预测关于亮度分量的4×4块和16×16块,分别有9种和4种预测模式。另外,关于色差分量的8×8块,有4种预测模式。
作为选择帧内预测的预测模式的评价尺度,在进行H.264的标准化工作的JVT(Joint Video Team,联合视频组)的会议集锦JVT-I049d0.doc(非专利文献2)中,提出了
(a)生成被输入运动图像压缩编码系统中的运动图像信号和从预测信号生成系统中输出的预测信号的差量信息的代价值的SAD(Sum ofAbsolute Difference:绝对差值求和);以及
(b)对于所有的模式,通过对所述差量信息进行哈达玛变换(Hadamard Transform)来生成代价值的SATD(Sum of AbsoluteTransformed Difference:绝对变换差值求和)。
在作为JVT标准化工作的一环而开发的H.264的参考软件(JiontModel:以下称为“JM”)中,在帧内预测模式的选择中采用SAD和SATD,选择预测模式时的代价值全部通过SAD或SATD中的一个来求出。
另外,以往公知有选择预测方式和块大小的技术(例如专利文献1、2)。在专利文献1中公开了下述的运动图像预测编码方式:对于各种块大小的块,通过彼此不同的多种预测方法求出预测误差,并用第一评价方式来评价各个预测误差,从而自适应地选择适于该块的预测方法和预测误差,使用第二评价方式来评价通过第一评价方式得到的各种块大小的预测误差,由此按运动图像各个部位自适应地选择最适于编码的块大小。另外,在专利文献2中公开了下述的运动图像预测编码方式:向接收侧传输块大小信息和预测方式的类型,并根据DCT计算结果检测出平坦部分和变化剧烈的部分,然后根据平坦或变化剧烈的部分增大或缩小块大小,从而可以选择出对于画面的平坦部分、变化剧烈的部分来说最优的块大小。此外,在专利文献3中公开了由于根据画面的局部性质而自适应地切换预测方法,从而提高了整体的传输效率的运动图像预测编码方式。另外,在专利文献4中公开了具有下述单元的结构:第一编码单元,求出每个图像数据块的近似面,并对特定近似面的信息以及该近似面与块的差值进行编码;第二编码单元,根据每个块从多种预测方式中选择预测方式,并根据选中的预测方式进行编码;以及为每个块从第一编码单元和第二编码单元中选择一个编码单元的单元。
但是,在专利文献1至3等中记载的技术中,作为帧内预测方式的评价尺度仅使用了SAD。因此,与使用SATD进行帧内预测的时候相比,编码效率明显变差。
专利文献1:日本专利第2608909号公报;
专利文献2:日本专利第2702139号公报;
专利文献3:日本专利第2716703号公报;
专利文献4:日本专利特开平9-9265号公报;
非专利文献1:H.264/MPEG-4 Part 10(ISO/IEC 14496-10)因特网<URL:http://www.itu.Int/rec/recommendation.asp?type=item&|ang=e&parent=T-REC-H.264-200305-I>;
非专利文献2:JVT-I049d0.doc因特网<ftp://standards.polycom.com/2003_09_SanDiego/>。
如上所述的现有的运动图像压缩编码方式存在以下的问题。
第一个问题是:关于帧内预测方式,如果仅通过输入信号和预测信号的差量信息(SAD)来进行模式选择,编码效率就会很差。
这是因为,通过运动图像压缩编码方式而编码的数据,对输入信号和预测信号的差量信息转换了频率,所以仅用该差量信息来作为评价编码效率的尺度的话,精度不高。
第二个问题是:当为了提高编码效率而使用对差量信息进行频率转换并计算代价的SATD时,用于选择最优模式的处理量非常大。
这是因为,由于在帧内预测中多种块大小的每一种均有多种预测模式,所以当选择最优的预测模式时,需要对于所有的模式计算出对所述差量信息进行频率转换后的值。
发明内容
因此,本发明的目的在于,提供一种可以提高帧内预测器的编码效率的运动图像压缩编码装置和方法、以及程序。
本发明的另一目的在于,提供一种具有能够高速进行处理的帧内预测器的运动图像压缩编码装置和方法、以及程序。
为了达到上述目的,本发明大体上采用以下结构。
本发明一方面涉及的运动图像压缩编码装置具有多级搜索预测模式的帧内预测器,更具体地说,所述帧内预测器包括:根据输入运动图像压缩编码装置中的运动图像信号和由帧内预测器生成的预测信号的差量信息来算出第一评价值的单元;根据所述第一评价值来预选多个预测模式的单元;根据所述预选的多个预测模式的差量信息来算出第二评价值的单元;以及根据所述第二评价值来从所述预选的多个预测模式中选择一个预测模式的单元。
或者,本发明另一方面涉及的运动图像压缩编码装置包括:在有多种块大小的情况下,根据输入运动图像压缩编码装置中的运动图像信号和由帧内预测器生成的预测信号的差量信息来算出第一评价值的单元;根据所述第一评价值来预选多个预测模式的单元;根据所述预选的模式的差量信息来算出第二评价值的单元;根据所述第二评价值来从所述预选的预测模式中选择一个预测模式的单元;以及根据所述第二评价值来选择最优的块大小的单元。
本发明再一方面涉及的运动图像压缩编码方法包括以下步骤:根据输入的运动图像信号和由帧内预测器生成的预测信号的差量信息来算出第一评价值;根据所述第一评价值来预选多个预测模式;根据所述预选的模式的差量信息来算出第二评价值;以及根据所述第二评价值来从所述预选的预测模式中选择一个预测模式。
本发明又一方面涉及的计算机程序是使构成运动图像压缩编码装置的计算机执行以下处理的程序:根据输入的运动图像信号和由帧内预测器生成的预测信号的差量信息来算出第一评价值;根据所述第一评价值来预选多个预测模式;根据所述预选的模式的差量信息来算出第二评价值;以及根据所述第二评价值来从所述预选的预测模式中选择一个预测模式。
发明效果
根据本实施例,当进行模式选择时,与仅用差量信息(SAD)来选择模式的方法相比,可以使编码效率大幅提高并可实现高速化。
根据本发明,在通过帧内预测器选择模式时,由于没有必要针对所有的模式进行差量信息的频率变换,所以能够大幅度地削减处理量,并且在性能上还能够提供接近SATD的高性能。
附图说明
图1是示出发明一个实施例的整体装置结构的示意图;
图2是本发明第一实施例的结构示意图;
图3是本发明第二实施例的结构示意图;
图4是本发明第三实施例的结构示意图;
图5是本发明第三实施例的部分结构示意图;
图6是本发明第三实施例的部分结构示意图;
图7是本发明第四实施例的结构示意图;
图8是本发明第五实施例的结构示意图;
图9是本发明第五实施例的结构示意图;
图10是本发明第六实施例的结构示意图;
图11是本发明的作用效果的一个例示图;
图12是本发明的作用效果的另一例示图。
具体实施方式
为了进一步详细地说明上述的本发明,下面将参考附图进行说明。
本发明一实施方式涉及的帧内预测装置包括预测信号生成器(103)和预测模式判定器(108)以及预测信号呼出装置(109)。其中,预测信号生成器(103)将下述的重建信号(13)作为输入并生成预测信号,所述重建信号(13)是对进行帧内预测的块进行编码之前已结束编码的相邻块的一部分图像信号。预测模式判定器(108)包括:代价计算机(104),其根据由预测信息生成器(103)生成的预测信号和输入到运动图像压缩编码装置中的运动图像信号的差量信息来生成代价值;预选器(105),其从帧内预测器的所有模式中根据差量信息的代价值来至少选择两个预测模式(例如代价值最小的两个以上的模式)并将选中的预测模式输出给代价计算机(106);代价计算机(106),其对于从预选器(105)中输出的预测模式,对差量信息进行频率转换从而生成新的代价值;以及预测模式选择器(107),其根据所述频率转换后的代价值来选择最优的预测模式。另外,预测信号呼出装置(109)从预测信号存储器(102)读取与从预测模式判定器(108)输出的预测模式(115)对应的预测信号,并将其作为帧内预测的结果而输出。
本发明的实施方式在具有多个帧内预测器并有多种块大小的情况下,可以是具有如下单元的结构,即:该单元利用所述帧内预测器按照每种块大小来改变预测模式判别方法,并选择预测模式,进而选择块大小。或者,也可以是具有如下单元的结构,即:该单元利用帧内预测器,按照每种块大小使用多个预测模式判别方法中的一个方法来选择预测模式,并选择块大小。下面,结合实施例来进行说明。
实施例
图1是本发明第一实施例的结构示意图。参考图1可知,运动图像信号12被输入帧内预测器1和运动矢量检测器2中。运动补偿器3根据由运动矢量检测器2检测出的运动矢量和帧存储器10的信息来进行运动补偿,开关11切换帧内预测器1和运动补偿器3的输出。由减法器15从运动图像信号12中减去开关11的输出所得的结果在DIT器4中被DIT(Discrete Integer Transform,离散整数转换)转换,并在量化器5中被量化,进而在可变长度编码器6中被进行可变长度编码。量化器5的输出在反量化器7被反量化并在反DIT器8中被反DIT转换。加法器16对反DIT器8的输出和开关11的输出进行加法运算,并将相加的结果作为重建信号13被提供给帧内预测器1和环内滤波器9,环内滤波器9的输出被存储到帧存储器10中。
图2是示出图1的帧内预测器1的详细结构的示意图。帧内预测器1具有预测信号生成器103、预测模式判定器108、以及预测信号呼出装置109。
预测信号生成器103具有输入重建信号的多个滤波器101和从多个滤波器101中分别输入预测信号110的多个预测信号存储器102。
预测模式判定器108具有代价计算机104、预选器105、代价计算机106以及预测模式选择器107。
首先,对预测信号生成器103的操作进行说明。在图2中,滤波器101分别根据存在于帧内预测器中的多种预测模式对重建信号13进行滤波处理,并将生成的预测信号110存储到预测信号存储器102中。
如非专利文献1中记载的那样,帧内预测使用以下像素来进行预测:在相邻于该块左侧的块中位于右端的4或16个像素、在相邻于该块上侧或右上侧的块中位于下端的4或16个像素、以及在相邻于该块左上侧的块中位于右下端的1个像素。
在帧内预测中例如使用:
·将相邻于左侧的块的右端的像素作为该块相同高度上的像素的预测信号的预测模式;
·将相邻于上侧的块的下端的像素作为该块相同列上的像素的预测信号的预测模式;
·将在预测中使用的像素的平均值作为该块所有的预测信号的预测模式;
·根据该块的位置对预测中使用的多个像素值进行滤波处理,从而生成预测信号的预测模式。
预测信号存储器102是用于存储从滤波器101输出的预测信号110的装置,该装置将预测信号110输出给预测模式判定器108的代价计算机104、以及预测信号呼出装置109。
重建信号13是在对进行帧内预测的块进行编码之前已结束编码的相邻块的一部分图像信号。
预测信号110是根据预测模式而使用不同的滤波器101对重建信号13进行滤波后生成的信号,或者是与重建信号13相同的值的信号。
接下来,对预测模式判定器108的操作进行说明。
代价计算机104计算预测信号110和运动图像信号12的差量信息112,并向预选器105输出代价值111。代价计算机104例如算出
Diff(i,j)=Original(i,j)-Prediction(i,j)…(1)
来作为差量信息(block difference)112。其中,Prediction(i,j)为预测信号110,Original(i,j)为运动图形信号12。
然后,代价计算机104将差量数据Diff(i,j)的绝对值之和SAD(Sum ofAbsolute Difference)(参考下式(2))作为代价值输出。
SAD=∑i,j|Diff(i,j)|           …(2)
预选器105从代价值111的差量信息小的预测模式中至少选择两种预测模式,并将选择模式113输出给代价计算机106。
代价计算机106针对从预选器105输出的与选择模式113对应的差量信息,计算出频率转换后的代价值114并将其输出给预测模式选择器107。代价计算机106算出DiffT(i,j)的绝对值之和、即SATD(Sum ofAbsolute Transformed Difference)(参考下式(3)),作为该块的代价值114,其中DiffT(i,j)是对差量数据Diff(i,j)例如利用哈达玛变换(Hadamard Transform)等而进行频率转换后得到的。
SATD=(∑i,j|DiffT(i,j)|)/2    …(3)
预测模式选择器107根据由代价计算机106输出的代价值114来选择最优的预测模式115,并将预测模式115及其代价值114作为帧内预测的结果而输出。
运动图像信号12是运动图像压缩编码装置14的输入图像信号。
预测信号呼出装置109从预测信号存储器102中读取与从预测模式判定器108输出的预测模式115对应的预测信号,并将其作为帧内预测的结果而输出。或者,在通过图1的开关11选择了帧内预测的情况下,预测信号呼出装置109从预测信号存储器102中读取与从预测模式判定器108输出的预测模式115对应的预测信号,并将其作为帧内预测的结果而输出。
在本实施例中,对两级搜索进行了说明,但通过以下方式可以扩展为三级以上:
·在第二级的搜索中选择多个模式,并从由图1的量化器5对DiffT(i,j)进行量化所得的值求出代价值,或者,
·将由图1的量化器5对DiffT(i,j)进行量化所得的值通过图1的可变长度编码器6进行编码,并从所述编码后的值求出代价值。
接下来,参考图3对本发明的第二实施方式进行详细的说明。图3示出了在帧内预测器1中有N种块大小的情况下选择块大小的部分的结构。参考图3可知,块大小选择部具有:与N种块大小对应的帧内预测器2011~201N、块大小判定器202、以及预测信号·预测模式存储器203。
块大小判定器202选择从帧内预测器2011~201N按照每种块大小所输出的代价值206最小的块大小207,并将该块大小207及其代价值206输出给预测信号·预测模式存储器203。
预测信号·预测模式存储器203按照每种块大小存储从帧内预测器2011~201N输出的预测信号204和预测模式205,并且将与从块大小判定器202输出的块大小207对应的预测信号204和预测模式205作为帧内预测结果,与代价值206和块大小207一并输出。由于帧内预测器2011~201N均具有图2所示的结构(预测信号生成器103、预测模式判定器108以及预测信号呼出装置109),并且操作也相同,所以省略说明。
接下来,参考图4和图5来详细说明本发明的第三实施方式。图4示出了在帧内预测器1中有多种块大小的情况下选择块大小的部分的结构。在本实施例中对有三种块大小和三种预测模式判别方法的情况进行说明。
块大小选择部包括:根据每种块大小而预测模式的判别方法不同的帧内预测器301、302、303;块大小判定器304;以及预测信号·预测模式存储器305。下面将说明帧内预测器301、302、303的结构和操作。
帧内预测器301、302、303根据每种块大小分别使用其中预测模式判定器不同的帧内预测器(参考图2、图5和图6)。
如图5所示,预测模式判定器407具有代价计算机404、预测模式选择器405、以及代价计算机406。预测信号生成器403与图2的相同。
代价计算机404根据输入到运动图像压缩编码装置14中的运动图像信号12和预测信号生成器403的差量信息411来计算代价值410(例如上式(2)的SAD),并输出给预测模式选择器405。
预测模式选择器405根据代价值410选择最优的预测模式412,并向代价计算机406输出预测模式412及其差量信息。
代价计算机406对预测模式412的差量信息411进行频率转换并计算代价值413,然后作为帧内预测器的结果而输出预测模式412和代价值413(例如上式(3)的SATD)。
另外,在图6所示的结构中,预测模式判定器427包括差量计算机424、代价计算机425以及预测模式选择器426。
差量计算机424计算输入到运动图像压缩编码装置14中的运动图像信号12和预测信号生成器423的输出(预测信号)的差量信息430(例如参考上式(1)),并输出给代价计算机425。
代价计算机425对所有预测模式的差量信息430(Diff(i,j))进行频率转换(例如,进行哈达玛变换得到的DiffT(i,j))并计算出代价值431(例如上式(3)的SATD),然后输出给预测模式选择器426。
预测模式选择器426根据从代价计算机425输出的代价值431来选择最优的预测模式432,并作为帧内预测器的结果而输出最优的预测模式432及其差量值431。由于上述之外的结构和操作与上述第二实施例相同,因此省略说明。
下面,参考图7来说明本发明的第四实施方式。图7示出了在帧内预测方式中有多种块大小的情况下选择块大小的部分的结构。下面,对有M=3个的预测模式判定方法并且有2种块大小的情况进行说明。
块大小选择部分包括帧内预测器501、502、块大小判定器503、以及预测信号·预测模式存储器504。
对帧内预测器501、502的结构进行说明。帧内预测器501和502可以使用图2或图5、图6所示结构中的任一种。由于上述以外的结构和操作与上述第三实施例相同,所以省略说明。
下面将参考图8说明本发明的第五实施例。图8示出了在帧内预测方式中有多种块大小的情况下选择块大小的部分的结构。在本实施例中,对预测模式选择数有2种的情况进行说明。块大小选择部分中包括预测模式的预选数根据每种块大小而不同的帧内预测器601、602、块大小判定器603以及预测信号·预测模式存储器604。
对帧内预测器601和602的结构进行说明。帧内预测器601、602使用图2或图9的帧内预测器1。
图2和图9的结构的不同点在于在预选器105和预选器625中被选择的预测模式的预选数不同。除此之外的结构和操作与第二实施例相同。
下面,将参考图10来说明本发明的第六实施例。图10示出了在帧内预测器中有多种块大小的情况下选择块大小的部分的结构。在本实施例中,对有4种块大小和3种预测模式判定方法,并且其中的进行预选的预测模式判别方法中有2种预选数的结构进行说明。块大小选择部包括根据每种块大小预测模式的预选数或预测模式判别方法有所不同的帧内预测器701、702、703、704和块大小判定器705以及预测信号·预测模式存储器706。
对帧内预测器701、702、703以及704的结构进行说明。块大小不同的帧内预测器701、702、703、704中的两个由图2和图9的帧内预测器构成。图2和图9的不同点在于预选数不同。其他块大小的帧内预测器由图5和图6的帧内预测器构成。或者,其他块大小的帧内预测器由图2、图5、图6或图8中的任一种帧内预测器构成。由于上述以外的结构和操作与前述第三或第四实施例相同,所以省略说明。
根据本实施例,当进行模式选择时,与仅用差量信息(SAD)来选择模式的方法相比,可以使编码效率大幅提高。
根据本发明,当通过帧内预测器来选择模式时,由于不需要对所有的模式进行差量信息的频率转换,所以能够大幅度地削减处理量,并且还能够提供接近SATD的高性能。
图11和图12是示出关于亮度分量,帧内预测器的块大小有4×4和16×16这2种,并且在4×4的块大小下有9种预测模式、在16×16的块大小下有4种预测模式的情况下的本发明作用效果的数据。
图11示出了有关编码效率的数据(横轴表示比特量,纵轴表示SNR(信噪比)),图12示出了横轴上的每种方法(SATD、第五实施例、第二实施例、SAD)的计算量相对于对所有的模式进行差量信息的频率转换从而进行模式选择的计算量(SATD)的削减率(纵轴)。
各个数据示出了第二和第五实施例、仅用差量信息进行模式选择的方法(SAD)、以及对所有的模式进行差量信息的频率转换从而进行模式选择的方法(SATD)。
在本发明的第二实施例中,对于4×4块、16×16块,将预选数均设2个,在第五实施例中,对于4×4块有4个预选,而对于16×16块则有2个预选。
由图11可知,在相同比特量的码流中,第二、第五实施例获得了比SAD高的SN比,从而编码效率被提高。第五实施例获得了与SATD相等的编码效率。
第二实施例获得了与SATD几乎相等的编码效率。
另外,由图12可知,第二、第五实施例与SATD相比实现了高速化。在第五实施例中可实现20%左右的高速化,在第二实施例中可实现35%左右的高速化。
以上结合上述实施例对本发明进行了说明,但是本发明不限于上述实施例的结构,当然还包括本领域技术人员在本发明的范围内能够做出的各种变形和修正。

Claims (21)

1.一种运动图像压缩编码装置,其特征在于,具有下述的帧内预测器,所述帧内预测器包括:
根据输入运动图像压缩编码装置中的运动图像信号和由帧内预测器生成的预测信号的差量信息来算出作为SAD值的单元;
根据所述SAD值来预选多个预测模式的单元;
根据所述预选的多个预测模式的差量信息来算出对所述预选的多个预测模式的差量信息进行频率转换而生成的SATD值的单元;以及
根据所述SATD值来从所述预选的多个预测模式中选择一个预测模式的单元。
2.如权利要求1所述的运动图像压缩编码装置,其特征在于,所述帧内预测器还包括:
当有多种块大小时根据输入运动图像压缩编码装置中的运动图像信号和由帧内预测器生成的预测信号的差量信息来算出SAD值的单元;以及
根据所述SATD值来选择最优的块大小的单元。
3.如权利要求1或2所述的运动图像压缩编码装置,其特征在于,包括:
当在帧内预测器中有多种块大小时,通过所述帧内预测器按照每种块大小来改变所述预测模式的判别方法并选择预测模式的单元;和
选择块大小的单元。
4.如权利要求1或2所述的运动图像压缩编码装置,其特征在于,包括:
当在帧内预测器中有多种块大小时,通过所述帧内预测器按照每种块大小使用多个所述预测模式的判别方法中的一个来选择预测模式的单元;和
选择块大小的单元。
5.如权利要求3所述的运动图像压缩编码装置,其特征在于,
所述预选的多个预测模式的预选数根据每种块大小而不同。
6.如权利要求3所述的运动图像压缩编码装置,其特征在于,
所述帧内预测器中的预测模式的预选数根据每种块大小而不同。
7.如权利要求5所述的运动图像压缩编码装置,其特征在于,
所述选择块大小的单元根据按每种块大小而从多个所述帧内预测器输出的SATD值来选择块大小,并将选择的块大小及其评价值输出给预测信号·预测模式存储器,
所述预测信号·预测模式存储器按每种块大小存储从所述帧内预测器输出的预测信号和预测模式,并且将与从所述选择块大小的单元输出的块大小对应的预测信号、预测模式作为帧内预测的结果而同评价值和块大小一并输出。
8.一种运动图像压缩编码装置,其特征在于,具有下述的帧内预测装置,所述帧内预测装置包括:
预测信号生成器,输入重建信号,生成并输出预测信号,并且将所述预测信号存储在预测信号存储器中,所述重建信号是在对进行帧内预测的块进行编码之前已结束编码的相邻块的一部分图像信号;
预测模式判定器,包括:第一代价计算机,根据在所述预测信号生成器中生成的预测信号和输入的运动图像信号的差量信息来生成SAD值;预选器,根据所述SAD值来至少选择两个预测模式并输出给第二代价计算机;第二代价计算机,关于从所述预选器输出的预测模式,通过对差量信息进行频率转换来生成SATD值;以及预测模式选择器,根据所述SATD值来选择最优的预测模式;
预测信号呼出电路,从所述预测信号存储器读取与从所述预测模式判定器输出的预测模式对应的预测信号,并作为帧内预测的结果而输出。
9.一种运动图像压缩编码装置,其特征在于,具有下述的帧内预测装置,所述帧内预测装置包括:
预测信号生成器,输入重建信号,生成并输出预测信号,并且将所述预测信号存储在预测信号存储器中,所述重建信号是在对进行帧内预测的块进行编码之前已结束编码的相邻块的一部分图像信号;
预测模式判定器,包括:第一代价计算机,根据输入的运动图像信号和所述预测信号生成器的输出的差量信息来算出SAD值并输出;预测模式选择器,根据所述SAD值来选择最优的预测模式并输出最优的预测模式及其差量信息;第二代价计算机,对所述预测模式的差量信息进行频率转换,从而计算SATD值,并将预测模式和评价值作为帧内预测器的结果而输出;
预测信号呼出电路,从所述预测信号存储器读取与从所述预测模式判定器输出的预测模式对应的预测信号,并作为帧内预测的结果而输出。
10.一种运动图像压缩编码装置,其特征在于,具有下述的帧内预测装置,所述帧内预测装置包括:
预测信号生成器,输入重建信号,生成并输出预测信号,并且将所述预测信号存储在预测信号存储器中,所述重建信号是在对进行帧内预测的块进行编码之前已结束编码的相邻块的一部分图像信号;
差量计算机,计算运动图像信号和所述预测信号生成器的输出的差量信息;
预测模式判定器,包括:代价计算机,对从所述差量计算机输出的预测模式的差量信息进行频率转换,从而计算评价值并输出;预测模式选择器,根据所述评价值来选择最优的预测模式,并输出最优的预测模式及其差量信息;
预测信号呼出电路,从所述预测信号存储器读取与从所述预测模式判定器输出的预测模式对应的预测信号,并作为帧内预测的结果而输出。
11.如权利要求8至10中任一项所述的运动图像压缩编码装置,其特征在于,还包括:
输出下述两个输出中的一个的开关,其中所述两个输出是指帧内预测装置的输出和从所述运动图像信号中检测运动矢量并进行运动补偿的单元的输出,以及
将对下述的信号进行反量化和反正交变换所得的信号与所述开关的输出进行相加,并将所述相加的结果作为所述重建信号提供给所述帧内预测装置的单元,其中所述信号是对所述运动图像信号与所述开关的输出的相减结果进行正交变换和量化之后所得的信号。
12.一种运动图像压缩编码方法,其特征在于,包括以下步骤:
根据输入的运动图像信号和由帧内预测器生成的预测信号的差量信息来算出SAD值;
根据所述SAD值来预选多个预测模式;
根据所述预选的多个预测模式的差量信息来算出对所述预选的多个预测模式的差量信息进行频率转换而生成的SATD值;以及
根据所述SATD值来从所述预选的预测模式中选择一个预测模式。
13.如权利要求12所述的运动图像压缩编码方法,其特征在于,还包括以下步骤:
当有多种块大小时,根据输入的运动图像信号和由帧内预测器生成的预测信号的差量信息来算出SAD值;以及
根据所述SATD值来选择最优的块大小。
14.如权利要求12或13所述的运动图像压缩编码方法,其特征在于,包括以下步骤:
当在帧内预测器中有多种块大小时,通过所述帧内预测器按每种块大小来改变所述预测模式的判别方法,并选择预测模式;以及
选择块大小。
15.如权利要求12或13所述的运动图像压缩编码方法,其特征在于,包括以下步骤:
当在帧内预测器中有多种块大小时,通过所述帧内预测器按每种块大小使用多个所述预测模式的判别方法中的一个方法来选择预测模式;以及
选择块大小。
16.如权利要求14所述的运动图像压缩编码方法,其特征在于,所述帧内预测器的处理步骤包括:
所述预选的多个预测模式的预选数根据每种块大小而不同。
17.如权利要求14所述的运动图像压缩编码方法,其特征在于,所述帧内预测器的处理步骤包括:
帧内预测方式的预测模式的预选数根据每种块大小而不同。
18.如权利要求16所述的运动图像压缩编码方法,其特征在于,所述选择块大小的步骤包括:
根据按每种块大小从多个所述帧内预测器中输出的SATD值来选择块大小,并将选择的块大小及其评价值输出到预测信号·预测模式存储器中的步骤;
所述预测信号·预测模式存储器按每种块大小存储从所述帧内预测器输出的预测信号和预测模式的步骤;以及
将与在所述选择块大小的步骤中选择的块大小对应的预测信号、预测模式作为帧内预测的结果与评价值和块大小一并输出的步骤。
19.一种运动图像压缩编码方法,其特征在于,运动图像压缩编码中的帧内预测包括以下步骤:
输入重建信号,生成并输出预测信号,并且将所述预测信号存储到预测信号存储器中,其中所述重建信号是在对进行帧内预测的块进行编码之前已结束编码的相邻块的一部分图像信号;
根据所述生成的预测信号和输入的运动图像信号的差量信息来生成SAD值;
根据所述SAD值来至少选择两个预测模式并输出;
关于所述输出的预测模式,对差量信息进行频率转换从而生成SATD值;
根据所述SATD值来选择最优的预测模式;以及
从所述预测信号存储器读取与所述输出的预测模式对应的预测信号,并作为帧内预测的结果而输出。
20.一种运动图像压缩编码方法,其特征在于,运动图像压缩编码中的帧内预测包括以下步骤:
输入重建信号,生成并输出预测信号,并且将所述预测信号存储到预测信号存储器中,其中所述重建信号是在对进行帧内预测的块进行编码之前已结束编码的相邻块的一部分图像信号;
根据输入的运动图像信号和所述预测信息生成器的输出的差量信息来算出SAD值并输出;
根据所述SAD值来选择最优的预测模式,并输出最优的预测模式及其差量信息;
对所述预测模式的差量信息进行频率转换,从而计算出SATD值,并将预测模式和评价值作为帧内预测器的结果而输出;以及
从所述预测信号存储器读取与所述输出的最优的预测模式对应的预测信号,并作为帧内预测的结果而输出。
21.一种运动图像压缩编码方法,其特征在于,运动图像压缩编码中的帧内预测包括以下步骤:
输入重建信号,生成并输出预测信号,并且将所述预测信号存储到预测信号存储器中,其中所述重建信号是在对进行帧内预测的块进行编码之前已结束编码的相邻块的一部分图像信号;
根据运动图像信号和所述预测信号生成器的输出的差量信息来计算SAD值;
对所述预测模式的差量信息进行频率转换,从而计算SATD值并输出;
根据所述SATD值来选择最优的预测模式,并输出最优的预测模式及其差量信息;以及
从所述预测信号存储器读取与所述输出的最优的预测模式对应的预测信号,并作为帧内预测的结果而输出。
CN2005101322588A 2004-12-22 2005-12-22 运动图像压缩编码方法、运动图像压缩编码装置以及程序 Expired - Fee Related CN1794816B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2004371112A JP4501675B2 (ja) 2004-12-22 2004-12-22 動画像圧縮符号化方法と動画像圧縮符号化装置並びにプログラム
JP2004371112 2004-12-22
JP2004-371112 2004-12-22

Publications (2)

Publication Number Publication Date
CN1794816A CN1794816A (zh) 2006-06-28
CN1794816B true CN1794816B (zh) 2010-12-22

Family

ID=36113847

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005101322588A Expired - Fee Related CN1794816B (zh) 2004-12-22 2005-12-22 运动图像压缩编码方法、运动图像压缩编码装置以及程序

Country Status (5)

Country Link
US (1) US20060133489A1 (zh)
EP (1) EP1675404A3 (zh)
JP (1) JP4501675B2 (zh)
KR (1) KR100701478B1 (zh)
CN (1) CN1794816B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008124580A (ja) * 2006-11-08 2008-05-29 Matsushita Electric Ind Co Ltd 動きベクトル検出方法、動きベクトル検出装置、及び撮像システム
US8218636B2 (en) * 2006-11-21 2012-07-10 Vixs Systems, Inc. Motion refinement engine with a plurality of cost calculation methods for use in video encoding and methods for use therewith
CN101222641B (zh) * 2007-01-11 2011-08-24 华为技术有限公司 帧内预测编解码方法及其装置
KR100924640B1 (ko) * 2007-11-21 2009-11-02 한양대학교 산학협력단 영상 부호화에서 매크로블록의 인트라 모드 결정 방법
US20090154567A1 (en) * 2007-12-13 2009-06-18 Shaw-Min Lei In-loop fidelity enhancement for video compression
JP5064305B2 (ja) * 2008-06-05 2012-10-31 株式会社日立製作所 ビットレート変換装置及び変換方法
JP5326828B2 (ja) * 2009-06-03 2013-10-30 富士通株式会社 動画像符号化装置及び動画像符号化方法
JP5544996B2 (ja) * 2010-04-09 2014-07-09 ソニー株式会社 画像処理装置および方法
JP5552078B2 (ja) * 2011-02-28 2014-07-16 株式会社メガチップス 符号化装置
JP2013179572A (ja) * 2012-02-08 2013-09-09 Canon Inc 画像符号化装置および画像符号化方法
CN102984545B (zh) * 2012-12-12 2016-01-20 北京视博云科技有限公司 一种视频类资源的编码方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1533183A (zh) * 2003-03-24 2004-09-29 华为技术有限公司 一种视频图象编码方法
CN1533184A (zh) * 2003-03-24 2004-09-29 华为技术有限公司 一种视频图象编码方法

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2608909B2 (ja) * 1988-01-28 1997-05-14 富士通株式会社 動画像の予測符号化方式
EP0533195A2 (en) * 1991-09-20 1993-03-24 Sony Corporation Picture signal encoding and/or decoding apparatus
JPH05252511A (ja) * 1992-03-06 1993-09-28 Nippon Telegr & Teleph Corp <Ntt> 画像分配装置
JPH07288814A (ja) * 1994-04-20 1995-10-31 Oki Electric Ind Co Ltd 動きベクトル検出方法
JP3655651B2 (ja) * 1994-09-02 2005-06-02 テキサス インスツルメンツ インコーポレイテツド データ処理装置
KR0139164B1 (ko) * 1994-12-19 1998-06-01 김광호 적응적 직교변환부호화 장치
JPH08186823A (ja) * 1994-12-28 1996-07-16 Canon Inc 符号化装置及び方法
JP3689454B2 (ja) * 1995-06-22 2005-08-31 キヤノン株式会社 画像符号化装置及び方法
DE69631999T2 (de) * 1995-06-22 2004-09-02 Canon K.K. Bildverarbeitungsgerät und Verfahren
US6728775B1 (en) * 1997-03-17 2004-04-27 Microsoft Corporation Multiple multicasting of multimedia streams
US7474699B2 (en) * 2001-08-28 2009-01-06 Ntt Docomo, Inc. Moving picture encoding/transmission system, moving picture encoding/transmission method, and encoding apparatus, decoding apparatus, encoding method decoding method and program usable for the same
EP2096872B1 (en) * 2001-09-14 2014-11-12 NTT DoCoMo, Inc. Coding method, decoding method, coding apparatus, decoding apparatus, image processing system, coding program, and decoding program
EP1347649A1 (en) * 2002-03-18 2003-09-24 Lg Electronics Inc. B picture mode determining method and apparatus in video coding system
JP4120301B2 (ja) * 2002-04-25 2008-07-16 ソニー株式会社 画像処理装置およびその方法
JP2003319394A (ja) * 2002-04-26 2003-11-07 Sony Corp 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム
AU2003284958A1 (en) * 2003-01-10 2004-08-10 Thomson Licensing S.A. Fast mode decision making for interframe encoding
KR100750110B1 (ko) * 2003-04-22 2007-08-17 삼성전자주식회사 4×4인트라 휘도 예측 모드 결정방법 및 장치
KR100510137B1 (ko) * 2003-04-30 2005-08-26 삼성전자주식회사 고속 움직임 추정을 위한 참조 픽쳐 및 블록 모드 결정방법, 그 장치, 블록 모드 결정 방법 및 그 장치
US7369707B2 (en) * 2003-10-28 2008-05-06 Matsushita Electric Industrial Co., Ltd. Intra-picture prediction coding method
EP1605706A2 (en) * 2004-06-09 2005-12-14 Broadcom Corporation Advanced video coding (AVC) intra prediction scheme
KR100677118B1 (ko) * 2004-06-11 2007-02-02 삼성전자주식회사 움직임 추정 방법 및 그 장치
US8311113B2 (en) * 2004-11-12 2012-11-13 Broadcom Corporation Method and system for using motion prediction to equalize video quality across intra-coded frames

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1533183A (zh) * 2003-03-24 2004-09-29 华为技术有限公司 一种视频图象编码方法
CN1533184A (zh) * 2003-03-24 2004-09-29 华为技术有限公司 一种视频图象编码方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHANGSUNG KIM ET AL.Feature-based intra-prediction mode decision for H.264.PISCATAWAY,NJ,USA,IEEE,2004,769-772. *
JP特开2000-41257A 2000.02.08
JP特开2002-142227A 2002.05.17

Also Published As

Publication number Publication date
JP4501675B2 (ja) 2010-07-14
CN1794816A (zh) 2006-06-28
JP2006180195A (ja) 2006-07-06
US20060133489A1 (en) 2006-06-22
KR100701478B1 (ko) 2007-03-29
EP1675404A3 (en) 2006-07-12
EP1675404A2 (en) 2006-06-28
KR20060071894A (ko) 2006-06-27

Similar Documents

Publication Publication Date Title
CN1794816B (zh) 运动图像压缩编码方法、运动图像压缩编码装置以及程序
CN100499818C (zh) 运动图像压缩编码方法和运动图像压缩编码装置
US11240498B2 (en) Independently coding frame areas
CN101390401B (zh) 借助伪影评价的提高的图像/视频质量
CN100442855C (zh) 图像编码装置、方法及程序和图像解码装置、方法及程序
CN102835111B (zh) 使用先前块的运动矢量作为当前块的运动矢量来对图像进行编码/解码的方法和设备
CN102934443B (zh) 用于对视频进行编码和解码的方法和设备
CN105915901B (zh) 动图像解码装置以及动图像解码方法
CN103190151B (zh) 帧间预测编码方法
CN102474609B (zh) 对图像编码的方法和设备及对图像解码的方法和设备
CN102823250B (zh) 图像编码装置、图像解码装置、图像编码方法以及图像解码方法
CN104041048A (zh) 利用跳过模式进行视频编码和解码的方法和设备
CN102415098B (zh) 图像处理设备和方法
CN101836455A (zh) 用于处理视频信号的方法和装置
CN103765901A (zh) 用于使用帧内预测进行图像编码和解码的方法和设备
CN108111853A (zh) 合并模式下的图像重构方法
CN104980761A (zh) 用于对运动矢量进行编码和解码的方法和设备
CN102640495A (zh) 运动向量编码/解码方法和装置及使用该方法和装置的图像编码/解码方法和装置
CN103248895A (zh) 一种用于hevc帧内编码的快速模式估计方法
KR100541623B1 (ko) 움직임 보상을 이용한 예측 코딩 방법 및 장치
CN105025298A (zh) 对图像进行编码/解码的方法和设备
JP4957780B2 (ja) 動き補償予測符号化装置、動き補償予測符号化方法及びプログラム
CN108432252A (zh) 视频编码中的运动矢量选择及预测系统和方法
CN105025299B (zh) 对图像进行编码/解码的方法和设备
KR20120138426A (ko) 교차 삽입법을 이용한 향상된 움직임 백터 예측 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20101222

Termination date: 20131222