CN101207819A - 译码方法及编码方法 - Google Patents

译码方法及编码方法 Download PDF

Info

Publication number
CN101207819A
CN101207819A CNA2007101604206A CN200710160420A CN101207819A CN 101207819 A CN101207819 A CN 101207819A CN A2007101604206 A CNA2007101604206 A CN A2007101604206A CN 200710160420 A CN200710160420 A CN 200710160420A CN 101207819 A CN101207819 A CN 101207819A
Authority
CN
China
Prior art keywords
image
coding
retrieval
motion vector
dynamic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007101604206A
Other languages
English (en)
Inventor
村上智一
浜田宏一
山口宗明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of CN101207819A publication Critical patent/CN101207819A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/57Motion estimation characterised by a search window with variable size or shape
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本法明涉及译码方法及编码方法,根据本发明能够降低编码数据的编码量,防止译码图像的质量恶化。根据本发明进行的译码处理包括:接受关于动态检索的信息的步骤;使用记录的参照图像与关于该动态检索的信息进行动态检索的步骤;和从通过该动态检索取得的动态矢量与记录的参照图像而生成预测图像的步骤。而且,进行生成与该译码处理相对应的指示在译码侧进行动态检索的标记的编码处理。

Description

译码方法及编码方法
技术领域
本发明涉及对编码图像数据进行译码的译码方法或译码装置,及对图像进行编码的编码方法或编码装置。
背景技术
作为将图像、声音信息变换为数字数据而进行记录、传递的方法,规定有H.264/AVC(Advanced Video Coding:高级视频编码)规格。
在H.264/AVC方式中,在被称为宏块(Macro Block)的各帧的编码单位中,能够从各种各样的预测编码的模式中选择相对于编码量的画面质量最高的模式。将这样编码的样式称为编码模式(参照非专利文献1)。
就H.264/AVC方式中的编码模式来说,在宏块的尺寸为16×16像素时,存在将块的尺寸较小地分割为16×8及8×16,或8×8及4×4等,进行动作补偿预测的模式,被称为跳跃模式(スキツプモ一ド)或直接模式(ダイレクトモ一ド)的不传送动态矢量(動きベクトル)的模式等。
非专利文献1:Joint Video Team(JVT)of ISO/IEC MPEG & ITU-TVCEG:“Text of International Standard of Joint Video Specification”,ITU-T Rec.H.264|ISO/IEC 14496-10Advanced Video Coding.(December,2003).
发明内容
然而,在已有的跳跃模式及直接模式中,是代用编码对象块以外的其它动态矢量而进行预测。因此,存在有未必能够高精度地进行测量,译码后的图像质量低、且编码量大的问题。
本发明就是鉴于上述问题而提出的,其目的在于降低编码量,防止图像质量的恶化。
本发明的一个实施方式,包括:接受关于动态检索的信息的步骤;使用记录的参照图像与关于该动态检索的信息进行动态检索的步骤;和从通过该动态检索取得的动态矢量与记录的参照图像而生成预测图像的步骤。
根据本发明的实施方式,能够提高图像的质量,降低编码量。
附图说明
本发明的其它特征、目标与优点,能够通过以下采用附图的说明而得到进一步的理解。
图1是本发明的一个实施例中图像编码装置的一例的说明图。
图2是本发明的一个实施例中图像译码装置的一例的说明图。
图3是本发明的一个实施例中动态检索方法的一例的说明图。
图4是本发明的一个实施例中动态检索方法的一例的说明图。
图5(a)是本发明的一个实施例中动态检索方法的一例的说明图。
图5(b)是本发明的一个实施例中动态检索方法的一例的说明图。
图6(a)是本发明的一个实施例中图像编码方法的一例的说明图。
图6(b)是本发明的一个实施例中图像编码方法的一例的说明图。
图7(a)是本发明的一个实施例中图像译码方法的一例的说明图。
图7(b)是本发明的一个实施例中图像译码方法的一例的说明图。
图8是本发明的一个实施例中数据记录介质的一例的说明图。
图9是本发明的一个实施例中误差计算方法的一例的说明图。
具体实施方式
下面说明本发明的实施方式。此外,实施方式仅是为了实施本发明的具体化的例子,并不能由此对本发明的技术范围进行限定性的解释。就是说,本发明在不脱离其技术思想、或其主要特征的前提下,能够以各种形式进行实施。
下面,使用附图详细说明本发明的实施例。
而且,在各图中,赋予同样的符号的结构要素都具有同一的功能。
而且,在本说明书的各记述及各图面中的所谓“译码侧动态检索模式”的表现形式,表示本发明中新的编码模式。
而且,在本说明书的各记述及各图面中的所谓“残差成分”的表现形式,也包含与“预测误差”同样的意义。而且,在本说明书的各记述及各图面的预测处理中单纯表现为“误差”的情况,意味着“预测误差”。
而且,在本说明书的各记述及各图面中的所谓“与标记(フラグ)一起传送”的表现形式,也包含“包含在标记中进行传送”的意义。
而且,在本说明书的各记述及各图面中的所谓“块预测”的表现形式,也包含“按照块单位的预测”的意义。
而且,在本说明书的各记述及各图面中的所谓“像素(ピクセル)预测”的表现形式,也包含“按照像素单位的预测”的意义。
首先,参照附图对本发明的第一实施例进行说明。
图1表示本发明的一个实施例中图像编码装置100的框图的一例。
图像编码装置包括,例如原图像存储器101,内部(イントラ)预测误差计算部102,动态预测误差计算部103,译码侧动态检索模式的动态预测误差计算部111,参照图像间动态检索部104,预测图像合成部105,变换·量子化部106,系数编码部107,模式选择部108,逆量子化·逆变换·合成部109,译码图像存储器110,控制部112,存储部113以及加法器114。这里,参照图像间动态检索部104与预测图像合成部105是译码侧动态检索模式的动态预测误差计算部111具有的要素。
以下对图像编码装置100的各构成要素进行详细的说明。
还有,图像编码装置100的各构成要素的动作,例如,可以作为以下记载的各构成要素的自主动作。而且,例如也可以是通过控制部112与例如存储部113所存储的软件的协同动作来实现。
首先,原图像存储器101输入作为编码对象的原图像,进行暂时缓冲。接着,进入每个编码图像的单位的预测步骤。编码单位例如可以是宏块单位,也可以是像素单位。以下表示的是按照宏块单位进行处理的例子。
在以后的处理中,对于各宏块按照多个编码模式进行预测,例如,由模式选择部108从中选择编码效率最高的模式,作为编码流而输出。
由内部预测误差计算部102,进行编码模式中内部预测模式的预测图像合成。取得通过该预测图像合成所生成的预测图像与原图像之间的差分,输出残差成分。对于内部预测方法,例如可以使用上述非专利文献中记载的现有的方法。而且,内部预测误差计算部102也进行生成的预测图像的输出。
在动态预测误差计算部103中,使用译码图像存储器110中存储的参照图像,进行编码模式中使用动态预测(動き予測)的模式的预测图像合成。取得由该预测图像合成所生成的预测图像与原图像之间的差分,输出残差成分。对于已经存在的P图像(Pピルチヤ)、B图像(Bピルチヤ)中包含的跳跃模式及直接模式,这样进行处理。对于这些方式,可以使用上述非专利文献中记载的现有的方法。而且,动态预测误差计算部103也进行生成的预测图像的输出。
这里,动态预测误差计算部103,虽然是为了说明的方便而仅记载了一个,但也可以是对于每个编码装置分别配置图像编码装置100。
接着,在译码侧动态检索模式的动态预测误差计算部111中,进行本发明中新编码模式的译码侧动态检索模式的预测图像合成。而且,取得由该预测图像合成所生成的预测图像与原图像之间的差分,输出残差成分。
这里,参照图像间动态检索部104,检索译码图像存储器110中存储的多个参照图像之间的对应点。由此,计算出动态矢量。关于检索方式,后面进行详细说明。
而且,在预测图像误差计算部105中,从通过参照图像间动态检索部104得到的动态矢量,合成编码对象图像的预测图像。接着,取得该预测图像与原图像之间的差分,输出残差成分。关于合成方式,后面进行详细说明。而且,译码侧动态检索模式的动态预测误差计算部111具有的预测图像误差计算部105也进行生成的预测图像的输出。
对以上说明的内部预测误差计算部102、动态预测误差计算部103、或译码侧动态检索模式的动态预测误差计算部111输出的各编码模式的残差成分,由变换·量子化部106进行离散余弦变换(Discrete CosineTransform)处理与量子化处理,变换为编码系数。
进而,系数编码部107对该编码系数进行可变长度编码处理,变换为对于各编码模式的编码数据。
另一方面,逆量子化·逆变换部109,对于变换·量子化部106输出的编码系数,进行逆量子化处理与逆离散余弦变换处理。由此,编码系数再次回到残差成分。这里,残差成分输出到加法器113。
进而,加法器113对该残差成分与编码模式的计算部所输出的预测图像进行合成,生成译码图像块。
这里,在模式选择部108中,对于各编码模式,比较从系数编码部107取得的各编码模式的编码数据的编码量,或加法器113生成的各编码模式的译码图像块的图像质量等,选择一个编码模式。这里,作为该选择的方法,例如有选择编码效率好的编码模式等的方法。就是说,可以是研究讨论编码数据的编码量、图像质量或这两者,通过兼顾它们而进行选择。
而且,这里,图像质量良好的判断,例如可以是通过对加法器113生成的各编码模式的译码图像块与对应的原图像块的差分值(编码误差)进行评价等而进行。
例如,作为选择编码效率最好的编码模式的方法,有Rate-Distortion最优化方式的提案(参照参考文献)。该方式是对于各宏块计算全部模式下的编码量与译码后的原图像的编码误差,根据成本计算式而选择最佳模式的方式。
(参考文献)Gary Sullivan and Thomas Wiegand:“Rate-DistortionOptimization for Video Compression”,IEEE Signal Processing Magazine,vol.15,no.6,pp.74-90(November,1998)。
而且,除上述方法之外,也可以是通过重视图像质量的权重,重视符合量的权重,而变更判定方法。
接着,模式选择部108将选择的编码模式的编码模式标记作为编码流而一起输出。在选择了上述译码侧动态检索模式的情况下,输出表示进行译码侧动态检索的标记。这里,在选择了该译码侧动态检索模式的情况下,残差成分的编码数据可以输出,也可以不输出。
此时,不输出残差成分的编码数据的情况,具有使编码量更小的优点。而且,输出残差成分的编码数据的情况,具有能够提高图像质量的优点。无论是在哪种情况下,在选择该译码侧动态检索模式的情况下,译码侧动态检索模式中都不进行动态矢量的输出。这样,就具有比现有的编码模式中输出动态矢量数据的编码模式具有更小的编码量的优点。
另一方面,加法器113向译码图像存储器110输出由模式选择部108选择的编码模式中的译码图像块。
接着,译码图像存储器110从上述取得的译码图像块而生成参照图像,并保存。
根据以上说明的图1的编码装置,即使不传送动态矢量,通过进行译码装置侧的动态检索处理,也能够计算出高精度的动态矢量。由此,能够在译码装置侧进行误差少的预测图像的合成。
这样,根据以上说明的图1的编码装置,没有必要传送动态矢量,能够提高编码效率,并进行高图像质量的图像编码。
就是说,根据以上说明的图1的编码装置,能够将图像变换为数据量更小的编码数据,并进行能够更高图像质量地译码的图像编码。
接着,图2中表示本发明的一个实施例中图像译码装置200的框图一例。
图像译码装置200包括,例如流解析部201,模式判定部202,内部预测合成部203,动态预测合成部204,译码侧动态检索模式的预测合成部211,系数解析部207,逆量子化·逆变换·合成部208,译码图像存储器209,控制部212,存储部213,以及加法器214。这里,参照图像间动态检索部205与预测图像合成部206是译码侧动态检索模式的预测合成部211具有的要素。
以下,对图像译码装置200的各构成要素的动作进行详细的说明。
还有,图像译码装置200的各构成要素的动作,例如,可以是作为以下记载的各构成要素的自主动作。而且,例如也可以是通过控制部112与例如存储部113所存储的软件的协同动作来实现。
首先,流解析部201对输入的编码流进行解析。这里,流解析部201也进行自包(パケツト)的数据抽取处理,或各种头(header)、标记的信息取得处理。进而进行各宏块的处理。
接着,模式判定部202,对于各宏块,进行由标记等指定的编码模式的判别。以下的译码处理,进行与该判别结果的编码模式相对应的处理。以下,对各个编码模式的处理进行说明。
首先,在编码模式是内部编码的情况下,内部预测合成部203进行内部预测与预测图像的合成。该方法可以利用上述现有的方法。这里,内部预测合成部203输出合成后的预测图像。
在编码模式是现有的基于动态预测的编码的情况下,动态预测合成部204进行动态检索与预测图像的合成。此时,存在使用包含输入于图像译码装置200的编码流的动态矢量的情况,和跳跃模式与直接模式等,使用相邻宏块的信息及关于相邻帧的宏块信息的情况。这也同样可以使用现有的方法。这里,动态预测合成部204输出合成的预测图像。
在编码模式是本发明的一个实施方式中的译码侧动态检索模式的情况下,译码侧动态检索模式的预测合成部211进行动态预测。由此,进行预测图像的合成。
此时,参照图像间动态检索部205,检索译码图像存储器209中存储的多个参照图像之间的对应点,进行动态检索。由此计算出动态矢量。关于检索方式,后面进行详细说明。这里,参照图像间动态检索部205可以是与图像编码装置100的参照图像间动态检索部相同。
而且,预测图像合成部206,从参照图像间动态检索部205计算出的动态矢量,合成编码对象图像的预测图像。这里,预测图像合成部206输出合成的预测图像。
如以上的说明,根据模式判定部202所判定的编码模式,分别生成预测图像。
另一方面,系数解析部207对输入编码流中包含的各宏块的编码数据进行解析,将残差成分的编码数据输出到逆量子化·逆变换部208。
逆量子化·逆变换部208对残差成分的编码数据进行逆量子化处理、逆离散余弦变换处理。由此,对残差成分进行译码。逆量子化·逆变换部208将译码后的残差成分输出到加法器214。
加法器214对从逆量子化·逆变换部208取得的残差成分与模式判定部202判定的编码模式的从预测合成部输出的预测图像进行合成,生成译码图像。加法器214将生成的译码图像输出到译码图像存储器209。
译码图像存储器209存储加法器214生成的译码图像。存储的译码图像从译码图像存储器209向图像译码装置200的外部输出。而且,根据需要,可以由内部预测合成部203、动态预测合成部204、或译码侧动态检索模式的预测合成部211作为参照图像而使用。
根据以上说明的图2的编码装置,能够进行与不传送动态矢量的新编码模式相对应的动态检索处理。由此,对于编码效率高的编码流,能够生成高精度的预测图像,进行更高图像质量的图像的译码。
就是说,根据以上说明的图2的编码装置,对于按照数据量更少的方式进行了编码的编码数据,进行能够更高图像质量地译码的图像译码。
接着,使用图3、图4、图5(a)、图5(b)、图9,对上述编码侧动态检索模式中的动态检索方式与预测图像合成方式的一例进行详细的说明。该动态检索处理与预测图像合成处理,例如由图像编码装置100的译码侧动态检索模式的动态预测误差计算部111,图像译码装置200的译码侧动态检索模式的预测合成部211而进行。
在本发明的一个实施例中,例如对于动态检索中的参照帧的位置关系来说有内插预测与外插预测的两种。而且,对于动态矢量的检索方法,有块预测与像素预测两种。
这里,这些预测方法可以自由地组合。由此,在图像编码装置100的译码侧动态检索模式的动态预测误差计算部111中,图像译码装置200的译码侧动态检索模式的预测合成部211中,都可以使用任意(いずれ)的组合。
但是,在通过图像译码装置200的译码侧动态检索模式的预测合成部211进行动态预测的情况下,进行与图像编码装置100的译码侧动态检索模式的动态预测误差计算部111所进行的组合相同的组合的动态检索与预测图像的合成,更为合适。
由此,在图像编码装置100的模式选择部108中,选择译码侧动态检索模式的情况,例如在表示译码侧动态检索的标记,可以添加表示编码时的动态检索中是否使用了内插预测和外插预测的任意的标记。而且,例如也可以在表示进行译码侧动态检索的标记,添加表示编码时的动态检索中是否使用了块预测与像素预测的任意的标记。这些标记,在译码时由图像译码装置200的流解析部201或模式判定部202进行认识,向译码侧动态检索模式的预测合成部211发送指示。接受到该指示的译码侧动态检索模式的预测合成部211,进行表示上述标记的动态检索。这些译码时的动态检索方法,能够使用与编码时的动态检索方法同样的方法进行。
还有,在以下的说明中,使用编码处理中生成编码对象帧的预测图像的例子进行说明。对译码处理的动态检索,也能够使用同样的方法。
首先,使用图3,对本实施例的译码侧动态检索模式中的内插预测与外插预测的一个例子进行说明。
就内插预测来说,例如可以用于B图像的预测。在图3中,302是编码对象帧,301是比编码对象帧时间上靠前的参照帧,303是比编码对象帧时间上靠后的参照帧。这样,例如将对于比编码对象帧时间上靠前的参照帧与比编码对象帧时间上靠后的参照帧进行比较,进行动态检索,预测编码对象帧的像素,将其称为内插预测。
而且,就外插预测来说,例如可以用于P图像的预测。在图3中,306是编码对象帧,304、305是比编码对象帧时间上靠前的参照帧。对于时间上靠后的帧也可以进行同样的处理。这样,比较时间上靠前的多个参照帧,进行动态检索,预测比该多个参照帧时间上靠后的编码对象帧的像素,将其称为外插预测。
本发明的动态矢量检索中,可以使用内插预测与外插预测中的任意一个。作为内插预测中参照帧的选择方法,例如可以使用H.264/AVC规定的清单L0与L1的最小编号的清单。(这里,在H.264/AVC中,清单L0中按照距离现在时刻近的顺序存储有比现在的帧时间上为过去的参照帧的编号。而且,清单L1中分别按照距离现在时刻近的顺序存储有未来的参照帧的编号。)而且,可以在译码侧检索模式的标记中追加并传送各个清单编号。作为外插预测中参照帧的选择方法,例如可以自H.264/AVC规定的清单L0或L1的小的编号中选择2个。而且,还可以在译码侧动态检索模式的标记中追加并传送各自的清单的编号。在内插预测或外插预测各自的方法中所使用的参照帧枚数,例如可以是2枚。但是,也可以是多于2枚。这种情况下,图像编码装置100的模式选择部108,将译码侧动态检索模式的动态预测误差计算部111中使用的枚数与标记一起传送即可。这样,通过增加预测中所使用的参照帧数,也能够提高预测精度。
这里,在内插预测或外插预测的任意方法的预测图像合成中,在生成预测图像像素的情况下,都可以将对应的像素平均。而且,也可以根据编码对象帧与各自的参照帧的距离比进行合成。无论是在哪种情况下,都可以是通过将参照帧上的像素的像素值作为变量的函数值,而决定编码对象帧中对应的像素的像素值。
如以上的说明,不仅使用内插预测,而且也使用外插预测,由此,对于各种各样模式的输入图像,能够采用更高效率的编码方法。
接着,使用图4,说明本实施方式的块预测方法的一例。如上所述,块预测可以是内插预测与外插预测的任意组合。以下,作为一例,将编码对象帧402最近的前后各一枚的帧401、403作为参照帧,进行内插预测,对于这种情况进行说明。还有,如上所述,参照帧的枚数可以是任意的。而且,译码侧也用同样的方法进行预测。这里,在由块预测检索动态矢量的情况下,可对多个像素进行归纳、检索,对多个像素的组合进行误差判定。因此,能够进行高速、高精度的动态矢量的检索。
在本实施例的块预测中,与已经存在的编码方式的块匹配的动态预测进行比较,其不同点在于,例如,不是参照图像与编码对象图像,而是以参照图像之间作为对象,进行动态检索。在图4中,以402的编码对象帧的宏块405作为编码对象宏块。
对时间上靠前的参照帧401与时间上靠后的参照帧403以块单位进行比较,检索规定的范围。此时,使时间上靠前的参照帧401与时间上靠后的参照帧403的比较块的关系成为图4所示的关系而进行。就是说,对图4中时间上靠前的参照帧401的块404与靠后的参照帧403的块406进行比较。此时,例如,使得条件为前的参照帧401的块404、编码对象帧402的编码对象块405、后的参照帧403的块406成为直线上的关系,进行动态检索。由此,即使是选择了前的参照帧401的块及后的参照帧403的块的任意组合,两者之间的动态矢量都能够通过编码对象帧402的编码对象块。
例如,设自参照帧401到编码对象帧402的时间的距离为α,自编码对象帧402到参照帧403的时间的距离为β。而且,参照帧401的检索块404的位置为(X1,Y1),编码对象帧402的编码对称宏块405的位置为(X2,Y2),帧403的检索块406的位置为(X3,Y3)时,例如,各自的关系如以下公式(1),公式(2)所示即可。
公式1
X 3 = X 2 - β α × ( X 1 - X 2 )
公式2
Y 3 = Y 2 - β α × ( Y 1 - Y 2 )
如果使用上述式(1),式(2)的条件,给出编码对象帧402上的编码对象宏块405的位置(X2,Y2),参照帧401上的检索块404的位置(X1,Y1),则能够决定帧403上的检索块406的位置(X3,Y3)。
以上述关系作为条件,在参照帧401与参照帧403,进行规定范围的检索。
因此,该规定范围的设定方法,可以是考虑计算量与图像质量,对每个装置进行设定。例如,在参照帧401与参照帧403中,以与编码对象帧402的编码对象块405的位置(X2,Y2)同一的位置为基准,以该基准位置(X2,Y2)为中心,以规定的宽度A为X方向的宽度,以规定的宽度B为Y方向的宽度,这样的矩形区域即可。而且,也可以是以该基准位置(X2,Y2)为中心,规定的距离R的圆形区域。而且,也可以是以检索块是否进入了该规定的区域内的方式设定边界。另外,也可以是以检索块的中心是否进入了该规定的区域内的方式设定边界。这些规定的区域的设定条件,也可以是图像编码装置100的模式选择部108与标记一起传送。
还有,式(1),式(2)的关系仅是一例,也可以是其它的条件。但是,在这种情况下,如式(1),式(2)那样,能够判别参照帧401的检索块的位置、编码对象帧402的编码对象宏块405的位置、帧403的检索块406的位置的关系的信息,也可以是图像编码装置100的模式选择部108与标记一起传送。
这里,上述动态检索的检索结果,例如由以下的方法步骤计算。就是说,参照帧401的检索块404与帧403的检索块406的误差,是在上述规定区域内的各位置而求出。接着,以该误差最小的情况下的检索块404与检索块406之间的动态矢量作为检索结果。取得的动态矢量以始点作为编码对象块的中心位置,以参照帧上的检索块作为终点也可以。而且,也可以是以各参照帧上的检索块的中心位置分别作为始点、终点的动态矢量。
这里,该误差例如可以由以下方法步骤计算出。就是说,求出由参照帧401的检索块404的各像素值构成的矩阵与由参照帧403的检索块406的各像素值构成的矩阵的差的矩阵。接着,对于该差的矩阵的值(参照帧401的检索块404的像素值与参照帧403的检索块406的像素值的差分值),计算出其绝对值的和,或各值的平方和。将该绝对值的和或平方和作为误差即可。
将如以上的说明中计算出的动态矢量所指示的参照帧401上的块404,与参照帧403上的块406进行合成,生成预测图像。
这里,在该预测图像的生成中,以参照帧401上的块404的像素值与参照帧403上的块406的像素值的平均值作为预测图像的像素值即可。而且,也可以是使用编码对象帧与参照帧在时间上的距离,以将参照帧的块的像素值赋予权重后的值作为预测图像的像素值。使用该权重的合成的一例,可以按照以下方法步骤进行。就是说,在参照帧401上的块404的一个像素中的像素值为C,参照帧403上的块406的对应位置的像素中的像素值为D,从参照帧401到编码对象帧402的时间上的距离为α,从编码对象帧402到参照帧403的时间上的距离为β的情况下,例如如下述公式(3)所示,计算出与预测图像相对应位置的像素的像素值E即可。
公式3
E = β α + β × C + β α + β × D
而且,以上仅为一例,也可以由其它的计算方法设定预测图像的像素值。在任何一种情况下,都可以将通过动态检索的结果所求得的参照帧上的像素的像素值作为变量,由该函数值而决定预测图像中对应的像素的像素值。
以上,进行块预测与预测图像的合成。对于外插预测,仅仅是块的位置关系不同,可以进行同样的处理。
而且,例如在图3所示的外插预测的情况下,与上述说明的内插预测的情况相比,时间距离β的箭头的方向反向。在这种情况下,使用上述公式1、公式2、公式3时,将β取负值即可。
如以上的说明,通过由块预测而检索动态矢量,能够进行高速、高精度的动态矢量的检索。
而且,如以上的说明,不是检索以对象块为终点的动态矢量,而是检索参照帧中对应的块间的动态矢量,并使用其进行预测,由此,即使是不存在对象帧,也能够计算出动态矢量。这在译码时特别有效。
接着,使用图5(a)、图5(b)对像素预测方法的一例加以说明。如上所述,像素预测可以使用内插预测与外插预测的任意组合。还有,如上所述,参照帧的枚数可以是任意枚数。这里,以下对使用距离编码对象帧503最近的前后各2枚的帧501与502,504与505,进行内插预测的情况加以说明。而且,译码侧也可以由同样的方法进行预测。这里,在由像素预测而检索动态矢量的情况下,即使是对于具有不能由块单位区分的复杂动作(動き)的图像,也能够进行正确的动态检索(動き探索)。
这里,在像素预测中,在编码对象帧503的对象宏块506,对各像素分别求出动态矢量。例如,在编码时也可以不使用编码对象帧503的信息。译码时图的编码对象帧503相当于译码对象帧。该帧在译码开始时不存在。
首先,考虑对于编码对象宏块左上的一个像素507,求出动态矢量。这里,在参照帧501、参照帧502、参照帧504、参照帧505,以像素单位进行比较,检索规定的范围。
此时,例如按照参照帧501、参照帧502、参照帧504、参照帧505中比较块的关系,成为图5(a)所示的关系的方式进行。就是说,在图5(a)中,以参照帧501上的检索像素521、参照帧502上的检索像素522、编码对象帧503上的编码对象像素523、参照帧504上的检索像素524、参照帧505上的检索像素525成为直线上的关系为条件,进行动态检索。
由此,选择参照帧501、参照帧502、参照帧504、参照帧505的各检索像素的任意组合,通过该检索像素的动态矢量,通过编码对象帧503的编码对象像素。
这里,例如如图5(a)所示,设从参照帧501到编码对象帧503的时间上的距离为α2,从参照帧502到编码对象帧503的时间上的距离为α1,从编码对象帧503到参照帧504的时间上的距离为β1,从编码对象帧503到参照帧505的时间上的距离为β2,而且,参照帧501的检索像素521的位置为(X11,Y11)、参照帧502的检索像素522的位置为(X12,Y12)、编码对象帧503的编码对象像素523的位置为(X13,Y13)、参照帧504的检索像素524的位置为(X14,Y14)、参照帧505的检索像素525的位置为(X15,Y15)时,例如,各自的关系可以是如以下公式4、公式5、公式6、公式7、公式8、公式9所示。
公式4
X 12 = X 13 + α 1 α 2 × ( X 11 - X 13 )
公式5
Y 12 = Y 13 + α 1 α 2 × ( Y 11 - Y 13 )
公式6
X 14 = X 13 - β 1 α 2 × ( X 11 - X 13 )
公式7
Y 14 = Y 13 - β 1 α 2 × ( Y 11 - Y 13 )
公式8
X 15 = X 13 - β 2 α 2 × ( X 11 - X 13 )
式9
Y 15 = Y 13 - β 2 α 2 × ( Y 11 - Y 13 )
使用上述公式4、公式5、公式6、公式7、公式8、公式9的条件,如果给予编码对象帧503上的编码对象像素523的位置(X13,Y13)与参照帧501上的检索像素521的位置(X11,Y11),则能够确定参照帧502上的检索像素522的位置(X12,Y12)、参照帧504上的检索像素524的位置(X14,Y14)、参照帧505上的检索像素525的位置(X15,Y15)。
接着,使用图5(b)对上述规定的检索范围进行说明。图5(b)是表示编码对象帧503的编码对象像素与检索范围参照帧501、参照帧502中检索范围的关系。
这里,编码对象帧503的编码对象像素507、参照帧501上的像素508、参照帧502上的像素512的各帧上的像素位置都在同一位置。此时,参照帧501中的检索范围可以设定为以像素512为中心的范围515,参照帧501中的检索范围可以设定为以像素508为中心的范围511。
此时,例如对于编码对象帧503的编码对象像素507、参照帧501上的像素508、参照帧502上的像素512,在存在满足公式4、公式5的关系的条件时,使得检索范围与范围515,检索范围与范围511相互相似即可。例如,在范围515的横向宽度为H,纵向宽度为I,范围511的横向宽度为F,纵向宽度为G时,检索范围满足F=(α1/α2)×H及G=(α1/α2)×I的关系即可。在这种情况下,在编码对象帧503的编码对象像素507、参照帧501上的像素508、参照帧502上的像素512在一条直线上的情况,能够设定浪费少的检索范围。
使用以上说明的参照帧上的检索像素的位置条件,对上述规定的范围进行动态矢量的检索。
接着,对上述动态检索的检索结果的计算方法进行说明。在本实施例中,在测量参照帧之间的误差时,使用以检索位置为中心的样板(テンプレ一ト)。样板可以像图5(b)的样板509、样板513那样,使用4附近像素的样板,也可以像样板510、样板514那样,使用8附近像素的样板。也可以使用更大范围的样板。
这里,使用图9对使用4附近的样板509、513的情况下误差的计算方法加以说明。首先,取得在各参照帧的检索像素中样板(在4附近像素的样板的情况下,检索像素与邻接于该检索像素的4像素的5像素)的像素值的组合。在图9中,表示的是参照帧501的检索样板901、参照帧502的检索样板902、编码对象帧503的检索样板903、参照帧504的检索样板904。这里,接着对各参照帧的检索样板所对应的一个像素的像素值进行平均处理,生成平均样板903。接着,通过对各参照帧的检索样板与该平均样板903进行差分处理,生成差分样板911、912、914、915。接着,计算出各差分样板中包含的值的绝对值之和。进而,对各差分样板的绝对值的和进行平均,作为误差的值即可。此时,也可以不使用绝对值的和,而使用平方和。
这样,通过计算误差的值,能够对各参照帧的检索像素中样板的像素值是否接近平均值而进行评价。由此,该误差值越小,各参照帧的检索像素中的样板越表示出接近的值。
由此,这种情况下,在检索范围内的各位置,计算出该误差值,例如求出该误差的和最小的各参照帧中检索样板的组合。这里,将各参照帧的检索样板的检索像素构成的直线上的矢量作为编码对象像素的动态矢量。在这种情况下,所取得的动态矢量,可以是以始点作为编码对象像素,以终点作为各检索像素。而且,也可以是始点、终点都作为各检索像素的动态矢量。
而且,误差的计算方法也不限于上述方法。例如,在图9中,也可以不生成平均样板903。在这种情况下,可以生成各参照帧的检索样板的差分样板。具体地,从图9的各参照帧的检索样板901、902、904、905,每次2个地选择检索样板组合,生成各自的差分样板。就是说,在本图的例子中,生成检索样板901与检索样板902、检索样板901与检索样板903、检索样板901与检索样板904、检索样板902与检索样板903、检索样板902与检索样板904、检索样板904与检索样板905的共计6个组合的差分样板。计算该6个差分样板的各差分样板中包含的值的绝对值的和或平方和,并例如计算它们的平均值。可以以该值作为误差而进行评价。在这种情况下,也是该误差值越小,各参照帧的检索样板的像素值越接近。
还有,以上误差计算的说明,是使用图5(b)的样板509、样板513那样的4附近像素的样板而进行,但使用样板510、样板514那样的8附近像素,也同样能够求得。二者的不同仅在于各样板中所包含的像素值的数目不同。
接着,在图5(a)中,生成编码对象帧503的对象像素的预测像素值。预测像素值可以是对上述动态矢量的位置上各参照帧的检索像素的值进行平均而计算出。而且,也可以是根据自编码对象帧的时间上的距离赋予权重进行计算。使用该权重的合成的一例,可以按照以下方法步骤进行。就是说,设参照帧501上的检索像素521的像素值为J、参照帧502上的检索像素522的像素值为K、参照帧504上的检索像素524的像素值为L、参照帧505上的检索像素525的像素值为M,从参照帧501到编码对象帧503的时间上的距离为α2、从参照帧502到编码对象帧503的时间上的距离为α1、从编码对象帧503到参照帧504的时间上的距离为β1、从编码对象帧503到参照帧505的时间上的距离为β2的情况下,例如如以下的公式10所示,可以计算出预测像素的像素值N。
N = ( 1 α 2 × J + 1 α 1 × K + 1 β 1 × L + 1 β 2 × M ) ( 1 α 2 + 1 α 1 + 1 β 1 + 1 β 2 )
而且,以上仅为一例,也可以由其它的计算方法而设定预测图像的像素值。在任何一种情况下,都可以是以通过动态检索的结果所求得的参照帧上的像素的像素值作为变量的函数值,并通过该函数值决定预测像素的像素值。
如上所述,进行块预测与预测像素的生成。关于外插预测,仅块的位置关系不同,可以进行同样的处理。
而且,例如在图3所示的外插预测的情况下,与上述说明的内插的情况相比,时间距离β的方向相反。在这种情况下,适用上述公式4~公式10时,将β取负值即可。而且,对于参照帧的枚数与上述说明不同的情况下的公式4~公式10的适用,与参照帧的枚数相对应,增减与各参照帧相对应的项即可。
如上所述,通过对对象宏块内的全部像素进行像素单位的动态检索及预测像素合成,能够进行像素预测与预测像素的合成。
通过由以上说明的像素预测而进行动态矢量,即使是对于具有由块单位不能区分的复杂动作的图像,也能够进行正确的动态检索。
而且,与图4同样,不是检索以对象块为终点的动态矢量,而是检索参照帧中对应的块间的动态矢量,并使用其进行预测,由此,即使是不存在对象帧,也能够计算出动态矢量。这在译码时特别有效。
在以上的图3、图4、图5(a)、图5(b)、图9的说明中,是以整数像素单位的预测作为例子,但动态检索也可以是按照小数像素单位进行。在这种情况下,可以使用现有的H.264/AVC等技术,由插补滤波器(フイルタ)将各参照帧放大为小数像素精度的图像,进行同样的处理。
接着,使用图6(a),对本发明的一个实施例中编码方法流程的一例加以说明。
首先,在步骤601中,输入作为编码对象的原图像。例如,步骤601,由图像编码装置100的原图像存储器101进行即可。接着,在步骤602中,对于步骤601所取得的原图像的一个图像,进行各编码模式的预测图像的合成,计算出预测图像与原图像的残差成分。例如,步骤602,由图像编码装置100的内部预测误差计算部102、动态预测误差计算部103、译码侧动态检索模式的动态预测误差计算部111等,对于各自的编码模式而进行即可。步骤602的详细处理,例如可以按照图1中内部预测误差计算部102、动态预测误差计算部103、译码侧动态检索模式的动态预测误差计算部111的各说明所示而进行。接着,在步骤603中,对于步骤602所计算的各编码模式中的残差成分,进行离散余弦变换处理及量子化处理,计算出编码系数。例如,步骤603由图像编码装置100的变换·量子化部106而进行。在步骤603中,还可以对该编码系数进行可变长度编码处理。例如,该可变长度编码处理,可以由图像编码装置100的系数编码部107进行。无论是在哪种情况下,在步骤603中,都将处理后的数据作为编码数据而输出。接着,在步骤604中,比较进行了步骤603的处理的各编码模式的图像编码结果,对于该图像决定输出的编码模式。例如,步骤604由图像编码装置100的模式选择部108进行。步骤604的处理的详细步骤,可以按照图1中模式选择部108的说明而进行。接着,在步骤605中,将步骤604所选择的编码模式中的编码数据作为编码流而输出。此时,例如在选择了译码侧检索模式的情况下,编码模式标记也一起包含于编码流而输出。例如,步骤605可以由图像编码装置100的模式选择部108进行。而且,步骤605的处理的详细过程,可以按照图1中模式选择部108的说明而进行。
接着,使用图6(b),对上述步骤602中译码侧动态检索模式的预测图像的合成与残差成分的计算的详细流程的一例加以说明。此外,对于图6(b)所示的译码侧动态检索模式以外的编码模式的预测图像的合成与残差成分的计算,例如可以使用通过图1的图像编码装置100的内部预测误差计算部102或动态预测误差计算部103而进行的现有的方法。
首先,在步骤611中,对于步骤601所取得的原图像的一个图像,进行参照图像间的动态检索,计算出动态矢量。例如,步骤611可以由图像编码装置100的参照图像间动态检索部104进行。步骤611的处理的详细内容,可以如图1的参照图像间动态检索部104的说明,图3、图4、图5(a)、图5(b)中关于动态检索的各说明所示而进行。接着,在步骤612中,使用步骤611中计算出的动态矢量而合成预测图像。例如,步骤612可以由图像编码装置100的预测误差计算部105进行。步骤612的处理的详细内容,可以如图1的预测误差计算部105的说明,图3、图4、图5(a)、图5(b)中关于预测图像合成的各说明所示而进行。接着,在步骤613中,取得步骤612中取得的预测图像与原图像的差分,计算出残差成分。例如,步骤613同样地也可以由图像编码装置100的预测误差计算部105进行。步骤614的处理的详细内容,可以如图1的预测误差计算部105的说明所示而进行。
根据以上说明的图6的编码方法,即使不传送动态矢量,通过在译码处理侧进行动态检索处理,也能够进行可计算出高精度动态矢量的编码处理。这样,能够在译码处理侧进行误差少的预测图像的合成。
由此,根据以上说明的图6的编码方法,没有必要传送动态矢量,能够进行编码效率高的图像编码。
即,根据以上说明的图6的编码方法,能够将图像变换为数据量更小的编码数据,并且能够进行能够更高图像质量地译码的图像编码。
接着,使用图7(a),对本发明的一个实施例中译码方法流程的一例加以说明。
首先,在步骤701中,取得成为译码对象的编码流。例如,步骤701可以由图像译码装置200的流解析部201进行。接着,在步骤702中,对步骤701中取得的编码流中包含的编码模式标记与编码数据进行解析。例如,步骤702同样也可以由图像译码装置200的流解析部201进行。步骤702的处理的详细内容,例如可以按照图2的流解析部201的说明所示的方式进行。接着,在步骤703中,使用步骤702中解析的编码模式标记,对该编码数据中包含的一个编码单位(块单位或像素单位等)的编码模式进行判定。例如,步骤703可以由图像译码装置200的模式判定部202进行。接着,在步骤704中,进行与步骤703中判定的编码模式相对应的预测图像的合成。步骤704的处理的详细内容,例如可以根据判定的编码模式,由图2的图像译码装置200的内部预测合成部203、动态预测合成部204、译码侧动态检索模式的预测合成部211等,在各自对应的编码模式的情况下,进行预测图像的合成处理。步骤704的处理的详细内容,例如可以按照图2的内部预测合成部203、动态预测合成部204、译码侧动态检索模式的预测合成部211的各说明所示的方式进行。接着,在步骤705中,对步骤701取得的编码流中包含的编码数据中步骤702的上述一个编码单位的编码数据部分进行解析,对该编码数据进行逆量子化处理、逆离散余弦变换处理,对所述一个编码单位的残差成分进行译码。步骤705的处理,例如可以由图像译码装置200的系数解析部207与逆量子化·逆变换部208进行。步骤705的处理的详细内容,例如可以按照图2的系数解析部207与逆量子化·逆变换部208的各说明所示的方式进行。接着,在步骤706中,对步骤704生成的预测图像与由步骤705译码的残差成分进行合成,进行译码图像的生成。步骤706的处理例如可以由图像译码装置200的加法器214进行。接着,在步骤707中,对步骤705生成的译码图像进行输出。步骤707的处理例如可以由图像译码装置200的译码图像存储器209进行。
接着,使用图7(b),对上述步骤703中判定了译码侧动态检索模式的情况下的,步骤704中预测图像合成的详细流程的一例进行说明。还有,对上述步骤703中判定了译码侧动态检索模式以外的编码模式的情况下,例如可以使用通过图2的图像译码装置200的内部预测合成部203或动态预测合成部204所进行的现有的方法。
在图7(b)中,由于在步骤703中判定的编码模式是译码侧动态检索模式,所以首先在步骤711中,对译码对象图像使用参照图像进行动态检索。这里,所谓编码对象图像,是指在步骤703中判定了编码模式的所述一个编码单位的图像。例如,步骤711可以由图像译码装置200的参照图像间动态检索部205进行。步骤711的处理的详细内容,可以按照图2中参照图像间动态检索部205的说明,图3、图4、图5(a)、图5(b)中对于动态检索的各说明所示的方式进行。接着,在步骤712中,使用步骤711中计算出的动态矢量,合成预测图像。例如,步骤712可以由图像译码装置200的预测图像合成部206进行。步骤712的处理的详细内容,可以按照图2中预测图像合成部206的说明,图3、图4、图5(a)、图5(b)中对于预测图像合成的各说明所示的方式进行。
根据以上说明的图7的译码方法,能够进行与不传送动态矢量的新编码模式相对应的动态检索处理。由此,对于编码效率高的编码流能够生成高精度的预测图像,进行更高图像质量的图像的译码。
就是说,根据以上说明的图7的译码方法,对于按照使得数据量更小的方式进行了编码的编码数据,能够进行能够更高图像质量地译码的图像译码。
接着,图8表示本发明的一个实施例中数据记录介质的一例。
由本发明的一个实施例的编码装置所生成的编码流,例如作为数据列802而记录于数据记录介质801上。数据列802,例如是作为根据规定语法的编码流而被记录的。以下,作为变更了H.264/AVC规格的一部分的规格进行说明。
首先,在H.264/AVC中,由序列参数组803,图像参数组804,片段(スライス)805、806、807构成信息流。以下,表示在一个片段中存储一个图像(ピクチヤ:图像)的例子。
在各片段的内部,例如包含关于各个宏块的信息808。在关于宏块的信息808的内部,例如有对每个宏块记录各自的编码模式的区域,将其作为编码模式标记809。
接着,本发明的一个实施例的译码侧动态检索模式,与其它的内部编码模式、动态预测编码模式同样作为编码模式的一个种类,记录于编码模式标记809。这里,由本发明的一个实施例的译码侧动态检索模式而编码的宏块的动态矢量信息,不记录在数据记录介质801上。而且,由该译码侧动态检索模式而编码的宏块(マクロブロツク)的残差成分的系数,可以记录在数据记录介质801上,也可以不记录在数据记录介质上。此时,在没有残差成分系数的情况下的译码处理中,与现有的跳跃模式同样,对于该宏块,生成的预测图像原封不动地成为该宏块的译码图像。
而且,这里在预测方法中使用图4中说明的块预测的情况下,例如,可以在B图像使用清单L0与L1的最近的各一枚而进行内插预测。也可以在P图像使用清单L0的最近2枚而进行外插预测。而且,在使用图5(a)、图5(b)中说明的像素预测的情况下,可以在B图像中使用清单L0与L1的最近的各2枚而进行内插预测。而且,也可以同样在P图像使用清单L0的最近2枚而进行外插预测。此时,也可以将动态矢量检索中使用的参照帧记录于数据记录介质801上。而且,也可以将指定块预测与像素预测的标记记录于数据记录介质801上。而且,也可以将指定在B图像是使用内插预测、还是使用外插预测的标记记录于数据记录介质801上。
根据以上说明的图8的数据记录介质,能够以更小的数据量记录更高图像质量的图像数据。
还有,以上说明的各图、各方法等实施例的任意组合,也可以成为本发明的一个实施方式。
根据以上说明的本发明的实施方式,是不对动态矢量进行编码的新编码模式,能够实现在译码侧进行动态检索的译码侧动态检索模式。
这里,不传送动态矢量的模式能够削减动态矢量部分的编码量。而且,即使不传送动态矢量,通过在译码侧进行动态检索,也能够生成高精度的预测图像。
由此,通过采用该模式,能够同时做到高的压缩效率与高精度预测图像的生成。由此,能够实现压缩效率高的编码方法、编码装置。而且,能够实现生成更好的质量的译码图像的译码方法、译码装置。
而且,以上说明的各图、各方法等实施例,能够适用于记录编码后的图像编码流的介质,或者是使用这些介质的记录装置、再现装置、手机、数码相机等。
根据以上说明的本发明的各实施例的编码方法、编码装置、译码方法、译码装置,能够降低编码数据的编码量,防止译码图像的质量恶化。
根据以上说明的本发明的各实施例,能够降低编码量,防止图像质量的恶化。就是说,能够实现高的压缩率与更好的图像质量。

Claims (20)

1.一种译码方法,为动态图像的译码方法,其特征在于,包括:
接受关于动态检索的信息的步骤;
使用记录的参照图像与关于该动态检索的信息进行动态检索的步骤;和
从通过该动态检索取得的动态矢量与记录的参照图像而生成预测图像的步骤。
2.根据权利要求1所述的译码方法,其特征在于:
在所述接受关于动态检索的信息的步骤中还接受编码数据,
还包括对该编码数据进行逆量子化处理及逆离散余弦变换处理,并对误差成分进行译码的步骤,和
对该被译码的误差成分和所述预测图像进行合成的步骤。
3.根据权利要求1所述的译码方法,其特征在于:
所述被记录的参照图像是多个图像,
所述合成预测图像的步骤,使用通过所述动态检索取得的动态矢量,生成所述参照图像中的一个图像的一部分,作为预测图像。
4.根据权利要求1所述的译码方法,其特征在于:
所述被记录的参照图像是多个图像,
所述合成预测图像的步骤,使用通过所述动态检索取得的动态矢量,对所述参照图像的多个图像的一部分的各个赋予一定的权重而进行合成,作为预测图像进行生成。
5.根据权利要求1所述的译码方法,其特征在于:
所述进行动态检索的步骤,计算出第一参照图像与比第一参照图像在时间上靠后的第二参照图像之间的动态矢量;
所述生成预测图像的步骤,对关于比第二参照图像在时间上靠后的第三图像的预测图像进行生成。
6.一种译码方法,其是包含使用多个编码模式被编码的多个图像的动态图像的译码方法,其特征在于:
该多个编码模式包括包含伴随着译码侧的动态矢量检索的编码模式的多个编码模式,
包括:为了对该伴随译码侧的动态矢量检索的编码模式中使用的动态矢量的信息进行计算,而在所述多个图像间进行动态检索的步骤;和
将使用该动态矢量选择的所述图像的一部分作为预测图像进行生成的步骤。
7.根据权利要求6所述的译码方法,其特征在于:
所述多个编码模式是按照各图像中的块单位进行选择的模式,
所述包含被编码的多个图像的动态图像,包含关于所述伴随译码侧的动态矢量检索的编码模式所选择的块的残差成分的信息,
所述生成预测图像的步骤,按照块单位生成所述图像的一部分,作为预测图像,
还包括对该预测图像与所述残差成分进行合成的步骤。
8.根据权利要求7所述的译码方法,其特征在于:
所述生成预测图像的步骤,对使用所述动态矢量选择的多个图像的块部分分别赋予一定的权重而进行合成,由此生成预测图像。
9.根据权利要求6所述的译码方法,其特征在于:
所述多个编码模式是按照各图像中的像素单位进行选择的模式,
所述包含被编码的多个图像的动态图像,包含关于所述伴随译码侧的动态矢量检索的编码模式所选择的像素的残差成分的信息,
所述生成预测图像的步骤,按照像素单位生成所述图像的一部分,作为预测图像,
还包括对该预测图像与所述残差成分进行合成的步骤。
10.根据权利要求9所述的译码方法,其特征在于:
所述生成预测图像的步骤,对使用所述动态矢量选择的多个图像的像素部分分别赋予一定的权重而进行合成,由此生成预测图像。
11.根据权利要求6所述的译码方法,其特征在于:
所述进行动态检索的步骤,计算出第一参照图像与比第一参照图像在时间上靠后的第二参照图像之间的动态矢量;
所述生成预测图像的步骤,对关于比第二参照图像在时间上靠后的第三图像的预测图像进行生成。
12.一种编码方法,其是对于具有多个图像的动态图像,使用多个编码模式,对与使用动态检索合成的预测图像和输入图像的差分有关的信息和与通过该动态检索求得的动态矢量有关的信息进行编码的编码方法,其特征在于,包括:
在该多个编码模式中的一个编码模式下,从所述图像选择参照图像的步骤;
通过动态检索对在该编码模式中使用的动态矢量进行计算的步骤;
使用该动态矢量而选择参照图像的一部分的步骤;
生成该参照图像的一部分而作为预测图像的步骤;
对该预测图像与所述编码对象图像的残差成分进行计算的步骤;
对该残差成分进行离散余弦变换处理、量子化处理和可变长度编码处理的编码数据生成步骤;和
对包含该编码数据的编码流进行输出的步骤,
该多个编码模式包含伴随译码侧的动态矢量检索的编码模式,
在输出该编码流的步骤中,与对在译码侧进行动态检索生成预测图像的指示进行表示的标记一起输出。
13.根据权利要求12所述的编码方法,其特征在于:
在所述输出编码流的步骤中,关于在通过所述动态检索进行计算的步骤中所计算出的动态矢量的数据不输出。
14.根据权利要求12所述的编码方法,其特征在于:
在所述输出编码流的步骤之前,还包括对所述多个编码模式中的一个编码模式进行选择的步骤,
在所述选择编码模式的步骤中,在选择了伴随所述译码侧的动态矢量检索的编码模式的情况下,在编码数据生成步骤中,还生成对在译码侧进行动态检索生成预测图像的指示进行表示的标记的编码数据。
15.根据权利要求12所述的编码方法,其特征在于,包括:
对于所述多个编码模式中的一个编码模式以外的其它多个编码模式生成预测图像的步骤;
对于该其它多个编码模式的各个,计算出预测图像与所述编码对象图像的残差成分的步骤;
对关于该其它多个编码模式的各个的残差成分进行离散余弦变换处理、量子化处理和可变长度编码处理的编码数据生成步骤;和
在关于该其它多个编码模式的各个的编码数据与关于所述一个编码模式的编码数据中,对作为编码流而输出的编码数据进行选择的步骤。
16.根据权利要求15所述的编码方法,其特征在于:
所述选择编码数据的步骤,比较关于所述其他多个编码模式的各个的编码数据与关于所述一个编码模式的编码数据的编码量,进行选择。
17.根据权利要求15所述的编码方法,其特征在于:
在所述选择编码数据的步骤之前,还包括对关于所述一个编码模式的编码数据与所述其它多个编码模式的编码数据的各个的编码数据,进行逆量子化处理、逆离散余弦变换处理以及与各编码模式中生成的所述预测图像的合成处理,生成对于各编码模式的译码图像的步骤,
所述选择编码数据的步骤,比较关于该各编码模式的译码图像的图像质量,进行选择。
18.根据权利要求12所述的编码方法,其特征在于:
所述对在译码侧进行动态检索生成预测图像的指示进行表示的标记,包含对在参照图像中进行动态检索的图像大小的单位进行表示的信息。
19.根据权利要求12所述的编码方法,其特征在于:
所述对在译码侧进行动态检索生成预测图像的指示进行表示的标记,包含对动态检索中使用的参照图像进行指定的信息。
20.根据权利要求12所述的编码方法,其特征在于:
在所述选择参照图像的一部分的步骤中,对将所述动态图像具有的多个图像中的比编码对象的图像在时间上靠前的图像和比该编码对象的图像在时间上靠后的图像作为参照图像的第一参照图像的组合,和将所述动态图像具有的多个图像中的比该编码对象的图像在时间上靠前的多个图像作为参照图像的第二参照图像的组合中的任意一个组合进行选择,确定参照图像,
所述对在译码侧进行动态检索生成预测图像的指示进行表示的标记,包含表示选择了该第一参照图像的组合或第二参照图像的组合中的任一组合的信息。
CNA2007101604206A 2006-12-19 2007-12-19 译码方法及编码方法 Pending CN101207819A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2006340670A JP2008154015A (ja) 2006-12-19 2006-12-19 復号化方法および符号化方法
JP2006340670 2006-12-19

Publications (1)

Publication Number Publication Date
CN101207819A true CN101207819A (zh) 2008-06-25

Family

ID=39203109

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007101604206A Pending CN101207819A (zh) 2006-12-19 2007-12-19 译码方法及编码方法

Country Status (4)

Country Link
US (1) US20080159398A1 (zh)
EP (1) EP1936998A3 (zh)
JP (1) JP2008154015A (zh)
CN (1) CN101207819A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101964908A (zh) * 2009-07-24 2011-02-02 日立民用电子株式会社 解码处理方法
CN102823251A (zh) * 2010-03-31 2012-12-12 Jvc建伍株式会社 动图像编码装置、动图像编码方法及动图像编码程序、以及动图像解码装置、动图像解码方法及动图像解码程序
CN102823256A (zh) * 2010-04-09 2012-12-12 夏普株式会社 帧内预测的方法和系统
CN105493505A (zh) * 2014-06-19 2016-04-13 微软技术许可有限责任公司 统一的帧内块复制和帧间预测模式
CN102823256B (zh) * 2010-04-09 2016-12-14 夏普株式会社 帧内预测的方法和系统
US10368091B2 (en) 2014-03-04 2019-07-30 Microsoft Technology Licensing, Llc Block flipping and skip mode in intra block copy prediction
US10390034B2 (en) 2014-01-03 2019-08-20 Microsoft Technology Licensing, Llc Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area
US10469863B2 (en) 2014-01-03 2019-11-05 Microsoft Technology Licensing, Llc Block vector prediction in video and image coding/decoding
US10582213B2 (en) 2013-10-14 2020-03-03 Microsoft Technology Licensing, Llc Features of intra block copy prediction mode for video and image coding and decoding
US10812817B2 (en) 2014-09-30 2020-10-20 Microsoft Technology Licensing, Llc Rules for intra-picture prediction modes when wavefront parallel processing is enabled
US10986349B2 (en) 2017-12-29 2021-04-20 Microsoft Technology Licensing, Llc Constraints on locations of reference blocks for intra block copy prediction
US11109036B2 (en) 2013-10-14 2021-08-31 Microsoft Technology Licensing, Llc Encoder-side options for intra block copy prediction mode for video and image coding
US11284103B2 (en) 2014-01-17 2022-03-22 Microsoft Technology Licensing, Llc Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101690235B (zh) 2007-06-29 2013-05-01 夏普株式会社 图像编码装置、图像编码方法、图像译码装置、图像译码方法、程序以及记录介质
US8811484B2 (en) * 2008-07-07 2014-08-19 Qualcomm Incorporated Video encoding by filter selection
CN102160381A (zh) * 2008-09-24 2011-08-17 索尼公司 图像处理设备和方法
WO2010038212A2 (en) * 2008-10-01 2010-04-08 Nxp B.V. Embedded video compression for hybrid contents
WO2010086041A1 (en) * 2009-01-30 2010-08-05 Gottfried Wilhelm Leibniz Universität Hannover Method and apparatus for coding and decoding a video signal
TW201032600A (en) * 2009-02-20 2010-09-01 Sony Corp Image processing device and method
US8873626B2 (en) * 2009-07-02 2014-10-28 Qualcomm Incorporated Template matching for video coding
US9654792B2 (en) 2009-07-03 2017-05-16 Intel Corporation Methods and systems for motion vector derivation at a video decoder
US8917769B2 (en) 2009-07-03 2014-12-23 Intel Corporation Methods and systems to estimate motion based on reconstructed reference frames at a video decoder
JP5378939B2 (ja) * 2009-10-02 2013-12-25 日立コンシューマエレクトロニクス株式会社 画像符号化方法、画像復号化方法、画像符号化装置、及び画像復号化装置、並びにプログラム
JP5304709B2 (ja) * 2010-03-31 2013-10-02 株式会社Jvcケンウッド 動画像復号装置、動画像復号方法及び動画像復号プログラム
JP5304708B2 (ja) * 2010-03-31 2013-10-02 株式会社Jvcケンウッド 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
JP2011259229A (ja) * 2010-06-09 2011-12-22 Jvc Kenwood Corp 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
JP2011259230A (ja) * 2010-06-09 2011-12-22 Jvc Kenwood Corp 動画像復号装置、動画像復号方法及び動画像復号プログラム
WO2011155171A1 (ja) * 2010-06-09 2011-12-15 株式会社Jvcケンウッド 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム、ならびに動画像復号装置、動画像復号方法及び動画像復号プログラム
US8787459B2 (en) * 2010-11-09 2014-07-22 Sony Computer Entertainment Inc. Video coding methods and apparatus
JP5721851B2 (ja) 2010-12-21 2015-05-20 インテル・コーポレーション Dmvd処理のシステムおよび方法の改善
WO2012090425A1 (ja) * 2010-12-27 2012-07-05 株式会社Jvcケンウッド 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム、並びに動画像復号装置、動画像復号方法及び動画像復号プログラム
CN106851271B (zh) * 2011-03-08 2019-10-18 Jvc 建伍株式会社 动图像编码装置以及动图像编码方法
CN108322761B (zh) * 2012-09-28 2020-08-07 杜比国际公司 图像解码装置
MX2021002488A (es) 2018-09-04 2021-07-16 Huawei Tech Co Ltd Método de obtención de trama de referencia y aparato aplicado a la interpredicción bidireccional.

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1610560A (en) * 1922-10-24 1926-12-14 Frederick S Mccullough Vacuum-tube-filament construction and method of manufacturing same
JPH0262180A (ja) * 1988-08-26 1990-03-02 Fujitsu Ltd 動画像の動き補償予測符号化方式
JPH02171092A (ja) * 1988-12-23 1990-07-02 Fujitsu Ltd フレーム間符号化・復号化方式
JPH07336695A (ja) * 1994-06-13 1995-12-22 Oki Electric Ind Co Ltd 動画像の符号化及び復号化方法
JP3377893B2 (ja) * 1995-10-25 2003-02-17 沖電気工業株式会社 動画像符号化復号化装置
DE69834901T2 (de) * 1997-11-17 2007-02-01 Koninklijke Philips Electronics N.V. Bewegungskompensierte prädiktive bildcodierung und -decodierung
US6289052B1 (en) * 1999-06-07 2001-09-11 Lucent Technologies Inc. Methods and apparatus for motion estimation using causal templates
JP2003259377A (ja) * 2002-03-06 2003-09-12 Matsushita Electric Ind Co Ltd 動画像符号化方法、動画像復号化方法および符号列フォーマット
FR2860678A1 (fr) * 2003-10-01 2005-04-08 Thomson Licensing Sa Procede de codage differentiel
EP1610560A1 (en) * 2004-06-24 2005-12-28 Deutsche Thomson-Brandt Gmbh Method and apparatus for generating and for decoding coded picture data
JP2006174415A (ja) * 2004-11-19 2006-06-29 Ntt Docomo Inc 画像復号装置、画像復号プログラム、画像復号方法、画像符号化装置、画像符号化プログラム及び画像符号化方法
US8054882B2 (en) * 2005-05-13 2011-11-08 Streaming Networks (Pvt.) Ltd. Method and system for providing bi-directionally predicted video coding

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101964908A (zh) * 2009-07-24 2011-02-02 日立民用电子株式会社 解码处理方法
CN102823251A (zh) * 2010-03-31 2012-12-12 Jvc建伍株式会社 动图像编码装置、动图像编码方法及动图像编码程序、以及动图像解码装置、动图像解码方法及动图像解码程序
CN102823251B (zh) * 2010-03-31 2015-08-12 Jvc建伍株式会社 动图像编码装置、动图像编码方法及动图像编码程序、以及动图像解码装置、动图像解码方法及动图像解码程序
CN102823256B (zh) * 2010-04-09 2016-12-14 夏普株式会社 帧内预测的方法和系统
CN102823256A (zh) * 2010-04-09 2012-12-12 夏普株式会社 帧内预测的方法和系统
US10582213B2 (en) 2013-10-14 2020-03-03 Microsoft Technology Licensing, Llc Features of intra block copy prediction mode for video and image coding and decoding
US11109036B2 (en) 2013-10-14 2021-08-31 Microsoft Technology Licensing, Llc Encoder-side options for intra block copy prediction mode for video and image coding
US10390034B2 (en) 2014-01-03 2019-08-20 Microsoft Technology Licensing, Llc Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area
US10469863B2 (en) 2014-01-03 2019-11-05 Microsoft Technology Licensing, Llc Block vector prediction in video and image coding/decoding
US11284103B2 (en) 2014-01-17 2022-03-22 Microsoft Technology Licensing, Llc Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning
US10368091B2 (en) 2014-03-04 2019-07-30 Microsoft Technology Licensing, Llc Block flipping and skip mode in intra block copy prediction
CN105493505A (zh) * 2014-06-19 2016-04-13 微软技术许可有限责任公司 统一的帧内块复制和帧间预测模式
US10785486B2 (en) 2014-06-19 2020-09-22 Microsoft Technology Licensing, Llc Unified intra block copy and inter prediction modes
US10812817B2 (en) 2014-09-30 2020-10-20 Microsoft Technology Licensing, Llc Rules for intra-picture prediction modes when wavefront parallel processing is enabled
US10986349B2 (en) 2017-12-29 2021-04-20 Microsoft Technology Licensing, Llc Constraints on locations of reference blocks for intra block copy prediction

Also Published As

Publication number Publication date
EP1936998A3 (en) 2010-12-01
US20080159398A1 (en) 2008-07-03
JP2008154015A (ja) 2008-07-03
EP1936998A2 (en) 2008-06-25

Similar Documents

Publication Publication Date Title
CN101207819A (zh) 译码方法及编码方法
US11277634B2 (en) Method and apparatus for processing video signal
CN103024382B (zh) 动态图像编码装置、方法以及动态图像解码装置、方法
CN103430547B (zh) 动图像解码装置、动图像解码方法
CN100553321C (zh) 编码动态滤波器
CN100355291C (zh) 运动图象编码方法和运动图象编码装置
CN105791821B (zh) 动图像解码装置以及动图像解码方法
JP5580453B2 (ja) 直接モード符号化及び復号化装置
CN101389025A (zh) 用于根据多个子像素分辨率进行视频编码的运动细化引擎及其使用方法
CN105409218A (zh) 分量间预测
CN105245875A (zh) 图像解码装置、图像解码方法、接收装置及接收方法
KR100922510B1 (ko) 영상의 부호화 및 복호화 방법, 장치 및 그 애플리케이션
WO2008149327A2 (en) Method and apparatus for motion-compensated video signal prediction
CN101873495A (zh) 场景转换检测装置以及影像记录装置
CN102342104B (zh) 预测图像数据块的方法、实现所述方法的解码和编码设备
CN109413426A (zh) 视频编码处理方法
JP5067471B2 (ja) 復号化方法、復号化装置、及びプログラム
CN115037933A (zh) 一种帧间预测的方法及设备
KR20210055047A (ko) 비트스트림 디코더

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20080625