JPWO2009128208A1 - 動画像符号化装置、動画像復号化装置、動画像符号化方法、および動画像復号化方法 - Google Patents

動画像符号化装置、動画像復号化装置、動画像符号化方法、および動画像復号化方法 Download PDF

Info

Publication number
JPWO2009128208A1
JPWO2009128208A1 JP2010508099A JP2010508099A JPWO2009128208A1 JP WO2009128208 A1 JPWO2009128208 A1 JP WO2009128208A1 JP 2010508099 A JP2010508099 A JP 2010508099A JP 2010508099 A JP2010508099 A JP 2010508099A JP WO2009128208 A1 JPWO2009128208 A1 JP WO2009128208A1
Authority
JP
Japan
Prior art keywords
motion
unit
encoding
moving picture
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010508099A
Other languages
English (en)
Inventor
昌史 高橋
昌史 高橋
山口 宗明
宗明 山口
浩朗 伊藤
浩朗 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JPWO2009128208A1 publication Critical patent/JPWO2009128208A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Abstract

動画像符号化装置は、画面間予測を行って予測差分を計算する画面間予測部106と、複数フレームに渡る対象領域の動き情報をモデル化する動き記述部111と、予測差分に対して符号化を行う周波数変換部109および量子化処理部110と、動き記述部111によるモデル化の情報に基づいて、記号の発生確率に応じた可変長符号化を行う可変長符号化部113とを有し、動き記述部111は、複数フレーム内で、開始フレームおよび終了フレームを指定し、開始フレームと終了フレームとの間の対象領域の動きを時間関数によってモデル化する。

Description

本発明は動画像を符号化する動画像符号化技術および動画像を復号化する動画像復号化技術に関する。
大容量の動画像情報をデジタルデータ化して記録、伝達する手法として、さまざまな規格が国際標準の符号化方式として策定されている。
このような符号化方式のいくつかは、デジタル衛星放送やDVD、携帯電話やデジタルカメラなどにおける符号化方式として採用され、現在ますます利用の範囲が広がり、身近なものとなってきている。
これらの規格では、符号化処理が完了した画像情報を利用して符号化対象画像をブロック単位で予測し、原画像との予測差分を符号化することによって、動画像の持つ冗長性を除いて符号量を減らしている。
特に、対象画像とは別の画像を参照する画面間予測では、符号化対象ブロックと相関の高いブロックを参照画像中から探索することによって、高精度な予測を可能としている。
しかしながら、従来の画面間予測では、予測差分に加えて、ブロック探索の結果を動きベクトルとして符号化する必要があり、符号量のオーバーヘッドが発生してしまう。
このような画面間予測を行う規格の1つであるH.264/AVC(Advanced Video Coding)規格では、動きベクトルの符号量を減らすために、動きベクトルに対する予測技術を導入している。
すなわち、動きベクトルを符号化する際には、対象ブロックの周辺に位置する符号化済みのブロックを利用して対象ブロックの動きベクトルを予測し、予測ベクトルと動きベクトルの差分(差分ベクトル)を可変長符号化する。
これにより動きベクトルの符号量を大幅に削減することに成功したが、H.264/AVCによる動きベクトルの予測精度は十分であるとは言えず、特に動く物体が複数存在するなど動きの複雑な画像に対しては、依然として動きベクトルに多くの符号量が必要であるといった問題があった。
そこで、本発明の目的は、差分ベクトルの算出方法を改善することにより、動きベクトルの符号量を減少させて圧縮効率を向上させることができる動画像符号化装置、動画像復号化装置、動画像符号化方法、および動画像復号化方法を提供することにある。
本発明の前記ならびにその他の目的と新規な特徴は、本明細書の記述および添付図面から明らかになるであろう。
本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、次のとおりである。
すなわち、代表的なものの概要は、動画像符号化装置において、複数フレーム内で、開始フレームおよび終了フレームを指定し、開始フレームと終了フレームとの間の対象領域の動きを時間関数によってモデル化する動き記述部を備えたものである。
また、動画像復号化装置において、開始フレームと終了フレームとの間の対象領域の動きがモデル化された時間関数に基づいて、対象領域の動きベクトルを復号化する可変長復号化部を備えたものである。
本願において開示される発明のうち、代表的なものによって得られる効果を簡単に説明すれば以下のとおりである。
すなわち、代表的なものによって得られる効果は、差分ベクトルの算出方法を改善することにより、動きベクトルの符号量を減少させて圧縮効率を向上させることができ、少ない符号量で高画質の映像を提供することができる。
以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一の部材には原則として同一の符号を付し、その繰り返しの説明は省略する。
まず、図1および図2により、本発明の一実施の形態に係る動画像符号化方法および動画像復号化方法の前提となる画面間予測処理について説明する。図1は本発明の一実施の形態に係る動画像符号化方法および動画像復号化方法の前提となる画面間予測処理を説明するための説明図であり、H.264/AVCによる画面間予測処理の動作について概念的に示したものである。図2は本発明の一実施の形態に係る動画像符号化方法および動画像復号化方法の前提となる画面間予測処理の予測ベクトルの算出を説明するための説明図であり、予測ベクトルを算出する方法について概念的に示したものである。
H.264/AVCでは、符号化対象画像に対してラスタースキャンの順序に従ってブロック単位による符号化を行う。
画面間予測を行う際には、図1に示すように、符号化対象画像503と同じ映像501に含まれる符号化済みの画像の復号画像を参照画像502とし、対象画像中の対象ブロック504と相関の高いブロック505を参照画像中から探索する。
このとき、両ブロックの差分として計算される予測差分に加えて、両ブロックの座標値の差分を動きベクトル506として符号化する。一方復号化の際には上記の逆の手順を行えば良く、復号化された予測差分を参照画像中のブロック505に加えることにより、復号化画像を取得できる。
H.264/AVCでは、以上で説明した動きベクトルによる符号量のオーバーヘッドを低減するために、動きベクトルに対する予測技術を導入している。すなわち、動きベクトルを符号化する際には、対象ブロックの周辺に位置する符号化済みのブロックを利用して対象ブロックの動きベクトルを予測し、予測ベクトルと動きベクトルの差分ベクトルを符号化する。このとき、差分ベクトルの大きさはほぼ0に集中するため、これを可変長符号化することにより符号量を削減できる。
この予測ベクトルの算出は、図2に示すように、対象ブロック601の左側、上側、右上側に隣接する符号化済みのブロックをそれぞれブロックA602、ブロックB603、ブロックC604とし、各ブロックにおける動きベクトルをMVA、MVB、MVCとする。
このとき、予測ベクトルPMVは、引数として指定された複数の値の中央値を返す関数Medianを用いて予測ベクトルPMV605のように算出される。さらに、差分ベクトルDMVを対象ブロックの動きベクトルMVと予測ベクトルPMVの差分ベクトル606として算出し、続いてDMVを可変長符号化する。
以上のように、H.264/AVCでは、動きベクトルに対する予測技術を導入することにより、動きベクトルに必要な符号量を大幅に削減することが可能になった。しかし、H.264/AVCの場合、予測ベクトルを算出する際に空間方向の近傍ブロックしか考慮しておらず、必ずしもオブジェクトの動きを反映できているとは言えなかった。
そのため、特に動く物体が複数存在する画像において、動きベクトルの予測精度が十分とは言えず、依然として動きベクトルに多くの符号量が必要であった。
本実施の形態では、後述するように、符号化対象領域の動きを時間関数としてモデル化して予測ベクトルの算出に利用することにより、動きベクトルに対する予測精度を向上できるようになった。
次に、図3〜図7により、本発明の一実施の形態に係る動画像符号化方法および動画像復号化方法のモデル化について説明する。図3は本発明の一実施の形態に係る動画像符号化方法および動画像復号化方法の動きのモデル化の一例を示す図、図4は本発明の一実施の形態に係る動画像符号化方法および動画像復号化方法の動きベクトルの符号化の一例を示す図、図5は本発明の一実施の形態に係る動画像符号化方法および動画像復号化方法の開始フレームと終了フレームの選択の一例を示す図、図6は本発明の一実施の形態に係る動画像符号化方法および動画像復号化方法の動きのモデル化の他の例を示す図、図7は本発明の一実施の形態に係る動画像符号化方法および動画像復号化方法の開始フレームと終了フレームの選択の他の例を示す図である。
図3に示すように、本実施の形態では、まず、間にn−1枚のフレーム702〜704を挟んで開始フレーム701と終了フレーム705を用意する。続いて、終了フレーム内の特定領域708に対応する領域707を開始フレーム内で探索し、これら対応領域の座標の差分値に基づいて、対象領域の動きを時間関数MVMt706としてモデル化する。
この動きのモデルを利用して、開始フレームと終了フレームに挟まれるフレーム702〜704における動きベクトルの符号化を行う。さらに、モデル化された動き情報を別途符号化し、ストリームに格納する。
例えば、図3に示した例では、対象領域の動きを直線的にモデル化し、時刻tの一次関数によって表している。この場合、関数MVMt706の係数A、B、C、Dを動きパラメータとして符号化する。
さらに、例えば、開始フレーム番号や終了フレーム番号など、関数MVMtによる動きのモデル化が適用可能なフレームの範囲を特定するための情報、および、ブロック番号など、動きのモデル化が適用可能な領域情報を符号化する。
このとき、対象領域の動きをどのようにモデル化するかについては特に問わない。すなわち、図3に示した例では、対象領域の動きを直線によって近似しているが、これを例えば楕円、二次曲線放物線、ベジエ曲線、クロソイド曲線、サイクロイド、反射、振り子運動などによって近似しても構わない。
また、図4においては、関数MVMtによって表された動きのモデルを利用して動きベクトルを符号化しており、ここでは、開始フレーム時刻t=0とするフレーム801と終了フレーム時刻t=nとするフレーム803に挟まれたフレーム時刻t=mとするフレーム802を符号化する場合について示している。
すでに説明したとおり、対象ブロック808の動きベクトルMV804を符号化する際には、開始フレーム内の領域807と、それに対応する終了フレーム内の領域809を利用してモデル化された動きMVMt805を用いる。
すなわち、時刻t=mにおける動きMVMmを動きベクトルMVの予測値とし、差分ベクトルDMV806を動きベクトルMVと予測ベクトルMVMmの差分によって算出する。さらに、H.264/AVCと同様にDMVを可変長符号化する。
以上では、開始フレームと終了フレームに挟まれたフレームにおける動きベクトルの符号化方法を示したが、開始フレームと終了フレームにおける動きベクトルの符号化方法は特に問わない。しかし、例えば、図2に示すH.264/AVCによる方法と同様に、対象ブロックの周辺ブロックを参照して動きベクトルを予測する方法を用いると効果的である。
また、開始フレームと終了フレームの選択方法については特に問わないが、例えば、図5に示す例では、画面内予測のみが利用可能なIピクチャ901と、1枚の参照画像を利用した画面間予測が可能なPピクチャ904、907と、2枚の参照画像を利用した画面間予測が可能なBピクチャ902、903、905、906を利用して符号化する場合について示している。
この場合、Iピクチャ901が符号化された後、これを参照してPピクチャ904が符号化される。続いて、符合化済みの2枚の画像901、904を参照して、Bピクチャ902、903が符号化される。同様にして、Pピクチャ907が次に符号化され、続いて2枚の画像904、907を参照してBピクチャ905、906が符号化される。
このようなピクチャ構造においては、例えば、次のように本実施の形態を適用すると効果的である。すなわち、まず、Iピクチャ901とPピクチャ904に対して符号化を行うと共に、この2枚の画像をそれぞれ開始フレーム、終了フレームとして動きのモデル化を行う。
そして、このモデルを利用して間のBピクチャ902、903を符号化する。続いて、次のPピクチャ907の符号化を行うとともに、この2枚のPピクチャ904、907をそれぞれ開始フレーム、終了フレームとして動きのモデル化を行う。そして、このモデルを利用して間のBピクチャ905、906を符号化する。
以上のように開始フレームと終了フレームを選択することにより、H.264/AVCと比べて特に大きな遅延を起こすことなく符号化を行うことができる。
また、図6に示すように、動きのモデルを利用した符号化と、動きのモデルを利用しない符号化を組み合わせても良い。ここでは、最初のフレーム1301を開始フレームとし、画像の性質に応じて終了フレームを選択する。
この例では、開始フレームとの間に3枚のフレーム1302、1303、1304を挟んで終了フレーム1305を指定している。終了フレームの決定する方法については特に問わないが、例えば、対象領域の動きが、図3の動きモデルMVMt706によって表すことができるフレームの範囲を特定し、それらのフレームを開始フレームと挟むように終了フレームを決定すると効果的である。
また、対象領域の動きが、図3の動きモデルMVMt706等によってモデル化できない場合には、フレーム1306、1307のように、動きのモデル化を行わずに、例えば、図2に示すような従来方法によって動きベクトルを符号化しても良い。こうすることにより、効率的に符号化を行うことができる。
また、開始フレームと終了フレームの選択方法の他の例として、図7に示す。ここではピクチャの種類は特に問わないが、簡単のためIピクチャとPピクチャのみを利用する場合について示している。
この場合、符号化は映像の表示順序と同じ順番(1001→1002→1003→・・・)で行われる。この例では、まず、Iピクチャ1001を符号化した後、これを開始フレーム、n−1枚後の画像1004を終了フレームとして、動きのモデル化を行う。
このとき、画像1004に対しては、動きのモデル化を行うための対応領域探索のみを行い、符号化処理は行わない。続いて、このモデルを利用して、間の画像(1002、1003、・・)を符号化する。
この場合、画像1001を符号化した後で画像1004を先読みする必要があるため符号化を行う際に大きな遅延が発生することになるが、開始フレームと終了フレームの間に多くの画像を挟むことができるようになり、動きのモデル化の効率を高めることができるという利点がある。
上記の例は、いずれも動きのモデル化をブロック単位で行っているが、それ以外にも例えば画像の背景から分離したオブジェクト単位でモデル化を行っても良い。
次に、図8により、本発明の一実施の形態に係る動画像符号化装置の構成および動作について説明する。図8は本発明の一実施の形態に係る動画像符号化装置の構成を示す構成図である。
図8において、動画像符号化装置は、入力された原画像101を保持する入力画像メモリ102、入力画像を小領域に分割するブロック分割部103、ブロック単位で画面内予測を行う画面内予測部105、動き探索部104にて検出された動き量を基にブロック単位で画面間予測を行う画面間予測部106、画像の性質に合った予測符号化手段(予測方法およびブロックサイズ)を決定するモード選択部107、予測差分を生成するための減算部108、予測差分に対して符号化を行う周波数変換部109および量子化処理部110、対象領域における動きのモデル化を行う動き記述部111、モデル化された動きの情報を保持する動き情報メモリ112、記号の発生確率に応じた符号化を行うための可変長符号化部113、一度符号化した予測差分を復号化するための逆量子化処理部114および逆周波数変換部115、復号化された予測差分を用いて復号化画像を生成するための加算部116、復号化画像を保持して後の予測に活用するための参照画像メモリ117から構成されている。
入力画像メモリ102は、原画像101の中から1枚の画像を符号化対象画像として保持し、これをブロック分割部103にて細かなブロックに分割し、動き探索部104、画面内予測部105、および画面間予測部106に渡す。
動き探索部104では、参照画像メモリ117に格納されている復号化済み画像を用いて該当ブロックの動き量を計算し、動きベクトルを画面間予測部106に渡す。画面内予測部105および画面間予測部106では画面内予測処理および画面間予測処理をいくつかの大きさのブロック単位で実行し、モード選択部107にてどちらか最適な予測方法を選ぶ。
続いて減算部108では最適な予測符号化手段(予測方法およびブロックサイズ)による予測差分を生成し、周波数変換部109に渡す。周波数変換部109および量子化処理部110では、送られてきた予測差分に対して指定された大きさのブロック単位でそれぞれDCT(Discrete Cosine Transformation:離散コサイン変換)などの周波数変換および量子化処理を行い、可変長符号化部113および逆量子化処理部114に渡す。
また、動き記述部111では、開始フレームおよび終了フレームに関する情報(画像情報、動きベクトル等)に基づいて対象領域の動きを時間関数によってモデル化し、開始フレーム番号、終了フレーム番号、動きパラメータなどの情報を動き情報メモリ112に送り、記憶する。
さらに、可変長符号化部113では、周波数変換係数によって表される予測差分情報と、例えば、画面内予測を行う際に利用した予測方向や画面間予測を行う際に利用した動きベクトル、および動きのモデル化に利用する動きパラメータなど、復号化に必要な情報を、記号の発生確率に基づいて可変長符号化を行って符号化ストリームを生成する。
このとき、開始フレームと終了フレーム以外のフレームにおける動きベクトルの符号化には、動き情報メモリ112に格納されている動きモデルが利用される。また、逆量子化処理部114および逆周波数変換部115では、量子化後の周波数変換係数に対して、それぞれ逆量子化およびIDCT(Inverse DCT:逆DCT)などの逆周波数変換を施し、予測差分を取得して加算部116に送る。続いて加算部116により復号化画像を生成して参照画像メモリ117に格納する。
次に、図9により、本発明の一実施の形態に係る動画像復号化装置の構成および動作について説明する。図9は本発明の一実施の形態に係る動画像復号化装置の構成を示す構成図である。
図9において、動画像復号化装置は、例えば、図8に示す動画像符号化装置によって生成された符号化ストリーム201に対して可変長符号化の逆の手順を踏む可変長復号化部202、予測差分を復号化するための逆量子化処理部203および逆周波数変換部204、動きパラメータや開始フレーム番号、終了フレーム番号など動きのモデル化に必要な情報を蓄積するための動き情報メモリ205、画面間予測を行う画面間予測部206、画面内予測を行う画面内予測部207、復号化画像を取得するための加算部208、復号化画像を一時的に記憶しておくための参照画像メモリ209から構成されている。
可変長復号化部202では、符号化ストリーム201を可変長復号化し、予測差分の周波数変換係数成分と、ブロックサイズや動きベクトル、および動きパラメータなど予測処理に必要な情報を取得する。
前者の予測差分情報に対しては逆量子化処理部203に、後者の予測処理に必要な情報に対しては、動き情報メモリ205、画面間予測部206、または画面内予測部207に送られる。
続いて、逆量子化処理部203および逆周波数変換部204では、予測差分情報に対してそれぞれ逆量子化と逆周波数変換を施して復号化を行う。また、動き情報メモリ205では、動きパラメータなど動きのモデル化に必要な情報を記憶する。
続いて画面間予測部206または画面内予測部207では、可変長復号化部202から送られてきた情報を基に参照画像メモリ209を参照して予測処理を実行し、加算部208にて復号化画像を生成するとともに、復号化画像を参照画像メモリ209に格納する。
次に、図10および図11により、本発明の一実施の形態に係る動画像符号化装置の動き記述部の構成および動作について説明する。図10は本発明の一実施の形態に係る動画像符号化装置動き記述部の構成の一例を示す構成図、図11は本発明の一実施の形態に係る動画像符号化装置動き記述部の構成の他の例を示す構成図である。
図10において、動き記述部111は、開始フレームおよび終了フレーム原画像もしくは対象画像301を入力し、開始フレームを記憶するための開始フレームメモリ302、開始フレームと終了フレームの間で対応領域の探索を行う動き探索部303、探索結果に基づいて動きのモデル化を行う動き情報モデル化部304から構成され、動きパラメータ305などの動き情報を出力する。
動き記述部111には、まず開始フレームの原画像もしくは復号化画像が入力され、開始フレームメモリ302に記憶される。続いて、終了フレームの原画像もしくは復号化画像が入力されると、動き探索部303では、開始フレームメモリ302に記憶されている開始フレームと、入力された終了フレームの間で対応領域の探索が行われ、探索結果が動き情報モデル化部304に渡される。
動き情報モデル化部304では、探索結果に基づいて動きのモデル化が行われる。動き情報モデル化部304では、例えば、図10の関数MVMt306によって対象領域の動きをモデル化する。
図11において、動き記述部111は、開始フレームおよび終了フレームを符号化する際に算出した動きベクトル401を入力し、開始フレームの動きベクトルを記憶するための開始フレームメモリ402、開始フレームの動きベクトルと終了フレームの動きベクトルから対象領域の動きのモデル化を行う動き情報モデル化部403から構成され、動きパラメータ404などの動き情報を出力する。
動き記述部111には、まず開始フレームを符号化する際に算出した動きベクトルが入力され、開始フレームメモリ402に記憶される。続いて、終了フレームを符号化する際に算出した動きベクトルが入力されると、動き情報モデル化部403では、両ベクトルに基づいて動きのモデル化が行われる。動き情報モデル化部403では、例えば、図11の関数MVMt405によって対象領域の動きをモデル化する。
次に、図12により、本発明の一実施の形態に係る動画像符号化装置の1フレームの符号化処理手順について説明する。図12は本発明の一実施の形態に係る動画像符号化装置の1フレームの符号化処理手順を示すフローチャートである。
まず、符号化対象となるフレーム内に存在するすべてのブロックに対して、以下の処理をループ1として行う(ステップ1101)。すなわち、該当ブロックに対して一度すべての符号化モード予測方法とブロックサイズの組み合わせに対して、ループ2として予測を実行する(ステップ1102)。
ここでは、画面内予測モードかを判断し(ステップ1103)、ステップ1103の判断に応じて、画面内予測処理(ステップ1104)、または画面間予測処理(ステップ1105)を行い、予測差分の計算を行う。
さらに、画面間予測を行う際には、予測差分の他に動きベクトルを符号化する。ここでは、開始フレームかを判断し(ステップ1106)、ステップ1106で対象フレームが開始フレームであれば、画面間予測に利用した動きベクトルを、例えば、図10に示した方法にて保存する(ステップ1107)。
一方、ステップ1106で対象フレームが開始フレームでなければ、終了フレームかを判断し(ステップ1108)、ステップ1108で対象フレームが終了フレームであれば、対応領域の動きベクトルと、保存されている開始フレームの動きベクトルとを利用して動きのモデル化を行い、動きパラメータを算出する(ステップ1109)。
また、ステップ1106、ステップ1108において、対象フレームが開始フレームでも終了フレームでもなければ、動きモデルを利用して差分ベクトルDMVを算出する(ステップ1111)。
なお、開始フレームおよび終了フレームに対するDMVの計算は、H.264/AVCによる従来方式によって行う(ステップ1110)。
続いて、予測差分に対して周波数変換処理(ステップ1112)、量子化処理(ステップ1113)、可変長符号化処理(ステップ1114)を行い、各符号化モードの画質歪と符号量を計算する。
以上の処理を、ループ2により、すべての符合化モードに対して終了すれば、以上の結果に基づいて最も符号化効率の良いモードを選択する(ステップ1115)。
なお、多数の符号化モードの中から最も符号化効率の高いものを選択する際には、例えば、画質歪みと符号量の関係から最適な符号化モードを決定するRD−Optimization方式を利用することによって、効率良く符号化できる。
RD−Optimization方式の詳細については、以下の文献を参照のこと。
「G. Sullivan and T.Wiegand : “Rate−Distortion Optimization for Video Compression”, IEEE Signal Processing Magazine, vol.15, no.6, pp.74−90, 1998.」
続いて、選択された符号化モードに対して、量子化済みの周波数変換係数に逆量子化処理(ステップ1116)と逆周波数変換処理(ステップ1117)を施して予測差分を復号化し、復号化画像を生成して参照画像メモリに格納する(ステップ1118)。
以上の処理を、ループ1により、すべてのブロックに対して完了すれば、画像1フレーム分の符号化は終了する(ステップ1119)。
次に、図13により、本発明の一実施の形態に係る動画像復号化装置の1フレームの符号化処理手順について説明する。図13は本発明の一実施の形態に係る動画像復号化装置の1フレームの符号化処理手順を示すフローチャートである。
まず、1フレーム内のすべてのブロックに対して、以下の処理をループ1として行う(ステップ1201)。すなわち、入力ストリームに対して可変長復号化処理を施し(ステップ1202)、逆量子化処理(ステップ1203)および逆周波数変換処理(ステップ1204)を施して予測差分を復号化する。
続いて、画面内予測モードかを判断し(ステップ1205)、ステップ1205の判断に応じて、画面内予測処理(ステップ1206)、または画面間予測処理(ステップ1210)を行う。
なお、画面間予測を行う際には予測に先駆けて動きベクトルMVの復号化を行う必要がある。ここでは、開始フレームまたは終了フレームかを判断し(ステップ1207)、ステップ1207で、対象フレームが開始フレームまたは終了フレームであれば、H.264/AVCによる従来方式によってMVの復号を行う(ステップ1208)。
一方で、ステップ1207で、対象フレームが開始フレームでも終了フレームでもなければ、動きモデルを利用してMVの復号を行う(ステップ1209)。
以上の処理を、ループ1により、フレーム中のすべてのブロックに対して完了すれば、画像1フレーム分の復号化が終了する(ステップ1211)。
なお、本実施の形態では、周波数変換の一例としてDCTを挙げているが、DST(Discrete Sine Transformation:離散サイン変換)、WT(Wavelet Transformation:ウェーブレット変換)、DFT(Discrete Fourier Transformation:離散フーリエ変換)、KLT(Karhunen−Loeve Transformation:カルーネン−レーブ変換)など、画素間相関除去に利用する直交変換ならどんなものでも構わないし、特に周波数変換を施さずに予測差分そのものに対して符号化を行っても構わない。
さらに、可変長符号化も特に行わなくて良い。また、本実施の形態では、関数MVMtを利用して予測ベクトルを算出していたが、この関数を用いて動きベクトル自体を表現しても良い。この場合、動きベクトルMVはMVMtと等しくなり、差分ベクトルDMVを符号化する必要はない。
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。
本発明は動画像を符号化する動画像符号化技術および動画像を復号化する動画像復号化技術に関し、動画像の符号化・復号化を行う装置に広く適用可能である。
本発明の一実施の形態に係る動画像符号化方法および動画像復号化方法の前提となる画面間予測処理を説明するための説明図である。 本発明の一実施の形態に係る動画像符号化方法および動画像復号化方法の前提となる画面間予測処理の予測ベクトルの算出を説明するための説明図である。 本発明の一実施の形態に係る動画像符号化方法および動画像復号化方法の動きのモデル化の一例を示す図である。 本発明の一実施の形態に係る動画像符号化方法および動画像復号化方法の動きベクトルの符号化の一例を示す図である。 本発明の一実施の形態に係る動画像符号化方法および動画像復号化方法の開始フレームと終了フレームの選択の一例を示す図である。 本発明の一実施の形態に係る動画像符号化方法および動画像復号化方法の動きのモデル化の他の例を示す図である。 本発明の一実施の形態に係る動画像符号化方法および動画像復号化方法の開始フレームと終了フレームの選択の他の例を示す図である。 本発明の一実施の形態に係る動画像符号化装置の構成を示す構成図である。 本発明の一実施の形態に係る動画像復号化装置の構成を示す構成図である。 本発明の一実施の形態に係る動画像符号化装置動き記述部の構成の一例を示す構成図である。 本発明の一実施の形態に係る動画像符号化装置動き記述部の構成の他の例を示す構成図である。 本発明の一実施の形態に係る動画像符号化装置の1フレームの符号化処理手順を示すフローチャートである。 本発明の一実施の形態に係る動画像復号化装置の1フレームの符号化処理手順を示すフローチャートである。
符号の説明
101…原画像、102…入力画像メモリ、103…ブロック分割部、104…動き探索部、105…画面内予測部、106…画面間予測部、107…モード選択部、108…減算部、109…周波数変換部、110…量子化処理部、111…動き記述部、112…動き情報メモリ、113…可変長符号化部、114…逆量子化処理部、115…逆周波数変換部、116…加算部、117…参照画像メモリ、201…符号化ストリーム、202…可変長復号化部、203…逆量子化処理部、204…逆周波数変換部、205…動き情報メモリ、206…画面間予測部、207…画面内予測部、208…加算部、209…参照画像メモリ、301…対象画像、302…開始フレームメモリ、303…動き探索部、304…動き情報モデル化部、305…動きパラメータ、306…動きのモデル化関数、401…動きベクトル、402…開始フレームメモリ、403…動き情報モデル化部、404…動きパラメータ、405…動きのモデル化関数、501…画像、502…参照画像、503…符号化対象画像、504,505…ブロック、601〜606…ブロック、701〜705…フレーム、706…動きのモデル化関数、707,708…領域、801〜803…フレーム、804…動きベクトルMV、805…動きMVMt、806…差分ベクトルDMV、807〜809…領域、901…Iピクチャ、904、907…Pピクチャ、902、903、905、906…Bピクチャ、1001…Iピクチャ、1002〜1004…Iピクチャ、1301〜1307…フレーム。

Claims (12)

  1. 画面間予測を行って予測差分を計算する画面間予測部と、
    複数フレームに渡る対象領域の動き情報をモデル化する動き記述部と、
    前記予測差分に対して符号化を行う周波数変換部および量子化処理部と、
    前記動き記述部による前記モデル化の情報に基づいて、記号の発生確率に応じた可変長符号化を行う可変長符号化部とを有し、
    前記動き記述部は、前記複数フレーム内で、開始フレームおよび終了フレームを指定し、前記開始フレームと前記終了フレームとの間の前記対象領域の動きを時間関数によってモデル化することを特徴とする動画像符号化装置。
  2. 請求項1記載の動画像符号化装置において、
    前記可変長符号化部は、前記対象領域に対して、前記画面間予測を行う際に利用した動きベクトルと、前記動き記述部にて前記対象領域の動きをモデル化した前記時間関数によって算出されたベクトルの差分に対して可変長符号化を行うことを特徴とする動画像符号化装置。
  3. 請求項1記載の動画像符号化装置において、
    前記画面間予測部は、前記動き記述部にて前記対象領域の動きをモデル化した前記時間関数によって算出されたベクトルを用いて動き補償を行うことを特徴とする動画像符号化装置。
  4. 請求項1記載の動画像符号化装置において、
    前記動き記述部は、前記開始フレームおよび前記終了フレームの指定を、前記時間関数によってモデル化可能な範囲で指定することを特徴とする動画像符号化装置。
  5. 画面間予測を行って予測差分を計算する画面間予測部と、複数フレームに渡る対象領域の動き情報をモデル化する動き記述部と、前記予測差分に対して符号化を行う周波数変換部および量子化処理部と、前記動き記述部による前記モデル化の情報に基づいて、記号の発生確率に応じた可変長符号化を行う可変長符号化部とを有する動画像符号化装置における動画像符号化であって、
    前記動き記述部により、前記複数フレーム内で、開始フレームおよび終了フレームが指定され、前記開始フレームと前記終了フレームとの間の前記対象領域の動きが時間関数によってモデル化されることを特徴とする動画像符号化方法。
  6. 請求項5記載の動画像符号化方法において、
    前記可変長符号化部により、前記対象領域に対して、前記画面間予測を行う際に利用した動きベクトルと、前記動き記述部にて前記対象領域の動きをモデル化した前記時間関数によって算出されたベクトルの差分に対して可変長符号化が行われることを特徴とする動画像符号化方法。
  7. 請求項5記載の動画像符号化方法において、
    前記画面間予測部により、前記動き記述部にて前記対象領域の動きをモデル化した前記時間関数によって算出されたベクトルを用いて動き補償が行われることを特徴とする動画像符号化方法。
  8. 請求項5記載の動画像符号化方法において、
    前記動き記述部により、前記開始フレームおよび前記終了フレームの指定が、前記時間関数によってモデル化可能な範囲で指定されることを特徴とする動画像符号化方法。
  9. 可変長符号化されたデータを前記可変長符号化の逆の手順で復号化する可変長復号化部と、
    予測差分を復号化する逆量子化処理部および逆周波数変換部と、
    画面間予測を行い復号化画像を取得する画面間予測部とを有し、
    前記可変長復号化部は、開始フレームと終了フレームとの間の対象領域の動きがモデル化された時間関数に基づいて、前記対象領域の動きベクトルを復号化することを特徴とする動画像復号化装置。
  10. 請求項9記載の動画像復号化装置において、
    前記画面間予測部は、前記対象領域の動きをモデル化した時間関数によって算出された動きベクトルを用いて動き補償を行うことを特徴とする動画像復号化装置。
  11. 可変長符号化されたデータを前記可変長符号化の逆の手順で復号化する可変長復号化部と、予測差分を復号化する逆量子化処理部および逆周波数変換部と、画面間予測を行い復号化画像を取得する画面間予測部とを有する動画像復号化装置における動画像復号化方法であって、
    前記可変長復号化部により、開始フレームと終了フレームとの間の対象領域の動きがモデル化された時間関数に基づいて、前記対象領域の動きベクトルが復号化されることを特徴とする動画像復号化方法。
  12. 請求項11記載の動画像復号化方法において、
    前記画面間予測部により、前記対象領域の動きをモデル化した時間関数によって算出された動きベクトルを用いて動き補償が行われることを特徴とする動画像復号化方法。
JP2010508099A 2008-04-16 2009-03-30 動画像符号化装置、動画像復号化装置、動画像符号化方法、および動画像復号化方法 Pending JPWO2009128208A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2008106980 2008-04-16
JP2008106980 2008-04-16
PCT/JP2009/001449 WO2009128208A1 (ja) 2008-04-16 2009-03-30 動画像符号化装置、動画像復号化装置、動画像符号化方法、および動画像復号化方法

Publications (1)

Publication Number Publication Date
JPWO2009128208A1 true JPWO2009128208A1 (ja) 2011-08-04

Family

ID=41198917

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010508099A Pending JPWO2009128208A1 (ja) 2008-04-16 2009-03-30 動画像符号化装置、動画像復号化装置、動画像符号化方法、および動画像復号化方法

Country Status (2)

Country Link
JP (1) JPWO2009128208A1 (ja)
WO (1) WO2009128208A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2624562A4 (en) * 2010-09-30 2014-11-19 Mitsubishi Electric Corp DYNAMIC IMAGE ENCODING DEVICE, DYNAMIC IMAGE DECODING DEVICE, DYNAMIC IMAGE ENCODING METHOD, AND IMAGE DYNAMIC DECODING METHOD

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005533465A (ja) * 2002-07-15 2005-11-04 アップル コンピュータ、インコーポレイテッド デジタルビデオ符号化処理における可変精度ピクチャ間タイミング指定方法及び装置
JP2007067796A (ja) * 2005-08-31 2007-03-15 Sanyo Electric Co Ltd 符号化方法
JP2007110672A (ja) * 2005-09-14 2007-04-26 Sanyo Electric Co Ltd 符号化方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2947089B2 (ja) * 1994-10-07 1999-09-13 日本電気株式会社 動画像復号方法および装置
FR2833797B1 (fr) * 2001-12-19 2004-02-13 Thomson Licensing Sa Procede d'estimation du mouvement dominant dans une sequence d'images
KR100508798B1 (ko) * 2002-04-09 2005-08-19 엘지전자 주식회사 쌍방향 예측 블록 예측 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005533465A (ja) * 2002-07-15 2005-11-04 アップル コンピュータ、インコーポレイテッド デジタルビデオ符号化処理における可変精度ピクチャ間タイミング指定方法及び装置
JP2007067796A (ja) * 2005-08-31 2007-03-15 Sanyo Electric Co Ltd 符号化方法
JP2007110672A (ja) * 2005-09-14 2007-04-26 Sanyo Electric Co Ltd 符号化方法

Also Published As

Publication number Publication date
WO2009128208A1 (ja) 2009-10-22

Similar Documents

Publication Publication Date Title
US11546627B2 (en) Moving picture decoding method and moving picture encoding method
US10051273B2 (en) Video decoder and video decoding method
JP5061179B2 (ja) 照明変化補償動き予測符号化および復号化方法とその装置
JP2010081465A (ja) 動画像符号化方法および動画像復号化方法
WO2015010319A1 (zh) 一种基于p帧的多假设运动补偿编码方法
JPWO2012121234A1 (ja) 映像符号化装置、映像符号化方法および映像符号化プログラム
US10015508B2 (en) Video encoding device and video encoding method
JP5832263B2 (ja) 画像符号化装置及び画像符号化方法
WO2009128208A1 (ja) 動画像符号化装置、動画像復号化装置、動画像符号化方法、および動画像復号化方法
JP5281597B2 (ja) 動きベクトル予測方法,動きベクトル予測装置および動きベクトル予測プログラム
WO2010061515A1 (ja) 動画像符号化装置及び符号化方法、動画像復号化装置及び復号化方法
JP5788952B2 (ja) 動画像復号化方法
JP2008017304A (ja) 画像符号化装置、画像復号装置、画像符号化方法、及び画像符号化するプログラム
JP5887020B1 (ja) 動画像復号化方法
JP2016136741A (ja) 動画像復号化方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121120

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130611

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130807

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140304

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20140908