JP2013009165A - 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法 - Google Patents

動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法 Download PDF

Info

Publication number
JP2013009165A
JP2013009165A JP2011140615A JP2011140615A JP2013009165A JP 2013009165 A JP2013009165 A JP 2013009165A JP 2011140615 A JP2011140615 A JP 2011140615A JP 2011140615 A JP2011140615 A JP 2011140615A JP 2013009165 A JP2013009165 A JP 2013009165A
Authority
JP
Japan
Prior art keywords
prediction
image
encoding
reference image
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011140615A
Other languages
English (en)
Inventor
Yoshimi Moriya
芳美 守屋
Kazuo Sugimoto
和夫 杉本
Yusuke Itani
裕介 伊谷
Shunichi Sekiguchi
俊一 関口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2011140615A priority Critical patent/JP2013009165A/ja
Publication of JP2013009165A publication Critical patent/JP2013009165A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】符号化対象のブロックの中に、動きは異なるが連続している領域が含まれているような場合に、インター予測パラメータに係る情報の符号量を削減することができるようにする。
【解決手段】ブロック分割部1から出力された符号化対象ブロックBnのサイズが所定サイズ以下である場合、符号化制御部2が、符号化対象ブロックBnに属する全てのパーティションPi nに対して、共通のインター予測モードと共通の参照画像指示インデックスを決定して、そのインター予測モード及び参照画像指示インデックスを含むインター予測パラメータを動き補償予測部5及び可変長符号化部13に出力する。
【選択図】図1

Description

この発明は、イントラ予測処理又はインター予測処理を実施して予測符号化を実施する動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法に関するものである。
例えば、AVC/H.264などの国際標準映像符号化方式では、輝度信号16×16画素と、その輝度信号16×16画素に対応する色差信号8×8画素とをまとめたブロックデータ(以下、「マクロブロック」と称する)を一単位として、動き補償技術や直交変換/変換係数量子化技術に基づいて圧縮する方法が採用されている。
動画像符号化装置及び動画像復号装置における動き補償処理では、前方または後方のピクチャを参照して、マクロブロック単位またはマクロブロックをさらに4分割したサブマクロブロック単位で動きベクトルの検出や予測画像の生成を行う。
このとき、1枚のピクチャのみを参照して、画面間予測符号化を行うものをP(Predictive)ピクチャと称し、同時に2枚のピクチャを参照して、画面間予測符号化を行うものをB(Bi−predictive)ピクチャと称する。
国際標準方式であるAVC/H.264(ISO/IEC 14496−10|ITU−T H.264)では、Bピクチャのマクロブロック(以下、「Bマクロブロック」と称する) 、または、Bピクチャのサブマクロブロック(以下、「Bサブマクロブロック」と称する)は、1つないし複数の予測処理単位(パーティション)に分割され、パーティション単位に1枚のピクチャのみを参照して、画面間予測符号化を行うか、同時に2枚のピクチャを参照して画面間予測符号化を行うかを示す予測モードを切り替えて符号化することができる。
なお、予測画像の生成に用いる参照画像は、参照画像リストとして管理されている。
Bピクチャの場合には、2つの参照画像リストが管理されており、それぞれリスト0、リスト1と称される。通常はリスト0が前方向の参照画像を示し、リスト1が後方向の参照画像を示している。
Bマクロブロック又はBサブマクロブロック内のパーティションがリスト0に含まれる1枚の参照画像を参照して画面間予測符号化を行うモードを「Pred_L0」と称し、リスト1に含まれる1枚の参照画像を参照して画面間予測符号化を行うモードを「Pred_L1」と称する。また、リスト0からの1枚の参照画像とリスト1からの1枚の参照画像を同時に参照して画面間予測符号化を行うモードを「Pred_Bi」と称する。
パーティション毎に、Pred_L0/Pred_L1/Pred_Biのいずれの予測モードを適用したかを表す情報は、マクロブロックタイプ、サブマクロブロックタイプに含まれて可変長符号化され、ビットストリームに多重化される。
なお、マクロブロック内のパーティションに対しては、パーティション毎に、Pred_L0/Pred_L1/Pred_Biのいずれかの予測モードを適用できるようになっているが、サブマクロブロック内のパーティションに対しては、すべてのパーティションに対して、Pred_L0/Pred_L1/Pred_Biのいずれかの予測モードを共通に適用するようになっている。
リスト0又はリスト1に2枚以上の参照画像を含む場合には、2枚以上の参照画像の中から予測画像の生成に用いるために選択された参照画像の情報は、リスト毎の参照画像指示インデックスとして、パーティション単位に可変長符号化され、ビットストリームに多重化される。
なお、サブマクロブロック内のパーティションに対しては、すべてのパーティションに対して、同じ参照画像指示インデックスを適用するようになっている。
国際公開第2008/123254号公報
従来の動画像符号化装置は以上のように構成されているので、サブマクロブロックの中に、動きは異なるが連続している領域が含まれているような場合、サブマクロブロックを複数のパーティションに分割して、サブマクロブロックに属するパーティション毎に動きベクトルを決定しているが、サブマクロブロックに属する全てのパーティションに対して、共通の予測モードと共通の参照画像指示インデックスを決定することで、インター予測パラメータに関わる情報の符号量を抑えて、効率的に符号化することができるようにしている。しかしながら、マクロブロックやサブマクロブロックのサイズが固定であるため、サブマクロブロックよりも大きな単位で、動きは異なるが連続している領域を含むような場合に、マクロブロックに属する全てのパーティションに対して、同じ予測モードと同じ参照画像指示インデックスが適用されても、マクロブロックに属するパーティション毎に、予測モードと参照画像指示インデックスを符号化しなければならず、インター予測パラメータに係る情報の符号量が増加してしまうなどの課題があった。
この発明は上記のような課題を解決するためになされたもので、符号化対象のブロックの中に、動きは異なるが連続している領域が含まれているような場合に、インター予測パラメータに係る情報の符号量を削減することができる動画像符号化装置及び動画像符号化方法を得ることを目的とする。
また、この発明は、符号量が削減されているインター予測パラメータを正しく復号することができる動画像復号装置及び動画像復号方法を得ることを目的とする。
この発明に係る動画像符号化装置は、入力画像を階層的に予測処理単位のブロックに分割して、予測処理単位のブロックである符号化対象ブロックを出力するブロック分割手段と、ブロック分割手段から出力される符号化対象ブロックに対するインター予測処理を実施する際に用いるインター予測パラメータを決定する符号化制御手段と、符号化制御手段により決定されたインター予測パラメータに含まれている参照画像指示インデックスが示す参照画像とブロック分割手段から出力された符号化対象ブロックから動きベクトルを生成し、その動きベクトルを用いて、上記符号化対象ブロックに対するインター予測処理を実施することで予測画像を生成する予測画像生成手段と、予測画像生成手段により生成された予測画像とブロック分割手段から出力された符号化対象ブロックの差分画像を変換・量子化し、その差分画像の量子化係数を出力する量子化手段と、量子化手段から出力された量子化係数、符号化制御手段により決定されたインター予測パラメータ及び予測画像生成手段により生成された動きベクトルを可変長符号化して、その量子化係数、インター予測パラメータ及び動きベクトルの符号化データが多重化されているビットストリームを生成する可変長符号化手段とを備え、ブロック分割手段から出力された符号化対象ブロックのサイズが所定サイズ以下である場合、符号化制御手段が、上記符号化対象ブロックに属する全てのパーティションに対して、共通のインター予測モードと共通の参照画像指示インデックスを決定して、そのインター予測モード及び参照画像指示インデックスを含むインター予測パラメータを予測画像生成手段及び可変長符号化手段に出力し、予測画像生成手段が、上記参照画像指示インデックスが示す全てのパーティションで共通の参照画像を用いて、ブロック分割手段から出力された符号化対象ブロックに属するパーティション毎に動きベクトルを生成し、その動きベクトルを用いて、当該パーティションに対するインター予測処理を実施することで予測画像を生成するとともに、その動きベクトルを可変長符号化手段に出力するようにしたものである。
この発明によれば、ブロック分割手段から出力された符号化対象ブロックのサイズが所定サイズ以下である場合、符号化制御手段が、上記符号化対象ブロックに属する全てのパーティションに対して、共通のインター予測モードと共通の参照画像指示インデックスを決定して、そのインター予測モード及び参照画像指示インデックスを含むインター予測パラメータを予測画像生成手段及び可変長符号化手段に出力し、予測画像生成手段が、上記参照画像指示インデックスが示す全てのパーティションで共通の参照画像を用いて、ブロック分割手段から出力された符号化対象ブロックに属するパーティション毎に動きベクトルを生成し、その動きベクトルを用いて、当該パーティションに対するインター予測処理を実施することで予測画像を生成するとともに、その動きベクトルを可変長符号化手段に出力するように構成したので、符号化対象ブロックの中に、動きは異なるが連続している領域が含まれているような場合に、インター予測パラメータに係る情報の符号量を削減することができる効果がある。
この発明の実施の形態1による動画像符号化装置を示す構成図である。 この発明の実施の形態1による動画像符号化装置の動き補償予測部5の内部を示す構成図である。 この発明の実施の形態1による動画像符号化装置の処理内容(動画像符号化方法)を示すフローチャートである。 最大符号化ブロックが階層的に複数の符号化対象ブロックに分割される例を示す説明図である。 (a)は分割後のパーティションの分布を示し、(b)は階層分割によって符号化モードm(Bn)が割り当てられる状況を4分木グラフで示す説明図である。 符号化対象ブロックBn(n≧N)内の全てのパーティションに対して最適な参照画像指示インデックスを決定する処理を示すフローチャートである。 符号化対象ブロックBn(n<N)内のパーティション毎に最適な参照画像指示インデックスを決定する処理を示すフローチャートである。 符号化対象ブロックBn(n≧N)内の全てのパーティションに対して最適な参照画像指示インデックスを決定する処理を示すフローチャートである。 符号化対象ブロックBn(n<N)内のパーティション毎に最適な参照画像指示インデックスを決定する処理を示すフローチャートである。 この発明の実施の形態1による動画像復号装置を示す構成図である。 この発明の実施の形態1による動画像復号装置の処理内容(動画像復号方法)を示すフローチャートである。
実施の形態1.
図1はこの発明の実施の形態1による動画像符号化装置を示す構成図である。
図1において、ブロック分割部1は入力画像を示す映像信号を入力すると、その入力画像を符号化制御部2により決定された符号化ブロックサイズのブロック(予測処理単位のブロック)に分割して、予測処理単位のブロックである符号化対象ブロックを出力する処理を実施する。なお、ブロック分割部1はブロック分割手段を構成している。
符号化制御部2は符号化対象ブロックのサイズである符号化ブロックサイズを決定するとともに、選択可能な1以上のイントラ符号化モード及びインター符号化モードの中から、ブロック分割部1から出力される符号化対象ブロックに対する符号化効率が最も高い符号化モードを決定する処理を実施する。
また、符号化制御部2は符号化効率が最も高い符号化モードがイントラ符号化モードである場合、そのイントラ符号化モードで符号化対象ブロックに対するイントラ予測処理を実施する際に用いるイントラ予測パラメータを決定し、符号化効率が最も高い符号化モードがインター符号化モードである場合、そのインター符号化モードで符号化対象ブロックに対するインター予測処理を実施する際に用いるインター予測パラメータを決定する処理を実施する。
ただし、符号化制御部2は符号化効率が最も高い符号化モードがインター符号化モードである場合、符号化ブロックサイズが所定サイズ以下であれば、符号化対象ブロックに属する全てのパーティションに対して、共通のインター予測モードと共通の参照画像指示インデックスを決定して、そのインター予測モード及び参照画像指示インデックスを含むインター予測パラメータを動き補償予測部5及び可変長符号化部13に出力する処理を実施する。
さらに、符号化制御部2は変換・量子化部7、逆量子化・逆変換部8及び可変長符号化部13に与える予測差分符号化パラメータを決定する処理を実施する。
なお、符号化制御部2は符号化制御手段を構成している。
切換スイッチ3は符号化制御部2により決定された符号化モードがイントラ符号化モードであれば、ブロック分割部1から出力された符号化対象ブロックをイントラ予測部4に出力し、符号化制御部2により決定された符号化モードがインター符号化モードであれば、ブロック分割部1から出力された符号化対象ブロックを動き補償予測部5に出力する処理を実施する。
イントラ予測部4はイントラ予測用メモリ10に格納されている局所復号画像を参照しながら、符号化制御部2により決定されたイントラ予測パラメータを用いて、切換スイッチ3から出力された符号化対象ブロックに対するイントラ予測処理を実施してイントラ予測画像を生成する処理を実施する。
動き補償予測部5は切換スイッチ3から出力された符号化対象ブロックと動き補償予測フレームメモリ12に格納されているフィルタリング処理後の局所復号画像を比較して動きベクトルを探索し、その動きベクトルと符号化制御部2により決定されたインター予測パラメータを用いて、その符号化対象ブロックに対するインター予測処理(動き補償予測処理)を実施してインター予測画像(予測画像)を生成する処理を実施する。
ただし、動き補償予測部5は符号化制御部2により符号化対象ブロックに属する全てのパーティションに対して、共通のインター予測モードと共通の参照画像指示インデックスが決定された場合、その参照画像指示インデックスが示す全てのパーティションで共通の参照画像と、符号化対象ブロックに属する各々のパーティションとを比較して、パーティション毎に動きベクトルを探索し、その動きベクトルと上記インター予測パラメータを用いて、当該パーティションに対するインター予測処理を実施することで予測画像を生成するとともに、その動きベクトルを可変長符号化部13に出力する処理を実施する。
なお、動き補償予測部5は予測画像生成手段を構成している。
減算部6はブロック分割部1より出力された符号化対象ブロックから、イントラ予測部4により生成されたイントラ予測画像、または、動き補償予測部5により生成されたインター予測画像を減算して、その減算結果である予測差分信号(差分画像)を変換・量子化部7に出力する処理を実施する。
変換・量子化部7は符号化制御部2により決定された予測差分符号化パラメータを参照して、減算部6から出力された予測差分信号に対する直交変換処理(例えば、DCT(離散コサイン変換)や、予め特定の学習系列に対して基底設計がなされているKL変換等の直交変換処理)を実施して変換係数を算出するとともに、その予測差分符号化パラメータを参照して、その変換係数を量子化し、量子化後の変換係数である圧縮データ(差分画像の量子化係数)を逆量子化・逆変換部8及び可変長符号化部13に出力する処理を実施する。
なお、減算部6及び変換・量子化部7から量子化手段が構成されている。
逆量子化・逆変換部8は符号化制御部2により決定された予測差分符号化パラメータを参照して、変換・量子化部7から出力された圧縮データを逆量子化するとともに、その予測差分符号化パラメータを参照して、逆量子化後の圧縮データである変換係数に対する逆直交変換処理を実施して、減算部6から出力された予測差分信号に相当する局所復号予測差分信号を算出する処理を実施する。
加算部9は逆量子化・逆変換部8により算出された局所復号予測差分信号と、イントラ予測部4により生成されたイントラ予測画像、または、動き補償予測部5により生成されたインター予測画像とを加算して、ブロック分割部1から出力された符号化対象ブロックに相当する局所復号画像を算出する処理を実施する。
イントラ予測用メモリ10は加算部9により算出された局所復号画像を格納する記録媒体である。
ループフィルタ部11は加算部9により算出された局所復号画像に対して、所定のフィルタリング処理を実施して、フィルタリング処理後の局所復号画像を出力する処理を実施する。
動き補償予測フレームメモリ12はフィルタリング処理後の局所復号画像を格納する記録媒体である。
可変長符号化部13は変換・量子化部7から出力された圧縮データと、符号化制御部2の出力信号(符号化モード、イントラ予測パラメータ又はインター予測パラメータ、予測差分符号化パラメータ)と、動き補償予測部5から出力された動きベクトル(符号化モードがインター符号化モードである場合)とを可変長符号化してビットストリームを生成する処理を実施する。
なお、可変長符号化部13は可変長符号化手段を構成している。
図1の例では、動画像符号化装置の構成要素であるブロック分割部1、符号化制御部2、切換スイッチ3、イントラ予測部4、動き補償予測部5、減算部6、変換・量子化部7、逆量子化・逆変換部8、加算部9、イントラ予測用メモリ10、ループフィルタ部11、動き補償予測フレームメモリ12及び可変長符号化部13のそれぞれが専用のハードウェア(例えば、CPUを実装している半導体集積回路や、ワンチップマイコンなど)で構成されているものを想定しているが、動画像符号化装置がコンピュータで構成される場合、ブロック分割部1、符号化制御部2、切換スイッチ3、イントラ予測部4、動き補償予測部5、減算部6、変換・量子化部7、逆量子化・逆変換部8、加算部9、ループフィルタ部11及び可変長符号化部13の処理内容を記述しているプログラムをコンピュータのメモリに格納し、当該コンピュータのCPUが当該メモリに格納されているプログラムを実行するようにしてもよい。
図3はこの発明の実施の形態1による動画像符号化装置の処理内容(動画像符号化方法)を示すフローチャートである。
図2はこの発明の実施の形態1による動画像符号化装置の動き補償予測部5の内部を示す構成図である。
図2において、動きベクトル探索部21は切換スイッチ3から出力された符号化対象ブロックと動き補償予測フレームメモリ12に格納されている1フレーム以上の参照画像を参照しながら、インター符号化モードで最適な動きベクトルを探索し、その動きベクトルを動き補償処理部22に出力する処理を実施する。
ただし、動きベクトル探索部21は符号化制御部2により符号化対象ブロックに属する全てのパーティションに対して、共通のインター予測モードと共通の参照画像指示インデックスが決定された場合、その参照画像指示インデックスが示す全てのパーティションで共通の参照画像と、符号化対象ブロックに属する各々のパーティションとを比較して、パーティション毎に動きベクトルを探索し、その動きベクトルを動き補償処理部22及び可変長符号化部13に出力する。
動き補償処理部22は動きベクトル探索部21により探索された動きベクトルと動き補償予測フレームメモリ12に格納されている1フレーム以上の参照画像を用いて、符号化制御部2から出力されたインター予測パラメータに基づいてインター予測処理(動き補償予測処理)を実施することで、インター予測画像を生成する処理を実施する。
ただし、動き補償処理部22は符号化制御部2により符号化対象ブロックに属する全てのパーティションに対して、共通のインター予測モードと共通の参照画像指示インデックスが決定された場合、動きベクトル探索部21により探索された動きベクトルと参照画像指示インデックスが示す全てのパーティションで共通の参照画像を用いて、符号化制御部2から出力されたインター予測パラメータに基づいて、当該パーティションに対するインター予測処理を実施することで、インター予測画像を生成する処理を実施する。
図10はこの発明の実施の形態1による動画像復号装置を示す構成図である。
図10において、可変長復号部31は図1の動画像符号化装置により生成されたビットストリームを入力すると、そのビットストリームに多重化されている符号化データから予測処理単位のブロックである復号対象ブロック(符号化対象ブロック)に係る圧縮データ、符号化モード、イントラ予測パラメータ(符号化モードがイントラ符号化モードである場合)、インター予測パラメータ(符号化モードがインター符号化モードである場合)、予測差分符号化パラメータ及び動きベクトル(符号化モードがインター符号化モードである場合)を可変長復号する処理を実施する。
なお、可変長復号部31は符号化対象ブロックに属する全てのパーティションに対して、共通のインター予測モードと共通の参照画像指示インデックスが決定されている場合、共通のインター予測モードと共通の参照画像指示インデックスを含んでいるインター予測パラメータを可変長復号するとともに、符号化対象ブロックに属するパーティション毎の動きベクトルを可変長復号する。
可変長復号部31は可変長復号手段を構成している。
逆量子化・逆変換部32は可変長復号部31により可変長復号された予測差分符号化パラメータを参照して、可変長復号部31により可変長復号された圧縮データを逆量子化するとともに、その予測差分符号化パラメータを参照して、逆量子化後の圧縮データである変換係数に対する逆直交変換処理を実施して、復号予測差分信号を算出する処理を実施する。なお、逆量子化・逆変換部32は逆量子化手段を構成している。
切換スイッチ33は可変長復号部31により可変長復号された符号化モードがイントラ符号化モードであれば、可変長復号部31により可変長復号されたイントラ予測パラメータをイントラ予測部34に出力し、可変長復号部31により可変長復号された符号化モードがインター符号化モードであれば、可変長復号部31により可変長復号されたインター予測パラメータ及び動きベクトルを動き補償部35に出力する処理を実施する。
イントラ予測部34はイントラ予測用メモリ37に格納されている復号画像を参照しながら、切換スイッチ33から出力されたイントラ予測パラメータを用いて、復号対象ブロックに対するイントラ予測処理を実施してイントラ予測画像を生成する処理を実施する。
動き補償部35は動き補償予測フレームメモリ39に格納されているフィルタリング処理後の復号画像を参照しながら、切換スイッチ33から出力された動きベクトルとインター予測パラメータを用いて、復号対象ブロックに対するインター予測処理(動き補償予測処理)を実施してインター予測画像(予測画像)を生成する処理を実施する。
ただし、動き補償部35は復号対象ブロックに属する全てのパーティションに対して、共通のインター予測モードと共通の参照画像指示インデックスが決定されている場合、その参照画像指示インデックスが示す全てのパーティションで共通の参照画像と、パーティション毎の動きベクトルとを用いて、当該パーティションに対するイントラ予測処理を実施してイントラ予測画像を生成する処理を実施する。
なお、動き補償部35は予測画像生成手段を構成している。
加算部36は逆量子化・逆変換部32により算出された復号予測差分信号と、イントラ予測部34により生成されたイントラ予測画像、または、動き補償部35により生成されたインター予測画像とを加算して、復号画像を算出する処理を実施する。
イントラ予測用メモリ37は加算部36により算出された復号画像を格納する記録媒体である。
ループフィルタ部38は加算部36により算出された復号画像に対して、所定のフィルタリング処理を実施して、フィルタリング処理後の復号画像を出力する処理を実施する。
動き補償予測フレームメモリ39はフィルタリング処理後の復号画像を格納する記録媒体である。
図10の例では、動画像復号装置の構成要素である可変長復号部31、逆量子化・逆変換部32、切換スイッチ33、イントラ予測部34、動き補償部35、加算部36、イントラ予測用メモリ37、ループフィルタ部38及び動き補償予測フレームメモリ39のそれぞれが専用のハードウェア(例えば、CPUを実装している半導体集積回路や、ワンチップマイコンなど)で構成されているものを想定しているが、動画像復号装置がコンピュータで構成される場合、可変長復号部31、逆量子化・逆変換部32、切換スイッチ33、イントラ予測部34、動き補償部35、加算部36及びループフィルタ部38の処理内容を記述しているプログラムをコンピュータのメモリに格納し、当該コンピュータのCPUが当該メモリに格納されているプログラムを実行するようにしてもよい。
図11はこの発明の実施の形態1による動画像復号装置の処理内容(動画像復号方法)を示すフローチャートである。
次に動作について説明する。
この実施の形態1では、映像の各フレーム画像を入力画像として、近接フレーム間で動き補償予測を実施して、得られた予測差分信号に対して直交変換・量子化による圧縮処理を施し、その後、可変長符号化を行ってビットストリームを生成する動画像符号化装置と、その動画像符号化装置から出力されるビットストリームを復号する動画像復号装置について説明する。
図1の動画像符号化装置は、映像信号の空間・時間方向の局所的な変化に適応して、映像信号を多様なサイズのブロックに分割して、フレーム内・フレーム間適応符号化を行うことを特徴としている。
一般的に、映像信号は、空間・時間的に信号の複雑さが局所的に変化する特性を有している。空間的に見ると、ある映像フレーム上では、例えば、空や壁などのような比較的広い画像領域中で均一な信号特性を有する絵柄もあれば、人物や細かいテクスチャを含む絵画など、小さい画像領域内で複雑なテクスチャパターンを有する絵柄も混在することがある。
時間的に見ても、空や壁は局所的に時間方向の絵柄の変化は小さいが、動く人物や物体は、その輪郭が時間的に剛体・非剛体の運動をするため、時間的な変化が大きい。
符号化処理は、時間・空間的な予測によって、信号電力やエントロピーの小さい予測差分差信号を生成して、全体の符号量を削減する処理を行うが、予測に用いるパラメータをできるだけ大きな画像信号領域に均一に適用できれば、当該パラメータの符号量を小さくすることができる。
一方、時間的・空間的に変化の大きい画像信号パターンに対して、同一の予測パラメータを大きな画像領域に適用すると、予測の誤りが増えてしまうため、予測差分信号の符号量が増加してしまう。
したがって、時間的・空間的に変化が大きい領域では、同一の予測パラメータを適用して予測処理を行うブロックサイズを小さくして、予測に用いるパラメータのデータ量を増やし、予測差分信号の電力・エントロピーを低減する方が望ましい。
この実施の形態1では、このような映像信号の一般的な性質に適応した符号化を行うため、最初に所定の最大ブロックサイズから予測処理等を開始し、階層的に映像信号の領域を分割し、分割した領域毎に予測処理や、その予測差分の符号化処理を適応化させる構成をとるようにしている。
図1の動画像符号化装置が処理対象とする映像信号フォーマットは、輝度信号と2つの色差信号からなるYUV信号や、ディジタル撮像素子から出力されるRGB信号等の任意の色空間のカラー映像信号のほか、モノクロ画像信号や赤外線画像信号など、映像フレームが水平・垂直2次元のディジタルサンプル(画素)列から構成される任意の映像信号とする。
ただし、各画素の諧調は、8ビットでもよいし、10ビットや12ビットなどの諧調でもよい。
以下の説明では、便宜上、特に断らない限り、入力画像の映像信号はYUV信号であるとし、かつ、2つの色差成分U,Vが輝度成分Yに対して、サブサンプルされた4:2:0フォーマットの信号を扱う場合について述べる。
また、映像信号の各フレームに対応する処理データ単位を「ピクチャ」と称する。
この実施の形態1では、「ピクチャ」は順次走査(プログレッシブスキャン)された映像フレーム信号として説明を行うが、映像信号がインタレース信号である場合、「ピクチャ」は映像フレームを構成する単位であるフィールド画像信号であってもよい。
最初に、図1の動画像符号化装置の処理内容を説明する。
まず、符号化制御部2は、符号化対象となるピクチャ(カレントピクチャ)の符号化に用いる最大符号化ブロックのサイズと、最大符号化ブロックを階層分割する階層数の上限を決定する(図3のステップST1)。
最大符号化ブロックのサイズの決め方としては、例えば、入力画像の映像信号の解像度に応じて、すべてのピクチャに対して同一のサイズを定めてもよいし、入力画像の映像信号の局所的な動きの複雑さの違いをパラメータとして定量化して、動きの激しいピクチャには、小さいサイズを定める一方、動きが少ないピクチャには、大きいサイズを定めるようにしてもよい。
分割階層数の上限の決め方としては、例えば、入力画像の映像信号の動きが激しい場合には、階層数を深くして、より細かい動きが検出できるように設定し、動きが少ない場合には、階層数を抑えるように設定するなどの方法がある。
ブロック分割部1は、入力画像の映像信号を入力すると、符号化制御部2により決定された最大符号化ブロックサイズで、入力画像のピクチャに分割し、分割後の各ピクチャを出力する。
また、符号化制御部2は、最大符号化ブロックサイズの画像領域毎に、先に定めた分割階層数の上限に至るまで、階層的に符号化ブロックサイズを有する符号化対象ブロックに分割して、各符号化対象ブロックに対する符号化モードを決定する(ステップST2)。
ここで、図4は最大符号化ブロックが階層的に複数の符号化対象ブロックに分割される例を示す説明図である。
図4において、最大符号化ブロックは、「第0階層」と記されている輝度成分が(L0,M0)のサイズを有する符号化対象ブロックである。
最大符号化ブロックを出発点として、4分木構造で別途定める所定の深さまで、階層的に分割を行うことによって符号化対象ブロックを得るようにしている。
深さnにおいては、符号化対象ブロックはサイズ(Ln,Mn)の画像領域である。
ただし、LnとMnは、同じであってもよいし、異なっていてもよいが、図4では、Ln=Mnのケースを示している。
以降、符号化制御部2により決定される符号化ブロックサイズは、符号化対象ブロックの輝度成分におけるサイズ(Ln,Mn)と定義する。
4分木分割を行うため、常に、(Ln+1,Mn+1)=(Ln/2,Mn/2)が成立する。
なお、RGB信号など、全ての色成分が同一サンプル数を有するカラー映像信号(4:4:4フォーマット)では、全ての色成分のサイズが(Ln,Mn)になるが、4:2:0フォーマットを扱う場合、対応する色差成分の符号化ブロックサイズは(Ln/2,Mn/2)になる。
以降、第n階層の符号化対象ブロックをBnで表し、符号化対象ブロックBnで選択可能な符号化モードをm(Bn)で表すものとする。
複数の色成分からなるカラー映像信号の場合、符号化モードm(Bn)は、色成分毎に、それぞれ個別のモードを用いるように構成されてもよいし、すべての色成分に対し共通のモードを用いるように構成されてもよい。以降、特に断らない限り、YUV信号、4:2:0フォーマットの符号化ブロックの輝度成分に対する符号化モードを指すものとして説明を行う。
符号化モードm(Bn)には、1つないし複数のイントラ符号化モード(総称して「INTRA」と称する)と、1つないし複数のインター符号化モード(総称して、「INTER」と称する)とがあり、符号化制御部2は、当該ピクチャで利用可能な全ての符号化モード、または、そのサブセットの中から、符号化対象ブロックBnに対する符号化効率が最も高い符号化モードを選択する。
さらに、符号化対象ブロックBnは、図4に示すように、ブロック分割部1によって、1つないし複数の予測処理単位(パーティション)に分割される。
以降、符号化対象ブロックBnに属するパーティションをPi n(iは、第n階層におけるパーティション番号)と表記する。
符号化対象ブロックBnのパーティション分割が、どのようになされているかは、符号化モードm(Bn)の中に情報として含まれる。
パーティションPi nは、すべて符号化モードm(Bn)に従って予測処理が行われるが、符号化対象ブロックBnないしパーティションPi n毎に、予測パラメータが選択される。
符号化制御部2は、最大符号化ブロックに対して、例えば、図5に示すようなブロック分割状態を生成して、符号化対象ブロックを特定する。
図5(a)の斜線部分は、分割後のパーティションの分布を示しており、図5(b)は階層分割によって符号化モードm(Bn)が割り当てられる状況を4分木グラフで示している。
図5(b)の□で囲まれているノードは、符号化モードm(Bn)が割り当てられたノード(符号化対象ブロック)である。
符号化制御部2における階層分割・符号化モード判定の詳細な処理は後述する。
切換スイッチ3は、符号化制御部2により決定された符号化モードm(Bn)がイントラ符号化モードである場合(m(Bn)∈INTRAの場合)、ブロック分割部1から出力された符号化対象ブロックBnをイントラ予測部4に出力する。
一方、符号化制御部2により決定された符号化モードm(Bn)がインター符号化モードである場合(m(Bn)∈INTERの場合)、ブロック分割部1から出力された符号化対象ブロックBnを動き補償予測部5に出力する。
イントラ予測部4は、符号化制御部2により決定された符号化モードm(Bn)がイントラ符号化モードであり(m(Bn)∈INTRAの場合)、切換スイッチ3から符号化対象ブロックBnを受けると(ステップST3)、イントラ予測用メモリ10に格納されている局所復号画像を参照しながら、符号化制御部2により決定されたイントラ予測パラメータを用いて、その符号化対象ブロックBn内の各パーティションPi nに対するイントラ予測処理を実施して、イントラ予測画像PINTRAi nを生成する(ステップST4)。
なお、画像復号装置がイントラ予測画像PINTRAi nと全く同じイントラ予測画像を生成する必要があるため、イントラ予測画像PINTRAi nの生成に用いられたイントラ予測パラメータは、符号化制御部2から可変長符号化部13に出力されて、ビットストリームに多重化される。
動き補償予測部5は、符号化制御部2により決定された符号化モードm(Bn)がインター符号化モードであり(m(Bn)∈INTERの場合)、切換スイッチ3から符号化対象ブロックBnを受けると(ステップST3)、その符号化対象ブロックBn内の各パーティションPi nと動き補償予測フレームメモリ12に格納されているフィルタリング処理後の局所復号画像を比較して動きベクトルを探索し、その動きベクトルと符号化制御部2により決定されたインター予測パラメータを用いて、その符号化対象ブロックBn内の各パーティションPi nに対するインター予測処理を実施して、インター予測画像PINTERi nを生成する(ステップST5)。
動き補償予測部5の具体的な処理内容は後述する。
なお、図10の動画像復号装置がインター予測画像PINTERi nと全く同じインター予測画像を生成する必要があるため、インター予測画像PINTERi nの生成に用いられたインター予測パラメータは、符号化制御部2から可変長符号化部13に出力されて、ビットストリームに多重化される。
インター予測画像の生成に用いられたインター予測パラメータには、下記の情報が含まれている。
(1)パーティションPi nに空間方向または時間方向に隣接する1以上のパーティションのいずれか1つのパーティションのインター予測モード指示情報と参照画像指示インデックス情報および動きベクトルをパーティションPi nに対して適用するかどうかを示すフラグ(マージフラグ)
(2)マージフラグが1の場合(隣接するパーティションのインター予測モード指示情報と参照画像指示インデックス情報及び動きベクトルを用いて、パーティションPi nのインター予測画像を生成する場合)に、空間方向または時間方向に隣接する1以上のパーティションの中から、どのパーティションのインター予測モード指示情報と参照画像指示インデックス情報及び動きベクトルを適用するかを指示するインデックス(マージインデックス)
マージフラグが1ではない場合には、インター予測パラメータには以下の(3)から(5)の情報が含まれる。
(3)動き補償予測フレームメモリ12内に含まれている複数の参照画像のうち、1フレームの参照画像と、1つの動きベクトルとを用いて生成される予測画像をインター予測画像PINTERi nとするか(単一予測モード)、あるいは、2フレームの参照画像と、それぞれの参照画像に対して1つの動きベクトルとを用いて生成される2つの予測画像を補間して生成される補間画像をインター予測画像PINTERi nとするか(双予測モード)を示すインター予測モード指示情報
(4)動き補償予測フレームメモリ12内に2フレーム以上の参照画像を含む構成の場合、予測画像の生成に用いた参照画像を示す参照画像指示インデックス情報
(5)複数の動きベクトルの予測値候補がある場合に、いずれの動きベクトルの予測値を選択して使用するかを示すインデックス情報
減算部6は、ブロック分割部1から符号化対象ブロックBnを受けると、その符号化対象ブロックBn内のパーティションPi nから、イントラ予測部4により生成されたイントラ予測画像PINTRAi n、または、動き補償予測部5により生成されたインター予測画像PINTERi nを減算して、その減算結果である予測差分信号ei nを変換・量子化部7に出力する(ステップST6)。
変換・量子化部7は、減算部6から予測差分信号ei nを受けると、符号化制御部2により決定された予測差分符号化パラメータを参照して、その予測差分信号ei nに対する直交変換処理(例えば、DCT(離散コサイン変換)や、予め特定の学習系列に対して基底設計がなされているKL変換等の直交変換処理)を実施して、その変換係数を算出する。
また、変換・量子化部7は、その予測差分符号化パラメータを参照して、その変換係数を量子化し、量子化後の変換係数である圧縮データを逆量子化・逆変換部8及び可変長符号化部13に出力する(ステップST7)。
逆量子化・逆変換部8は、変換・量子化部7から圧縮データを受けると、符号化制御部2により決定された予測差分符号化パラメータを参照して、その圧縮データを逆量子化する。
また、逆量子化・逆変換部8は、その予測差分符号化パラメータを参照して、逆量子化後の圧縮データである変換係数に対する逆直交変換処理(例えば、逆DCT、逆KL変換など)を実施して、減算部6から出力された予測差分信号ei nに相当する局所復号予測差分信号を算出する(ステップST8)。
加算部9は、逆量子化・逆変換部8から局所復号予測差分信号を受けると、その局所復号予測差分信号と、イントラ予測部4により生成されたイントラ予測画像PINTRAi n、または、動き補償予測部5により生成されたインター予測画像PINTERi nとを加算して、局所復号パーティション画像、あるいは、その局所復号パーティション画像の集まりとして、ブロック分割部1から出力された符号化対象ブロックBnに相当する局所復号画像を算出する(ステップST9)。
なお、加算部9は、その局所復号画像をループフィルタ部11に出力するとともに、その局所復号画像をイントラ予測用メモリ10に格納する。
この局所復号画像が、以降のイントラ予測用の画像信号になる。
ループフィルタ部11は、加算部9から局所復号画像を受けると、その局所復号画像に対して、所定のフィルタリング処理を実施して、フィルタリング処理後の局所復号画像を動き補償予測フレームメモリ12に格納する(ステップST10)。
なお、ループフィルタ部11によるフィルタリング処理は、入力される局所復号画像の最大符号化ブロック、あるいは、個々の符号化ブロック単位で行ってもよいし、1画面分のマクロブロックに相当する局所復号画像が入力された後に1画面分まとめて行ってもよい。
可変長符号化部13は、全ての符号化対象ブロックBnに対するステップST3〜ST9の処理が完了すると(ステップST11、ST12)、変換・量子化部7から出力された圧縮データと、符号化制御部2から出力された符号化モードm(Bn)と、符号化制御部2から出力されたイントラ予測パラメータ(符号化モードがイントラ符号化モードである場合)又はインター予測パラメータ(符号化モードがインター符号化モードである場合)と、動き補償予測部5から出力された動きベクトル(符号化モードがインター符号化モードである場合)とを可変長符号化して、それらの符号化結果を示すビットストリームを生成する(ステップST13)。
可変長符号化部13の具体的な処理内容は後述する。
次に、動き補償予測部5の処理内容を具体的に説明する。ただし、符号化制御部2により符号化対象ブロックBnに属する全てのパーティションPi nに対して、共通のインター予測モードと共通の参照画像指示インデックスが決定される場合の処理内容は後述する。
動き補償予測部5は、符号化制御部2から指示されるインター予測パラメータに含まれるマージフラグが1の場合、動きベクトル探索部をスキップし、符号化制御部2から指示されるインター予測パラメータに含まれるマージインデックスが指示する隣接パーティションのインター予測モード指示情報と参照画像指示インデックス情報および動きベクトルを動き補償処理部22に出力する。
動き補償予測部5は、符号化制御部2から指示されるインター予測パラメータに含まれるマージフラグが0の場合、動き補償予測部5の動きベクトル探索部21は、インター符号化モードが選択された符号化対象ブロックBn内のパーティションPi nを受けとると、そのパーティションPi nと符号化制御部2から指示されるインター予測パラメータ(インター予測モードと参照画像指示インデックスの情報)に基づき、動き補償予測フレームメモリ12に格納されている1フレーム以上の参照画像を参照しながら、そのインター予測パラメータに対し最適な動きベクトルを探索し、その動きベクトルを動き補償処理部22に出力する。
ここで、符号化制御部2から指示されるインター予測パラメータに対して、最適な動きベクトルを探索する処理の一例を説明する。
まず、予測画像の生成に用いる参照画像は、参照に用いる動きベクトル毎に、参照画像リストとして管理されている。
インター予測モードが単一予測モードを示している場合には、1つの参照画像リストが管理され、参照画像リストには、動き補償予測フレーム12に格納されている参照画像の中の1フレーム以上の参照画像に対応付けられる参照画像指示インデックスが管理されている。
例えば、参照画像リストに含まれている参照画像指示インデックスは、符号化画像に対して、時間的に近い参照画像から順番に番号付けされている。なお、参照画像リストに含まれている参照画像指示インデックスは時間的に近い順に並んでいなくてもよい。
インター予測モードが双予測モードを示している場合には、2つの参照画像リストが管理されている。2つの参照画像リストは、参照画像リスト0、参照画像リスト1と称される。
参照画像リスト0に含まれている参照画像指示インデックスは、例えば、符号化画像に対して、時間的に後方向にある参照画像が時間的に近い順に番号付けされて管理されている。
参照画像リスト1に含まれている参照画像指示インデックスは、例えば、符号化画像に対して、時間的に前方向にある参照画像が時間的に近い順に番号付けされて管理されている。
ただし、参照ピクチャリスト0が後方向にある参照画像を示していてもよいし、前方向にある参照画像と後方向にある参照画像を示していてもよいし、時間的に近い順に並んでいなくてもよい。参照画像リスト1に対しても同様である。
また、参照画像リスト0に含まれている参照画像指示インデックスと、参照画像リスト1に含まれている参照画像指示インデックスが同じ参照画像を示していてもよい。
符号化制御部2から指示されるインター予測モードが単一予測モードを示している場合には、符号化制御部2から指示される参照画像指示インデックスで示される参照画像内を探索して、最適な動きベクトルを決定する。
符号化制御部2から指示されるインター予測モードが双予測モードを示している場合には、符号化制御部2から指示される参照画像リスト0の参照画像指示インデックスで示される参照画像内を探索するとともに、参照画像リスト1の参照画像指示インデックスで示される参照画像内を探索し、参照画像リスト0の参照画像に対する動きベクトル0と、参照画像リスト1の参照画像に対する動きベクトル1との最適な組み合わせを決定する。
なお、動きベクトルの探索処理自体は公知の技術であるため詳細な説明を省略する。
動き補償予測部5の動き補償処理部22は、動きベクトル探索部21から動きベクトルを受けると、その動きベクトルと動き補償予測フレームメモリ12に格納されている1フレーム以上の参照画像を用いて、符号化制御部2から出力されるインター予測パラメータに基づいて、インター予測処理を実施することで予測画像を生成する。
インター予測モードが単一予測モードを示している場合には、符号化制御部2から指示される参照画像リストの参照画像指示インデックスで示される参照画像と、動きベクトル探索部21から出力される1つの動きベクトルとを用いて、インター予測処理を実施してインター予測画像を生成する。
インター予測モードが双予測モードを示している場合には、符号化制御部2から出力される参照画像リスト0の参照画像指示インデックスで示される参照画像と、動きベクトル探索部21から出力される参照画像リスト0に対する動きベクトル0を用いて生成される予測画像0と、符号化制御部2から出力される参照画像リスト1の参照画像指示インデックスで示される参照画像と、動きベクトル探索部21から出力される参照画像リスト1に対する動きベクトル1を用いて生成される予測画像1とを補間して生成される補間画像をインター予測画像として出力する。
なお、動き補償処理部22の動き補償予測処理は公知の技術であるため詳細な説明を省略する。
次に、符号化制御部2におけるインター予測パラメータ決定の処理内容を具体的に説明する。
まず、符号化制御部2は、各インター予測モードに対して、最適な参照画像を決定する処理を実施する。
最初に、インター予測モードが単一モードの場合について説明する。
符号化制御部2は、符号化対象ブロックの階層(n)に応じて、その符号化対象ブロックBn内のパーティションPi nに対して有効な参照画像指示インデックスを決定する。
階層nが所定の階層(N)以上の符号化対象ブロックBn(n≧N)内のパーティションPi n(ブロックサイズが所定のサイズより小さいパーティションPi n)に対しては、全てのパーティションPi nに対しマージフラグを0とし、全てのパーティションが共通の参照画像指示インデックスで示される参照画像を用いることとする。
全てのパーティションに適用される参照画像指示インデックスの有効範囲は、0からKの範囲とし、この範囲の中から、全てのパーティションに最適な参照画像指示インデックスを1つ決定する。
一方、階層nが所定の階層(N)より小さい符号化対象ブロックBn(n<N)内のパーティションPi n(ブロックサイズが所定のサイズより大きいパーティションPi n)に対しては、パーティション毎にマージフラグ0または1を指示し、マージフラグ0が指示されたパーティション毎に有効な参照画像指示インデックスの中から最適な参照画像指示インデックスを決定できるようにする。
各パーティションに適用される参照画像指示インデックスの有効範囲は、0からKの範囲とする。
所定の階層(Nの値)は、例えば、符号化制御部2で決定された分割階層数の上限に設定される。
この場合には、一番小さいサイズの符号化対象ブロック内のパーティションのみ、共通のインター予測モードと共通の参照画像指示インデックスが適用される。
別の例では、所定の階層(Nの値)を、符号化対象ブロックを複数まとめた単位であるスライス単位やフレーム単位、複数フレームをまとめたシーケンス単位に切り替えるようにし、それぞれのヘッダ情報にNの値を符号化して、ビットストリームに多重化するようにしてもよい。
また、別の例では、ビットストリームの符号化条件(解像度の上限や使う符号化ツールのセットなど)を表すプロファイルやレベル毎に定めておき、プロファイルやレベルに応じて切り替えるようにしてもよい。
この場合、プロファイルやレベルに応じて、Nの値が一意に決められるため、Nの値を符号化してビットストリームに多重化する必要がない。
符号化対象ブロックBn(n≧N)内の全てのパーティションPi nに対して最適な参照画像指示インデックスを決定する処理について説明する。
図6は符号化対象ブロックBn(n≧N)内の全てのパーティションPi nに対して最適な参照画像指示インデックスを決定する処理を示すフローチャートである。
符号化制御部2は、参照画像リスト内の有効な参照画像指示インデックス(refIdx)を動き補償予測部5に指示する(ステップST21,ST22)。
動き補償予測部5は、符号化制御部2から参照画像リスト内の有効な参照画像指示インデックス(refIdx)を受けると、符号化対象ブロックBnの各パーティションPi nに対し、以下の処理を実施する。
即ち、動き補償予測部5は、参照画像指示インデックス(refIdx)で示される参照画像に対して、最適な動きベクトルを決定する(ステップST23)。
次に、動き補償予測部5は、参照画像指示インデックス(refIdx)で示される参照画像と最適な動きベクトルを用いて、当該パーティションPi nに対する動き補償予測処理を実施することで、インター予測画像PINTERi nを生成する(ステップST24)。
動き補償予測部5は、インター予測画像PINTERi nを生成すると、そのインター予測画像PINTERi nを用いて、パーティションPi n毎に動き補償予測コストを算出する(ステップST25)。
動き補償予測コストには、例えば、インター予測画像と原画像の画素の差分絶対値和(SAD)や、インター予測画像と原画像の画素の差分二乗和(SSE)、インター予測画像と原画像の差分信号をアダマール変換などにより直交変換して得られる変換差分信号の画素の差分絶対値和(SAD)などの予測誤差コストを用いる。
または、これらの予測誤差コストに動きベクトルや参照画像指示インデックスの符号量を加味したコストを用いてもよい。または、差分信号を変換・量子化したのち、逆量子化・逆変換して局所復号予測差分信号を生成し、インター予測画像と加算して局所復号画像を生成し、局所復号画像と原画像の差分二乗和に予測差分信号やインター予測パラメータの符号量を加味した符号量歪みコストを用いてもよい。
符号化制御部2は、符号化対象ブロックBn内の全てのパーティションPi nに対して、動き補償予測部5が参照画像指示インデックス(refIdx)に対する動き補償予測コストを算出すると(ステップST26)、全てのパーティションPi nの動き補償予測コストを加算して、その参照画像指示インデックス(refIdx)に対する符号化対象ブロックBnの動き補償予測コストを算出する(ステップST27)。
有効な全ての参照画像指示インデックスに対して、以上の処理(ステップST23〜ST28)を繰り返し実施する。
符号化制御部2は、参照画像リスト内の有効な全ての参照画像指示インデックスに対する符号化対象ブロックBnの動き補償予測コストを算出すると(ステップST22)、それらの動き補償予測コストを比較して、最小の動き補償予測コストを特定し、動き補償予測コストが最小の参照画像指示インデックス(refIdx)を符号化対象ブロックBnの最適な参照画像指示インデックスに決定する(ステップST29)。
これにより、符号化対象ブロックBn内の全てのパーティションPi nで用いられる共通の参照画像が、最適な参照画像指示インデックスで示される参照画像になる。
符号化対象ブロックBn(n<N)内のパーティション毎に最適な参照画像指示インデックスを決定する処理について説明する。
図7は符号化対象ブロックBn(n<N)内のパーティション毎に最適な参照画像指示インデックスを決定する処理を示すフローチャートである。
符号化制御部2は、参照画像リスト内の有効な参照画像指示インデックス(refIdx)を動き補償予測部5に指示する(ステップST31,ST32)。
動き補償予測部5は、符号化制御部2から参照画像リスト内の有効な参照画像指示インデックス(refIdx)を受けると、符号化対象ブロックBnの各パーティションPi nに対し、以下の処理を実施する。
即ち、動き補償予測部5は、参照画像指示インデックス(refIdx)で示される参照画像に対して、最適な動きベクトルを決定する(ステップST33)。
次に、動き補償予測部5は、参照画像指示インデックス(refIdx)で示される参照画像と最適な動きベクトルを用いて、当該パーティションPi nに対する動き補償予測処理を実施することで、インター予測画像PINTERi nを生成する(ステップST34)。
動き補償予測部5は、インター予測画像PINTERi nを生成すると、そのインター予測画像PINTERi nを用いて、パーティションPi n毎に動き補償予測コストを算出する(ステップST35)。パーティションPi n毎に算出する動き補償予測コストは、n≧Nの場合と同様である。
有効な全ての参照画像指示インデックスに対して、以上の処理(ステップST33〜ST36)を繰り返し実施する。
符号化制御部2は、動き補償予測部5が有効な全ての参照画像指示インデックス(refIdx)に対する動き補償予測コストを算出すると、パーティションPi n毎に、最小の動き補償予測コストを特定し、動き補償予測コストが最小の参照画像指示インデックス(refIdx)をパーティションPi nの最適な参照画像指示インデックスに決定する(ステップST37)。
符号化対象ブロックBn内の全てのパーティションPi nに対して、以上の処理(ステップST31〜ST37)を繰り返し実施して、パーティションPi n毎に最適な参照画像指示インデックスを決定する(ステップST38)。
次に、インター予測モードが双予測モードの場合について説明する。
符号化制御部2は、階層nが所定の階層(N)以上の符号化対象ブロックBn(n≧N)内のパーティションPi n(ブロックサイズが所定のサイズより小さいパーティションPi n)に対しては、全てのパーティションPi nが、同じ参照画像リスト0の参照画像指示インデックスを適用するとともに、同じ参照画像リスト1の参照画像指示インデックスを適用する。
全てのパーティションPi nに適用される参照画像リスト0の参照画像指示インデックスの有効範囲は0からK0の範囲とし、この範囲の中から、全てのパーティションPi nに最適な参照画像リスト0の参照画像指示インデックスを1つ決定する。参照画像リスト1に対しても同様に、参照画像リスト1の参照画像指示インデックスの有効範囲は0からK1の範囲とし、この範囲の中から、全てのパーティションPi nに最適な参照画像リスト1の参照画像指示インデックスを1つ決定する。
一方、階層nが所定の階層(N)より小さい符号化対象ブロックBn(n<N)内のパーティションPi n(ブロックサイズが所定のサイズより大きいパーティションPi n)に対しては、パーティションPi n毎に有効な参照画像指示インデックスの中から最適な参照画像指示インデックスを決定できるようにする。
各パーティションPi nに適用される参照画像リスト0の参照画像指示インデックスの有効範囲は0からK0の範囲とし、参照画像リスト1の参照画像指示インデックスの有効範囲は0からK1の範囲とする。
符号化対象ブロックBn(n≧N)内の全てのパーティションPi nに対して最適な参照画像指示インデックスを決定する処理について説明する。
図8は符号化対象ブロックBn(n≧N)内の全てのパーティションPi nに対して最適な参照画像指示インデックスを決定する処理を示すフローチャートである。
符号化制御部2は、参照画像リスト0内の有効な参照画像指示インデックス(refIdxL0)と、参照画像リスト1内の有効な参照画像指示インデックス(refIdxL1)とを動き補償予測部5に指示する(ステップST41,ST42)。
動き補償予測部5は、符号化制御部2から参照画像リスト0内の有効な参照画像指示インデックス(refIdxL0)と、参照画像リスト1内の有効な参照画像指示インデックス(refIdxL1)とを受けると、参照画像リスト0の参照画像指示インデックス(refIdxL0)で示される参照画像に対する動きベクトル0と、参照画像リスト1の参照画像指示インデックス(refIdxL1)で示される参照画像に対する動きベクトル1との最適な組み合わせを決定する(ステップST43)。
次に、動き補償予測部5は、参照画像リスト0の参照画像指示インデックス(refIdxL0)で示される参照画像と、参照画像リスト1の参照画像指示インデックス(refIdxL1)で示される参照画像と、それぞれの参照画像に対する動きベクトル0,1とを用いて、当該パーティションPi nに対する動き補償予測処理を実施することで、インター予測画像PINTERi nを生成する(ステップST44)。
動き補償予測部5は、インター予測画像PINTERi nを生成すると、単一予測モードの場合と同様に、そのインター予測画像PINTERi nを用いて、パーティションPi n毎に動き補償予測コストを算出する(ステップST45)。
符号化制御部2は、符号化対象ブロックBn内の全てのパーティションPi nに対して、動き補償予測部5が参照画像リスト0の参照画像指示インデックス(refIdxL0)に対する動き補償予測コストと、参照画像リスト1の参照画像指示インデックス(refIdxL1)に対する動き補償予測コストとを算出すると(ステップST46)、全てのパーティションPi nの動き補償予測コストを加算して、参照画像リスト0の参照画像指示インデックス(refIdxL0)と参照画像リスト1の参照画像指示インデックス(refIdxL1)とに対する符号化対象ブロックBnの動き補償予測コストを算出する(ステップST47)。
参照画像リスト0内の有効な全ての参照画像指示インデックスと参照画像リスト1内の有効な全ての参照画像指示インデックスとに対して、以上の処理(ステップST43〜ST48)を繰り返し実施する。
符号化制御部2は、参照画像リスト0内の有効な全ての参照画像指示インデックスと参照画像リスト1内の有効な全ての参照画像指示インデックスとに対する符号化対象ブロックBnの動き補償予測コストを算出すると(ステップST42)、符号化対象ブロックBnの動き補償予測コストを最小とする参照画像リスト0の参照画像指示インデックス(refIdxL0)と参照画像リスト1の参照画像指示インデックス(refIdxL1)とを特定する。
そして、符号化対象ブロックBnの動き補償予測コストを最小とする参照画像リスト0の参照画像指示インデックス(refIdxL0)と参照画像リスト1の参照画像指示インデックス(refIdxL1)とを符号化対象ブロックBnの最適な参照画像指示インデックスに決定する(ステップST49)。
これにより、符号化対象ブロックBn内の全てのパーティションPi nで用いられる共通の参照画像が、参照画像リスト0の最適な参照画像指示インデックスで示される参照画像と、参照画像リスト1の最適な参照画像指示インデックスで示される参照画像とになる。
符号化対象ブロックBn(n<N)内のパーティションPi n毎に最適な参照画像指示インデックスを決定する処理について説明する。
図9は符号化対象ブロックBn(n<N)内のパーティション毎に最適な参照画像指示インデックスを決定する処理を示すフローチャートである。
符号化制御部2は、参照画像リスト0内の有効な参照画像指示インデックス(refIdxL0)と、参照画像リスト1内の有効な参照画像指示インデックス(refIdxL1)とを動き補償予測部5に指示する(ステップST51,ST52)。
動き補償予測部5は、符号化制御部2から参照画像リスト0内の有効な参照画像指示インデックス(refIdxL0)と、参照画像リスト1内の有効な参照画像指示インデックス(refIdxL1)とを受けると、参照画像リスト0の参照画像指示インデックス(refIdxL0)で示される参照画像に対する動きベクトル0と、参照画像リスト1の参照画像指示インデックス(refIdxL1)で示される参照画像に対する動きベクトル1との最適な組み合わせを決定する(ステップST53)。
次に、動き補償予測部5は、参照画像リスト0の参照画像指示インデックス(refIdxL0)で示される参照画像と、参照画像リスト1の参照画像指示インデックス(refIdxL1)で示される参照画像と、それぞれの参照画像に対する動きベクトル0,1とを用いて、当該パーティションPi nに対する動き補償予測処理を実施することで、インター予測画像PINTERi nを生成する(ステップST54)。
動き補償予測部5は、インター予測画像PINTERi nを生成すると、単一予測モードの場合と同様に、そのインター予測画像PINTERi nを用いて、パーティションPi n毎に動き補償予測コストを算出する(ステップST55)。パーティションPi n毎に算出する動き補償予測コストは、n≧Nの場合と同様である。
参照画像リスト0内の有効な全ての参照画像指示インデックスと参照画像リスト1内の有効な全ての参照画像指示インデックスに対して、以上の処理(ステップST53〜ST56)を繰り返し実施する。
符号化制御部2は、動き補償予測部5が参照画像リスト0内の有効な全ての参照画像指示インデックス(refIdxL0)に対する動き補償予測コストと、参照画像リスト1内の有効な全ての参照画像指示インデックス(refIdxL1)に対する動き補償予測コストとを算出すると、パーティションPi nの動き補償予測コストを最小とする参照画像リスト0の参照画像指示インデックス(refIdxL0)と参照画像リスト1の参照画像指示インデックス(refIdxL1)とを特定する。
そして、パーティションPi nの動き補償予測コストを最小とする参照画像リスト0の参照画像指示インデックス(refIdxL0)と参照画像リスト1の参照画像指示インデックス(refIdxL1)とをパーティションPi nの最適な参照画像指示インデックスに決定する(ステップST57)。
符号化対象ブロックBn内の全てのパーティションPi nに対して、以上の処理(ステップST51〜ST57)を繰り返し実施して、パーティションPi n毎に最適な参照画像指示インデックスを決定する(ステップST58)。
符号化制御部2は、上記のようにして、最適な参照画像指示インデックスを決定すると、参照画像指示インデックスと同様に、階層nが所定の階層(N)以上の符号化対象ブロックBn(n≧N)内のパーティションPi nに対しては、全てのパーティションPi nに共通のインター予測モードを決定する。
一方、階層nが所定の階層(N)より小さい符号化対象ブロックBn(n<N)内のパーティションPi nに対しては、パーティションPi n毎にインター予測モードを決定する。
即ち、符号化制御部2は、符号化対象ブロックあるいはパーティション単位に、各インター予測モードに対して決定された動きベクトルと参照画像指示インデックスを用いて生成されるインター予測画像の動き補償予測コストを算出する。
そして、符号化対象ブロックあるいはパーティション単位に算出された動き補償予測コストを比較し、最小の動き補償予測コストを与えるインター予測モードを符号化対象ブロックBnあるいはパーティションPi nの最適なインター予測モードに決定する。
なお、動き補償予測コストは、参照画像の決定処理と同様に、予測誤差コストに動きベクトル、参照画像指示インデックスやインター予測モードなどの符号量を加味したコストを用いる。または、参照画像の決定処理と同様に、符号量歪みコストを用いてもよい。
次に、可変長符号化部13が符号化制御部2から出力されたインター予測パラメータと動き補償予測部5から出力された動きベクトルを可変長符号化する処理内容を具体的に説明する。
可変長符号化部13は、階層nが所定の階層(N)以上の符号化対象ブロックBn(n≧N)については、符号化制御部2が、符号化対象ブロックBn内の全てのパーティションPi nに対して、共通のインター予測モードと参照画像指示インデックスを動き補償予測部5に指示しているので、符号化対象ブロックBn毎に1つのインター予測モードと参照画像指示インデックスを含むインター予測パラメータを可変長符号化して、ビットストリームに多重化する。
動きベクトルについては、動き補償予測部5が符号化対象ブロックBn内のパーティションPi n毎に生成しているので、符号化対象ブロックBn内のパーティションPi n毎に動きベクトルを可変長符号化して、ビットストリームに多重化する。
可変長符号化部13は、階層nが所定の階層(N)より小さい符号化対象ブロックBn(n<N)については、符号化制御部2が、符号化対象ブロックBn内のパーティションPi n毎に1つのインター予測モードと参照画像指示インデックスを動き補償予測部5に指示しているので、符号化対象ブロックBn内のパーティションPi n毎に1つのインター予測モードと参照画像指示インデックスを含むインター予測パラメータを可変長符号化して、ビットストリームに多重化する。
動きベクトルについても、動き補償予測部5が符号化対象ブロックBn内のパーティションPi n毎に生成しているので、符号化対象ブロックBn内のパーティションPi n毎に動きベクトルを可変長符号化して、ビットストリームに多重化する。
以上で明らかなように、この実施の形態1によれば、ブロック分割部1から出力された符号化対象ブロックBnのサイズが所定サイズ以下である場合、符号化制御部2が、符号化対象ブロックBnに属する全てのパーティションPi nに対して、共通のインター予測モードと共通の参照画像指示インデックスを決定して、そのインター予測モード及び参照画像指示インデックスを含むインター予測パラメータを動き補償予測部5及び可変長符号化部13に出力し、動き補償予測部5が、その参照画像指示インデックスが示す全てのパーティションPi nで共通の参照画像を用いて、ブロック分割部1から出力された符号化対象ブロックBnに属するパーティションPi n毎に動きベクトルを生成し、その動きベクトルを用いて、当該パーティションPi nに対するインター予測処理を実施することでインター予測画像PINTERi nを生成するとともに、その動きベクトルを可変長符号化部13に出力するように構成したので、符号化対象ブロックBnの中に、動きは異なるが連続している領域が含まれているような場合に、インター予測パラメータに係る情報の符号量を削減することができる効果を奏する。
即ち、階層nが所定の階層(N)以上の符号化対象ブロックBn(n≧N)については、符号化制御部2が、符号化対象ブロックBn内の全てのパーティションPi nに対して、共通のインター予測モードと共通の参照画像指示インデックスを動き補償予測部5に指示し、動き補償予測部5が、全てのパーティションPi nで共通の参照画像を用いて、パーティションPi n毎に動きベクトルを生成して、インター予測画像PINTERi nを生成するようにしているので、パーティションPi n毎に異なる参照画像へのメモリアクセスが不要になり、メモリアクセスを効率化することができる。
また、階層nが所定の階層(N)以上の符号化対象ブロックBn(n≧N)については、可変長符号化部13が、全てのパーティションPi nで共通のインター予測モードと参照画像指示インデックスを含むインター予測パラメータを符号化対象ブロックBn毎に可変長符号化して、ビットストリームに多重化するようにしているので、インター予測パラメータに係る情報の符号量を削減することができる。
なお、この実施の形態1では、階層nが所定の階層(N)以上の符号化対象ブロックBn(n≧N)に対しては、全てのパーティションPi nに対して共通のインター予測モードと共通の参照画像指示インデックスを適用して、そのインター予測モードと参照画像指示インデックスを含むインター予測パラメータを可変長符号化するようにしているが、全てのパーティションPi nに対して、予め定められたインター予測モードと参照画像指示インデックスを適用することで、そのインター予測モードと参照画像指示インデックスを含むインター予測パラメータを符号化する必要がないようにしてもよい。
例えば、インター予測モードは、単一予測モードあるいは双予測モードのいずれか一方に固定し、参照画像指示インデックスは、固定値0に設定してもよい。また、所定の手順で、周囲の符号化済みの符号化対象ブロックから符号化対象ブロックBnの参照画像指示インデックスを推定し、その推定した値を設定するようにしてもよい。
なお、この実施の形態1では、階層nが所定の階層(N)以上の符号化対象ブロックBn(n≧N)に対しては、全てのパーティションPi nのマージフラグが常に0であるとし、全てのパーティションPi nに対して共通のインター予測モードと共通の参照画像指示インデックスを適用するようにしたので、階層nが所定の階層(N)以上の符号化対象ブロックBn(n≧N)に対しては、マージフラグを可変長符号化する必要がなく、マージフラグに係る情報の符号量を削減することができる。
また、階層nが所定の階層(N)以上のBn(n≧N)に対しては、マージフラグが1であることを禁止し、符号化制御部2が、符号化対象ブロックBn内の全てのパーティションPi nに対して、共通のインター予測モードと共通の参照画像指示インデックスを動き補償予測部5に指示し、動き補償予測部5が、全てのパーティションPi nで共通の参照画像を用いて、パーティションPi n毎に動きベクトルを生成して、インター予測画像PINTERi nを生成するようにしているので、パーティションPi n毎に異なる参照画像へのメモリアクセスが不要になり、メモリアクセスを効率化することができる。
次に、図10の動画像復号装置の処理内容を具体的に説明する。
可変長復号部31は、図1の動画像符号化装置により生成されたビットストリームを入力すると、そのビットストリームに対する可変長復号処理を実施して(図11のステップST61)、1フレーム以上のピクチャから構成されるシーケンス単位、あるいは、ピクチャ単位にフレームサイズの情報を復号する。
即ち、可変長復号部31は、図1の動画像符号化装置の符号化制御部2により決定された最大符号化ブロックサイズ及び分割階層数の上限を図1の動画像符号化装置と同様の手順で決定する(ステップST62)。
例えば、最大符号化ブロックサイズが映像信号の解像度に応じて決められた場合には、復号したフレームサイズ情報に基づいて、動画像符号化装置と同様の手順で最大符号化ブロックサイズを決定する。
最大符号化ブロックサイズ及び分割階層数の上限が、動画像符号化装置側でビットストリームに多重化された場合には、ビットストリームから復号した値を用いる。
動画像符号化装置は、図4で示されるように、最大符号化ブロックを出発点に階層的に複数の符号化対象ブロックに分割して得られる符号化対象ブロック単位に符号化モードや変換・量子化して得られる圧縮データをビットストリームに多重化する。
可変長復号部31は、最大符号化ブロックサイズ及び分割階層数の上限を決定すると、最大符号化ブロックに割り当てられている符号化モードを復号し、その符号化モードに含まれている最大符号化ブロックの分割状態を示す情報を復号する。
そして、可変長復号部31は、最大符号化ブロックの分割状態に基づいて、階層的に分割されている復号対象ブロック(図1の動画像符号化装置の「符号化対象ブロック」に相当するブロック)を特定する(ステップST63)。
次に、可変長復号部31は、復号対象ブロック(符号化対象ブロック)に割り当てられている符号化モードを復号し、その符号化モードに含まれている復号対象ブロックの分割状態を示す情報を復号する。
そして、可変長復号部31は、復号対象ブロックの分割状態に基づいて、その復号対象ブロックを更に1つないし複数の予測処理単位に分割し、符号化対象ブロック単位または予測処理単位に割り当てられている予測パラメータを復号する(ステップST64)。
可変長復号部31は、復号対象ブロック(符号化対象ブロック)に割り当てられている符号化モードがイントラ符号化モードである場合、その復号対象ブロックに含まれている1つ以上のパーティション毎にイントラ予測パラメータを復号する。
一方、復号対象ブロック(符号化対象ブロック)に割り当てられている符号化モードがインター符号化モードである場合、復号対象ブロック毎、あるいは、その復号対象ブロックに含まれている1つ以上のパーティション毎にインター予測パラメータを復号する。
インター予測パラメータの復号は、復号対象ブロック(符号化対象ブロック)の階層nが所定の階層(N)以上であれば、復号対象ブロック毎に、1つのインター予測モードと、各参照画像リストに1つの参照画像指示インデックスを可変長復号する。
そして、復号対象ブロック内の全てのパーティションに対して、共通のインター予測モードと共通の参照画像指示インデックスを設定する。動きベクトルについては、復号対象ブロック内のパーティション毎に可変長復号する。
一方、復号対象ブロック(符号化対象ブロック)の階層nが所定の階層(N)より小さければ、復号対象ブロック内のパーティション毎に、マージフラグを復号し、マージフラグが0の場合にはインター予測モードと、各参照画像リストに対する参照画像指示インデックスと、動きベクトルとを可変長復号する。マージフラグが1の場合には、マージインデックスを復号し、マージインデックスで示される隣接パーティションに適用されたインター予測パラメータ(インター予測モード指示情報、参照画像指示インデックス)と動きベクトルを動き補償部35に出力する。
所定の階層(Nの値)は、図1の動画像符号化装置に設定されている値と同じ値が用いられる。
所定の階層(Nの値)が動画像符号化装置側で分割階層数の上限に設定されている場合には、可変長復号部31で決定された分割階層数の上限に設定される。
この場合、一番小さいサイズの復号対象ブロック(符号化対象ブロック)内のパーティションのみが、共通のインター予測モードと共通の参照画像指示インデックスが適用される。
別の例では、動画像符号化装置側で、所定の階層(Nの値)を、符号化対象ブロックを複数まとめた単位であるスライス単位やフレーム単位、あるいは、複数のフレームをまとめたシーケンス単位に切り替えるようにし、それぞれのヘッダ情報にNの値を符号化して、ビットストリームに多重化しているような場合には、ヘッダ情報から復号した値に設定される。
また、別の例では、動画像符号化装置側で、ビットストリームの符号化条件(解像度の上限や使う符号化ツールのセットなど)を表すプロファイルやレベル毎に定められた値に設定している場合には、動画像符号化装置と同様に、プロファイルやレベル毎に定められた値に設定される。
なお、動画像符号化装置側で、符号化対象ブロックの階層nが所定の階層(N)以上の符号化対象ブロックに含まれる全てのパーティションに対し、固定のインター予測モードや参照画像指示インデックスを適用している場合には、動画像符号化装置と同様の手順で、復号対象ブロック内の全てのパーティションに対して、固定のインター予測モードや参照画像指示インデックスを設定する。
可変長復号部31は、予測処理単位となるパーティションを、更に予測差分符号化パラメータに含まれる変換ブロックサイズの情報に基づき、変換処理単位となる1つないし複数のパーティションに分割し、変換処理単位となるパーティション毎に圧縮データ(変換・量子化後の変換係数)を復号する(ステップST64)。
切換スイッチ33は、可変長復号部31により可変長復号された符号化モードm(Bn)がイントラ符号化モードであれば(m(Bn)∈INTRAの場合)、可変長復号部31により可変長復号されたイントラ予測パラメータをイントラ予測部34に出力する。
一方、可変長復号部31により可変長復号された符号化モードm(Bn)がインター符号化モードであれば(m(Bn)∈INTERの場合)、可変長復号部31により可変長復号されたインター予測パラメータ及び動きベクトルを動き補償部35に出力する。
イントラ予測部34は、可変長復号部31により可変長復号された符号化モードm(Bn)がイントラ符号化モードであり(m(Bn)∈INTRAの場合)、切換スイッチ33からイントラ予測パラメータを受けると(ステップST65)、図1のイントラ予測部4と同様の手順で、イントラ予測用メモリ37に格納されている局所復号画像を参照しながら、切換スイッチ33から出力されたイントラ予測パラメータを用いて、復号対象ブロックBn内の各パーティションPi nに対するイントラ予測処理を実施して、イントラ予測画像PINTRAi nを生成する(ステップST66)。
動き補償部35は、可変長復号部31により可変長復号された符号化モードm(Bn)がインター符号化モードであり(m(Bn)∈INTERの場合)、切換スイッチ33からインター予測パラメータ及び動きベクトルを受けると(ステップST65)、動き補償予測フレームメモリ39に格納されているフィルタリング処理後の復号画像を参照しながら、切換スイッチ33から出力された動きベクトルとインター予測パラメータを用いて、復号対象ブロックBn又はパーティションPi nに対するインター予測処理を実施してインター予測画像PINTERi nを生成する(ステップST67)。
ただし、動き補償部35は、復号対象ブロックBn内の全てのパーティションPi nに対して、共通のインター予測モードと共通の参照画像指示インデックスが決定されている場合、その参照画像指示インデックスが示す全てのパーティションPi nで共通の参照画像と、パーティションPi n毎の動きベクトルとを用いて、当該パーティションPi nに対するイントラ予測処理を実施してイントラ予測画像PINTERi nを生成する。
逆量子化・逆変換部32は、可変長復号部31から圧縮データ及び予測差分符号化パラメータを受けると、図1の逆量子化・逆変換部8と同様の手順で、その予測差分符号化パラメータを参照して、その圧縮データを逆量子化するとともに、その予測差分符号化パラメータを参照して、逆量子化後の圧縮データである変換係数に対する逆直交変換処理を実施して、図1の減算部6から出力された予測差分信号に相当する復号予測差分信号を算出する(ステップST68)。
加算部36は、逆量子化・逆変換部32により算出された復号予測差分信号と、イントラ予測部34により生成されたイントラ予測画像PINTRAi n、または、動き補償部35により生成されたインター予測画像PINTERi nとを加算して、復号対象ブロック内に含まれる1つないし複数の復号パーティション画像の集まりとして、復号画像をループフィルタ部38に出力するとともに、その復号画像をイントラ予測用メモリ37に格納する(ステップST69)。
この復号画像が、以降のイントラ予測用の画像信号になる。
ループフィルタ部11は、全ての復号対象ブロックBnに対するステップST63〜ST69の処理が完了すると(ステップST70)、加算部36から出力された復号画像に対して、所定のフィルタリング処理を実施して、フィルタリング処理後の復号画像を動き補償予測フレームメモリ39に格納する(ステップST71)。
この復号画像が、動き補償予測用の参照画像となり、また、再生画像となる。
この実施の形態1の動画像復号装置では、階層nが所定の階層(N)以上の復号対象ブロック(符号化対象ブロック)Bn(n≧N)については、可変長復号部31が、復号対象ブロックBn単位のインター予測パラメータに含まれているインター予測モードと参照画像指示インデックスを可変長復号し、復号対象ブロックBn内の全てのパーティションPi nに対して、共通のインター予測モードと共通の参照画像指示インデックスを設定するようにしているので、符号量を削減して符号化されたインター予測パラメータを正しく復号することができる。
また、階層nが所定の階層(N)以上の復号対象ブロックBn(n≧N)については、全てのパーティションPi nでマージフラグを0とし、動き補償部35が、全てのパーティションPi nで共通の参照画像と、パーティションPi n毎の動きベクトルとを用いて、インター予測画像PINTERi nを生成するようにしているので、パーティションPi n毎に異なる参照画像へのメモリアクセスが不要になり、メモリアクセスを効率化することができる。
本実施の形態1では、符号化器と復号器の両方に制約をつけるものとして示したが、これはプロファイルなどで規定される、符号化器に課される制約条件として位置づけてもよい。メモリアクセスが制限されている場合などのための制約条件とすることで、性能と処理量のバランスをとることができる。
なお、本願発明はその発明の範囲内において、実施の形態の任意の構成要素の変形、もしくは実施の形態の任意の構成要素の省略が可能である。
1 ブロック分割部(ブロック分割手段)、2 符号化制御部(符号化制御手段)、3 切換スイッチ、4 イントラ予測部、5 動き補償予測部(予測画像生成手段)、6 減算部(量子化手段)、7 変換・量子化部(量子化手段)、8 逆量子化・逆変換部、9 加算部、10 イントラ予測用メモリ、11 ループフィルタ部、12 動き補償予測フレームメモリ、13 可変長符号化部(可変長符号化手段)、21 動きベクトル探索部、22 動き補償処理部、31 可変長復号部(可変長復号手段)、32 逆量子化・逆変換部(逆量子化手段)、33 切換スイッチ、34 イントラ予測部、35 動き補償部(予測画像生成手段)、36 加算部、37 イントラ予測用メモリ、38 ループフィルタ部、39 動き補償予測フレームメモリ。

Claims (4)

  1. 入力画像を階層的に予測処理単位のブロックに分割して、予測処理単位のブロックである符号化対象ブロックを出力するブロック分割手段と、上記ブロック分割手段から出力される符号化対象ブロックに対するインター予測処理を実施する際に用いるインター予測パラメータを決定する符号化制御手段と、上記符号化制御手段により決定されたインター予測パラメータに含まれている参照画像指示インデックスが示す参照画像と上記ブロック分割手段から出力された符号化対象ブロックから動きベクトルを生成し、上記動きベクトルを用いて、上記符号化対象ブロックに対するインター予測処理を実施することで予測画像を生成する予測画像生成手段と、上記予測画像生成手段により生成された予測画像と上記ブロック分割手段から出力された符号化対象ブロックの差分画像を量子化し、上記差分画像の量子化係数を出力する量子化手段と、上記量子化手段から出力された量子化係数、上記符号化制御手段により決定されたインター予測パラメータ及び上記予測画像生成手段により生成された動きベクトルを可変長符号化して、上記量子化係数、上記インター予測パラメータ及び上記動きベクトルの符号化データが多重化されているビットストリームを生成する可変長符号化手段とを備え、
    上記符号化制御手段は、上記ブロック分割手段から出力された符号化対象ブロックのサイズが所定サイズ以下である場合、上記符号化対象ブロックに属する全てのパーティションに対して、共通のインター予測モードと共通の参照画像指示インデックスを決定して、上記インター予測モード及び上記参照画像指示インデックスを含むインター予測パラメータを上記予測画像生成手段及び上記可変長符号化手段に出力し、
    上記予測画像生成手段は、上記参照画像指示インデックスが示す全てのパーティションで共通の参照画像を用いて、上記ブロック分割手段から出力された符号化対象ブロックに属するパーティション毎に動きベクトルを生成し、上記動きベクトルを用いて、当該パーティションに対するインター予測処理を実施することで予測画像を生成するとともに、上記動きベクトルを上記可変長符号化手段に出力することを特徴とする動画像符号化装置。
  2. ビットストリームに多重化されている符号化データから予測処理単位のブロックである符号化対象ブロックに係る量子化係数、インター予測パラメータ及び動きベクトルを可変長復号する可変長復号手段と、上記可変長復号手段により可変長復号された符号化対象ブロックに係るインター予測パラメータに含まれている参照画像指示インデックスが示す参照画像及び当該符号化対象ブロックに係る動きベクトルを用いて、上記符号化対象ブロックに対するインター予測処理を実施することで予測画像を生成する予測画像生成手段と、上記可変長復号手段により可変長復号された符号化対象ブロックに係る量子化係数を逆量子化して、量子化前の差分画像を生成する差分画像生成手段と、上記差分画像生成手段により生成された差分画像と上記予測画像生成手段により生成された予測画像とを加算して復号画像を生成する復号画像生成手段とを備え、
    上記可変長復号手段は、上記符号化対象ブロックに属する全てのパーティションに対して、共通のインター予測モードと共通の参照画像指示インデックスを含んでいるインター予測パラメータを可変長復号するとともに、上記符号化対象ブロックに属するパーティション毎の動きベクトルを可変長復号して、上記インター予測パラメータ及び上記動きベクトルを上記予測画像生成手段に出力し、
    上記予測画像生成手段は、上記参照画像指示インデックスが示す全てのパーティションで共通の参照画像とパーティション毎の動きベクトルを用いて、当該パーティションに対するインター予測処理を実施することで予測画像を生成することを特徴とする動画像復号装置。
  3. ブロック分割手段が、入力画像を階層的に予測処理単位のブロックに分割して、予測処理単位のブロックである符号化対象ブロックを出力するブロック分割処理ステップと、符号化制御手段が、上記ブロック分割処理ステップで出力される符号化対象ブロックに対するインター予測処理を実施する際に用いるインター予測パラメータを決定する符号化制御処理ステップと、予測画像生成手段が、上記符号化制御処理ステップで決定されたインター予測パラメータに含まれている参照画像指示インデックスが示す参照画像と上記ブロック分割処理ステップで出力された符号化対象ブロックから動きベクトルを生成し、上記動きベクトルを用いて、上記符号化対象ブロックに対するインター予測処理を実施することで予測画像を生成する予測画像生成処理ステップと、量子化手段が、上記予測画像生成処理ステップで生成された予測画像と上記ブロック分割処理ステップで出力された符号化対象ブロックの差分画像を量子化し、上記差分画像の量子化係数を出力する量子化処理ステップと、可変長符号化手段が、上記量子化処理ステップで出力された量子化係数、上記符号化制御処理ステップで決定されたインター予測パラメータ及び上記予測画像生成処理ステップで生成された動きベクトルを可変長符号化して、上記量子化係数、上記インター予測パラメータ及び上記動きベクトルの符号化データが多重化されているビットストリームを生成する可変長符号化処理ステップとを備え、
    上記符号化制御処理ステップでは、上記ブロック分割処理ステップで出力された符号化対象ブロックのサイズが所定サイズ以下である場合、上記符号化対象ブロックに属する全てのパーティションに対して、共通のインター予測モードと共通の参照画像指示インデックスを決定して、上記インター予測モード及び上記参照画像指示インデックスを含むインター予測パラメータを上記予測画像生成処理ステップ及び上記可変長符号化処理ステップに与え、
    上記予測画像生成処理ステップでは、上記参照画像指示インデックスが示す全てのパーティションで共通の参照画像を用いて、上記ブロック分割処理ステップで出力された符号化対象ブロックに属するパーティション毎に動きベクトルを生成し、上記動きベクトルを用いて、当該パーティションに対するインター予測処理を実施することで予測画像を生成するとともに、上記動きベクトルを上記可変長符号化処理ステップに与えることを特徴とする動画像符号化方法。
  4. 可変長復号手段が、ビットストリームに多重化されている符号化データから予測処理単位のブロックである符号化対象ブロックに係る量子化係数、インター予測パラメータ及び動きベクトルを可変長復号する可変長復号処理ステップと、予測画像生成手段が、上記可変長復号処理ステップで可変長復号された符号化対象ブロックに係るインター予測パラメータに含まれている参照画像指示インデックスが示す参照画像及び当該符号化対象ブロックに係る動きベクトルを用いて、上記符号化対象ブロックに対するインター予測処理を実施することで予測画像を生成する予測画像生成処理ステップと、差分画像生成手段が、上記可変長復号処理ステップで可変長復号された符号化対象ブロックに係る量子化係数を逆量子化して、量子化前の差分画像を生成する差分画像生成処理ステップと、復号画像生成手段が、上記差分画像生成処理ステップで生成された差分画像と上記予測画像生成処理ステップで生成された予測画像とを加算して復号画像を生成する復号画像生成処理ステップとを備え、
    上記可変長復号処理ステップでは、上記符号化対象ブロックに属する全てのパーティションに対して、共通のインター予測モードと共通の参照画像指示インデックスを含んでいるインター予測パラメータを可変長復号するとともに、上記符号化対象ブロックに属するパーティション毎の動きベクトルを可変長復号して、上記インター予測パラメータ及び上記動きベクトルを上記予測画像生成処理ステップに与え、
    上記予測画像生成処理ステップでは、上記参照画像指示インデックスが示す全てのパーティションで共通の参照画像とパーティション毎の動きベクトルを用いて、当該パーティションに対するインター予測処理を実施することで予測画像を生成することを特徴とする動画像復号方法。
JP2011140615A 2011-06-24 2011-06-24 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法 Pending JP2013009165A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011140615A JP2013009165A (ja) 2011-06-24 2011-06-24 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011140615A JP2013009165A (ja) 2011-06-24 2011-06-24 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法

Publications (1)

Publication Number Publication Date
JP2013009165A true JP2013009165A (ja) 2013-01-10

Family

ID=47676163

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011140615A Pending JP2013009165A (ja) 2011-06-24 2011-06-24 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法

Country Status (1)

Country Link
JP (1) JP2013009165A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107888917A (zh) * 2017-11-28 2018-04-06 北京奇艺世纪科技有限公司 一种图像编解码方法及装置
JP2018164297A (ja) * 2010-09-29 2018-10-18 サン パテント トラスト 復号方法、復号装置およびプログラム
CN113808157A (zh) * 2021-11-18 2021-12-17 腾讯科技(深圳)有限公司 图像处理方法、装置、及计算机设备
US11310500B2 (en) 2010-09-30 2022-04-19 Sun Patent Trust Image decoding method, image coding method, image decoding apparatus, image coding apparatus, program, and integrated circuit

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004064398A1 (en) * 2003-01-10 2004-07-29 Thomson Licensing S.A. Fast mode decision making for interframe encoding

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004064398A1 (en) * 2003-01-10 2004-07-29 Thomson Licensing S.A. Fast mode decision making for interframe encoding

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018164297A (ja) * 2010-09-29 2018-10-18 サン パテント トラスト 復号方法、復号装置およびプログラム
USRE48726E1 (en) 2010-09-29 2021-09-07 Sun Patent Trust Image decoding method, image coding method, image decoding apparatus, image coding apparatus and integrated circuit for generating a code stream with a hierarchical code structure
US11310500B2 (en) 2010-09-30 2022-04-19 Sun Patent Trust Image decoding method, image coding method, image decoding apparatus, image coding apparatus, program, and integrated circuit
US11729389B2 (en) 2010-09-30 2023-08-15 Sun Patent Trust Image decoding method, image coding method, image decoding apparatus, image coding apparatus, program, and integrated circuit
CN107888917A (zh) * 2017-11-28 2018-04-06 北京奇艺世纪科技有限公司 一种图像编解码方法及装置
CN107888917B (zh) * 2017-11-28 2021-06-22 北京奇艺世纪科技有限公司 一种图像编解码方法及装置
CN113808157A (zh) * 2021-11-18 2021-12-17 腾讯科技(深圳)有限公司 图像处理方法、装置、及计算机设备
CN113808157B (zh) * 2021-11-18 2022-02-22 腾讯科技(深圳)有限公司 图像处理方法、装置、及计算机设备

Similar Documents

Publication Publication Date Title
JP6768110B2 (ja) 動画像復号装置及び動画像符号化装置
US11889052B2 (en) Method for encoding video information and method for decoding video information, and apparatus using same
US11496749B2 (en) Video decoding device and method using inverse quantization
JP6381724B2 (ja) 画像復号装置
JP5709996B2 (ja) 画像復号装置及び画像復号方法
US20130028328A1 (en) Image encoding method and image decoding method
WO2014051081A1 (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
JP2013009165A (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
JP2015076781A (ja) 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
JP2014168107A (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
Chiu et al. Self-derivation of motion estimation techniques to improve video coding efficiency
JP2015019257A (ja) カラー動画像符号化装置、カラー動画像復号装置、カラー動画像符号化方法及びカラー動画像復号方法
JP2012186762A (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
AU2017251808A1 (en) Video encoding device, video decoding device, video encoding method, and video decoding method
KR20150008337A (ko) 영상의 복호화 방법 및 이를 이용하는 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141017

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141028

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141226

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150317