JP4359274B2

JP4359274B2 - 動画像圧縮符号化装置

Info

Publication number: JP4359274B2
Application number: JP2005228118A
Authority: JP
Inventors: 秀雄児玉; 天浦野; 智子小林; 安八濱本; 悦子杉本
Original assignee: Sanyo Electric Co Ltd
Current assignee: Sanyo Electric Co Ltd
Priority date: 1995-12-20
Filing date: 2005-08-05
Publication date: 2009-11-04
Anticipated expiration: 2016-12-20
Also published as: JP2005354736A

Description

本発明は、動画像（映像）符号化技術に関し、特に、符号化モードを適応的に選択する技術に関する。例えば、ＭＰＥＧ方式の動画像符号化装置に関する。

（１）動画像データの符号化技法
予測／内挿符号化、動き補償、ＤＣＴ（離散コサイン変換）、量子化、可変長符号化（ＶＬＣ）等が、動画像符号化で用いられている。

予測符号化では、現マクロブロックが参照マクロブロックと比較され、その差がＤＣＴへ出力される。現マクロブロックは現フレームから抽出される１６×１６画素のブロックである。参照マクロブロックは参照フレームから抽出される１６×１６画素のブロックである。参照フレームは、現フレームに先行し、又は後続するフレームである。参照フレームが先行する場合、前方予測符号化と呼ばれる。参照フレームが後続する場合、後方予測符号化と呼ばれる。現フレームに先行する参照フレームと後続する参照フレームの平均が採用される場合は内挿符号化と呼ばれる。

参照フレームから抽出される参照マクロブロックは、現マクロブロックに似ていることが望まれる。このため、例えば、予測誤差が最小のマクロブロックが抽出される。そのマクロブロックの参照フレーム内の位置は、現マクロブロックの現フレーム内の位置とは一般に異なる。この位置の差は動きベクトルによって指定される。現マクロブロックと参照マクロブロックの対応する画素の差、これは動きベクトルによって指定されるものであるが、これがＤＣＴへ出力される。これが、動き補償と呼ばれる。

ＤＣＴでは、８×８画素の現ブロックが、ＤＣＴ技法により８×８の係数行列Ｃijに変換されて量子化器へ出力される。なお、現ブロックは、上記差分のマクロブロックを図３のように分割して得られる。

図４のように、係数行列Ｃijは、或る除数Ｑij（量子化ステップ幅ｑ×各係数行列Ｃijに適当な定数Ｋij）で除算され、余りは丸められる。量子化された係数行列Ｃ’ijはジグザグ走査され、可変長符号化器へ出力される。定数Ｋijは、量子化テーブルにより与えられる。

定数Ｋij、及び／又は、ｑが増加すると、量子化器から出力される量子化された係数データＣ’ijは、より多くの「０」を含むようになり、圧縮レートは上昇する。適応量子化では、動画像符号化器から出力されるビットストリームのビットレートが監視され、量子化ステップ幅は、ビットレートが目標値に適合するようにセットされる。つまり、ビットレートが目標値より小さいときは量子化ステップ幅ｑは小さく制御され、ビットレートが目標値より大きいときは量子化ステップ幅ｑは大きく制御される。

可変長符号化、例えば、ハフマン符号化では、量子化器から出力される量子化後の各係数データＣ’ijに対して、その出現頻度に応じた長さの符号が割り当てられる。

（２）ＭＰＥＧ
或る１つのタイプの動画像符号化システムが、国際標準化機構（ＩＳＯ）傘下の動画像標準化のための専門家委員会（ＭＰＥＧ）により提案されている。ＭＰＥＧ１標準はＩＳＯ／ＩＥＣ１１１７２により与えられ、ＭＰＥＧ２標準は、ＩＳＯ／ＩＥＣ１３８１８により与えられる。

ＭＰＥＧシステムでは、周知の多数のデータ圧縮技法が単一のシステムに集積されている。これらは、動き補償付き予測／内挿符号化、ＤＣＴ、適応量子化、及びＶＬＣを含む。

図２のように、ＭＰＥＧ標準では、Ｉ，Ｐ，Ｂピクチャが用いられている。Ｉピクチャは、ＤＣＴ，量子化、ＶＬＣのみで符号化されるイントラマクロブロックで構成される。即ち、動き補償付き予測／内挿符号化は使われない。Ｉピクチャは、動きベクトル無しで復号される。

Ｐピクチャは、イントラマクロブロックと前方マクロブロックで構成される。Ｐピクチャは、先行するＩ又はＰピクチャからの動きベクトルを用いて復号される。Ｂピクチャは、イントラマクロブロックと、前方予測マクロブロックと、後方予測マクロブロックと、内挿マクロブロックで構成される。Ｂピクチャは、先行及び後続するＩ又はＰピクチャからの動きベクトルを用いて復号される。

（３）符号化モード
６種類の動き補償、即ち、フレーム構造に於けるフレームＭＣ、フィールドＭＣ、デュアルプライムＭＣ、及び、フィールド構造に於けるフィールドＭＣ、１６×８ＭＣ、デュアルプライムＭＣが、ＭＰＥＧ標準で許容されている。３種類の予測方向、即ち、前方向、後方向、及び双方向（前方向及び後方向）が、ＭＰＥＧ標準で許容されている。したがって、ＭＰＥＧ標準では、複数の動き補償モードがある。動きベクトルの個数は動き補償モードに依存している。そして、動き補償を伴わない予測符号化モードと、イントラ符号化モードがＭＰＥＧ標準で許容されている。

したがって、ＭＰＥＧ標準には、複数種類の符号化モードがある。符号化に際しては、許容されている符号化モードの中から最適な符号化モードが各マクロブロックについて選択される。例えば、画面間予測符号化に於いて、予測誤差が最小の符号化モードが選択される。また、最小の予測誤差が所定の閾値を越える場合は、イントラ符号化モードが選択される。ここで、予測誤差は、例えば、現マクロブロックと参照マクロブロックの差の二乗誤差の平均値や、絶対値の平均値で与えられる。

（４）従来技術
動きベクトル検出に関連する従来技術としては、特許文献１、特許文献２、特許文献３、特許文献４、特許文献５、特許文献６等の公報がある。イントラ符号化とインター符号化を選択する選択回路に関連する従来技術としては、特許文献７、特許文献８等の公報がある。動き付き予測／内挿符号化器、ＤＣＴ、適応量子化器、及びＶＬＣを有するエンコーダから出力される符号量に関連する従来技術としては、特許文献９、特許文献１０、特許文献１１等の公報がある。
特開平４−１４５７７７号公報特開平４−７９４８４号公報特開平３−４０６８７号公報特開平４−２０７７９０号公報特開平４−２３４２７６号公報特開平４−４０１９３号公報特開平６−１３３３０１号公報特開平５−１３７１２９号号公報特開平４−２１５３８４号公報特開平２−２９１８０号公報特開平２−２２２３８９号公報

本発明の第１の課題について、説明する。従来においては、各種動き補償モードの中では、予測誤差が一番最低になる動き補償モードが選択されている。しかし、特許文献９(H04N7/13)に示されるように、画像を実際に符号化したときの符号量は、この予測誤差に比例するものではない。また、特許文献１０(H04N7/137)に示されるように、符号化時の符号量に応じてモード選択することが知られている。また、特許文献１１(H04N7/137)に示されるように、動き補償予測符号化を行った場合に、画像自身の符号量だけでなく、動きベクトルの符号量も考慮することが知られている。

しかし、動きベクトルも含めた符号化時の符号量を実際に算出して、符号化のモードを決定するものは、従来においては、存在しない。本願の第１の目的は、動きベクトル含む実際の符号量を考慮した動き補償モード選択方法を提供することである。また、本発明の第２の課題は、このような動画像圧縮符号化装置を提案することである。

本発明の第３の課題について、説明する。従来においては、各種動き補償モードの中では、予測誤差が一番最低になる動き補償モードが選択されている。ところが、後段の量子化回路(118)での量子化ステップ幅(q)が大きな場合（圧縮率が大きい場合）においては、再生画像の画質は劣化する可能性が高い。

このような場合は、予測誤差が一番最低になる動き補償モードの予測符号化を行っても、予測誤差が２番目に最低になる動き補償モードで予測符号化しても、あまり大差がつかない可能性が高いと考えられる。又、このような場合は、予測誤差が一番最低になる動きベクトルで、予測符号化しても、予測誤差が２番目に最低になる動きベクトルで予測符号化しても、復号画像の画質にあまり大差がつかない可能性が高いと考えられる。

しかし、従来においては、圧縮率と動き補償動作とを結び付ける考えはなかった。本願の第３の目的は、この新規の認識に関わるものである。つまり、圧縮率が大きければ、動きベクトルの検出精度又は動き補償モード選択精度が高くても、復号画像の画質的には意味は少ない。また、圧縮率が大きい場合は、実際の符号化における符号量が少ないものが、切望されている状況である。

そこで、圧縮率等に応じて、動き補償動作を好適に変更できればよい。本願の第３の課題は、動き補償関連回路に圧縮率等を知らせることを課題とする。また、ビットストリーム全体の符号量は、必ずしも画像間の予測誤差だけによって決まる訳ではない。即ち、符号化されるものは、差分ブロックまたは処理ブロックの画素値だけではなく、動き補償モード情報、動きベクトル、その他のパラメータ等があり、これらは、動き補償モードによって個数が異なる。また、例えば、動きベクトルの値によっては、却って符号量を増加させることもある。リアルタイムに動画像圧縮データを復号するためには、符号量制御は必須であるから、ある画像の一部分の符号量が増加すると、他の部分の符号量は少なくせざるを得なくなり、全体の画質が劣化することもあり得る。従って、ある一部分の画像間の予測誤差が最小になったとしても、符号量が増加すれば、全体の画質劣化につながることもある。特に、低ビットレートにおける符号化では、画質よりも符号量を減らすことが重要になってくる。

請求項１の発明は、動画像映像信号を複数の異なる動き補償予測符号化モードを用いて圧縮符号化する動き補償予測符号化手段を備える動画像圧縮符号化装置において、前記動き補償予測符号化手段は、量子化回路を含み、前記各動き補償モードにより前記動き補償予測符号化手段で生じる予測誤差を検出するモード別予測誤差検出手段と、このモード別予測誤差検出手段の出力と前記量子化回路の量子化ステップ幅に応じて変更されるしきい値とを比較し、前記しきい値より小さな予測誤差の動き補償モードがあれば、前記各動き補償モードの中から、前記しきい値より小さな予測誤差の動き補償モードをひとつ選定する動き補償モード選択手段と、を備えることを特徴とする動画像圧縮符号化装置である。

本発明では、圧縮率、発生符号量等に応じて、動き補償モード選択処理動作を変更することができる。したがって、エンコーダの状況に応じた適切な動き補償モードの選択処理を行うことができる。

以下では、ＭＰＥＧビデオエンコーダの用語で記述されているが、それは、イメージフレームが部分的に動き補償付き予測や適応量子化に基づいて符号化される他のタイプのビデオエンコーダが使われる得ることを意図している。

（１）典型的なＭＰＥＧエンコーダ（図１）．
図１は典型的なＭＰＥＧエンコーダを示す。このシステムでは、イメージを記述するビデオ信号が、画面並び換え器111に供給される。画面並び換え111器は画面順を並び換える。現フレームが時間的に先行するフレームにより参照される場合は、該現フレームが先行して復号されて画像メモリ142に格納されている必要がある。このため、現フレームとその時間的な先行フレームとは、現フレームが最初に処理されるように並び換えられる。例えば、時間的に先行するＢピクチャによって参照される現Ｉ又はＰピクチャは、先にマクロブロック変換器112へ出力される。

画面並び換え器111で並び換えられたビデオデータは、マクロブロック変換器112に入力される。例えば通常の２ポートメモリを含むマクロブロック変換器112は、信号を、ラスタスキャンフォーマットから１６×１６画素のマクロブロックフォーマットに変換して、減算器114と動き検出器146へ出力する。マクロブロックフォーマットでは、イメージの各フレームは、１６×１６画素の行列にアレンジされた２５６画素を有するマクロブロックの集まりとして表される。マクロブロック変換器112は、これらの画素値をマクロブロック毎に減算器114へ供給する。

非イントラ符号化モードでは、減算器114は、画像メモリ142から供給される参照マクロブロックを、マクロブロック変換器112から供給される対応する現マクロブロックから減算して、動き補償された差分マクロブロックである差分マクロブロックをブロック変換器116へ出力する。イントラ符号化モードでは、減算器114は、マクロブロック変換器112から供給された現マクロブックを、ブロック変換器116へ出力する。

ブロック変換器116は、図３に示すように、信号を、１６×１６画素のマクロブロックフォーマットから、８×８画素の４個のブロックフォーマットに変換して、ＤＣＴ118へ出力する。ブロック変換器116は、これらの画素値をブロック毎にＤＣＴ118へ供給する。

ＤＣＴプロセッサ118は、各ブロックの画素値にＤＣＴ演算を適用して、ＤＣＴ係数行列Ｃijのブロックに変換する。各ブロックは、図４（ｃ）に示すようなジグザグスキャンを用いて、６４個の係数Ｃijのリニアストリームにアレンジされる。何れのブロックに於いても、これらの係数Ｃijの先頭は、画素ブロックの直流（ＤＣ）空間周波数成分を表す。また、残りの係数Ｃijは、次に高い空間周波数成分である。

ＤＣＴプロセッサ118によって供給される係数値は、量子化器120に適用される。量子化器120は、各係数値Ｃijを、割り当てられたビット数を持つ２値に変換する。概して、低い順番の係数に対しては、高い順番の係数に対してよりも、大きいビット数が用いられる。その理由は、人間の目が、低空間周波数のイメージ成分に対してよりも、高空間周波数のイメージ成分に対しての方が、より感受性が鈍いためである。この操作は、例えば、各係数を、空間周波数に比例する各々異なる値によって除算することで実行され得る。

また、各係数値に割り当てられたビット数は、量子化コントローラ132から供給される量子化ステップ幅ｑに応じて変更され得る。量子化ステップ幅ｑは、各係数が、量子化行列Ｋijによって除算される前又は除算された後に、各係数を除算するために適用される。量子化器120はデジタル値の流れを産み、それは、ＶＬＣ124と、逆量子化器136へ入力される。圧縮レートを制御する量子化ステップ幅ｑは可変である。

ＶＬＣ124は、量子化器120からのデータを、例えば、ランレングスのハフマンタイプのコードを用いて符号化する。ハフマンタイプのコードを用いて、ＶＬＣ124は、出現頻度の高いデータ値の結合と０の連続に対して、より少ないビット数を割り当てる。

第２のＶＬＣ134がある。これは、ともにモード決定器150からのデータであるマクロブロックタイプデータＭＢＴと動きベクトルデータとを、可変長符号化する。

ＶＬＣ124で発生された符号と、ＶＬＣ134で発生された符号は、挿入器（ＦＩＦＯメモリ）126に入力する。この挿入器（ＦＩＦＯメモリ）126は、それらを結合して、ビットストリームをバッファメモリ（ＦＩＦＯメモリ）128へ出力する。このビットストリームはバッファメモリ（ＦＩＦＯメモリ）128に格納され、光ディスクのような記録媒体130に記録される。

ＭＰＥＧエンコーダでは、バッファメモリ128のデータ量が監視され、ＭＰＥＧデコーダのバッファメモリに格納されるデータ量がシミュレートされる。これにより、量子化ステップ幅ｑが、ＭＰＥＧデコーダのバッファメモリがオーバーフローしないように制御される。即ち、量子化ステップ幅ｑは、バッファメモリ128と、バッファメモリ128の容量変化を参照して決定される。量子化ステップ幅ｑとしては、通常は、値１〜３１が採用される。

ＢピクチャとＰピクチャでは、差分値がＤＣＴされて出力されため、データ量はＩピクチャより少なくなる。この理由から、ＭＰＥＧでは、目標データ量はピクチャタイプに応じて割り当てられる。また、発生されたデータ量は、各スライスやマクロブロック毎に監視される。データ量は目標値と比較され、量子化コントローラ132によって評価される。例えば、発生符号量が目標値より大きい場合は量子化ステップ幅ｑは大きくされ、量子化は粗くなる。この制御は、量子化コントローラ132により行われる。他方では、発生符号量が目標値より小さい場合は量子化ステップ幅ｑは小さくされ、量子化は細かくなる。バッファメモリ128はフレームタイプ、フレーム特性、量子化ステップ幅に起因して生ずる発生符号量の変動を緩和する。

なお、ＭＰＥＧ標準は、一般的ではないが、固定ビットレートに加えて、可変ビットレートを許容している。ビットレートが変動する場合は、量子化ステップ幅ｑは当然に変動する。

逆量子化器136と逆ＤＣＴ138で構成される局部デコーダは、先行又は後続フレームのための参照イメージデータを再生する。再生されたフレームは、画像メモリ142に格納される。その後、減算器114へ前述のように出力される。加算器140は、上記再生データが差分データである場合に、参照フレーム内の動き補償された参照マクロブロックを上記再生データに加算する。

画像メモリ142は、少なくとも２つのイメージデータを格納する。ＩピクチャとＩピクチャ、ＩピクチャとＰピクチャ、ＰピクチャとＰピクチャのペアの何れかである。画像メモリ142は、各マクロブロックを参照用に出力する。また、動きベクトル検出用に動きベクトル検出器146へ出力する。また、モード決定用にモード決定器150に出力する。動きベクトル検出器146では、現マクロブロックに最も似ている領域が、例えば、予測誤差を用いて参照フレーム内から探し出される。動きベクトル検出器146は、前方検出器146F、双方検出器146M、後方検出器146Bから成る。前方検出器146Fは、前方動きベクトルを検出して、その予測誤差とともに動き補償モード選択器148に出力する。双方検出器146Mは、両方向の動きベクトルを検出して、その予測誤差とともに動き補償モード選択器148に出力する。後方検出器146Bは、後方動きベクトルを検出して、その予測誤差とともに動き補償モード選択器148に出力する。

動き補償モード選択回路148は、最も予測誤差の少ないものを選択する。つまり、３つの動きベクトル検出回路146F,146M,146Bからの予測誤差出力の内、後方向動きベクトル検出回路146Bからの予測誤差がもっとも少なければ、動き補償モード選択回路148は、後方向動き補償を指示するマクロブロックタイプ情報を出力するとともに、後方向動きベクトル検出回路146Bからの動きベクトルを出力する。

また、同様に、３つの動きベクトル検出回路146F,146M,146Bからの予測誤差出力の内、双方向動きベクトル検出回路146Mの予測誤差がもっとも少なければ、動き補償モード選択回路148は、双方向動き補償を指示するマクロブロックタイプ情報を出力するとともに、双方向動きベクトル検出回路146Mからの動きベクトルを出力する。

前段の動き補償モード選択回路148により、マクロブロックを動き補償予測符号化（インター符号化）する場合に、最も、適切な動き補償の方向が選択済みである。しかし、画像のパターンによっては、マクロブロックを符号化する場合に画面内符号化（イントラ符号化）の方が、効率的な場合もある。モード決定回路150は、このイントラ／インターの決定を行う。モード決定回路150については、例えば、特許文献７、特許文献８に示されるように、良く知られている。

モード決定回路150は、マクロブロック変換器112からのマクロブロックの画像の分散値を求める。また、動き補償モード選択回路148からのマクロブロックタイプ情報及び動きベクトルに基づいて動き予測符号化した場合の差分画面の分散値を求める。このために、動き補償モード選択回路148からのマクロブロックタイプ情報及び動きベクトルに基づいて、予測マクロブロックを、動き補償読み出し制御回路144を介して画像メモリ142から読み出して、このモード決定回路150に入力する。

モード決定回路150は、この予測マクロブロックとマクロブロック変換器112からのマクロブロックとの差分画面のマクロブロックを得る。そして、このマクロブロックの分散値を求める。このように求めた２つの分散値を比較することによりマクロブロックのタイプを決定する。この決定に基づいて、マクロブロックタイプ情報を出力する。また、マクロブロックタイプ情報として、インター符号化が選ばれた場合は、動きベクトル情報も出力する。

ＭＰＥＧエンコーダの動作を、図１〜図４を参照しつつ簡単に説明する。まず、画面並び替え回路111は、数十枚の画面から、一枚の画面が画面単位内で圧縮が行われるＩピクチャを設定し、それ以外の画面は、動き補償を用いた画面単位間での圧縮が行われＢピクチャ・Ｐピクチャとする。画面並び替え回路111は、この設定に合わせて画面の並び替えを行う。

そして、画面単位内で圧縮を行うイントラマクロブロックでは、ブロック化回路112で画面を複数の領域に分割し、減算回路114を素通りし、ＤＣＴ回路118でそれぞれに二次元離散余弦変換（ＤＣＴ）を行って周波数成分を求める。このＤＣＴ処理の単位は、８×８画素単位のブロックである。

画面（図４（ａ））はＤＣＴ処理されて、図４（ｂ）に示されるように、周波数成分に変換される。この結果、左上が低周波領域となり、右下が高周波領域となる。得られた周波数成分は、図４（ｄ）で示される値によって除算される。この除算が、量子化である。この量子化時に、人間の視覚特性が高周波に対して鈍感なことを利用し、低周波側には多くの符号を割り当て、高周波側の符号量を少なくするように、量子化する。つまり、前述の値Ｑijは、高周波に当る領域の値が大きく設定された量子化マトリックスＫijと、量子化回路120からの量子化ステップ幅ｑとの、乗算結果である。こうして得られたデータを図４（ｃ）の如く、低周波側から高周波側へジグザグに取り、この結果を可変長符号化する。

また、画面単位間で圧縮を行うインターマクロブロックでは、ブロック化回路112の出力（現画面）と、動き補償による予測画面とを、減算回路114に入力して差分をとり、以降は、Ｉピクチャと同等に符号化する。このようにＢピクチャとＰピクチャは、差分を伝送するので、データ量は小さい。したがって、このままでは、符号化時のデータ量（ビット量）が、画面によって異なる。しかし、ＭＰＥＧでは、転送ビットレートは、ほぼ一定である。

このために、データ量が多い画面が続くと、バッファメモリ128がオーバーフローしてしまう恐れがある。そこで、量子化マトリックス（図４（ｄ）の乗数である量子化ステップ幅ｑの値を変更することにより量子化の粗さを変更して（圧縮率を制御して）、発生データ量をフィードバック制御することにより、オーバーフローを防止している。

動きベクトル検出回路146は、動きベクトルを検出する。動き補償モード選択回路148は、このマクロブロックの適切な符号化モードを検出する。動きベクトル検出回路146、動き補償モード選択回路148では、いくつかある動き補償予測モードのすべての内で、予測誤差が最小になる動き補償モードを選択する。モード決定回路150は、最終的にマクロブロックタイプを決定し、このマクロブロックタイプ情報と、動きベクトルを出力する。

（２）第１実施例（図５〜図８）．
図５において、図１と同一部分には、同一符号を付し説明を省略する。図５において、50は、イントラ符号化用のバッファである。52、54、56は、インター符号化用のバッファである。各バッファは、各動き補償モードにおける、動きベクトル等の付属データを含む画像の符号化データを格納する。

52は、前方向の動き補償予測符号化を行った場合に発生する符号を一時格納するバッファである。54は、双方向の動き補償予測符号化を行った場合に発生する符号を一時格納するバッファである。56は、後方向の動き補償予測符号化を行った場合に発生する符号を一時格納するバッファである。

58は、モード選択回路である。モード選択回路58は、バッファ50、52、54、56の符号量を検出し、符号量が最も少ないモードを選択して、モード決定回路60に出力する。このモード選択回路58は、複数の異なる動き補償予測符号化モードより動画像信号を符号化した場合に、実際に生じる動きベクトルを含めた符号量を検出するモード別発生符号量検出手段58を成している。

モード決定回路60は、符号化する場合のモードを決定する。モード決定回路60は、少なくても、モード選択回路58の出力により、符号化する動き補償モードを選択する適応型動き補償モード選択手段60を成している。

第１実施例の動作を説明する。Ｂピクチャを符号化する場合には、各マクロブロックについて、モードを決定しなくてはならない。動き検出回路146では、符号化するマクロブロックについて、各モードの動きベクトルを求める。

これより、本願の特徴を記載する。モード決定回路60は、図６のＳ１に示すように、まず、イントラ符号化が行われるように本エンコーダを制御する。そして、この時に発生する符号をバッファ50に格納する。

次に、モード決定回路60は、図６のＳ２に示すように、まず、インター符号化のうちの前方向予測符号化が行われるように本エンコーダを制御すると共に、対応する前方向の動きベクトルを出力する。そして、この時に発生する符号をバッファ52に格納する。

モード決定回路60は、図６のＳ３に示すように、インター符号化のうちの双方向予測符号化が行われるように本エンコーダを制御すると共に、対応する双方向の動きベクトルを出力する。そして、この時に発生する符号をバッファ54に格納する。

モード決定回路60は、図６のＳ４に示すように、インター符号化のうちの後方向予測符号化が行われるように本エンコーダを制御すると共に、対応する後方向の動きベクトルを出力する。そして、この時に発生する符号をバッファ56に格納する。

モード選択回路58は、図６のＳ５に示すように、バッファ50、52、54、56の符号量を検出し、もっとも符号量の少ないバッファを検出し、モード決定回路60に知らせる。つまり、モード選択回路58は、バッファ50、52、54、56の符号量を検出し、モード決定回路60は、図６のＳ６に示す如く、このもっとも少ない符号量に対応するモードでの符号化を決定する。ここからは、従来と同様に通常の符号化処理を行う。

このモードの決定について述べる。例えば、バッファ50の符号量が最も少ないのであれば、この時のマクロブロックに適した符号化は、イントラ符号化である。従って、モード選択回路58が、これを検出し、これをモード決定回路60に伝えると、モード決定回路60は、イントラ符号化を行うように本エンコーダを制御するために、イントラ符号化を示すマクロブロックタイプ情報を出力する。

また、バッファ56の符号量がもっとも少ないのであれば、この時のマクロブロックに適した符号化は、後方向の動き補償予測符号化である。従って、モード選択回路58が、これを検出し、これをモード決定回路60に伝えると、モード決定回路60は、後方向の動き補償予測符号化を行うように本エンコーダを制御するために、後方向予測符号化を示すマクロブロックタイプ情報を出力すると共に後方向の動きベクトルを出力する。

このように、この第１実施例によれば、実際の動きベクトルを含む符号量により、モードを選択しているので、発生符号量が少ない動き補償モードを選択することが出来る。なお、この第１実施例は、ハード的な概略回路ブロック図で説明したが、本願は、当然、ＭＰＥＧの符号化をソフトウエアで行う場合に、採用しても良い。また、この第１実施例では、マクロブロックの符号化モードとしてイントラ符号化を含んでいるが、本願はこれに限定されるものではなく、複数種類の動き補償モードだけでもよい。また、この第１実施例は、３つの動き補償モードについて説明したが、本願は、当然、これだけに限定されるわけでなく、例えば、ＭＰＥＧ２のフレーム構造におけるフレーム予測とフィールド予測のモード選択にも利用できる。また、ＭＰＥＧ２のフィールド構造における１６×１６単位の予測と１６×８単位の予測モードの選択にも利用できる。また、Ｐピクチャに用いても良い。

また、第１実施例では、常に、実際の符号量からモードを選択している。しかし、本願は、これに限定されるわけでない。例えば、十分にバッファ128に余裕があり、量子化ステップ幅ｑが最小の場合（圧縮率が小さな場合）は、従来と同様にしてモードを決定してもよい。そして、例えば、バッファ128に余裕がなくなる可能性が高まったり、量子化ステップ幅ｑが増加した場合（圧縮率が大きな場合）に、発生符号量を少なくするために、上述の処理を行うように構成してもよい。

また、この第１実施例は、３つの動き補償モードについては、全て実際に符号化した。しかし、本願は、当然、これだけに限定されるわけでなく。例えば、動き補償モードにおいて、予測誤差が小さい上位２つの動き補償モードについて全て実際に符号化するようにしてもよい。このようにすれば、プログラムにおける演算量を低減でき、処理スピードの高速化が図れる。なお、前述したように予測誤差が少ない場合に必ずしも符号量が少ないとは限らないが、その可能性が高いからである。

また、上述の如く、予測誤差が少ない上位２つの動き補償モードについて、全て実際に符号化するのではなく、図７の如く、予測誤差が所定閾値より少ない動き補償モードについて実際に符号化するようにしてもよい。このようにすると、プログラムにおける演算量を低減でき、処理スピードの高速化が図れる。

さらに、この図７の所定閾値の値を、量子化ステップ幅ｑに応じて変更してもよい。つまり、図８に示すように、量子化ステップ幅ｑが大きい場合、実際の符号量を出来るだけ検出するモードを選択した。つまり、バッファ128に余裕がない場合は、発生符号量の低減が切望されるので、この様な場合には、少しでも発生符号量を少なくする可能性を高めるために行う。

（３）第２実施例（図９）．
図９において、図１及び図５と同一の部分には、同一符号を付して説明を省略する。この実施例は、本エンコーダでの圧縮率又は発生符号量に関連する値に応じて、符号化時のモード選択動作を変更するものである。なお、本エンコーダでの圧縮率又は発生符号量に関連する値としては、挿入器126からのマクロブロック毎の発生符号量、バッファ128の残り容量、量子化ステップ幅ｑがある。

この実施例では、量子化ステップ幅ｑを用いた。また、この実施例では、発生符号量に応じてモード選択動作を行う場合に、実際の発生符号量を検出するのではなく、分散値から発生符号量を予測した。図９において、62は、動き補償モード選択回路である。Ｌは、量子化ステップ幅ｑを動き補償モード選択回路62に伝送する報知手段としての信号線路である。

前記動き補償モード選択回路62は、予測誤差が所定の閾値より小さいモードをまず検出する。なお、この所定の閾値は、量子化ステップ幅ｑに応じて変更される。この量子化ステップ幅ｑは、信号線路Ｌにより動き補償モード選択回路62に伝送されている。量子化ステップ幅ｑが大きい場合には、前述の閾値も大きく変更される。

そして予測誤差と閾値との比較し、閾値より小さな予測誤差のモードを検出する。これに該当するモードがなければ、動き補償モード選択回路62は、最も予測誤差の小さいものを選択する。つまり、このモードを示すマクロブロックタイプ情報を出力するとともに、このモードの動きベクトルを出力する。また、これに該当するモードが１つのみであれば、動き補償モード選択回路62は、このモードを選択する。つまり、このモードを示すマクロブロックタイプ情報を出力するとともに、このモードの動きベクトルを出力する。

また、これに該当するモードが２つ以上であれば、動き補償モード選択回路62は、更に選択処理を行う。この選択処理のために、分散値による処理を行う。動き補償モード選択回路62は、複数のモードの一つについて、マクロブロックタイプ情報及び動きベクトルに基づいて、動き予測符号化した場合の誤差画面の分散値を求める。

このため、このモードに対応するマクロブロックタイプ情報及び動きベクトルを動き補償読み出し制御回路144に出力する。これにより、画像メモリ142からは、対応する予測画面のマクロブロックが、動き補償モード選択回路62へ出力される。

動き補償モード選択回路62は、マクロブロック変換器112からの現マクロブロックの画像と、画像メモリ142からの予測画面のマクロブロックの差分を求め、更に、この差分画面マクロブロックの分散値を求める。動き補償モード選択回路62は、残りのモードについても、同様に処理して、それぞれのモードにおける分散値を求める。

そして、動き補償モード選択回路62は、この分散値を比較して、動き補償モードを選択する。このように、動き補償モード選択回路62は、この動きベクトル検出回路（各モード別予測誤差検出手段:146）の出力と前記圧縮率に関連した値とを参考に前記動き補償モードを選定する、動き補償モード選択手段62を成している。また、この動き補償モード選択回路62は、少なくても前記圧縮率に関連した値に応じて動き補償モードを選択する処理を変更する動き補償モード選択手段62を成している。なお、この実施例では、動き補償モードによる差分画面の分散値をモード決定回路150でもう一度求めるようにしているが、これは、当然、回路をまとめてもよい。

（４）動き補償付き予測符号化（図１７，図１８）．
従来より一般に行なわれている動き補償つき予測符号化を用いた圧縮手法について、以下に概略を説明する。図１７は、ＭＰＥＧ規格に基づく圧縮動作の構成図、図１８は、動き補償モードを選択する動作の構成図である。図１７に於いて、イントラ画像はまず、ブロック毎にＤＣＴ／量子化部101で、ＤＣＴ及び量子化が行なわれる。

この際、符号量制御部108より与えられる目標符号量に応じて、量子化ステップ幅等が定められる。生成したデータは、ＶＬＣ部102へ送られて可変長符号化（ＶＬＣ）が行なわれる。符号化データは、前記量子ステップ幅値とデータ統合され一本のビットストリームを形成する。一方、前記符号化データは、逆量子化／逆ＤＣＴ（ＩＤＣＴ）部103へも送られて復号化され、復号データ（以下、デコード画像）は、画像メモリ104へ蓄えられる。

次に、インター画像は、まず、動き検出部105で、マクロブロック毎に、参照ピクチャに対して動きベクトルを検出する。ここで参照ピクチャは、画像メモリ104に保持されているデコード画像である。複数の動き補償モードが許容されている場合には、各動き補償モード毎に動きベクトル検出を行なう。その後に、動き補償部106において、画像間予測誤差が最小となる動き補償モードまたは、動き補償を行なわないモードを選択する。

選択したモードに対応する差分ブロックまたは処理ブロックは、ＤＣＴ／量子化部101、次いでＶＬＣ部102へ送られて、イントラ画像と同様の圧縮処理が行なわれる。一方、動き補償部106で選択した前記モードの情報、及び動き補償を行う場合には対応する動きベクトル情報は、ＶＬＣ部107へ送られて符号化される。最後にデータ統合部110において、各符号化情報が一本のビットストリームに統合されて出力される。生成ビットストリーム量は、符号量制御部108へ送られて、残存画像の符号化時に定める目標符号量の基準となる。

図１８には、本構成の動き補償部106内部の詳細を記す。ここでは、まずブロック位置指定部11で、検出済みの動きベクトルデータを用いて、ピクチャ内の参照ブロック位置を指定し、参照ピクチャ内から、参照ブロックを切り出す。次に、差分ブロック生成部12で、前記参照ブロックと処理ブロックとの間の対応する画素値の差分を求め、差分ブロックを生成する。11〜13の動作は、複数の動き補償モードの各々及び動き補償を行わないピクチャ間予測符号化の各々について行う。但し、動き補償を行わない場合には、ブロック位置指定部11では、動きベクトルデータを用いず、処理マクロブロックと同じ座標を指定する。最小予測誤差選択部14では、各モードに対応する複数の差分ブロックを元に、画像間の予測誤差が最小になる動き補償モードを選択する。

最後に、選択した動き補償モードによる動き補償つきピクチャ間予測符号化（非イントラ）と、ピクチャ間予測符号化を行わないモード（イントラ）のいずれかを選択する、イントラ／非イントラ判定をイントラ／非イントラ判定部15で行う。一般には、ピクチャ間予測符号化の予測誤差が一定の閾値を越えれば、ピクチャ間予測符号化は行わない（イントラ判定）。

選択された動き補償モードの情報及び動きベクトルは、図１７のＶＬＣ部107へ送られる。一方、対応する差分ブロック、または、動き補償を行なわないモードが選択された場合には、処理ブロックが、図１７のＤＣＴ／量子化部101へ送られる。

（５）第３実施例（図１０，図１１）．
本発明の第３実施例について述べる。図１０は、本発明による動画像圧縮方法の構成の一例を示したもの、図１１は、本発明による動き補償モード選択の詳細を示したものである。

図１０に示す様に、この実施例の動作構成は、ＤＣＴ及び量子化を行なうＤＣＴ／量子化部101及び可変長符号化を行なうＶＬＣ102、ＶＬＣ107、逆量子化及びＩＤＣＴを行なう逆量子化／ＩＤＣＴ部103、少なくとも１枚以上のピクチャデータを格納する画像メモリ104、動き検出を行なう動き検出部105、動き補償を行なう動き補償部106、符号量制御を行なう符号量制御部108、種々の圧縮データを一本のビットストリームに統合するデータ統合部110で構成される。

本発明において、従来技術と異なる点は、インター画像における動き補償モードの選択であるので、イントラ画像の圧縮動作については、述べない。インター画像の場合は、まず、動き検出部105で画像メモリに蓄えられた参照画像に対して動き検出を行ない、さらに動き検出部で得られた動きベクトルを用いて動き補償部１０６で動き補償を行なう。

動き補償部では、過去に符号化済みのビットストリームの量から得られる目標符号量を用いて、複数の動き補償モードの中から最適な動き補償モードを選択する。ＤＣＴ／量子化器101では、選択された動き補償モードに基づく動き補償により生成した差分ブロックデータをＤＣＴ及び量子化によって圧縮する。

更にＶＬＣ部102において可変長符号化を行なう。

一方、選択された動き補償モード情報と該動き補償モードに対応する動きベクトルは、ＶＬＣ部107で可変長符号化される。データ統合部110では、上記圧縮データを統合して一つのビットストリームにし、出力する。

図１１は、本実施例における、動き補償モード選択動作の詳細である。まず、ブロック位置指定部11において、検出済みの動きベクトルデータを用いて、参照ピクチャ内の、参照ブロックの位置を指定する。次に、差分ブロック生成部12において、処理ピクチャ内の処理ブロックと、前記参照ブロック位置に基づく参照ピクチャ内の参照ブロックとの対応する画素値の差分をとり、差分ブロックを生成する。

符号量計算部23では、前記差分ブロックを符号化する場合に生成する符号量を求める。ここで、符号量の算出は、予め差分ブロックの各要素、パターン、及び動きベクトル値に対応する符号量の表を保持しておき、該当する値を比較によって得る。または、差分ブロック及びその他のパラメータを実際に符号化処理して生成する符号量を得ても良い。その場合は、図１０のＤＣＴ／量子化部101、ＶＬＣ部102、ＶＬＣ部107と同一の動作を全てのモードについて行い、符号量を得る。最近符号量選択部34では、各動き補償モード毎に求めた生成符号量から、目標符号量に最も近い値となる動き補償モードを選択する。

選択した動き補償データ及び対応する差分ブロックデータ、または、動き補償を行なわないモードが選択された場合には処理ブロックデータを出力する。ここで、符号量計算時に符号化を行なった場合には、ブロックデータの代わりに、符号化済みのデータを出力しても良い。その場合は、図１０における、ＤＣＴ／量子化部101、ＶＬＣ部102、ＶＬＣ部107の動作は行なわない。

（６）第４実施例（図１２）．
次に本発明の第４実施例を説明する。本実施例は、目標符号量の見積もりに量子化ステップ幅を用い、該目標符号量に最近の符号量となる動き補償モードを選択することを特徴とする。図１２は、本実施例における、動き補償モード選択動作の詳細である。

まず、ブロック位置指定部11において、検出済みの動きベクトルデータを用いて、参照ピクチャ内の、参照ブロックの位置を指定する。次に、差分ブロック生成部12において、処理ピクチャ内の処理ブロックと、前記参照ブロック位置に基づく参照ピクチャ内の参照ブロックとの対応する画素値の差分をとり、差分ブロックを生成する。

符号量計算部23では、前記差分ブロックを符号化する場合に生成する符号量を求める。ここで、符号量の算出は、予め差分ブロックの各要素、パターン、及び動きベクトル値に対応する符号量の表を保持しておき、該当する値を比較によって得る。または、差分ブロック及びその他のパラメータを実際に符号化処理して生成する符号量を得ても良い。その場合は、図１０のＤＣＴ／量子化部101、ＶＬＣ部102、ＶＬＣ部107と同一の動作を全てのモードについて行って符号量を得る。

符号化済みビットストリームのバッファ残存量に応じて量子化ステップ幅が定められる場合には、目標符号量の代わりに量子化ステップ幅を用いても良い。この場合、図中目標符号量見積り部45において、量子化ステップ幅値に対応する残存バッファ量のテーブルを予め保持しておき、該テーブルと比較することにより、目標符号量の概算を得る。

最近符号量選択部34では、各動き補償モード毎に求めた生成符号量から、見積もり目標符号量に最も近い値となる動き補償モードを選択する。選択した動き補償データ及び対応する差分ブロックデータ、または、動き補償を行なわないモードが選択された場合には処理ブロックデータを出力する。ここで、符号量計算時に符号化を行なった場合には、ブロックデータの代わりに、符号化済みのデータを出力しても良い。その場合は、図１０における、ＤＣＴ／量子化部101、ＶＬＣ部102、ＶＬＣ部107の動作は行なわない。

（７）第５実施例（図１３）．
次に本発明の第５実施例を説明する。本実施例は、符号化後の符号量が最小となる動き補償モードを選択することを特徴とする。図１３は、本実施例における動き補償モード選択動作の詳細である。

最小符号量選択部54では、各モード毎に求めた生成符号量から、最小符号量となるモードを選択し、選択した動き補償データ及び対応する差分ブロックデータ、または、動き補償を行なわないモードが選択された場合には処理ブロックデータを出力する。選択した動き補償データ及び対応する差分ブロックデータ、または、動き補償を行なわないモードが選択された場合には処理ブロックデータを出力する。ここで、符号量計算時に符号化を行なった場合には、ブロックデータの代わりに、符号化済みのデータを出力しても良い。その場合は、図１０におけるＤＣＴ／量子化部101、ＶＬＣ部102、ＶＬＣ部107の動作は行なわない。

（８）第６実施例（図１４）．
次に本発明の第６実施例を説明する。本実施例は、予測誤差が最小となる動き補償モード、及び、動き補償を行わないモードの内、符号化後の符号量が目標符号量にもっとも近くなるモードを選択することを特徴とする。

図１４は、本実施例における、モード選択動作の詳細である。まず、ブロック位置指定部11において、検出済みの動きベクトルデータを用いて、参照ピクチャ内の、参照ブロックの位置を指定する。次に、差分ブロック生成部12において処理ピクチャ内の処理ブロックと前記参照ブロック位置に基づく参照ピクチャ内の参照ブロックとの対応する画素値の差分をとり、差分ブロックを生成する。

予測誤差計算部13では、予測誤差を計算する。符号量計算部23では、前記差分ブロックを符号化する場合に生成する符号量を求める。最小予測誤差選択部64では、ピクチャ間予測符号化を行なうモード毎に得た予測誤差の値が最小になるものを選び出す。符号量計算部23では、該最小予測誤差を持つモードと、イントラ符号化を行なうモードの双方について、圧縮後の符号量を計算する。

最近符号量選択部34では、該計算した符号量が、目標符号量に最も近くなるモードを選択する。なお、本実施例においては、最近符号量選択部34の代わりに最小符号量を選択する手段を用いても良い。また、目標符号量の代わりに、量子化ステップ幅を用い、目標符号量を見積もる手段を追加しても良い。

（９）第７実施例（図１５）．
次に本発明の第７実施例を説明する。本実施例は、最適な符号量を得るモードを用いて符号化を行い、生成ビットストリームを記録する、圧縮データ記録方法である。図１５は本実施例における圧縮動画像記録方法の一例を示したものである。

図１５に示す様に、この実施例の動作構成はＤＣＴ及び量子化を行なうＤＣＴ／量子化部101及び可変長符号化を行なうＶＬＣ102、ＶＬＣ107、逆量子化及びＩＤＣＴを行なう逆量子化／ＩＤＣＴ部103、少なくとも１枚以上のピクチャデータを格納する画像メモリ104、動き検出を行なう動き検出部105、動き補償を行なう動き補償部106、符号量制御を行なう符号量制御部108、種々の圧縮データを一本のビットストリームに統合するデータ統合部110、圧縮データを記録する記録媒体611で構成される。

更にＶＬＣ部102において可変長符号化を行なう。一方、選択された動き補償モード情報と該動き補償モードに対応する動きベクトルは、ＶＬＣ部107で可変長符号化される。データ統合部110では、上記圧縮データを統合して一つのビットストリームにし、出力する。

出力されたビットストリームは、記録装置に収納された記録媒体611に記録される。なお、動き補償部106の内部構成は、前記実施例３〜実施例６のいずれか一つと同じである。

（１０）第８実施例（図１６）．
次に本発明の第８実施例を説明する。本実施例は、最適な符号量を得るモードを用いて符号化を行い、生成ビットストリームを伝送する、圧縮データ伝送手段である。

図１６は本実施例における圧縮動画像記録方法の一例を示したものである。図１６に示す様に、この実施例の動作構成は、ＤＣＴ及び量子化を行なうＤＣＴ／量子化部101及び可変長符号化を行なうＶＬＣ102、ＶＬＣ107、逆量子化及びＩＤＣＴを行なう逆量子化／ＩＤＣＴ部103、少なくとも１枚以上のピクチャデータを格納する画像メモリ104、動き検出を行なう動き検出部105、動き補償を行なう動き補償部106、符号量制御を行なう符号量制御部108、種々の圧縮データを一本のビットストリームに統合するデータ統合部110、圧縮データを転送する送信手段711で構成される。

本発明において、従来技術と異なる点は、インター画像における動き補償モードの選択であるので、イントラ画像の圧縮動作については、述べない。インター画像の場合は、まず、動き検出・BR>・05で画像メモリに蓄えられた参照画像に対して動き検出を行ない、さらに動き検出部で得られた動きベクトルを用いて動き補償部106で動き補償を行なう。

動き補償部では、過去に符号化済みのビットストリームの量から得られる目標符号量を用いて、複数の動き補償モードの中から最適な動き補償モードを選択する。ＤＣＴ／量子化器101では、選択された動き補償モードに基づく動き補償により生成した差分ブロックデータをＤＣＴ及び量子化によって圧縮する。更にＶＬＣ部102において可変長符号化を行なう。一方、選択された動き補償モード情報と該動き補償モードに対応する動きベクトルは、ＶＬＣ部107で可変長符号化される。データ統合部110では、上記圧縮データを統合して一つのビットストリームにし、出力する。

各処理部101〜110によって圧縮した動画像データのビットストリームは、送信手段711によって伝送される。なお、動き補償部106の内部構成は、前記実施例３〜実施例６のいずれか一つと同じである。

典型的な動画像符号化装置を例示するブロック図。動画像符号化方式の説明図。動画像符号化方式の説明図。動画像符号化方式の説明図。第１実施例の動画像符号化装置のブロック図。図５の装置の動作手順の一例を示すフローチャート。図５の装置の動作手順の一例を示すフローチャート。図５の装置の動作手順の一例を示すフローチャート。第２実施例の動画像符号化装置のブロック図。第３〜第６実施例の動画像圧縮方式の機能ブロック図。第３実施例の動画像圧縮方式の動作説明図。第４実施例の動画像圧縮方式の動作説明図。第５実施例の動画像圧縮方式の動作説明図。第６実施例の動画像圧縮方式の動作説明図。第７実施例の動画像圧縮記録方式の機能ブロック図。第８実施例の動画像圧縮伝送方式の機能ブロック図。典型的な動画像圧縮符号化方式の機能ブロック図。図１０の動画像圧縮方式の動作説明図。

符号の説明

ｑ量子化ステップ幅
Ｌ信号線路
５０バッファメモリ
５２バッファメモリ
５４バッファメモリ
５６バッファメモリ
５８モード選択回路
６０モード決定回路
６２動き補償モード選択回路

Claims

動画像映像信号を複数の異なる動き補償予測符号化モードを用いて圧縮符号化する動き補償予測符号化手段を備える動画像圧縮符号化装置において、
前記動き補償予測符号化手段は、量子化回路を含み、
前記各動き補償モードにより、前記動き補償予測符号化手段で生じる予測誤差を検出するモード別予測誤差検出手段と、
このモード別予測誤差検出手段の出力と前記量子化回路の量子化ステップ幅に応じて変更されるしきい値とを比較し、前記しきい値より小さな予測誤差の動き補償モードがあれば、前記各動き補償モードの中から、前記しきい値より小さな予測誤差の動き補償モードをひとつ選定する動き補償モード選択手段と、
を備えることを特徴とする動画像圧縮符号化装置。