JP5136470B2

JP5136470B2 - 動画像符号化装置及び動画像符号化方法

Info

Publication number: JP5136470B2
Application number: JP2009053913A
Authority: JP
Inventors: 秀誠三好
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2009-03-06
Filing date: 2009-03-06
Publication date: 2013-02-06
Anticipated expiration: 2029-03-06
Also published as: JP2010212785A; US9185420B2; US20100226433A1

Description

ここに開示される実施形態は、特定の画像を周期的にイントラ符号化し、その他の画像をインター符号化する動画像符号化装置及び動画像符号化方法に関する。

動画像データは、一般に非常に大きなデータ量を有する。そのため、動画像データを扱う装置は、動画像データを他の装置へ送信しようとする場合、あるいは、動画像データを記憶装置に記憶しようとする場合、動画像データを圧縮する。特に、動画像データの圧縮に使用される符号化方法として、イントラ符号化方法とインター符号化方法がある。イントラ符号化方法は、符号化対象の１枚のピクチャ内に含まれる情報のみを用いてそのピクチャを符号化する方法であり、フレーム内符号化方法あるいはピクチャ内符号化方法とも呼ばれる。一方、インター符号化方法は、符号化対象のピクチャと、その前後のピクチャの情報を用いて、符号化対象のピクチャを符号化する方法である。具体的には、インター符号化方法では、符号化対象のピクチャが複数のブロックに分割される。そして、各ブロックに対して、前後の既に符号化されたピクチャを復号したピクチャから、最も類似している領域が選択され、各ブロックとその選択された類似領域との差分情報が求められる。その後、その差分情報と、各ブロックがその類似領域から移動している量を表す動きベクトル情報とが符号化される。そのため、インター符号化方法は、冗長な情報を取り除くことができるので、イントラ符号化方法の圧縮効率よりも高い圧縮効率を達成することができる。

これに対し、イントラ符号化方法は、一般に、符号化されたデータからピクチャを復号することにより得られたピクチャと原ピクチャとの誤差を小さくできる。そのため、圧縮符号化された動画像データを再現する装置は、イントラ符号化方法により符号化されたデータから、鮮鋭度の高いピクチャを復号することができる。一方、インター符号化方法は、上記のように、前後のピクチャとの差分情報及び動きベクトル情報のみを符号化する。そのため、何れかのピクチャを符号化する際に誤差が含まれると、そのピクチャ以降の他のピクチャにも、その誤差が伝播してしまう。そこで、符号化誤差の伝播を抑制するために、一定周期ごとに、動画像データに含まれた連続する複数のピクチャのうち、何れか一つのピクチャをイントラ符号化し、その他のピクチャをインター符号化する符号化方法が提案されている。このような符号化方法は、例えば、Moving Picture Experts Group phase 2（MPEG-2）、MPEG-4、あるいはH.264 MPEG-4 Advanced Video Coding（H.264 MPEG-4 AVC）などの規格で採用されている。なお、この一定周期で繰り返される、連続する複数のピクチャを含み、各ピクチャに対する符号化方法が規定された構造はGroup Of Pictures（GOP）と呼ばれる。また、以下では、GOPに含まれるピクチャのうち、イントラ符号化されるピクチャをIピクチャと表記する。さらに、時間的に前のピクチャの情報を用いてインター符号化されるピクチャをPピクチャと表記する。さらに、時間的に前のピクチャと後のピクチャの両方の情報を用いてインター符号化されるピクチャをBピクチャと表記する。なお、ピクチャは、フレームまたはフィールドである。フレームは、動画像データ中の一つの静止画像であり、一方、フィールドは、フレームから奇数行のデータあるいは偶数行のデータのみを取り出すことにより得られる静止画像である。そして、奇数行のデータのみを有するフィールド及び偶数行のデータのみを有するフィールドを、本明細書では、それぞれ、トップフィールド及びボトムフィールドと呼ぶ。

さて、デジタル放送システムのように、動画像データの配信に関してリアルタイム性に対する要求が高いシステムでは、固定ビットレート（Constant Bit Rate、CBR）符号化方法が採用される。このCBR符号化方法は、符号化された動画像データに対して、単位時間ごとに固定ビット長を割り当てる符号化方法である。ここで、GOPの先頭に位置するIピクチャは、他のPピクチャまたはBピクチャをインター符号化するための基準となる。しかし、イントラ符号化方法の圧縮効率は、インター符号化方法の圧縮効率よりも低い。そのため、Iピクチャの符号化誤差が出来るだけ少なくなるように、Iピクチャに対してより多くの情報量、すなわち符号化ビット数が割り当てられる必要がある。そして、Iピクチャに多数の符号化ビットが割り当てられると、CBR符号化方法では単位時間ごとのビット数が決まっているため、GOP内のPピクチャ及びBピクチャに割り当て可能な符号化ビット数が少なくなる。

特に、リアルタイム性に対する要求が高いシステムは、動画像データの符号化による遅延を抑制するために、符号化のために前後のピクチャの情報を必要とするBピクチャを使用しないことも多い。そして、最も圧縮効率の高いBピクチャがGOPに含まれなければ、必然的にPピクチャに割り当てられる符号化ビット数が不十分となる。そのため、このCBR符号化方法により符号化された動画像データから復号されたPピクチャの鮮鋭度が低下してしまう。一方、上記のように、Iピクチャには十分な符号化ビット数が割り当てられているため、復号されたIピクチャは高い鮮鋭度を持つ。このPピクチャとIピクチャの鮮鋭度の差により、復号された動画像データに対する観察者の主観的な画質は低くなる。
このような問題に対して、動画像データにおいて高画質のピクチャと低画質のピクチャが交互に並んでいれば、動画像データに対する観察者の主観的な画質は、低画質のピクチャの存在にもかかわらず良好であることが報告されている。

吹抜、「鋭/鈍繰返し画像の時空間信号処理による解明」、平成１９年１０月、PCSJ2007/IMPS2007、No.P3-03

しかし、動きのあるシーンに対応するGOPでは、着目するピクチャに対して、時間的に近いピクチャほど類似していることが多い。そのため、インター符号化方法は、インター符号化するための基準となる参照ピクチャとして、時間的に最も近いピクチャを用いることにより、符号化誤差を少なくできる。ところが、GOPの先頭から、高画質のピクチャと低画質のピクチャが交互に並ぶように動画像データがインター符号化された場合、着目するピクチャに対して時間的に最も近いピクチャは、符号化により画質が大きく劣化してしまっている可能性がある。そのため、符号化誤差が大きくなってしまうおそれがある。特に、GOPの後半部分に含まれるPピクチャは、符号化誤差の累積による画質劣化が著しくなるので、GOPの後半部分に含まれるPピクチャと、その直後のIピクチャの画質の差が非常に大きくなる。そのため、復号された動画像データでは、GOP単位で発生するフリッカーノイズが顕著になってしまう。

そこで、本明細書は、GOP単位で発生するフリッカーノイズを抑制することにより、復号された動画像データに対する観察者の主観的な画質を改善可能な動画像符号化装置及び動画像符号化方法を提供することを目的とする。

一つの実施形態によれば、動画像符号化装置が提供される。この動画像符号化装置は、動画像データを取得する信号取得部と、動画像データに含まれる、ピクチャの組に含まれる複数の連続するピクチャのそれぞれを、インター符号化またはイントラ符号化することにより、その動画像データを符号化する処理部とを有する。そして処理部は、インター符号化されるピクチャの位置が、ピクチャの組の先頭を基準として、ピクチャの組に含まれる各ピクチャに対して均等に符号化ビット数を割り当てた場合にインター符号化による符号化誤差が許容範囲内に収まる所定位置より後であり、かつ、ピクチャの組に含まれるピクチャの枚数よりも短い所定の周期の第１の位置に対応する場合、インター符号化されるピクチャに対して割り当てられる符号化ビット数が、所定の基準値に対して第１の所定量を加算した値となり、インター符号化されるピクチャの位置が所定位置より後であり、且つ、第１の位置と異なる第２の位置である場合、その符号化ビット数がその基準値から第２の所定量を減算した値となるように、量子化パラメータを決定する情報量制御機能と、ピクチャの組に含まれる各ピクチャを複数のブロックに分割し、分割された各ブロックごとに、時間的に前後のピクチャの類似する領域、あるいはピクチャ内の他のブロックとの誤差を表す予測誤差信号を生成する予測誤差信号生成機能と、予測誤差信号を直交変換することにより、周波数信号を生成する直交変換機能と、量子化パラメータに従って、周波数信号を量子化する量子化機能と、量子化された周波数信号を可変長符号化する符号化機能とを実現する。

また他の実施形態によれば、動画像データに含まれる、ピクチャの組に含まれる複数の連続するピクチャのそれぞれを、インター符号化またはイントラ符号化することにより、その動画像データを符号化する動画像符号化方法が提供される。この動画像符号化方法は、インター符号化されるピクチャの位置が、ピクチャの組の先頭を基準として、ピクチャの組に含まれる各ピクチャに対して均等に符号化ビット数を割り当てた場合にインター符号化による符号化誤差が許容範囲内に収まる所定位置より後であり、かつ、ピクチャの組に含まれるピクチャの枚数よりも短い所定の周期の第１の位置に対応する場合、インター符号化されるピクチャに対して割り当てられる符号化ビット数が、所定の基準値に対して第１の所定量を加算した値となり、インター符号化されるピクチャの位置が所定位置より後であり、且つ、第１の位置と異なる第２の位置である場合、その符号化ビット数がその基準値から第２の所定量を減算した値となるように、量子化パラメータを決定し、ピクチャの組に含まれる各ピクチャを複数のブロックに分割し、分割された各ブロックごとに、時間的に前後のピクチャの類似する領域、あるいはピクチャ内の他のブロックとの誤差を表す予測誤差信号を生成し、予測誤差信号を直交変換することにより、周波数信号を生成し、量子化パラメータに従って、周波数信号を量子化し、量子化された周波数信号を可変長符号化することを含む。

さらに他の実施形態によれば、動画像データに含まれる、ピクチャの組に含まれる複数の連続するピクチャのそれぞれを、コンピュータにインター符号化またはイントラ符号化させることにより、その動画像データを符号化させる動画像符号化用コンピュータプログラムが提供される。このコンピュータプログラムは、インター符号化されるピクチャの位置が、ピクチャの組の先頭を基準として、ピクチャの組に含まれる各ピクチャに対して均等に符号化ビット数を割り当てた場合にインター符号化による符号化誤差が許容範囲内に収まる所定位置より後であり、かつ、ピクチャの組に含まれるピクチャの枚数よりも短い所定の周期の第１の位置に対応する場合、インター符号化されるピクチャに対して割り当てられる符号化ビット数が、所定の基準値に対して第１の所定量を加算した値となり、インター符号化されるピクチャの位置が所定位置より後であり、且つ、第１の位置と異なる第２の位置である場合、その符号化ビット数がその基準値から第２の所定量を減算した値となるように、量子化パラメータを決定する情報量制御機能と、ピクチャの組に含まれる各ピクチャを複数のブロックに分割し、分割された各ブロックごとに、時間的に前後のピクチャの類似する領域、あるいはピクチャ内の他のブロックとの誤差を表す予測誤差信号を生成する予測誤差信号生成機能と、予測誤差信号を直交変換することにより、周波数信号を生成する直交変換機能と、量子化パラメータに従って、周波数信号を量子化する量子化機能と、量子化された周波数信号を可変長符号化する符号化機能とをコンピュータに実行させる命令を有する。

さらに他の実施形態によれば、ピクチャの組に含まれる複数の連続するピクチャのそれぞれを、インター符号化またはイントラ符号化することにより、その動画像データを符号化する動画像符号化回路が提供される。この動画像符号化回路は、インター符号化されるピクチャの位置が、ピクチャの組の先頭を基準として、ピクチャの組に含まれる各ピクチャに対して均等に符号化ビット数を割り当てた場合にインター符号化による符号化誤差が許容範囲内に収まる所定位置より後であり、かつ、ピクチャの組に含まれるピクチャの枚数よりも短い所定の周期の第１の位置に対応する場合、インター符号化されるピクチャに対して割り当てられる符号化ビット数が、所定の基準値に対して第１の所定量を加算した値となり、インター符号化されるピクチャの位置が所定位置より後であり、且つ、第１の位置と異なる第２の位置である場合、その符号化ビット数がその基準値から第２の所定量を減算した値となるように、量子化パラメータを決定する情報量制御回路と、ピクチャの組に含まれる各ピクチャを複数のブロックに分割し、分割された各ブロックごとに、時間的に前後のピクチャの類似する領域、あるいはピクチャ内の他のブロックとの誤差を表す予測誤差信号を生成する予測誤差信号生成回路と、予測誤差信号を直交変換することにより、周波数信号を生成する直交変換回路と、情報量制御回路により決定された量子化パラメータに従って、周波数信号を量子化する量子化回路と、量子化回路により量子化された周波数信号を可変長符号化する符号化回路とを有する。

本明細書に開示された動画像符号化装置及び動画像符号化方法は、GOP単位で発生するフリッカーノイズを抑制することにより、復号された動画像データに対する観察者の主観的な画質を改善することができるという効果を奏する。

一つの実施形態に係る動画像符号化装置の概略構成図である。動画像符号化装置の処理部の機能ブロック図である。ピクチャ情報量制御部の機能ブロック図である。（ａ）は、GOPに対応するシーンが静止シーンである場合における、ピクチャ情報量決定部により決定された量子化パラメータに基づいて、GOP内の各ピクチャに割り当てられる符号化ビット数を示すグラフである。（ｂ）は、GOPに対応するシーンが動きのあるシーンである場合における、ピクチャ情報量決定部により決定された量子化パラメータに基づいて、GOP内の各ピクチャに割り当てられる符号化ビット数を示すグラフである。一つの実施形態に係る動画像符号化装置の処理部上で実行されるコンピュータプログラムにより制御される、ピクチャ情報量制御部によるPピクチャに対する量子化パラメータ決定処理の動作フローチャートである。一つの実施形態に係る動画像符号化装置の処理部上で実行されるコンピュータプログラムにより制御される、動画像データの符号化処理の動作フローチャートである。

以下、図を参照しつつ、一つの実施形態による、動画像符号化装置について説明する。
この動画像符号化装置は、動画像データを、GOP単位で一定のビット長となるように符号化する。そして、この動画像符号化装置は、GOP内の連続するPピクチャに対して割り当てるビット数を交互に増減することにより、画質劣化が少ないピクチャの間隔を短くすることで、GOPごとのビットレートを一定に保ったまま、観察者の主観的な画質の向上を図る。
なお、以下に説明する実施形態では、GOPにはIピクチャとPピクチャのみが含まれ、Bピクチャは使用されないものとする。また、符号化対象となる動画像データに含まれるピクチャは、インターレース方式により取得されるトップフィールドまたはボトムフィールドである。しかし、符号化対象となる動画像データに含まれるピクチャは、プログレッシブ方式により取得されるフレームであってもよい。

図１は、一つの実施形態による動画像符号化装置１の概略構成図である。図１に示すように、動画像符号化装置１は、信号取得部１１と、記憶部１２と、処理部１３と、出力部１４とを有する。

信号取得部１１は、符号化対象となる動画像データを取得する。そのために、信号取得部１１は、例えば、動画像データを生成するビデオカメラ２と動画像符号化装置１を接続するビデオ入力インターフェースを有する。あるいは、信号取得部１１は、他の装置から通信ネットワーク（図示せず）を介して動画像データを取得するために、動画像符号化装置１を通信ネットワークに接続するための通信インターフェース及びその制御回路を有する。例えば、信号取得部１１は、イーサネット（登録商標）などの通信規格に従った通信ネットワークまたはIntegrated Services Digital Network（総合ディジタル通信網サービス、ISDN）に接続するための通信インターフェース及びその制御回路を有する。あるいは、信号取得部１１は、ユニバーサル・シリアルバス2（Universal Serial Bus 2、USB2）などの近距離通信用の規格に従った通信インターフェース及びその制御回路を有してもよい。
そして信号取得部１１は、記憶部１２及び処理部１３と接続される。信号取得部１１により取得された動画像データは、処理部１３に渡される。

出力部１４は、処理部１３により生成された、符号化された動画像データを含むデータストリームを他の装置に出力する。そのために、出力部１４は、例えば、そのデータストリームを所定の信号形式に変換して無線発信する送信機及びその送信機に接続されたアンテナを有する。あるいは、出力部１４は、動画像符号化装置１を通信ネットワーク（図示せず）に接続するための通信インターフェース及びその制御回路を有してもよい。また、この場合には、信号取得部１１と出力部１４は、一体的に形成されてもよい。

記憶部１２は、例えば、半導体メモリ、磁気ディスク装置、または光ディスク装置のうちの少なくとも何れか一つを有する。そして記憶部１２は、動画像符号化装置１で使用されるコンピュータプログラム及び各種のデータを記憶する。また記憶部１２は、信号取得部１１を介して受信した動画像データ、あるいは処理部１３により符号化された動画像データを記憶してもよい。

処理部１３は、１個または複数個のプロセッサと、メモリと、その周辺回路を有する。そして処理部１３は、信号取得部１１を介して取得した動画像データを符号化することにより、その動画像データのデータ量を圧縮する。

図２は、動画像データを符号化するために実現される機能を示す処理部１３の機能ブロック図である。図２に示されるように、処理部１３は、予測誤差信号生成部２１と、直交変換部２２と、量子化部２３と、符号化部２４と、逆量子化部２５と、逆直交変換部２６と、復号画像生成部２７と、復号画像記憶部２８と、動きベクトル計算部２９と、インター予測画像生成部３０と、イントラ予測画像生成部３１と、予測画像選択部３２と、ピクチャ情報量制御部３３とを有する。処理部１３が有する、復号画像記憶部２８以外の各部は、処理部１３が有するプロセッサ上で実行されるコンピュータプログラムによって実装される機能モジュールである。また復号画像記憶部２８は、処理部１３が有するメモリとすることができる。あるいは、処理部１３が有するこれらの各部は、それぞれ別個の演算回路あるいはそれら演算回路が集積された一つの集積回路として動画像符号化装置１に実装されてもよい。

予測誤差信号生成部２１は、入力された動画像データのうち、符号化対象となる現在のピクチャを、所定数のピクセルを持つ複数のブロックに分割する。このブロックを、以下ではマクロブロックと呼ぶ。また、マクロブロックは、例えば、１６×１６個のピクセルを含む。
予測誤差信号生成部２１は、それぞれのマクロブロックと、予測画像選択部３２から供給された予測画像との差分演算を実行する。そして予測誤差信号生成部２１は、その差分演算により得られたマクロブロック内の各ピクセルに対応する差分値を、予測誤差信号として生成する。
予測誤差信号生成部２１は、生成された予測誤差信号を直交変換部２２に渡す。

直交変換部２２は、予測誤差信号生成部２１から得た、各マクロブロックの予測誤差信号を直交変換処理することにより、予測誤差信号の水平方向の周波数成分及び垂直方向の周波数成分を表す周波数信号を求める。例えば、直交変換部２２は、直交変換処理として、離散コサイン変換（Discrete Cosine Transform、DCT）を予測誤差信号に対して実行することにより、周波数信号として、マクロブロックごとのDCT係数の組を得る。
直交変換部２２は、直交変換処理によって得られた周波数信号を量子化部２３に供給する。

量子化部２３は、直交変換部２２から受け取った周波数信号を、ピクチャ情報量制御部３３によって決定された量子化パラメータにしたがって量子化する。この量子化処理は、一定区間に含まれる信号値を一つの信号値で表す処理である。そしてその一定区間は、量子化幅と呼ばれる。例えば、量子化部２３は、直交変換部２２から受け取った周波数信号から、量子化幅に相当する所定数の下位ビットを切り捨てることにより、その周波数信号を量子化する。量子化幅は、量子化パラメータによって決定される。例えば、量子化部２３は、量子化パラメータの値に対する量子化幅の値を表す関数にしたがって、使用される量子化幅を決定する。またその関数は、量子化パラメータの値に対する単調増加関数とすることができ、予め設定される。あるいは、水平方向及び垂直方向の周波数成分のそれぞれに対応する量子化幅を規定する量子化マトリクスが、予め複数準備され、記憶部１２に記憶される。そして量子化部２３は、量子化パラメータにしたがって、記憶部１２に記憶されたそれら量子化マトリクスのうちの特定の量子化マトリクスを選択する。そして量子化部２３は、選択された量子化マトリクスを参照して、周波数信号の各周波数成分に対する量子化幅を決定する。この場合も、量子化部２３は、量子化パラメータの値が大きくなるほど、各周波数成分に対する量子化幅が大きい量子化マトリクスを選択する。
量子化部２３は、量子化処理を実行することにより、周波数信号の各周波数成分を表すために使用されるビットの数を削減できるので、各マクロブロックに含まれる情報量を低減できる。量子化部２３は、量子化された信号を符号化部２４及び逆量子化部２５に供給する。

符号化部２４は、量子化部２３から受け取った量子化された信号及び動きベクトル計算部２９から受け取った動きベクトルを符号化することにより、データ量が圧縮された符号化信号を生成する。そのために、符号化部２４は、例えば、その量子化信号に対して、生起確率が高い信号値ほど短くなる、可変長の符号語を割り当てる可変長符号化処理を実行する。なお、可変長符号化処理は、エントロピー符号化処理とも呼ばれる。例えば、符号化部２４は、可変長符号化処理として、ハフマン符号化処理あるいは算術符号化処理を行うことができる。
符号化部２４により生成された符号化信号に対して、処理部１３は、所定の情報をヘッダ情報として付加することにより、符号化された動画像データを含むデータストリームを生成する。処理部１３は、そのデータストリームを記憶部１２に記憶するか、あるいはそのデータストリームを出力部１４を介して他の機器へ出力する。

逆量子化部２５は、量子化部２３から受け取った量子化信号に、量子化パラメータにより決定された量子化幅に相当する所定数を乗算することにより逆量子化する。この逆量子化により、各マクロブロックの周波数信号、例えば、DCT係数の組が復元される。そして逆量子化部２５は、得られた周波数信号を逆直交変換部２６に供給する。

逆直交変換部２６は、逆量子化部２５から受け取った周波数信号を逆直交変換処理する。例えば、直交変換部２２においてDCT処理が行われる場合、逆直交変換部２６は、逆量子化部２５から受け取った信号を逆DCTする。これら逆量子化部２５及び逆直交変換部２６により、符号化前の予測誤差信号と同程度の情報を有する予測誤差信号が再生される。そして逆直交変換部２６は、再生された予測誤差信号を復号画像生成部２７に供給する。

復号画像生成部２７は、インター符号化されるPピクチャについて、インター予測画像生成部３０で動き補償された予測画像の各ピクセル値に、そのピクセルに対応する、逆量子化部２５及び逆直交変換部２６により再生された予測誤差信号を加算する。一方、復号画像生成部２７は、イントラ符号化されるIピクチャについて、イントラ予測画像生成部３１で生成された予測画像の各ピクセル値に、そのピクセルに対応する、逆量子化部２５及び逆直交変換部２６により再生された予測誤差信号を加算する。これらの処理を各マクロブロックについて実行することにより、復号画像生成部２７は、動画像データの現在のピクチャに対する予測ピクチャを得る。
復号画像生成部２７は、得られた予測ピクチャを復号画像記憶部２８に渡す。

復号画像記憶部２８は、復号画像生成部２７から渡された予測ピクチャを新たな参照ピクチャとして一時的に記憶する。そして復号画像記憶部２８は、イントラ予測画像生成部３１、インター予測画像生成部３０及び動きベクトル計算部２９にその参照ピクチャを供給する。なお、復号画像記憶部２８は、予め定められた所定枚数分の参照ピクチャを記憶し、参照ピクチャの枚数がその所定枚数を超えると、古い参照ピクチャから順に破棄する。

動きベクトル計算部２９は、入力された動画像データの現在のピクチャの各マクロブロックと、復号画像記憶部２８から得られる既に符号化された参照ピクチャを用いて、動きベクトルを求める。動きベクトルは、ブロック単位で、現在のピクチャのマクロブロックと、そのマクロブロックに最も類似する参照ピクチャのブロックとの空間的な移動量を表す。動きベクトル計算部２９は、例えば、現在のピクチャの着目するマクロブロックと、各参照ピクチャとのブロックマッチングを実行することにより、各参照ピクチャの各位置についてマクロブロックに対するコストCを求める。コストCは、例えば、次式により求められる。

ここで、CPiは、マクロブロックに含まれるピクセルのピクセル値を表す。また、PPiは、ブロックマッチングされる参照ピクチャの対応ピクセルのピクセル値を表す。そしてMは、マクロブロックに含まれるピクセルの総数である。動きベクトル計算部２９は、そのコストCが最小となる、参照ピクチャのブロックを決定する。動きベクトル計算部２９は、着目するマクロブロックの水平方向の位置と、求めた参照ピクチャのブロックの水平方向の位置の差を、水平方向の移動量MVxとする。同様に、動きベクトル計算部２９は、着目するマクロブロックの垂直方向の位置と、求めた参照ピクチャのブロックの垂直方向の位置の差を、垂直方向の移動量MVyとする。そして動きベクトル計算部２９は、水平方向の移動量MVx、垂直方向の移動量MVy及び選択された参照ピクチャを表す識別情報を、それぞれ要素とするベクトルを動きベクトルとする。

なお、後述するように、GOPの後半では、トップフィールドに対して割り当てられる符号化ビット数が、ボトムフィールドに対して割り当てられる符号化ビット数よりも多くなる。この場合、動きベクトル計算部２９は、動きベクトルを求めるために参照される参照ピクチャもトップフィールドのみに限定することが好ましい。これにより、画質劣化の少ない参照ピクチャに基づいて動きベクトルを求めることができるので、動画像符号化装置１は、GOP内で伝播する符号化誤差を低減できる。

動きベクトル計算部２９は、現在のピクチャに含まれる各マクロブロックに対して、それぞれ動きベクトルを求める。そして動きベクトル計算部２９は、求めた動きベクトルをインター予測画像生成部３０及びピクチャ情報量制御部３３に渡す。

インター予測画像生成部３０は、復号画像記憶部２８から得た参照ピクチャを、動きベクトル計算部２９から提供される動きベクトルに基づいて動き補償することにより、動き補償されたブロック単位の予測画像を生成する。なお、動き補償は、動きベクトルで表された、マクロブロックとそれに対して最も類似する参照ピクチャのブロックの位置ずれ量を相殺するように、その最も類似する参照ピクチャのブロックの位置を移動する処理である。

イントラ予測画像生成部３１は、動画像データの現在のピクチャのうちの着目するマクロブロックについて、その着目マクロブロックの左側または上側に隣接する、既に符号化されたマクロブロックに含まれるピクセル値から補間によって予測画像を生成する。

予測画像選択部３２は、イントラ予測画像生成部３１とインター予測画像生成部３０から出力された予測画像のうちの一方の予測画像を選択する。予測画像選択部３２は、現在のピクチャがIピクチャであれば、イントラ予測画像生成部３１により生成された予測画像を選択し、一方、現在のピクチャがPピクチャであれば、インター予測画像生成部３０により生成された予測画像を選択する。なお、予測画像選択部３２は、現在のピクチャがGOPの先頭ピクチャであれば、現在のピクチャはIピクチャであると判定できる。予測画像選択部３２は、選択された予測画像を予測誤差信号生成部２１に供給する。

ピクチャ情報量制御部３３は、量子化部２３が符号化されるピクチャに対して割り当てる符号化ビット数を制御するための量子化パラメータを決定する。
図３は、ピクチャ情報量制御部３３が有する機能を示す機能ブロック図である。図３に示されるように、ピクチャ情報量制御部３３は、ピクチャ動き量算出部３３１と、動き判定部３３２と、ピクチャ情報量決定部３３３とを有する。

ピクチャ動き量算出部３３１は、現在のピクチャがPピクチャである場合、現在のピクチャが動きのあるシーンに対応するか否かを判定するための指標であるピクチャ動き量として、各マクロブロックの移動量の絶対値に関する統計量を算出する。そこで、ピクチャ動き量算出部３３１は、動きベクトル計算部２９から受け取った、現在のピクチャの各マクロブロックに対応する動きベクトルの水平方向の移動量MVxの絶対値を累積加算することにより、累積水平移動量SMVx（=Σ|MVx|）を算出する。また、ピクチャ動き量算出部３３１は、現在のピクチャの各マクロブロックに対応する動きベクトルの垂直方向の移動量MVyの絶対値を累積加算することにより、累積垂直移動量SMVy（=Σ|MVy|）を算出する。なお、ピクチャ動き量算出部３３１は、各マクロブロックの水平方向の移動量MVx及び垂直方向の移動量MVyを、対応する参照ピクチャと現在のピクチャの時間差で割った値の絶対値を累積加算することにより、SMVx、SMVyを算出してもよい。この参照ピクチャと現在のピクチャの時間差は、参照ピクチャのGOP内の位置と現在のピクチャのGOP内の位置との差に相当する枚数として表される。
そしてピクチャ動き量算出部３３１は、累積水平移動量SMVx及び累積垂直移動量SMVyを、それぞれ現在のピクチャに含まれるマクロブロックの総数MBNで割ることにより、水平平均移動量AvMVx（=SMx/MBN）及び垂直平均移動量AvMVy（=SMy/MBN）を求める。最後に、ピクチャ動き量算出部３３１は、次式にしたがってピクチャ動き量PMVを算出する。

ただし、α及びβは、それぞれ係数である。動画像符号化装置１が垂直方向の動きを検出したい場合、例えば、αは0、βは1に設定される。また、動画像符号化装置１が水平方向の動きを検出したい場合、例えば、αは1、βは0に設定される。

また、ピクチャ動き量算出部３３１は、ピクチャ動き量PMVを求めるために、現在のピクチャの各マクロブロックに対応する動きベクトルの水平方向の移動量MVxの絶対値の最頻値MMVx、及び垂直方向の移動量MVyの絶対値の最頻値MMVyをそれぞれ求めてもよい。そしてピクチャ動き量算出部３３１は、上記の（２）式におけるAvMVx、AvMVyを、その最頻値MMVx、MMVyで置換することにより、ピクチャ動き量PMVを算出してもよい。さらに、ピクチャ動き量算出部３３１は、ピクチャ動き量PMVを求めるために、現在のピクチャの各マクロブロックに対応する動きベクトルの水平方向の移動量MVxの絶対値の中央値CMVx、及び垂直方向の移動量MVyの絶対値の中央値CMVyをそれぞれ求めてもよい。そしてピクチャ動き量算出部３３１は、上記の（２）式におけるAvMVx、AvMVyを、その中央値CMVx、CMVyで置換することにより、ピクチャ動き量PMVを算出してもよい。
ピクチャ動き量算出部３３１は、算出されたピクチャ動き量PMVを動き判定部３３２に渡す。

動き判定部３３２は、ピクチャ動き量算出部３３１から受け取ったピクチャ動き量PMVを、所定の閾値Thmvと比較する。そして動き判定部３３２は、ピクチャ動き量PMVが閾値Thmvよりも大きい場合、現在のピクチャは、動きのあるシーンに対応するピクチャであると判定する。一方、動き判定部３３２は、ピクチャ動き量PMVが閾値Thmv以下であれば、現在のピクチャは、静止シーンに対応するピクチャであると判定する。なお、閾値Thmvは、検出したい動きの大きさに応じて設定される。例えば、上記の（２）式において、αとβのうちの何れか一方が1であり、他方が0である場合、閾値Thmvは1に設定される。
動き判定部３３２は、現在のピクチャが動きのあるシーンに対応するピクチャか否かの判定結果を示す動き判定情報を、ピクチャ情報量決定部３３３に通知する。

ピクチャ情報量決定部３３３は、動き判定部３３２から通知された動き判定情報及び現在のピクチャのGOP内の位置に基づいて、現在のピクチャに対する量子化パラメータの値を決定する。ここで、ピクチャ情報量決定部３３３は、動き判定情報が、現在のピクチャが静止シーンに対応するピクチャであることを示していれば、GOPに含まれる全てのPピクチャに対して同一の符号化ビット数が割り当てられるように量子化パラメータ値を決定する。一方、ピクチャ情報量決定部３３３は、動き判定情報が現在のピクチャが動きのあるシーンに対応するピクチャであることを示していれば、現在のピクチャのGOP内の位置または画質劣化度に応じて符号化ビット数が調整されるように量子化パラメータ値を決定する。特に、ピクチャ情報量決定部３３３は、現在のピクチャがトップフィールドであれば、割り当てられる符号化ビット数が多く、現在のピクチャがボトムフィールドであれば、割り当てられる符号化ビット数が少なくなるように量子化パラメータを決定する。

そこで、ピクチャ情報量決定部３３３は、例えば、MPEG-2の標準テストモデル5において採用されている方法に沿って、Iピクチャ、Pピクチャの基本目標情報量Ti、Tpを求める。さらにピクチャ情報量決定部３３３は、Pピクチャに対する補正情報量ΔTを求める。そして、ピクチャ情報量決定部３３３は、基本目標情報量Ti、Tp及びΔTに基づいて、目標情報量Tを算出する。そしてピクチャ情報量決定部３３３は、目標情報量Tの値に応じた量子化パラメータQi、Qpを求める。なお、MPEG-2の標準テストモデル5に関する量子化パラメータQi、Qpの算出方法に関しては、http://www.mpeg.org/MPEG/MSSG/tm5/Ch10/Ch10.htmlで特定されるURLを参照されたい。なお、ピクチャ情報量決定部３３３は、目標情報量Tの値が大きいほど、量子化パラメータQi、Qpの値が小さくなるような決定方法であれば、他の量子化パラメータの決定方法を採用してもよい。例えば、ピクチャ情報量決定部３３３は、特開２００８−２５２５６２号公報に開示されているような、目標情報量と量子化パラメータの関係を表すレート歪関数を用いて量子化パラメータを決定してもよい。

具体的には、ピクチャ情報量決定部３３３は、先ず、現在のピクチャに対して推定される複雑度を計算する。各ピクチャに対する複雑度は、次式により算出される。

ここで、Xiは、Iピクチャに対する複雑度であり、Xpは、Pピクチャに対する複雑度である。また、Si、Spは、それぞれ、既に符号化された直前のピクチャについて、符号化により発生したビット数である。また、Qi、Qpは、それぞれ、前のピクチャを符号化する際に使用された、全てのマクロブロックの量子化パラメータを平均することにより算出される平均量子化パラメータである。なお、Xi、Xpの初期値は例として以下のように設定される。
Xi = (160 * bitrate) / 115
Xp = (60 * bitrate) / 115
ただし、bitrateは、符号化に与えられた1秒あたりの情報量（bit/s）である。

次に、ピクチャ情報量決定部３３３は、算出された複雑度Xi、Xpに基づいて、次式に従って基本目標情報量Ti、Tpを算出する。

ここで、Kp、Kbは定数であり、一般にKp=1.0, Kb=1.4に設定される。またRは、GOPに割り当て可能なビット数の残量である。Rは、各ピクチャの符号化が完了した後、次のように更新される。
R = R-Si またはR = R-Sp
なお、Si、Spは、それぞれ、既に符号化された直前のピクチャについて、符号化により発生したビット数である。また、GOPの最初のピクチャ、すなわち、Iピクチャを符号化する際に、ビット数の残量Rは、前のGOPについて計算されたビット数の残量Rpを用いて次のように更新される。
R = G + Rp
G = bitrate * N / picturerate
ただしNは、GOPに含まれるピクチャの枚数である。なお、動画像データの最初のGOPに対して、Rは0に設定される。さらに、picturerateは、符号化対象の動画像データにおいて、1秒間に走査されるフレームの枚数（Hz）である。
また（４）式において、Np、Nbは、それぞれ、符号化順序における、GOP内の符号化されていない残りPピクチャとBピクチャの枚数である。本実施形態では、GOPにはBピクチャが含まれていないので、Nb=0である。また、関数max(a,b)は、変数aとbのうちの大きい方の値を出力する関数である。

さらに、ピクチャ情報量決定部３３３は、GOP内で所定の位置よりも後にあるPピクチャに対して割り当てる符号化ビット数が交互に増減するように、補正情報量ΔTを用いて目標情報量を調整する。その所定の位置は、各ピクチャに対して均等に符号化ビット数が割り当てられた場合に、インター符号化による符号化誤差が観察者の主観的画質の劣化に及ぼす影響が許容範囲内に収まると想定される位置のうち、最も後ろ側の位置とすることが好ましい。これにより、ピクチャ情報量決定部３３３は、符号化ビット数が均等に割り当てられるGOPの前半部分では、現在のピクチャと時間的に最も近い参照ピクチャも一定以上の画質を有するので、インター符号化により発生する符号化誤差を最小限に抑制できる。一方、ピクチャ情報量決定部３３３は、符号化誤差がある程度以上増加したGOPの後半部分では、符号化誤差がそれ以上増加しないPピクチャを１枚おきに作成できる。

そのために、ピクチャ情報量決定部３３３は、GOP内の符号化されていないPピクチャの枚数Npを閾値ThNと比較することにより、現在のピクチャが、GOPの後半部分に含まれるか否か判定する。なお、閾値ThNは、上記の所定位置に対応する値、例えばN/2に設定される。そして符号化されていないPピクチャの枚数Npが閾値ThNよりも少ない場合、すなわち、現在のピクチャがGOPの後半部分に含まれる場合、ピクチャ情報量決定部３３３は補正情報量ΔTを算出する。そしてピクチャ情報量決定部３３３は、現在のピクチャがトップフィールドであれば、（４）式により算出された基本目標情報量Tpに補正情報量ΔTを加えた値を、現在のピクチャに対する目標情報量Tとする。一方、ピクチャ情報量決定部３３３は、現在のピクチャがボトムフィールドであれば、（４）式により算出された基本目標情報量Tpから補正情報量ΔTを引いた値を、現在のピクチャに対する目標情報量Tとする。
ただし、補正情報量ΔTは、例えば、次式により算出される。

ここでkは係数である。kの値は、例えば、GOP内のPピクチャのうち、トップフィールドのPピクチャの画質が一定となるように設定されることが好ましい。さらに、kの値は、例えば、ボトムフィールドのPピクチャに対する符号化ビット数が、GOP内にBピクチャが含まれるとした場合に、そのBピクチャに割り当てられる符号化ビット数以上となるように設定されることが好ましい。なお、復号されたピクチャの画質は、例えば、復号画像記憶部２８に記憶されている参照ピクチャとその参照ピクチャに対応する原ピクチャとからPeak Signal To Noise Rate（PSNR）を算出することにより評価される。

また、ボトムフィールドに割り当てられる符号化ビット数を、Bピクチャに割り当てられる符号化ビット数以上となるようにするためには、目標情報量TがBピクチャに対する基本目標情報量Tb以上となればよい。ここでBピクチャに対する基本目標情報量Tbは、次式で与えられる。

ただし、この場合、Np、Nbは、GOPでは、Iピクチャの後、2枚のBピクチャと1枚のPピクチャが繰り返し配置されると仮定することにより決定される。またXbは、Xi、Xpと同様に、SbとQbの積で与えられる。Sbは、既に符号化された直前のピクチャについて、符号化により発生したビット数であり、Qbは、前のピクチャを符号化する際に使用された、全てのマクロブロックの量子化パラメータを平均することにより算出される平均量子化パラメータである。

また（５）式から明らかなように、補正情報量ΔTは、Npが少なくなるほど大きな値となる。すなわち、現在のピクチャがGOPの終端に近いほど、補正情報量ΔTは大きな値となる。したがって、ピクチャ情報量決定部３３３は、GOPの終端に近いトップフィールドほど、大きな符号化ビット数を割り当てることができる。

次に、ピクチャ情報量決定部３３３は、目標情報量Tに基づいて量子化パラメータを決定する。そのために、ピクチャ情報量決定部３３３は、j番目のマクロブロックを符号化する前の、適当な仮想バッファの充足度d_ij、d_pjを算出する。その充足度d_ij、d_pjは次式に従って計算される。

ここで、B_j-1は、1番目から(j-1)番目までの全てのマクロブロックを符号化することにより生成されたビット数である。MBNは、ピクチャに含まれるマクロブロックの数である。また、d_i0、d_p0は、充足度の初期値である。なお、特定のピクチャについて、最後のマクロブロックまで符号化したときの充足度d_iMBN、d_pMBNは、次の同じタイプのピクチャに対する充足度の初期値d_i0、d_p0となる。
最後に、ピクチャ情報量決定部３３３は、この充足度d_ij、d_pjを用いて、次式により、j番目のマクロブロックに対する量子化パラメータを決定する。

ただし、djは、現在のピクチャがIピクチャであればd_ij、現在のピクチャがPピクチャであればd_pjである。
ピクチャ情報量決定部３３３は、求めた量子化パラメータを、量子化部２３に渡す。

図４（ａ）は、GOPに対応するシーンが静止シーンである場合における、ピクチャ情報量決定部３３３により決定された量子化パラメータに基づいて、GOP内の各ピクチャに割り当てられる符号化ビット数を示すグラフである。また、図４（ｂ）は、GOPに対応するシーンが動きのあるシーンである場合における、ピクチャ情報量決定部３３３により決定された量子化パラメータに基づいて、GOP内の各ピクチャに割り当てられる符号化ビット数を示すグラフである。
図４（ａ）及び（ｂ）において、横軸は時間を表し、縦軸は情報量、すなわちピクチャに割り当てられる符号化ビット数を表す。また、図４（ａ）において、棒グラフ４０１及び４０２は、GOPの先頭に位置するIピクチャに割り当てられる符号化ビット数を表す。またその他の各棒グラフ４０３は、それぞれ一つのPピクチャに割り当てられる符号化ビット数を表す。同様に、図４（ｂ）において、棒グラフ４１１及び４１２は、GOPの先頭に位置するIピクチャに割り当てられる符号化ビット数を表す。またその他の各棒グラフ４１３は、それぞれ一つのPピクチャに割り当てられる符号化ビット数を表す。さらに、各棒グラフの下に示された「T」、「B」は、それぞれ、その棒グラフに対応するピクチャがトップフィールドまたはボトムフィールドであることを表す。

図４（ａ）から分かるように、GOPが静止シーンに対応する場合、Iピクチャに割り当てられる符号化ビット数は、何れのPピクチャに割り当てられる符号化ビット数よりも多く、一方、各Pピクチャに割り当てられる符号化ビット数は一定となる。静止シーンでは、連続するPピクチャ間の誤差が小さいため、各Pピクチャを符号化するために必要な情報量は少なくてよい。そのため、各Pピクチャに対して均等に符号化ビット数を割り当てることにより、動画像符号化装置１は、全てのPピクチャの画質劣化を抑制できる。
一方、図４（ｂ）から分かるように、GOPが動きのあるシーンに対応する場合、GOP内の後半部分では、Pピクチャに割り当てられる符号化ビット数が交互に増減する。そして特に、GOPの後端に近づくほど、トップフィールドのPピクチャに割り当てられる符号化ビット数が増加する。逆に、GOPの後端に近づくほど、ボトムフィールドのPピクチャに割り当てられる符号化ビット数が減少する。そのため、Iピクチャと同じフィールドであるPピクチャには、より多くの情報量が割り当てられるので、トップフィールドのPピクチャの画質劣化が抑制される。そのため、トップフィールドのPピクチャの画質と、次のGOPの先頭に位置するIピクチャの画質の差が小さくなるので、画像符号化装置１は、フリッカーの発生を抑制できる。なお、ボトムフィールドのPピクチャの画質は劣化してしまうが、上述したように、画質の良好なピクチャと画質がよくないピクチャが交互に並んでいれば、観察者の主観的な画質は劣化しない。

図５は、処理部１３上で実行されるコンピュータプログラムにより制御される、処理部１３のピクチャ情報量制御部３３によるPピクチャに対する量子化パラメータ決定処理の動作フローチャートを示す。
まず、ピクチャ情報量制御部３３のピクチャ動き量算出部３３１は、動きベクトル計算部２９から受け取った、各マクロブロックの動きベクトルから、ピクチャ動き量PMVを算出する（ステップＳ１０１）。そしてピクチャ動き量算出部３３１は、ピクチャ動き量PMVをピクチャ情報量制御部３３の動き判定部３３２に渡す。

次に、動き判定部３３２は、ピクチャ動き量算出部３３１から受け取ったピクチャ動き量PMVが所定の閾値Thmvよりも大きいか否か判定する（ステップＳ１０２）。ピクチャ動き量PMVが所定の閾値Thmv以下である場合（ステップＳ１０２−Ｎｏ）、動き判定部３３２は、現在のピクチャは静止シーンに対応するピクチャであると判定する。そして動き判定部３３２は、現在のピクチャが静止シーンに対応するピクチャであるとの判定結果を示す動き判定情報を、ピクチャ情報量制御部３３のピクチャ情報量決定部３３３に通知する。
ピクチャ情報量決定部３３３は、上記の（３）式及び（４）式に従って、Pピクチャに対する基本目標情報量Tpを算出する。そしてピクチャ情報量決定部３３３は、算出した基本目標情報量Tpを目標情報量Tに設定する（ステップＳ１０９）。その後、処理部１３は、制御をステップＳ１１０へ移行する。

一方、ステップＳ１０２において、ピクチャ動き量PMVが所定の閾値Thmvよりも大きい場合（ステップＳ１０２−Ｙｅｓ）、動き判定部３３２は、現在のピクチャは、動きのあるシーンに対応するピクチャであると判定する。そして動き判定部３３２は、現在のピクチャが動きのあるシーンに対応するピクチャであるとの判定結果を示す動き判定情報を、ピクチャ情報量決定部３３３に通知する。
ピクチャ情報量決定部３３３は、上記の（３）式及び（４）式に従って、Pピクチャに対する基本目標情報量Tpを算出する（ステップＳ１０３）。次に、ピクチャ情報量決定部３３３は、GOP内の符号化されていないPピクチャの枚数Npが閾値ThNよりも小さいか否か判定する（ステップＳ１０４）。そのPピクチャの枚数Npが閾値ThN以上である場合（ステップＳ１０４−Ｎｏ）、処理部１３は、制御をステップＳ１０９へ移行する。一方、そのPピクチャの枚数Npが閾値ThNよりも小さい場合（ステップＳ１０４−Ｙｅｓ）、ピクチャ情報量決定部３３３は、上記の（５）式に従って、補正情報量ΔTを算出する（ステップＳ１０５）。

その後、ピクチャ情報量決定部３３３は、現在のピクチャのフィールドがIピクチャのフィールドと同一か否か判定する（ステップＳ１０６）。現在のピクチャのフィールドがIピクチャのフィールドと同一であれば（ステップＳ１０６−Ｙｅｓ）、ピクチャ情報量決定部３３３は、基本目標情報量Tpに補正情報量ΔTを加えた値を目標情報量Tとする（ステップＳ１０７）。なお、IピクチャはGOPの先頭に位置するので、現在のピクチャがトップフィールドであれば、現在のピクチャのフィールドとIピクチャのフィールドは同一となる。
一方、現在のピクチャのフィールドがIピクチャのフィールドと異なっていれば（ステップＳ１０６−Ｎｏ）、ピクチャ情報量決定部３３３は、基本目標情報量Tpから補正情報量ΔTを引いた値を目標情報量Tとする（ステップＳ１０８）。

ステップＳ１０７〜Ｓ１０９の何れかによって目標情報量Tが決定されると、ピクチャ情報量決定部３３３は、（７）式及び（８）式に従って、その目標情報量Tを用いて量子化パラメータを決定する（ステップＳ１１０）。ピクチャ情報量決定部３３３は、求められた量子化パラメータを量子化部２３に渡す。
その後ピクチャ情報量制御部３３は、Pピクチャに対する量子化パラメータの決定処理を終了する。

なお、Iピクチャに対する量子化パラメータについては、ピクチャ情報量制御部３３は、上記の（３）式及び（４）式に従って基本目標情報量Tiを算出する。そしてピクチャ情報量制御部３３は、（７）式及び（８）式に従って、その基本目標情報量Tiを用いて量子化パラメータを決定すればよい。

図６は、動画像符号化装置１の処理部１３上で実行されるコンピュータプログラムにより制御される、動画像データの符号化処理の動作フローチャートを示す。なお、図６に示されたフローチャートは、１枚のピクチャの各マクロブロックに対する処理を表す。動画像符号化装置１は、符号化対象となる動画像データが連続している間、ピクチャごとに図６に示された符号化処理の手順を繰り返し実行する。

図６に示されるように、動画像符号化装置１が信号取得部１１を介して動画像データを取得すると、処理部１３は符号化処理を開始する。そして処理部１３は、現在のピクチャがIピクチャであるか否か判定する（ステップＳ２０１）。現在のピクチャがIピクチャである場合（ステップＳ２０１−Ｙｅｓ）、処理部１３のイントラ予測画像生成部３１は、符号化対象となるマクロブロックに隣接する既に符号化されたマクロブロックから、予測画像を作成する（ステップＳ２０２）。イントラ予測画像生成部３１は、作成された予測画像を処理部１３の予測画像選択部３２に渡す。そして、予測画像選択部３２は、イントラ予測画像生成部３１により作成された、隣接するマクロブロックに基づく予測画像を選択し、選択された予測画像を処理部１３の予測誤差信号生成部２１に渡す（ステップＳ２０３）。

一方、ステップＳ２０１において、現在のピクチャがPピクチャである場合（ステップＳ２０１−Ｎｏ）、処理部１３の動きベクトル計算部２９は、マクロブロックの動きベクトルを算出する（ステップＳ２０４）。動きベクトル計算部２９は、上述したように、マクロブロックと復号画像記憶部２８に記憶されている参照ピクチャとのブロックマッチングにより、動きベクトルを算出できる。なお、ステップＳ２０４の処理に関して、動きベクトル計算部２９は、最初のマクロブロックについての符号化処理を実行する際に、現在のピクチャに含まれる全てのマクロブロックについて動きベクトルを算出する。これは、ステップＳ２０９における量子化パラメータの決定処理において、全てのマクロブロックの動きベクトルが使用されるためである。その代わりに、２番目以降のマクロブロックに関しては、処理部１３は、ステップＳ２０４の処理を省略する。動きベクトル計算部２９は、算出された動きベクトルを、処理部１３のインター予測画像生成部３０、ピクチャ情報量制御部３３及び符号化部２４にそれぞれ渡す。

次に、インター予測画像生成部３０は、参照ピクチャを動きベクトルで動き補償することにより、予測画像を作成する（ステップＳ２０５）。インター予測画像生成部３０は、作成された予測画像を予測画像選択部３２に渡す。そして、予測画像選択部３２は、インター予測画像生成部３０により作成された、前のピクチャに基づく予測画像を選択し、選択された予測画像を予測誤差信号生成部２１に渡す（ステップＳ２０６）。

ステップＳ２０５またはＳ２０６の後、予測誤差信号生成部２１は、符号化対象のマクロブロックと予測画像との差分により、予測誤差信号を生成する（ステップＳ２０７）。そして予測誤差信号生成部２１は、生成された予測誤差信号を処理部１３の直交変換部２２に渡す。直交変換部２２は、受け取った予測誤差信号を直交変換処理することにより、周波数信号を算出する（ステップＳ２０８）。直交変換部２２は、この周波数信号を処理部１３の量子化部２３に渡す。

一方、ピクチャ情報量制御部３３は、動きベクトル計算部２９から受け取った動きベクトルに基づいて、量子化パラメータを決定する（ステップＳ２０９）。ピクチャ情報量制御部３３は、現在のピクチャがPピクチャである場合、図５のフローチャートに示された手順に従って、量子化パラメータを決定する。そしてピクチャ情報量制御部３３は、量子化パラメータを量子化部２３に渡す。

量子化部２３は、ピクチャ情報量制御部３３から受け取った量子化パラメータに従って、直交変換部２２から受け取った周波数信号を量子化する（ステップＳ２１０）。そして量子化部２３は、量子化された周波数信号を処理部１３の符号化部２４及び逆量子化部２５に渡す。
符号化部２４は、量子化された周波数信号を可変長符号化することにより、符号化対象であるマクロブロックについての符号化された信号を生成する（ステップＳ２１１）。そして符号化部２４は、その符号化された信号を出力する。

一方、逆量子化部２５は、量子化された周波数信号を逆量子化することにより、周波数信号を算出する（ステップＳ２１２）。そして逆量子化部２５は、算出された周波数信号を処理部１３の逆直交変換部２６に渡す。逆直交変換部２６は、逆量子化部２５から受け取った周波数信号を逆直交変換することにより、符号化対象のマクロブロックについての予測誤差信号を再生する（ステップＳ２１３）。そして逆直交変換部２６は、再生された予測誤差信号を処理部１３の復号画像生成部２７に渡す。復号画像生成部２７は、予測誤差信号を算出する際に用いられた予測画像に、再生された予測誤差信号を加算することにより、ブロック単位で参照ピクチャを生成する（ステップＳ２１４）。復号画像生成部２７は、その参照ピクチャを、処理部１３の復号画像記憶部２８に記憶する。
処理部１３は、上記の処理を繰り返して、各ピクチャのマクロブロックごとに符号化された信号を生成する。そして処理部１３は、所定のヘッダ情報をその符号化された信号に付すとともに、所定の形式に沿ってその符号化された信号を配列することにより、符号化された動画像データを含むデータストリームを作成する。

なお、動画像符号化装置１により符号化された動画像データは、例えば、H.264 MPEG-4 AVCに準拠するデータとすることができる。そのため、動画像符号化装置１により符号化された動画像データは、従来の動画像復号装置により復号することができる。

以上に説明してきたように、この動画像符号化装置は、GOP内の後半部に位置するPピクチャに対して割り当てられる符号化ビット数を、Iピクチャと同じフィールドのPピクチャに対して多く、Iピクチャと異なるフィールドのPピクチャに対して少なくする。これにより、この動画像符号化装置は、画質劣化が少ないPピクチャを1枚おきに作成できるので、GOP全体のビットレートを一定に保ったまま、観察者の主観的な画質を向上することができる。また、Pピクチャの画質劣化が比較的少ないGOPの前半部分では、予測誤差信号生成のために、トップフィールドとボトムフィールドのどちらを参照ピクチャとしても、誤差が小さくて済む。そのため、この動画像符号化装置は、GOP内の後半部に限定してそのような割り当て符号化ビット数を調整することにより、GOP内の前半部分で発生する誤差を抑制しつつ、符号化誤差が大きくなる後半部分では、それ以上画質が劣化することを防止できる。そのため、この動画像符号化装置は、Iピクチャと同じフィールドのPピクチャと、次のGOPの先頭に位置するIピクチャとの間で画質が急激に変化することを抑制できる。
したがって、この動画像符号化装置は、この動画像符号化装置により符号化された動画像データから復号された復号動画像データにおけるフリッカーの発生を抑制することができる。

なお、本発明は上記の実施形態に限定されるものではない。例えば、処理部は、図６に示したフローチャートにおける、ステップＳ２０９の処理と、ステップＳ２０２、Ｓ２０３若しくはステップＳ２０５、Ｓ２０６及びステップＳ２０７、Ｓ２０８の処理の順序を入れ替えてもよい。さらに、処理部は、図６に示したフローチャートにおける、ステップＳ２１１の処理と、ステップＳ２１２〜Ｓ２１４の処理の順序を入れ替えてもよい。
また、ピクチャ情報量制御部は、補正情報量ΔTを使用して目標情報量Tを増減するか否かの判定基準として、参照ピクチャとその参照ピクチャに対応する原ピクチャとから計算されるPSNRを用いてもよい。この場合、図５に示されたフローチャートのステップＳ１０４において、ピクチャ情報量制御部は、残りPピクチャの枚数Npを所定の閾値ThNと比較する代わりに、現在のピクチャの一つ前のピクチャについて求めたPSNRが所定の閾値Thpよりも低いか否かを判定する。そしてピクチャ情報量制御部は、PSNRがその閾値Thpよりも低い場合、ステップＳ１０５以降の処理を実行し、一方、PSNRがその閾値Thp以上である場合、ステップＳ１０９の処理を実行する。

なお、PSNRは、例えば、次式に従って算出される。

ただし、Npixは、ピクチャに含まれる総ピクセル数である。またp_iは、原ピクチャのi番目のピクセルのピクセル値を表す。一方、p'_iは、原ピクチャに対応する、復号画像記憶部に記憶された参照ピクチャのi番目のピクセルのピクセル値を表す。
また、閾値Thpは、着目するGOP内の各ピクチャを観察者が動画像として見た時に、そのGOPのIピクチャの画質と比較して、Pピクチャの画質が劣化したことに気付かないPSNR値の最小値に設定されることが好ましい。例えば、閾値Thpは、着目するGOPのIピクチャについて算出されたPSNR値に、0.7あるいは0.8を乗じた値とすることができる。

さらに、ピクチャ情報量制御部は、補正情報量ΔTを一定としてもよい。例えば、ピクチャ情報量制御部は、（５）式において、符号化されていない残りPピクチャの枚数にかかわらず、Np=0として、補正情報量ΔTを求めてもよい。

また、ピクチャ情報量制御部は、動きのないシーンに対応するGOPについても、画質劣化が少ないPピクチャが1枚おきに並ぶように、量子化パラメータを決定してもよい。この場合、ピクチャ情報量制御部は、図５に示されたフローチャートのステップＳ１０１及びＳ１０２の処理を省略する。すなわち、ピクチャ情報量制御部は、ピクチャが動きのあるシーンに対応するピクチャか否かの判定結果によらず、目標情報量Tを決定してもよい。この場合には、ピクチャ動き量算出部及び動き判定部は省略されるので、ピクチャ情報量制御部は、量子化パラメータを算出するための演算量を少なくすることができる。

さらに、符号化ビット数が多く割り当てられるPピクチャの周期は、1枚おきに限定されない。ピクチャ情報量制御部は、観察者の主観的画質の低下が許容できる範囲で、符号化ビット数が多く割り当てられるPピクチャの周期を設定できる。例えば、ピクチャ情報量制御部は、連続する3枚のPピクチャのうちの1枚に対する目標情報量T1を大きくし、その他の2枚に対する目標情報量T2を小さくしてもよい。この場合、ピクチャ情報量制御部は、目標情報量T1を、Pピクチャに対する基本目標情報量Tpに、（５）式に基づいて求められた補正情報量ΔTを加算した値とする。一方、ピクチャ情報量制御部は、目標情報量T2を、Pピクチャに対する基本目標情報量Tpから（５）式に基づいて求められた補正情報量ΔTの1/2を引いた値とする。またピクチャ情報量制御部は、連続する3枚のPピクチャのうちの2枚に対する目標情報量T1を大きくし、その他の1枚に対する目標情報量T2を小さくしてもよい。この場合には、ピクチャ情報量制御部は、目標情報量T1を、基本目標情報量Tpに、（５）式に基づいて求められた補正情報量ΔTの1/2を加算した値とする。一方、ピクチャ情報量制御部は、目標情報量T2を、基本目標情報量Tpから（５）式に基づいて求められた補正情報量ΔTを引いた値とする。

このように、符号化ビット数が多く割り当てられるPピクチャの周期が1枚おきでない場合、ピクチャ情報量制御部は、図５に示されたフローチャートのステップＳ１０６では、現在のピクチャのGOP内の位置が、GOP内のピクチャの枚数よりも短い所定の周期に対応する位置か否か判定する。
また、符号化される動画像データに含まれる各ピクチャがフレームである場合も、ピクチャ情報量制御部は、図５に示されたフローチャートのステップＳ１０６では、現在のピクチャのGOP内の位置が、GOP内の上記の所定の周期に対応する位置か否か判定すればよい。そして現在のピクチャのGOP内の位置がその所定周期に対応する位置であれば、ピクチャ情報量制御部はステップＳ１０７の処理を実行する。一方、現在のピクチャのGOP内の位置がその所定周期に対応する位置でなければ、ピクチャ情報量制御部はステップＳ１０８の処理を実行する。

また、この画像符号化装置により符号化される動画像データのGOPは、Bピクチャを含んでいてもよい。例えば、GOPが連続する2枚のBピクチャと1枚のPピクチャを含むピクチャの組を複数有する場合には、ピクチャ情報量制御部は、何れか一方のBピクチャの目標情報量を所定量だけ低下させ、他方のBピクチャの目標情報量をその所定量だけ増加させてもよい。この場合、所定量は、例えば、（６）式により求められるBピクチャに対する基本目標情報量Tbの10%あるいは20%とすることができる。

この画像符号化装置は、様々な用途に利用される。例えば、この画像符号化装置は、ビデオカメラ、映像伝送装置、テレビ電話システム、コンピュータあるいは携帯電話機に組み込まれる。例えば、この画像符号化装置が映像伝送装置に組み込まれる場合、この動画像符号化装置により作成された、符号化された動画像データは、その処理部により、音声信号等、動画像データと同時に取得される他の信号とともに、所定の通信規格に従ったデータストリームに変換される。そして画像符号化装置を組み込んだ映像伝送装置は、そのデータストリームを、出力部に接続されたアンテナを介して、あるいは通信回線を介して、遠隔地に設置された動画像復号装置へ伝送する。

以上のように、当業者は、本発明の範囲内で、実施される形態に合わせて様々な変更を行うことができる。

１動画像符号化装置
１１信号取得部
１２記憶部
１３処理部
１４出力部
２１予測誤差信号生成部
２２直交変換部
２３量子化部
２４符号化部
２５逆量子化部
２６逆直交変換部
２７復号画像生成部
２８復号画像記憶部
２９動きベクトル計算部
３０インター予測画像生成部
３１イントラ予測画像生成部
３２予測画像選択部
３３ピクチャ情報量制御部
３３１ピクチャ動き量算出部
３３２動き判定部
３３３ピクチャ情報量決定部

Claims

動画像データを取得する信号取得部と、
前記動画像データに含まれる、ピクチャの組に含まれる複数の連続するピクチャのそれぞれを、インター符号化またはイントラ符号化することにより、前記動画像データを符号化する処理部とを有し、
前記処理部は、
インター符号化されるピクチャの位置が、前記ピクチャの組の先頭を基準として、前記ピクチャの組に含まれる各ピクチャに対して均等に符号化ビット数を割り当てた場合にインター符号化による符号化誤差が許容範囲内に収まる所定位置より後であり、かつ、前記ピクチャの組に含まれるピクチャの枚数よりも短い所定の周期の第１の位置に対応する場合、前記インター符号化されるピクチャに対して割り当てられる符号化ビット数が、所定の基準値に対して第１の補正量を加算した値となり、前記インター符号化されるピクチャの位置が前記所定位置より後であり、且つ、前記第１の位置と異なる第２の位置である場合、前記符号化ビット数が前記基準値から第２の補正量を減算した値となるように、量子化パラメータを決定する情報量制御機能と、
前記ピクチャの組に含まれる各ピクチャを複数のブロックに分割し、分割された各ブロックごとに、時間的に前後のピクチャの類似する領域、あるいは前記ピクチャ内の他のブロックとの誤差を表す予測誤差信号を生成する予測誤差信号生成機能と、
前記予測誤差信号を直交変換することにより、周波数信号を生成する直交変換機能と、
前記量子化パラメータに従って、前記周波数信号を量子化する量子化機能と、
前記量子化された前記周波数信号を可変長符号化する符号化機能と、
を実現する、動画像符号化装置。
前記所定位置は、前記ピクチャの組の先頭位置に、前記ピクチャの組に含まれる、インター符号化されるピクチャの枚数の半分を加えた位置である、請求項１に記載の動画像符号化装置。
前記所定位置は、前記インター符号化されるピクチャの直前のピクチャについて、符号化による画質劣化度が、前記ピクチャの組に含まれるイントラ符号化されたピクチャの画質劣化度よりも所定度数低下した位置である、請求項１に記載の動画像符号化装置。
前記処理部は、前記情報量制御機能により、前記ピクチャの組の後端に近いほど、前記第１の位置にある前記インター符号化されるピクチャに対して割り当てられる符号化ビット数が多くなるように前記第１の補正量を増加させ、前記ピクチャの組の後端に近いほど、前記第２の位置にある前記インター符号化されるピクチャに対して割り当てられる符号化ビット数が少なくなるように前記第２の補正量を増加させる、請求項１〜３の何れか一項に記載の動画像符号化装置。
前記ピクチャの組は、前記連続するピクチャとしてトップフィールドとボトムフィールドを交互に含み、かつ、前記処理部は、前記情報量制御機能により、イントラ符号化されるピクチャのフィールドと同一のフィールドのピクチャが前記第１の位置に配置されるように、前記所定の周期を設定する、請求項１〜４の何れか一項に記載の動画像符号化装置。
前記処理部は、前記インター符号化されるピクチャの前記各ブロックについて、時間的に前後のピクチャの類似する領域からの移動量を求める動き検出機能をさらに実現し、
前記処理部は、前記情報量制御機能により、前記各ブロックの移動量の統計値から前記インター符号化されるピクチャが対応するシーンが静止シーンであると判定した場合、前記第１の補正量及び前記第２の補正量をゼロに設定する、請求項１〜５の何れか一項に記載の動画像符号化装置。
動画像データに含まれる、ピクチャの組に含まれる複数の連続するピクチャのそれぞれを、インター符号化またはイントラ符号化することにより、前記動画像データを符号化する動画像符号化方法であって、
インター符号化されるピクチャの位置が、前記ピクチャの組の先頭を基準として、前記ピクチャの組に含まれる各ピクチャに対して均等に符号化ビット数を割り当てた場合にインター符号化による符号化誤差が許容範囲内に収まる所定位置より後であり、かつ、前記ピクチャの組に含まれるピクチャの枚数よりも短い所定の周期の第１の位置に対応する場合、前記インター符号化されるピクチャに対して割り当てられる符号化ビット数が、所定の基準値に対して第１の補正量を加算した値となり、前記インター符号化されるピクチャの位置が前記所定位置より後であり、且つ、前記第１の位置と異なる第２の位置である場合、前記符号化ビット数が前記基準値から第２の補正量を減算した値となるように、量子化パラメータを決定し、
前記ピクチャの組に含まれる各ピクチャを複数のブロックに分割し、分割された各ブロックごとに、時間的に前後のピクチャの類似する領域、あるいは前記ピクチャ内の他のブロックとの誤差を表す予測誤差信号を生成し、
前記予測誤差信号を直交変換することにより、周波数信号を生成し、
前記量子化パラメータに従って、前記周波数信号を量子化し、
前記量子化された前記周波数信号を可変長符号化する、
ことを含む動画像符号化方法。
動画像データに含まれる、ピクチャの組に含まれる複数の連続するピクチャのそれぞれを、コンピュータにインター符号化またはイントラ符号化させることにより、前記動画像データを符号化させる動画像符号化用コンピュータプログラムであって、
インター符号化されるピクチャの位置が、前記ピクチャの組の先頭を基準として、前記ピクチャの組に含まれる各ピクチャに対して均等に符号化ビット数を割り当てた場合にインター符号化による符号化誤差が許容範囲内に収まる所定位置より後であり、かつ、前記ピクチャの組に含まれるピクチャの枚数よりも短い所定の周期の第１の位置に対応する場合、前記インター符号化されるピクチャに対して割り当てられる符号化ビット数が、所定の基準値に対して第１の補正量を加算した値となり、前記インター符号化されるピクチャの位置が前記所定位置より後であり、且つ、前記第１の位置と異なる第２の位置である場合、前記符号化ビット数が前記基準値から第２の補正量を減算した値となるように、量子化パラメータを決定する情報量制御機能と、
前記ピクチャの組に含まれる各ピクチャを複数のブロックに分割し、分割された各ブロックごとに、時間的に前後のピクチャの類似する領域、あるいは前記ピクチャ内の他のブロックとの誤差を表す予測誤差信号を生成する予測誤差信号生成機能と、
前記予測誤差信号を直交変換することにより、周波数信号を生成する直交変換機能と、
前記量子化パラメータに従って、前記周波数信号を量子化する量子化機能と、
前記量子化された前記周波数信号を可変長符号化する符号化機能と、
をコンピュータに実行させる動画像符号化用コンピュータプログラム。
ピクチャの組に含まれる複数の連続するピクチャのそれぞれを、インター符号化またはイントラ符号化することにより、該動画像データを符号化する動画像符号化回路であって、
インター符号化されるピクチャの位置が、前記ピクチャの組の先頭を基準として、前記ピクチャの組に含まれる各ピクチャに対して均等に符号化ビット数を割り当てた場合にインター符号化による符号化誤差が許容範囲内に収まる所定位置より後であり、かつ、前記ピクチャの組に含まれるピクチャの枚数よりも短い所定の周期の第１の位置に対応する場合、前記インター符号化されるピクチャに対して割り当てられる符号化ビット数が、所定の基準値に対して第１の補正量を加算した値となり、前記インター符号化されるピクチャの位置が前記所定位置より後であり、且つ、前記第１の位置と異なる第２の位置である場合、前記符号化ビット数が前記基準値から第２の補正量を減算した値となるように、量子化パラメータを決定する情報量制御回路と、
前記ピクチャの組に含まれる各ピクチャを複数のブロックに分割し、分割された各ブロックごとに、時間的に前後のピクチャの類似する領域、あるいは前記ピクチャ内の他のブロックとの誤差を表す予測誤差信号を生成する予測誤差信号生成回路と、
前記予測誤差信号を直交変換することにより、周波数信号を生成する直交変換回路と、
前記量子化パラメータに従って、前記周波数信号を量子化する量子化回路と、
前記量子化された前記周波数信号を可変長符号化する符号化回路と、
を有する動画像符号化回路。