WO2012105267A1

WO2012105267A1 - 画像符号化方法

Info

Publication number: WO2012105267A1
Application number: PCT/JP2012/000712
Authority: WO
Inventors: 寿郎笹井; 敏康杉尾; 西　孝啓; 陽司柴原
Original assignee: パナソニック株式会社
Priority date: 2011-02-03
Filing date: 2012-02-02
Publication date: 2012-08-09

Abstract

画像データを圧縮符号化する画像符号化方法であって、画像データの符号化対象信号を２値化することで、２値信号を生成する２値化ステップ（Ｓ２０１）と、画像データを既に符号化したフレームから予測する画像予測ステップと、画像予測の相対位置情報を予測する動きベクトル予測ステップと、画像予測に用いた動きベクトルと予測動きベクトルとの差分を算出し、差分動きベクトルを取得する差分ステップと、複数のコンテキストから、差分動きベクトルを符号化するためのコンテキストを決定するコンテキスト区分決定ステップ（Ｓ２０２～Ｓ２０５）と、コンテキストに対応付けられた符号化確率情報を用いて２値信号を算術符号化する算術符号化ステップ（Ｓ２０６）と、２値信号に基づいて、符号化確率情報を更新する更新ステップ（Ｓ２０７）とを含む。

Description

画像符号化方法

　本発明は、画像符号化方法に関し、特に、算術符号化を行う画像符号化方法に関する。

　近年、インターネットを介したビデオ会議、デジタルビデオ放送及び映像コンテンツのストリーミングを含む、例えば、ビデオ・オン・デマンドタイプのサービスのためのアプリケーションの数が増えている。これらのアプリケーションでは、かなりのデータ量のデジタルデータからなる映像データを、伝送チャネルを介して伝送し、記憶媒体に記憶している。しかし、従来の伝送路はバンド幅が限られ、記憶媒体は記憶容量が限られている。このため、従来の伝送チャネルに映像データを伝送し、従来の記憶媒体に映像データを記憶するためには、映像データのデータ量を圧縮又は削減することが不可欠である。

　そこで、映像データの圧縮のために、複数の映像符号化規格が開発されている。このような映像符号化規格には、例えば、Ｈ．２６ｘで示されるＩＴＵ－Ｔ（国際電気通信連合電気通信標準化部門）規格、及び、ＭＰＥＧ－ｘで示されるＩＳＯ／ＩＥＣ規格がある。最新かつ最も進んだ映像符号化規格は、現在、Ｈ．２６４／ＡＶＣ、又は、ＭＰＥＧ－４　ＡＶＣで示される規格である（非特許文献１及び非特許文献２参照）。

　Ｈ．２６４／ＡＶＣ規格におけるデータ圧縮処理は、大きく分けると、予測、変換、量子化、エントロピー符号化という処理で構成される。この中でエントロピー符号化は、予測に用いられる情報や、量子化された情報から冗長な情報を削減する。エントロピー符号化としては、可変長符号化、適応符号化、固定長符号化等が知られている。可変長符号化にはハフマン符号化、ランレングス符号化、算術符号化等がある。このうち、算術符号化は、シンボル発生確率を計算しながら出力符号を決める方式であり、画像データの特徴に応じて符号が決められるため、固定した符号化テーブルを使用するハフマン符号化等に比べて符号化効率が高いことが知られている。

　Ｈ．２６４／ＡＶＣ規格では、動きベクトル（相対位置情報）を用いたデータ圧縮処理が行われる。具体的には、既に符号化済みの隣接ブロック等の動きベクトルから予測動きベクトルを生成し、その差分を符号化することによって情報量を削減する。

　具体的な例として、図１５を参照して説明する。図１５において、符号化対象ブロックの左側に隣接する符号化済みのブロックを隣接ブロックＡ、符号化対象ブロックの上側に隣接する符号化済みのブロックを隣接ブロックＢ、符号化対象ブロックの右斜め上に隣接する符号化済みのブロックを隣接ブロックＣとする。

　また、図１５において、隣接ブロックＡは、２方向の予測動きベクトルを持ち、予測方向１の動きベクトルＭｖＬ０＿Ａと、予測方向２の動きベクトルＭｖＬ１＿Ａを持つ。ここで、ＭｖＬ０とは、参照ピクチャリスト１（Ｌ０）により特定した参照ピクチャを参照する動きベクトルであり、ＭｖＬ１とは、参照ピクチャリスト（Ｌ１）により特定した参照ピクチャを参照する動きベクトルである。また、隣接ブロックＢは、１方向の予測動きベクトルを持ち、予測方向１の動きベクトルＭｖＬ０＿Ｂを持つ。また、隣接ブロックＣは、２方向の予測動きベクトルを持ち、予測方向１の動きベクトルＭｖＬ０＿Ｃと、予測方向２の動きベクトルＭｖＬ１＿Ｃを持つ。また、符号化対象ブロックは、２方向の予測動きベクトルを持ち、予測方向１の動きベクトルＭｖＬ０と、予測方向２の動きベクトルＭｖＬ１を持つ。

　符号化対象ブロックの予測方向１の動きベクトルＭｖＬ０の符号化の際は、同一の予測方向１の動きベクトルである、隣接ブロックＡのＭｖＬ０＿Ａ、隣接ブロックＢのＭｖＬ０＿Ｂ、および隣接ブロックＣのＭｖＬ０＿Ｃを用いて予測動きベクトルＰＭｖＬ０を生成する。即ち、符号化対象ブロックの動きベクトルＭｖＬ０を符号化する際には、隣接ブロックの動きベクトルＭｖＬ０を利用し、動きベクトルＭｖＬ１を利用することはない。そして、符号化対象ブロックの動きベクトルＭｖＬ０と予測動きベクトルＰＭｖＬ０の差分動きベクトルを符号化する。予測動きベクトルＰＭｖＬ０は、動きベクトルＭｖＬ０＿Ａ、ＭｖＬ０＿Ｂ、ＭｖＬ０＿Ｃの中間値Ｍｅｄｉａｎ（ＭｖＬ０＿Ａ，ＭｖＬ０＿Ｂ、ＭｖＬ０＿Ｃ）等を用いて算出される。ここで、中間値Ｍｅｄｉａｎは、以下のような式で導出される。

　符号化対象ブロックの予測方向２の動きベクトルＭｖＬ１の符号化の際は、同一の予測方向２の動きベクトルである、隣接ブロックＡのＭｖＬ１＿Ａ、および隣接ブロックＣのＭｖＬ１＿Ｃを用いて予測動きベクトルＰＭｖＬ１を生成する。即ち、符号化対象ブロックの動きベクトルＭｖＬ１を符号化する際には、隣接ブロックの動きベクトルＭｖＬ１を利用し、動きベクトルＭｖＬ０を利用することはない。そして、予測対象ブロックの動きベクトルＭｖＬ１と予測動きベクトルＰＭｖＬ１の差分動きベクトルを符号化する。予測動きベクトルＰＭｖＬ１は、中間値Ｍｅｄｉａｎ（ＭｖＬ１＿Ａ，０，ＭｖＬ１＿Ｃ）等を用いて算出される。上記により算出される差分動きベクトルを示す差分動き情報を算術符号化することにより、ビットストリームとして出力する。

　次に、図１３及び図１４を用いて、従来の算術符号化の動作を説明する。

　まず、図１３を用いて、算術符号化の流れを以下に説明する。

　上記の差分動き情報の信号（入力信号）について、算術符号化が開始されると、ステップＳ１１において、信号の種別に応じて、予め決められた手法で２値化（Ｂｉｎａｒｉｚａｔｉｏｎ）が行われる。次に、ステップＳ１２において信号の種別に応じたコンテキスト制御処理が行われる。コンテキスト制御処理では、信号の種別に対応したシンボル発生確率を、複数のシンボル発生確率を格納しているメモリから読み出して出力する。ステップＳ１３において、ステップＳ１２においてメモリより受け取ったシンボル発生確率を用いて、処理対象の差分動き情報に算術符号化を行い、結果を出力信号として出力する。

　ステップＳ１４において、ステップＳ１１において算出された２値化情報に基づいて、対応するシンボル発生確率の値を更新し、新たなシンボル発生確率として格納する。処理対象の入力信号が示す差分動き情報の算術符号化が完了すると、また、次の符号化処理対象の入力信号が示す差分動き情報の算術符号化を行う。

　図１４は、Ｈ．２６４／ＡＶＣの算術符号化処理を実行する算術符号化部の構成を示すブロック図である。図１４に示されるように、算術符号化部１０は、２値化部１１と、シンボル発生確率格納部１２と、コンテキスト制御部１３と、２値算術符号化器１４とを含んでいる。

　算術符号化部１０には、符号化対象となる信号である入力信号ＳＩと、当該入力信号ＳＩの種別を表す信号種別情報ＳＥとが入力される。２値化部１１は、信号種別情報ＳＥに基づいて、入力信号ＳＩを“０”、“１”の２値の情報（シンボル）に変換し、２値信号ＢＩＮを２値算術符号化器１４とコンテキスト制御部１３とに送る。

　コンテキスト制御部１３は、信号種別情報ＳＥに対応するシンボル発生確率ＰＥをシンボル発生確率格納部１２から２値算術符号化器１４に出力させる。また、コンテキスト制御部１３は、２値化部１１から入力される入力信号ＳＩに対応する２値信号ＢＩＮに基づいて、信号種別情報ＳＥに対応したシンボル発生確率ＰＥの更新処理を行い、更新結果をシンボル発生確率格納部１２に格納する。

　２値算術符号化器１４は、２値信号ＢＩＮに、シンボル発生確率ＰＥに基づいて算術符号化処理を行い、出力ビット情報ＯＢを生成して出力する。

ＩＳＯ／ＩＥＣ　１４４９６－１０　「ＭＰＥＧ－４　Ｐａｒｔ１０　Ａｄｖａｎｃｅｄ　Ｖｉｄｅｏ　Ｃｏｄｉｎｇ」Ｔｈｏｍａｓ　Ｗｉｅｇａｎｄ　ｅｔ　ａｌ、"Ｏｖｅｒｖｉｅｗ　ｏｆ　ｔｈｅ　Ｈ．２６４／ＡＶＣ　Ｖｉｄｅｏ　Ｃｏｄｉｎｇ　Ｓｔａｎｄａｒｄ"、ＩＥＥＥ　ＴＲＡＮＳＡＣＴＩＯＮＳ　ＯＮ　ＣＩＲＣＵＩＴＳ　ＡＮＤ　ＳＹＳＴＥＭＳ　ＦＯＲ　ＶＩＤＥＯ　ＴＥＣＨＮＯＬＯＧＹ、ＪＵＬＹ　２００３、ＰＰ．１－１９．

　上記従来の技術では、コンテキスト制御部において、上記信号種別情報に基づいて、符号化対象信号に対応するシンボル発生確率を、Ｘ軸の動き情報、Ｙ軸の動き情報、予測動きベクトルの大きさによって区分している。しかしながら、例えば、動きベクトルの予測が当たらない場合と、当たる場合では、得られる差分動き情報が大きく異なり算術符号化の利点である画像データの特徴に適応した制御が困難になり、符号化効率が悪化する。

　そこで、本発明は、上記従来の課題を解決するためになされたものであって、シンボル発生確率などの確率情報の予測の精度を高めることができ、符号化効率を向上させることができる画像符号化方法及び画像復号方法を提供することを目的とする。

　上記従来の課題を解決するために、本発明の一態様に係る画像符号化方法は、画像データを圧縮符号化する画像符号化方法であって、画像データを既に符号化したフレームから予測する画像予測ステップと、画像予測の相対位置情報を予測する動きベクトル予測ステップと、画像予測に用いた相対位置情報と、前記予測された予測動きベクトルとの差分を算出し、差分動きベクトルを取得する差分ステップと、複数のコンテキストから、前記差分動きベクトルを符号化するためのコンテキストを決定するコンテキスト区分決定ステップと、前記差分動きベクトルの符号化対象信号を２値化することで、２値信号を生成する２値化ステップと、前記コンテキスト区分決定ステップで決定した前記コンテキストに対応付けられた符号化確率情報を用いて、前記２値信号を算術符号化する算術符号化ステップと、前記２値化ステップで生成された前記２値信号に基づいて、前記符号化確率情報を更新する更新ステップとを含む。

　これにより、符号化対象となる差分動き情報が大きくなりやすい（予測動きベクトル候補の本数が少ない）、小さくなりやすい（予測動きベクトル候補の本数が多い）といった統計的性質をもつ信号を考慮した符号化確率情報（シンボル発生確率）を使用できるので、確率情報の予測の精度を高めることができ、符号化効率を向上させることが可能となる。

　なお、本発明は、画像符号化方法として実現できるだけではなく、当該画像符号化方法に含まれる処理ステップを実行する処理部を備える装置として実現することもできる。また、これらステップをコンピュータに実行させるプログラムとして実現してもよい。さらに、当該プログラムを記録したコンピュータ読み取り可能なＣＤ－ＲＯＭ（Ｃｏｍｐａｃｔ　Ｄｉｓｃ－Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）などの記憶媒体、並びに、当該プログラムを示す情報、データ又は信号として実現してもよい。そして、それらプログラム、情報、データ及び信号は、インターネットなどの通信ネットワークを介して配信してもよい。

　また、上記の画像符号化方法を実行する装置を構成する構成要素の一部又は全部は、１個のシステムＬＳＩ（Ｌａｒｇｅ　Ｓｃａｌｅ　Ｉｎｔｅｇｒａｔｉｏｎ：大規模集積回路）から構成されていてもよい。システムＬＳＩは、複数の構成部を１個のチップ上に集積して製造された超多機能ＬＳＩであり、具体的には、マイクロプロセッサ、ＲＯＭ及びＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）などを含んで構成されるコンピュータシステムである。

　本発明によれば、精度の高いシンボル発生確率の予測を行うことができるため、画像符号化効率を向上させることができる。

図１は、本発明の実施の形態１に係る算術符号化部の構成の一例を示すブロック図である。図２は、本発明の実施の形態１に係るシンボル発生確率テーブルの一例を示す図である。図３Ａは、本発明の実施の形態１に係るコンテキストテーブルの一例を示す図である。図３Ｂは、本発明の実施の形態１に係るコンテキストテーブルの一例を示す図である。図４は、本発明の実施の形態１に係る予測動きベクトル候補リスト取得の一例を示すフローチャートである。図５Ａは、本発明の実施の形態１に係る予測動きベクトル候補インデックス及び予測動きベクトル候補リストの一例を示す模式図である。図５Ｂは、本発明の実施の形態１に係る予測動きベクトル候補インデックス及び予測動きベクトル候補リストの一例を示す模式図である。図５Ｃは、本発明の実施の形態１に係る予測動きベクトル候補インデックス及び予測動きベクトル候補リストの一例を示す模式図である。図６は、本発明の実施の形態１に係るコンテキストブロック区分制御の動作の一例を示すフローチャートである。図７は、本発明の実施の形態１に係るコンテキストブロック区分制御の動作の一例を示すフローチャートである。図８は、本発明の実施の形態１に係る画像符号化装置の構成の一例を示すブロック図である。図９は、本発明の実施の形態２に係る算術復号部の構成の一例を示すブロック図である。図１０は、本発明の実施の形態２に係る算術復号方法の一例を示すフローチャートである。図１１は、本発明の実施の形態２に係る算術復号方法の一例を示すフローチャートである。図１２は、本発明の実施の形態２に係る画像復号装置の構成の一例を示すブロック図である。図１３は、従来の算術符号化方法を示すフローチャートである。図１４は、従来の算術符号化装置の構成を示すブロック図である。図１５は、従来の差分動き情報の導出方法の一例を示す模式図である。図１６は、コンテンツ配信サービスを実現するコンテンツ供給システムの全体構成図である。図１７は、デジタル放送用システムの全体構成図である。図１８は、テレビの構成例を示すブロック図である。図１９は、光ディスクである記録メディアに情報の読み書きを行う情報再生／記録部の構成例を示すブロック図である。図２０は、光ディスクである記録メディアの構造例を示す図である。図２１Ａは、携帯電話の一例を示す図である。図２１Ｂは、携帯電話の構成例を示すブロック図である。図２２は、多重化データの構成を示す図である。図２３は、各ストリームが多重化データにおいてどのように多重化されているかを模式的に示す図である。図２４は、ＰＥＳパケット列に、ビデオストリームがどのように格納されるかを更に詳しく示した図である。図２５は、多重化データにおけるＴＳパケットとソースパケットの構造を示す図である。図２６は、ＰＭＴのデータ構成を示す図である。図２７は、多重化データ情報の内部構成を示す図である。図２８は、ストリーム属性情報の内部構成を示す図である。図２９は、映像データを識別するステップを示す図である。図３０は、各実施の形態の動画像符号化方法および動画像復号方法を実現する集積回路の構成例を示すブロック図である。図３１は、駆動周波数を切り替える構成を示す図である。図３２は、映像データを識別し、駆動周波数を切り替えるステップを示す図である。図３３は、映像データの規格と駆動周波数を対応づけたルックアップテーブルの一例を示す図である。図３４Ａは、信号処理部のモジュールを共有化する構成の一例を示す図である。図３４Ｂは、信号処理部のモジュールを共有化する構成の他の一例を示す図である。

　本発明の実施の形態を説明するにあたり、先ず、本発明の概要について説明する。

　上記の課題を解決するために、本発明に係る画像符号化方法は、画像データを圧縮符号化する画像符号化方法であって、前記画像データを既に符号化したフレームから予測する画像予測ステップと、前記画像予測の相対位置情報を予測する動きベクトル予測ステップと、前記画像予測に用いた相対位置情報と、前記予測された予測動きベクトルとの差分を算出し、差分動きベクトルを取得する差分ステップと、複数のコンテキストから、前記差分動きベクトルを符号化するための符号化確率情報コンテキストを決定するコンテキスト区分決定ステップと、前記差分動きベクトル画像データの符号化対象信号を２値化することで、２値信号を生成する２値化ステップと、前記コンテキスト区分決定ステップで決定した前記コンテキストに対応付けられた前記符号化確率情報を用いて、前記２値信号を算術符号化する算術符号化ステップと、前記２値化ステップで生成された前記２値信号に基づいて、前記符号化確率情報を更新する更新ステップとを含む。

　さらに好ましくは、本発明に係る画像符号化方法の一態様は、さらに、前記予測動きベクトルの候補を導出する予測動きベクトル候補導出ステップを含み、前記コンテキスト区分決定ステップでは、前記予測動きベクトルの候補の数によって、前記符号化確率情報を決定するコンテキストを決定してもよい。

　さらに好ましくは、本発明に係る画像符号化方法の一態様は、前記コンテキスト区分決定ステップでは、前記予測動きベクトルの候補の数が小さい場合に、前記差分動きベクトルが大きくなることを示すコンテキストを選択し、前記予測動きベクトルの候補の数が大きい場合に、前記差分動きベクトルが小さくなることを示すコンテキストを選択してもよい。

　さらに好ましくは、本発明に係る画像符号化方法の一態様は、さらに既に符号化済みの周囲の差分動きベクトルを取得する周囲差分動きベクトル取得ステップを含み、前記コンテキスト区分決定ステップでは、前記周囲の差分動きベクトルの大きさによって、前記符号化確率情報を決定するコンテキストを決定してもよい。

　さらに好ましくは、本発明に係る画像符号化方法の一態様は、前記コンテキスト区分決定ステップでは、前記周囲の差分動きベクトルの大きさが大きい場合に、前記差分動きベクトルが大きくなることを示すコンテキストを選択し、前記周囲の差分動きベクトルの大きさが小さい場合に、前記差分動きベクトルが小さくなることを示すコンテキストを選択してもよい。

　さらに好ましくは、本発明に係る画像符号化方法の一態様は、前記コンテキスト区分決定ステップでは、前記周囲の差分動きベクトルが無い場合に、前記差分動きベクトルが大きくなることを示すコンテキストを選択してもよい。

　以下、本発明の実施の形態について、図面を参照しながら説明する。尚、以下で説明する実施の形態は、いずれも本発明の好ましい一具体例を示す。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序等は、一例であり、本発明を限定する主旨ではない。本発明は、請求の範囲だけによって限定される。よって、以下の実施の形態における構成要素のうち、本発明の最上位概念を示す独立請求項に記載されていない構成要素については、本発明の課題を達成するのに必ずしも必要ではないが、より好ましい形態を構成するものとして説明する。

　（実施の形態１）
　本実施の形態１の算術符号化方法の概要について説明する。本実施の形態の算術符号化方法は、符号化対象となる信号の種別に対し、周波数成分に基づいて適切に区分されたシンボル発生確率を用いる。これにより、各周波数成分に共通した統計情報に基づくシンボル発生確率を使用することができ、符号化効率の向上を可能とする。さらに、シンボル発生確率の区分数を減らすことができ、実装時のメモリサイズを削減することが可能となる。

　以上が、本実施の形態の算術符号化方法の概要についての説明である。

　（実施の形態１における算術符号化部の構成）
　次に、本実施の形態の算術符号化方法を行う算術符号化部の構成について説明する。図１は、本発明の実施の形態１に係る算術符号化部１００の構成の一例を示すブロック図である。なお、後述するように、本発明の実施の形態１に係る算術符号化部１００は、画像データを圧縮符号化する画像符号化装置の一部に相当する。

　図１に示すように、算術符号化部１００は、２値化部１０１と、シンボル発生確率格納部１０２と、コンテキスト制御部１０３と、２値算術符号化器１０４と、コンテキスト区分制御部１０５とを備える。算術符号化部１００は、符号化対象の信号である入力信号ＳＩを算術符号化することで、出力信号ＯＢを生成して出力する。また、算術符号化部１００には、入力信号ＳＩの種別を示す信号種別情報ＳＥと、入力信号ＳＩが量子化係数に関連する信号である場合、信号種別情報ＳＥは係数位置情報を示す。

　なお、入力信号ＳＩは、画像データの符号化対象信号であり、例えば、画像データを予測する際に他のフレーム内の画像との相対位置を示す信号である。なお、入力信号ＳＩは、相対位置の情報そのものではなく、相対位置の情報とその予測情報との差分の情報であってもよい。

　また、信号種別情報ＳＥは、符号化対象信号である入力信号ＳＩの種別を示す種別情報である。入力信号ＳＩの種別は、例えば、符号化対象信号の性質を示す情報である。信号種別情報ＳＥは、例えば、差分の動き情報であることを示す情報でもよい。

　ただし、以降の説明では、対象の入力信号ＳＩを、相対位置の情報を示す動きベクトルと、動きベクトルを予測した予測情報である予測動きベクトルとの差分の情報である差分動き情報を示す信号であるとして、説明する。本実施の形態では、動き差分情報を算術符号化（動き予測符号化）する場合について特に詳しく説明する。

　２値化部１０１は、符号化対象信号（入力信号ＳＩ）を２値化することで、２値信号を生成する。具体的には、２値化部１０１は、入力信号ＳＩと信号種別情報ＳＥとに基づいて、入力信号ＳＩの２値化（Ｂｉｎａｒｉｚａｔｉｏｎ）を行うことで、２値信号ＢＩＮを生成する。

　シンボル発生確率格納部１０２は、複数のシンボル発生確率を保持するメモリなどである。例えば、シンボル発生確率格納部１０２は、シンボル発生確率テーブルを保持する。シンボル発生確率テーブルは、コンテキストと確率情報とを対応付けたテーブルである。シンボル発生確率テーブルの詳細については、後で説明する。

　また、シンボル発生確率格納部１０２は、コンテキストテーブルを保持する。コンテキストテーブルは、符号化対象信号の種別とコンテキストとを対応付けたテーブルである。コンテキストテーブルの詳細については、後で説明する。

　コンテキスト制御部１０３は、符号化対象信号の種別から関連付けられるコンテキストを決定する。具体的には、コンテキスト制御部１０３は、信号種別情報ＳＥと、コンテキスト区分制御部１０５より取得する制御信号ＣＴＲＳを取得し、取得した信号種別情報ＳＥおよび制御信号ＣＴＲＳに基づいて、コンテキストテーブルを参照することで、符号化対象信号の種別に関連付けられているコンテキストを決定する。このとき、コンテキスト制御部１０３は、制御信号ＣＴＲＳにより指定された区分に基づいたコンテキストを決定し、係数位置が異なっても同じ区分とする場合には、区分に共通のコンテキストを決定する。なお、コンテキスト制御部１０３が、コンテキストテーブルを保持していてもよい。ここでコンテキスト区分制御部１０５の動作については、後で説明する。

　さらに、コンテキスト制御部１０３は、決定したコンテキストに対応する確率情報を決定する。つまり、コンテキスト制御部１０３は、シンボル発生確率テーブルを参照することで、シンボル発生確率格納部１０２に格納されているどのシンボル発生確率を使用するかを決定し、符号化確率情報を決定する。符号化確率情報は、２値信号の算術符号化に用いる確率情報である。なお、確率情報は、例えば、シンボル発生確率の値を示すインデックス、又は、シンボル発生確率の値である。

　具体的には、シンボル発生確率格納部１０２から、コンテキスト制御部１０３によって決定されたコンテキストに対応するシンボル発生確率が、２値算術符号化器１０４に出力される。

　２値算術符号化器１０４は、符号化確率情報を用いて２値信号を算術符号化する。具体的には、２値算術符号化器１０４は、シンボル発生確率格納部１０２が出力するシンボル発生確率を用いて、２値化部１０１が生成した２値信号の算術符号化を行う。

　以上が、本実施の形態の算術符号化部１００の構成についての説明である。

　ここで、シンボル発生確率格納部１０２が保持するシンボル発生確率テーブルについて説明する。図２は、本発明の実施の形態１に係るシンボル発生確率テーブルの一例を示す図である。

　シンボル発生確率テーブルは、コンテキストとシンボル発生確率とを対応付けたテーブルである。図２におけるインデックス（ｃｔｘＩｄｘ）は、コンテキストを表すインデックスであり、具体的には、符号化中のマクロブロックの周辺の情報、又は、ブロック内の既に符号化済みの情報、又は、符号化するビット位置に応じて決まるインデックスである。

　各インデックス（ｃｔｘＩｄｘ）は、シンボル発生確率を示す確率情報（ｐＳｔａｔｅＩｄｘ）と、発生確率の高いシンボル（Ｍｏｓｔ　Ｐｒｏｂａｂｌｅ　Ｓｙｍｂｏｌ）を示すシンボル（ｖａｌＭＰＳ）に対応付けられている。これらは、Ｈ．２６４規格に示されるものと同等である。すなわち、確率情報ｐＳｔａｔｅＩｄｘは、シンボル発生確率の値を示すインデックスである。シンボル発生確率格納部１０２は、図示しないが、さらに、確率情報ｐＳｔａｔｅＩｄｘに対応するシンボル発生確率の値を示すテーブルを保持している。

　なお、ここでは、シンボル発生確率を示すインデックス（ｐＳｔａｔｅＩｄｘ）とコンテキスト（ｃｔｘＩｄｘ）とを対応付けたテーブルとして管理しているが、コンテキストとシンボル発生確率の値とを直接対応付けて管理してもよい。この場合、シンボル発生確率の値を、例えば、１６ビット精度（０－６５５３５）で表すことにより、上記テーブルで管理するよりも、詳細な値を扱うことができる。このため、符号化効率を向上させることができる。以降、シンボル発生確率を値として管理する方法で説明する。

　次に、シンボル発生確率格納部１０２が保持するコンテキストテーブルについて説明する。図３Ａ及び図３Ｂは、本発明の実施の形態１に係るコンテキストテーブルの一例を示す図である。

　コンテキストテーブルは、複数の種別情報ＳＥとコンテキスト（ｃｔｘＩｄｘ）とを対応付けたテーブルである。入力信号ＳＩが量子化係数に関連する信号であり、信号種別情報ＳＥが係数位置を示す情報である場合、コンテキスト区分制御部１０５は、図３Ａに示すように、符号化対象信号の信号種別情報ＳＥに対して対応付けられているコンテキストテーブルを選択する。一方、コンテキスト区分制御部１０５の制御により、図３Ｂに示すように、全ての信号種別情報ＳＥに対して、同じコンテキストが対応付けられることもある。

　次に、予測動きベクトル候補リスト（以下、適宜「候補リスト」と略称する）の導出方法について、図４の処理フローを用いて詳細に説明する。Ｓ１では、符号化対象ブロックの左側に隣接する隣接ブロックＡ、上側に隣接する隣接ブロックＢ、右斜め上に隣接する隣接ブロックＣを求める。例えば、符号化対象ブロックの最も左上位置にある画素の左隣の画素が所属するブロックを隣接ブロックＡ、最も左上位置にある画素の上隣の画素が所属するブロックを隣接ブロックＢ、最も右上位置にある画素の右上隣の画素が所属するブロックを隣接ブロックＣ、などとする。次に、隣接ブロックＡ、Ｂ、Ｃについて、Ｓ２及びＳ３を実行して、予測動きベクトル候補リストを作成する（Ｓ１ａ～Ｓ１ｂをＮ＝Ａ、Ｂ、Ｃとしてループさせる）。Ｓ２では、隣接ブロックＡ、Ｂ、Ｃのそれぞれが、符号化対象ブロックと同一の予測方向の動きベクトルを持ち、かつ、隣接ブロックＡ、Ｂ、Ｃのそれぞれの参照ピクチャが、符号化対象ブロックの参照ピクチャと同一かどうかを判定する。Ｓ２において、真ならば、Ｓ３において、対応する隣接ブロックの動きベクトルを予測動きベクトル候補リストに追加する。

　Ｓ４では、隣接ブロックＡ、Ｂ、Ｃの動きベクトルのＭｅｄｉａｎ値を算出し、予測動きベクトル候補リストに追加する。なお、本実施例では、Ｓ２において、符号化対象ブロックの動きベクトルと同一の予測方向を持つ隣接ブロックの動きベクトルを、予測動きベクトル候補リストに追加し、異なる予測方向を持つ隣接ブロックの動きベクトルは追加しないようにしたが、異なる予測方向を持つ隣接ブロックの動きベクトルの大きさは０として予測動きベクトル候補リストに追加するようにしても構わない。

　次に、図１５のように、符号化対象ブロックが予測方向１の動きベクトルＭｖＬ０および、予測方向２の動きベクトルＭｖＬ１を持つ場合に、生成される予測動きベクトル候補リストの例について、図５Ａ、図５Ｂを用いて説明する。

　本実施形態では、図１５において、符号化対象ブロックの予測方向１の参照ピクチャと、隣接ブロックＡ、Ｂ、Ｃの予測方向１の参照ピクチャとが同一であり、符号化対象ブロックの予測方向２の参照ピクチャと、隣接ブロックＡの予測方向２の参照ピクチャと、隣接ブロックＣの予測方向１の参照ピクチャとが同一ピクチャであるとして説明を行う。

　また、図５Ａの予測方向１の予測動きベクトル候補リストにおいて、予測動きベクトルインデックスの値は、Ｍｅｄｉａｎ（ＭｖＬ０＿Ａ，ＭｖＬ０＿Ｂ，ＭｖＬ０＿Ｃ）に対応する値を０とし、ＭｖＬ０＿Ａに対応する値を１とし、ＭｖＬ０＿Ｂに対応する値を２とし、ＭｖＬ０＿Ｃに対応する値を３としている。また、図５Ｂの予測方向２の予測動きベクトル候補リストにおいて、Ｍｅｄｉａｎ（ＭｖＬ１＿Ａ，ＭｖＬ０＿Ｂ，ＭｖＬ１＿Ｃ）に対応する値を０とし、ＭｖＬ１＿Ａに対応する値を１とし、ＭｖＬ１＿Ｃに対応する値を２としている。ここで、本実施形態では、予測方向２の予測動きベクトル候補リストにおいて、予測動きベクトル候補となる隣接ブロックの予測方向２の動きベクトルＭｖＬ１＿Ｂが存在しない場合には、リストに追加しない。予測方向２の予測動きベクトル候補リストにおいて、予測動きベクトル候補となる隣接ブロックの動きベクトルが存在しない場合には、予測動きベクトルインデックスの割り当てを行わないことにより、符号化効率を向上させることができる。また、予測動きベクトルインデックスの割り当て方は、この例に限らず、予測動きベクトル候補となる動きベクトルが存在しない場合に、動きベクトルの大きさを０として、予測動きベクトルインデックスの割り当てを行ってもよい。

　図５Ｃは、予測動きベクトルインデックスを可変長符号化する際に用いる、符号表の例を示している。図５Ｃに示す符号表では、予測動きベクトルインデックスの値の小さい順に、符号長の短い符号を割り当てている。尚、予測精度が良い可能性の高い予測動きベクトル候補に対応する予測動きベクトルインデックスの値を小さくすることにより、符号化効率を向上させることができる。

　上記で説明したように、予測動きベクトルの候補数を得ることができる。

　次に、図１に示した算術符号化部１００が行う算術符号化方法を、図６に示すフローチャートに従って説明する。図６は、本発明の実施の形態１に係る算術符号化方法の一例を示すフローチャートである。また、図６に示すフローチャートは、あるブロックの差分動き情報を示す信号を符号化対象信号として符号化する場合の算術符号化の処理手順を示している。

　まず、２値化部１０１は、ブロックの差分動き情報を２値化する（ステップＳ２０１、２値化ステップ)。ここで、２値化の方法としては、例えば、ある一定の値（例えば８）までは、１増える毎に１ずつ符号長が変わる符号を使い、一定値以上になった段階で、数の大きさが変わる毎に２値化符号長が指数的に大きくなる、指数ゴロム（Ｅｘｐｏｎｅｎｔｉａｌ－Ｇｏｌｏｍｂ）がある。指数ゴロムの場合、生成される２値化符号（２値信号）は、例えば、差分動き情報が０のときは、“０”となり、０より大きく一定値以下のときは、その数だけ１を連続し、最後に０を付加した符号となり、一定値より大きいときは、一定値までは前述の方法で１を連続し、それ以降は指数ゴロムを用いて２値化した符号をつなげた符号となる。

　次に、コンテキスト区分制御部１０５は、予測動きベクトル候補リストに含まれる予測動きベクトル候補の数を候補リスト数として取得する（ステップＳ２０２）。ここで、予測動きベクトル候補リストとは、上記で説明した方法で求められるリストである。次に、取得した候補リスト数と閾値とで比較をする（ステップＳ２０３）。閾値を、例えば、１に設定すると、候補リスト数が１本のみの場合と、２本以上ある場合とで処理を切り替えることができる。ここで、候補リスト数が閾値よりも多い場合（ステップＳ２０３でＹＥＳ）、コンテキスト区分制御部１０５は、候補リスト数が閾値よりも多いことを示す制御信号ＣＴＲＳをコンテキスト制御部１０３に対して出力し、候補リスト数が多い場合に対応したコンテキストモデル（コンテキストテーブル）を選択する（ステップＳ２０５）。一方、候補リスト数が閾値よりも少ない場合（ステップＳ２０３でＮＯ）、コンテキスト区分制御部１０５は、候補リスト数が閾値よりも少ないことを示す制御信号ＣＴＲＳをコンテキスト制御部１０３に対して出力し、候補リスト数が少ない場合に対応したコンテキストモデルを選択する（ステップＳ２０４）。尚、ステップＳ２０２～Ｓ２０５がコンテキスト区分決定ステップに相当する。

　ここで、リスト数の多少に対応したコンテキストモデルとは次のような性質を有する。候補リスト数が多い場合には、一般的に、予測動きベクトルを求める際の選択の幅が大きいため、符号化する動き情報に合わせて予測動きベクトルを選択可能になる。即ち、差分動き情報（差分動きベクトル）は小さくなりやすい傾向がある。具体的には、前述の２値化符号が短くなることが予測される。このため、このような２値符号が多く発生する場合に対応したコンテキストモデルを選択する。

　一方、候補リスト数が少ない場合には、一般的に、予測動きベクトルを求める際の選択の幅が小さいため、差分動き情報（差分動きベクトル）は大きくなりやすい傾向がある。具体的には、前述の２値化符号が長くなることが予測されるため、このような２値符号が多く発生する場合に対応したコンテキストモデルを選択する。

　次に、２値算術符号化器１０４は、２値算術符号化に用いるシンボル発生確率を、シンボル発生確率格納部１０２から取得する。さらに、取得したシンボル発生確率を用いて２値算術符号化を実行する（ステップＳ２０６）。また、実際に２値算術符号化で用いた２値信号に合わせてシンボル発生確率を更新する（ステップＳ２０７）。

　なお、ここで切り替えるコンテキスト（シンボル発生確率）は、差分動き情報の２値化算術符号全てに対して切り替えても良いし、差分動き情報が“０”か０でない“１”を示す２値信号だけに対して切り替えても良い。前者の場合、全ての２値化信号の符号化に対して別々の確率を用いることができるため、さらなる符号化効率の改善が期待できる。一方、後者の場合、差分動き情報が“０”か０ではない“１”という情報という、必ず必要な部分においては、別々のコンテキストテーブルを用いるため、前者と同様に符号化効率の改善が期待できる上に、その他の信号に対しては同じコンテキストテーブルを用いることで、シンボル発生確率の格納に必要なメモリサイズを小さくすることができ、回路規模の増大を抑制することが可能となる。

　なお、ここでの説明では候補リスト数が多い、少ないと２つに分けたがこれに限らない。例えば、候補リストの数毎に、別々のコンテキストモデル（コンテキストテーブル）を用意して切り替えても良い。この場合、区分はさらに細かくなるが、シンボルの発生確率をより細かく分割することができるため、さらなる符号化効率の向上が期待できる。

　（実施の形態１における算術符号化部の変形例）
　また、上記とは別に、周辺ブロックのＭＶＤの大きさによってコンテキストモデルを切替えても良い。図７は、この場合の本発明の実施の形態１に係る算術符号化部１００が行う算術符号化方法の動作を説明するフローチャートである。また、図７に示すフローチャートは、符号化対象信号である差分動き情報を符号化する場合の算術符号化を示している。

　まず、２値化部１０１は、ブロックの差分動き情報を２値化する（ステップＳ３０１)。ここで、２値化の方法とは、上記、図６の説明で示した例と同じである。

　次に、コンテキスト区分制御部１０５は、対象ブロックの左に隣接するブロックである左隣接ブロックに差分動き情報があるかどうかを判断する（ステップＳ３０２）。左隣接ブロックに対応する差分動き情報がない場合（例えば、左隣接ブロックが画面内予測符号化であるか、画面端のため当該ブロックが存在しない場合）（ステップＳ３０２でＮＯ）、パラメータＰａｒａｍに固定値ＶＡＬを加える（ステップＳ３０３）。ここで、ＶＡＬには、後述するコンテキストの切替えの閾値に関係する一定値（例えば３４や１７といった値）をあらかじめ用意する。一方、左隣接ブロックに差分動き情報がある場合（ステップＳ３０２でＹＥＳ）、パラメータＰａｒａｍに左隣接ブロックの差分動き情報（差分動きベクトル）の大きさ、より具体的には、符号化対象である差分動き情報と同じパリティ（Ｘ座標もしくはＹ座標）の値の絶対値ＭＶＤＬをセットする（ステップＳ３０４）。

　次に、同様に、上側に隣接するブロックである上隣接ブロックに差分動き情報があるかどうかを判断する（ステップＳ３０５）。

　左隣接ブロックの場合と同様に、上隣接ブロックに対応する差分動き情報が無い場合（ステップＳ３０５でＮＯ）、パラメータＰａｒａｍにさらに固定値ＶＡＬを加える（ステップＳ３０６）。一方、上隣接ブロックに差分動き情報がある場合（ステップＳ３０５でＹＥＳ）、パラメータＰａｒａｍに上隣接ブロックの差分動き情報の大きさ、より具体的には、符号化対象である差分動き情報と同じパリティ（Ｘ座標もしくはＹ座標）の値の絶対値ＭＶＤＴを加える（ステップＳ３０７）。次に、これまで算出したＰａｒａｍの値に応じて、コンテキストモデルを選択する。

　当該実施の形態１の変形例では、具体的には、Ｐａｒａｍの値のグループを、小、中、大（例えば２以下を小、３以上３２以下を中、３３以上を大）の大きさで分け、それぞれのグループに対して、異なるコンテキストモデル（コンテキストテーブル）を予め設定しておく（ステップＳ３０８）。

　ここで、Ｐａｒａｍの値の大きさに対応したコンテキストモデルとは、次のような性質を有する。Ｐａｒａｍが小さい場合には、周囲の予測ベクトルの精度が高く、差分が小さくなっていることが予測されるため、差分動き情報（差分動きベクトル）は小さくなりやすい傾向がある。具体的には、前述の２値化符号が短くなることが予測される。このため、このような２値符号が多く発生する場合に対応したコンテキストモデルを選択する。

　一方、Ｐａｒａｍの値が大きい場合には、周囲に参考となるベクトル情報がない、もしくは、差分動き情報が大きいため、予測がうまくあたっていないことが予測され、差分動き情報（差分動きベクトル）は大きくなりやすい傾向がある。具体的には、前述の２値化符号が長くなることが予測されるため、このような２値符号が多く発生する場合に対応したコンテキストモデルを選択する。

　さらに、Ｐａｒａｍの値が中間の場合には、上記のコンテキストモデルの中間に位置するコンテキストモデルを選択する。

　次に、２値算術符号化器１０４は、２値算術符号化に用いるシンボル発生確率を、シンボル発生確率格納部１０２から取得する。さらに、取得したシンボル発生確率を用いて２値算術符号化を実行する（ステップＳ３０９）。また、実際に２値算術符号化で用いた２値信号に合わせてシンボル発生確率を更新する（ステップＳ３１０）。

　なお、ここでの説明ではＰａｒａｍの値を３つの区分に分けたがこれに限らない。例えば、さらに細かく、４以上の区分を設定し、別々のコンテキストモデルを用意して切り替えても良い。この場合、区分はさらに細かくなるが、シンボルの発生確率をより細かく分割することができるため、さらなる符号化効率の向上が期待できる。また、２つの区分としてもよい。この場合、メモリサイズの削減が期待できる。

　さらに、Ｐａｒａｍの値と、候補リスト数の両方に応じて、別々のコンテキストモデルを用意して切り替えても良い。この場合、区分はさらに細かくなるが、シンボルの発生確率をより細かく分割することができるため、さらなる符号化効率の向上が期待できる。

　なお、候補リスト数でコンテキストモデルを切替える場合及びＰａｒａｍの値でコンテキストモデルを切替える場合の何れにおいても、コンテキストモデルの情報（閾値、固定値ＶＡＬ、区分数）を、ビットストリームの先頭（ストリームヘッダ）に記録してもよい。このようにすることで、画像の特徴によって、コンテキストモデルを切替えることができ、さらなる符号化効率を向上することが期待できる。

　なお、前記ヘッダに記録する単位は、スライス、ピクチャに対応する単位としてもよい。この場合、ストリーム単位に記録する場合と比べて、より細かく制御することができるため、さらなる符号化効率の向上が期待できる。

　（実施の形態１における画像符号化装置の構成）
　上述した本発明の実施の形態１に係る算術符号化部１００は、画像データを圧縮符号化する画像符号化装置に備えられる。

　画像符号化装置２００は、画像データを圧縮符号化する。例えば、画像符号化装置２００には、画像データがブロック毎に入力信号として入力される。画像符号化装置２００は、入力された入力信号に対し、変換、量子化及び可変長符号化を行うことで、符号化信号を生成する。

　ここで、図８は、本発明の実施の形態１に係る画像符号化装置２００の構成の一例を示すブロック図である。図８に示すように、画像符号化装置２００は、減算器２０５と、変換・量子化部２１０と、エントロピー符号化部２２０（図１の算術符号化部１００に相当）と、逆量子化・逆変換部２３０と、加算器２３５と、デブロッキングフィルタ２４０と、メモリ２５０と、イントラ予測部２６０と、動き検出部２７０と、動き補償部２８０と、イントラ／インター切換スイッチ２９０とを備える。

　減算器２０５は、入力信号と予測信号との差分、すなわち、予測誤差を算出する。

　変換・量子化部２１０は、空間領域の予測誤差を変換することで、周波数領域の変換係数を生成する。例えば、変換・量子化部２１０は、予測誤差にＤＣＴ（Ｄｉｓｃｒｅｔｅ　Ｃｏｓｉｎｅ　Ｔｒａｎｓｆｏｒｍ）変換を行うことで、変換係数を生成する。さらに、変換・量子化部２１０は、変換係数を量子化することで、量子化係数を生成する。

　エントロピー符号化部２２０は、量子化係数を可変長符号化することで、符号化信号を生成する。また、エントロピー符号化部２２０は、動き検出部２７０によって検出された動きデータ（例えば、動きベクトル）を符号化し、符号化信号に含めて出力する。

　逆量子化・逆変換部２３０は、量子化係数を逆量子化することで、変換係数を復元する。さらに、逆量子化・逆変換部２３０は、復元した変換係数を逆変換することで、予測誤差を復元する。なお、復元された予測誤差は、量子化により情報が失われているので、減算器２０５が生成する予測誤差とは一致しない。すなわち、復元された予測誤差は、量子化誤差を含んでいる。

　加算器２３５は、復元された予測誤差と予測信号とを加算することで、ローカル復号画像を生成する。

　デブロッキングフィルタ２４０は、生成されたローカル復号画像にデブロッキングフィルタ処理を行う。

　メモリ２５０は、動き補償に用いられる参照画像を格納するためのメモリである。具体的には、メモリ２５０は、デブロッキングフィルタ処理が施されたローカル復号画像を格納する。

　イントラ予測部２６０は、イントラ予測を行うことで、予測信号（イントラ予測信号）を生成する。具体的には、イントラ予測部２６０は、加算器２３５によって生成されたローカル復号画像における、符号化対象ブロック（入力信号）の周囲の画像を参照してイントラ予測を行うことで、イントラ予測信号を生成する。

　動き検出部２７０は、入力信号と、メモリ２５０に格納された参照画像との間の動きデータ（例えば、動きベクトル）を検出する。

　動き補償部２８０は、検出された動きデータに基づいて動き補償を行うことで、予測信号（インター予測信号）を生成する。

　イントラ／インター切換スイッチ２９０は、イントラ予測信号及びインター予測信号のいずれかを選択し、選択した信号を予測信号として減算器２０５及び加算器２３５に出力する。

　以上の構成により、本発明の実施の形態１に係る画像符号化装置２００は、画像データを圧縮符号化する。

　なお、図８において、本発明の実施の形態１に係る算術符号化部１００は、エントロピー符号化部２２０が備える。すなわち、算術符号化部１００は、入力信号ＳＩとして量子化係数を受け付け、２値化及び算術符号化する。また、信号種別情報ＳＥは、量子化係数の係数位置、図８に示す動きデータ、又は、イントラ予測部２６０が用いたイントラ予測方向などを示す情報である。

　以上のように、本発明の実施の形態１に係る画像符号化装置及び画像符号化方法によれば、符号化対象信号の種別に関連付けられているコンテキストを、差分動き情報の関連情報に応じて、適切なコンテキストモデルを決定し、当該コンテキストモデルを用いて算術符号化に用いる符号化確率情報を求める。

　これにより、全体の統計情報を反映した符号化確率情報を用いることができるので、符号化効率を高めることができる。

　（実施の形態２）
　本実施の形態の算術復号方法の概要について説明する。本実施の形態の算術復号方法は、復号対象となる信号の種別に対し、周波数成分に基づいて適切に区分されたシンボル発生確率を用いる。これにより、各周波数成分に共通した統計情報に基づくシンボル発生確率を使用することができ、符号化効率の向上することができ、符号化効率を向上させた信号を復号することを可能とする。

　以上が、本実施の形態の算術復号方法の概要についての説明である。

　次に、本実施の形態の算術復号方法を行う算術復号部の構成について説明する。図９は本発明の実施の形態２に係る算術復号部３００の構成の一例を示すブロック図である。なお、後述するように、本発明の実施の形態２に係る算術復号部３００は、圧縮符号化された符号化画像データを復号する画像復号装置の一部に相当する。

　図９に示すように、算術復号部３００は、２値算術復号器３０１と、シンボル発生確率格納部３０２と、コンテキスト制御部３０３と、多値化部３０４と、コンテキスト区分制御部３０５を備える。

　算術復号部３００は、復号対象の信号である入力ストリームＩＳを算術復号することで、画像データを復元して出力する。また、算術復号部３００には、入力ストリームＩＳの種別を示す信号種別情報ＳＥが入力される。

　入力ストリームＩＳは、符号化画像データの復号対象信号であり、例えば、画像データが圧縮符号化されて生成された量子化係数を示す信号である。つまり、実施の形態１に係る入力信号ＳＩが算術符号化されて生成された信号に相当する。

　信号種別情報ＳＥは、符号化画像データの復号対象信号の種別情報の一例である。具体的には、信号種別情報ＳＥは、入力ストリームＩＳの種別を示す情報であり、より具体的には、実施の形態１に係る信号種別情報ＳＥと同様である。すなわち、入力ストリームＩＳが変換係数に関連する信号（例えば量子化係数）である場合、信号種別情報ＳＥは、係数位置を含む情報である。

　２値算術復号器３０１は、復号確率情報を用いて復号対象信号を算術復号することで、２値信号を生成する。具体的には、２値算術復号器３０１は、シンボル発生確率格納部３０２が出力するシンボル発生確率を用いて、入力ストリームＩＳに算術復号を行うことで、出力２値信号ＯＢＩＮを生成する。

　シンボル発生確率格納部３０２は、シンボルの複数の発生確率を保持するメモリなどである。例えば、シンボル発生確率格納部３０２は、シンボル発生確率テーブルを保持する。シンボル発生確率テーブルは、コンテキストと確率情報とを対応付けたテーブルであり、例えば、図２に示すテーブルである。シンボル発生確率テーブルの詳細は、実施の形態１と同様である。

　また、シンボル発生確率格納部３０２は、コンテキストテーブルを保持する。コンテキストテーブルは、復号対象信号の種別とコンテキストとを対応付けたテーブルであり、例えば、図３Ａおよび図３Ｂに示すテーブルである。コンテキストテーブルの詳細は、実施の形態１と同様である。

　コンテキスト制御部３０３は、復号対象信号の種別から関連付けられるコンテキストを決定する。具体的には、コンテキスト制御部３０３は、信号種別情報ＳＥと、コンテキスト区分制御部３０５より取得する制御信号ＣＴＲＳを取得し、取得した入力ストリームＩＳの種別を表す信号種別情報ＳＥおよび制御信号ＣＴＲＳに基づいて、コンテキストテーブルを参照することで、復号対象信号の種別に関連付けられているコンテキストを決定する。このとき、コンテキスト制御部３０３は、制御信号ＣＴＲＳにより指定された区分に基づいたコンテキストテーブルのコンテキストを決定し、係数位置が異なっても同じ区分とする場合には、区分に共通のコンテキストテーブルのコンテキストを決定する。なお、コンテキスト制御部３０３が、コンテキストテーブルを保持していてもよい。ここでコンテキスト区分制御部３０５の動作については、後で説明する。

　さらに、コンテキスト制御部３０３は、決定したコンテキストに対応する復号確率情報を決定する。コンテキスト制御部３０３は、決定した復号確率情報を用い、シンボル発生確率テーブルを参照することで、シンボル発生確率格納部３０２に格納されているどのシンボル発生確率を使用するかを決定する。なお、復号確率情報は、例えば、シンボル発生確率の値を示すインデックス、又は、シンボル発生確率の値である。コンテキスト制御部３０３によって決定されたコンテキストに対応するシンボル発生確率は、シンボル発生確率格納部３０２から、２値算術復号器３０１に出力される。コンテキスト制御部３０３の具体的な動作は、実施の形態１に係るコンテキスト制御部１０３と同様である。

　多値化部３０４は、２値算術復号器３０１によって生成された出力２値信号ＯＢＩＮを多値化することで、画像データを復元する。なお、多値化の方式は、信号種別情報ＳＥに基づいて決定される。

　以上が、本実施の形態の算術復号部３００の構成についての説明である。

　次に、図９に示した算術復号部３００が行う算術復号方法を、図１０および図１１に示すフローチャートに従って説明する。

　ここで、図１０は、本発明の実施の形態２に係る算術復号方法の一例を示すフローチャートである。また、図１０は、符号化対象信号があるブロックの差分動き情報を復号する場合の算術復号の処理手順を示している。

　図１０に示すように、本実施の形態の算術復号方法では、まず、復号対象となる入力ストリームＩＳを取得し、コンテキスト区分制御部３０５は、予測動きベクトル候補リストの数である候補リスト数を取得する（Ｓ４０１）。ここで、予測動きベクトル候補リストとは、上記実施の形態１で説明した予測動きベクトル候補と同じである。また、候補リスト数は、実施の形態１の候補リスト数と同じであり、実施の形態１と同じ方法で算出する。次に、取得した候補リスト数と閾値とで比較をする（ステップＳ４０２）。閾値とは、例えば、１に設定すると、候補リスト数が１本のみの場合と、２本以上ある場合とで処理を切り替えることができる。この閾値についても、符号化時に使用されたものと同じ値を用いる。ここで、候補リスト数が閾値よりも多い場合（ステップＳ４０２でＹＥＳ）、コンテキスト区分制御部３０５は、候補リスト数が閾値よりも多いことを示す制御信号ＣＴＲＳをコンテキスト制御部３０３に対して出力し、候補リスト数が多い場合に対応したコンテキストモデル（コンテキストテーブル）を選択する（ステップＳ４０４）。一方、候補リスト数が閾値よりも少ない場合（ステップＳ４０２でＮＯ）、コンテキスト区分制御部３０５は、候補リスト数が閾値よりも少ないことを示す制御信号ＣＴＲＳをコンテキスト制御部１０３に対して出力し、候補リスト数が少ない場合に対応したコンテキストモデルを設定する（ステップＳ４０３）。

　ここで、リスト数の多少に対応したコンテキストモデルとは、実施の形態１で説明した符号化方法におけるコンテキストモデルと同じ性質を有するものとする。

　次に、２値算術復号器３０１は、選択したコンテキストモデル（コンテキストテーブル）を用いて、２値算術符号化に用いるシンボル発生確率を、シンボル発生確率格納部３０２から取得する。さらに取得したシンボル発生確率を用いて２値算術復号を実行する（ステップＳ４０５）。また、復号された２値信号に合わせてシンボル発生確率を更新する（ステップＳ４０６）。最後に、算術復号により得られた２値信号に対し、符号化側と対となる方法で、多値化を施し、出力信号となる差分動き情報を取得する（ステップＳ４０７）。

　なお、ここでの説明では候補リスト数が多い場合と少ない場合の２つに分けたが、これに限られるものではない。実施の形態１における算術符号化部で設定した区分と同じ区分を設定することが好ましい。

　（実施の形態２における算術復号部の変形例）
　また、図１１は、上記とは別に、周辺ブロックのＭＶＤの大きさによってコンテキストモデルを切替えて符号化されている符号化信号を復号する場合の動作を説明するフローチャートである。図１１に示すフローチャートは、復号対象信号が、差分動き情報を符号化した信号である場合の算術復号の処理手順を示している。

　図１１に示すように、本実施の形態２の算術復号方法では、まず、復号対象信号である入力ストリームＩＳを取得し、コンテキスト区分制御部１０５は、対象ブロックの左に隣接する左隣接ブロックに差分動き情報があるかどうかを判断する（ステップＳ５０１）。

　左隣接のブロックに対応する差分動き情報がない場合（例えば、左隣接ブロックが画面内予測符号化されたブロックであるか、画面端のため当該ブロックが存在しない場合）（ステップＳ５０１でＮＯ）、パラメータＰａｒａｍに固定値ＶＡＬを加える（ステップＳ５０２）。ここで、ＶＡＬには、後述するコンテキストの切替えの閾値に関係する一定値（例えば３４や１７といった値）を、あらかじめ決められた符号化側と同じ値に設定する。一方、左隣接ブロックに差分動き情報がある場合（ステップＳ５０１でＹＥＳ）、パラメータＰａｒａｍに左隣接ブロックの差分動き情報（差分動きベクトル）の大きさ、より具体的には、復号対象である差分動き情報と同じパリティ（Ｘ座標もしくはＹ座標）の値の絶対値ＭＶＤＬをセットする（ステップＳ５０３）。

　次に、同様に、上側に隣接する上隣接ブロックに差分動き情報があるかどうかを判断する（ステップＳ５０４）。

　左側のブロックの場合と同様に、上隣接ブロックに対応する差分動き情報が無い場合（ステップＳ５０４でＮＯ）、パラメータＰａｒａｍに、さらに固定値ＶＡＬを加える（ステップＳ５０５）。一方、上隣接ブロックに差分動き情報がある場合（ステップＳ５０４でＹＥＳ）、パラメータＰａｒａｍに、上隣接ブロックの差分動き情報の大きさ、より具体的には、復号対象である差分動き情報と同じパリティ（Ｘ座標もしくはＹ座標）の値の絶対値ＭＶＤＴを加える（ステップＳ５０６）。次に、これまで算出したＰａｒａｍの値に応じて、コンテキストモデルを設定する。

　具体的には、Ｐａｒａｍの値のグループを、小、中、大（例えば２以下を小、３以上３２以下を中、３３以上を大）の多きさで分け、それぞれのグループに対して、異なるコンテキストモデル（コンテキストテーブル）を予め設定しておく（ステップＳ５０７）。

　ここで、Ｐａｒａｍの値の大きさに対応したコンテキストモデルとは、実施の形態１で説明した符号化方法におけるコンテキストモデルと同じ性質を有するものとする。

　次に、２値算術復号器３０１は、選択したコンテキストモデル（コンテキストテーブル）を用いて、２値算術復号で用いるシンボル発生確率を、シンボル発生確率格納部３０２から取得する。さらに、取得したシンボル発生確率を用いて２値算術復号を実行する（ステップＳ５０８）。また、復号された２値信号に合わせてシンボル発生確率を更新する（ステップＳ５０９）。最後に、算術復号により得られた２値信号に対し、符号化側と対となる方法で、多値化を施し、出力信号となる差分動き情報を取得する（ステップＳ５１０）。

　上記の方法をとることにより、符号化効率を向上した符号化信号を復号することが可能になる。

　尚、実施の形態１と同様に、Ｐａｒａｍの値と、候補リスト数の両方に応じて、別々のコンテキストモデルを用意して切り替えても良い。

　（実施の形態２における画像復号装置の構成）
　上述した本発明の実施の形態２に係る算術復号部３００は、圧縮符号化された符号化画像データを復号する画像復号装置に備えられる。

　画像復号装置４００は、圧縮符号化された符号化画像データを復号する。例えば、画像復号装置４００は、符号化画像データがブロック毎に復号対象信号として入力される。画像復号装置４００は、入力された復号対象信号に対し、可変長復号、逆量子化及び逆変換を行うことで、画像データを復元する。

　ここで、図１１は、本発明の実施の形態２に係る画像復号装置４００の構成の一例を示すブロック図である。図１１に示すように、画像復号装置４００は、エントロピー復号部４１０（図９の算術復号部３００に相当）と、逆量子化・逆変換部４２０と、加算器４２５と、デブロッキングフィルタ４３０と、メモリ４４０と、イントラ予測部４５０と、動き補償部４６０と、イントラ／インター切換スイッチ４７０とを備える。

　エントロピー復号部４１０は、入力信号（入力ストリーム）を可変長復号することで、量子化係数を復元する。なお、ここで、入力信号（入力ストリーム）は、復号対象信号であり、符号化画像データのブロック毎のデータに相当する。また、エントロピー復号部４１０は、入力信号から動きデータを取得し、取得した動きデータを動き補償部４６０に出力する。

　逆量子化・逆変換部４２０は、エントロピー復号部４１０によって復元された量子化係数を逆量子化することで、変換係数を復元する。そして、逆量子化・逆変換部４２０は、復元した変換係数を逆変換することで、予測誤差を復元する。

　加算器４２５は、復元された予測誤差と予測信号とを加算することで、復号画像を生成する。

　デブロッキングフィルタ４３０は、生成された復号画像にデブロッキングフィルタ処理を行う。デブロッキングフィルタ処理された復号画像は、復号信号として出力される。

　メモリ４４０は、動き補償に用いられる参照画像を格納するためのメモリである。具体的には、メモリ４４０は、デブロッキングフィルタ処理が施された復号画像を格納する。

　イントラ予測部４５０は、イントラ予測を行うことで、予測信号（イントラ予測信号）を生成する。具体的には、イントラ予測部４５０は、加算器４２５によって生成された復号画像における、復号対象ブロック（入力信号）の周囲の画像を参照してイントラ予測を行うことで、イントラ予測信号を生成する。

　動き補償部４６０は、エントロピー復号部４１０から出力された動きデータに基づいて動き補償を行うことで、予測信号（インター予測信号）を生成する。

　イントラ／インター切換スイッチ４７０は、イントラ予測信号及びインター予測信号のいずれかを選択し、選択した信号を予測信号として加算器４２５に出力する。

　以上の構成により、本発明の実施の形態２に係る画像復号装置４００は、圧縮符号化された符号化画像データを復号する。

　なお、図１０、１１において、本発明の実施の形態２に係る算術復号部３００は、エントロピー復号部４１０が備える。すなわち、算術復号部３００は、入力ストリームＩＳとして、予測符号化が実行された符号化画像データを受け付け、算術復号及び多値化する。また、信号種別情報ＳＥは、量子化係数の位置、動きデータ、又は、イントラ予測部４５０が用いるイントラ予測方向などを示す情報である。

　なお、ここでのコンテキスト区分の情報（閾値、固定値ＶＡＬ、区分数）が、ビットストリームの先頭（ストリームヘッダ）に記録されている場合、その記録された情報を読み取って、コンテキストを切り替えてもよい。これにより、さらなる符号化効率を向上した符号化ストリームを復号することができる。

　なお、前記ヘッダに記録する単位は、スライス、ピクチャに対応する単位であっても、同様に復号できる。

　以上のように、本発明の実施の形態２に係る画像復号装置及び画像復号方法によれば、符号化対象信号の種別に関連付けられているコンテキストを候補動きベクトルの本数や周囲の差分動きベクトルの大きさに応じて、適切な区分のコンテキストを決定し、算術復号に用いる復号確率情報を算出する。

　これにより、符号化効率が向上された信号を正しく復号することができる。具体的には、実施の形態１に示したように、符号化対象信号の種別に関連付けられているコンテキストを予測動きベクトルの候補リスト数や周囲の差分動きベクトルの大きさに応じて、統計的にバランスが取れた形に区分できるため、適切な統計情報を反映した確率情報を確率情報として用いることができるので、符号化効率を高めることができる。

　このようにして符号化効率が向上された信号を、本発明の実施の形態２に係る画像復号装置及び画像復号方法は、正しく復号することができる。

　（実施の形態３）
　上記各実施の形態で示した動画像符号化方法（画像符号化方法）または動画像復号方法（画像復号方法）の構成を実現するためのプログラムを記憶メディアに記録することにより、上記各実施の形態で示した処理を独立したコンピュータシステムにおいて簡単に実施することが可能となる。記憶メディアは、磁気ディスク、光ディスク、光磁気ディスク、ＩＣカード、半導体メモリ等、プログラムを記録できるものであればよい。

　さらにここで、上記各実施の形態で示した動画像符号化方法（画像符号化方法）や動画像復号方法（画像復号方法）の応用例とそれを用いたシステムを説明する。当該システムは、画像符号化方法を用いた画像符号化装置、及び画像復号方法を用いた画像復号装置からなる画像符号化復号装置を有することを特徴とする。システムにおける他の構成について、場合に応じて適切に変更することができる。

　図１６は、コンテンツ配信サービスを実現するコンテンツ供給システムｅｘ１００の全体構成を示す図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ｅｘ１０６、ｅｘ１０７、ｅｘ１０８、ｅｘ１０９、ｅｘ１１０が設置されている。

　このコンテンツ供給システムｅｘ１００は、インターネットｅｘ１０１にインターネットサービスプロバイダｅｘ１０２および電話網ｅｘ１０４、および基地局ｅｘ１０６からｅｘ１１０を介して、コンピュータｅｘ１１１、ＰＤＡ（ＰｅｒｓｏｎａｌＤｉｇｉｔａｌＡｓｓｉｓｔａｎｔ）ｅｘ１１２、カメラｅｘ１１３、携帯電話ｅｘ１１４、ゲーム機ｅｘ１１５などの各機器が接続される。

　しかし、コンテンツ供給システムｅｘ１００は図１６のような構成に限定されず、いずれかの要素を組合せて接続するようにしてもよい。また、固定無線局である基地局ｅｘ１０６からｅｘ１１０を介さずに、各機器が電話網ｅｘ１０４に直接接続されてもよい。また、各機器が近距離無線等を介して直接相互に接続されていてもよい。

　カメラｅｘ１１３はデジタルビデオカメラ等の動画撮像が可能な機器であり、カメラｅｘ１１６はデジタルカメラ等の静止画撮像、動画撮像が可能な機器である。また、携帯電話ｅｘ１１４は、ＧＳＭ（登録商標）（ＧｌｏｂａｌＳｙｓｔｅｍｆｏｒＭｏｂｉｌｅＣｏｍｍｕｎｉｃａｔｉｏｎｓ）方式、ＣＤＭＡ（ＣｏｄｅＤｉｖｉｓｉｏｎＭｕｌｔｉｐｌｅＡｃｃｅｓｓ）方式、Ｗ－ＣＤＭＡ（Ｗｉｄｅｂａｎｄ-ＣｏｄｅＤｉｖｉｓｉｏｎＭｕｌｔｉｐｌｅＡｃｃｅｓｓ）方式、若しくはＬＴＥ（ＬｏｎｇＴｅｒｍＥｖｏｌｕｔｉｏｎ）方式、ＨＳＰＡ(ＨｉｇｈＳｐｅｅｄＰａｃｋｅｔＡｃｃｅｓｓ)の携帯電話機、またはＰＨＳ（ＰｅｒｓｏｎａｌＨａｎｄｙｐｈｏｎｅＳｙｓｔｅｍ）等であり、いずれでも構わない。

　コンテンツ供給システムｅｘ１００では、カメラｅｘ１１３等が基地局ｅｘ１０９、電話網ｅｘ１０４を通じてストリーミングサーバｅｘ１０３に接続されることで、ライブ配信等が可能になる。ライブ配信では、ユーザがカメラｅｘ１１３を用いて撮像するコンテンツ（例えば、音楽ライブの映像等）に対して上記各実施の形態で説明したように符号化処理を行い（即ち、本発明の画像符号化装置として機能する）、ストリーミングサーバｅｘ１０３に送信する。一方、ストリーミングサーバｅｘ１０３は要求のあったクライアントに対して送信されたコンテンツデータをストリーム配信する。クライアントとしては、上記符号化処理されたデータを復号することが可能な、コンピュータｅｘ１１１、ＰＤＡｅｘ１１２、カメラｅｘ１１３、携帯電話ｅｘ１１４、ゲーム機ｅｘ１１５等がある。配信されたデータを受信した各機器では、受信したデータを復号処理して再生する（即ち、本発明の画像復号装置として機能する）。

　なお、撮像したデータの符号化処理はカメラｅｘ１１３で行っても、データの送信処理をするストリーミングサーバｅｘ１０３で行ってもよいし、互いに分担して行ってもよい。同様に配信されたデータの復号処理はクライアントで行っても、ストリーミングサーバｅｘ１０３で行ってもよいし、互いに分担して行ってもよい。また、カメラｅｘ１１３に限らず、カメラｅｘ１１６で撮像した静止画像および／または動画像データを、コンピュータｅｘ１１１を介してストリーミングサーバｅｘ１０３に送信してもよい。この場合の符号化処理はカメラｅｘ１１６、コンピュータｅｘ１１１、ストリーミングサーバｅｘ１０３のいずれで行ってもよいし、互いに分担して行ってもよい。

　また、これら符号化・復号処理は、一般的にコンピュータｅｘ１１１や各機器が有するＬＳＩｅｘ５００において処理する。ＬＳＩｅｘ５００は、ワンチップであっても複数チップからなる構成であってもよい。なお、動画像符号化・復号用のソフトウェアをコンピュータｅｘ１１１等で読み取り可能な何らかの記録メディア（ＣＤ－ＲＯＭ、フレキシブルディスク、ハードディスクなど）に組み込み、そのソフトウェアを用いて符号化・復号処理を行ってもよい。さらに、携帯電話ｅｘ１１４がカメラ付きである場合には、そのカメラで取得した動画データを送信してもよい。このときの動画データは携帯電話ｅｘ１１４が有するＬＳＩｅｘ５００で符号化処理されたデータである。

　また、ストリーミングサーバｅｘ１０３は複数のサーバや複数のコンピュータであって、データを分散して処理したり記録したり配信するものであってもよい。

　以上のようにして、コンテンツ供給システムｅｘ１００では、符号化されたデータをクライアントが受信して再生することができる。このようにコンテンツ供給システムｅｘ１００では、ユーザが送信した情報をリアルタイムでクライアントが受信して復号し、再生することができ、特別な権利や設備を有さないユーザでも個人放送を実現できる。

　なお、コンテンツ供給システムｅｘ１００の例に限らず、図１７に示すように、デジタル放送用システムｅｘ２００にも、上記各実施の形態の少なくとも動画像符号化装置（画像符号化装置）または動画像復号装置（画像復号装置）のいずれかを組み込むことができる。具体的には、放送局ｅｘ２０１では映像データに音楽データなどが多重化された多重化データが電波を介して通信または衛星ｅｘ２０２に伝送される。この映像データは上記各実施の形態で説明した動画像符号化方法により符号化されたデータである（即ち、本発明の画像符号化装置によって符号化されたデータである）。これを受けた放送衛星ｅｘ２０２は、放送用の電波を発信し、この電波を衛星放送の受信が可能な家庭のアンテナｅｘ２０４が受信する。受信した多重化データを、テレビ（受信機）ｅｘ３００またはセットトップボックス（ＳＴＢ）ｅｘ２１７等の装置が復号して再生する（即ち、本発明の画像復号装置として機能する）。

　また、ＤＶＤ、ＢＤ等の記録メディアｅｘ２１５に記録した多重化データを読み取り復号する、または記録メディアｅｘ２１５に映像信号を符号化し、さらに場合によっては音楽信号と多重化して書き込むリーダ／レコーダｅｘ２１８にも上記各実施の形態で示した動画像復号装置または動画像符号化装置を実装することが可能である。この場合、再生された映像信号はモニタｅｘ２１９に表示され、多重化データが記録された記録メディアｅｘ２１５により他の装置やシステムにおいて映像信号を再生することができる。また、ケーブルテレビ用のケーブルｅｘ２０３または衛星／地上波放送のアンテナｅｘ２０４に接続されたセットトップボックスｅｘ２１７内に動画像復号装置を実装し、これをテレビのモニタｅｘ２１９で表示してもよい。このときセットトップボックスではなく、テレビ内に動画像復号装置を組み込んでもよい。

　図１８は、上記各実施の形態で説明した動画像復号方法および動画像符号化方法を用いたテレビ（受信機）ｅｘ３００を示す図である。テレビｅｘ３００は、上記放送を受信するアンテナｅｘ２０４またはケーブルｅｘ２０３等を介して映像データに音声データが多重化された多重化データを取得、または出力するチューナｅｘ３０１と、受信した多重化データを復調する、または外部に送信する多重化データに変調する変調／復調部ｅｘ３０２と、復調した多重化データを映像データと、音声データとに分離する、または信号処理部ｅｘ３０６で符号化された映像データ、音声データを多重化する多重／分離部ｅｘ３０３を備える。

　また、テレビｅｘ３００は、音声データ、映像データそれぞれを復号する、またはそれぞれの情報を符号化する音声信号処理部ｅｘ３０４、映像信号処理部ｅｘ３０５（本発明の画像符号化装置または画像復号装置として機能する）を有する信号処理部ｅｘ３０６と、復号した音声信号を出力するスピーカｅｘ３０７、復号した映像信号を表示するディスプレイ等の表示部ｅｘ３０８を有する出力部ｅｘ３０９とを有する。さらに、テレビｅｘ３００は、ユーザ操作の入力を受け付ける操作入力部ｅｘ３１２等を有するインタフェース部ｅｘ３１７を有する。さらに、テレビｅｘ３００は、各部を統括的に制御する制御部ｅｘ３１０、各部に電力を供給する電源回路部ｅｘ３１１を有する。インタフェース部ｅｘ３１７は、操作入力部ｅｘ３１２以外に、リーダ／レコーダｅｘ２１８等の外部機器と接続されるブリッジｅｘ３１３、ＳＤカード等の記録メディアｅｘ２１６を装着可能とするためのスロット部ｅｘ３１４、ハードディスク等の外部記録メディアと接続するためのドライバｅｘ３１５、電話網と接続するモデムｅｘ３１６等を有していてもよい。なお記録メディアｅｘ２１６は、格納する不揮発性／揮発性の半導体メモリ素子により電気的に情報の記録を可能としたものである。テレビｅｘ３００の各部は同期バスを介して互いに接続されている。

　まず、テレビｅｘ３００がアンテナｅｘ２０４等により外部から取得した多重化データを復号し、再生する構成について説明する。テレビｅｘ３００は、リモートコントローラｅｘ２２０等からのユーザ操作を受け、ＣＰＵ等を有する制御部ｅｘ３１０の制御に基づいて、変調／復調部ｅｘ３０２で復調した多重化データを多重／分離部ｅｘ３０３で分離する。さらにテレビｅｘ３００は、分離した音声データを音声信号処理部ｅｘ３０４で復号し、分離した映像データを映像信号処理部ｅｘ３０５で上記各実施の形態で説明した復号方法を用いて復号する。復号した音声信号、映像信号は、それぞれ出力部ｅｘ３０９から外部に向けて出力される。出力する際には、音声信号と映像信号が同期して再生するよう、バッファｅｘ３１８、ｅｘ３１９等に一旦これらの信号を蓄積するとよい。また、テレビｅｘ３００は、放送等からではなく、磁気／光ディスク、ＳＤカード等の記録メディアｅｘ２１５、ｅｘ２１６から多重化データを読み出してもよい。次に、テレビｅｘ３００が音声信号や映像信号を符号化し、外部に送信または記録メディア等に書き込む構成について説明する。テレビｅｘ３００は、リモートコントローラｅｘ２２０等からのユーザ操作を受け、制御部ｅｘ３１０の制御に基づいて、音声信号処理部ｅｘ３０４で音声信号を符号化し、映像信号処理部ｅｘ３０５で映像信号を上記各実施の形態で説明した符号化方法を用いて符号化する。符号化した音声信号、映像信号は多重／分離部ｅｘ３０３で多重化され外部に出力される。多重化する際には、音声信号と映像信号が同期するように、バッファｅｘ３２０、ｅｘ３２１等に一旦これらの信号を蓄積するとよい。なお、バッファｅｘ３１８、ｅｘ３１９、ｅｘ３２０、ｅｘ３２１は図示しているように複数備えていてもよいし、１つ以上のバッファを共有する構成であってもよい。さらに、図示している以外に、例えば変調／復調部ｅｘ３０２や多重／分離部ｅｘ３０３の間等でもシステムのオーバフロー、アンダーフローを避ける緩衝材としてバッファにデータを蓄積することとしてもよい。

　また、テレビｅｘ３００は、放送等や記録メディア等から音声データ、映像データを取得する以外に、マイクやカメラのＡＶ入力を受け付ける構成を備え、それらから取得したデータに対して符号化処理を行ってもよい。なお、ここではテレビｅｘ３００は上記の符号化処理、多重化、および外部出力ができる構成として説明したが、これらの処理を行うことはできず、上記受信、復号処理、外部出力のみが可能な構成であってもよい。

　また、リーダ／レコーダｅｘ２１８で記録メディアから多重化データを読み出す、または書き込む場合には、上記復号処理または符号化処理はテレビｅｘ３００、リーダ／レコーダｅｘ２１８のいずれで行ってもよいし、テレビｅｘ３００とリーダ／レコーダｅｘ２１８が互いに分担して行ってもよい。

　一例として、光ディスクからデータの読み込みまたは書き込みをする場合の情報再生／記録部ｅｘ４００の構成を図１９に示す。情報再生／記録部ｅｘ４００は、以下に説明する要素ｅｘ４０１、ｅｘ４０２、ｅｘ４０３、ｅｘ４０４、ｅｘ４０５、ｅｘ４０６、ｅｘ４０７を備える。光ヘッドｅｘ４０１は、光ディスクである記録メディアｅｘ２１５の記録面にレーザスポットを照射して情報を書き込み、記録メディアｅｘ２１５の記録面からの反射光を検出して情報を読み込む。変調記録部ｅｘ４０２は、光ヘッドｅｘ４０１に内蔵された半導体レーザを電気的に駆動し記録データに応じてレーザ光の変調を行う。再生復調部ｅｘ４０３は、光ヘッドｅｘ４０１に内蔵されたフォトディテクタにより記録面からの反射光を電気的に検出した再生信号を増幅し、記録メディアｅｘ２１５に記録された信号成分を分離して復調し、必要な情報を再生する。バッファｅｘ４０４は、記録メディアｅｘ２１５に記録するための情報および記録メディアｅｘ２１５から再生した情報を一時的に保持する。ディスクモータｅｘ４０５は記録メディアｅｘ２１５を回転させる。サーボ制御部ｅｘ４０６は、ディスクモータｅｘ４０５の回転駆動を制御しながら光ヘッドｅｘ４０１を所定の情報トラックに移動させ、レーザスポットの追従処理を行う。システム制御部ｅｘ４０７は、情報再生／記録部ｅｘ４００全体の制御を行う。上記の読み出しや書き込みの処理はシステム制御部ｅｘ４０７が、バッファｅｘ４０４に保持された各種情報を利用し、また必要に応じて新たな情報の生成・追加を行うと共に、変調記録部ｅｘ４０２、再生復調部ｅｘ４０３、サーボ制御部ｅｘ４０６を協調動作させながら、光ヘッドｅｘ４０１を通して、情報の記録再生を行うことにより実現される。システム制御部ｅｘ４０７は例えばマイクロプロセッサで構成され、読み出し書き込みのプログラムを実行することでそれらの処理を実行する。

　以上では、光ヘッドｅｘ４０１はレーザスポットを照射するとして説明したが、近接場光を用いてより高密度な記録を行う構成であってもよい。

　図２０に光ディスクである記録メディアｅｘ２１５の模式図を示す。記録メディアｅｘ２１５の記録面には案内溝（グルーブ）がスパイラル状に形成され、情報トラックｅｘ２３０には、予めグルーブの形状の変化によってディスク上の絶対位置を示す番地情報が記録されている。この番地情報はデータを記録する単位である記録ブロックｅｘ２３１の位置を特定するための情報を含み、記録や再生を行う装置において情報トラックｅｘ２３０を再生し番地情報を読み取ることで記録ブロックを特定することができる。また、記録メディアｅｘ２１５は、データ記録領域ｅｘ２３３、内周領域ｅｘ２３２、外周領域ｅｘ２３４を含んでいる。ユーザデータを記録するために用いる領域がデータ記録領域ｅｘ２３３であり、データ記録領域ｅｘ２３３より内周または外周に配置されている内周領域ｅｘ２３２と外周領域ｅｘ２３４は、ユーザデータの記録以外の特定用途に用いられる。情報再生／記録部ｅｘ４００は、このような記録メディアｅｘ２１５のデータ記録領域ｅｘ２３３に対して、符号化された音声データ、映像データまたはそれらのデータを多重化した多重化データの読み書きを行う。

　以上では、１層のＤＶＤ、ＢＤ等の光ディスクを例に挙げ説明したが、これらに限ったものではなく、多層構造であって表面以外にも記録可能な光ディスクであってもよい。また、ディスクの同じ場所にさまざまな異なる波長の色の光を用いて情報を記録したり、さまざまな角度から異なる情報の層を記録したりなど、多次元的な記録／再生を行う構造の光ディスクであってもよい。

　また、デジタル放送用システムｅｘ２００において、アンテナｅｘ２０５を有する車ｅｘ２１０で衛星ｅｘ２０２等からデータを受信し、車ｅｘ２１０が有するカーナビゲーションｅｘ２１１等の表示装置に動画を再生することも可能である。なお、カーナビゲーションｅｘ２１１の構成は例えば図１８に示す構成のうち、ＧＰＳ受信部を加えた構成が考えられ、同様なことがコンピュータｅｘ１１１や携帯電話ｅｘ１１４等でも考えられる。

　図２１Ａは、上記実施の形態で説明した動画像復号方法および動画像符号化方法を用いた携帯電話ｅｘ１１４を示す図である。携帯電話ｅｘ１１４は、基地局ｅｘ１１０との間で電波を送受信するためのアンテナｅｘ３５０、映像、静止画を撮ることが可能なカメラ部ｅｘ３６５、カメラ部ｅｘ３６５で撮像した映像、アンテナｅｘ３５０で受信した映像等が復号されたデータを表示する液晶ディスプレイ等の表示部ｅｘ３５８を備える。携帯電話ｅｘ１１４は、さらに、操作キー部ｅｘ３６６を有する本体部、音声を出力するためのスピーカ等である音声出力部ｅｘ３５７、音声を入力するためのマイク等である音声入力部ｅｘ３５６、撮像した映像、静止画、録音した音声、または受信した映像、静止画、メール等の符号化されたデータもしくは復号されたデータを保存するメモリ部ｅｘ３６７、又は同様にデータを保存する記録メディアとのインタフェース部であるスロット部ｅｘ３６４を備える。

　さらに、携帯電話ｅｘ１１４の構成例について、図２１Ｂを用いて説明する。携帯電話ｅｘ１１４は、表示部ｅｘ３５８及び操作キー部ｅｘ３６６を備えた本体部の各部を統括的に制御する主制御部ｅｘ３６０に対して、電源回路部ｅｘ３６１、操作入力制御部ｅｘ３６２、映像信号処理部ｅｘ３５５、カメラインタフェース部ｅｘ３６３、ＬＣＤ（ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ）制御部ｅｘ３５９、変調／復調部ｅｘ３５２、多重／分離部ｅｘ３５３、音声信号処理部ｅｘ３５４、スロット部ｅｘ３６４、メモリ部ｅｘ３６７がバスｅｘ３７０を介して互いに接続されている。

　電源回路部ｅｘ３６１は、ユーザの操作により終話及び電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することにより携帯電話ｅｘ１１４を動作可能な状態に起動する。

　携帯電話ｅｘ１１４は、ＣＰＵ、ＲＯＭ、ＲＡＭ等を有する主制御部ｅｘ３６０の制御に基づいて、音声通話モード時に音声入力部ｅｘ３５６で収音した音声信号を音声信号処理部ｅｘ３５４でデジタル音声信号に変換し、これを変調／復調部ｅｘ３５２でスペクトラム拡散処理し、送信／受信部ｅｘ３５１でデジタルアナログ変換処理および周波数変換処理を施した後にアンテナｅｘ３５０を介して送信する。また携帯電話ｅｘ１１４は、音声通話モード時にアンテナｅｘ３５０を介して受信した受信データを増幅して周波数変換処理およびアナログデジタル変換処理を施し、変調／復調部ｅｘ３５２でスペクトラム逆拡散処理し、音声信号処理部ｅｘ３５４でアナログ音声信号に変換した後、これを音声出力部ｅｘ３５７から出力する。

　さらにデータ通信モード時に電子メールを送信する場合、本体部の操作キー部ｅｘ３６６等の操作によって入力された電子メールのテキストデータは操作入力制御部ｅｘ３６２を介して主制御部ｅｘ３６０に送出される。主制御部ｅｘ３６０は、テキストデータを変調／復調部ｅｘ３５２でスペクトラム拡散処理をし、送信／受信部ｅｘ３５１でデジタルアナログ変換処理および周波数変換処理を施した後にアンテナｅｘ３５０を介して基地局ｅｘ１１０へ送信する。電子メールを受信する場合は、受信したデータに対してこのほぼ逆の処理が行われ、表示部ｅｘ３５８に出力される。

　データ通信モード時に映像、静止画、または映像と音声を送信する場合、映像信号処理部ｅｘ３５５は、カメラ部ｅｘ３６５から供給された映像信号を上記各実施の形態で示した動画像符号化方法によって圧縮符号化し（即ち、本発明の画像符号化装置として機能する）、符号化された映像データを多重／分離部ｅｘ３５３に送出する。また、音声信号処理部ｅｘ３５４は、映像、静止画等をカメラ部ｅｘ３６５で撮像中に音声入力部ｅｘ３５６で収音した音声信号を符号化し、符号化された音声データを多重／分離部ｅｘ３５３に送出する。

　多重／分離部ｅｘ３５３は、映像信号処理部ｅｘ３５５から供給された符号化された映像データと音声信号処理部ｅｘ３５４から供給された符号化された音声データを所定の方式で多重化し、その結果得られる多重化データを変調／復調部ｅｘ３５２でスペクトラム拡散処理をし、送信／受信部ｅｘ３５１でデジタルアナログ変換処理及び周波数変換処理を施した後にアンテナｅｘ３５０を介して送信する。

　データ通信モード時にホームページ等にリンクされた動画像ファイルのデータを受信する場合、または映像およびもしくは音声が添付された電子メールを受信する場合、アンテナｅｘ３５０を介して受信された多重化データを復号するために、多重／分離部ｅｘ３５３は、多重化データを分離することにより映像データのビットストリームと音声データのビットストリームとに分け、同期バスｅｘ３７０を介して符号化された映像データを映像信号処理部ｅｘ３５５に供給するとともに、符号化された音声データを音声信号処理部ｅｘ３５４に供給する。映像信号処理部ｅｘ３５５は、上記各実施の形態で示した動画像符号化方法に対応した動画像復号方法によって復号することにより映像信号を復号し（即ち、本発明の画像復号装置として機能する）、ＬＣＤ制御部ｅｘ３５９を介して表示部ｅｘ３５８から、例えばホームページにリンクされた動画像ファイルに含まれる映像、静止画が表示される。また音声信号処理部ｅｘ３５４は、音声信号を復号し、音声出力部ｅｘ３５７から音声が出力される。

　また、上記携帯電話ｅｘ１１４等の端末は、テレビｅｘ３００と同様に、符号化器・復号器を両方持つ送受信型端末の他に、符号化器のみの送信端末、復号器のみの受信端末という３通りの実装形式が考えられる。さらに、デジタル放送用システムｅｘ２００において、映像データに音楽データなどが多重化された多重化データを受信、送信するとして説明したが、音声データ以外に映像に関連する文字データなどが多重化されたデータであってもよいし、多重化データではなく映像データ自体であってもよい。

　このように、上記各実施の形態で示した動画像符号化方法あるいは動画像復号方法を上述したいずれの機器・システムに用いることは可能であり、そうすることで、上記各実施の形態で説明した効果を得ることができる。

　また、本発明はかかる上記実施の形態に限定されるものではなく、本発明の範囲を逸脱することなく種々の変形または修正が可能である。

　（実施の形態４）
　上記各実施の形態で示した動画像符号化方法または装置と、ＭＰＥＧ－２、ＭＰＥＧ４－ＡＶＣ、ＶＣ－１など異なる規格に準拠した動画像符号化方法または装置とを、必要に応じて適宜切替えることにより、映像データを生成することも可能である。

　ここで、それぞれ異なる規格に準拠する複数の映像データを生成した場合、復号する際に、それぞれの規格に対応した復号方法を選択する必要がある。しかしながら、復号する映像データが、どの規格に準拠するものであるか識別できないため、適切な復号方法を選択することができないという課題を生じる。

　この課題を解決するために、映像データに音声データなどを多重化した多重化データは、映像データがどの規格に準拠するものであるかを示す識別情報を含む構成とする。上記各実施の形態で示す動画像符号化方法または装置によって生成された映像データを含む多重化データの具体的な構成を以下説明する。多重化データは、ＭＰＥＧ－２トランスポートストリーム形式のデジタルストリームである。

　図２２は、多重化データの構成を示す図である。図２２に示すように多重化データは、ビデオストリーム、オーディオストリーム、プレゼンテーショングラフィックスストリーム（ＰＧ）、インタラクティブグラフィックスストリームのうち、１つ以上を多重化することで得られる。ビデオストリームは映画の主映像および副映像を、オーディオストリーム（ＩＧ）は映画の主音声部分とその主音声とミキシングする副音声を、プレゼンテーショングラフィックスストリームは、映画の字幕をそれぞれ示している。ここで主映像とは画面に表示される通常の映像を示し、副映像とは主映像の中に小さな画面で表示する映像のことである。また、インタラクティブグラフィックスストリームは、画面上にＧＵＩ部品を配置することにより作成される対話画面を示している。ビデオストリームは、上記各実施の形態で示した動画像符号化方法または装置、従来のＭＰＥＧ－２、ＭＰＥＧ４－ＡＶＣ、ＶＣ－１などの規格に準拠した動画像符号化方法または装置によって符号化されている。オーディオストリームは、ドルビーＡＣ－３、Ｄｏｌｂｙ　Ｄｉｇｉｔａｌ　Ｐｌｕｓ、ＭＬＰ、ＤＴＳ、ＤＴＳ－ＨＤ、または、リニアＰＣＭのなどの方式で符号化されている。

　多重化データに含まれる各ストリームはＰＩＤによって識別される。例えば、映画の映像に利用するビデオストリームには０ｘ１０１１が、オーディオストリームには０ｘ１１００から０ｘ１１１Ｆまでが、プレゼンテーショングラフィックスには０ｘ１２００から０ｘ１２１Ｆまでが、インタラクティブグラフィックスストリームには０ｘ１４００から０ｘ１４１Ｆまでが、映画の副映像に利用するビデオストリームには０ｘ１Ｂ００から０ｘ１Ｂ１Ｆまで、主音声とミキシングする副音声に利用するオーディオストリームには０ｘ１Ａ００から０ｘ１Ａ１Ｆが、それぞれ割り当てられている。

　図２３は、多重化データがどのように多重化されるかを模式的に示す図である。まず、複数のビデオフレームからなるビデオストリームｅｘ２３５、複数のオーディオフレームからなるオーディオストリームｅｘ２３８を、それぞれＰＥＳパケット列ｅｘ２３６およびｅｘ２３９に変換し、ＴＳパケットｅｘ２３７およびｅｘ２４０に変換する。同じくプレゼンテーショングラフィックスストリームｅｘ２４１およびインタラクティブグラフィックスｅｘ２４４のデータをそれぞれＰＥＳパケット列ｅｘ２４２およびｅｘ２４５に変換し、さらにＴＳパケットｅｘ２４３およびｅｘ２４６に変換する。多重化データｅｘ２４７はこれらのＴＳパケットを１本のストリームに多重化することで構成される。

　図２４は、ＰＥＳパケット列に、ビデオストリームがどのように格納されるかをさらに詳しく示している。図２４における第１段目はビデオストリームのビデオフレーム列を示す。第２段目は、ＰＥＳパケット列を示す。図２４の矢印ｙｙ１，ｙｙ２，　ｙｙ３，　ｙｙ４に示すように、ビデオストリームにおける複数のＶｉｄｅｏ　Ｐｒｅｓｅｎｔａｔｉｏｎ　ＵｎｉｔであるＩピクチャ、Ｂピクチャ、Ｐピクチャは、ピクチャ毎に分割され、ＰＥＳパケットのペイロードに格納される。各ＰＥＳパケットはＰＥＳヘッダを持ち、ＰＥＳヘッダには、ピクチャの表示時刻であるＰＴＳ（Ｐｒｅｓｅｎｔａｔｉｏｎ　Ｔｉｍｅ－Ｓｔａｍｐ）やピクチャの復号時刻であるＤＴＳ（Ｄｅｃｏｄｉｎｇ　Ｔｉｍｅ－Ｓｔａｍｐ）が格納される。

　図２５は、多重化データに最終的に書き込まれるＴＳパケットの形式を示している。ＴＳパケットは、ストリームを識別するＰＩＤなどの情報を持つ４ＢｙｔｅのＴＳヘッダとデータを格納する１８４ＢｙｔｅのＴＳペイロードから構成される１８８Ｂｙｔｅ固定長のパケットであり、上記ＰＥＳパケットは分割されＴＳペイロードに格納される。ＢＤ－ＲＯＭの場合、ＴＳパケットには、４ＢｙｔｅのＴＰ＿Ｅｘｔｒａ＿Ｈｅａｄｅｒが付与され、１９２Ｂｙｔｅのソースパケットを構成し、多重化データに書き込まれる。ＴＰ＿Ｅｘｔｒａ＿ＨｅａｄｅｒにはＡＴＳ（Ａｒｒｉｖａｌ＿Ｔｉｍｅ＿Ｓｔａｍｐ）などの情報が記載される。ＡＴＳは当該ＴＳパケットのデコーダのＰＩＤフィルタへの転送開始時刻を示す。多重化データには図２５下段に示すようにソースパケットが並ぶこととなり、多重化データの先頭からインクリメントする番号はＳＰＮ（ソースパケットナンバー）と呼ばれる。

　また、多重化データに含まれるＴＳパケットには、映像・音声・字幕などの各ストリーム以外にもＰＡＴ（Ｐｒｏｇｒａｍ　Ａｓｓｏｃｉａｔｉｏｎ　Ｔａｂｌｅ）、ＰＭＴ（Ｐｒｏｇｒａｍ　Ｍａｐ　Ｔａｂｌｅ）、ＰＣＲ（Ｐｒｏｇｒａｍ　Ｃｌｏｃｋ　Ｒｅｆｅｒｅｎｃｅ）などがある。ＰＡＴは多重化データ中に利用されるＰＭＴのＰＩＤが何であるかを示し、ＰＡＴ自身のＰＩＤは０で登録される。ＰＭＴは、多重化データ中に含まれる映像・音声・字幕などの各ストリームのＰＩＤと各ＰＩＤに対応するストリームの属性情報を持ち、また多重化データに関する各種ディスクリプタを持つ。ディスクリプタには多重化データのコピーを許可・不許可を指示するコピーコントロール情報などがある。ＰＣＲは、ＡＴＳの時間軸であるＡＴＣ（Ａｒｒｉｖａｌ　Ｔｉｍｅ　Ｃｌｏｃｋ）とＰＴＳ・ＤＴＳの時間軸であるＳＴＣ（Ｓｙｓｔｅｍ　Ｔｉｍｅ　Ｃｌｏｃｋ）の同期を取るために、そのＰＣＲパケットがデコーダに転送されるＡＴＳに対応するＳＴＣ時間の情報を持つ。

　図２６はＰＭＴのデータ構造を詳しく説明する図である。ＰＭＴの先頭には、そのＰＭＴに含まれるデータの長さなどを記したＰＭＴヘッダが配置される。その後ろには、多重化データに関するディスクリプタが複数配置される。上記コピーコントロール情報などが、ディスクリプタとして記載される。ディスクリプタの後には、多重化データに含まれる各ストリームに関するストリーム情報が複数配置される。ストリーム情報は、ストリームの圧縮コーデックなどを識別するためストリームタイプ、ストリームのＰＩＤ、ストリームの属性情報（フレームレート、アスペクト比など）が記載されたストリームディスクリプタから構成される。ストリームディスクリプタは多重化データに存在するストリームの数だけ存在する。

　記憶媒体などに記録する場合には、上記多重化データは、多重化データ情報ファイルと共に記録される。

　多重化データ情報ファイルは、図２７に示すように多重化データの管理情報であり、多重化データと１対１に対応し、多重化データ情報、ストリーム属性情報とエントリマップから構成される。

　多重化データ情報は図２７に示すようにシステムレート、再生開始時刻、再生終了時刻から構成されている。システムレートは多重化データの、後述するシステムターゲットデコーダのＰＩＤフィルタへの最大転送レートを示す。多重化データ中に含まれるＡＴＳの間隔はシステムレート以下になるように設定されている。再生開始時刻は多重化データの先頭のビデオフレームのＰＴＳであり、再生終了時刻は多重化データの終端のビデオフレームのＰＴＳに１フレーム分の再生間隔を足したものが設定される。

　ストリーム属性情報は図２８に示すように、多重化データに含まれる各ストリームについての属性情報が、ＰＩＤ毎に登録される。属性情報はビデオストリーム、オーディオストリーム、プレゼンテーショングラフィックスストリーム、インタラクティブグラフィックスストリーム毎に異なる情報を持つ。ビデオストリーム属性情報は、そのビデオストリームがどのような圧縮コーデックで圧縮されたか、ビデオストリームを構成する個々のピクチャデータの解像度がどれだけであるか、アスペクト比はどれだけであるか、フレームレートはどれだけであるかなどの情報を持つ。オーディオストリーム属性情報は、そのオーディオストリームがどのような圧縮コーデックで圧縮されたか、そのオーディオストリームに含まれるチャネル数は何であるか、何の言語に対応するか、サンプリング周波数がどれだけであるかなどの情報を持つ。これらの情報は、プレーヤが再生する前のデコーダの初期化などに利用される。

　本実施の形態においては、上記多重化データのうち、ＰＭＴに含まれるストリームタイプを利用する。また、記憶媒体に多重化データが記録されている場合には、多重化データ情報に含まれる、ビデオストリーム属性情報を利用する。具体的には、上記各実施の形態で示した動画像符号化方法または装置において、ＰＭＴに含まれるストリームタイプ、または、ビデオストリーム属性情報に対し、上記各実施の形態で示した動画像符号化方法または装置によって生成された映像データであることを示す固有の情報を設定するステップまたは手段を設ける。この構成により、上記各実施の形態で示した動画像符号化方法または装置によって生成した映像データと、他の規格に準拠する映像データとを識別することが可能になる。

　また、本実施の形態における動画像復号方法のステップを図２９に示す。ステップｅｘＳ１００において、多重化データからＰＭＴに含まれるストリームタイプ、または、多重化データ情報に含まれるビデオストリーム属性情報を取得する。次に、ステップｅｘＳ１０１において、ストリームタイプ、または、ビデオストリーム属性情報が上記各実施の形態で示した動画像符号化方法または装置によって生成された多重化データであることを示しているか否かを判断する。そして、ストリームタイプ、または、ビデオストリーム属性情報が上記各実施の形態で示した動画像符号化方法または装置によって生成されたものであると判断された場合には、ステップｅｘＳ１０２において、上記各実施の形態で示した動画像復号方法により復号を行う。また、ストリームタイプ、または、ビデオストリーム属性情報が、従来のＭＰＥＧ－２、ＭＰＥＧ４－ＡＶＣ、ＶＣ－１などの規格に準拠するものであることを示している場合には、ステップｅｘＳ１０３において、従来の規格に準拠した動画像復号方法により復号を行う。

　このように、ストリームタイプ、または、ビデオストリーム属性情報に新たな固有値を設定することにより、復号する際に、上記各実施の形態で示した動画像復号方法または装置で復号可能であるかを判断することができる。従って、異なる規格に準拠する多重化データが入力された場合であっても、適切な復号方法または装置を選択することができるため、エラーを生じることなく復号することが可能となる。また、本実施の形態で示した動画像符号化方法または装置、または、動画像復号方法または装置を、上述したいずれの機器・システムに用いることも可能である。

　（実施の形態５）
　上記各実施の形態で示した動画像符号化方法および装置、動画像復号方法および装置は、典型的には集積回路であるＬＳＩで実現される。一例として、図３０に１チップ化されたＬＳＩｅｘ５００の構成を示す。ＬＳＩｅｘ５００は、以下に説明する要素ｅｘ５０１、ｅｘ５０２、ｅｘ５０３、ｅｘ５０４、ｅｘ５０５、ｅｘ５０６、ｅｘ５０７、ｅｘ５０８、ｅｘ５０９を備え、各要素はバスｅｘ５１０を介して接続している。電源回路部ｅｘ５０５は電源がオン状態の場合に各部に対して電力を供給することで動作可能な状態に起動する。

　例えば符号化処理を行う場合には、ＬＳＩｅｘ５００は、ＣＰＵｅｘ５０２、メモリコントローラｅｘ５０３、ストリームコントローラｅｘ５０４、駆動周波数制御部ｅｘ５１２等を有する制御部ｅｘ５０１の制御に基づいて、ＡＶ　Ｉ／Ｏｅｘ５０９によりマイクｅｘ１１７やカメラｅｘ１１３等からＡＶ信号を入力する。入力されたＡＶ信号は、一旦ＳＤＲＡＭ等の外部のメモリｅｘ５１１に蓄積される。制御部ｅｘ５０１の制御に基づいて、蓄積したデータは処理量や処理速度に応じて適宜複数回に分けるなどされ信号処理部ｅｘ５０７に送られ、信号処理部ｅｘ５０７において音声信号の符号化および／または映像信号の符号化が行われる。ここで映像信号の符号化処理は上記各実施の形態で説明した符号化処理である。信号処理部ｅｘ５０７ではさらに、場合により符号化された音声データと符号化された映像データを多重化するなどの処理を行い、ストリームＩ／Ｏｅｘ５０６から外部に出力する。この出力された多重化データは、基地局ｅｘ１０７に向けて送信されたり、または記録メディアｅｘ２１５に書き込まれたりする。なお、多重化する際には同期するよう、一旦バッファｅｘ５０８にデータを蓄積するとよい。

　なお、上記では、メモリｅｘ５１１がＬＳＩｅｘ５００の外部の構成として説明したが、ＬＳＩｅｘ５００の内部に含まれる構成であってもよい。バッファｅｘ５０８も１つに限ったものではなく、複数のバッファを備えていてもよい。また、ＬＳＩｅｘ５００は１チップ化されてもよいし、複数チップ化されてもよい。

　また、上記では、制御部ｅｘ５０１が、ＣＰＵｅｘ５０２、メモリコントローラｅｘ５０３、ストリームコントローラｅｘ５０４、駆動周波数制御部ｅｘ５１２等を有するとしているが、制御部ｅｘ５０１の構成は、この構成に限らない。例えば、信号処理部ｅｘ５０７がさらにＣＰＵを備える構成であってもよい。信号処理部ｅｘ５０７の内部にもＣＰＵを設けることにより、処理速度をより向上させることが可能になる。また、他の例として、ＣＰＵｅｘ５０２が信号処理部ｅｘ５０７、または信号処理部ｅｘ５０７の一部である例えば音声信号処理部を備える構成であってもよい。このような場合には、制御部ｅｘ５０１は、信号処理部ｅｘ５０７、またはその一部を有するＣＰＵｅｘ５０２を備える構成となる。

　なお、ここでは、ＬＳＩとしたが、集積度の違いにより、ＩＣ、システムＬＳＩ、スーパーＬＳＩ、ウルトラＬＳＩと呼称されることもある。

　また、集積回路化の手法はＬＳＩに限るものではなく、専用回路または汎用プロセッサで実現してもよい。ＬＳＩ製造後に、プログラムすることが可能なＦＰＧＡ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）や、ＬＳＩ内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。

　さらには、半導体技術の進歩または派生する別技術によりＬＳＩに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。

　（実施の形態６）
　上記各実施の形態で示した動画像符号化方法または装置によって生成された映像データを復号する場合、従来のＭＰＥＧ－２、ＭＰＥＧ４－ＡＶＣ、ＶＣ－１などの規格に準拠する映像データを復号する場合に比べ、処理量が増加することが考えられる。そのため、ＬＳＩｅｘ５００において、従来の規格に準拠する映像データを復号する際のＣＰＵｅｘ５０２の駆動周波数よりも高い駆動周波数に設定する必要がある。しかし、駆動周波数を高くすると、消費電力が高くなるという課題が生じる。

　この課題を解決するために、テレビｅｘ３００、ＬＳＩｅｘ５００などの動画像復号装置は、映像データがどの規格に準拠するものであるかを識別し、規格に応じて駆動周波数を切替える構成とする。図３１は、本実施の形態における構成ｅｘ８００を示している。駆動周波数切替え部ｅｘ８０３は、映像データが、上記各実施の形態で示した動画像符号化方法または装置によって生成されたものである場合には、駆動周波数を高く設定する。そして、上記各実施の形態で示した動画像復号方法を実行する復号処理部ｅｘ８０１に対し、映像データを復号するよう指示する。一方、映像データが、従来の規格に準拠する映像データである場合には、映像データが、上記各実施の形態で示した動画像符号化方法または装置によって生成されたものである場合に比べ、駆動周波数を低く設定する。そして、従来の規格に準拠する復号処理部ｅｘ８０２に対し、映像データを復号するよう指示する。

　より具体的には、駆動周波数切替え部ｅｘ８０３は、図３０のＣＰＵｅｘ５０２と駆動周波数制御部ｅｘ５１２から構成される。また、上記各実施の形態で示した動画像復号方法を実行する復号処理部ｅｘ８０１、および、従来の規格に準拠する復号処理部ｅｘ８０２は、図３０の信号処理部ｅｘ５０７に該当する。ＣＰＵｅｘ５０２は、映像データがどの規格に準拠するものであるかを識別する。そして、ＣＰＵｅｘ５０２からの信号に基づいて、駆動周波数制御部ｅｘ５１２は、駆動周波数を設定する。また、ＣＰＵｅｘ５０２からの信号に基づいて、信号処理部ｅｘ５０７は、映像データの復号を行う。ここで、映像データの識別には、例えば、実施の形態４で記載した識別情報を利用することが考えられる。識別情報に関しては、実施の形態４で記載したものに限られず、映像データがどの規格に準拠するか識別できる情報であればよい。例えば、映像データがテレビに利用されるものであるか、ディスクに利用されるものであるかなどを識別する外部信号に基づいて、映像データがどの規格に準拠するものであるか識別可能である場合には、このような外部信号に基づいて識別してもよい。また、ＣＰＵｅｘ５０２における駆動周波数の選択は、例えば、図３３のような映像データの規格と、駆動周波数とを対応付けたルックアップテーブルに基づいて行うことが考えられる。ルックアップテーブルを、バッファｅｘ５０８や、ＬＳＩの内部メモリに格納しておき、ＣＰＵｅｘ５０２がこのルックアップテーブルを参照することにより、駆動周波数を選択することが可能である。

　図３２は、本実施の形態の方法を実施するステップを示している。まず、ステップｅｘＳ２００では、信号処理部ｅｘ５０７において、多重化データから識別情報を取得する。次に、ステップｅｘＳ２０１では、ＣＰＵｅｘ５０２において、識別情報に基づいて映像データが上記各実施の形態で示した符号化方法または装置によって生成されたものであるか否かを識別する。映像データが上記各実施の形態で示した符号化方法または装置によって生成されたものである場合には、ステップｅｘＳ２０２において、駆動周波数を高く設定する信号を、ＣＰＵｅｘ５０２が駆動周波数制御部ｅｘ５１２に送る。そして、駆動周波数制御部ｅｘ５１２において、高い駆動周波数に設定される。一方、従来のＭＰＥＧ－２、ＭＰＥＧ４－ＡＶＣ、ＶＣ－１などの規格に準拠する映像データであることを示している場合には、ステップｅｘＳ２０３において、駆動周波数を低く設定する信号を、ＣＰＵｅｘ５０２が駆動周波数制御部ｅｘ５１２に送る。そして、駆動周波数制御部ｅｘ５１２において、映像データが上記各実施の形態で示した符号化方法または装置によって生成されたものである場合に比べ、低い駆動周波数に設定される。

　さらに、駆動周波数の切替えに連動して、ＬＳＩｅｘ５００またはＬＳＩｅｘ５００を含む装置に与える電圧を変更することにより、省電力効果をより高めることが可能である。例えば、駆動周波数を低く設定する場合には、これに伴い、駆動周波数を高く設定している場合に比べ、ＬＳＩｅｘ５００またはＬＳＩｅｘ５００を含む装置に与える電圧を低く設定することが考えられる。

　また、駆動周波数の設定方法は、復号する際の処理量が大きい場合に、駆動周波数を高く設定し、復号する際の処理量が小さい場合に、駆動周波数を低く設定すればよく、上述した設定方法に限らない。例えば、ＭＰＥＧ４－ＡＶＣ規格に準拠する映像データを復号する処理量の方が、上記各実施の形態で示した動画像符号化方法または装置により生成された映像データを復号する処理量よりも大きい場合には、駆動周波数の設定を上述した場合の逆にすることが考えられる。

　さらに、駆動周波数の設定方法は、駆動周波数を低くする構成に限らない。例えば、識別情報が、上記各実施の形態で示した動画像符号化方法または装置によって生成された映像データであることを示している場合には、ＬＳＩｅｘ５００またはＬＳＩｅｘ５００を含む装置に与える電圧を高く設定し、従来のＭＰＥＧ－２、ＭＰＥＧ４－ＡＶＣ、ＶＣ－１などの規格に準拠する映像データであることを示している場合には、ＬＳＩｅｘ５００またはＬＳＩｅｘ５００を含む装置に与える電圧を低く設定することも考えられる。また、他の例としては、識別情報が、上記各実施の形態で示した動画像符号化方法または装置によって生成された映像データであることを示している場合には、ＣＰＵｅｘ５０２の駆動を停止させることなく、従来のＭＰＥＧ－２、ＭＰＥＧ４－ＡＶＣ、ＶＣ－１などの規格に準拠する映像データであることを示している場合には、処理に余裕があるため、ＣＰＵｅｘ５０２の駆動を一時停止させることも考えられる。識別情報が、上記各実施の形態で示した動画像符号化方法または装置によって生成された映像データであることを示している場合であっても、処理に余裕があれば、ＣＰＵｅｘ５０２の駆動を一時停止させることも考えられる。この場合は、従来のＭＰＥＧ－２、ＭＰＥＧ４－ＡＶＣ、ＶＣ－１などの規格に準拠する映像データであることを示している場合に比べて、停止時間を短く設定することが考えられる。

　このように、映像データが準拠する規格に応じて、駆動周波数を切替えることにより、省電力化を図ることが可能になる。また、電池を用いてＬＳＩｅｘ５００またはＬＳＩｅｘ５００を含む装置を駆動している場合には、省電力化に伴い、電池の寿命を長くすることが可能である。

　（実施の形態７）
　テレビや、携帯電話など、上述した機器・システムには、異なる規格に準拠する複数の映像データが入力される場合がある。このように、異なる規格に準拠する複数の映像データが入力された場合にも復号できるようにするために、ＬＳＩｅｘ５００の信号処理部ｅｘ５０７が複数の規格に対応している必要がある。しかし、それぞれの規格に対応する信号処理部ｅｘ５０７を個別に用いると、ＬＳＩｅｘ５００の回路規模が大きくなり、また、コストが増加するという課題が生じる。

　この課題を解決するために、上記各実施の形態で示した動画像復号方法を実行するための復号処理部と、従来のＭＰＥＧ－２、ＭＰＥＧ４－ＡＶＣ、ＶＣ－１などの規格に準拠する復号処理部とを一部共有化する構成とする。この構成例を図３４Ａのｅｘ９００に示す。例えば、上記各実施の形態で示した動画像復号方法と、ＭＰＥＧ４－ＡＶＣ規格に準拠する動画像復号方法とは、エントロピー符号化、逆量子化、デブロッキングフィルタ、動き補償などの処理において処理内容が一部共通する。共通する処理内容については、ＭＰＥＧ４－ＡＶＣ規格に対応する復号処理部ｅｘ９０２を共有し、ＭＰＥＧ４－ＡＶＣ規格に対応しない、本発明特有の他の処理内容については、専用の復号処理部ｅｘ９０１を用いるという構成が考えられる。特に、本発明は、逆量子化に特徴を有していることから、例えば、逆量子化については専用の復号処理部ｅｘ９０１を用い、それ以外のエントロピー符号化、デブロッキングフィルタ、動き補償のいずれか、または、全ての処理については、復号処理部を共有することが考えられる。復号処理部の共有化に関しては、共通する処理内容については、上記各実施の形態で示した動画像復号方法を実行するための復号処理部を共有し、ＭＰＥＧ４－ＡＶＣ規格に特有の処理内容については、専用の復号処理部を用いる構成であってもよい。

　また、処理を一部共有化する他の例を図３４Ｂのｅｘ１０００に示す。この例では、本発明に特有の処理内容に対応した専用の復号処理部ｅｘ１００１と、他の従来規格に特有の処理内容に対応した専用の復号処理部ｅｘ１００２と、本発明の動画像復号方法と他の従来規格の動画像復号方法とに共通する処理内容に対応した共用の復号処理部ｅｘ１００３とを用いる構成としている。ここで、専用の復号処理部ｅｘ１００１、ｅｘ１００２は、必ずしも本発明、または、他の従来規格に特有の処理内容に特化したものではなく、他の汎用処理を実行できるものであってもよい。また、本実施の形態の構成を、ＬＳＩｅｘ５００で実装することも可能である。

　このように、本発明の動画像復号方法と、従来の規格の動画像復号方法とで共通する処理内容について、復号処理部を共有することにより、ＬＳＩの回路規模を小さくし、かつ、コストを低減することが可能である。

　本発明に係る画像符号化方法は、さまざまな用途に利用可能であり、例えば、テレビ、デジタルビデオレコーダー、カーナビゲーション、携帯電話、デジタルカメラ、デジタルビデオカメラ等の高解像度の情報表示機器や撮像機器に利用可能である。

１０　　　　算術符号化部
１１　　　　２値化部
１２　　　　シンボル発生確率格納部
１３　　　　コンテキスト制御部
１４　　　　２値算術符号化器
１００　　　算術符号化部
１０１　　　２値化部
１０２　　　シンボル発生確率格納部
１０３　　　コンテキスト制御部
１０４　　　２値算術符号化器
１０５　　　コンテキスト区分制御部
２００　　　画像符号化装置
２０５　　　減算器
２１０　　　変換・量子化部
２２０　　　エントロピー符号化部
２３０　　　逆量子化・逆変換部
２３５　　　加算器
２４０　　　デブロッキングフィルタ
２５０　　　メモリ
２６０　　　イントラ予測部
２７０　　　動き検出部
２８０　　　動き補償部
２９０　　　イントラ／インター切換スイッチ
３００　　　算術復号部
３０１　　　２値算術復号器
３０２　　　シンボル発生確率格納部
３０３　　　コンテキスト制御部
３０４　　　多値化部
３０５　　　コンテキスト区分制御部
４００　　　画像復号装置
４１０　　　エントロピー復号部
４２０　　　逆量子化・逆変換部
４２５　　　加算器
４３０　　　デブロッキングフィルタ
４４０　　　メモリ
４５０　　　イントラ予測部
４６０　　　動き補償部
４７０　　　イントラ／インター切換スイッチ
ｅｘ１００　コンテンツ供給システム
ｅｘ１０１　インターネット
ｅｘ１０２　インターネットサービスプロバイダ
ｅｘ１０３　ストリーミングサーバ
ｅｘ１０４　電話網
ｅｘ１０６、ｅｘ１０７、ｅｘ１０８、ｅｘ１０９、ｅｘ１１０　基地局
ｅｘ１１１　コンピュータ
ｅｘ１１２　ＰＤＡ
ｅｘ１１３、ｅｘ１１６　カメラ
ｅｘ１１４　カメラ付デジタル携帯電話（携帯電話）
ｅｘ１１５　ゲーム機
ｅｘ１１７　マイク
ｅｘ２００　デジタル放送用システム
ｅｘ２０１　放送局
ｅｘ２０２　放送衛星（衛星）
ｅｘ２０３　ケーブル
ｅｘ２０４、ｅｘ２０５、ｅｘ３５０　アンテナ
ｅｘ２１０　車
ｅｘ２１１　カーナビゲーション（カーナビ）
ｅｘ２１９　モニタ
ｅｘ２１５、ｅｘ２１６　記録メディア
ｅｘ２１７　セットトップボックス（ＳＴＢ）
ｅｘ２１８　リーダ／レコーダ
ｅｘ２２０　リモートコントローラ
ｅｘ２３０　情報トラック
ｅｘ２３１　記録ブロック
ｅｘ２３２　内周領域
ｅｘ２３３　データ記録領域
ｅｘ２３４　外周領域
ｅｘ３００　テレビ
ｅｘ３０１　チューナ
ｅｘ３０２、ｅｘ３５２　変調／復調部
ｅｘ３０３、ｅｘ３５３　多重／分離部
ｅｘ３０４、ｅｘ３５４　音声信号処理部
ｅｘ３０５、ｅｘ３５５　映像信号処理部
ｅｘ３０６、ｅｘ５０７　信号処理部
ｅｘ３０７　スピーカ
ｅｘ３０８、ｅｘ３５８　表示部
ｅｘ３０９　出力部
ｅｘ３１０、ｅｘ３５９、ｅｘ５０１　制御部
ｅｘ３１１、ｅｘ３６１、ｅｘ５０５　電源回路部
ｅｘ３１２　操作入力部
ｅｘ３１３　ブリッジ
ｅｘ３１４、ｅｘ３６４　スロット部
ｅｘ３１５　ドライバ
ｅｘ３１６　モデム
ｅｘ３１７　インタフェース部
ｅｘ３１８、ｅｘ３１９、ｅｘ３２０、ｅｘ３２１、ｅｘ４０４、ｅｘ５０８　バッファ
ｅｘ３５６　音声入力部
ｅｘ３５７　音声出力部
ｅｘ３６０　主制御部
ｅｘ３６２　操作入力制御部
ｅｘ３６３　カメラインタフェース部
ｅｘ３６５　カメラ部
ｅｘ３７０、ｅｘ５１０　バス
ｅｘ４００　情報再生／記録部
ｅｘ４０１　光ヘッド
ｅｘ４０２　変調記録部
ｅｘ４０３　再生復調部
ｅｘ４０５　ディスクモータ
ｅｘ４０６　サーボ制御部
ｅｘ４０７　システム制御部
ｅｘ５００　ＬＳＩ
ｅｘ５０２　ＣＰＵ
ｅｘ５０３　メモリコントローラ
ｅｘ５０４　ストリームコントローラ
ｅｘ５０６　ストリームＩ／Ｏ
ｅｘ５０９　ＡＶ　Ｉ／Ｏ
ｅｘ５１１　メモリ
ｅｘ５１２　駆動周波数制御部
ｅｘ８０１　復号処理部
ｅｘ８０２　復号処理部
ｅｘ８０３　駆動周波数切替え部
ｅｘ９０１、ｅｘ９０２、ｅｘ１００１、ｅｘ１００２、ｅｘ１００３　復号処理部

Claims

　画像データを圧縮符号化する画像符号化方法であって、
　前記画像データを既に符号化したフレームから予測する画像予測ステップと、
　前記画像データに含まれる符号化対象ブロックの相対位置情報を用いて、予測動きベクトルを予測する動きベクトル予測ステップと、
　前記相対位置情報と、前記予測動きベクトルとの差分を算出し、差分動きベクトルを取得する差分ステップと、
　複数のコンテキストから、前記差分動きベクトルを符号化するためのコンテキストを決定するコンテキスト区分決定ステップと、
　前記差分動きベクトルの符号化対象信号を２値化することで、２値信号を生成する２値化ステップと、
　前記コンテキスト区分決定ステップで決定した前記コンテキストに対応付けられた符号化確率情報を用いて、前記２値信号を算術符号化する算術符号化ステップと、
　前記２値化ステップで生成された前記２値信号に基づいて、前記符号化確率情報を更新する更新ステップとを含む
　画像符号化方法。
　前記画像符号化方法は、
　さらに、前記予測動きベクトルの候補を導出する予測動きベクトル候補導出ステップを含み、
　前記コンテキスト区分決定ステップでは、前記予測動きベクトルの候補の数によって、前記符号化確率情報を決定するコンテキストを決定する
　請求項１に記載の画像符号化方法。
　前記画像符号化方法は、
　前記コンテキスト区分決定ステップでは、前記予測動きベクトルの候補の数が小さい場合に、前記差分動きベクトルが大きくなることを示すコンテキストを選択し、前記予測動きベクトルの候補の数が大きい場合に、前記差分動きベクトルが小さくなることを示すコンテキストを選択する
　請求項２に記載の画像符号化方法。
　前記画像符号化方法は、
　さらに、既に符号化済みの周囲の差分動きベクトルを取得する周囲差分動きベクトル取得ステップを含み、
　前記コンテキスト区分決定ステップでは、前記周囲の差分動きベクトルの大きさによって、前記コンテキストを決定する、
　請求項１～３のいずれか１項に記載の画像符号化方法。
　前記画像符号化方法は、
　前記コンテキスト区分決定ステップでは、前記周囲の差分動きベクトルの大きさが大きい場合に、前記差分動きベクトルが大きくなることを示すコンテキストを選択し、前記周囲の差分動きベクトルの大きさが小さい場合に、前記差分動きベクトルが小さくなることを示すコンテキストを選択する
　請求項４に記載の画像符号化方法。
　前記画像符号化方法は、
　前記コンテキスト区分決定ステップでは、前記周囲の差分動きベクトルが無い場合に、前記差分動きベクトルが大きくなることを示すコンテキストを選択する
　請求項４または５に記載の画像符号化方法。