JP2017229103A

JP2017229103A - 復号方法および復号装置

Info

Publication number: JP2017229103A
Application number: JP2017194032A
Authority: JP
Inventors: 寿郎笹井; Toshiro Sasai; 西　孝啓; Takahiro Nishi; 孝啓西; 陽司柴原; Yoji Shibahara; 敏康杉尾; Toshiyasu Sugio; 京子谷川; Kyoko Tanigawa; 徹松延; Toru Matsunobu
Original assignee: Sun Patent Trust Inc
Current assignee: Sun Patent Trust Inc
Priority date: 2011-06-24
Filing date: 2017-10-04
Publication date: 2017-12-28
Anticipated expiration: 2032-06-21
Also published as: JP5999563B2; EP3522377A1; PL3309970T3; US20220329848A1; US20120328022A1; US20230353775A1; CA2806796C; KR20140032930A; US20140029673A1; EP3309969A1; AU2012274765A1; US10382779B2; JP2014014130A; EP4220966A1; ES2952761T3; CN107396107B; CN103004207A; EP2725796A1; JP5362129B2; JP5390727B1

Abstract

【課題】画像を構成する情報を効率的に処理する。
【解決手段】復号方法は、差分ベクトルの水平成分が０かどうかと垂直成分が０かどうかとの組み合わせを示すフラグを含み、差分ベクトルの水平成分と垂直成分とをそれぞれ示す第１の二値データと第２の二値データとを含む符号データを取得する取得ステップと、符号データを復号する復号ステップと、を含み、フラグには、水平成分と垂直成分がともに０の場合に、０が割り当てられ、水平成分が０ではなく垂直成分が０の場合に、１０が割り当てられ、水平成分が０であり垂直成分が０ではない場合に、１１０が割り当てられ、水平成分と垂直成分がともに０ではない場合に、１１１が割り当てられる。
【選択図】図１６Ｂ

Description

本発明は、動きベクトルを用いて画像を符号化する画像符号化方法に関する。

動きベクトルを用いて画像を符号化する画像符号化方法に関する技術として、非特許文献１および非特許文献２に記載された技術がある。

ＩＴＵ−ＴＲｅｃｏｍｍｅｎｄａｔｉｏｎＨ．２６４「Ａｄｖａｎｃｅｄｖｉｄｅｏｃｏｄｉｎｇｆｏｒｇｅｎｅｒｉｃａｕｄｉｏｖｉｓｕａｌｓｅｒｖｉｃｅｓ」、２０１０年３月ＪＣＴ−ＶＣ「ＷＤ３：ＷｏｒｋｉｎｇＤｒａｆｔ３ｏｆＨｉｇｈ−ＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ」、ＪＣＴＶＣ−Ｅ６０３、Ｍａｒｃｈ２０１１．

しかしながら、画像の非効率な符号化は、処理の遅延を招き、画像の復号にも影響を及ぼす。

そこで、本発明は、画像を構成する情報を効率的に符号化する画像符号化方法を提供することを目的とする。

上記目的を達成するため、本発明の一態様に係る画像符号化方法は、動きベクトルを用いて画像を符号化する画像符号化方法であって、前記動きベクトルの予測値である予測動きベクトルと前記動きベクトルとの差を示す差分ベクトルを符号化する符号化ステップを含み、前記符号化ステップでは、前記差分ベクトルの水平成分および垂直成分のうちの第１の成分の一部である第１の部分を符号化し、前記水平成分および前記垂直成分のうち、前記第１の成分とは異なる第２の成分の一部である第２の部分を符号化し、前記第１の成分の一部であり、前記第１の部分とは異なる部分である第３の部分を符号化し、前記第２の成分の一部であり、前記第２の部分とは異なる部分である第４の部分を符号化し、前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分の順で前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分を含む符号列を生成する。

また、本発明の一態様に係る符号化復号装置は、符号化装置と復号装置とを備える符号化復号装置であって、前記符号化装置は、第１画像の予測に用いられる第１動きベクトルと前記第１動きベクトルの予測値である第１予測動きベクトルとの差を示す第１差分ベクトルをビットストリームに符号化する符号化部を備え、前記符号化部は、前記第１差分ベクトルを、前記第１差分ベクトルの水平成分と垂直成分とをそれぞれ示す第１の二値データと第２の二値データとに、二値化し、前記第１の二値データに含まれる、第１の部分および前記第１の部分とは異なる第２の部分と、前記第２の二値データに含まれる、第３の部分および前記第３の部分とは異なる第４の部分とを、それぞれ、符号化済み第１の部分と、符号化済み第２の部分と、符号化済み第３の部分と、符号化済み第４の部分とに符号化し、前記ビットストリームに、前記符号化済み第１の部分と、前記符号化済み第３の部分と、前記符号化済み第２の部分と、前記符号化済み第４の部分とを、この順で配置し、前記復号装置は、第２画像の予測に用いられる第２動きベクトルと前記第２動きベクトルの予測である第２予測動きベクトルとの差を示す第２差分ベクトルを復号する復号部を備え、前記復号部は、前記第２差分ベクトルの水平成分と垂直成分とをそれぞれ示す第３の二値データと第４の二値データとを含む符号データを取得し、前記符号データから、前記第３の二値データに含まれる、第５の部分および前記第５の部分とは異なる第７の部分と、前記第４の二値データに含まれる、第６の部分および前記第６の部分とは異なる第８の部分とを、前記第５の部分、前記第６の部分、前記第７の部分、前記第８の部分の順に復号する符号化復号装置でもよい。

また、本発明の一態様に係る復号方法は、画像の予測に用いられる動きベクトルと前記動きベクトルの予測である予測動きベクトルとの差を示す差分ベクトルを復号する復号方法であって、前記差分ベクトルの水平成分が０かどうかと垂直成分が０かどうかとの組み合わせを示すフラグを含み、前記差分ベクトルの水平成分と垂直成分とをそれぞれ示す第１の二値データと第２の二値データとを含む符号データを取得する取得ステップと、前記符号データを復号する復号ステップと、を含み、前記フラグには、前記水平成分と前記垂直成分がともに０の場合に、０が割り当てられ、前記水平成分が０ではなく前記垂直成分が０の場合に、１０が割り当てられ、前記水平成分が０であり前記垂直成分が０ではない場合に、１１０が割り当てられ、前記水平成分と前記垂直成分がともに０ではない場合に、１１１が割り当てられる復号方法でもよい。

なお、これらの全般的または具体的な態様は、装置、システム、集積回路、コンピュータプログラム、または、コンピュータ読み取り可能なＣＤ−ＲＯＭなどの非一時的な記録媒体で実現されてもよく、装置、システム、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。

本発明により、画像を構成する情報が効率的に符号化される。

図１は、従来の差分ベクトル復号方法の構成の一例を示すブロック図である。図２は、従来の差分ベクトル復号方法の動作の流れを示すフローチャートである。図３は、従来の算術復号方法のコンテキスト適応算術復号処理を示すフローチャートである。図４は、従来の算術復号方法のバイパス算術復号処理を示すフローチャートである。図５は、従来の算術復号方法の正規化処理を示すフローチャートである。図６は、差分ベクトルの二値化列の例を示す模式図である。図７は、実施の形態１に係る復号装置の機能構成を示すブロック図である。図８は、実施の形態１に係る復号装置の処理動作を示すフローチャートである。図９は、実施の形態１における実行処理の一例を説明するための図である。図１０は、実施の形態１に係る画像復号装置の構成の一例を示すブロック図である。図１１Ａは、実施の形態１の変形例に係る二値化符号列の一例を示す表である。図１１Ｂは、実施の形態１の変形例に係る復号装置の処理動作を示すフローチャートである。図１２は、実施の形態２に係る符号化装置の処理動作を示すフローチャートである。図１３は、データ構造の一例を示すシンタックス表である。図１４は、実施の形態２に係る画像符号化装置の構成の一例を示すブロック図である。図１５Ａは、実施の形態３に係る画像符号化装置の構成の一例を示すブロック図である。図１５Ｂは、実施の形態３に係る画像符号化装置の処理動作を示すフローチャートである。図１６Ａは、実施の形態３に係る画像復号装置の構成の一例を示すブロック図である。図１６Ｂは、実施の形態３に係る画像復号装置の処理動作を示すフローチャートである。図１７は、差分ベクトルに対応する符号列のデータ構造の一例を示すシンタックス表である。図１８は、コンテンツ配信サービスを実現するコンテンツ供給システムの全体構成図である。図１９は、デジタル放送用システムの全体構成図である。図２０は、テレビの構成例を示すブロック図である。図２１は、光ディスクである記録メディアに情報の読み書きを行う情報再生／記録部の構成例を示すブロック図である。図２２は、光ディスクである記録メディアの構造例を示す図である。図２３Ａは、携帯電話の一例を示す図である。図２３Ｂは、携帯電話の構成例を示すブロック図である。図２４は、多重化データの構成を示す図である。図２５は、各ストリームが多重化データにおいてどのように多重化されているかを模式的に示す図である。図２６は、ＰＥＳパケット列に、ビデオストリームがどのように格納されるかを更に詳しく示した図である。図２７は、多重化データにおけるＴＳパケットとソースパケットの構造を示す図である。図２８は、ＰＭＴのデータ構成を示す図である。図２９は、多重化データ情報の内部構成を示す図である。図３０は、ストリーム属性情報の内部構成を示す図である。図３１は、映像データを識別するステップを示す図である。図３２は、各実施の形態の動画像符号化方法および動画像復号化方法を実現する集積回路の構成例を示すブロック図である。図３３は、駆動周波数を切り替える構成を示す図である。図３４は、映像データを識別し、駆動周波数を切り替えるステップを示す図である。図３５は、映像データの規格と駆動周波数を対応づけたルックアップテーブルの一例を示す図である。図３６Ａは、信号処理部のモジュールを共有化する構成の一例を示す図である。図３６Ｂは、信号処理部のモジュールを共有化する構成の他の一例を示す図である。

（本発明の基礎となった知見）
インターネットを介したビデオ会議、デジタルビデオ放送、及び映像コンテンツのストリーミングを含む、例えば、ビデオ・オン・デマンドタイプのサービスのためのアプリケーションの数は右肩上がりであり、これらのアプリケーションは、映像情報の送信に頼っている。映像データが送信され、又は、記録される時、かなりの量のデータは、限られたバンド幅の従来の伝送路を通って送信され、又は、限られたデータ容量の従来の記憶媒体に記憶される。従来の伝送チャネル及び記憶媒体に映像情報を送信及び記憶するためには、デジタルデータの量を圧縮又は削減することが不可欠である。

そこで、映像データの圧縮のために、複数の映像符号化規格が開発されている。このような映像符号化規格は、例えば、Ｈ．２６ｘで示されるＩＴＵ−Ｔ規格、及び、ＭＰＥＧ−ｘで示されるＩＳＯ／ＩＥＣ規格である。最新かつ最も進んだ映像符号化規格は、現在、Ｈ．２６４／ＭＰＥＧ−４ＡＶＣで示される規格である（非特許文献１参照）。

これらの規格のほとんどの基礎をなす符号化アプローチは、以下の（ａ）〜（ｄ）で示される主な段階を含む予測符号化に基づいている。（ａ）映像フレームのそれぞれをブロックレベルでデータ圧縮するために、映像フレームを画素のブロックに分割する。（ｂ）先に符号化された映像データから個々のブロックを予測することで、時間的及び空間的冗長性を特定する。（ｃ）映像データから予測データを減ずることで、特定された冗長性を除去する。（ｄ）フーリエ変換、量子化、及び、エントロピー符号化によって、残りのデータ（残差ブロック）を圧縮する。

上記の（ａ）の工程において、現在の映像符号化規格では、各マクロブロックを予測するのに用いられる予測モードが異なる。ほとんどの映像符号化規格は、前に符号化及び復号されたフレームから映像データを予測するために動き検出及び動き補償を用いる（インターフレーム予測）。あるいは、ブロックデータは、同じフレームの隣接するブロックから外挿されてもよい（イントラフレーム予測）。

例えば、符号化対象ピクチャをインターフレーム予測で符号化する場合、画像符号化装置は、表示順で符号化対象ピクチャの前方または後方の符号化済みピクチャを参照ピクチャとして用いる。そして、画像符号化装置は、その参照ピクチャに対する符号化対象ピクチャの動き検出を行うことにより、各ブロックの動きベクトルを導出する。画像符号化装置は、このように導出された動きベクトルを用いて動き補償を行うことにより、予測画像データを生成する。そして、画像符号化装置は、生成された予測画像データと、符号化対象ピクチャの画像データとの差分を符号化することにより、時間方向の冗長性を削減する。

また、ＢピクチャまたはＰピクチャにおける符号化対象ブロックの動きベクトルを符号化する時に予測動きベクトル指定モードを用いることが検討されている（非特許文献２）。予測動きベクトル指定モードを用いる画像符号化装置は、符号化対象ブロックに隣接する符号化済みブロックに基づいて、予測動きベクトルの候補を複数生成する。そして、画像符号化装置は、生成された複数の候補の中から予測動きベクトルを選択する。

画像符号化装置は、選択された予測動きベクトルを用いて、符号化対象ブロックの動きベクトルを符号化する。具体的には、符号化対象ブロックの動きベクトルと、選択された予測動きベクトルとの差分ベクトルを可変長符号化する。

また、画像符号化装置は、選択された予測動きベクトルのインデックス（予測動きベクトルインデックスとも呼ばれる）を符号化ビットストリームに追加する。これにより、画像復号装置は、復号時に、符号化時に選択された予測動きベクトルと同じ予測動きベクトルを選択できる。

なお、より具体的に差分ベクトルの可変長復号方法について図１および図２を用いて説明する。図１は、従来の差分ベクトルの可変長復号方法の構成の一例を示すブロック図である。図２は、従来の差分ベクトルの可変長復号方法の動作の流れの一例を示すフローチャートである。

また、差分ベクトル値は、二値化され、二値化列を構成する。二値化列は、正負符号を示すフラグ、差分ベクトルの絶対値のＴＨ値（閾値）以下の部分に対応するプリフィックス部、および、ＴＨ値より上の部分に対応するサフィックス部に分けられる（図６参照）。

正負符号は＋または−である。例えば、正負符号が＋である場合、正負符号を示すフラグは０である。正負符号が−である場合、正負符号を示すフラグは１である。また、例えば、ＴＨ値は８である。この場合、プリフィックス部は、差分ベクトルの絶対値の２値化列において、８以下を構成する部分に対応する。そして、サフィックス部は、差分ベクトルの絶対値の２値化列において、９以上を構成する部分に対応する。

正負符号のフラグ、プリフィックス部およびサフィックス部のそれぞれに対して、算術符号化復号方法が異なる。算術符号化復号方法については後述する。

差分ベクトル可変長復号部Ａ００は差分ベクトル情報を含むビットストリームＢＳを取得し、差分ベクトル復元制御部Ａ０１と差分ベクトル０判定部Ａ０２に対して入力する。なお、ここで差分ベクトル復元制御部Ａ０１は、取得した差分ベクトル情報のＸ成分（水平成分）、Ｙ成分（垂直成分）の順番に取り込み、復号処理中の差分ベクトル情報がＸ成分かＹ成分かどうかを管理する。

差分ベクトル０判定部Ａ０２は、取得したビットストリームより差分ベクトルのＸ成分が０かどうかを示すフラグを復号する（ステップＳＢ００）。差分ベクトルのＸ成分が０ではない場合（ステップＳＢ０１でＮＯ）、差分ベクトルプリフィックス部復号部Ａ０３で、差分ベクトルのＸ成分のプリフィックス部分を復号する（ステップＳＢ０２）。次に、差分ベクトルのＸ成分のサフィックス部がある場合（ステップＳＢ０３でＹＥＳ）、差分ベクトルサフィックス部復号部Ａ０４で、差分ベクトルのＸ成分のサフィックス部を復号する（ＳＢ０４）。サフィックス部が無い場合に（ＳＢ０３でＮＯ）、サフィックス復号処理をスキップする。次に差分ベクトル正負符号復号部Ａ０５において、差分ベクトルのＸ成分の正負符号の復号を行い、差分ベクトル復元部Ａ０６において、差分ベクトルのＸ成分を復元しセットする（ＳＢ０５）。

一方、差分ベクトルのＸ成分が０である場合（ステップＳＢ０１でＹＥＳ）、差分ベクトル復元部Ａ０６において、差分ベクトルのＸ成分に０をセットする（ステップＳＢ０６）。ここで、差分ベクトル復元制御部Ａ０１よりスイッチＡ０７がＸ成分であることを示す側（図１中上側の端子）に切替えられ、差分ベクトルのＸ成分を出力する。

次にＸ成分と同様に、差分ベクトルのＹ成分を復号する。なお、以降の動作の手順では、ステップＳＢ００に対しステップＳＢ０７、ステップＳＢ０１に対しステップＳＢ０８、ステップＳＢ０２に対しステップＳＢ０９、ステップＳＢ０３に対しステップＳＢ１０、ステップＳＢ０４に対しステップＳＢ１１、ステップＳＢ０５に対しステップＳＢ１２、ステップＳＢ０６に対しステップＳＢ１３が対応する。これらは、成分が異なることを除いて同じ動作であるため、詳細説明は省略する。

全てのステップが終了した段階で、差分ベクトルのＸ成分、Ｙ成分が復元される。

次に、予測画像データと符号化対象ピクチャの画像データとの差分、および予測動きベクトルと動きベクトルとの差分ベクトルなどの可変長符号化について説明する。Ｈ．２６４では、可変長符号化方法の１つとして、コンテキスト適応型算術符号化（ＣＡＢＡＣ：ＣｏｎｔｅｘｔＡｄａｐｔｉｖｅＢｉｎａｒｙＡｒｉｔｈｍｅｔｉｃＣｏｄｉｎｇ）がある。このＣＡＢＡＣについて、図３、図４、図５を用いて以下に説明する。

図３は、前述の従来のコンテキスト適応の算術復号処理のフローを示す図である。なお、この図面は非特許文献１より抜粋したものであり、特に説明がない限り、非特許文献１に記載の通りである。

算術復号処理は、まず、信号種別に基づいて決められるコンテキスト（ｃｔｘＩｄｘ）を入力する。

次に、現時点での算術復号装置内の状態を示すパラメタｃｏｄＩＲａｎｇｅから導出される値ｑＣｏｄＩＲａｎｇｅＩｄｘを算出し、ｃｔｘＩｄｘに対応した状態値であるｐＳｔａｔｅＩｄｘ値を取得する。その２つの値により、テーブル（ｒａｎｇｅＴａｂｌｅＬＰＳ）を参照することにより、ｃｏｄＩＲａｎｇｅＬＰＳを取得する。なおこのｃｏｄＩＲａｎｇｅＬＰＳは、ＬＰＳ（シンボル０および１のうち発生確率の低いシンボル）が発生した場合の算術復号装置内の状態を示す第１のパラメタｃｏｄＩＲａｎｇｅに対応する値を示す。

また、ｃｏｄＩＲａｎｇｅには、現在のｃｏｄＩＲａｎｇｅから前述のｃｏｄＩＲａｎｇｅＬＰＳを引いた値を入れておく（ステップＳＣ０１）。次に、算出したｃｏｄＩＲａｎｇｅと、算術復号装置内の状態を示す第２のパラメタｃｏｄＩＯｆｆｓｅｔとを比較する（ステップＳＣ０２）。

ｃｏｄＩＯｆｆｓｅｔが等しいか大きい場合（ＳＣ０２でＹＥＳ）、ＬＰＳのシンボルが発生したと判断する。そして、復号出力値であるｂｉｎＶａｌに、ｖａｌＭＰＳ（シンボル０および１のうち発生確率の高いシンボルを示すＭＰＳの具体的な値０もしくは１）とは異なる値（ｖａｌＭＰＳ＝１の場合は０、ｖａｌＭＰＳ＝０の場合は１）をセットする。また、算術復号装置内の状態を示す第２のパラメタｃｏｄＩＯｆｆｓｅｔには、ｃｏｄＩＲａｎｇｅを引いた値をセットする。算術復号装置内の状態を示す第１のパラメタｃｏｄＩＲａｎｇｅには、ＬＰＳが発生したため、ステップＳＣ０１で算出したｃｏｄＩＲａｎｇｅＬＰＳの値をセットする（ステップＳＣ０３）。

なお、ここで前述のｃｔｘＩｄｘに対応した状態値であるｐＳｔａｔｅＩｄｘ値が０である場合（ステップＳＣ０５でＹＥＳ）は、ＬＰＳの確率がＭＰＳの確率を上回る場合を示す。そのため、ｖａｌＭＰＳを入れ替える（ｖａｌＭＰＳ＝１の場合は０、ｖａｌＭＰＳ＝０の場合は１）（ステップＳＣ０６）。一方、ｐＳｔａｔｅＩｄｘ値が０でない場合（ステップＳＣ０５でＮＯ）、ｐＳｔａｔｅＩｄｘ値をＬＰＳが発生した場合の変換テーブルｔｒａｎｓＩｄｘＬＰＳに基づいて更新する（ステップＳＣ０７）。

また、ｃｏｄＩＯｆｆｓｅｔが小さい場合（ＳＣ０２でＮＯ）、ＭＰＳのシンボルが発生したと判断する。そして、復号出力値であるｂｉｎＶａｌに、ｖａｌＭＰＳをセットし、ｐＳｔａｔｅＩｄｘ値をＭＰＳが発生した場合の変換テーブルｔｒａｎｓＩｄｘＭＰＳに基づいて更新する（ステップＳＣ０４）。

最後に、正規化処理（ＲｅｎｏｒｍＤ）を行い（ステップＳＣ０８）、算術復号を終了する。

このようにコンテキスト適応算術復号処理では、２値シンボルの発生確率であるシンボル発生確率をコンテキストインデックスに対応づけて複数保持し、条件に応じて（例えば隣接ブロックの値を参照して）切替える。そのため、処理の順番を維持する必要がある。

図４は、従来のバイパス処理用の算術復号処理のフローを示す図である。なお、この図面は非特許文献１より抜粋したものであり、特に説明がない限り、非特許文献１に記載の通りである。

まず、現時点での算術復号装置内の状態を示す第２のパラメタｃｏｄＩＯｆｆｓｅｔを左シフト（２倍）し、ビットストリームから１ビット読出す。その読出しビットが１であれば、２倍されたｃｏｄＩＯｆｆｓｅｔに１を加える。０であればそのまま（２倍）の値をセットする（ＳＤ０１）。

次に、ｃｏｄＩＯｆｆｓｅｔが算術復号装置内の状態を示す第１のパラメタｃｏｄＩＲａｎｇｅと等しいもしくは大きい場合には（ＳＤ０２でＹＥＳ）、復号出力値であるｂｉｎＶａｌに「１」をセットする。そして、ｃｏｄＩＯｆｆｓｅｔにｃｏｄＩＲａｎｇｅを引いた値をセットする（ステップＳＤ０３）。一方、ｃｏｄＩＯｆｆｓｅｔが算術復号装置内の状態を示す第１のパラメタｃｏｄＩＲａｎｇｅより小さい場合には（ＳＤ０２でＮＯ）、復号出力値であるｂｉｎＶａｌに「０」をセットする（ステップＳＤ０４）。

図５は、図３のステップＳＣ０８で示した正規化処理（ＲｅｎｏｒｍＤ）を詳しく説明するためのフローチャートである。この図面は非特許文献１より抜粋したものであり、特に説明がない限り、非特許文献１に記載の通りである。

算術復号処理で算術復号装置内の状態を示す第１のパラメタｃｏｄＩＲａｎｇｅが０ｘ１００（１６進：２５６（１０進））よりも小さくなった場合（ステップＳＥ０１でＹＥＳ）、ｃｏｄＩＲａｎｇｅを左シフト（２倍）し、算術復号装置内の状態を示す第２のパラメタｃｏｄＩＯｆｆｓｅｔを左シフト（２倍）する。そして、ビットストリームから１ビット読出す。その読出しビットが１であれば、２倍されたｃｏｄＩＯｆｆｓｅｔに１を加える。０であればそのまま（２倍）の値をセットする（ＳＥ０２）。

この処理で、最終的にｃｏｄＩＲａｎｇｅが２５６以上になった段階で（ステップＳＥ０１でＮＯ）、終了する。

上記の図３、図４および図５に示された処理を行うことにより、差分ベクトルの算術復号を行う。

しかしながら、従来、予測動きベクトルと動きベクトルとの差分ベクトルが算術符号化される場合において、差分ベクトルのＸ成分とＹ成分を順番に符号化している。つまり、符号化ストリーム上には、差分ベクトルのＸ成分と差分ベクトルのＹ成分とが別々に格納されている。つまり、符号化時には、コンテキスト適応算術符号化と、バイパス符号化とが、復号時には、コンテキスト適応算術復号と、バイパス復号とが、Ｘ成分およびＹ成分のそれぞれについて、交互に実行される。よって、バイパス符号化およびバイパス復号の利点である並列処理が十分にできないという課題がある。

そこで、本発明の一態様に係る画像符号化方法は、動きベクトルを用いて画像を符号化する画像符号化方法であって、前記動きベクトルの予測値である予測動きベクトルと前記動きベクトルとの差を示す差分ベクトルを符号化する符号化ステップを含み、前記符号化ステップでは、前記差分ベクトルの水平成分および垂直成分のうちの第１の成分の一部である第１の部分を符号化し、前記水平成分および前記垂直成分のうち、前記第１の成分とは異なる第２の成分の一部である第２の部分を符号化し、前記第１の成分の一部であり、前記第１の部分とは異なる部分である第３の部分を符号化し、前記第２の成分の一部であり、前記第２の部分とは異なる部分である第４の部分を符号化し、前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分の順で前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分を含む符号列を生成する。

これにより、差分ベクトルの水平成分の一部と、差分ベクトルの垂直成分の一部とが、符号列において組み合わされる。例えば、水平成分のうちバイパス復号が用いられる部分と、垂直成分のうちバイパス復号が用いられる部分とが、符号列において組み合わされた場合、復号処理の並列度が上がる可能性がある。すなわち、水平成分の一部と垂直成分の一部とが組み合わされることで、差分ベクトルが効率的に符号化される。

例えば、前記符号化ステップでは、前記第１の成分の正負の符号を含む前記第３の部分を符号化し、前記第２の成分の正負の符号を含む前記第４の部分を符号化し、前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分の順で前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分を含む前記符号列を生成してもよい。

これにより、水平成分の正負の符号と、垂直成分の正負の符号とが、符号列において組み合わされる。典型的には、これらの正負の符号の復号にバイパス復号が用いられる。したがって、復号処理の並列度が上がる可能性がある。

また、例えば、前記符号化ステップでは、前記第１の成分が０であるか否かを示すフラグを含む前記第１の部分を符号化し、前記第２の成分が０であるか否かを示すフラグを含む前記第２の部分を符号化し、前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分の順で前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分を含む前記符号列を生成してもよい。

これにより、水平成分が０であるか否かを示すフラグと、垂直成分が０であるか否かを示すフラグとが、符号列において組み合わされる。典型的には、これらのフラグの復号にコンテキスト適応算術復号が用いられる。これらのフラグが符号列において組み合わされることにより、バイパス復号が用いられる別の複数の部分が符号列において組み合わされる。したがって、復号処理の並列度が上がる可能性がある。

また、例えば、前記符号化ステップでは、前記第１の成分の絶対値が閾値よりも大きい場合、前記第１の成分の絶対値と前記閾値との差を含む前記第３の部分を符号化し、前記第２の成分の絶対値が前記閾値よりも大きい場合、前記第２の成分の絶対値と前記閾値との差を含む前記第４の部分を符号化し、前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分の順で前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分を含む前記符号列を生成してもよい。

これにより、水平成分の絶対値と閾値との差、および、垂直成分の絶対値と閾値との差が、符号列において組み合わされる。典型的には、これらの差の復号にバイパス復号が用いられる。したがって、復号処理の並列度が上がる可能性がある。

また、例えば、前記符号化ステップでは、符号化済みデータに基づいて更新された変動確率を用いる算術符号化であるコンテキスト適応算術符号化によって、前記第１の部分および前記第２の部分を符号化し、前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分の順で前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分を含む前記符号列を生成してもよい。

これにより、コンテキスト適応算術復号が用いられる複数の部分が符号列において組み合わされる。この場合、バイパス復号が用いられる別の複数の部分が符号列において組み合わされる。したがって、復号処理の並列度が上がる可能性がある。

また、例えば、前記符号化ステップでは、予め定められた固定確率を用いる算術符号化であるバイパス符号化によって、前記第３の部分および前記第４の部分を符号化し、前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分の順で前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分を含む前記符号列を生成してもよい。

これにより、バイパス復号が用いられる複数の部分が符号列において組み合わされる。したがって、復号処理の並列度が上がる可能性がある。

また、例えば、前記符号化ステップでは、前記第３の部分および前記第４の部分を並行して符号化してもよい。

これにより、水平成分の一部と、垂直成分の一部とが、並行して符号化される。したがって、差分ベクトルが効率的に符号化される。

また、例えば、前記符号化ステップでは、第１の規格に準拠する第１の符号化処理、または、第２の規格に準拠する第２の符号化処理に、符号化処理を切替え、切替えられた前記符号化処理が準拠する前記第１の規格または前記第２の規格を示す識別情報を含むビットストリームを生成し、前記符号化処理が前記第１の符号化処理に切替えられた場合、前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分の順で前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分を含む前記符号列を生成し、前記第１の規格を示す前記識別情報と前記符号列とを含む前記ビットストリームを生成してもよい。

これにより、差分ベクトルの水平成分の一部と、差分ベクトルの垂直成分の一部とが、符号列において組み合わされているか否かが、復号側に通知される。したがって、復号処理の適切な切替えが可能である。

また、本発明の一態様に係る画像復号方法は、動きベクトルを用いて画像を復号する画像復号方法であって、前記動きベクトルの予測値である予測動きベクトルと前記動きベクトルとの差を示す差分ベクトルを復号する復号ステップを含み、前記復号ステップでは、（ｉ）前記差分ベクトルの水平成分および垂直成分のうちの第１の成分の一部である第１の部分、（ｉｉ）前記水平成分および前記垂直成分のうち、前記第１の成分とは異なる第２の成分の一部である第２の部分、（ｉｉｉ）前記第１の成分の一部であり、前記第１の部分とは異なる部分である第３の部分、および、（ｉｖ）前記第２の成分の一部であり、前記第２の部分とは異なる部分である第４の部分の順で前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分を含む符号列を取得し、前記符号列に含まれる前記第１の部分を復号し、前記符号列に含まれる前記第２の部分を復号し、前記符号列に含まれる前記第３の部分を復号し、前記符号列に含まれる前記第４の部分を復号する画像復号方法でもよい。

これにより、差分ベクトルの水平成分の一部と、差分ベクトルの垂直成分の一部とが組み合わされた符号列が取得される。例えば、水平成分のうちバイパス復号が用いられる部分と、垂直成分のうちバイパス復号が用いられる部分とが、符号列において組み合わされている場合、復号処理の並列度が上がる可能性がある。すなわち、水平成分の一部と垂直成分の一部とが組み合わされた符号列によって、差分ベクトルが効率的に復号される。

例えば、前記復号ステップでは、（ｉ）前記第１の部分、（ｉｉ）前記第２の部分、（ｉｉｉ）前記第１の成分の正負の符号を含む前記第３の部分、および、（ｉｖ）前記第２の成分の正負の符号を含む前記第４の部分の順で前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分を含む前記符号列を取得し、前記符号列に含まれる前記第１の部分を復号し、前記符号列に含まれる前記第２の部分を復号し、前記符号列に含まれる前記第３の部分を復号し、前記符号列に含まれる前記第４の部分を復号してもよい。

これにより、水平成分の正負の符号と、垂直成分の正負の符号とが組み合わされた符号列が取得される。典型的には、これらの正負の符号の復号にバイパス復号が用いられる。したがって、復号処理の並列度が上がる可能性がある。

また、例えば、前記復号ステップでは、（ｉ）前記第１の成分が０であるか否かを示すフラグを含む前記第１の部分、（ｉｉ）前記第２の成分が０であるか否かを示すフラグを含む前記第２の部分、（ｉｉｉ）前記第３の部分、および、（ｉｖ）前記第４の部分の順で前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分を含む前記符号列を取得し、前記符号列に含まれる前記第１の部分を復号し、前記符号列に含まれる前記第２の部分を復号し、前記符号列に含まれる前記第３の部分を復号し、前記符号列に含まれる前記第４の部分を復号してもよい。

これにより、水平成分が０であるか否かを示すフラグと、垂直成分が０であるか否かを示すフラグとが組み合わされた符号列が取得される。典型的には、これらのフラグの復号にコンテキスト適応算術復号が用いられる。これらのフラグが符号列において組み合わされることにより、バイパス復号が用いられる別の複数の部分が符号列において組み合わされる。したがって、復号処理の並列度が上がる可能性がある。

また、例えば、前記復号ステップでは、（ｉ）前記第１の部分、（ｉｉ）前記第２の部分、（ｉｉｉ）前記第１の成分の絶対値が閾値よりも大きい場合に前記第１の成分の絶対値と前記閾値との差を含む前記第３の部分、および、（ｉｖ）前記第２の成分の絶対値が前記閾値よりも大きい場合に前記第２の成分の絶対値と前記閾値との差を含む前記第４の部分の順で前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分を含む前記符号列を取得し、前記符号列に含まれる前記第１の部分を復号し、前記符号列に含まれる前記第２の部分を復号し、前記符号列に含まれる前記第３の部分を復号し、前記符号列に含まれる前記第４の部分を復号してもよい。

これにより、水平成分の絶対値と閾値との差、および、垂直成分の絶対値と閾値との差が組み合わされた符号列が取得される。典型的には、これらの差の復号にバイパス復号が用いられる。したがって、復号処理の並列度が上がる可能性がある。

また、例えば、前記復号ステップでは、（ｉ）復号済みデータに基づいて更新された変動確率を用いる算術復号であるコンテキスト適応算術復号によって復号される前記第１の部分、（ｉｉ）前記コンテキスト適応算術復号によって復号される前記第２の部分、（ｉｉｉ）前記第３の部分、および、（ｉｖ）前記第４の部分の順で前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分を含む前記符号列を取得し、前記符号列に含まれる前記第１の部分を前記コンテキスト適応算術復号によって復号し、前記符号列に含まれる前記第２の部分を前記コンテキスト適応算術復号によって復号し、前記符号列に含まれる前記第３の部分を復号し、前記符号列に含まれる前記第４の部分を復号してもよい。

これにより、コンテキスト適応算術復号が用いられる複数の部分が組み合わされた符号列が取得される。この場合、バイパス復号が用いられる別の複数の部分が符号列において組み合わされる。したがって、復号処理の並列度が上がる可能性がある。

また、例えば、前記復号ステップでは、（ｉ）前記第１の部分、（ｉｉ）前記第２の部分、（ｉｉｉ）予め定められた固定確率を用いる算術復号であるバイパス復号によって復号される前記第３の部分、および、（ｉｖ）前記バイパス復号によって復号される前記第４の部分の順で前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分を含む前記符号列を取得し、前記符号列に含まれる前記第１の部分を復号し、前記符号列に含まれる前記第２の部分を復号し、前記符号列に含まれる前記第３の部分を前記バイパス復号によって復号し、前記符号列に含まれる前記第４の部分を前記バイパス復号によって復号してもよい。

これにより、バイパス復号が用いられる複数の部分が組み合わされた符号列が取得される。したがって、復号処理の並列度が上がる可能性がある。

また、例えば、前記復号ステップでは、前記第３の部分および前記第４の部分を並行して復号してもよい。

これにより、水平成分の一部と、垂直成分の一部とが、並行して復号される。したがって、差分ベクトルが効率的に復号される。

また、例えば、前記復号ステップでは、第１の規格または第２の規格を示す識別情報を含むビットストリームを取得し、前記識別情報に基づいて、前記第１の規格に準拠する第１の復号処理、または、前記第２の規格に準拠する第２の復号処理に、復号処理を切替え、前記復号処理が前記第１の復号処理に切替えられた場合、前記ビットストリームから前記符号列を取得し、前記符号列に含まれる前記第１の部分を復号し、前記符号列に含まれる前記第２の部分を復号し、前記符号列に含まれる前記第３の部分を復号し、前記符号列に含まれる前記第４の部分を復号してもよい。

これにより、差分ベクトルの水平成分の一部と、差分ベクトルの垂直成分の一部とが、符号列において組み合わされているか否かに応じて、復号処理が適切に切替えられる。

さらに、これらの全般的または具体的な態様は、装置、システム、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なＣＤ−ＲＯＭなどの非一時的な記録媒体で実現されてもよく、装置、システム、集積回路、コンピュータプログラムまたは記録媒体の任意な組み合わせで実現されてもよい。

以下、本発明の一態様に係る画像符号化方法および画像復号方法について、図面を用いて詳細に説明する。なお、以下で説明する実施の形態は、いずれも本発明の一具体例を示す。つまり、以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置及び接続形態、ステップ、ステップの順序などは、一例であり、本発明を限定する趣旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。

（実施の形態１）
図７は、実施の形態１に係る差分ベクトル復号部１００の機能構成を示すブロック図である。

本実施の形態に係る差分ベクトル復号部１００は、プリフィックス部復号部１１０、サフィックス部復号部１２０、差分ベクトル復元制御部１０１、および、差分ベクトル復元部１０６で構成される。このうち、プリフィックス部復号部１１０は、差分ベクトル０判定部１０２および差分ベクトルプリフィックス部復号部１０３で構成される。また、サフィックス部復号部１２０は、差分ベクトルサフィックス部復号部１０４および差分ベクトル正負符号復号部１０５で構成される。そして、差分ベクトル復号部１００は、差分ベクトルのＸ成分ＭＶＤＸとＹ成分ＭＶＤＹの情報をビットストリームＢＳから復元する。

本実施の形態の差分ベクトル復号部１００の動作について、図８を用いて詳しく説明する。図８は、本実施の形態に係る差分ベクトル復号部１００の動作の流れの一例を示すフローチャートである。

まず、差分ベクトル０判定部１０２は、取得したビットストリームより、差分ベクトルのＸ成分が０かどうかを示すフラグを復号する（Ｓ２００）。ここで差分ベクトルのＸ成分が０ではない場合、（Ｓ２０１でＮＯ）、差分ベクトルプリフィックス部復号部１０３により、差分ベクトルのＸ成分のプリフィックス部を復号する（Ｓ２０２）。一方、差分ベクトルのＸ成分が０である場合は（Ｓ２０１でＹＥＳ）、差分ベクトルのＸ成分に０をセットしておく（Ｓ２０３）。

次にループを戻り差分ベクトル０判定部１０２は、差分ベクトルのＹ成分が０かどうかを示すフラグを復号する（Ｓ２０４）。ここで差分ベクトルのＹ成分が０ではない場合、（Ｓ２０５でＮＯ）、差分ベクトルプリフィックス部復号部１０３により、差分ベクトルのＹ成分のプリフィックス部を復号する（Ｓ２０６）。一方、差分ベクトルのＹ成分が０である場合は（Ｓ２０５でＹＥＳ）、差分ベクトルのＹ成分に０をセットしておく（Ｓ２０７）。なお、ここまでの処理が差分ベクトルプリフィックス部復号部１０３の動作（Ｓ２８０）である。

次に、復号済みの差分ベクトルのＸ成分の情報により、Ｘ成分が０ではなく（Ｓ２０８でＮＯ）、サフィックス部があると判定される場合（Ｓ２０９でＹＥＳ）、差分ベクトルサフィックス部復号部１０４は、ビットストリームから差分ベクトルのＸ成分のサフィックス部を復号する（Ｓ２１０）。なお、サフィックス部が無い場合には（Ｓ２０９でＮＯ）、サフィックス部の復号処理をスキップする。ここでサフィックス部の有無については、例えば図６のような二値化列でプリフィックス部とサフィックス部が分かれているため、プリフィックス部が全て１の場合に、サフィックス部があると判断する。

次に、差分ベクトル正負符号復号部１０５は、ビットストリームから差分ベクトルの正負符号を復号し、差分ベクトル復元部１０６により、差分ベクトルのＸ成分を復元する（Ｓ２１１）。一方、Ｘ成分が０である場合には（Ｓ２０８でＹＥＳ）、既に差分ベクトルのＸ成分は復元できているため、Ｘ成分のサフィックス部の復号処理をスキップする。

次に、復号済みの差分ベクトルのＹ成分の情報により、Ｙ成分が０ではなく（Ｓ２１２でＮＯ）、サフィックス部があると判定される場合（Ｓ２１３でＹＥＳ）、差分ベクトルサフィックス部復号部１０４は、ビットストリームから差分ベクトルのＹ成分のサフィックス部を復号する（Ｓ２１４）。なお、サフィックス部が無い場合には（Ｓ２１３でＮＯ）、サフィックス部の復号処理をスキップする。ここで、サフィックス部の有無は、Ｘ成分と同様に判断されてもよい。次に、差分ベクトル正負符号復号部１０５は、ビットストリームから差分ベクトルのＹ成分の正負符号を復号し、差分ベクトル復元部１０６により、差分ベクトルのＹ成分を復元する（Ｓ２１５）。一方、Ｙ成分が０である場合には（Ｓ２１２でＹＥＳ）、既に差分ベクトルのＹ成分は復元できているため、Ｙ成分のサフィックス部の復号処理をスキップする。

なお、プリフィックス部分については、差分ベクトルの情報の偏りが大きい（０ベクトルが多くなる傾向がある）ため、前述のコンテキスト適応での算術符号化することによって符号化効率が高まる。そのため、復号時にはコンテキスト適応での算術復号処理（図３）を実行する。

一方、サフィックス部分は、大きい差分ベクトルの下位ビットに対応する。したがって、取りうる値の範囲が大きく（例えば９〜１０２４）、二値化列のシンボルの発生頻度について偏りが小さい。そのため、シンボル発生確率を５０％とみなし、バイパス符号化を行うことで処理量を削減する。つまり、サフィックス部分の復号ではバイパス復号（図４）を実行する。なお、差分ベクトルに正負符号が含まれる場合には、これに対してもバイパス符号化されるため、バイパス復号を実行する。

ここで、図９を用いて、図８で示した復号処理の動作例を説明する。

図９は、実施の形態１における実行処理ステップの例を説明するための図である。図９の（ａ）は実施の形態１の実行処理を１並列で実施した場合の例である。差分ベクトルのＸ成分のプリフィックス部分の復号（ＭＶＤＸ＿ＰＲＥＦＩＸ）、Ｙ成分のプリフィックス部分の復号（ＭＶＤＹ＿ＰＲＥＦＩＸ）、Ｘ成分のサフィックス部分の復号（ＭＶＤＸ＿ＳＵＦＦＩＸ）、Ｘ成分の正負符号の復号（ＭＶＤＸ＿ＳＩＧＮ）、Ｙ成分のサフィックス部分の復号（ＭＶＤＹ＿ＳＵＦＦＩＸ）、Ｙ成分の正負符号の復号（ＭＶＤＹ＿ＳＩＧＮ）の順で処理がなされる。

しかし、利用される画像解像度の拡大、および、高速度のリアルタイム通信が広まる中、高速処理が必要となるため、処理を並列化した実装が行われる。しかし、プリフィックス部分はコンテキスト適応の算術符号化処理が行われるため、シンボル発生確率の読み込み処理、および、更新処理が逐次的に必要となる。そのため、並列化ができない。しかし、バイパス処理部分については、図９の（ｂ）に示すようにビット単位で並列化することが可能となる。

一方、図９の（ｃ）および（ｄ）は従来の構成での実行処理の並列化の例である。図９の（ｃ）は、図９の（ａ）に対応し、図９の（ｄ）は図９の（ｂ）に対応する。同様にプリフィックス部分、つまりコンテキスト適応算術復号処理部分は逐次処理となり、サフィックス部分、つまりバイパス処理部分は並列化できる。しかし、Ｘ成分とＹ成分が入れ違いになるため、並列可能な部分が途切れる。そのため、十分に高速化できない（図９の（ｄ））。また、コンテキスト適応算術復号とバイパス復号との切替えが多いため、処理の負荷および遅延も大きい。

なお、実施の形態１に係る差分ベクトル復号部１００は、圧縮符号化された符号化画像データを復号する画像復号装置に備えられる。図１０は、実施の形態１に係る画像復号装置４００の構成の一例を示すブロック図である。

画像復号装置４００は、圧縮符号化された符号化画像データを復号する。例えば、画像復号装置４００には、符号化画像データがブロック毎に復号対象信号として入力される。画像復号装置４００は、入力された復号対象信号に、可変長復号、逆量子化及び逆変換を行うことで、画像データを復元する。

図１０に示すように、画像復号装置４００は、エントロピー復号部４１０と、逆量子化逆変換部４２０と、加算器４２５と、デブロッキングフィルタ４３０と、メモリ４４０と、イントラ予測部４５０と、動き補償部４６０と、イントラ／インター切替えスイッチ４７０とを備える。

エントロピー復号部４１０は、入力信号（入力ストリーム）を可変長復号することで、量子化係数を復元する。なお、ここで、入力信号（入力ストリーム）は、復号対象信号であり、符号化画像データのブロック毎のデータに相当する。また、エントロピー復号部４１０は、入力信号から動きデータを取得し、取得した動きデータを動き補償部４６０に出力する。

逆量子化逆変換部４２０は、エントロピー復号部４１０によって復元された量子化係数を逆量子化することで、変換係数を復元する。そして、逆量子化逆変換部４２０は、復元した変換係数を逆変換することで、予測誤差を復元する。

加算器４２５は、復元された予測誤差と予測信号とを加算することで、復号画像を生成する。

デブロッキングフィルタ４３０は、生成された復号画像にデブロッキングフィルタ処理を行う。デブロッキングフィルタ処理された復号画像は、復号信号として出力される。

メモリ４４０は、動き補償に用いられる参照画像を格納するためのメモリである。具体的には、メモリ４４０は、デブロッキングフィルタ処理が施された復号画像を格納する。

イントラ予測部４５０は、イントラ予測を行うことで、予測信号（イントラ予測信号）を生成する。具体的には、イントラ予測部４５０は、加算器４２５によって生成された復号画像における、復号対象ブロック（入力信号）の周囲の画像を参照してイントラ予測を行うことで、イントラ予測信号を生成する。

動き補償部４６０は、エントロピー復号部４１０から出力された動きデータに基づいて動き補償を行うことで、予測信号（インター予測信号）を生成する。

イントラ／インター切替えスイッチ４７０は、イントラ予測信号及びインター予測信号のいずれかを選択し、選択した信号を予測信号として加算器４２５に出力する。

以上の構成により、実施の形態１に係る画像復号装置４００は、圧縮符号化された符号化画像データを復号する。

なお、画像復号装置４００において、実施の形態１に係る差分ベクトル復号部１００をエントロピー復号部４１０が備える。

以上のように、実施の形態１に係る画像復号装置及び画像復号方法によれば、高速な差分ベクトルの復号が可能である。

具体的には、実施の形態１に示したように、差分ベクトル値のＸ成分およびＹ成分を統合し、差分ベクトル値をコンテキスト適応算術復号部分とバイパス処理部分とに分ける。これにより、並列演算可能な部分が長くなる。したがって、並列処理、すなわち、高速な復号が可能になる。

なお、上記の説明では、Ｘ成分、Ｙ成分に分けてサフィックス部の復号処理と正負符号復号処理を説明したがこれに限らない。例えばＸ成分のサフィックス部復号処理の後、Ｙ成分のサフィックス部復号処理、Ｘ成分の正負符号復号処理、Ｙ成分の正負符号復号処理としてもよい。この構成であっても、バイパス処理する部分が連続するため、効果が期待できる。また、プリフィックス部分に対しても、Ｘ成分が０かどうかを示す情報とＹ成分が０かどうかを示す情報を連続して復号してもよい。どちらにしても、コンテキスト算術復号処理部分の制約（逐次処理が必要）は変わらないためである。

なお、図６に示した二値化列や、コンテキスト適応算術復号する長さについては一例であり、必ずしも上述と一致する必要はない。例えば、絶対値０、１または２の差分ベクトルがプリフィックス部分として、３以上の差分ベクトル値がサフィックス部分として復号されてもよい（当然ながら、このビットストリームを生成する符号化装置でも同様の処理をする）。このように二値化列を決めることで、並列度が上がり、さらに高速な復号処理が可能となる。

（実施の形態１の変形例）
なお、実施の形態１では、コンテキスト適応算術復号処理に対応するプリフィックス部と、バイパス復号処理に対応するサフィックス部とに、Ｘ成分およびＹ成分にかかわらず、差分ベクトルを分割する。これにより、高速処理が実現される。この点を保ちつつ、次のような変形例が考えられる。

実施の形態１の変形例について図１１Ａおよび図１１Ｂを用いて詳しく説明する。図１１Ａは、実施の形態１の変形例における差分ベクトルのＸ成分、Ｙ成分が０かどうかを示すフラグの対応表である。図１１Ｂは、実施の形態１の変形例における処理の流れの一例を示すフローチャートである。

実施の形態１では、差分ベクトルのＸ成分が０かどうか、差分ベクトルのＹ成分が０かどうかは、別々のフラグとして説明した。しかし、実施の形態１では、差分ベクトルのＸ成分とＹ成分を組み合わせて復号することを実現したため、このフラグを組み合わせることにより、さらに符号化効率の向上を実現することができる。

例えば、図１１Ａに示すように、Ｘ成分が０かどうか（ＭＶＤＸ＿ＥＸＩＳＴ）とＹ成分が０かどうか（ＭＶＤＹ＿ＥＸＩＳＴ）の組み合わせに符号（ＭＶＤＸＹ＿ＥＸＩＳＴ）が割り当てられる。

Ｘ成分とＹ成分がともに０の場合に「０」が、Ｘ成分とＹ成分がともに０ではない場合に「１１１」が、Ｘ成分が０でありＹ成分が０ではない場合に「１１０」が、Ｙ成分が０でありＸ成分が０ではない場合に「１０」が割り当てられている。

前述のとおり、差分ベクトルの導出方法として、周囲のベクトルからの導出方法をインデックスで指定する方法が考えられている。このため、従来の画像符号化よりもさらに差分ベクトルの成分が「０」となる確率が高い。Ｘ成分とＹ成分がともに「０」となる場合に従来では二値化列信号が２ビット必要であったところ、本変形例では１ビットで表現される。本変形例の差分ベクトル復号部１００の処理の流れは図１１Ｂのようになる。

ステップＳ５０１では、差分ベクトルのＸ成分、Ｙ成分が０かどうかを示す符号列を取得する（Ｓ５０１）。ここで、例えば図１１Ａの対応表により、Ｘ成分、Ｙ成分が０かどうかの結果を当てはめる。なお、図８のＳ２００とＳ２０４の部分がステップＳ５０１となった以外は図８と同じであるため、以降の説明は省略する。

なお、図１１Ａに示す対応表は一例である。この例の場合では、一般に水平方向に動く映像が多いため、差分ベクトルのＸ成分は０になる可能性が低いという前提で二値化列を決定している。例えば、差分ベクトル符号化部は、符号の発生頻度により、この対応表を切替えて、ビットストリーム中にどの対応表で符号化したかのインデックスを記録しておいてもよい。そして、差分ベクトル復号部１００は、そのインデックスを復号することで、図１１Ａの対応表を取得してもよい。

この変形例により、高速処理を実現しつつ、符号化効率を向上させることができる。

（実施の形態２）
本実施の形態の算術符号化方法の概要について説明する。本実施の形態の算術符号化方法は、差分ベクトルをＸ成分とＹ成分とにではなく、コンテキスト適応算術符号化に対応するプリフィックス部と、バイパス処理符号化に対応するサフィックス部とに分割することを特徴とする。これにより、処理の並列化を実現し、高速な符号化を実現する。

以上が、本実施の形態の算術符号化方法の概要についての説明である。特に説明しない場合には、従来の算術符号化方法と同じ方法を取っても良いことを示す。

次に、本実施の形態の差分ベクトル符号化方法を行う差分ベクトル符号化部の処理の流れについて説明する。

図１２は、実施の形態２に係る差分ベクトル符号化部の処理の流れを示すフローチャートである。

差分ベクトル符号化部は、まず符号化対象となる差分ベクトルのＸ成分とＹ成分の情報を取得し、差分ベクトルのＸ成分が０かどうかを判断する（Ｓ６０１）。差分ベクトルのＸ成分が０ではない場合（Ｓ６０１でＮＯ）、差分ベクトルのＸ成分のプリフィックス部の符号化処理をする（Ｓ６０２）。なお、ここでのプリフィックス部の符号化処理は、図６に示す二値化列を後述するコンテキスト適応算術符号化方法で符号化する。コンテキスト適応算術符号化は、図３の算術復号方法の対をなすものであり、条件によりコンテキストを切替え、シンボル発生確率を取得し、符号化したシンボルによって、その確率値を更新する算術符号化の一種である（非特許文献１参照）。なお以降、明記しない場合には、プリフィックス部の符号化には、コンテキスト適応算術符号化方法を実施する。

次に、差分ベクトルのＸ成分が０である場合（Ｓ６０１でＹＥＳ）、差分ベクトルのＸ成分が０であることを示すフラグの符号化を行う（Ｓ６０３）。次に差分ベクトルのＹ成分が０かどうかを判断する（Ｓ６０４）。差分ベクトルのＹ成分が０ではない場合（Ｓ６０４でＮＯ）、差分ベクトルのＹ成分のプリフィックス部の符号化処理を行う（Ｘ成分と同様、Ｓ６０５）。一方、差分ベクトルのＹ成分が０である場合、差分ベクトルのＹ成分が０であることを示すフラグを符号化する（Ｓ６０６）。

次に、差分ベクトルのＸ成分がＴＨ値以上、すなわちサフィックスがあるかどうかを判断する（Ｓ６０７）。例えば、図６の二値化列表を用いる場合には、ＴＨ＝９として判定する。なお、本実施の形態では、この二値化列表にはかかわらず、プリフィックス（コンテキスト適応算術符号化）部分とサフィックス（バイパス処理符号化）部分の境界を判定すればよい。

ここでＸ成分のサフィックス部があれば（Ｓ６０７でＹＥＳ）、差分ベクトルのＸ成分のサフィックス部分の符号化を実施する（Ｓ６０８）。なお、サフィックス部分の符号化には、算術符号化のバイパス処理を行う。具体的には確率５０％に固定することで、演算を省略する方法であり、図４に示したバイパス復号方法の対を成すものである（非特許文献１参照）。今後明記しない場合には、サフィックス部の符号化には、バイパス符号化を用いるものとする。次に、差分ベクトルのＸ成分の正負符号の符号化を行う。なお、この処理に対してもバイパス符号化を実施する（Ｓ６１０）。なお、Ｘ成分の正負符号の符号化は、サフィックス部分がなく（Ｓ６０７でＮＯ）、Ｘ成分が０でなかった場合（Ｓ６０９でＮＯ）にも行う。Ｘ成分のサフィックス符号化処理の終了後（Ｓ６１０およびＳ６０９でＹＥＳ）Ｙ成分に対するサフィックス符号化処理を行う。

次に、差分ベクトルのＹ成分がＴＨ値以上、すなわちサフィックスがあるかどうかを判断する（Ｓ６１１）。判定はＸ成分と同じであるため、詳細説明は省略する。

ここでＹ成分のサフィックス部があれば（Ｓ６１１でＹＥＳ）、差分ベクトルのＹ成分のサフィックス部分の符号化を実施する（Ｓ６１２）。なお、サフィックス部分の符号化には、算術符号化のバイパス処理を行う。次に、差分ベクトルのＹ成分の正負符号の符号化を行う。なお、この処理に対してもバイパス符号化を実施する（Ｓ６１４）。なお、Ｙ成分の正負符号の符号化は、サフィックス部分がなく（Ｓ６１１でＮＯ）、Ｙ成分が０でなかった場合（Ｓ６１３でＮＯ）にも行う。これにより、Ｙ成分のサフィックス符号化処理が終了し、差分ベクトルのＸ成分、Ｙ成分の符号化処理を終了する。

なお、差分ベクトルの符号化方法においても、実施の形態１で説明した図９の（ｂ）のように、処理の並列化を行うことができるため、符号化装置を高速化できる。なお、実施の形態１の変形例に対する符号化方法としては、図１２の処理フローのうち、Ｓ６０１とＳ６０４を最初に実施する。そして、Ｓ６０３とＳ６０６の代わりに、図１１Ａの対応表を元に、差分ベクトルのＸ成分、Ｙ成分が０かどうかの組み合せを示す二値化列を符号化する。なお、この場合の符号化に対してもプリフィックス符号化すなわち、コンテキスト適応型の算術符号化方法を行う。これにより、符号化効率を向上させつつ、高速な符号化を実現できる。

なお、図１３は、データ構成の例を示すシンタックスを説明する模式図である。なお、このシンタックス表は非特許文献２より引例し、７０１、７０２、７０３の部分を実施の形態２（および１）での差分ベクトルの符号化（復号）方法によって生成するデータ構造の例である。

７０１から７０３で示すように、差分ベクトルを示すｍｖｄ＿ｌ？は、Ｘ成分およびＹ成分の両方を示すパラメタとして表現されている。なお、ｍｖｄ＿ｌ？の？は、参照インデックスに対応し、具体的にはｃ、０または１である（詳細は非特許文献２参照）。

差分ベクトルは、従来、ｍｖｄ＿ｌ？［ｘ０］［ｙ０］［０］およびｍｖｄ＿ｌ？［ｘ０］［ｙ０］［１］として表現されている。ここで、最後の要素の［０］がＸ成分を示し、［１］がＹ成分を示している。実施の形態２（および１）に係る差分ベクトルのＸ成分およびＹ成分は、組み合わせてストリーム中に記載される。そのため、実施の形態２（および１）に係る差分ベクトルは、ｍｖｄ＿ｌ？［ｘ０］［ｙ０］として表記される。

このような構成のデータを生成することにより、高速な符号化および復号を実現することができる。

なお、実施の形態２に係る差分ベクトル符号化部は、画像データを圧縮符号化する画像符号化装置に備えられる。図１４は、実施の形態２に係る画像符号化装置２００の構成の一例を示すブロック図である。

画像符号化装置２００は、画像データを圧縮符号化する。例えば、画像符号化装置２００には、画像データがブロック毎に入力信号として入力される。画像符号化装置２００は、入力された入力信号に、変換、量子化及び可変長符号化を行うことで、符号化信号を生成する。

図１４に示すように、画像符号化装置２００は、減算器２０５と、変換量子化部２１０と、エントロピー符号化部２２０と、逆量子化逆変換部２３０と、加算器２３５と、デブロッキングフィルタ２４０と、メモリ２５０と、イントラ予測部２６０と、動き検出部２７０と、動き補償部２８０と、イントラ／インター切替えスイッチ２９０とを備える。

減算器２０５は、入力信号と予測信号との差分、すなわち、予測誤差を算出する。

変換量子化部２１０は、空間領域の予測誤差を変換することで、周波数領域の変換係数を生成する。例えば、変換量子化部２１０は、予測誤差にＤＣＴ（ＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ）変換を行うことで、変換係数を生成する。さらに、変換量子化部２１０は、変換係数を量子化することで、量子化係数を生成する。

エントロピー符号化部２２０は、量子化係数を可変長符号化することで、符号化信号を生成する。また、エントロピー符号化部２２０は、動き検出部２７０によって検出された動きデータ（例えば、動きベクトル）を符号化し、符号化信号に含めて出力する。

逆量子化逆変換部２３０は、量子化係数を逆量子化することで、変換係数を復元する。さらに、逆量子化逆変換部２３０は、復元した変換係数を逆変換することで、予測誤差を復元する。なお、復元された予測誤差は、量子化により情報が失われているので、減算器２０５が生成する予測誤差とは一致しない。すなわち、復元された予測誤差は、量子化誤差を含んでいる。

加算器２３５は、復元された予測誤差と予測信号とを加算することで、ローカル復号画像を生成する。

デブロッキングフィルタ２４０は、生成されたローカル復号画像にデブロッキングフィルタ処理を行う。

メモリ２５０は、動き補償に用いられる参照画像を格納するためのメモリである。具体的には、メモリ２５０は、デブロッキングフィルタ処理が施されたローカル復号画像を格納する。

イントラ予測部２６０は、イントラ予測を行うことで、予測信号（イントラ予測信号）を生成する。具体的には、イントラ予測部２６０は、加算器２３５によって生成されたローカル復号画像における、符号化対象ブロック（入力信号）の周囲の画像を参照してイントラ予測を行うことで、イントラ予測信号を生成する。

動き検出部２７０は、入力信号と、メモリ２５０に格納された参照画像との間の動きデータ（例えば、動きベクトル）を検出する。

動き補償部２８０は、検出された動きデータに基づいて動き補償を行うことで、予測信号（インター予測信号）を生成する。

イントラ／インター切替えスイッチ２９０は、イントラ予測信号及びインター予測信号のいずれかを選択し、選択した信号を予測信号として減算器２０５及び加算器２３５に出力する。

以上の構成により、実施の形態２に係る画像符号化装置２００は、画像データを圧縮符号化する。

（実施の形態３）
本実施の形態では、実施の形態１または実施の形態２に含まれる特徴的な構成および手順が確認的に示される。本実施の形態に係る構成および手順は、実施の形態１または実施の形態２で示された構成および手順に対応する。すなわち、実施の形態１および実施の形態２で示された概念は、本実施の形態に係る構成および手順を含む。

図１５Ａは、本実施の形態に係る画像符号化装置の構成の一例を示すブロック図である。図１５Ａに示された画像符号化装置８００は、動きベクトルを用いて画像を符号化する。また、画像符号化装置８００は、符号化部８０１を含む。

図１５Ｂは、図１５Ａに示された画像符号化装置８００の処理動作を示すフローチャートである。符号化部８０１は、差分ベクトルを符号化する（Ｓ８０１）。差分ベクトルは、予測動きベクトルと動きベクトルとの差を示す。予測動きベクトルは、動きベクトルの予測値である。符号化部８０１は、差分ベクトルを符号化する際、第１の部分、第２の部分、第３の部分および第４の部分を符号化する。

第１の部分は、差分ベクトルの水平成分および垂直成分のうちの第１の成分の一部である。第２の部分は、差分ベクトルの水平成分および垂直成分のうち、第１の成分とは異なる第２の成分の一部である。第３の部分は、第１の成分の一部であり、第１の部分とは異なる部分である。第４の部分は、第２の成分の一部であり、第２の部分とは異なる部分である。典型的には、各成分の一部は、当該成分に対応する２値データの一部である。

そして、符号化部８０１は、第１の部分、第２の部分、第３の部分および第４の部分の順で第１の部分、第２の部分、第３の部分および第４の部分を含む符号列を生成する。

これにより、差分ベクトルの水平成分の一部と、差分ベクトルの垂直成分の一部とが、符号列において組み合わされる。そして、水平成分の一部と垂直成分の一部とが組み合わされることで、差分ベクトルが効率的に符号化される。

例えば、第１の部分は、第１の成分が０であるか否かを示すフラグを含んでもよい。第２の部分は、第２の成分が０であるか否かを示すフラグを含んでもよい。第３の部分は、第１の成分の正負の符号を含んでもよい。第４の部分は、第２の成分の正負の符号を含んでもよい。

また、例えば、第１の成分の絶対値が閾値よりも大きい場合、第３の部分は、第１の成分の絶対値と閾値との差を含んでもよい。第２の成分の絶対値が閾値よりも大きい場合、第４の部分は、第２の成分の絶対値と閾値との差を含んでもよい。

また、例えば、符号化部８０１は、コンテキスト適応算術符号化によって、第１の部分および第２の部分を符号化してもよい。そして、符号化部８０１は、バイパス符号化によって、第３の部分および第４の部分を符号化してもよい。コンテキスト適応算術符号化は、符号化済みデータに基づいて更新された変動確率を用いる算術符号化である。バイパス符号化は、予め定められた固定確率を用いる算術符号化である。また、符号化部８０１は、第３の部分および第４の部分を並行して符号化してもよい。

また、例えば、符号化部８０１は、第１の部分、第２の部分、第３の部分および第４の部分の順で第１の部分、第２の部分、第３の部分および第４の部分を符号化してもよい。

また、例えば、符号化部８０１は、第１の規格に準拠する第１の符号化処理、または、第２の規格に準拠する第２の符号化処理に、符号化処理を切替えてもよい。そして、符号化部８０１は、切替えられた符号化処理が準拠する第１の規格または第２の規格を示す識別情報を含むビットストリームを生成してもよい。

そして、符号化処理が第１の符号化処理に切替えられた場合、符号化部８０１は、第１の部分、第２の部分、第３の部分および第４の部分の順で第１の部分、第２の部分、第３の部分および第４の部分を含む符号列を生成してもよい。また、この場合、符号化部８０１は、第１の規格を示す識別情報と符号列とを含むビットストリームを生成してもよい。

図１６Ａは、本実施の形態に係る画像復号装置の構成の一例を示すブロック図である。図１６Ａに示された画像復号装置９００は、動きベクトルを用いて画像を復号する。また、画像復号装置９００は、復号部９０１を含む。

図１６Ｂは、図１６Ａに示された画像復号装置９００の処理動作を示すフローチャートである。復号部９０１は、差分ベクトルを復号する（Ｓ９０１）。予測動きベクトルは、動きベクトルの予測値である。差分ベクトルは、予測動きベクトルと動きベクトルとの差を示す。

復号部９０１は、差分ベクトルを復号する際、符号列を取得する。そして、復号部９０１は、符号列に含まれる第１の部分を復号し、符号列に含まれる第２の部分を復号し、符号列に含まれる第３の部分を復号し、符号列に含まれる第４の部分を復号する。

第１の部分は、差分ベクトルの水平成分および垂直成分のうちの第１の成分の一部である。第２の部分は、水平成分および垂直成分のうち、第１の成分とは異なる第２の成分の一部である。第３の部分は、第１の成分の一部であり、第１の部分とは異なる部分である。第４の部分は、第２の成分の一部であり、第２の部分とは異なる部分である。典型的には、各成分の一部は、当該成分に対応する２値データの一部である。

符号列は、第１の部分、第２の部分、第３の部分および第４の部分の順で第１の部分、第２の部分、第３の部分および第４の部分を含む。

すなわち、復号部９０１は、差分ベクトルの水平成分の一部と、差分ベクトルの垂直成分の一部とが組み合わされた符号列を取得する。そして、水平成分の一部と垂直成分の一部とが組み合わされた符号列によって、差分ベクトルが効率的に復号される。

また、例えば、復号部９０１は、コンテキスト適応算術復号によって、第１の部分および第２の部分を復号してもよい。そして、復号部９０１は、バイパス復号によって、第３の部分および第４の部分を復号してもよい。コンテキスト適応算術復号は、復号済みデータに基づいて更新された変動確率を用いる算術復号である。バイパス復号は、予め定められた固定確率を用いる算術復号である。また、復号部９０１は、第３の部分および第４の部分を並行して復号してもよい。

また、例えば、復号部９０１は、第１の部分、第２の部分、第３の部分および第４の部分の順で第１の部分、第２の部分、第３の部分および第４の部分を復号してもよい。

また、例えば、復号部９０１は、第１の規格または第２の規格を示す識別情報を含むビットストリームを取得してもよい。そして、復号部９０１は、識別情報に基づいて、第１の規格に準拠する第１の復号処理、または、第２の規格に準拠する第２の復号処理に、復号処理を切替えてもよい。

そして、復号処理が第１の復号処理に切替えられた場合、復号部９０１は、ビットストリームから、第１の部分、第２の部分、第３の部分および第４の部分の順で第１の部分、第２の部分、第３の部分および第４の部分を含む符号列を取得してもよい。

また、例えば、画像符号化装置８００および画像復号装置９００は、画像符号化復号装置を構成してもよい。

また、例えば、差分ベクトルの符号列に対応するデータ構造は、図１７で示されるデータ構造でもよい。

図１７は、差分ベクトルの符号列に対応するデータ構造の一例を示すシンタックス表である。図１７の［０］は水平成分を表し、［１］は垂直成分を表す。

ａｂｓ＿ｍｖｄ＿ｇｒｅａｔｅｒ０＿ｆｌａｇは、差分ベクトルの水平成分または垂直成分の絶対値が０よりも大きいか否かを示すフラグである。ａｂｓ＿ｍｖｄ＿ｇｒｅａｔｅｒ１＿ｆｌａｇは、差分ベクトルの水平成分または垂直成分の絶対値が１よりも大きいか否かを示すフラグである。ａｂｓ＿ｍｖｄ＿ｍｉｎｕｓ２は、差分ベクトルの水平成分または垂直成分の絶対値から２を引くことにより得られる値である。ｍｖｄ＿ｓｉｇｎ＿ｆｌａｇは、差分ベクトルの水平成分または垂直成分の符号である。

ａｂｓ＿ｍｖｄ＿ｇｒｅａｔｅｒ０＿ｆｌａｇおよびａｂｓ＿ｍｖｄ＿ｇｒｅａｔｅｒ１＿ｆｌａｇは、プリフィックス部に対応する。ａｂｓ＿ｍｖｄ＿ｍｉｎｕｓ２は、サフィックス部に対応する。典型的には、ａｂｓ＿ｍｖｄ＿ｇｒｅａｔｅｒ０＿ｆｌａｇおよびａｂｓ＿ｍｖｄ＿ｇｒｅａｔｅｒ１＿ｆｌａｇの符号化（復号）に、コンテキスト適応算術符号化（復号）が用いられる。そして、ａｂｓ＿ｍｖｄ＿ｍｉｎｕｓ２およびｍｖｄ＿ｓｉｇｎ＿ｆｌａｇの符号化（復号）に、バイパス符号化（復号）が用いられる。

なお、上記各実施の形態において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、ＣＰＵまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。ここで、上記各実施の形態の画像符号化装置などを実現するソフトウェアは、次のようなプログラムである。

すなわち、このプログラムは、コンピュータに、動きベクトルを用いて画像を符号化する画像符号化方法であって、前記動きベクトルの予測値である予測動きベクトルと前記動きベクトルとの差を示す差分ベクトルを符号化する符号化ステップを含み、前記符号化ステップでは、前記差分ベクトルの水平成分および垂直成分のうちの第１の成分の一部である第１の部分を符号化し、前記水平成分および前記垂直成分のうち、前記第１の成分とは異なる第２の成分の一部である第２の部分を符号化し、前記第１の成分の一部であり、前記第１の部分とは異なる部分である第３の部分を符号化し、前記第２の成分の一部であり、前記第２の部分とは異なる部分である第４の部分を符号化し、前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分の順で前記第１の部分、前記第２の部分、前記第３の部分および前記第４の部分を含む符号列を生成する画像符号化方法を実行させる。

以上、本発明の一つまたは複数の態様に係る画像符号化方法について、実施の形態に基づいて説明したが、本発明は、この実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、本発明の１つまたは複数の態様の範囲内に含まれてもよい。

（実施の形態４）
上記各実施の形態で示した動画像符号化方法（画像符号化方法）または動画像復号化方法（画像復号方法）の構成を実現するためのプログラムを記憶メディアに記録することにより、上記各実施の形態で示した処理を独立したコンピュータシステムにおいて簡単に実施することが可能となる。記憶メディアは、磁気ディスク、光ディスク、光磁気ディスク、ＩＣカード、半導体メモリ等、プログラムを記録できるものであればよい。

さらにここで、上記各実施の形態で示した動画像符号化方法（画像符号化方法）や動画像復号化方法（画像復号方法）の応用例とそれを用いたシステムを説明する。当該システムは、画像符号化方法を用いた画像符号化装置、及び画像復号方法を用いた画像復号装置からなる画像符号化復号装置を有することを特徴とする。システムにおける他の構成について、場合に応じて適切に変更することができる。

図１８は、コンテンツ配信サービスを実現するコンテンツ供給システムex１００の全体構成を示す図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ex１０６、ex１０７、ex１０８、ex１０９、ex１１０が設置されている。

このコンテンツ供給システムex１００は、インターネットex１０１にインターネットサービスプロバイダex１０２および電話網ex１０４、および基地局ex１０６からex１１０を介して、コンピュータex１１１、ＰＤＡ（Personal Digital Assistant）ex１１２、カメラex１１３、携帯電話ex１１４、ゲーム機ex１１５などの各機器が接続される。

しかし、コンテンツ供給システムex１００は図１８のような構成に限定されず、いずれかの要素を組合せて接続するようにしてもよい。また、固定無線局である基地局ex１０６からex１１０を介さずに、各機器が電話網ex１０４に直接接続されてもよい。また、各機器が近距離無線等を介して直接相互に接続されていてもよい。

カメラex１１３はデジタルビデオカメラ等の動画撮影が可能な機器であり、カメラex１１６はデジタルカメラ等の静止画撮影、動画撮影が可能な機器である。また、携帯電話ex１１４は、ＧＳＭ（登録商標）（Global System for Mobile Communications）方式、ＣＤＭＡ（Code Division Multiple Access）方式、Ｗ−ＣＤＭＡ（Wideband-Code Division Multiple Access）方式、若しくはＬＴＥ（Long Term Evolution）方式、ＨＳＰＡ(High Speed Packet Access)の携帯電話機、またはＰＨＳ（Personal Handyphone System）等であり、いずれでも構わない。

コンテンツ供給システムex１００では、カメラex１１３等が基地局ex１０９、電話網ex１０４を通じてストリーミングサーバex１０３に接続されることで、ライブ配信等が可能になる。ライブ配信では、ユーザがカメラex１１３を用いて撮影するコンテンツ（例えば、音楽ライブの映像等）に対して上記各実施の形態で説明したように符号化処理を行い（即ち、本発明の一態様に係る画像符号化装置として機能する）、ストリーミングサーバex１０３に送信する。一方、ストリーミングサーバex１０３は要求のあったクライアントに対して送信されたコンテンツデータをストリーム配信する。クライアントとしては、上記符号化処理されたデータを復号化することが可能な、コンピュータex１１１、ＰＤＡex１１２、カメラex１１３、携帯電話ex１１４、ゲーム機ex１１５等がある。配信されたデータを受信した各機器では、受信したデータを復号化処理して再生する（即ち、本発明の一態様に係る画像復号装置として機能する）。

なお、撮影したデータの符号化処理はカメラex１１３で行っても、データの送信処理をするストリーミングサーバex１０３で行ってもよいし、互いに分担して行ってもよい。同様に配信されたデータの復号化処理はクライアントで行っても、ストリーミングサーバex１０３で行ってもよいし、互いに分担して行ってもよい。また、カメラex１１３に限らず、カメラex１１６で撮影した静止画像および／または動画像データを、コンピュータex１１１を介してストリーミングサーバex１０３に送信してもよい。この場合の符号化処理はカメラex１１６、コンピュータex１１１、ストリーミングサーバex１０３のいずれで行ってもよいし、互いに分担して行ってもよい。

また、これら符号化・復号化処理は、一般的にコンピュータex１１１や各機器が有するＬＳＩex５００において処理する。ＬＳＩex５００は、ワンチップであっても複数チップからなる構成であってもよい。なお、動画像符号化・復号化用のソフトウェアをコンピュータex１１１等で読み取り可能な何らかの記録メディア（ＣＤ−ＲＯＭ、フレキシブルディスク、ハードディスクなど）に組み込み、そのソフトウェアを用いて符号化・復号化処理を行ってもよい。さらに、携帯電話ex１１４がカメラ付きである場合には、そのカメラで取得した動画データを送信してもよい。このときの動画データは携帯電話ex１１４が有するＬＳＩex５００で符号化処理されたデータである。

また、ストリーミングサーバex１０３は複数のサーバや複数のコンピュータであって、データを分散して処理したり記録したり配信するものであってもよい。

以上のようにして、コンテンツ供給システムex１００では、符号化されたデータをクライアントが受信して再生することができる。このようにコンテンツ供給システムex１００では、ユーザが送信した情報をリアルタイムでクライアントが受信して復号化し、再生することができ、特別な権利や設備を有さないユーザでも個人放送を実現できる。

なお、コンテンツ供給システムex１００の例に限らず、図１９に示すように、デジタル放送用システムex２００にも、上記各実施の形態の少なくとも動画像符号化装置（画像符号化装置）または動画像復号化装置（画像復号装置）のいずれかを組み込むことができる。具体的には、放送局ex２０１では映像データに音楽データなどが多重化された多重化データが電波を介して通信または衛星ex２０２に伝送される。この映像データは上記各実施の形態で説明した動画像符号化方法により符号化されたデータである（即ち、本発明の一態様に係る画像符号化装置によって符号化されたデータである）。これを受けた放送衛星ex２０２は、放送用の電波を発信し、この電波を衛星放送の受信が可能な家庭のアンテナex２０４が受信する。受信した多重化データを、テレビ（受信機）ex３００またはセットトップボックス（ＳＴＢ）ex２１７等の装置が復号化して再生する（即ち、本発明の一態様に係る画像復号装置として機能する）。

また、ＤＶＤ、ＢＤ等の記録メディアex２１５に記録した多重化データを読み取り復号化する、または記録メディアex２１５に映像信号を符号化し、さらに場合によっては音楽信号と多重化して書き込むリーダ／レコーダex２１８にも上記各実施の形態で示した動画像復号化装置または動画像符号化装置を実装することが可能である。この場合、再生された映像信号はモニタex２１９に表示され、多重化データが記録された記録メディアex２１５により他の装置やシステムにおいて映像信号を再生することができる。また、ケーブルテレビ用のケーブルex２０３または衛星／地上波放送のアンテナex２０４に接続されたセットトップボックスex２１７内に動画像復号化装置を実装し、これをテレビのモニタex２１９で表示してもよい。このときセットトップボックスではなく、テレビ内に動画像復号化装置を組み込んでもよい。

図２０は、上記各実施の形態で説明した動画像復号化方法および動画像符号化方法を用いたテレビ（受信機）ex３００を示す図である。テレビex３００は、上記放送を受信するアンテナex２０４またはケーブルex２０３等を介して映像データに音声データが多重化された多重化データを取得、または出力するチューナex３０１と、受信した多重化データを復調する、または外部に送信する多重化データに変調する変調／復調部ex３０２と、復調した多重化データを映像データと、音声データとに分離する、または信号処理部ex３０６で符号化された映像データ、音声データを多重化する多重／分離部ex３０３を備える。

また、テレビex３００は、音声データ、映像データそれぞれを復号化する、またはそれぞれの情報を符号化する音声信号処理部ex３０４、映像信号処理部ex３０５（本発明の一態様に係る画像符号化装置または画像復号装置として機能する）を有する信号処理部ex３０６と、復号化した音声信号を出力するスピーカex３０７、復号化した映像信号を表示するディスプレイ等の表示部ex３０８を有する出力部ex３０９とを有する。さらに、テレビex３００は、ユーザ操作の入力を受け付ける操作入力部ex３１２等を有するインタフェース部ex３１７を有する。さらに、テレビex３００は、各部を統括的に制御する制御部ex３１０、各部に電力を供給する電源回路部ex３１１を有する。インタフェース部ex３１７は、操作入力部ex３１２以外に、リーダ／レコーダex２１８等の外部機器と接続されるブリッジex３１３、ＳＤカード等の記録メディアex２１６を装着可能とするためのスロット部ex３１４、ハードディスク等の外部記録メディアと接続するためのドライバex３１５、電話網と接続するモデムex３１６等を有していてもよい。なお記録メディアex２１６は、格納する不揮発性／揮発性の半導体メモリ素子により電気的に情報の記録を可能としたものである。テレビex３００の各部は同期バスを介して互いに接続されている。

まず、テレビex３００がアンテナex２０４等により外部から取得した多重化データを復号化し、再生する構成について説明する。テレビex３００は、リモートコントローラex２２０等からのユーザ操作を受け、ＣＰＵ等を有する制御部ex３１０の制御に基づいて、変調／復調部ex３０２で復調した多重化データを多重／分離部ex３０３で分離する。さらにテレビex３００は、分離した音声データを音声信号処理部ex３０４で復号化し、分離した映像データを映像信号処理部ex３０５で上記各実施の形態で説明した復号化方法を用いて復号化する。復号化した音声信号、映像信号は、それぞれ出力部ex３０９から外部に向けて出力される。出力する際には、音声信号と映像信号が同期して再生するよう、バッファex３１８、ex３１９等に一旦これらの信号を蓄積するとよい。また、テレビex３００は、放送等からではなく、磁気／光ディスク、ＳＤカード等の記録メディアex２１５、ex２１６から多重化データを読み出してもよい。次に、テレビex３００が音声信号や映像信号を符号化し、外部に送信または記録メディア等に書き込む構成について説明する。テレビex３００は、リモートコントローラex２２０等からのユーザ操作を受け、制御部ex３１０の制御に基づいて、音声信号処理部ex３０４で音声信号を符号化し、映像信号処理部ex３０５で映像信号を上記各実施の形態で説明した符号化方法を用いて符号化する。符号化した音声信号、映像信号は多重／分離部ex３０３で多重化され外部に出力される。多重化する際には、音声信号と映像信号が同期するように、バッファex３２０、ex３２１等に一旦これらの信号を蓄積するとよい。なお、バッファex３１８、ex３１９、ex３２０、ex３２１は図示しているように複数備えていてもよいし、１つ以上のバッファを共有する構成であってもよい。さらに、図示している以外に、例えば変調／復調部ex３０２や多重／分離部ex３０３の間等でもシステムのオーバフロー、アンダーフローを避ける緩衝材としてバッファにデータを蓄積することとしてもよい。

また、テレビex３００は、放送等や記録メディア等から音声データ、映像データを取得する以外に、マイクやカメラのＡＶ入力を受け付ける構成を備え、それらから取得したデータに対して符号化処理を行ってもよい。なお、ここではテレビex３００は上記の符号化処理、多重化、および外部出力ができる構成として説明したが、これらの処理を行うことはできず、上記受信、復号化処理、外部出力のみが可能な構成であってもよい。

また、リーダ／レコーダex２１８で記録メディアから多重化データを読み出す、または書き込む場合には、上記復号化処理または符号化処理はテレビex３００、リーダ／レコーダex２１８のいずれで行ってもよいし、テレビex３００とリーダ／レコーダex２１８が互いに分担して行ってもよい。

一例として、光ディスクからデータの読み込みまたは書き込みをする場合の情報再生／記録部ex４００の構成を図２１に示す。情報再生／記録部ex４００は、以下に説明する要素ex４０１、ex４０２、ex４０３、ex４０４、ex４０５、ex４０６、ex４０７を備える。光ヘッドex４０１は、光ディスクである記録メディアex２１５の記録面にレーザスポットを照射して情報を書き込み、記録メディアex２１５の記録面からの反射光を検出して情報を読み込む。変調記録部ex４０２は、光ヘッドex４０１に内蔵された半導体レーザを電気的に駆動し記録データに応じてレーザ光の変調を行う。再生復調部ex４０３は、光ヘッドex４０１に内蔵されたフォトディテクタにより記録面からの反射光を電気的に検出した再生信号を増幅し、記録メディアex２１５に記録された信号成分を分離して復調し、必要な情報を再生する。バッファex４０４は、記録メディアex２１５に記録するための情報および記録メディアex２１５から再生した情報を一時的に保持する。ディスクモータex４０５は記録メディアex２１５を回転させる。サーボ制御部ex４０６は、ディスクモータex４０５の回転駆動を制御しながら光ヘッドex４０１を所定の情報トラックに移動させ、レーザスポットの追従処理を行う。システム制御部ex４０７は、情報再生／記録部ex４００全体の制御を行う。上記の読み出しや書き込みの処理はシステム制御部ex４０７が、バッファex４０４に保持された各種情報を利用し、また必要に応じて新たな情報の生成・追加を行うと共に、変調記録部ex４０２、再生復調部ex４０３、サーボ制御部ex４０６を協調動作させながら、光ヘッドex４０１を通して、情報の記録再生を行うことにより実現される。システム制御部ex４０７は例えばマイクロプロセッサで構成され、読み出し書き込みのプログラムを実行することでそれらの処理を実行する。

以上では、光ヘッドex４０１はレーザスポットを照射するとして説明したが、近接場光を用いてより高密度な記録を行う構成であってもよい。

図２２に光ディスクである記録メディアex２１５の模式図を示す。記録メディアex２１５の記録面には案内溝（グルーブ）がスパイラル状に形成され、情報トラックex２３０には、予めグルーブの形状の変化によってディスク上の絶対位置を示す番地情報が記録されている。この番地情報はデータを記録する単位である記録ブロックex２３１の位置を特定するための情報を含み、記録や再生を行う装置において情報トラックex２３０を再生し番地情報を読み取ることで記録ブロックを特定することができる。また、記録メディアex２１５は、データ記録領域ex２３３、内周領域ex２３２、外周領域ex２３４を含んでいる。ユーザデータを記録するために用いる領域がデータ記録領域ex２３３であり、データ記録領域ex２３３より内周または外周に配置されている内周領域ex２３２と外周領域ex２３４は、ユーザデータの記録以外の特定用途に用いられる。情報再生／記録部ex４００は、このような記録メディアex２１５のデータ記録領域ex２３３に対して、符号化された音声データ、映像データまたはそれらのデータを多重化した多重化データの読み書きを行う。

以上では、１層のＤＶＤ、ＢＤ等の光ディスクを例に挙げ説明したが、これらに限ったものではなく、多層構造であって表面以外にも記録可能な光ディスクであってもよい。また、ディスクの同じ場所にさまざまな異なる波長の色の光を用いて情報を記録したり、さまざまな角度から異なる情報の層を記録したりなど、多次元的な記録／再生を行う構造の光ディスクであってもよい。

また、デジタル放送用システムex２００において、アンテナex２０５を有する車ex２１０で衛星ex２０２等からデータを受信し、車ex２１０が有するカーナビゲーションex２１１等の表示装置に動画を再生することも可能である。なお、カーナビゲーションex２１１の構成は例えば図２０に示す構成のうち、ＧＰＳ受信部を加えた構成が考えられ、同様なことがコンピュータex１１１や携帯電話ex１１４等でも考えられる。

図２３Ａは、上記実施の形態で説明した動画像復号化方法および動画像符号化方法を用いた携帯電話ex１１４を示す図である。携帯電話ex１１４は、基地局ex１１０との間で電波を送受信するためのアンテナex３５０、映像、静止画を撮ることが可能なカメラ部ex３６５、カメラ部ex３６５で撮像した映像、アンテナex３５０で受信した映像等が復号化されたデータを表示する液晶ディスプレイ等の表示部ex３５８を備える。携帯電話ex１１４は、さらに、操作キー部ex３６６を有する本体部、音声を出力するためのスピーカ等である音声出力部ex３５７、音声を入力するためのマイク等である音声入力部ex３５６、撮影した映像、静止画、録音した音声、または受信した映像、静止画、メール等の符号化されたデータもしくは復号化されたデータを保存するメモリ部ex３６７、又は同様にデータを保存する記録メディアとのインタフェース部であるスロット部ex３６４を備える。

さらに、携帯電話ex１１４の構成例について、図２３Ｂを用いて説明する。携帯電話ex１１４は、表示部ex３５８及び操作キー部ex３６６を備えた本体部の各部を統括的に制御する主制御部ex３６０に対して、電源回路部ex３６１、操作入力制御部ex３６２、映像信号処理部ex３５５、カメラインタフェース部ex３６３、ＬＣＤ（Liquid Crystal Display）制御部ex３５９、変調／復調部ex３５２、多重／分離部ex３５３、音声信号処理部ex３５４、スロット部ex３６４、メモリ部ex３６７がバスex３７０を介して互いに接続されている。

電源回路部ex３６１は、ユーザの操作により終話及び電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することにより携帯電話ex１１４を動作可能な状態に起動する。

携帯電話ex１１４は、ＣＰＵ、ＲＯＭ、ＲＡＭ等を有する主制御部ex３６０の制御に基づいて、音声通話モード時に音声入力部ex３５６で収音した音声信号を音声信号処理部ex３５４でデジタル音声信号に変換し、これを変調／復調部ex３５２でスペクトラム拡散処理し、送信／受信部ex３５１でデジタルアナログ変換処理および周波数変換処理を施した後にアンテナex３５０を介して送信する。また携帯電話ex１１４は、音声通話モード時にアンテナex３５０を介して受信した受信データを増幅して周波数変換処理およびアナログデジタル変換処理を施し、変調／復調部ex３５２でスペクトラム逆拡散処理し、音声信号処理部ex３５４でアナログ音声信号に変換した後、これを音声出力部ex３５７から出力する。

さらにデータ通信モード時に電子メールを送信する場合、本体部の操作キー部ex３６６等の操作によって入力された電子メールのテキストデータは操作入力制御部ex３６２を介して主制御部ex３６０に送出される。主制御部ex３６０は、テキストデータを変調／復調部ex３５２でスペクトラム拡散処理をし、送信／受信部ex３５１でデジタルアナログ変換処理および周波数変換処理を施した後にアンテナex３５０を介して基地局ex１１０へ送信する。電子メールを受信する場合は、受信したデータに対してこのほぼ逆の処理が行われ、表示部ex３５８に出力される。

データ通信モード時に映像、静止画、または映像と音声を送信する場合、映像信号処理部ex３５５は、カメラ部ex３６５から供給された映像信号を上記各実施の形態で示した動画像符号化方法によって圧縮符号化し（即ち、本発明の一態様に係る画像符号化装置として機能する）、符号化された映像データを多重／分離部ex３５３に送出する。また、音声信号処理部ex３５４は、映像、静止画等をカメラ部ex３６５で撮像中に音声入力部ex３５６で収音した音声信号を符号化し、符号化された音声データを多重／分離部ex３５３に送出する。

多重／分離部ex３５３は、映像信号処理部ex３５５から供給された符号化された映像データと音声信号処理部ex３５４から供給された符号化された音声データを所定の方式で多重化し、その結果得られる多重化データを変調／復調部（変調／復調回路部）ex３５２でスペクトラム拡散処理をし、送信／受信部ex３５１でデジタルアナログ変換処理及び周波数変換処理を施した後にアンテナex３５０を介して送信する。

データ通信モード時にホームページ等にリンクされた動画像ファイルのデータを受信する場合、または映像およびもしくは音声が添付された電子メールを受信する場合、アンテナex３５０を介して受信された多重化データを復号化するために、多重／分離部ex３５３は、多重化データを分離することにより映像データのビットストリームと音声データのビットストリームとに分け、同期バスex３７０を介して符号化された映像データを映像信号処理部ex３５５に供給するとともに、符号化された音声データを音声信号処理部ex３５４に供給する。映像信号処理部ex３５５は、上記各実施の形態で示した動画像符号化方法に対応した動画像復号化方法によって復号化することにより映像信号を復号し（即ち、本発明の一態様に係る画像復号装置として機能する）、ＬＣＤ制御部ex３５９を介して表示部ex３５８から、例えばホームページにリンクされた動画像ファイルに含まれる映像、静止画が表示される。また音声信号処理部ex３５４は、音声信号を復号し、音声出力部ex３５７から音声が出力される。

また、上記携帯電話ex１１４等の端末は、テレビex３００と同様に、符号化器・復号化器を両方持つ送受信型端末の他に、符号化器のみの送信端末、復号化器のみの受信端末という３通りの実装形式が考えられる。さらに、デジタル放送用システムex２００において、映像データに音楽データなどが多重化された多重化データを受信、送信するとして説明したが、音声データ以外に映像に関連する文字データなどが多重化されたデータであってもよいし、多重化データではなく映像データ自体であってもよい。

このように、上記各実施の形態で示した動画像符号化方法あるいは動画像復号化方法を上述したいずれの機器・システムに用いることは可能であり、そうすることで、上記各実施の形態で説明した効果を得ることができる。

また、本発明はかかる上記実施の形態に限定されるものではなく、本発明の範囲を逸脱することなく種々の変形または修正が可能である。

（実施の形態５）
上記各実施の形態で示した動画像符号化方法または装置と、ＭＰＥＧ−２、ＭＰＥＧ４−ＡＶＣ、ＶＣ−１など異なる規格に準拠した動画像符号化方法または装置とを、必要に応じて適宜切替えることにより、映像データを生成することも可能である。

ここで、それぞれ異なる規格に準拠する複数の映像データを生成した場合、復号する際に、それぞれの規格に対応した復号方法を選択する必要がある。しかしながら、復号する映像データが、どの規格に準拠するものであるか識別できないため、適切な復号方法を選択することができないという課題を生じる。

この課題を解決するために、映像データに音声データなどを多重化した多重化データは、映像データがどの規格に準拠するものであるかを示す識別情報を含む構成とする。上記各実施の形態で示す動画像符号化方法または装置によって生成された映像データを含む多重化データの具体的な構成を以下説明する。多重化データは、ＭＰＥＧ−２トランスポートストリーム形式のデジタルストリームである。

図２４は、多重化データの構成を示す図である。図２４に示すように多重化データは、ビデオストリーム、オーディオストリーム、プレゼンテーショングラフィックスストリーム（ＰＧ）、インタラクティブグラフィックスストリームのうち、１つ以上を多重化することで得られる。ビデオストリームは映画の主映像および副映像を、オーディオストリーム（ＩＧ）は映画の主音声部分とその主音声とミキシングする副音声を、プレゼンテーショングラフィックスストリームは、映画の字幕をそれぞれ示している。ここで主映像とは画面に表示される通常の映像を示し、副映像とは主映像の中に小さな画面で表示する映像のことである。また、インタラクティブグラフィックスストリームは、画面上にＧＵＩ部品を配置することにより作成される対話画面を示している。ビデオストリームは、上記各実施の形態で示した動画像符号化方法または装置、従来のＭＰＥＧ−２、ＭＰＥＧ４−ＡＶＣ、ＶＣ−１などの規格に準拠した動画像符号化方法または装置によって符号化されている。オーディオストリームは、ドルビーＡＣ−３、ＤｏｌｂｙＤｉｇｉｔａｌＰｌｕｓ、ＭＬＰ、ＤＴＳ、ＤＴＳ−ＨＤ、または、リニアＰＣＭのなどの方式で符号化されている。

多重化データに含まれる各ストリームはＰＩＤによって識別される。例えば、映画の映像に利用するビデオストリームには０ｘ１０１１が、オーディオストリームには０ｘ１１００から０ｘ１１１Ｆまでが、プレゼンテーショングラフィックスには０ｘ１２００から０ｘ１２１Ｆまでが、インタラクティブグラフィックスストリームには０ｘ１４００から０ｘ１４１Ｆまでが、映画の副映像に利用するビデオストリームには０ｘ１Ｂ００から０ｘ１Ｂ１Ｆまで、主音声とミキシングする副音声に利用するオーディオストリームには０ｘ１Ａ００から０ｘ１Ａ１Ｆが、それぞれ割り当てられている。

図２５は、多重化データがどのように多重化されるかを模式的に示す図である。まず、複数のビデオフレームからなるビデオストリームex２３５、複数のオーディオフレームからなるオーディオストリームex２３８を、それぞれＰＥＳパケット列ex２３６およびex２３９に変換し、ＴＳパケットex２３７およびex２４０に変換する。同じくプレゼンテーショングラフィックスストリームex２４１およびインタラクティブグラフィックスex２４４のデータをそれぞれＰＥＳパケット列ex２４２およびex２４５に変換し、さらにＴＳパケットex２４３およびex２４６に変換する。多重化データex２４７はこれらのＴＳパケットを１本のストリームに多重化することで構成される。

図２６は、ＰＥＳパケット列に、ビデオストリームがどのように格納されるかをさらに詳しく示している。図２６における第１段目はビデオストリームのビデオフレーム列を示す。第２段目は、ＰＥＳパケット列を示す。図２６の矢印ｙｙ１，ｙｙ２，ｙｙ３，ｙｙ４に示すように、ビデオストリームにおける複数のＶｉｄｅｏＰｒｅｓｅｎｔａｔｉｏｎＵｎｉｔであるＩピクチャ、Ｂピクチャ、Ｐピクチャは、ピクチャ毎に分割され、ＰＥＳパケットのペイロードに格納される。各ＰＥＳパケットはＰＥＳヘッダを持ち、ＰＥＳヘッダには、ピクチャの表示時刻であるＰＴＳ（ＰｒｅｓｅｎｔａｔｉｏｎＴｉｍｅ−Ｓｔａｍｐ）やピクチャの復号時刻であるＤＴＳ（ＤｅｃｏｄｉｎｇＴｉｍｅ−Ｓｔａｍｐ）が格納される。

図２７は、多重化データに最終的に書き込まれるＴＳパケットの形式を示している。ＴＳパケットは、ストリームを識別するＰＩＤなどの情報を持つ４ＢｙｔｅのＴＳヘッダとデータを格納する１８４ＢｙｔｅのＴＳペイロードから構成される１８８Ｂｙｔｅ固定長のパケットであり、上記ＰＥＳパケットは分割されＴＳペイロードに格納される。ＢＤ−ＲＯＭの場合、ＴＳパケットには、４ＢｙｔｅのＴＰ＿Ｅｘｔｒａ＿Ｈｅａｄｅｒが付与され、１９２Ｂｙｔｅのソースパケットを構成し、多重化データに書き込まれる。ＴＰ＿Ｅｘｔｒａ＿ＨｅａｄｅｒにはＡＴＳ（Ａｒｒｉｖａｌ＿Ｔｉｍｅ＿Ｓｔａｍｐ）などの情報が記載される。ＡＴＳは当該ＴＳパケットのデコーダのＰＩＤフィルタへの転送開始時刻を示す。多重化データには図２７下段に示すようにソースパケットが並ぶこととなり、多重化データの先頭からインクリメントする番号はＳＰＮ（ソースパケットナンバー）と呼ばれる。

また、多重化データに含まれるＴＳパケットには、映像・音声・字幕などの各ストリーム以外にもＰＡＴ（ＰｒｏｇｒａｍＡｓｓｏｃｉａｔｉｏｎＴａｂｌｅ）、ＰＭＴ（ＰｒｏｇｒａｍＭａｐＴａｂｌｅ）、ＰＣＲ（ＰｒｏｇｒａｍＣｌｏｃｋＲｅｆｅｒｅｎｃｅ）などがある。ＰＡＴは多重化データ中に利用されるＰＭＴのＰＩＤが何であるかを示し、ＰＡＴ自身のＰＩＤは０で登録される。ＰＭＴは、多重化データ中に含まれる映像・音声・字幕などの各ストリームのＰＩＤと各ＰＩＤに対応するストリームの属性情報を持ち、また多重化データに関する各種ディスクリプタを持つ。ディスクリプタには多重化データのコピーを許可・不許可を指示するコピーコントロール情報などがある。ＰＣＲは、ＡＴＳの時間軸であるＡＴＣ（ＡｒｒｉｖａｌＴｉｍｅＣｌｏｃｋ）とＰＴＳ・ＤＴＳの時間軸であるＳＴＣ（ＳｙｓｔｅｍＴｉｍｅＣｌｏｃｋ）の同期を取るために、そのＰＣＲパケットがデコーダに転送されるＡＴＳに対応するＳＴＣ時間の情報を持つ。

図２８はＰＭＴのデータ構造を詳しく説明する図である。ＰＭＴの先頭には、そのＰＭＴに含まれるデータの長さなどを記したＰＭＴヘッダが配置される。その後ろには、多重化データに関するディスクリプタが複数配置される。上記コピーコントロール情報などが、ディスクリプタとして記載される。ディスクリプタの後には、多重化データに含まれる各ストリームに関するストリーム情報が複数配置される。ストリーム情報は、ストリームの圧縮コーデックなどを識別するためストリームタイプ、ストリームのＰＩＤ、ストリームの属性情報（フレームレート、アスペクト比など）が記載されたストリームディスクリプタから構成される。ストリームディスクリプタは多重化データに存在するストリームの数だけ存在する。

記録媒体などに記録する場合には、上記多重化データは、多重化データ情報ファイルと共に記録される。

多重化データ情報ファイルは、図２９に示すように多重化データの管理情報であり、多重化データと１対１に対応し、多重化データ情報、ストリーム属性情報とエントリマップから構成される。

多重化データ情報は図２９に示すようにシステムレート、再生開始時刻、再生終了時刻から構成されている。システムレートは多重化データの、後述するシステムターゲットデコーダのＰＩＤフィルタへの最大転送レートを示す。多重化データ中に含まれるＡＴＳの間隔はシステムレート以下になるように設定されている。再生開始時刻は多重化データの先頭のビデオフレームのＰＴＳであり、再生終了時刻は多重化データの終端のビデオフレームのＰＴＳに１フレーム分の再生間隔を足したものが設定される。

ストリーム属性情報は図３０に示すように、多重化データに含まれる各ストリームについての属性情報が、ＰＩＤ毎に登録される。属性情報はビデオストリーム、オーディオストリーム、プレゼンテーショングラフィックスストリーム、インタラクティブグラフィックスストリーム毎に異なる情報を持つ。ビデオストリーム属性情報は、そのビデオストリームがどのような圧縮コーデックで圧縮されたか、ビデオストリームを構成する個々のピクチャデータの解像度がどれだけであるか、アスペクト比はどれだけであるか、フレームレートはどれだけであるかなどの情報を持つ。オーディオストリーム属性情報は、そのオーディオストリームがどのような圧縮コーデックで圧縮されたか、そのオーディオストリームに含まれるチャンネル数は何であるか、何の言語に対応するか、サンプリング周波数がどれだけであるかなどの情報を持つ。これらの情報は、プレーヤが再生する前のデコーダの初期化などに利用される。

本実施の形態においては、上記多重化データのうち、ＰＭＴに含まれるストリームタイプを利用する。また、記録媒体に多重化データが記録されている場合には、多重化データ情報に含まれる、ビデオストリーム属性情報を利用する。具体的には、上記各実施の形態で示した動画像符号化方法または装置において、ＰＭＴに含まれるストリームタイプ、または、ビデオストリーム属性情報に対し、上記各実施の形態で示した動画像符号化方法または装置によって生成された映像データであることを示す固有の情報を設定するステップまたは手段を設ける。この構成により、上記各実施の形態で示した動画像符号化方法または装置によって生成した映像データと、他の規格に準拠する映像データとを識別することが可能になる。

また、本実施の形態における動画像復号化方法のステップを図３１に示す。ステップexＳ１００において、多重化データからＰＭＴに含まれるストリームタイプ、または、多重化データ情報に含まれるビデオストリーム属性情報を取得する。次に、ステップexＳ１０１において、ストリームタイプ、または、ビデオストリーム属性情報が上記各実施の形態で示した動画像符号化方法または装置によって生成された多重化データであることを示しているか否かを判断する。そして、ストリームタイプ、または、ビデオストリーム属性情報が上記各実施の形態で示した動画像符号化方法または装置によって生成されたものであると判断された場合には、ステップexＳ１０２において、上記各実施の形態で示した動画像復号方法により復号を行う。また、ストリームタイプ、または、ビデオストリーム属性情報が、従来のＭＰＥＧ−２、ＭＰＥＧ４−ＡＶＣ、ＶＣ−１などの規格に準拠するものであることを示している場合には、ステップexＳ１０３において、従来の規格に準拠した動画像復号方法により復号を行う。

このように、ストリームタイプ、または、ビデオストリーム属性情報に新たな固有値を設定することにより、復号する際に、上記各実施の形態で示した動画像復号化方法または装置で復号可能であるかを判断することができる。従って、異なる規格に準拠する多重化データが入力された場合であっても、適切な復号化方法または装置を選択することができるため、エラーを生じることなく復号することが可能となる。また、本実施の形態で示した動画像符号化方法または装置、または、動画像復号方法または装置を、上述したいずれの機器・システムに用いることも可能である。

（実施の形態６）
上記各実施の形態で示した動画像符号化方法および装置、動画像復号化方法および装置は、典型的には集積回路であるＬＳＩで実現される。一例として、図３２に１チップ化されたＬＳＩex５００の構成を示す。ＬＳＩex５００は、以下に説明する要素ex５０１、ex５０２、ex５０３、ex５０４、ex５０５、ex５０６、ex５０７、ex５０８、ex５０９を備え、各要素はバスex５１０を介して接続している。電源回路部ex５０５は電源がオン状態の場合に各部に対して電力を供給することで動作可能な状態に起動する。

例えば符号化処理を行う場合には、ＬＳＩex５００は、ＣＰＵex５０２、メモリコントローラex５０３、ストリームコントローラex５０４、駆動周波数制御部ex５１２等を有する制御部ex５０１の制御に基づいて、ＡＶＩ／Ｏex５０９によりマイクex１１７やカメラex１１３等からＡＶ信号を入力する。入力されたＡＶ信号は、一旦ＳＤＲＡＭ等の外部のメモリex５１１に蓄積される。制御部ex５０１の制御に基づいて、蓄積したデータは処理量や処理速度に応じて適宜複数回に分けるなどされ信号処理部ex５０７に送られ、信号処理部ex５０７において音声信号の符号化および／または映像信号の符号化が行われる。ここで映像信号の符号化処理は上記各実施の形態で説明した符号化処理である。信号処理部ex５０７ではさらに、場合により符号化された音声データと符号化された映像データを多重化するなどの処理を行い、ストリームＩ／Ｏex５０６から外部に出力する。この出力された多重化データは、基地局ex１０７に向けて送信されたり、または記録メディアex２１５に書き込まれたりする。なお、多重化する際には同期するよう、一旦バッファex５０８にデータを蓄積するとよい。

なお、上記では、メモリex５１１がＬＳＩex５００の外部の構成として説明したが、ＬＳＩex５００の内部に含まれる構成であってもよい。バッファex５０８も１つに限ったものではなく、複数のバッファを備えていてもよい。また、ＬＳＩex５００は１チップ化されてもよいし、複数チップ化されてもよい。

また、上記では、制御部ex５０１が、ＣＰＵex５０２、メモリコントローラex５０３、ストリームコントローラex５０４、駆動周波数制御部ex５１２等を有するとしているが、制御部ex５０１の構成は、この構成に限らない。例えば、信号処理部ex５０７がさらにＣＰＵを備える構成であってもよい。信号処理部ex５０７の内部にもＣＰＵを設けることにより、処理速度をより向上させることが可能になる。また、他の例として、ＣＰＵex５０２が信号処理部ex５０７、または信号処理部ex５０７の一部である例えば音声信号処理部を備える構成であってもよい。このような場合には、制御部ex５０１は、信号処理部ex５０７、またはその一部を有するＣＰＵex５０２を備える構成となる。

なお、ここでは、ＬＳＩとしたが、集積度の違いにより、ＩＣ、システムＬＳＩ、スーパーＬＳＩ、ウルトラＬＳＩと呼称されることもある。

また、集積回路化の手法はＬＳＩに限るものではなく、専用回路または汎用プロセッサで実現してもよい。ＬＳＩ製造後に、プログラムすることが可能なＦＰＧＡ（Field Programmable Gate Array）や、ＬＳＩ内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。

さらには、半導体技術の進歩または派生する別技術によりＬＳＩに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。

（実施の形態７）
上記各実施の形態で示した動画像符号化方法または装置によって生成された映像データを復号する場合、従来のＭＰＥＧ−２、ＭＰＥＧ４−ＡＶＣ、ＶＣ−１などの規格に準拠する映像データを復号する場合に比べ、処理量が増加することが考えられる。そのため、ＬＳＩex５００において、従来の規格に準拠する映像データを復号する際のＣＰＵex５０２の駆動周波数よりも高い駆動周波数に設定する必要がある。しかし、駆動周波数を高くすると、消費電力が高くなるという課題が生じる。

この課題を解決するために、テレビex３００、ＬＳＩex５００などの動画像復号化装置は、映像データがどの規格に準拠するものであるかを識別し、規格に応じて駆動周波数を切替える構成とする。図３３は、本実施の形態における構成ex８００を示している。駆動周波数切替え部ex８０３は、映像データが、上記各実施の形態で示した動画像符号化方法または装置によって生成されたものである場合には、駆動周波数を高く設定する。そして、上記各実施の形態で示した動画像復号化方法を実行する復号処理部ex８０１に対し、映像データを復号するよう指示する。一方、映像データが、従来の規格に準拠する映像データである場合には、映像データが、上記各実施の形態で示した動画像符号化方法または装置によって生成されたものである場合に比べ、駆動周波数を低く設定する。そして、従来の規格に準拠する復号処理部ex８０２に対し、映像データを復号するよう指示する。

より具体的には、駆動周波数切替え部ex８０３は、図３２のＣＰＵex５０２と駆動周波数制御部ex５１２から構成される。また、上記各実施の形態で示した動画像復号化方法を実行する復号処理部ex８０１、および、従来の規格に準拠する復号処理部ex８０２は、図３２の信号処理部ex５０７に該当する。ＣＰＵex５０２は、映像データがどの規格に準拠するものであるかを識別する。そして、ＣＰＵex５０２からの信号に基づいて、駆動周波数制御部ex５１２は、駆動周波数を設定する。また、ＣＰＵex５０２からの信号に基づいて、信号処理部ex５０７は、映像データの復号を行う。ここで、映像データの識別には、例えば、実施の形態５で記載した識別情報を利用することが考えられる。識別情報に関しては、実施の形態５で記載したものに限られず、映像データがどの規格に準拠するか識別できる情報であればよい。例えば、映像データがテレビに利用されるものであるか、ディスクに利用されるものであるかなどを識別する外部信号に基づいて、映像データがどの規格に準拠するものであるか識別可能である場合には、このような外部信号に基づいて識別してもよい。また、ＣＰＵex５０２における駆動周波数の選択は、例えば、図３５のような映像データの規格と、駆動周波数とを対応付けたルックアップテーブルに基づいて行うことが考えられる。ルックアップテーブルを、バッファex５０８や、ＬＳＩの内部メモリに格納しておき、ＣＰＵex５０２がこのルックアップテーブルを参照することにより、駆動周波数を選択することが可能である。

図３４は、本実施の形態の方法を実施するステップを示している。まず、ステップexＳ２００では、信号処理部ex５０７において、多重化データから識別情報を取得する。次に、ステップexＳ２０１では、ＣＰＵex５０２において、識別情報に基づいて映像データが上記各実施の形態で示した符号化方法または装置によって生成されたものであるか否かを識別する。映像データが上記各実施の形態で示した符号化方法または装置によって生成されたものである場合には、ステップexＳ２０２において、駆動周波数を高く設定する信号を、ＣＰＵex５０２が駆動周波数制御部ex５１２に送る。そして、駆動周波数制御部ex５１２において、高い駆動周波数に設定される。一方、従来のＭＰＥＧ−２、ＭＰＥＧ４−ＡＶＣ、ＶＣ−１などの規格に準拠する映像データであることを示している場合には、ステップexＳ２０３において、駆動周波数を低く設定する信号を、ＣＰＵex５０２が駆動周波数制御部ex５１２に送る。そして、駆動周波数制御部ex５１２において、映像データが上記各実施の形態で示した符号化方法または装置によって生成されたものである場合に比べ、低い駆動周波数に設定される。

さらに、駆動周波数の切替えに連動して、ＬＳＩex５００またはＬＳＩex５００を含む装置に与える電圧を変更することにより、省電力効果をより高めることが可能である。例えば、駆動周波数を低く設定する場合には、これに伴い、駆動周波数を高く設定している場合に比べ、ＬＳＩex５００またはＬＳＩex５００を含む装置に与える電圧を低く設定することが考えられる。

また、駆動周波数の設定方法は、復号する際の処理量が大きい場合に、駆動周波数を高く設定し、復号する際の処理量が小さい場合に、駆動周波数を低く設定すればよく、上述した設定方法に限らない。例えば、ＭＰＥＧ４−ＡＶＣ規格に準拠する映像データを復号する処理量の方が、上記各実施の形態で示した動画像符号化方法または装置により生成された映像データを復号する処理量よりも大きい場合には、駆動周波数の設定を上述した場合の逆にすることが考えられる。

さらに、駆動周波数の設定方法は、駆動周波数を低くする構成に限らない。例えば、識別情報が、上記各実施の形態で示した動画像符号化方法または装置によって生成された映像データであることを示している場合には、ＬＳＩex５００またはＬＳＩex５００を含む装置に与える電圧を高く設定し、従来のＭＰＥＧ−２、ＭＰＥＧ４−ＡＶＣ、ＶＣ−１などの規格に準拠する映像データであることを示している場合には、ＬＳＩex５００またはＬＳＩex５００を含む装置に与える電圧を低く設定することも考えられる。また、他の例としては、識別情報が、上記各実施の形態で示した動画像符号化方法または装置によって生成された映像データであることを示している場合には、ＣＰＵex５０２の駆動を停止させることなく、従来のＭＰＥＧ−２、ＭＰＥＧ４−ＡＶＣ、ＶＣ−１などの規格に準拠する映像データであることを示している場合には、処理に余裕があるため、ＣＰＵex５０２の駆動を一時停止させることも考えられる。識別情報が、上記各実施の形態で示した動画像符号化方法または装置によって生成された映像データであることを示している場合であっても、処理に余裕があれば、ＣＰＵex５０２の駆動を一時停止させることも考えられる。この場合は、従来のＭＰＥＧ−２、ＭＰＥＧ４−ＡＶＣ、ＶＣ−１などの規格に準拠する映像データであることを示している場合に比べて、停止時間を短く設定することが考えられる。

このように、映像データが準拠する規格に応じて、駆動周波数を切替えることにより、省電力化を図ることが可能になる。また、電池を用いてＬＳＩex５００またはＬＳＩex５００を含む装置を駆動している場合には、省電力化に伴い、電池の寿命を長くすることが可能である。

（実施の形態８）
テレビや、携帯電話など、上述した機器・システムには、異なる規格に準拠する複数の映像データが入力される場合がある。このように、異なる規格に準拠する複数の映像データが入力された場合にも復号できるようにするために、ＬＳＩex５００の信号処理部ex５０７が複数の規格に対応している必要がある。しかし、それぞれの規格に対応する信号処理部ex５０７を個別に用いると、ＬＳＩex５００の回路規模が大きくなり、また、コストが増加するという課題が生じる。

この課題を解決するために、上記各実施の形態で示した動画像復号方法を実行するための復号処理部と、従来のＭＰＥＧ−２、ＭＰＥＧ４−ＡＶＣ、ＶＣ−１などの規格に準拠する復号処理部とを一部共有化する構成とする。この構成例を図３６Ａのex９００に示す。例えば、上記各実施の形態で示した動画像復号方法と、ＭＰＥＧ４−ＡＶＣ規格に準拠する動画像復号方法とは、エントロピー符号化、逆量子化、デブロッキング・フィルタ、動き補償などの処理において処理内容が一部共通する。共通する処理内容については、ＭＰＥＧ４−ＡＶＣ規格に対応する復号処理部ex９０２を共有し、ＭＰＥＧ４−ＡＶＣ規格に対応しない、本発明の一態様に特有の他の処理内容については、専用の復号処理部ex９０１を用いるという構成が考えられる。特に、本発明の一態様は、エントロピー復号に特徴を有していることから、例えば、エントロピー復号については専用の復号処理部ex９０１を用い、それ以外の逆量子化、デブロッキング・フィルタ、動き補償のいずれか、または、全ての処理については、復号処理部を共有することが考えられる。復号処理部の共有化に関しては、共通する処理内容については、上記各実施の形態で示した動画像復号化方法を実行するための復号処理部を共有し、ＭＰＥＧ４−ＡＶＣ規格に特有の処理内容については、専用の復号処理部を用いる構成であってもよい。

また、処理を一部共有化する他の例を図３６Ｂのex１０００に示す。この例では、本発明の一態様に特有の処理内容に対応した専用の復号処理部ex１００１と、他の従来規格に特有の処理内容に対応した専用の復号処理部ex１００２と、本発明の一態様に係る動画像復号方法と他の従来規格の動画像復号方法とに共通する処理内容に対応した共用の復号処理部ex１００３とを用いる構成としている。ここで、専用の復号処理部ex１００１、ex１００２は、必ずしも本発明の一態様、または、他の従来規格に特有の処理内容に特化したものではなく、他の汎用処理を実行できるものであってもよい。また、本実施の形態の構成を、ＬＳＩex５００で実装することも可能である。

このように、本発明の一態様に係る動画像復号方法と、従来の規格の動画像復号方法とで共通する処理内容について、復号処理部を共有することにより、ＬＳＩの回路規模を小さくし、かつ、コストを低減することが可能である。

本発明の一態様に係る画像符号化方法および画像復号方法は、例えば、テレビジョン受像機、デジタルビデオレコーダー、カーナビゲーション、携帯電話、デジタルカメラ、または、デジタルビデオカメラ等に利用可能である。

１００差分ベクトル復号部
１０１、Ａ０１差分ベクトル復元制御部
１０２、Ａ０２差分ベクトル０判定部
１０３、Ａ０３差分ベクトルプリフィックス部復号部
１０４、Ａ０４差分ベクトルサフィックス部復号部
１０５、Ａ０５差分ベクトル正負符号復号部
１０６、Ａ０６差分ベクトル復元部
１１０プリフィックス部復号部
１２０サフィックス部復号部
２００、８００画像符号化装置
２０５減算器
２１０変換量子化部
２２０エントロピー符号化部
２３０、４２０逆量子化逆変換部
２３５、４２５加算器
２４０、４３０デブロッキングフィルタ
２５０、４４０メモリ
２６０、４５０イントラ予測部
２７０動き検出部
２８０、４６０動き補償部
２９０、４７０イントラ／インター切替えスイッチ
４００、９００画像復号装置
４１０エントロピー復号部
８０１符号化部
９０１復号部
Ａ００差分ベクトル可変長復号部
Ａ０７スイッチ

Claims

画像の予測に用いられる動きベクトルと前記動きベクトルの予測である予測動きベクトルとの差を示す差分ベクトルを復号する復号方法であって、
前記差分ベクトルの水平成分が０かどうかと垂直成分が０かどうかとの組み合わせを示すフラグを含み、前記差分ベクトルの水平成分と垂直成分とをそれぞれ示す第１の二値データと第２の二値データとを含む符号データを取得する取得ステップと、
前記符号データを復号する復号ステップと、を含み、
前記フラグには、
前記水平成分と前記垂直成分がともに０の場合に、０が割り当てられ、
前記水平成分が０ではなく前記垂直成分が０の場合に、１０が割り当てられ、
前記水平成分が０であり前記垂直成分が０ではない場合に、１１０が割り当てられ、
前記水平成分と前記垂直成分がともに０ではない場合に、１１１が割り当てられる、
復号方法。
画像の予測に用いられる動きベクトルと前記動きベクトルの予測である予測動きベクトルとの差を示す差分ベクトルを復号する復号装置であって、
前記差分ベクトルの水平成分が０かどうかと垂直成分が０かどうかとの組み合わせを示すフラグを含み、前記差分ベクトルの水平成分と垂直成分とをそれぞれ示す第１の二値データと第２の二値データとを含む符号データを取得する取得部と、
前記符号データを復号する復号部と、を備え、
前記フラグには、
前記水平成分と前記垂直成分がともに０の場合に、０が割り当てられ、
前記水平成分が０ではなく前記垂直成分が０の場合に、１０が割り当てられ、
前記水平成分が０であり前記垂直成分が０ではない場合に、１１０が割り当てられ、
前記水平成分と前記垂直成分がともに０ではない場合に、１１１が割り当てられる、
復号装置。
画像の予測に用いられる動きベクトルと前記動きベクトルの予測である予測動きベクトルとの差を示す差分ベクトルを復号する復号装置であって、
処理回路と、前記処理回路に接続される記憶部とを備え、
前記処理回路は、前記記憶部を用いて、
前記差分ベクトルの水平成分が０かどうかと垂直成分が０かどうかとの組み合わせを示すフラグを含み、前記差分ベクトルの水平成分と垂直成分とをそれぞれ示す第１の二値データと第２の二値データとを含む符号データを取得し、
前記符号データを復号し、
前記フラグには、
前記水平成分と前記垂直成分がともに０の場合に、０が割り当てられ、
前記水平成分が０ではなく前記垂直成分が０の場合に、１０が割り当てられ、
前記水平成分が０であり前記垂直成分が０ではない場合に、１１０が割り当てられ、
前記水平成分と前記垂直成分がともに０ではない場合に、１１１が割り当てられる、
復号装置。