JP4700069B2

JP4700069B2 - 内部予測ビデオ符号化のためのモード選択技術

Info

Publication number: JP4700069B2
Application number: JP2007551445A
Authority: JP
Inventors: リャング、イ; モーロイ、ステファン
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2005-01-13
Filing date: 2006-01-13
Publication date: 2011-06-15
Anticipated expiration: 2026-01-13
Also published as: WO2006076675A1; CN101133648B; CN101133648A; US20060153292A1; US7830960B2; EP1859629B1; ATE524019T1; KR100937275B1; KR20070104595A; WO2006076675A9; EP1859629A1; JP2008527933A

Description

本明細書は、ディジタル画像処理に係り、特に、ビデオ系列の画像又は画像フレームの符号化に関する。

ディジタル・ビデオ能力は、広い範囲のデバイスへと組み込まれることが可能であり、それはディジタル・テレビ、ディジタル直接放送システム、無線通信デバイス、個人ディジタル補助装置（ＰＤＡ：personal digital assistants）、ラップトップ・コンピュータ、デスクトップ・コンピュータ、ディジタル・カメラ、ディジタル記録デバイス、セルラ電話機又は衛星無線通信電話機、及びその他を含む。ディジタル・ビデオ・デバイスは、完全動画ビデオ系列を製作し、修正し、伝送し、記憶し、記録し、そして再生する際に、従来のアナログ・ビデオ・システムに対して著しい改善を提供することが可能である。

複数の異なるビデオ符号化規格が、ディジタル・ビデオ系列を符号化するために制定されてきている。動画像エキスパート・グループ（ＭＰＥＧ：Moving Picture Expert Group）は、例えば、ＭＰＥＧ−１，ＭＰＥＧ−２及びＭＰＥＧ−４を含む複数の規格を開発している。他の規格は、国際電気通信連合（ＩＴＵ：International Telecommunication Union）Ｈ．２６３規格、カルフォルニア州キューパーティーノ市のアップル・コンピュータにより開発されたクイックタイム（QuickTime（登録商標））技術、ワシントン州レドモンド市のマイクロソフト株式会社により開発されたウィンドウズ（登録商標）のためのビデオ及びウィンドウズ・メディア、インテル株式会社により開発されたインディオ（Indeo（登録商標））、ワシントン州シアトル市リアルネットワーク株式会社からのリアルビデオ（RealVideo（登録商標））、スーパーマック株式会社により開発されたシネパック（Cinepak（登録商標））を含む。これらの規格の更新された版、同様に、ＩＴＵＨ．２６４規格及び複数の専有規格を含む新たな規格が、出現し続けそして発展し続けている。複数の画像符号化規格が、ＪＰＥＧ規格のように静止画の圧縮のために同様に開発され続けている。ＪＰＥＧは、標準化委員会である“ジョイント・フォトグラフィック・エキスパート・グループ（Joint Photographic Experts Group）”を言う。

複数の符号化規格は、“内部予測符号化（intra-prediction encoding）”又は単純に“内部予測（intra-prediction）”と呼ばれるものを使用させることができる。Ｈ．２６３では、内部予測符号化は、同様に“高度内部コーディング（advanced intra-coding）”とも呼ばれ、そして予測プロセスは、一般的に“ＡＣ／ＤＣ予測”と呼ばれる。一般に、内部予測符号化は、符号化されたビデオ・フレーム又はビデオ画像に必要なデータの量を圧縮するために所定のビデオ・フレーム又はビデオ画像内の冗長性を活用する符号化プロセスを呼ぶ。

内部予測符号化は、静止画像圧縮のような圧縮技術として単独で使用されることができるが、より一般的にはビデオ系列の圧縮の際に別のビデオ符号化技術とともに実行される。例えば、内部予測符号化は、フレーム間符号化技術とともに使用されることができ、それは時間的な相関又はフレーム間相関と呼ばれる連続するビデオ・フレーム間の類似性を利用する。フレーム間符号化は、フレーム全体にわたるデータの冗長性を活用することによって、そしてビデオ・フレームのピクセル・ベースの表示を動画表示（motion representation）に変換することによってフレーム間圧縮を与えることができる。内部予測がフレーム間圧縮とともに使用されるときに、ビデオ系列は、著しく圧縮されることが可能である。

種々のタイプの圧縮をサポートするために、ディジタル・ビデオ・デバイスは、一般的に、ディジタル・ビデオ系列を圧縮するためのエンコーダ、及びディジタル・ビデオ系列を逆圧縮するためのデコーダを含む。多くの場合には、エンコーダとデコーダは、統合されたエンコーダ／デコーダ（ＣＯＤＥＣ）を形成し、それはビデオ画像の系列を規定するフレーム内部のピクセルのブロックに動作する。

内部予測符号化に関して、エンコーダは、モード選択エンジンを利用することができ、それは所定のフレーム又は画像の内部予測のためにベスト・モードを選択する。例えば、ＩＴＵＨ．２６３符号化規格のアネックス（Annex（付属文書））Ｉは、３つの可能な内部予測モード、水平ＡＣ／ＤＣモード、垂直ＡＣ／ＤＣモード及びＤＣのみのモード、を与える。ＤＣモードは、ビデオ・ブロックの平均値を表すビデオ・ブロックのＤＣ係数を使用するモードを呼び、それに対して、ＡＣモードは、ビデオ・ブロックの残りの（非ＤＣ）係数であるＡＣ係数を使用する。ＩＴＵＨ．２６３符号化規格のアネックスＩは、モード選択がどのようにして実行されることが可能であるかも同様に規定する。ＭＰＥＧ−４及びＩＴＵＨ．２６４符号化規格のような他の規格も、同様に相互予測符号化（inter-prediction encoding）のためにモードを使用する。不幸にして、異なる規格に対する内部予測モード選択をサポートするために、これらの異なる規格は、従来は別のモード選択エンジンを必要とする。

［サマリー］
本明細書は、ビデオ符号化技術及びそのような技術を実行するビデオ符号化デバイスを説明する。説明される符号化技術は、内部予測符号化を可能にする多種多様なビデオ符号化規格又は静止画像符号化規格に対して有用であり得る。本技術は、異なる内部予測符号化規格のサポートでモード選択を単純化することが可能である。特に、複数の符号化規格をサポートする符号化デバイスにおいて、１つのモード選択エンジンが、異なる符号化規格のためのモード選択を実行するために使用される。１つのモード選択エンジンは、複数の規格の各々に対して満足のいくモード選択を実行する。

ある複数のケースでは、モード選択エンジンは、１又はそれより多くの規格で従来使用されるモード選択技術から外れることがあるが、そのような規格に対して適切なモード選択性能を今まで通り与えることができる。例えば、本明細書は、ＩＴＵＨ．２６３符号化のサポートでモード選択を実行するためにＩＴＵＨ．２６４モード選択エンジンの使用を特に考慮する。本明細書は、同様に、ＩＴＵＨ．２６３符号化のサポートでモード選択を実行するためにＭＰＥＧ−４モード選択エンジンの使用を特に考慮する。ある複数のケースでは、ＩＴＵＨ．２６３符号化規格のアネックスＩに規定されたように、ＩＴＵＨ．２６３符号化のためのモード選択が、ＤＣＴドメインの内部予測に対して一般的に直感的に反する空間ドメインにおいて実行されることが可能であることが、認識される。本明細書中で説明されるモード選択技術が符号化デバイス内のハードウェアの削減を可能にしつつ、非常に良いレベルの圧縮を実現することを、実験に基づく研究は示している。

１つの実施形態では、本明細書は、モード選択エンジンを具備する符号化デバイスを与え、それは該符号化デバイスが第１の符号化規格又は第２の符号化規格に準拠するようにプログラムされているかどうかに拘らず内部予測符号化のためにモード選択を実行する。本デバイスは、しかも該符号化デバイスが該第１の符号化規格に準拠するようにプログラムされているときに、該第１の符号化規格に準拠する該選択されたモードにしたがって該内部予測符号化を実行するための第１のエンコーダ、及び該符号化デバイスが該第２の符号化規格に準拠するようにプログラムされているときに、該第２の符号化規格に準拠する該選択されたモードにしたがって該内部予測符号化を実行するための第２のエンコーダを含む。追加のエンコーダも、同様に含まれることができ、そしてモード選択エンジンの数は、エンコーダの数よりも少ないことがある。

本明細書中に説明されるこれらの技術及び他の技術は、ハードウェア、ソフトウェア、ファームウェア、又はこれらの任意の組み合わせでディジタル・ビデオ・デバイスにおいて実行されることができる。様々な実施形態のさらなる詳細は、添付された図面及び以下の説明に記述される。その他の特徴、目的及び利点は、詳細な説明及び図面から、そして特許請求の範囲から明らかになるであろう。

［詳細な説明］
図１は、具体例の符号化デバイス１０を説明するブロック図である。符号化デバイス１０は、一般に内部予測符号化技術を実行することが可能ないずれかの符号化デバイスを呼ぶ。多くのケースでは、符号化デバイス１０は、ビデオ符号化デバイスを備え、それはビデオ系列のフレームを符号化する。それらのケースでは、符号化デバイス１０は、例えば、様々なフレーム間符号化技術を実行するための複数のさらなるコンポーネントを含むことができる。しかしながら、ある複数のケースでは、符号化デバイス１０の様々なコンポーネントは、本明細書中に記述されるように、静止画像上に内部予測符号化技術を実行することができる。符号化デバイスの例は、ディジタル・テレビ、ディジタル・カメラ、ディジタル直接放送システム、無線通信デバイス、個人ディジタル補助装置（ＰＤＡ）、ラップトップ・コンピュータ、デスクトップ・コンピュータ、ディジタル記録デバイス、セルラ電話機又は衛星無線通信電話機、及びその他を含むことができる。一般に、本明細書中に記述される符号化技術を実行するいずれかのデバイスは、符号化デバイスであり得る。

符号化デバイス１０は、メモリ１２を含み、それは未圧縮画像又は未圧縮ビデオ・フレームを初めに記憶する。以下の説明において、本明細書は、ビデオ・フレームに関係して実行される動作及び技術を一般に言及する。しかしながら、同様な技術が静止画像の圧縮に関して適用されることができることが、理解される。ビデオ・フレームは、内部予測符号化技術の目的に関して静止画像と本質的に同じである。

符号化デバイス１０は、例えば、フレームを圧縮するために、メモリ１２中に記憶されたフレームの内部予測符号化のために様々なコンポーネントを含む。より具体的に、符号化デバイス１０は、２又はそれより多くの異なる符号化規格にしたがった内部予測符号化をサポートする。しかしながら、本明細書中に記述されるように、２又はそれより多くの異なる符号化規格のうちのどちらが所定の時間において使用されるかに拘らず、この内部予測符号化のためのモード選択をサポートしそして促進させるために設計されたハードウェア・エンジンは、共有されそして使用される。符号化デバイス１０は、専門販売業者（vendor）が使用されるべき特定の規格をプログラムすることを可能にするようにプログラム可能であり得て、さらに専門販売業者が２又はそれより多くの規格から選択できるように弾力的であり得る。２つのエンコーダを含むように一般的に記述されるが、符号化デバイス１０は、任意の数のエンコーダを含むことができる。モード選択エンジンの数は、エンコーダの数よりも少ないことがある。

図１に図示されたように、符号化デバイス１０は、第１の内部予測エンコーダ１４及び第２の内部予測エンコーダ１６を含む。第１の内部予測エンコーダ１４は、第１の符号化規格にしたがって内部予測符号化を実行する、ところが、第２の内部予測エンコーダ１６は、第２の符号化規格にしたがって内部予測符号化を実行する。第１の内部予測エンコーダ１４及び第２の内部予測エンコーダ１６は、それぞれハードウェア、ソフトウェア、及びファームウェアの組み合わせにより与えられることができる。特にエンコーダ１４及び１６は、１又はそれより多くのディジタル信号プロセッサ（ＤＳＰ：digital signal processor）、用途特定集積回路（ＡＳＩＣ：application specific integrated circuit）、フィールド・プログラマブル論理アレイ（ＦＰＧＡ：field programmable logic array）、汎用目的プロセッサ、又はこれらの任意の組み合わせを使用して与えられることができる。

内部予測符号化は、符号化されたビデオ・フレーム又はビデオ画像に必要とされるデータの量を圧縮するために所定のビデオ・フレーム又はビデオ画像内部の冗長性を活用する符号化プロセスを呼ぶ。エンコーダ１０は、少なくとも２つの符号化規格にしたがった内部予測符号化を可能にする。しかしながら、それぞれのケースにおいて、内部予測は、静止画像圧縮に対するような圧縮技術として単独で使用されることができる、又はフレーム間対比を同様に実行するビデオ符号化技術の一部として、及び／又は別の符号化技術の一部として使用されることができる。

様々な符号化規格にしたがって、モード選択プロセスは、内部予測符号化プロセスの一部として実行される。符号化デバイス１０は、モード選択エンジン１８を含み、内部予測符号化のためにこのモード選択を実行する。例えば、モード選択エンジン１８は、任意の所定の時間において必要とされる望ましい符号化レート、圧縮比又は符号化効率に基づいて、内部予測モードを選択することができる。しかしながら、従来のエンコーダとは異なり、符号化デバイス１０は、同じモード選択エンジン１８を使用して、内部予測エンコーダ１４及び第２の内部予測エンコーダ１６のためのモード選択を容易にする。モード選択エンジン１８は、第１の内部予測エンコーダ１４及び第２の内部予測エンコーダ１６のいずれでも使用されるハードウェア・コンポーネントを備えることができる。例えば、モード選択ハードウェアは、モード選択プロセスを促進させることが可能である。その上、専門販売業者は、エンコーダ１４及び１６のうちのいずれかに関係する２つの規格のうちのいずれをサポートするために符号化デバイス１０をプログラムすることが可能であるが、モード選択エンジン１８は、この選択に無関係に使用される。したがって、１つのモード選択エンジン１８の使用は、結果として複数の規格をサポートする符号化デバイス中のハードウェアの削減になることが可能である。

モード選択は、一般にフレームの別の部分を符号化しそして圧縮するために使用されるであろうフレームの一部分を識別するプロセスである。一例として、ＩＴＵＨ．２６３ビデオ符号化規格は、アネックスＩを含み、それはその規格に準拠する好ましいモード選択プロセスを記述する。Ｈ．２６３のアネックスＩに記述されたモード選択プロセスは、“内部”ビデオ・ブロックのコーディングがどのように実行されるかを規定する。内部ビデオ・ブロックのコーディング効率は、予測モードの弾力性を認めることによって改善されると言われる。Ｈ．２６３のアネックスＩは、３つの異なる予測モードを規定する。別の規格文書は、３つの予測モード、又はおそらくそれよりも多くを規定できるが、いずれのケースでも、これらの異なるモードを選択するために提案される（suggested）方法は、複数の規格文書間でかなり変化する。

ＩＴＵＨ．２６３規格のアネックスＩ中に記述された３つの予測モード、水平ＤＣ及びＡＣ（モード２）、垂直ＤＣ及びＡＣ（モード１）、及びＤＣのみ（モード０）、の間で、エンコーダのモード・セレクタは、一般的に、最小の絶対差の和（ＳＡＤ：sum of absolute different）基準を使用してベスト・モードを決定する。ＩＴＵＨ．２６３規格のアネックスＩに記述されているような内部予測モード選択プロセスは、図２を参照してより良く理解されることが可能である。本明細書中で使用されるように、ＤＣモードは、ビデオ・ブロックの平均値を表すビデオ・ブロックのＤＣ係数を使用するモードを呼ぶ、ところが、ＡＣモードは、ビデオ・ブロックの残りの（非ＤＣ）係数であるＡＣ係数を使用する。

図２を参照して、Ｃ［ｉ，ｊ］は、予測の前の現在のブロックの離散型コサイン変換（ＤＣＴ：discrete cosine transform）係数を表し、Ｃ’［０，０］は、モード０を使用する現在のブロックの予測されたＤＣ成分を表し、Ａ’［ｉ，０］、ｉ＝０，１，．．．７、は、モード１を使用する現在のブロックの予測された一番上の行を表し、そしてＢ’［０，ｊ］、ｊ＝０，１，．．．７、は、モード２を使用する現在のブロックの予測された左の列を表す。

ＳＡＤ０、ＳＡＤ１、ＳＡＤ２は、それぞれモード０、１、及び２に対する絶対差の和（ＳＡＤ）メトリック（metric（尺度））を表す。１つの８×８明度（ルーマ）ブロック又は色度（クロマ）ブロックに対するＳＡＤは、以下のように計算される：

次に、所定のブロックのＳＡＤは、６個のブロック（４個のルーマと２個のクロマ）に対するＳＡＤ_８×８の和である。ベスト・モードは、結果として最小のＳＡＤになるものである。

ＩＴＵＨ．２６３規格の提案された規格文書に整合する上記のアルゴリズムは、現在のブロックのＤＣＴ係数、ブロックＣ［ｉ，ｊ］、を必要とする。言い換えると、モード選択プロセスを含んでいる内部予測プロセスは、空間ドメインよりはむしろＤＣＴドメインにおいてＩＴＵＨ．２６３規格に対して提案された規格文書にしたがって実行される。そのケースでは、内部予測モード選択は、空間ドメインにおけるピクセルのＤＣＴ変換の後であるが、ＤＣＴ係数の量子化が実行される前に行われる必要がある。しかしながら、モード選択がＩＴＵＨ．２６４規格のような別の規格を用いる内部予測にしたがって実行されるときには、ＤＣＴ係数は一般的に発生されない。したがって、現在のブロックのＤＣＴ係数と予測する側のブロックのＤＣＴ係数との間のＳＡＤを使用するＩＴＵＨ．２６３規格中の内部予測に対して提唱された（proposed）規格文書に整合するモード選択判断は、ＩＴＵＨ．２６４規格のような規格に対して設計されたモード選択エンジンに対して弾力的ではない。ＭＰＥＧ−４に関して、内部予測及び内部予測のためのモード選択は、一般的にＤＣＴドメインにおいて実行されるが、ＩＴＵＨ．２６３よりもはるかに単純な方法で実行される。

本明細書は、ＩＴＵＨ．２６３モード選択に対する少なくとも２つの代案を考慮している。ある複数のケースでは、ＩＴＵＨ．２６３モード選択は、現在のブロックのＤＣＴ係数をあてにしないことができる。したがって、本明細書は、ＩＴＵＨ．２６３規格又は別の１つの規格が現在サポートされているかどうかに拘らず、共通モード選択エンジンがモード選択を実行することを可能にする。

ＭＰＥＧ−４では、現在のブロックに対する内部予測モードは、一般的に隣接するブロックの係数から決定され、それは現在のブロックのいずれの係数にも依存しない。ＭＰＥＧ−４では、各８×８ブロックに対するモードが決定される。ＭＰＥＧ−４と対照的に、ＩＴＵＨ．２６３規格に対して提唱されたモード選択方式は、１６×１６“マクロブロック”の左上のサブブロックに対するモードの決定を必要とするだけであり、それは全体のマクロブロックに対して使用される。

図３を参照して、そしてブロックＸの係数を表すためにＦ＿Ｘ［ｉ］［ｊ］を使用して、ここでブロックＸは処理されようとしている現在のマクロブロックの左上のブロックである、ＭＰＥＧ−４にしたがった内部予測モード選択プロセスは、“アルゴリズム１”と呼ばれる以下の擬似コードにしたがって要約されることができる：
もし（ブロックＡ，Ｂ又はＣのいずれかが現在のビデオ・セグメントの範囲外である）ならば、
モード０を使用する；
そうでなければ、もし（｜Ｆ＿Ａ［０］［０］−Ｆ＿Ｂ［０］［０］｜＜｜Ｆ＿Ｂ［０］［０］−Ｆ＿Ｃ［０］［０］｜）ならば、
ブロックＣから予測する（モード１）；
そうでなければ、
ブロックＡから予測する（モード２）；
終了
特に、アルゴリズム１は、モード選択がＭＰＥＧ−４に準拠するエンコーダに対してどのようにして実行されることが可能であるかを説明する。手短に、モード０は、隣接するブロックが現在のビデオ・ブロックの範囲外であるときに使用される。ブロックＢとＡとの間の平均ＤＣ差がブロックＢとＣとの間の平均差よりも小さい場合に、垂直予測が使用される。ブロックＢとＣとの間の平均差がブロックＢとＡとの間の平均差よりも小さい場合に、水平予測が使用される。

その上、アルゴリズム１は、より良い出来栄えを実現するために、以下のように、わずかに変形されることが可能である。下記は、“アルゴリズム２”と呼ばれる。

もし（ブロックＡ，Ｂ又はＣのいずれかが現在のビデオ・セグメントの範囲外である）ならば、
モード０を使用する；
そうでなければ、もし（｜Ｆ＿Ａ［０］［０］−Ｆ＿Ｂ［０］［０］｜＜｜Ｆ＿Ｂ［０］［０］−Ｆ＿Ｃ［０］［０］｜
＆＆｜Ｆ＿Ａ［０］［０］−Ｆ＿Ｂ［０］［０］｜／Ｆ＿Ａ［０］［０］＜０．０３）ならば、
ブロックＣから予測する（モード１）；
そうでなければ、もし（｜Ｆ＿Ｂ［０］［０］−Ｆ＿Ｃ［０］［０］｜／Ｆ＿Ｃ［０］［０］＜０．０３）ならば、
ブロックＡから予測する（モード２）；
そうでなければ、
モード０を使用する；
終了
アルゴリズム１と比較して、アルゴリズム２は、追加の条件を提案し、それはＤＣ予測の代わりに水平予測又は垂直予測のいずれかを実行するために、２つの隣接するブロック間の平均ＤＣ差がしきい値よりも低いことを必要とする。言い換えると、アルゴリズム２では、隣接するブロックが現在のビデオ・セグメントの範囲外であるとき、又は２つの隣接するブロック間の平均ＤＣ差がしきい値よりも低くないときに、モード０が使用される。ＭＰＥＧ−４における内部予測モード選択プロセスは、ＩＴＵＨ．２６３規格のような他の規格のためのモード選択プロセスに対して相対的に複雑でないという利点を有する。

ＩＴＵＨ．２６４推奨規格文書では、ＩＴＵＨ．２６３規格推奨とは異なり、内部予測は、ＤＣＴ係数の代わりにピクセルに基づく。しかしながら、下記にさらに詳細に説明するように、ベスト１６×１６ルーマ・モードは、圧縮の著しい損失又はピーク信号対ノイズ比（ＰＳＮＲ：peak signal-to-noise ratio）の著しい劣化なしに、ＩＴＵＨ．２６３内部予測のためのモードのように、ＩＴＵＨ．２６４規格文書にしたがって決定されることが可能である。この結果は、ＩＴＵＨ．２６３内部予測が空間ドメイン中のピクセルよりはむしろＤＣＴ係数に対して実行されるように示唆されることを、意外にも与えている。

ＩＴＵＨ．２６４推奨規格文書にしたがって、マクロブロックのルーマ成分に対して４つの１６×１６ルーマ・モード：ＤＣ、垂直、水平、及びプレーナ、がある。垂直モード、水平モード及びプレーナ・モードは、ビデオ・ブロックのＡＣ係数を使用する。初めの３つのモード：ＤＣ、垂直及び水平、は、内部予測のためのＩＴＵＨ．２６３規格のモードに対応するように使用されることが可能である。ある複数のケースでは、プレーナ・モードは、電力消費が問題でありそして処理能力が限られている特に手持ちデバイスにとって、計算するためにさらに複雑であることがあるので、初めの３つのモードだけが、ＩＴＵＨ．２６４モード選択のために同様に使用される。

再び、図１を参照して、符号化デバイス１０は、モード選択エンジン１８を含み、それは符号化デバイスが第１の符号化規格又は第２の符号化規格に準拠するようにプログラムされているかどうかに拘らず、内部予測符号化のためのモード選択を実行する。符号化デバイス１０が第１の符号化規格に準拠するようにプログラムされているときに、第１のエンコーダ１４は、第１の符号化規格に準拠する選択されたモードにしたがって内部予測符号化を実行する。符号化デバイスが第２の符号化規格に準拠するようにプログラムされているときに、第２のエンコーダ１６は、第２の符号化規格に準拠する選択されたモードにしたがって内部予測符号化を実行する。一例として、符号化デバイス１０は、ハンドセットを備えることができ、それは第１の符号化規格又は第２の符号化規格のいずれかに準拠するようにプログラムされることが可能である。したがって、専門販売業者は、符号化デバイス１０を第１の規格又は第２の規格のいずれかに準拠するようにプログラムすることができ、専門販売業者に対してより大きな弾力性を提供する。その上、第１のエンコーダ１４と第２のエンコーダ１６が共通のモード選択エンジン１８を使用するので、モード選択プロセスを加速させるためにモード選択ハードウェアを有する従来型のデュアル規格符号化デバイスと比較して、符号化デバイス１０は、単純化されることが可能である。符号化デバイス１０の別の例は、ディジタル・テレビ、ディジタル直接放送システム、無線通信デバイス、個人ディジタル補助装置（ＰＤＡ：personal digital assistants）、ラップトップ・コンピュータ、デスクトップ・コンピュータ、ディジタル・カメラ、ディジタル記録デバイス、セルラ電話機又は衛星無線通信電話機、及びその他を含む。

ある複数の実施形態では、モード選択エンジン１８は、第１のエンコーダ１４の一部を形成することができる。そのケースでは、符号化デバイス１０が第２の符号化規格に準拠するようにプログラムされているとき、第２のエンコーダ１６は、第１のエンコーダ１４のモード選択エンジン１８を使用する（implement）。言い換えると、別々のコンポーネントとして図示されているが、モード選択エンジン１８は、複数のエンコーダのうちの１つのハードウェア・コンポーネントを形成することができ、そして他方のエンコーダは、そのモード選択ハードウェアを同様に使用することが可能である。多種多様な他のコンポーネントは、符号化デバイス１０中に同様に含まれることができるが、単純化のために具体的には図示されていない。増設のエンコーダも、同様に含まれることができる。しかしながら、エンコーダの数に無関係に、２又はそれより多くのエンコーダが、本明細書中で説明するようにモード選択エンジンを共有できる。

図４は、ＭＰＥＧ−４に準拠する符号化及びＩＴＵＨ．２６３に準拠する符号化をサポートするビデオ符号化デバイス４０のより詳しいブロック図である。図４に示されたように、ビデオ符号化デバイス４０は、メモリ４２を含み、それは未圧縮の画像又は未圧縮のビデオ・フレームを初めに記憶する。符号化プロセスの全体を通して、メモリ４２は、同様に符号化されたままの及び圧縮されたままのビデオ・データを記憶するために使用されることができる。

ビデオ・デバイス４０は、ＭＰＥＧ−４エンコーダ４４及びＩＴＵＨ．２６３エンコーダ４６を含む。ＭＰＥＧ−４エンコーダ４４は、ＭＰＥＧ−４ビデオ符号化規格に準拠してビデオ系列を符号化し、そして同様に、ＩＴＵＨ．２６３エンコーダ４６は、ＩＴＵＨ．２６３ビデオ符号化規格に準拠してビデオ系列を符号化する。これらの規格の各々は、内部予測符号化とフレーム内符号化の両方を使用する。したがって、ＭＰＥＧ−４エンコーダ４４は、内部予測エンコーダ４７及びフレーム間エンコーダ４１を含み、そしてＩＴＵＨ．２６３エンコーダ４６は、内部予測エンコーダ４５及びフレーム間エンコーダ４３を含む。これらのコンポーネントの各々は、一般にエンコーダ４４及び４６に関係するそれぞれの符号化規格に準拠する。

上記に概略を示したように、内部予測符号化の間に実行される１つのプロセスは、内部予測モード選択である。特に、これらの異なる規格に対する推奨規格文書がモード選択を実行するために別の方法を規定するとはいえ、内部予測モード選択は、ＭＰＥＧ−４符号化及びＩＴＵＨ．２６３符号化の両者を考慮する。提案されたＭＰＥＧ−４内部予測モード選択は、提案されたＩＴＵＨ．２６３内部予測モード選択よりもはるかに複雑でない。

ＭＰＥＧ−４エンコーダ４４は、モード選択エンジン４８を含む。モード選択エンジン４８は、モード選択プロセスを加速するために設計されたハードウェアを備える。その上、モード選択エンジン４８は、ＭＰＥＧ−４規格に対して提案された規格文書に実質的に適合するモード選択を実行する。モード選択エンジン４８は、ＤＣＴドメインにおいてモード選択を実行するが、ＩＴＵＨ．２６３の提案された文書に比較して単純化された方式で、例えば、コード化されている現在のブロックからのＤＣＴ係数を必要としないで、モード選択を実行する。

ＩＴＵＨ．２６３エンコーダ４６は、それ自身のモード選択エンジンを含まない。その代わりに、モード選択のために、ＩＴＵＨ．２６３エンコーダ４６は、ＭＰＥＧ−４エンコーダ４４のモード選択エンジン４８を使用する。しかしながら、ＭＰＥＧ−４モード選択にしたがったＩＴＵＨ．２６３のためのモード選択が、ＩＴＵＨ．２６３モード選択に対して受け入れ可能な結果を提供することを、本明細書は認識する。

符号化デバイス４０は、例えば、専門販売業者からの、複数の符号化規格から符号化規格を指定するプログラミング命令を受け取ることができる。例えば、専門販売業者は、ＭＰＥＧ−４符号化又はＩＴＵＨ．２６３符号化のいずれかを指定できる。いずれのケースでも、内部予測符号化は、選択された符号化規格に準拠して実行される。しかしながら、モード選択は、上記に概要を示したように、ＭＰＥＧ−４符号化又はＩＴＵＨ．２６３符号化が専門販売業者によって指定されているかどうかに拘らず、提案されたＭＰＥＧ−４文書に記述されたように実行されることができる。

図５は、ビデオ符号化デバイス５０のより詳しいブロック図であり、それはＩＴＵＨ．２６４に準拠する符号化及びＩＴＵＨ．２６３に準拠する符号化をサポートする。図５に示されたように、ビデオ符号化デバイス５０は、メモリ５２を含み、それは未圧縮の画像又は未圧縮のビデオ・フレームを初めに記憶する。符号化プロセスの全体を通して、メモリ５２は、しかも符号化されたままの及び圧縮されたままのビデオ・データを記憶するために使用されることができる。図５の実施形態に矛盾なく、本明細書にしたがった方法は、離散型余弦変換（ＤＣＴ）ドメインにおける内部予測を指定する提案された規格文書を有する符号化規格に準拠するようにプログラムされた符号化デバイス中で内部予測符号化のために空間ドメインにおいてモード選択を実行することを備えることができる。

ビデオ符号化デバイス５０は、ＩＴＵＨ．２６４エンコーダ５４及びＩＴＵＨ．２６３エンコーダ５６を含む。ＩＴＵＨ．２６４エンコーダ５４は、ＩＴＵＨ．２６４ビデオ符号化規格に準拠してビデオ系列を符号化し、そして同様に、ＩＴＵＨ．２６３エンコーダ５６は、ＩＴＵＨ．２６３ビデオ符号化規格に準拠してビデオ系列を符号化する。これらの規格の各々は、内部予測符号化とフレーム内符号化の両方を使用する。したがって、ＩＴＵＨ．２６４エンコーダ５４は、内部予測エンコーダ５５及びフレーム間エンコーダ５１を含み、そしてＩＴＵＨ．２６３エンコーダ５６は、内部予測エンコーダ５７及びフレーム間エンコーダ５３を含む。これらのコンポーネントの各々は、一般にエンコーダ５４及び５６に関係するそれぞれの符号化規格に準拠する。

ＩＴＵＨ．２６４推奨規格文書は、内部予測が空間ドメインにおいてピクセルに対して実行されるべきであることを規定する。再び、提案されたＩＴＵＨ．２６３内部予測は、対照的に、離散型余弦変換（ＤＣＴ）ドメインにおける係数に関して実行される。ＩＴＵＨ．２６４推奨規格文書にしたがって、マクロブロックのルーマ成分に対する４つの１６×１６ルーマ・モード：ＤＣ、垂直、水平、及びプレーナ、がある。初めの３つ：ＤＣ、垂直及び水平、は、内部予測のためのＩＴＵＨ．２６３規格のモードに対応するように使用されることが可能である。

ＩＴＵＨ．２６４エンコーダ５４は、モード選択エンジン５８を含む。モード選択エンジン５８は、モード選択プロセスを加速するために設計されたハードウェアを備える。その上、モード選択エンジン５８は、ＩＴＵＨ．２６４規格に対して提案された規格文書に実質的に適合するモード選択を実行する。しかしながら、ある複数のケースでは、プレーナ・モードが処理するためにより複雑であり得るので、初めの３つのモードだけがＩＴＵＨ．２６４モード選択のために使用されることができる。ＩＴＵＨ．２６４モード選択のためにプレーナ・モードの使用を避けることは、ビデオ符号化デバイス５０のハードウェアを単純化することに、電力消費量を削減することに、そしてバッテリー寿命を延長することに役立つことがある。いずれのケースでも、モード選択エンジン５８は、空間ドメインにおいて、すなわち、空間ドメインにおけるピクセル値に基づいて、モード選択を実行する。

ＩＴＵＨ．２６３エンコーダ５６は、それ自身のモード選択エンジンを含まない。その代わりに、モード選択のために、ＩＴＵＨ．２６３エンコーダ５６は、ＩＴＵＨ．２６４エンコーダ５４のモード選択エンジン５８を使用する。再び、ＩＴＵＨ．２６３規格に対する推奨規格文書は、内部予測がＤＣＴドメインにおいて、すなわち、ＤＣＴ係数に基づいて実行されることを規定するので、これは直感に反している。しかしながら、空間ドメインにおけるＩＴＵＨ．２６３のためのモード選択が受け入れ可能な結果を提供することを、本発明は認識する。

ＩＴＵＨ．２６４推奨規格文書にしたがって、マクロブロックのルーマ成分に対する４つの１６×１６ルーマ・モード：ＤＣ、垂直、水平、及びプレーナ、がある。初めの３つ：ＤＣ、垂直及び水平、は、モード選択エンジン５８によって決定されることが可能であり、そして内部予測のためにＩＴＵＨ．２６３規格のモードに対応するようにＩＴＵＨ．２６３エンコーダ５６によって使用されることが可能である。その上、ある複数のケースでは、プレーナ・モードが、特に電力消費及び処理能力がさらに限られている手持ちデバイスにとって、計算するためにより複雑であることがあるので、初めの３つのモードだけが、ＩＴＵＨ．２６４モード選択のためにＩＴＵＨ．２６４エンコーダ５４によって使用される。ある複数の実施形態では、プレーナ・モードは、エンコーダ５４による使用のためにモード選択エンジン５８によって計算されことが可能であるが、デバイス５０がＩＴＵＨ．２６３符号化をサポートするようにプログラムされている場合には、モード選択エンジン５８は、プレーナ・モードに関係するそのような計算を避けることができる。

図６は、ビデオ符号化デバイス６０のブロック図であり、それは２又はそれより多くの符号化規格にしたがってビデオ符号化をサポートする。ビデオ符号化デバイス６０は、図１のビデオ符号化デバイス１０に非常に良く似ているが、複数の増設コンポーネントを含む。符号化装置７０は、ビデオ取り込みデバイス６１、ディスプレイ６３、ビデオ・メモリ６５及び送信機６７とともにデバイス６０中へとパッケージされたチップセットを備えることができる。送信機６７は、無線送信機であり得る。これらの様々なコンポーネントは、通信バス６９を介して通信的に接続されることができる。他のコンポーネントも、同様に含まれることができる。

符号化装置７０は、ローカル高速メモリ６２を含み、チップ外のビデオ・メモリ６５からビデオ系列をロードされる。ビデオ系列は、本明細書中に記述されたように符号化される。デバイス６０は、複数の符号化規格をサポートし、そして専門販売業者は、使用されるべき符号化規格を選択することが可能である。

符号化装置７０は、モード選択エンジン６８を含み、それは符号化装置７０が第１の符号化規格又は第２の符号化規格に準拠するようにプログラムされているかどうかに拘らず内部予測符号化のためのモード選択を実行する。モード選択エンジン６８は、モード選択プロセスを加速するために与えられたハードウェアを備えることができる。装置７０は、しかも第１の内部予測エンコーダ６４及び第２の内部予測エンコーダ６６を含み、第１の内部予測エンコーダ６４は、装置７０が第１の符号化規格に準拠するようにプログラムされているときに第１の符号化規格に準拠する選択されたモードにしたがって内部予測符号化を実行し、そして第２の内部予測エンコーダ６６は、装置が第２の符号化規格に準拠するようにプログラムされているときに第２の符号化規格に準拠する選択されたモードにしたがって内部予測符号化を実行する。エンコーダ６４及び６６は、それぞれハードウェア、ソフトウェア、及びファームウェアの任意の組み合わせを備えることができる。エンコーダ６４、６６は、しかも１又はそれより多くのディジタル信号プロセッサ（ＤＳＰ：digital signal processor）、用途特定集積回路（ＡＳＩＣ：application specific integrated circuit）、ＦＰＧＡ、汎用プロセッサ、又はこれらの任意の組み合わせによって与えられることができる。

ビデオ取り込みデバイス６１は、ビデオ系列を取り込むためにビデオ・カメラを備えることができ、そしてビデオ・メモリ６５中に取り込まれた系列を記憶することができる。特に、ビデオ取り込みデバイス６１は、電荷結合素子（ＣＣＤ：charge coupled device）、電荷注入デバイス、フォトダイオードのアレイ、相補型金属酸化物半導体（ＣＭＯＳ：complementary metal oxide semiconductor）デバイス、若しくはビデオ画像又はディジタル・ビデオ系列を取り込むことが可能ないずれかの他の光感応性デバイスを含むことができる。ディスプレイ６３は、復号されたビデオ系列を表示することができ、そして送信機６７は、符号化されたビデオ系列を伝送できる。ある複数のケースでは、ビデオ取り込みデバイスは、ビデオ系列を取り込み、それは選択された規格にしたがって符号化され、そしてそれから送信機６７によってリアルタイムで伝送される。モード選択エンジン６８は、内部予測符号化の間にモード選択プロセスを加速させることによってこのリアルタイム符号化を改善することが可能である。

ビデオ・メモリ６５は、一般的に比較的大きなメモリ空間を備える。ビデオ・メモリ６５は、例えば、ダイナミック・ランダム・アクセス・メモリ（ＤＲＡＭ：dynamic random access memory）、又はＦＬＡＳＨメモリを備えることができる。別の例では、ビデオ・メモリ６５は、不揮発性メモリ又はいずれかの他のデータ記憶デバイスを備えることができる。対照的に、ローカル・メモリ６２は、ビデオ・メモリ６５と比較して小さなメモリ空間そしてより早いメモリ空間を備えることができる。一例として、ローカル・メモリ６２は、シンクロナス・ランダム・アクセス・メモリ（ＳＤＲＡＭ：synchronous random access memory）を備えることができる。ローカル・メモリ６２は、同様に、装置７０の別のコンポーネントとともに集積された“オン−チップ”メモリを備えることもでき、プロセッサに集中する符号化プロセスの間にデータへの非常に高速なアクセスを提供することができる。

図７は、本明細書の教示に一致するプロセスを説明するフロー図である。図７は、図１の符号化デバイス１０を参照して説明される。図７に示されたように、デバイス１０は、第１の符号化規格（規格１）に実質的に準拠するモード選択エンジン１８を使用してモード選択を実行する（７１）。デバイス１０が第１の規格にしたがって符号化するようにプログラムされている場合（７２の分岐規格１）、デバイスは、規格１に準拠してフレームを符号化する（７３）。デバイス１０が第２の規格にしたがって符号化するようにプログラムされている場合（７２の分岐規格２）、デバイスは、規格２に準拠してフレームを符号化する（７４）。上記に概略を示したように、モード選択エンジン１８が規格のうちの１つに対する内部予測ドメインとは異なるドメインにおいてそのようなモード選択を実行する場合でさえも、モード選択エンジン１８は、両方の規格に対して共用されることが可能である。下記の表１−４及び図８−１１のグラフは、本明細書中で説明したモード選択技術が非常に良い結果を実現することを確認する実験結果を与える。

下記の表１−４は、それぞれ図８−１１のグラフに対応する。本明細書にしたがって、４つのビデオ系列が、ＩＴＵＨ．２６３符号化のあいだに試験された。系列は、フォアマン（Foreman）、マザー（Mother）、コーストガード（Coast-guard）、及びクレア（Claire）と名付けられ、別の系列を区別する。各系列は、３００フレームからなる。各系列は、Ｈ．２６３、ＭＰＥＧ−４及びＩＴＵＨ．２６４に対する推奨規格文書に実質的に整合する種々のモード判断方式を使用してＩＴＵＨ．２６３規格に準拠して内部予測符号化された。内部期間（intra period）は、５フレームであった。ピーク信号対ノイズ比（ＰＳＮＲ）、同様に最小ＳＡＤ法の代わりにＭＰＥＧ−４方式又はＩＴＵＨ．２６４方式の使用に起因するレート増加、は、表１−４に列挙されている。各系列に対するそれぞれのレート歪曲線（rate-distortion curves）が、図８−１１にプロットされている。

表及び図では、“Ｈ．２６３”は、ＩＴＵＨ．２６３規格文書のアネックスＩに概略を示されたように、最小ＳＡＤモード選択が使用されたときのＩＴＵＨ．２６３符号化を呼ぶ。“ＭＰＥＧ−４”は、アルゴリズム２（上記）に整合し、ＭＰＥＧ−４推奨規格文書と比較してわずかに変更されたモード選択技術が使用されたときのＩＴＵＨ．２６３符号化を呼ぶ。“Ｈ．２６４”は、ＩＴＵＨ．２６４推奨規格文書の初めの３つのモード（プレーナ・モードを除く）がＩＴＵＨ．２６３符号化におけるモード選択のために使用されたときの符号化を呼ぶ。ＭＰＥＧ−４及びＨ．２６４の“レート増加”は、Ｈ．２６３モード選択を用いた符号化に対して相対的なレート増加を同定する。

ＩＴＵＨ．２６３符号化に対して提案された最小ＳＡＤベースの技術を使用しないことによって、影響を受けたビット・レート費用は、わずかに高いことが、観測される。アルゴリズム２（上記）で説明したようにわずかに変更されたＭＰＥＧ−４モード選択方式を使用することは、ＩＴＵＨ．２６３符号化のあいだに、ほぼ同じＰＳＮＲを実現するために、結果として最小ＳＡＤ法と比較して１１％未満のビット・レート増加になる。ＩＴＵＨ．２６４選択方式が上記のように使用されたときに、出来栄えは、さらに良くなり、そしてＩＴＵＨ．２６３提案文書によって予想される最小ＳＡＤ法を使用して実現されることが可能な出来栄えに非常に近くなった。ＩＴＵＨ．２６４選択方式が使用されたときのビット・レート増加は、５％未満であった。特に、レートは、ＩＴＵＨ．２６４モード選択技術が使用されたときに、ある複数のケースでは実際に減少した。

要するに、ＩＴＵＨ．２６３内部予測モード選択に対して調査された２つの異なる代案が検討された。ＩＴＵＨ．２６４モード選択は、ＩＴＵＨ．２６３内部予測の代わりに使用されることが可能であるが、ＩＴＵＨ．２６３内部予測に対して提案された文書と対照的に、空間ドメインにおいて実行される。ＭＰＥＧ−４モード選択も、同様にＩＴＵＨ．２６３内部予測の代わりに使用されることが可能であるが、ＩＴＵＨ．２６３に対して提案された文書よりもはるかに複雑でない。もし電力消費量が重大な関心事でなければ、ＩＴＵＨ．２６４モード選択エンジンのモード選択判断は、ＤＣＴ係数を必要とする最小ＳＡＤ法に対する良い代案として機能する。出来栄えの隔たりは、非常に小さい。もしより複雑でないことが望まれる場合でさえ、アルゴリズム２（上記）によってわずかに変更されているので、ＭＰＥＧ−４モード選択エンジンのモード選択判断は、妥当な出来栄えの低下をともなう代案である。

複数の異なる実施形態が記述されてきている。これらの実施形態そして他の実施形態は、特許請求の範囲のスコープの範囲内である。

図１は、本明細書の１実施形態にしたがった具体例の符号化デバイスを説明するブロック図である。図２は、ＩＴＵＨ．２６３規格のアネックスＩにおいて記述される符号化プロセスの説明を助けるために使用する図である。図３は、ＭＰＥＧ−４文書で記述されるものに類似のモード選択を使用する符号化プロセスの説明を助けるために使用する図である。図４は、ＭＰＥＧ−４に準拠する符号化及びＩＴＵＨ．２６３に準拠する符号化をサポートするビデオ符号化デバイスのブロック図である。図５は、ＩＴＵＨ．２６４に準拠する符号化及びＩＴＵＨ．２６３に準拠する符号化をサポートするビデオ符号化デバイスの図である。図６は、本明細書の１実施形態にしたがった具体例の符号化デバイスを説明する別の１つのブロック図である。図７は、本明細書の教示に整合するプロセスを説明するフロー図である。図８は、本明細書中に記述されたモード選択技術が非常に良い結果を実現することを確認する実験結果のグラフである。図９は、本明細書中に記述されたモード選択技術が非常に良い結果を実現することを確認する実験結果のグラフである。図１０は、本明細書中に記述されたモード選択技術が非常に良い結果を実現することを確認する実験結果のグラフである。図１１は、本明細書中に記述されたモード選択技術が非常に良い結果を実現することを確認する実験結果のグラフである。

符号の説明

１０…符号化デバイス，１２…メモリ，１４…第１の内部予測エンコーダ，１６…第２の内部予測エンコーダ，１８…モード選択エンジン。

Claims

符号化デバイスが第１の符号化規格又は第２の符号化規格に準拠するようにプログラムされているかどうかに拘らず内部予測符号化のためにモード選択を実行するモード選択エンジン；
該符号化デバイスが該第１の符号化規格に準拠するようにプログラムされているときに、該第１の符号化規格に準拠する該選択されたモードにしたがって該内部予測符号化を実行するための第１のエンコーダ；及び
該符号化デバイスが該第２の符号化規格に準拠するようにプログラムされているときに、該第２の符号化規格に準拠する該選択されたモードにしたがって該内部予測符号化を実行するための第２のエンコーダ、
を具備することを特徴とする符号化デバイス。
該符号化デバイスは、該第１の符号化規格又は該第２の符号化規格のいずれかに準拠するようにプログラムされることが可能であることを特徴とする請求項１の符号化デバイス。
該第１のエンコーダ及び該第２のエンコーダは、ビデオ系列を符号化するビデオ・エンコーダを備えることを特徴とする請求項１の符号化デバイス。
該モード選択エンジンは、該第１のエンコーダの一部を形成し、そして該符号化デバイスが該第２の符号化規格に準拠するようにプログラムされているときに、該第２のエンコーダは、該第１のエンコーダの該モード選択エンジンを使用することを特徴とする請求項１の符号化デバイス。
該第１の符号化規格は、国際電気通信連合（ＩＴＵ）Ｈ．２６４規格に準拠し、そして該第２の符号化規格は、ＩＴＵＨ．２６３規格に準拠することを特徴とする請求項１の符号化デバイス。
該モード選択エンジンは、空間ドメインにおいてモード選択を実行することを特徴とする請求項５の符号化デバイス。
該第１の符号化規格は、動画像エキスパート・グループ（ＭＰＥＧ）−４規格に準拠し、そして該第２の符号化規格は、ＩＴＵＨ．２６３規格に準拠することを特徴とする請求項１の符号化デバイス。
該モード選択エンジンは、ＤＣＴドメインにおいてモード選択を実行するが、該ＩＴＵＨ．２６３規格によって提案されたようなモード選択とは異なる方法であることを特徴とする請求項７の符号化デバイス。
該第１の符号化規格に対して提案された規格文書は、第１のドメインにおける内部予測を指定し、そして該第２の符号化規格に対して提案された規格文書は、第２のドメインにおける内部予測を指定する、ここにおいて、該モード選択エンジンは、該符号化デバイスが該第１の符号化規格又は該第２の符号化規格に準拠するようにプログラムされているかどうかに拘らず該第１のドメインにおいてモード選択を実行することを特徴とする請求項１の符号化デバイス。
該第１の符号化規格に対して提案された規格文書は、空間ドメインにおける内部予測を指定し、そして該第２の符号化規格に対して提案された規格文書は、離散型余弦変換（ＤＣＴ）ドメインにおける内部予測を指定することを特徴とする請求項１の符号化デバイス。
該モード選択エンジンは、該符号化デバイスが該第１の符号化規格又は該第２の符号化規格に準拠するようにプログラムされているかどうかに拘らず空間ドメインにおいて該モード選択を実行することを特徴とする請求項１０の符号化デバイス。
該第１のエンコーダ及び該第２のエンコーダのうちの１つによって符号化されたビデオ・フレームを伝送するための送信機をさらに具備することを特徴とする請求項１の符号化デバイス。
リアルタイムでビデオ・フレームを取り込むためのビデオ取り込みデバイスをさらに具備する、ここにおいて、該第１のエンコーダ及び該第２のエンコーダはリアルタイムで該ビデオ・フレームを符号化するために構成され、そして該送信機は、リアルタイムで該符号化されたビデオ・フレームを伝送するために構成されることを特徴とする請求項１２の符号化デバイス。
離散型余弦変換（ＤＣＴ）ドメインにおける内部予測を指定する提案された規格文書を有する符号化規格を含む複数の符号化規格に準拠するようにプログラムされた符号化デバイスにおいて、前記複数の符号化規格に共通の１つのモード選択エンジンによって、内部予測符号化のために空間ドメインまたはＤＣＴドメインにおいてモード選択を実行することと、
前記符号化デバイスによって、前記選択されたモードに基づいて前記内部予測符号化を実行することと、
を具備することを特徴とする方法。
前記符号化デバイスが、該複数の符号化規格のうち該ＤＣＴドメインにおける内部予測を指定する提案された規格文書を有する符号化規格を指定するプログラミング命令を外部から受け取ること、をさらに具備することを特徴とする請求項１４の方法。
前記選択されたモードに基づいて前記内部予測符号化を実行することは、該ＤＣＴドメインにおける内部予測を指定する提案された規格文書を有する符号化規格に準拠する選択されたモードに基づいて内部予測符号化を実行すること、を特徴とする請求項１４の方法。
前記符号化デバイスによって、該ＤＣＴドメインにおける内部予測を指定する提案された規格文書を有する符号化規格に準拠してフレーム内符号化を実行すること、をさらに具備することを特徴とする請求項１６の方法。
該ＤＣＴドメインにおける内部予測を指定する提案された規格文書を有する符号化規格は、国際電気通信連合（ＩＴＵ）Ｈ．２６３規格に準拠することを特徴とする請求項１４の方法。
符号化デバイスが第１の符号化規格又は第２の符号化規格に準拠するようにプログラムされているかどうかに拘らず該第１の符号化規格に準拠するモード選択エンジンを使用して内部予測符号化するためにモード選択を実行すること；
該符号化デバイスが該第１の符号化規格に準拠するようにプログラムされているときに、該第１の符号化規格に準拠する該選択されたモードにしたがって該内部予測符号化を実行すること；及び
該符号化デバイスが該第２の符号化規格に準拠するようにプログラムされているときに、該第２の符号化規格に準拠する該選択されたモードにしたがって該内部予測符号化を実行すること、
を具備することを特徴とする方法。
該第１の符号化規格は、国際電気通信連合（ＩＴＵ）Ｈ．２６４規格に準拠し、そして該第２の符号化規格は、ＩＴＵＨ．２６３規格に準拠することを特徴とする請求項１９の方法。
該第１の符号化規格は、動画像エキスパート・グループ（ＭＰＥＧ）−４規格に準拠し、そして該第２の符号化規格は、ＩＴＵＨ．２６３規格に準拠することを特徴とする請求項１９の方法。
空間ドメインにおいてモード選択を実行することをさらに具備することを特徴とする請求項１９の方法。
該第１の符号化規格に対して提案された規格文書は、第１のドメインにおける内部予測を指定し、そして該第２の符号化規格に対して提案された規格文書は、第２のドメインにおける内部予測を指定する、ここにおいて、該方法は、該符号化デバイスが該第１の符号化規格又は該第２の符号化規格に準拠するようにプログラムされているかどうかに拘らず該第１のドメインにおいてモード選択を実行することをさらに具備することを特徴とする請求項１９の方法。
該第１の符号化規格に対して該提案された規格文書は、空間ドメインにおける内部予測を指定し、そして該第２の符号化規格に対して該提案された規格文書は、離散型余弦変換（ＤＣＴ）ドメインにおける内部予測を指定することを特徴とする請求項１９の方法。
符号化装置が第１の符号化規格又は第２の符号化規格に準拠するようにプログラムされているかどうかに拘らず内部予測符号化のためにモード選択を実行するモード選択エンジン；
該符号化装置が該第１の符号化規格に準拠するようにプログラムされているときに、該第１の符号化規格に準拠する該選択されたモードにしたがって該内部予測符号化を実行するための手段；及び
該符号化装置が該第２の符号化規格に準拠するようにプログラムされているときに、該第２の符号化規格に準拠する該選択されたモードにしたがって該内部予測符号化を実行するための手段、
を具備することを特徴とする装置。
該装置は、該第１の符号化規格又は該第２の符号化規格のいずれかに準拠するようにプログラムされることが可能であるチップセットを具備することを特徴とする請求項２５の装置。
該モード選択エンジンは、第１のエンコーダの一部を形成し、そして該符号化装置が該第２の符号化規格に準拠するようにプログラムされているときに、第２のエンコーダは、該第１のエンコーダの該モード選択エンジンを使用することを特徴とする請求項２５の装置。
該モード選択エンジンは、ハードウェアを具備することを特徴とする請求項２５の装置。
該第１の符号化規格に準拠する該選択されたモードにしたがって該内部予測符号化を実行するための該手段は、該モード選択エンジンを含んでいるハードウェア及びソフトウェアの組み合わせを備える；及び
該第２の符号化規格に準拠する該選択されたモードにしたがって該内部予測符号化を実行するための該手段は、該モード選択エンジンを含んでいるハードウェア及びソフトウェアの前記組み合わせと別の組み合わせを備えることを特徴とする請求項２８の装置。
該第１の符号化規格に対して提案された規格文書は、第１のドメインにおける内部予測を指定し、そして該第２の符号化規格に対して提案された規格文書は、第２のドメインにおける内部予測を指定する、ここにおいて、該モード選択エンジンは、該符号化装置が該第１の符号化規格又は該第２の符号化規格に準拠するようにプログラムされているかどうかに拘らず該第１のドメインにおいてモード選択を実行することを特徴とする請求項２５の装置。
該第１の符号化規格に対して提案された規格文書は、空間ドメインにおける内部予測を指定し、そして該第２の符号化規格に対して提案された規格文書は、離散型余弦変換（ＤＣＴ）ドメインにおける内部予測を指定することを特徴とする請求項３０の装置。