JP4491349B2 - ビデオ・データのイントラ符号化方法及び装置 - Google Patents

ビデオ・データのイントラ符号化方法及び装置 Download PDF

Info

Publication number
JP4491349B2
JP4491349B2 JP2004562614A JP2004562614A JP4491349B2 JP 4491349 B2 JP4491349 B2 JP 4491349B2 JP 2004562614 A JP2004562614 A JP 2004562614A JP 2004562614 A JP2004562614 A JP 2004562614A JP 4491349 B2 JP4491349 B2 JP 4491349B2
Authority
JP
Japan
Prior art keywords
sub
block
video
intra
blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2004562614A
Other languages
English (en)
Other versions
JP2005532768A5 (ja
JP2005532768A (ja
Inventor
コンクリン,グレゴリー・ジェイ
Original Assignee
リアルネットワークス・インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/732,522 external-priority patent/US6765964B1/en
Application filed by リアルネットワークス・インコーポレイテッド filed Critical リアルネットワークス・インコーポレイテッド
Publication of JP2005532768A publication Critical patent/JP2005532768A/ja
Publication of JP2005532768A5 publication Critical patent/JP2005532768A5/ja
Application granted granted Critical
Publication of JP4491349B2 publication Critical patent/JP4491349B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation

Description

関連出願
(関連出願)
本出願は、2000年12月6日出願の「System and Method for Intracoding Video Data」という名称の米国出願09/732522の一部継続出願である。
本出願はまた、以下の仮出願の優先権を主張するものである。
a)2002年7月8日出願の「Low Complexity Diagonal Mode for Intra−Prediction」という名称の仮出願60/394524、
b)2002年9月27日出願の「Reducing Pixel Dependencies for Intra Prediction」という名称の仮出願60/414210、
c)2002年10月1日出願の「Reducing Pixel Dependencies for Intra Prediction With Varying Block Sizes」という名称の仮出願60/415447。
これらの出願の明細書は参照により完全に本明細書に組み込まれる。
本発明は、ビデオ・データを送信又は格納するために圧縮し、このビデオ・データを表示するために圧縮解除するビデオ・システムに関する。より詳細には、本発明は、ビデオ・データをイントラ符号化するためのビデオ・システムと方法に関する。
ビデオ・システムは大量のビデオ・データを送信し、処理し、格納する。ビデオ・ムービーなどのビデオ・プレゼンテーションを作成するために、レンダリング・ビデオ・システムは、ビデオ・データを「フレーム」とも呼ばれる複数のデジタル・画像として表示し、それにより動きをシミュレートする。受け入れ可能なビデオ品質を有するビデオ・プレゼンテーションを達成するために、あるいは、送信及び格納を可能にするために、従来のビデオ・システムはビデオ・データを送信又は格納の前に修正する。例えば、ビデオ・システムはビデオ・データを圧縮し、符号化して、格納及び送信のためのビット・レートを低減する。
従来のビデオ・システムでは、ビデオ・エンコーダは、ビデオ・データを圧縮及び符号化するために使用され、ビデオ・デコーダは、ビデオ・データを圧縮解除及び復号するために使用される。ビデオ・エンコーダは、低減されたビット・レート及び低減された冗長性を有するビデオ・データを出力する。すなわち、ビデオ圧縮の技術は、ビデオ・フレーム内の空間的冗長性、又は、複数の連続ビデオ・フレームの間の時間的冗長性を除去する。
ビデオ・エンコーダ及びビデオ・デコーダを、ビデオ・ストリームを圧縮するための2つのタイプの符号化、すなわちイントラ符号化とインター符号化のうち1つを適用するように構成することができる。これらの2つのタイプの符号化は、ビデオ・フレームの統計プロパティに基づく。ビデオ・フレームがイントラ符号化を使用して符号化されるとき、圧縮は、一つのフレーム(圧縮されるフレーム)内に含まれた情報に基付いて、そのフレーム内の空間的冗長性を使用して行われる。したがって、イントラ符号化は他のいかなるフレームにも依存しない。対照的に、インター符号化は少なくとも1つの他のフレームを参照として使用し、圧縮されるフレームと参照フレームの間の違いを符号化する。したがって、インター符号化は、ビデオ・データ内の複数の連続フレームの間の時間的冗長性に基づく。
ビデオ圧縮の分野は、例えば、ビデオ符号化と復号化のための均一の要件を定義する様々な国際電気通信連合(ITU)規格など、国際規格を受ける。通常、これらの規格は、業界からの寄与に基づいて発展する。加えて、ビデオ・コーダ及びデコーダのメーカーもまた国際規格を修正し、あるいはこれに基づき、またビデオ圧縮のための追加のメーカー独自の技術を実施する。
国際規格及びメーカー独自の技術の存在にもかかわらず、なお、ビデオ圧縮のための改良された技術の必要性がある。例えば、表示されたビデオ・ムービーの品質は、ビデオ圧縮のために使用された技術から直接左右される。ビデオ圧縮技術のあらゆる改良は、ビデオ・ムービーを見る者にとってより満足のいくものにする。
本発明のこれら及び他の態様、利点、及び新規な特徴は、以下の詳細な説明を読んだ上で、また、添付の図面を参照した上で明らかになるであろう。
以下の説明では、例示として、本発明を実施することができる特定の実施形態の一部を形成し、これを示す、添付の図面を参照する。本発明の範囲から逸脱することなく、他の実施形態を利用することができ、構造上の変更を行なうことができることを理解されたい。可能である場合、同じ参照番号は図面の全体に渡って同じ又は類似の構成要素を指すために使用される。本発明に対して十分な理解を与えるために、多数の特定の詳細が示される。しかし、本発明をこれらの特定の詳細なしに、あるいはある代替の、本明細書で説明するものに相当する装置と方法と共に実施することができることは、当業者には明らかになるであろう。他の場合では、周知の方法、手順、構成要素、装置については、本発明の態様を不必要に曖昧にしないようにするため、詳細に説明していない。
様々なオペレーションを、複数の離散ステップとして、本発明の理解の助けとなる方法で説明するが、説明の順序は、これらのオペレーションが必ずしも順序に依存することを示唆するように解釈されるべきではない。特に、これらのオペレーションは提示の順序で実行される必要はない。
「一実施形態では」という句は繰り返し使用される。この句は一般に同じ実施形態を指さないが、同じ実施形態を指す場合がある。「備える」、「有する」及び「含む」という語は、特に文脈で指示しない限り、同義語である。
図1は、エンコーダ装置3と、そのエンコーダ装置3にメディア9を介して結合されるデコーダ装置5を有するビデオ圧縮及び圧縮解除システム1(以下「ビデオ・システム1」)の高レベル・ブロック図である。エンコーダ装置3は、ビデオ・エンコーダ2、モード・セレクタ14、バッファ8を含む。デコーダ装置5は、バッファ10、ビデオ・デコーダ12、モード・セレクタ16を含む。エンコーダ装置3はビデオ・シーケンス20(VIDEO IN)を受信し、そのビデオ・シーケンス20を符号化して、符号化された、したがって圧縮されたプレゼンテーションを、いくつかの可能なフォーマットの1つで生成する。フォーマットを、符号化されたプレゼンテーションの「ライブ」ストリーミング向けに調整されたインターリーブされたフォーマットにすることができる。フォーマットを、符号化されたプレゼンテーションの各々が1つのファイル内の連続ブロックに格納される単一のファイル・フォーマットにすることもできる。
エンコーダ装置3へのビデオ・シーケンス20入力は、例えばビデオ・カメラによって提供されるライブ信号、又は、所定のフォーマットにおいて事前記録されたシーケンスにすることができる。ビデオ・シーケンス20には、デジタル・ビデオのフレーム、デジタル・オーディオからなるオーディオ・セグメント、ビデオ、グラフィックス、テキスト及び/又はオーディオの組合せ(マルチメディア・アプリケーション)、又は、前述のアナログ形式が含まれる。必要な場合、アナログ・ビデオ、又は事前に圧縮及び符号化されたビデオなど、様々なタイプの入力信号に変換を適用して、エンコーダ装置3への適切な入力を生成することができる。一実施形態では、エンコーダ装置3はビデオをRGB又はYUVフォーマットで受け入れることができる。しかし、エンコーダ装置3を、適切な変換メカニズムが供給される限り、いかなるフォーマットの入力をも受け入れるように適合させることができる。あるフォーマットの信号を別のフォーマットの信号に変換するための変換メカニズムは、当技術分野で周知である。
メディア9は、ストレージ・デバイス又は送信メディアとすることができる。一実施形態では、ビデオ・システム1をコンピュータ上で実装することができる。エンコーダ装置3は、符号化済ビデオ・ストリーム(プレゼンテーション)を、ストレージ・デバイスとして実装されるメディア9に送信する。ストレージ・デバイスはビデオ・サーバ、ハード・ディスク・ドライブ、CD再書き込み可能ドライブ、リード/ライトDVDドライブ、又は、符号化済ビデオ・データを格納することができ、検索を可能にすることができる他のいかなる装置にすることもできる。ストレージ・デバイスはデコーダ装置5に接続され、デコーダ装置5は、ストレージ・デバイスから選択的に読み取ることができ、符号化済ビデオ・シーケンスを復号することができる。デコーダ装置5は、符号化済ビデオ・シーケンスのうち選択されたものを復号するとき、ビデオ・シーケンス20の再生を、例えば、コンピュータ・モニター又は画面上に表示するために生成する。
もう1つの実施形態では、メディア9は別のコンピュータへの接続を提供する。別のコンピュータを、符号化済ビデオ・シーケンスを受信するリモート・コンピュータにすることができる。メディア9を、LAN、WAN、インターネットなど、ネットワーク接続にすることができる。リモート・コンピュータ内のデコーダ装置5は、その中に含まれた符号化済プレゼンテーションを復号し、ビデオ・シーケンス20の再生をリモート・コンピュータの画面又はモニター上に生成させることができる。
図1に例示し、上述したビデオ・システム1の形態を結合及び補足して、他の実施形態を達成することができる。多数の他の実施形態は、本発明の範囲に適合する。このような他の実施形態はビデオに限定される必要はなく、オーディオ又は他の形態のメディアをも含んでいてもよい。
前から存在するビデオ符号化技術は通常、フレーム(ピクチャ)を、マクロブロックと呼ばれるピクセルのより少ないブロックに分割する。各マクロブロックは、符号化が実行される情報の単位を決めるピクセルのマトリックス、通常は16×16マトリックスからなる。したがって、そのピクセルのマトリックスは、16×16マクロブロックと呼ばれる。これらのビデオ符号化技術は通常、各16×16マクロブロックをさらにより少ないピクセルのマトリックス、例えば、ピクセルの8×8マトリックス又はピクセルの4×4マトリックスに分割する。このようなマトリックスを以下でサブブロックと称する。
本発明の一実施形態では、16×16マクロブロックは16個の4×4サブブロックに分割される。他の実施形態では、16×16マクロブロックは、8×8サブブロック、8×4サブブロック、又は4×8サブブロックに分割される。本発明は、他のサブブロックを使用するか、あるいは、サブブロックに分割することなく16×16マクロブロックのみを使用するシステムに等しく適用可能又は容易に適合可能であることは、当業者には理解されよう。
さらに、前から存在する符号化技術は、動きベクトルを使用した動き補償及び動き予測を備えている。動きベクトルは、x成分及びy成分を介してプレゼンテーションされる方向、ならびに、16×16マクロブロック又はそれらの各サブブロックの動きの量を記述し、デコーダへ、ビット・ストリームの一部として送信される。当技術分野で知られているように、動きベクトルは、双方向で符号化されたピクチャ(Bピクチャ)及び予測されたピクチャ(Pピクチャ)のために使用される。
ビデオ・エンコーダ2は、離散コサイン変換(DCT)を実行して、ビデオ・シーケンス20を符号化し、圧縮する。簡単に述べると、ビデオ・エンコーダ2はビデオ・シーケンス20を、空間、時間領域から周波数領域に変換する。ビデオ・エンコーダ2の出力は信号振幅のセットであり、「DCT係数」と呼ばれる。量子化器はDCT係数を受信し、符号化中に、DCT係数値の範囲(又はステップ・サイズ)の各々に、小さい整数などの単一の値を割り当てる。量子化は、データをより小型にプレゼンテーションできるようにするが、あるデータが損失する結果となる。より細かいスケールにおける量子化は、それほど小型でないプレゼンテーション(より高いビット・レート)の結果となるが、データの損失もより少ない。より粗いスケールにおける量子化は、より小型のプレゼンテーション(より低いビット・レート)の結果となるが、データの損失もより多い。モード・セレクタ14はビデオ・エンコーダ2と通信し、ビデオ・シーケンス20の符号化を監視し、制御する。モード・セレクタ14は、本発明によって、ビデオ・エンコーダ2がビデオ・シーケンス20を符号化する予測モードを決定する。モード・セレクタ14は、本発明の方法によって動作するように構成される、プロセッサ、又は、1つ又は複数のソフトウェア・モジュールにすることができる。図1はモード・セレクタ14を、例示のために、ビデオ・エンコーダ2から分離した要素として示している。モード・セレクタ14の機能性をビデオ・エンコーダ2の機能性と結合させることができることは、当業者には理解されよう。
エンコーダ装置3のバッファ8は、符号化され、圧縮されたビデオ・シーケンス(以下「符号化済ビデオ・シーケンス」)をビデオ・エンコーダ2から受信し、メディア9に送信される前に符号化済ビデオ・シーケンスのビット・レートを調整する。バッファリングが必要とされる場合があり、これは、個々のビデオ画像が様々な量の情報を含む場合があり、結果として画像によって様々な符号化効率となるからである。バッファ8のサイズが制限されているので、量子化器へのフィードバック・ループを使用して、バッファ8のオーバーフロー又はアンダーフローを回避することができる。プレゼンテーションのビット・レートは、プレゼンテーションをリアル・タイムで提示するためにプレゼンテーション・データが処理されなければならないレートである。
デコーダ装置5は、エンコーダ装置3の逆の機能を実行する。バッファ10もまた、入ってくる符号化済ビデオ・シーケンスのビット・レートを調整する。ビデオ・デコーダ12は、モード・セレクタ16と結合して、入ってくるビデオ・シーケンスを復号及び圧縮解除し、ビデオ・シーケンスを再構築する。モード・セレクタ16は、入ってくるビデオ・シーケンスを符号化したビデオ・エンコーダ2に従って予測モードを決定する。デコーダ装置5は、「VIDEO OUT」として例示された復号され、圧縮解除されたビデオ・シーケンス24(以下「復号済ビデオ・シーケンス24」)を出力する。
ビデオ・デコーダ12は、バッファ10(図1)からの符号化済ビデオ・シーケンスを表現するビット・ストリームを受信する。一実施形態では、ビデオ・デコーダは、例えばMPEG−xデコーダなどの従来のビデオ・デコーダであり、デコーダ・コントローラ、VLCデコーダ(VLC 可変長符号化)、再構築モジュールを含む。これらのコンポーネントのオペレーション及び機能は当業者に知られている。これらのコンポーネントは当業者に知られており、一般に入手可能なMPEG文書及び出版物に記載されている。
図2は、ビデオ・シーケンス20の一部であるビデオ・フレーム30を例示する図である。上述のように、既知のビデオ符号化技術は通常、ビデオ・フレーム30をマクロブロック36、36a、36b、36c、36dに分割する。例えば、ビデオ・フレーム30は、16×16マクロブロック36、36a、36b、36c、36dのマトリックスに分割される。ビデオ・システム1はマクロブロック36、36a、36b、36c、36dを行ごとに、上から下へ、左から右へ、例えばイントラ符号化のシーケンスを例示する破線34を介して示すように符号化する。例示の実施形態では、破線34は次に符号化されるマクロブロックであるマクロブロック36aで終わっている。その前のすべてのマクロブロック36、36b、36c、36dはすでに符号化されている。
マクロブロック36aを、すべてのマクロブロック36、36a、36b、36c、36dの代表として、ビデオ・フレーム30の下により詳細に示す。ビデオ・システム1のビデオ符号化技術は各マクロブロック36、36a、36b、36c、36dをさらに、ピクセルのマトリックス38に分割する。以下でこれをサブブロック38と称する。
一実施形態では、サブブロック38はピクセルの4×4マトリックスであり、その16個のピクセルにはa、b、c、...、p(「行が先」の方法で)とラベルが付けられている。マクロブロック36aのサブブロック38の真上に位置する近接マクロブロック36bの隣接サブブロックのピクセルの境界ピクセルには、A、B、C、Dとラベルが付けられている。さらに、サブブロック38の右上に位置するマクロブロック36bのサブブロックの境界ピクセルには、E、F、G、Hとラベルを付ける。同様に、マクロブロック36aのサブブロック38のすぐ左に位置する近接マクロブロック36cの隣接サブブロックの境界ピクセルには、I、J、K、Lとラベルを付ける。サブブロック38の左下に位置するマクロブロック36cのサブブロックの境界ピクセルには、M、N、O、Pとラベルを付ける。マクロブロック36aのサブブロック38の左上に位置する、マクロブロック36dのサブブロックの境界ピクセルには、Qとラベルを付ける。
本発明のビデオ・システム1は、各マクロブロック36をイントラ・マクロブロックとして符号化する。イントラ・マクロブロックは、動き補償された予測なしに変換符号化される。したがって、イントラ・マクロブロックは、前又は後続のフレームからの復号されたデータを参照しない。Iフレームは、完全にイントラ・マクロブロックからなるフレームである。したがって、Iフレームは、前又は後続のフレームへの参照なしに符号化される。Iフレームはまた「イントラ・フレーム」としても知られる。
図3はサブブロック38であり、サブブロック38を符号化することができる可能な方向を例示する。本発明によれば、マクロブロック36、36a、36b、36c、36dのサブブロックを、以下にリストする9つのモード(モード0、モード1、...、モード8)のうち1つでイントラ符号化することができる。すなわち、特定のサブブロック38を、現在復号されている現在のサブブロックの上のサブブロックから(「垂直予測」)、現在のサブブロックの左のサブブロックから(「水平予測」)、又は、左及び上のサブブロックから(「対角予測」)予測することができる。モード1〜8はサブブロックを所定の方向で予測し、モード0は所定の方向の予測なしに一様平均を使用する。図3では、各方向は、本発明による8つの予測モードのうち1つを表す。
モード0:
このモードでは、各ピクセルa〜pは、以下の式によって予測される。
Figure 0004491349
このモード、ならびに以下のモードでは、「除算」は、結果を「マイナス無限大」(−∞)まで丸めることを意味する。例えば、モード0では、項「+4」は、除算が最も近い整数への丸めの結果となることを保証する。これはまた他のモードにも当てはまる。
ピクセルa〜pのうち4つが、現在符号化されている現在のピクチャ(フレーム)の外側である場合、残りの4つのピクセルの平均が予測のために使用される。すべての8つのピクセルがピクチャの外側である場合、このサブブロック内のすべてのピクセルについての予測は128である。したがって、サブブロックは常にモード0で予測することができる。
モード1:
ピクセルA、B、C、Dが現在のピクチャの内側である場合、ピクセルa〜pは、図3に示す垂直方向に予測される。すなわち、ピクセルa〜pは以下のように予測される。
Figure 0004491349
モード2:
ピクセルI、J、K、Lが現在のピクチャの内側である場合、ピクセルa〜pは、水平方向に予測される。すなわち、ピクセルa〜pは以下のように予測される。
Figure 0004491349
モード3:
このモードは、すべてのピクセルa〜pが現在のピクチャの内側である場合に使用される。これは、図3に示す対角方向の予測に対応する。ピクセルa〜pは以下のように予測される。
Figure 0004491349
モード4:
このモードは、すべてのピクセルa〜pが現在のピクチャの内側である場合に使用される。これもまた対角予測である。
Figure 0004491349
モード5:
このモードは、すべてのピクセルa〜pが現在のピクチャの内側である場合に使用される。これもまた対角予測である。
Figure 0004491349
モード6:
このモードは、すべてのピクセルa〜pが現在のピクチャの内側である場合に使用される。これは対角予測である。
Figure 0004491349
モード7:
このモードは、すべてのピクセルa〜pが現在のピクチャの内側である場合に使用される。これは対角予測である。
Figure 0004491349
モード8:
このモードは、すべてのピクセルa〜pが現在のピクチャの内側である場合に使用される。これは対角予測である。
Figure 0004491349
本発明の一実施形態では、モード選択アルゴリズムは、9つのモードのうち1つ選択するための基準を決定する。次いで、サブブロック38は、選択されたモードに従って符号化される。モード選択アルゴリズムを以下で詳細に説明する。
図4は、ビデオ・フレームのストリームを含むビデオ・データを符号化し、予測モードのモード0〜8のうち1つを選択する本発明による方法を例示する手順の流れ図である。一実施形態では、この方法はビデオ・フレームの輝度部(Y)を符号化する。
ステップ28で、例えば、ユーザーがビデオ・システム1を起動するとき、この手順はビデオ・システム1を初期化する。初期化手順には、例えば、エンコーダ装置3が動作中であり、ビデオ・フレームのストリームを受信するために適切に接続されているかどうかを判断することが含まれる。
ステップ30で、この手順は、ビデオ・フレームのストリームを受信し、各ビデオ・フレームを複数のサブブロックのマトリックスに分割する。各サブブロックは複数のピクセルを含む。複数のサブブロックのマトリックスは、上述のマクロブロックの一部である4×4サブブロック38を含む。
ステップ32で、この手順は、9つの予測モード0〜8のそれぞれのモードに対して定義する。各予測モードは現在のサブブロックが符号化されるモードを決定する。例えば、この手順は、モード0〜8のそれぞれのモードを計算し、定義するためのサブルーチンを実行することができる。
ステップ34で、この手順は、現在のサブブロック38を符号化するために、9つの予測モードのモード0〜8のうち1つを選択する。一実施形態では、この手順は、各モードについて誤差値を計算し、どのモードが最小誤差値を提供するかを決定し、そのモードを、現在のサブブロック38を符号化するために選択する。
この手順が、現在のサブブロック38のピクセルを符号化するための「最良」の予測モードを選択した後、この手順は最小誤差値を符号化し、符号化された最小誤差値を、圧縮されたビット・ストリーム内でデコーダへ送信する。最小誤差値は、現在のサブブロックの予測されたピクセルと、サブブロックの元のピクセルの間の差を表す。この差を、当技術分野で知られているDCT、係数量子化、可変長符号化を使用して符号化することができる。デコーダは、予測されたピクセル、及び、元のピクセルとの差を使用して、ビデオ・フレームを正確に再構築する。この手順は、ステップ36で終了する。
この手順は、4×4サブブロック38の各々が、9つの予測モードであるモード0〜8のうち1つに従って符号化されることを規定する。直接符号化される場合、これにはかなりの数のビットが必要となる場合があるので、本発明によるビデオ・システム1は、モード情報を符号化するより効率的な方法とすることができる。あるサブブロックの予測モードは、隣接サブブロックの予測モードと相関される。
図5は、3つの例示的サブブロックA、B、Cを介してこれを例示する。サブブロックCは、その予測モードが知られているサブブロックA、Bを用いて符号化(予測)されるサブブロックである。サブブロックAはサブブロックCの上に位置し、サブブロックBはサブブロックCの左に位置する。この場合、サブブロックCのための最も確率の高い、次に最も確率の高い、などの予測モードの順序付けが与えられる。このような順序付けテーブルの一例を以下にリストする。このテーブルは10個のグループ(グループ1〜グループ10)に分割される。各グループ内で、サブブロックAのための各予測モードは一定であり(例えば、サブブロックAのモード0は、グループ2内で一定である)、サブブロックBのための予測モードは変化する。すなわち、あるグループ内のサブブロックAのための(一定の)予測モードを、そのグループ内でサブブロックBのための9つの予測モードのうち1つに結合させることができる。
サブブロックA、Bの予測モードの各組合せに対して、9つのモード0〜9の各モードに対して1つの一連の9つの数が与えられる。グループ3の例では、サブブロックAとサブブロックBのための予測モードが共にモード1である場合、文字列「162530487」は、モード1、すなわち、文字列内の最初の数がサブブロックCのための最も確率の高いモードであることを示す。モード6、すなわち、文字列内の第2の数は、次に最も確率の高いモードである。例示的文字列では、モード7が最も確率が低い。これは、数7が文字列内の最後の数であるからである。この文字列は、符号化済ビデオ・シーケンスを表現するビットのストリームの一部となる。
したがって、ビットのストリームには、情報(Prob0=1(テーブル1を参照))が含まれ、これはサブブロックCのために使用されたモードを示す。例えば、この情報は、次に最も確率の高いイントラ予測モードがモード6であることを示すことができる。テーブル内の「−」は、このインスタンスが発生することができないことを示すことに留意されたい。テーブル1で使用される「外側」という語は、「フレームの外側」を示す。サブブロックA又はBがフレーム内であるが、「イントラ」符号化されない(例えば、Pフレームでは、サブブロックCを「イントラ」符号化することはできるが、サブブロックAもサブブロックBも「イントラ」符号化することはできない)場合、予測モードはない。本発明の手順は、このようなサブブロックについてモード0を仮定する。
Figure 0004491349
Figure 0004491349
Figure 0004491349
Figure 0004491349
Figure 0004491349
予測モードについての情報を、2つのサブブロック38の予測モード情報を1つのコードワードにおいて結合することによって、効率的に符号化することができる。ビットのストリームは次いで、結果として生じるコードワードを含む。各コードワードは2つのサブブロックの予測モードを表現する。テーブル2は、0と80の間のコード番号(コード番号)のための例示的バイナリ・コードワードをリストする。最初のサブブロックのモードの確率はProb0と示され、第2のサブブロックのモードの確率はProb1と示される。
Figure 0004491349
Figure 0004491349
Figure 0004491349
Figure 0004491349
9つの予測モード(テーブル1)及びモードの確率(テーブル1、テーブル2)により、モード選択アルゴリズムは、特定のサブブロックが予測されるモードを決定する。本発明の一実施形態では、アルゴリズムは、ピクセルa〜pと元のフレーム内の対応するピクセルの間の差分絶対値和(SAD)、及び、上記のモードの確率を使用して、モードを選択する。SAD及び確率テーブルは、特定のサブブロック38のためのモードを選択するために使用される。このアルゴリズムは、9つの可能なモードであるモード0〜8の各々について、パラメータuErrorを計算する。最小のuErrorを提供するモードは、サブブロック38のために選択されたモードである。
uErrorは以下のように計算される。
uError=SAD({a,...,p},{元のフレーム})+rd_quant[uMBQP]*uProb
ただし、SAD({a,...,p},{元のフレーム})は、ピクセルa〜pと元のフレーム内の対応するピクセルの間の差分絶対値和であり、
ただし、rd_quant[uMBQP]は、量子化パラメータuMBQPによってインデックス付けされた定数値のテーブルである。uMBQPは以下によって与えられ、
const U8 rd_quant[32]=
{1,1,1,1,1,1,2,2,2,2,3,3,3,4,4,5,5,6,7,7,8,9,11,12,13,15,17,19,21,24,27,30}、かつ
ただし、uProbは、モード確率テーブル(テーブル1)内の位置によって提供された、モードが発生する確率である。
例えば、サブブロックAのための予測モードはモード1であり、サブブロックBのための予測モードはモード1である。文字列「162530487」は、モード1はまたサブブロックCのための最も確率の高いモードでもあることを示す。モード6は、第2に最も確率の高いモードである、などとなる。このように、このアルゴリズムがモード0のためのuErrorを計算するとき、確率uProbは5である。さらに、モード1では確率uProbは0であり、モード2では確率uProbは2であり、モード3では確率uProbは4である、などとなる。
ビデオ・フレームの輝度部(Y)の符号化に加えて、本発明のビデオ・システム1はまた、ビデオ・フレームのクロミナンス部(U、V)をも予測することができる。クロミナンス部は、クロミナンス面(U及びV面)と見なすことができる。通常、クロミナンス面(U及びV面)は、輝度面のサイズの4分の1である。したがって、16×16マクロブロックでは、対応するピクセルの8×8ブロックは、U及びV面の両方に存在する。これらの8×8ブロックは4×4ブロックに分割される。一般に、別々の予測モードはクロミナンス・ブロック用に送信されない。その代わりに、Y面ブロック用に送信されたモードが、U及びV面ブロックのための予測モードとして使用される。
図6は、一実施形態による、本発明の教示が組み込まれたビデオ装置を例示する。例示のように、ビデオ装置600は、この装置の入力及び出力に結合されたエンコーダ610及びデコーダ620を含む。前述のように、エンコーダ610は、ビデオ・フレーム・データを受信し、各フレーム・データをマクロブロックとサブブロックに分割し、選択的にサブブロックを前述のようにイントラ符号化するように設計される。デコーダ620は、イントラ符号化されたサブブロックを受信し、ビデオ・フレーム・データを前述のようにリカバリするように設計される。
エンコーダ610及びデコーダ620は、前述のエンコーダ装置3及びデコーダ装置5に類似の方法で構成される。様々な実施形態では、エンコーダ610とデコーダ620は少なくとも部分的には、それらの構成するテーブル及び符号化/復号化ロジックを共有することができる(エンコーダ610とデコーダ620の交差するブロックによって示される)。
様々な実施形態では、ビデオ装置600を無線携帯電話、携帯情報端末などのパーム・サイズの演算装置、ラップトップ演算装置、デスクトップ演算装置、サーバ、その他の演算装置などにすることができる。他の実施形態では、ビデオ装置600を、ビデオ「アドオン」回路基板(ドーター回路基板とも呼ばれる)、マザーボード、及び他の回路基板など、回路基板コンポーネントにすることができる。
さらに他の実施形態では、エンコーダ610及びデコーダ620を両方とも有するのではなく、ビデオ装置600は、ビデオ・カメラの場合のようにエンコーダ610のみ、又は、DVDプレイヤー、テレビ、表示モニター又はセットトップ・ボックスの場合のようにデコーダ620のみを含むことができる。
図7は、前述のエンコーダ装置100及び/又はデコーダ装置400のソフトウェア実施形態を実現するプログラミング命令を有する、記録可能メディアを含む製品700を例示する。プログラミング命令は、ビデオ装置710に本発明の符号化及び復号化機能を装備するように、ビデオ装置710をプログラムするために使用するために設計される。
この実施形態では、ビデオ装置710は、エンコーダ装置100及び/又はデコーダ400のソフトウェア実施形態を実施するプログラミング命令の作業用コピーの少なくとも一部を格納するためのストレージ・メディア712と、このプログラミング命令を実行するためにストレージ・メディア712に結合された少なくとも1つのプロセッサ714を含む。
ビデオ装置710を、上記で列挙した装置の例、又は類似の他のビデオ装置のいずれか1つにすることができる。製品700を例えば、ディスケット、コンパクト・ディスク(CD)、DVD、又は、類似の他のコンピュータ可読メディアとすることができる。他の実施形態では、製品700を、エンコーダ装置100及び/又はデコーダ装置400を、インターネットなどのプライベート及び/又は公衆ネットワークを介してオンラインで分散させる分散サーバにすることができる。一実施形態では、製品700はウェブ・サーバである。
図8は、図示のように互いに通信的に結合されたビデオ・センダー802及びビデオ・レシーバ804を有する例示的システムを例示し、ビデオ・センダー802は、本発明の教示によってビデオを符号化し、符号化されたビデオをビデオ・レシーバ802に提供し、ビデオ・レシーバ802は、符号化されたビデオを復号して、ビデオをレンダリングする。ビデオ・センダー802及びビデオ・レシーバ804は、前述のエンコーダ装置100及びデコーダ装置400をそれぞれ装備する。
ビデオ・センダー802の一例はビデオ・サーバであるのに対して、ビデオ・レシーバ804の一例は、ビデオ・センダー802に結合されたクライアント装置である。
様々な代替実施形態では、モード4、6のための符号化は、符号化されているサブブロックのピクセル値の予測において、符号化されているサブブロックの上の隣接サブブロックのピクセルのみを使用するように合理化される。具体的には、符号化されているサブブロックのピクセル値は、モード4、6の下で以下のように予測される。
合理化されたモード4
a =(A+2*B+C+2)/4、
b、e =(B+2*C+D+2)/4、
c、f、i =(C+2*D+E+2)/4、
d、g、j、m =(D+2*E+F+2)/4、
h、k、n =(E+2*F+G+2)/4、
l、o =(F+2*G+H+2)/4、
p =(G+3*H+2)/4
合理化されたモード6
a =(A+B+1)/2、
b、i =(B+C+1)/2、
c、j =(C+D+1)/2、
d、k =(D+E+1)/2、
l =(E+F+1)/2、
e =(A+2*B+C+2)/4、
f、m =(B+2*C+D+2)/4、
g、n =(C+2*D+E+2)/4、
h、o =(D+2*E+F+2)/4、
p =(E+2*F+G+2)/4
さらに、モード7のための符号化は、符号化されているサブブロックのピクセル値の予測において、符号化されているサブブロックの左の隣接サブブロックのピクセルのみを使用するように合理化される。具体的には、符号化されているサブブロックのピクセル値は、以下のように予測される。
合理化されたモード7
a =(I+J+1)/2、
b =(I+2*J+K+2)/4、
c、e =(J+K+1)/2、
d、f =(J+2*K+L+2)/4、
g、i =(K+L+1)/2、
h、j =(K+2*L+L+2)/4、
l、n、k、
m、o、p =L
さらに他の実施形態では、マクロブロックをM×Nサブブロックに再分割することができ、ただし、M×Nをその代わりに8×8、8×4又は4×8にすることができる。本明細書のこの部分のために、図9a〜9cに例示するように、M×Nサブブロックのピクセルをpijと称するものとし、ただし、インデックスiはサブブロックの行位置を示し、8×8及び8×4サブブロックの場合は0から7の値、又は、4×8サブブロックの場合は0から3の値を仮定することができ、インデックスjはサブブロックの列位置を示し、同様に8×8及び4×8サブブロックの場合は0から7の値、又は、8×4サブブロックの場合は0から3の値を仮定することができる。
例示のように、符号化されているサブブロックの上の隣接サブブロックの予測ピクセルを、t0からt15と称し、符号化されているサブブロックの左の隣接サブブロックの予測ピクセルを、l0からl15と称する。
モード0〜2では、M×Nサブブロックのピクセル値は、M×Nが8×8であるか、8×4であるか、4×8であるかにかかわらず、以下のように予測される。
モード0
0〜tN-1 及びl0〜lM-1 が使用可能である場合、
ij=(t0+...+tN-1 +l0+...+lM-1 +N/2+M/2)/(M+N)、
そうでなければ、t0〜tN-1 のみが使用可能である場合、
ij=(t0+...+tN-1 +N/2)/N、
そうでなければ、l0〜lM-1 のみが使用可能である場合、
ij=(l0+...+lM-1 +M/2)/M、
そうでなければ、
ij=128、
i=0−(N−1)、j=0−(M−1)。
モード1
0〜tN-1 が使用可能である場合、
ij=tj
i=0−(N−1)、j=0−(M−1)。
モード2
0〜lM-1 が使用可能である場合、
ij=li
i=0−(N−1)、j=0−(M−1)。
モード3〜8では、M×Nサブブロックのピクセル値は以下のように予測される。
モード3
q及びすべてのt0〜tN-1 及びl0〜lM-1 が予測のために使用可能である場合
Figure 0004491349
モード4
すべてのt0〜t 2N-1 が予測のために使用可能である場合、
Figure 0004491349
モード5
q及びすべてのt0〜tN-1 及びl0〜lM-1 が予測のために使用可能である場合、以下の通りである。
Figure 0004491349
モード6
すべてのt0〜t 2N-1 が予測のために使用可能である場合
Figure 0004491349
モード7
すべてのl0〜lM-1 8×8及び4×8のサブブロックの予測のために使用可能である場合又はl 0 〜l 2M-1 が8×4のサブブロックの予測のために使用可能である場合
Figure 0004491349
モード8
q及びすべてのt0〜tN-1 及びl0〜lM-1 が予測のために使用可能である場合、以下の通りである。
Figure 0004491349
結論及びエピローグ
このように、ビデオ・フレーム・データをイントラ符号化と復号化するための新規な方法を、この方法が組み込まれたエンコーダ、デコーダ、装置及びシステムを含めて説明したことは、上記の説明から分かるであろう。
本発明を前述の実施形態及び応用例の例に関して説明したが、本発明は、説明した実施形態及び応用例の例に限定されないことは、当業者には理解されよう。本発明を、付属の特許請求の範囲の精神及び範囲内の修正及び変更と共に実施することができる。特に、本発明の一部又は全部(例えば、様々な動作ロジック)を、特定用途向け集積回路(ASIC)において実装することができる。
このように、本明細書は、本発明を限定するものではなく、例示するものとして見なされるべきである。
符号化側及び復号側を有するビデオ・アプリケーションのためのシステムの高レベル・ブロック図である。 マクロブロック及びサブブロック内のフレーム及びその分割の高レベルの例示の図である。 それに従ってサブブロックを符号化することができる方向を例示するサブブロックの図であり、各方向は本発明による8つの予測モードのうち1つを表す図である。 本発明の一実施形態による、予測モードを選択する流れ図である。 2つのサブブロックが第3のサブブロックを符号化するために使用される、3つの近接サブブロックの例示の図である。 一実施形態による、本発明の符号化/復号教示が組み込まれたエンコーダ及びデコーダを有するビデオ装置を例示する図である。 一実施形態による、本発明の符号化/復号機能を装置に装備するように装置をプログラムするために使用するために設計された、本発明のエンコーダ/デコーダのソフトウェア実装を有する記録可能メディアを有する製品を例示する図である。 一実施形態による、本発明の符号化/復号教示が組み込まれたビデオ・センダー・装置及びビデオ・レシーバ・装置を有するシステムを例示する図である。 3つの代替実施形態による、それぞれ8×8、8×4及び4×8サブブロックのピクセル値を予測するために使用された、周辺ピクセルを例示する図である。 3つの代替実施形態による、それぞれ8×8、8×4及び4×8サブブロックのピクセル値を予測するために使用された、周辺ピクセルを例示する図である。 3つの代替実施形態による、それぞれ8×8、8×4及び4×8サブブロックのピクセル値を予測するために使用された、周辺ピクセルを例示する図である。

Claims (9)

  1. ビデオエンコーダ及びビデオデコーダの選択された1つを少なくとも備えた装置であって、
    プロセッサと、
    ストレージ・メディアと、
    前記ストレージ・メディアに格納された複数の命令とを備え、前記命令は、(a)ビデオ・データのマクロブロックのイントラ符号化、及び、(b)ビデオ・データのイントラ符号化されたマクロブロックの復号化のうち選択されたものを前記プロセッサに実行させるように設計され、イントラ符号化されたマクロブロックは、以下のように第1の予測モードの下で予測されたピクセル値のM×Nサブブロックを含み、
    i=0−(N−1)、j=0−(M−1)について、
    0 〜t N-1 及びl 0 〜l M-1 が使用可能である場合、
    ij =(t 0 +...+t N-1 +l 0 +...+l M-1 +N/2+M/2)/(M+N)、
    そうでなければ、t 0 〜t N-1 のみが使用可能である場合、
    ij =(t 0 +...+t N-1 +N/2)/N、
    そうでなければ、l 0 〜l M-1 のみが使用可能である場合、
    ij =(l 0 +...+l M-1 +M/2)/M、
    そうでなければ、
    ij =128、
    ただし、P ij は前記M×Nサブブロックのピクセル値であり、i及びjは前記M×Nサブブロック内の行と列の位置を示すインデックスであり、
    0 〜t N-1 は前記M×Nサブブロックの上の隣接サブブロックのピクセル値であり、
    0 〜l m-1 は前記M×Nサブブロックの左の隣接サブブロックのピクセル値であり、
    イントラ符号化されたマクロブロックは、第2のサブブロックのピクセル値を含み、前記第2のサブブロックは、4×8サブブロック、8×4サブブロック、8×8サブブロックのうちの選択された1つであり、前記第2のサブブロックのピクセル値は、第2の予測モードの下で予測され、ピクセル値の対角は
    Figure 0004491349
    のうち選択されたものに従って予測され、
    qは、t 0 の左でl 0 の上のピクセルの値である装置
  2. ビデオエンコーダ及びビデオデコーダの選択された1つを少なくとも備えた装置であって、
    プロセッサと、
    ストレージ・メディアと、
    前記ストレージ・メディアに格納された複数の命令とを備え、前記命令は、(a)ビデオ・データのマクロブロックのイントラ符号化、及び、(b)ビデオ・データのイントラ符号化されたマクロブロックの復号化のうち選択されたものを前記プロセッサに実行させるように設計され、イントラ符号化されたマクロブロックは、以下のように第1の予測モードの下で予測されたピクセル値のM×Nサブブロックを含み、
    i=0−(N−1)、j=0−(M−1)について、
    0 〜t N-1 及びl 0 〜l M-1 が使用可能である場合、
    ij =(t 0 +...+t N-1 +l 0 +...+l M-1 +N/2+M/2)/(M+N)、
    そうでなければ、t 0 〜t N-1 のみが使用可能である場合、
    ij =(t 0 +...+t N-1 +N/2)/N、
    そうでなければ、l 0 〜l M-1 のみが使用可能である場合、
    ij =(l 0 +...+l M-1 +M/2)/M、
    そうでなければ、
    ij =128、
    ただし、P ij は前記M×Nサブブロックのピクセル値であり、i及びjは前記M×Nサブブロック内の行と列の位置を示すインデックスであり、
    0 〜t N-1 は前記M×Nサブブロックの上の隣接サブブロックのピクセル値であり、
    0 〜l m-1 は前記M×Nサブブロックの左の隣接サブブロックのピクセル値であり、
    イントラ符号化されたマクロブロックは、第2のM×Nサブブロックのピクセル値を含み、前記第2のM×Nサブブロックは、4×8サブブロック、8×4サブブロック、8×8サブブロックのうちの選択された1つであり、前記第2のサブブロックのピクセル値は、第2の予測モードの下で予測され、ピクセル値の対角は
    Figure 0004491349
    のうち選択されたものに従って予測される装置
  3. ビデオエンコーダ及びビデオデコーダの選択された1つを少なくとも備えた装置であって、
    プロセッサと、
    ストレージ・メディアと、
    前記ストレージ・メディアに格納された複数の命令とを備え、前記命令は、(a)ビデオ・データのマクロブロックのイントラ符号化、及び、(b)ビデオ・データのイントラ符号化されたマクロブロックの復号化のうち選択されたものを前記プロセッサに実行させるように設計され、イントラ符号化されたマクロブロックは、以下のように第1の予測モードの下で予測されたピクセル値のM×Nサブブロックを含み、
    i=0−(N−1)、j=0−(M−1)について、
    0 〜t N-1 及びl 0 〜l M-1 が使用可能である場合、
    ij =(t 0 +...+t N-1 +l 0 +...+l M-1 +N/2+M/2)/(M+N)、
    そうでなければ、t 0 〜t N-1 のみが使用可能である場合、
    ij =(t 0 +...+t N-1 +N/2)/N、
    そうでなければ、l 0 〜l M-1 のみが使用可能である場合、
    ij =(l 0 +...+l M-1 +M/2)/M、
    そうでなければ、
    ij =128、
    ただし、P ij は前記M×Nサブブロックのピクセル値であり、i及びjは前記M×Nサブブロック内の行と列の位置を示すインデックスであり、
    0 〜t N-1 は前記M×Nサブブロックの上の隣接サブブロックのピクセル値であり、
    0 〜l m-1 は前記M×Nサブブロックの左の隣接サブブロックのピクセル値であり、
    イントラ符号化されたマクロブロックは、第2のサブブロックのピクセル値を含み、前記第2のサブブロックは、4×8サブブロック、8×4サブブロック、8×8サブブロックのうちの選択された1つであり、前記第2のサブブロックのピクセル値は、第2の予測モードの下で予測され、ピクセル値の対角は
    Figure 0004491349
    のうち選択されたものに従って予測され、
    qは、t 0 の左でl 0 の上のピクセルの値である装置
  4. ビデオエンコーダ及びビデオデコーダの選択された1つを少なくとも備えた装置であって、
    プロセッサと、
    ストレージ・メディアと、
    前記ストレージ・メディアに格納された複数の命令とを備え、前記命令は、(a)ビデオ・データのマクロブロックのイントラ符号化、及び、(b)ビデオ・データのイントラ符号化されたマクロブロックの復号化のうち選択されたものを前記プロセッサに実行させるように設計され、イントラ符号化されたマクロブロックは、以下のように第1の予測モードの下で予測されたピクセル値のM×Nサブブロックを含み、
    i=0−(N−1)、j=0−(M−1)について、
    0 〜t N-1 及びl 0 〜l M-1 が使用可能である場合、
    ij =(t 0 +...+t N-1 +l 0 +...+l M-1 +N/2+M/2)/(M+N)、
    そうでなければ、t 0 〜t N-1 のみが使用可能である場合、
    ij =(t 0 +...+t N-1 +N/2)/N、
    そうでなければ、l 0 〜l M-1 のみが使用可能である場合、
    ij =(l 0 +...+l M-1 +M/2)/M、
    そうでなければ、
    ij =128、
    ただし、P ij は前記M×Nサブブロックのピクセル値であり、i及びjは前記M×Nサブブロック内の行と列の位置を示すインデックスであり、
    0 〜t N-1 は前記M×Nサブブロックの上の隣接サブブロックのピクセル値であり、
    0 〜l m-1 は前記M×Nサブブロックの左の隣接サブブロックのピクセル値であり、
    イントラ符号化されたマクロブロックは、第2のサブブロックのピクセル値を含み、前記第2のサブブロックは、4×8サブブロック、8×4サブブロック、8×8サブブロックのうちの選択された1つであり、前記第2のサブブロックのピクセル値は、第2の予測モードの下で予測され、ピクセル値の対角は
    Figure 0004491349
    のうち選択されたものに従って予測される装置
  5. ビデオエンコーダ及びビデオデコーダの選択された1つを少なくとも備えた装置であって、
    プロセッサと、
    ストレージ・メディアと、
    前記ストレージ・メディアに格納された複数の命令とを備え、前記命令は、(a)ビデオ・データのマクロブロックのイントラ符号化、及び、(b)ビデオ・データのイントラ符号化されたマクロブロックの復号化のうち選択されたものを前記プロセッサに実行させるように設計され、イントラ符号化されたマクロブロックは、以下のように第1の予測モードの下で予測されたピクセル値のM×Nサブブロックを含み、
    i=0−(N−1)、j=0−(M−1)について、
    0 〜t N-1 及びl 0 〜l M-1 が使用可能である場合、
    ij =(t 0 +...+t N-1 +l 0 +...+l M-1 +N/2+M/2)/(M+N)、
    そうでなければ、t 0 〜t N-1 のみが使用可能である場合、
    ij =(t 0 +...+t N-1 +N/2)/N、
    そうでなければ、l 0 〜l M-1 のみが使用可能である場合、
    ij =(l 0 +...+l M-1 +M/2)/M、
    そうでなければ、
    ij =128、
    ただし、P ij は前記M×Nサブブロックのピクセル値であり、i及びjは前記M×Nサブブロック内の行と列の位置を示すインデックスであり、
    0 〜t N-1 は前記M×Nサブブロックの上の隣接サブブロックのピクセル値であり、
    0 〜l m-1 は前記M×Nサブブロックの左の隣接サブブロックのピクセル値であり、
    イントラ符号化されたマクロブロックは、第2のM×Nサブブロックのピクセル値を含み、前記第2のM×Nサブブロックは、4×8サブブロック、8×4サブブロック、8×8サブブロックのうちの選択された1つであり、前記第2のサブブロックのピクセル値は、第2の予測モードの下で予測され、ピクセル値の対角は
    Figure 0004491349
    のうち選択されたものに従って予測される装置
  6. ビデオエンコーダ及びビデオデコーダの選択された1つを少なくとも備えた装置であって、
    プロセッサと、
    ストレージ・メディアと、
    前記ストレージ・メディアに格納された複数の命令とを備え、前記命令は、(a)ビデオ・データのマクロブロックのイントラ符号化、及び、(b)ビデオ・データのイントラ符号化されたマクロブロックの復号化のうち選択されたものを前記プロセッサに実行させるように設計され、イントラ符号化されたマクロブロックは、以下のように第1の予測モードの下で予測されたピクセル値のM×Nサブブロックを含み、
    i=0−(N−1)、j=0−(M−1)について、
    0 〜t N-1 及びl 0 〜l M-1 が使用可能である場合、
    ij =(t 0 +...+t N-1 +l 0 +...+l M-1 +N/2+M/2)/(M+N)、
    そうでなければ、t 0 〜t N-1 のみが使用可能である場合、
    ij =(t 0 +...+t N-1 +N/2)/N、
    そうでなければ、l 0 〜l M-1 のみが使用可能である場合、
    ij =(l 0 +...+l M-1 +M/2)/M、
    そうでなければ、
    ij =128、
    ただし、P ij は前記M×Nサブブロックのピクセル値であり、i及びjは前記M×Nサブブロック内の行と列の位置を示すインデックスであり、
    0 〜t N-1 は前記M×Nサブブロックの上の隣接サブブロックのピクセル値であり、
    0 〜l m-1 は前記M×Nサブブロックの左の隣接サブブロックのピクセル値であり、
    イントラ符号化されたマクロブロックは、第2のM×Nサブブロックのピクセル値を含み、前記第2のM×Nサブブロックは、4×8サブブロック、8×4サブブロック、8×8サブブロックのうちの選択された1つであり、前記第2のサブブロックのピクセル値は、第2の予測モードの下で予測され、ピクセル値の対角は
    Figure 0004491349
    のうち選択されたものに従って予測され、
    qは、t 0 の左でl 0 の上のピクセルの値である装置
  7. 前記装置は、パーム・サイズの演算装置、無線携帯電話、携帯情報端末、ラップトップ演算装置、デスクトップ演算装置、セットトップ・ボックス、サーバ、コンパクト・ディスク・プレイヤー、デジタル多用途ディスク・プレイヤー、テレビ、表示モニターのうち選択されたものを備える請求項1から6のいずれか1つに記載の装置。
  8. 前記装置は、ビデオ・ドーター・カード、及び、統合ビデオ機能を有するマザーボードを備える請求項1から6のいずれか1つに記載の装置。
  9. 前記装置は、さらに、ビデオ・データのイントラ符号化されたマクロブロックを記憶するためのストレージ・メディアを備える請求項1から6のいずれか1つに記載の装置。
JP2004562614A 2000-12-06 2003-06-12 ビデオ・データのイントラ符号化方法及び装置 Expired - Lifetime JP4491349B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US09/732,522 US6765964B1 (en) 2000-12-06 2000-12-06 System and method for intracoding video data
US39452402P 2002-07-08 2002-07-08
US41412002P 2002-09-27 2002-09-27
US41544702P 2002-10-01 2002-10-01
PCT/US2003/018963 WO2004006587A1 (en) 2000-12-06 2003-06-12 Intra coding video data methods and apparatuses

Publications (3)

Publication Number Publication Date
JP2005532768A JP2005532768A (ja) 2005-10-27
JP2005532768A5 JP2005532768A5 (ja) 2006-07-27
JP4491349B2 true JP4491349B2 (ja) 2010-06-30

Family

ID=36033904

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004562614A Expired - Lifetime JP4491349B2 (ja) 2000-12-06 2003-06-12 ビデオ・データのイントラ符号化方法及び装置

Country Status (7)

Country Link
US (1) US7606312B2 (ja)
EP (1) EP1649697B1 (ja)
JP (1) JP4491349B2 (ja)
KR (1) KR100952892B1 (ja)
CN (2) CN101505429B (ja)
AU (1) AU2003243595A1 (ja)
WO (1) WO2004006587A1 (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7266150B2 (en) 2001-07-11 2007-09-04 Dolby Laboratories, Inc. Interpolation of video compression frames
AU2013200690B2 (en) * 2002-06-28 2013-06-27 Dolby Laboratories Licensing Corporation Region sizing for macroblocks
KR101204788B1 (ko) * 2004-06-03 2012-11-26 삼성전자주식회사 영상의 공간 예측 부호화 방법, 부호화 장치, 복호화 방법및 복호화 장치
KR100813958B1 (ko) * 2004-06-07 2008-03-14 세종대학교산학협력단 동영상의 무손실 인코딩 및 디코딩 방법, 그 장치
KR100678911B1 (ko) 2005-07-21 2007-02-05 삼성전자주식회사 방향적 인트라 예측의 적용을 확장하여 비디오 신호를인코딩하고 디코딩하는 방법 및 장치
JP4571069B2 (ja) * 2005-11-28 2010-10-27 三菱電機株式会社 動画像符号化装置
CN100426869C (zh) * 2006-07-21 2008-10-15 北京中星微电子有限公司 一种视频预测编码方法和解码方法
FR2910768A1 (fr) * 2006-12-21 2008-06-27 Thomson Licensing Sas Procede et dispositif d'attribution d'un type de codage, et procede et dispositif de codage et de transcodage associes.
WO2009032255A2 (en) * 2007-09-04 2009-03-12 The Regents Of The University Of California Hierarchical motion vector processing method, software and devices
EP2106148A3 (en) * 2008-03-28 2010-11-03 Samsung Electronics Co., Ltd. Method and apparatus for encoding/decoding information about intra-prediction mode of video
JP4584324B2 (ja) * 2008-05-22 2010-11-17 ルネサスエレクトロニクス株式会社 データ処理システム、及びコンポーネント管理方法
WO2010017166A2 (en) 2008-08-04 2010-02-11 Dolby Laboratories Licensing Corporation Overlapped block disparity estimation and compensation architecture
US20110194616A1 (en) * 2008-10-01 2011-08-11 Nxp B.V. Embedded video compression for hybrid contents
US9697535B2 (en) 2008-12-23 2017-07-04 International Business Machines Corporation System and method in a virtual universe for identifying spam avatars based upon avatar multimedia characteristics
US9704177B2 (en) 2008-12-23 2017-07-11 International Business Machines Corporation Identifying spam avatars in a virtual universe (VU) based upon turing tests
US8537219B2 (en) 2009-03-19 2013-09-17 International Business Machines Corporation Identifying spatial locations of events within video image data
US8553778B2 (en) * 2009-03-19 2013-10-08 International Business Machines Corporation Coding scheme for identifying spatial locations of events within video image data
US8656476B2 (en) 2009-05-28 2014-02-18 International Business Machines Corporation Providing notification of spam avatars
US20110090954A1 (en) * 2009-10-21 2011-04-21 Cohen Robert A Video Codes with Directional Transforms
US9025661B2 (en) 2010-10-01 2015-05-05 Qualcomm Incorporated Indicating intra-prediction mode selection for video coding
US8913662B2 (en) * 2011-01-06 2014-12-16 Qualcomm Incorporated Indicating intra-prediction mode selection for video coding using CABAC
KR101824241B1 (ko) * 2011-01-11 2018-03-14 에스케이 텔레콤주식회사 인트라 부가정보 부호화/복호화 장치 및 방법
US10080016B2 (en) 2011-01-14 2018-09-18 Sony Corporation Codeword space reduction for intra chroma mode signaling for HEVC
JP2013015912A (ja) * 2011-06-30 2013-01-24 Toshiba Corp データ転送装置及びデータ転送方法
US9398300B2 (en) * 2011-10-07 2016-07-19 Texas Instruments Incorporated Method, system and apparatus for intra-prediction in video signal processing using combinable blocks
US9979970B2 (en) 2014-08-08 2018-05-22 Qualcomm Incorporated System and method for determining buffer fullness for display stream compression
JP2016126037A (ja) 2014-12-26 2016-07-11 ソニー株式会社 信号処理装置、および信号処理方法、並びにプログラム
CN108496367B (zh) * 2015-11-11 2022-07-12 三星电子株式会社 用于对视频进行解码的方法和设备以及用于对视频进行编码的方法和设备

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4951139A (en) * 1988-03-30 1990-08-21 Starsignal, Inc. Computer-based video compression system
WO1993018618A1 (en) * 1992-03-03 1993-09-16 Kabushiki Kaisha Toshiba Time-varying image encoder
US5247355A (en) * 1992-06-11 1993-09-21 Northwest Starscan Limited Partnership Gridlocked method and system for video motion compensation
US6031937A (en) * 1994-05-19 2000-02-29 Next Software, Inc. Method and apparatus for video compression using block and wavelet techniques
KR0134483B1 (ko) * 1994-06-14 1998-05-15 배순훈 디코더에 있어서 어드레스 보정 회로(address correction circuit of the decoder)
US5946044A (en) * 1995-06-30 1999-08-31 Sony Corporation Image signal converting method and image signal converting apparatus
JP3788823B2 (ja) * 1995-10-27 2006-06-21 株式会社東芝 動画像符号化装置および動画像復号化装置
JP3157144B1 (ja) * 1996-05-28 2001-04-16 松下電器産業株式会社 画像予測復号化方法
JPH10290464A (ja) * 1997-04-14 1998-10-27 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化モード判定装置
US6130912A (en) * 1998-06-09 2000-10-10 Sony Electronics, Inc. Hierarchical motion estimation process and system using block-matching and integral projection
JP2003199111A (ja) * 2001-12-27 2003-07-11 Matsushita Electric Ind Co Ltd 予測装置、符号化装置、逆予測装置、復号装置、及び、演算装置

Also Published As

Publication number Publication date
WO2004006587A1 (en) 2004-01-15
CN101505429B (zh) 2011-06-08
KR20050021445A (ko) 2005-03-07
JP2005532768A (ja) 2005-10-27
CN101505429A (zh) 2009-08-12
EP1649697A1 (en) 2006-04-26
US7606312B2 (en) 2009-10-20
AU2003243595A1 (en) 2004-01-23
CN100481955C (zh) 2009-04-22
US20060056518A1 (en) 2006-03-16
KR100952892B1 (ko) 2010-04-16
EP1649697B1 (en) 2008-09-17
CN1679342A (zh) 2005-10-05

Similar Documents

Publication Publication Date Title
JP4491349B2 (ja) ビデオ・データのイントラ符号化方法及び装置
US10250885B2 (en) System and method for intracoding video data
JP5819347B2 (ja) スキップマクロブロックコード化
US20040136457A1 (en) Method and system for supercompression of compressed digital video
US10284864B2 (en) Content initialization for enhancement layer coding
US20070177664A1 (en) Entropy encoding/decoding method and apparatus
JP7221390B2 (ja) ビデオ復号及び符号化の方法、装置並びにプログラム
CN113557527A (zh) 通用视频编解码中色彩变换的方法和装置
JP4541896B2 (ja) 多重記述符合化のための装置及び方法
CN114270836A (zh) 视频编解码的颜色转换
JP2022539311A (ja) ピクチャのサブセクション用の独立したcabac
EP1750452B1 (en) Apparatus for intra coding video data
JP2022548685A (ja) 画像データの符号化及び復号化
JP2023520314A (ja) ビデオ復号方法、ビデオ符号化方法、装置、媒体、及び電子機器
KR20030083703A (ko) 동화상 정보의 압축 방법 및 그 시스템
JP2001112002A (ja) 画像サイズ変換可能なデジタル動画像復号装置
JP2022538007A (ja) 画像データ符号化及び復号化

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060606

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060606

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20080625

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20080625

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080702

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091102

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100202

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100209

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100315

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100405

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130409

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4491349

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130409

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130409

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140409

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250