JP5795416B2 - スケーラブルビット深度のためのスケーラブルビデオコーディング手法 - Google Patents

スケーラブルビット深度のためのスケーラブルビデオコーディング手法 Download PDF

Info

Publication number
JP5795416B2
JP5795416B2 JP2014187844A JP2014187844A JP5795416B2 JP 5795416 B2 JP5795416 B2 JP 5795416B2 JP 2014187844 A JP2014187844 A JP 2014187844A JP 2014187844 A JP2014187844 A JP 2014187844A JP 5795416 B2 JP5795416 B2 JP 5795416B2
Authority
JP
Japan
Prior art keywords
layer
bit
inter
video block
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014187844A
Other languages
English (en)
Other versions
JP2015039182A (ja
Inventor
ヤン・イエ
マルタ・カークゼウィックズ
ヒュクジュネ・チュン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2015039182A publication Critical patent/JP2015039182A/ja
Application granted granted Critical
Publication of JP5795416B2 publication Critical patent/JP5795416B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/36Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/34Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本願は2007年10月15日に出願され米国仮出願第60/979,921号の利益を主張し、この全体の内容は参照によって本願に組み込まれる。
この開示はデジタルビデオコーディングに関し、より具体的にはベースレイヤ及びエンハンスメントレイヤがビデオデータの異なるビット深度を定めるスケーラブルビデオコーディング(SVC)に関する。
デジタルビデオケイパビリティは、デジタルテレビジョン、デジタル直接放送(direct broadcast)システム、無線通信デバイス、無線放送システム、PDA(personal digital assistant)、ラップトップまたはデスクトップコンピュータ、デジタルカメラ、デジタルレコーディングデバイス、ビデオゲームデバイス、ビデオゲームコンソール、セルラまたは衛星無線電話機、及び同種のものを含む広範なデバイスに組み込まれ得る。デジタルビデオデバイスは、効率的な方法でデジタルビデオを送信及び受信するために、MPEG−2、MPEG−4、またはH.264/MPEG−4,Part 10,AVC(Advanced Video Coding)において定められるものなどのブロックベースのビデオ圧縮手法を実装する。
ブロックベースのコーディング手法は、通常、ビデオシーケンスにおけるデータ圧縮を達成するために、空間的予測及び/または時間的予測を行う。イントラコーディングは、ビデオフレーム、ビデオフレームのスライス、または独立にデコード可能なデータ単位を備え得る所与のコーディング単位内のビデオブロック間の空間的冗長性を低減または除去するための空間的予測に依存する。対照的に、インターコーディングは、ビデオシーケンスの連続したコーディング単位のビデオブロック間の時間的冗長性を低減または除去するための時間的予測に依存する。イントラコーディングに関して、ビデオエンコーダは、同一のコーディング単位内の他のデータに基づいてデータを圧縮するための空間的予測を行う。インターコーディングに関して、ビデオエンコーダは、2つまたは3以上の隣接するコーディング単位の対応するビデオブロックの動きを追跡するための動き推定及び動き補償を行う。
コーディングされたビデオブロックは、予測ブロックを作り出すまたは識別するために使用可能な予測情報、及びコーディングされているブロックと予測ブロックとの間の差分を示す残差ブロックデータによって表現され得る。インターコーディングの場合には1つまたは複数の動きベクトルが予測ブロックデータを識別するために使用される一方、イントラコーディングの場合には予測モードが予測ブロックを生成するために使用され得る。イントラコーディング及びインターコーディングの両方ともいくつかの異なる予測モードを定め得るが、これらはコーディングにおいて使用される異なるブロックサイズ及び/または予測手法を定め得る。シンタクス要素の追加タイプも、コーディング処理において使用されるコーディング手法またはパラメータを制御または定めるために、エンコードされたビデオデータの一部として含まれ得る。16×16エリアピクセルは、典型的には、サブパーティションされた輝度(ルーマ(luma))ブロック及び2つの異なるダウンサンプルされた8×8クロミナンス(クロマ(chroma))ブロックによって表される。異なるビデオブロックの各々は、予測コーディングされ得る。
ブロックベースの予測コーディングののち、ビデオエンコーダは、残差ブロックの通信に関するビットレートを更に低減させるために、変換、量子化及びエントロピー符号化処理を適用し得る。変換手法は、離散コサイン変換、またはウェーブレット変換、整数変換などの概念的に類似の処理、または他のタイプの変換を備え得る。離散コサイン変換(DCT)処理において、例として、変換処理はピクセル値のセットを変換係数に変換し、これらは周波数ドメインにおけるピクセル値のエネルギーを表し得る。量子化は、変換係数に適用され、一般的には任意の所与の変換係数に関するビット数を制限する処理を含む。エントロピー符号化は、CAVLC(context adaptive variable length coding)またはCABAC(context adaptive binary arithmetic coding)などの、量子化された変換係数のシーケンスを集合的に圧縮する1つまたは複数の処理を備える。
一部のブロックベースのビデオ符号化及び圧縮は、スケーラブル手法を活用する。スケーラブルビデオコーディング(SVC)は、ベースレイヤ及び1つまたは複数のスケーラブルエンハンスメントレイヤが使用されるビデオコーディングを参照する。SVCに関して、ベースレイヤは、典型的には、ベースレベル品質を備えるビデオデータを搬送する。1つまたは複数のエンハンスメントレイヤは、より高度な空間、時間及び/またはSNRレベルをサポートするための追加的なビデオデータを搬送する。一部の場合において、ベースレイヤはエンハンスメントの伝送に比べてより信頼度の高い方法で伝送され得る。
SVC方式の一部のタイプは、ピクセル値のビット深度に基づいてスケーラブルである。これらの場合において、ベースレイヤは第1のビット深度に従うベースレベル品質でピクセル値を定め得るし、エンハンスメントレイヤはベース及びエンハンスメントレイヤが一緒に例えば第1のビット深度よりも大きい第2のビット深度に従うより高い品質レベルでピクセル値を定めるような追加的なデータを加える。ビット深度スケーラビリティは、特により高い解像度の表示ケイパビリティ(これは、従来のディスプレイよりも高度なビット深度に基づいたピクセル再生をサポートする)の出現によって、ますます望まれつつある。
一般に、この開示は、ビット深度ベーススケーラブルビデオコーディング(SVC)方式において実行されるビデオエンコード及びビデオデコード手法を記述する。「コーディング(coding)」という用語は、一般的にエンコードまたはデコードのどちらも参照するためにこの開示において使用される。この開示に従って、ベースレイヤビデオデータ及びエンハンスメントレイヤビデオデータは異なるビット深度で定められる。ベースレイヤビデオデータはMビットのビット深度を持ち得るが、エンハンスメントレイヤビデオデータはMより大きいNビットのビット深度のためのエンハンスメントを提供し得る。例として、ベースレイヤのビット深度は8ビットであり得るし、エンハンスメントレイヤは10ビットのためのエンハンスメントを提供し得る。
この開示の手法は、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされるべきであるという判定に続くエンハンスメントレイヤビデオブロックのコーディングに関する。この場合に、2つまたは3以上の異なるインターレイヤ予測コーディングモードがインターベースレイヤブロックに関して利用され得るし、これらのインターレイヤ予測コーディングモードの1つはイントラブロックに関しても利用され得る。シンタクス情報は、デコーダがデコードにおいてインターレイヤ予測コーディングモードを使用できるように、エンコーダにおいて生成され、ビットストリームを用いて伝達され得る。
一例において、この開示は、ビット深度ベースSVC方式に従ってビデオデータをエンコードする方法を記述する。この方法は、ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを生成することを備え、ベースレイヤはMビットのビット深度を持つビデオデータを定め、エンハンスメントレイヤはMより大きいNビットまでのビット深度のエンハンスメントを定める。この方法は、ベースレイヤ及びエンハンスメントレイヤをエンコードすることも備える。エンハンスメントレイヤをエンコードすることは、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされるべきかどうかを判定することと、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされるべきであると判定するときに、Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定することとを含む。Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、この方法は第1のインターレイヤ予測コーディング手法に従ってNビットエンハンスメントレイヤビデオブロックをコーディングすることを含み、第1のインターレイヤ予測コーディング手法はNビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分として残差ビデオブロックを生成することを含む。Nビットエンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、この方法は第1のインターレイヤ予測コーディング手法及び第2のインターレイヤ予測コーディング手法のどちらかを選択することを含み、第2のインターレイヤ予測コーディング手法はNビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分として残差ビデオブロックを生成することを含む。
別の例において、この開示は、ビット深度ベースSVC方式に従ってビデオデータをデコードする方法を記述する。このデコード方法は、ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを受信することを備え、ベースレイヤはMビットのビット深度を持つビデオデータを定め、エンハンスメントレイヤはMより大きいNビットまでのビット深度のエンハンスメントを定める。この方法は、ベースレイヤ及びエンハンスメントレイヤをデコードすることも含む。エンハンスメントレイヤをデコードすることは、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされたかどうかを判定することと、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされたことを判定するときに、Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定することとを含む。Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、この方法は第1のインターレイヤ予測コーディング手法に従ってNビット残差エンハンスメントレイヤビデオブロックをデコードすることを含み、第1のインターレイヤ予測コーディング手法はNビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む。Nビット残差エンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、この方法は第1のインターレイヤ予測コーディング手法及び第2のインターレイヤ予測コーディング手法のどちらかを選択することを含み、第2のインターレイヤ予測コーディング手法はNビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として復元ビデオブロックを生成することを含む。
別の例において、この開示は、ビット深度ベースSVC方式に従ってビデオデータをエンコードする装置を記述する。この装置はビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを生成するビット深度ベーススケーラブルビデオエンコーダを備え、ベースレイヤはMビットのビット深度を持つビデオデータを定め、エンハンスメントレイヤはMより大きいNビットまでのビット深度のエンハンスメントを定める。ビデオエンコーダはベースレイヤ及びエンハンスメントレイヤをエンコードし、エンハンスメントレイヤに関して、ビデオエンコーダはNビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされるべきかどうかを判定し、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされるべきであると判定するときに、ビデオエンコーダはNビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定する。Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤビデオブロックに対応するならば、ビデオエンコーダは第1のインターレイヤ予測コーディング手法に従ってNビットエンハンスメントレイヤビデオブロックをエンコードし、第1のインターレイヤ予測コーディング手法はNビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差としての残差ビデオブロックの生成を含む。Nビットエンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、ビデオエンコーダは第1のインターレイヤ予測コーディング手法及び第2のインターレイヤ予測コーディング手法のどちらかを選択し、第2のインターレイヤ予測コーディング手法はNビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分としての残差ビデオブロックの生成を含む。
別の例では、この開示は、ビット深度ベースSVC方式に従ってビデオデータをデコードする装置を記述する。この場合に、この装置はビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを受信するビット深度ベーススケーラブルビデオデコーダを備え、ベースレイヤはMビットのビット深度を持つビデオデータを定め、エンハンスメントレイヤはMより大きいNビットまでのビット深度のエンハンスメントを定める。ビデオデコーダはベースレイヤ及びエンハンスメントレイヤをデコードし、エンハンスメントレイヤに関して、ビデオデコーダはNビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされたかどうかを判定し、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされたと判定するときに、ビデオデコーダはNビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定する。Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、ビデオデコーダは第1のインターレイヤ予測コーディング手法に従ってNビット残差エンハンスメントレイヤビデオブロックをデコードし、第1のインターレイヤ予測コーディング手法はNビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む。Nビット残差エンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、ビデオデコーダは第1のインターレイヤ予測コーディング手法及び第2のインターレイヤ予測コーディング手法のどちらかを選択し、第2のインターレイヤ予測コーディング手法はNビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として復元ビデオブロックを生成することを含む。
別の例において、この開示はビット深度ベースSVC方式に従ってビデオデータをエンコードするデバイスを記述する。このデバイスは、ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを生成するための手段を備え、ベースレイヤはMビットのビット深度を持つビデオデータを定め、エンハンスメントレイヤはMより大きいNビットまでのビット深度のエンハンスメントを定める。このデバイスは、ベースレイヤをエンコードするための手段と、エンハンスメントレイヤをエンコードするための手段とを更に備え、エンハンスメントレイヤをエンコードするための手段は、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされるべきであるかどうかを判定するための手段と、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされるべきであると判定するときに、Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定するための手段とを含む。Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、デバイスは第1のインターレイヤ予測コーディング手法に従ってNビットエンハンスメントレイヤビデオブロックをエンコードするための手段を呼び出し(invoke)、第1のインターレイヤ予測コーディング手法はNビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分として残差ビデオブロックを生成することを含む。Nビットエンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、デバイスは第1のインターレイヤ予測コーディング手法及び第2のインターレイヤ予測コーディング手法のどちらかを選択するための手段を呼び出し、第2のインターレイヤ予測コーディング手法はNビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分として残差ビデオブロックを生成することを含む。
別の例において、この開示は、ビット深度ベースSVC方式に従ってビデオデータをデコードするデバイスを記述する。このデバイスはビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを受信するための手段を備え、ベースレイヤはMビットのビット深度を持つビデオデータを定め、エンハンスメントレイヤはMより大きいNビットまでのビット深度のエンハンスメントを定める。このデバイスはベースレイヤをデコードするための手段と、エンハンスメントレイヤをデコードするための手段とを更に含み、エンハンスメントレイヤをデコードするための手段は、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされたかどうかを判定するための手段と、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされたと判定するときに、Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定するための手段とを含む。Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、デバイスは第1のインターレイヤ予測コーディング手法に従ってNビット残差エンハンスメントレイヤビデオブロックをデコードするための手段を備え、第1のインターレイヤ予測コーディング手法はNビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む。Nビット残差エンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、デバイスは第1のインターレイヤ予測コーディング手法及び第2のインターレイヤ予測コーディング手法のどちらかを選択するための手段を備え、第2のインターレイヤ予測コーディング手法はNビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として復元ビデオブロックを生成することを含む。
別の例において、この開示は、ビット深度ベースSVC方式に従ってビデオデータをエンコードするデバイスを記述する。このデバイスは、ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを生成し、ベースレイヤ及びエンハンスメントレイヤをエンコードするビット深度ベーススケーラブルビデオエンコーダを備え、ベースレイヤはMビットのビット深度を持つビデオデータを定め、エンハンスメントレイヤはMより大きいNビットまでのビット深度のエンハンスメントを定める。エンハンスメントレイヤに関して、ビデオエンコーダは、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされるべきかどうかを判定し、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされるべきであると判定するときに、Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定する。Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、ビデオエンコーダは第1のインターレイヤ予測コーディング手法に従ってNビットエンハンスメントレイヤビデオブロックをエンコードし、第1のインターレイヤ予測コーディング手法はNビットエンハンスメントレイヤビデオブロックと、対応する復元Mビットベースレイヤビデオブロックと間の差分としての残差ビデオブロックの生成を含む。Nビットエンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、ビデオエンコーダは第1のインターレイヤ予測手法及び第2のインターレイヤ予測手法のどちらかを選択し、第2のインターレイヤ予測はNビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分としての残差ビデオブロックの生成を含む。この例において、このデバイスはベースレイヤ及びエンハンスメントレイヤを別のデバイスに送信する無線送信器も含む。
別の例において、この開示はビット深度ベースSVC方式に従ってビデオデータをデコードするデバイスを記述する。このデバイスは、ビデオデータを受信する無線受信器と、ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを受信するビット深度ベーススケーラブルビデオデコーダとを備え、ベースレイヤはMビットのビット深度を持つビデオデータを定め、エンハンスメントレイヤはMより大きいNビットまでのビット深度のエンハンスメントを定める。ビデオデコーダはベースレイヤ及びエンハンスメントレイヤをデコードし、エンハンスメントレイヤに関して、ビデオデコーダは、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされたかどうかを判定し、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされたと判定するときに、Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定する。Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、ビデオデコーダは第1のインターレイヤ予測手法に従ってNビット残差エンハンスメントレイヤビデオブロックをデコードし、第1のインターレイヤ予測コーディング手法はNビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む。Nビット残差エンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、ビデオデコーダは第1のインターレイヤ予測コーディング手法及び第2のインターレイヤ予測コーディング手法のどちらかを選択し、第2のインターレイヤ予測コーディング手法はNビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として復元ビデオブロックを生成することを含む。
この開示において記述される手法は、ハードウェア、ソフトウェア、ファームウェアまたはそれらの任意の組み合わせにおいて実装され得る。ソフトウェアにおいて実装するならば、ソフトウェアは、マイクロプロセッサ、ASIC(application specific integrated circuit)、FPGA(field programmable gate array)またはDSP(digital signal processor)などの1つまたは複数のプロセッサにおいて実行され得る。この手法を実行するソフトウェアは、最初にコンピュータ可読媒体に保存され、プロセッサにロードされ、実行され得る。一部の場合において、ソフトウェアは、コンピュータ可読媒体及びコンピュータ可読媒体のためのパッケージング材料を含むコンピュータプログラム製品で販売されてもよい。
従って、別の例において、この開示は、実行時にビデオコーディングデバイスに、ビット深度ベースSVC方式に従ってビデオデータをエンコードさせる命令を備えるコンピュータ可読媒体を記述し、命令はデバイスにビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを生成させ、ベースレイヤはMビットのビット深度を持つビデオデータを定め、エンハンスメントレイヤはMより大きいNビットまでのビット深度のエンハンスメントを定める。命令は、デバイスに、ベースレイヤ及びエンハンスメントレイヤをエンコードさせ、エンハンスメントレイヤに関して、命令は、デバイスに、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされるべきであるかどうかを判定させ、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされるべきであると判定するときに、Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定させる。Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、命令は、デバイスに、第1のインターレイヤ予測コーディング手法に従ってNビットエンハンスメントレイヤビデオブロックをエンコードさせ、第1のインターレイヤ予測コーディング手法はNビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分としての残差ビデオブロックの生成を含む。Nビットエンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、命令は、デバイスに、第1のインターレイヤ予測コーディング手法及び第2のインターレイヤ予測コーディング手法のどちらかを選択させ、第2のインターレイヤ予測コーディング手法はNビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分としての残差ビデオブロックの生成を含む。
更なる別の例において、この開示は、実行時にデバイスに、ビット深度ベースSVC方式に従ってビデオデータをデコードさせる命令を備えるコンピュータ可読媒体を記述する。ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを受信するときに、命令は、デバイスに、ベースレイヤ及びエンハンスメントレイヤをデコードさせ、ベースレイヤはMビットのビット深度を持つビデオデータを定め、エンハンスメントレイヤはMより大きいNビットまでのビット深度のエンハンスメントを定め、エンハンスメントレイヤに関して、命令は、デバイスに、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされたかどうかを判定させ、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされたと判定するときに、Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定させる。Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、命令は、デバイスに、第1のインターレイヤ予測手法に従ってNビット残差エンハンスメントレイヤビデオブロックをデコードさせ、第1のインターレイヤ予測コーディング手法はNビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む。Nビット残差エンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、命令は、デバイスに、第1のインターレイヤ予測コーディング手法及び第2のインターレイヤ予測コーディング手法のどちらかを選択させ、第2のインターレイヤ予測コーディング手法はNビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として復元ビデオブロックを生成することを含む。
他の場合において、この開示は、集積回路などの回路、チップセット、ASIC(application specific integrated circuit)、FPGA(field programmable gate array)、ロジック、または本願において記述される1つまたは複数の手法を行うように構成されたそれらの種々の組み合わせに向けられ得る。
本開示の1つまたは複数の態様の詳細が、添付図面及び下記説明において説明される。この開示において記述される手法のその他の特徴、目的(object)及び利点は、説明及び図面から、及びクレームから明らかとなるだろう。
図1は、この開示の1つまたは複数の手法を実装するビデオエンコード及びデコードシステムを説明する例示的なブロック図である。 図2は、この開示に調和した例示的なビデオエンコーダを説明するブロック図である。 図3は、この開示に調和したビデオエンコーダを説明する別のブロック図である。 図4は、この開示に調和した例示的なビデオデコーダを説明するブロック図である。 図5及び図6は、この開示に調和した例示的なエンコード及びデコード手法を説明するフロー図である。 図5及び図6は、この開示に調和した例示的なエンコード及びデコード手法を説明するフロー図である。
一般に、この開示は、ビット深度ベースのスケーラブルビデオコーディング(SVC)方式において実行されるビデオエンコード及びビデオデコード手法を記述する。「コーディング(coding)」という用語は、一般的には、エンコードまたはデコードのいずれかを参照するために使用される。この開示に従って、ベースレイヤビデオデータ及びエンハンスメントレイヤビデオデータは、異なるビット深度で定められる。ベースレイヤビデオデータはMビットのビット深度を持ち得るし、エンハンスメントレイヤビデオデータはNビット(NはMより大きい)までのエンハンスメントを提供し得る。
この開示の手法はエンハンスメントレイヤがベースレイヤよりも大きいビット深度に対応する限りは任意のビット深度に適用され得るが、例として、ベースレイヤビット深度は8ビットであり得るし、エンハンスメントレイヤは10ビットのためのエンハンスメントを提供し得る。この例において、ピクセル値(例えば、ピクセルドメインにおけるクロマ及びルーマ値)は、エンハンスメントレイヤにおいて10ビットで表され、ベースレイヤにおいて8ビットで表される。8ビットは256個の異なるピクセル値を許容し得る一方、10ビットは1024個の異なるピクセル値を許容し得る。また一方では、N及びMに関する10及び8のビット深度値は、単なる例に過ぎない。一般的には、N及びMは正の整数を表し、NはMより大きい。
この開示の手法は、エンハンスメントレイヤビデオブロックのコーディングに関する。特に、この開示の手法は、特に、一度エンコーダがエンハンスメントレイヤビデオブロックはインターレイヤ予測を用いてベースレイヤに基づいてコーディングされるべきであると判定すると、または一度デコーダがエンハンスメントレイヤビデオブロックはインターレイヤ予測を用いてベースレイヤに基づいてコーディングされたと判定すると、適用される。これらの場合において、2つまたは3以上の異なるインターレイヤ予測コーディングモードがインターベースレイヤブロックの予測について利用され得るし、これら予測コーディングモードの1つもまたイントラベースレイヤブロックの予測について利用され得る。デコーダがデコードにおいてインターレイヤ予測コーディングモードを使用できるように、シンタクス情報がエンコーダにおいて生成され、ビットストリームを用いて伝達され得る。特に、第1のシンタクス情報はエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされているかどうかを伝達するために使用され得るし、第2のシンタクス情報はこの場合に使用されるインター予測コーディングモードを指定するために使用され得る。
「イントラ」エンハンスメントレイヤビデオブロック(例えば、対応するベースレイヤブロックが空間的コーディング手法に基づいてイントラコーディングされるエンハンスメントレイヤビデオブロック)のために、この開示は、残差ビデオブロックがNビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として生成される第1のインターレイヤ予測コーディング手法を使用する。このタイプの予測は、イントラベースレイヤブロックに対応するエンハンスメントレイヤビデオブロックに関して非常に効果的となり得る。
他方では、インターベースレイヤブロックに対応するエンハンスメントレイヤビデオブロック(例えば、対応するベースレイヤブロックが動き推定及び動き補償などの時間的コーディング手法に基づいてインターコーディングされるエンハンスメントレイヤブロック)のために、この開示は2つの異なるインターレイヤ予測コーディング手法のどちらかを選択する。この場合には、第1のインターレイヤ予測コーディング手法はイントラブロックのために使用されるものと同じであり、即ち、残差ビデオブロックがNビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分として生成される。第2のインターレイヤ予測コーディング手法は、Nビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分としての残差ビデオブロックの生成を含む。インターベースレイヤブロックに対応するエンハンスメントレイヤビデオブロックのためにこれら2つの異なる予測コーディング手法のどちらかを選択する能力は、望ましい圧縮及びビデオ品質を達成するときに非常に効果的となり得る。
エンコーダにおいて、この手法は種々のビデオブロックタイプ(イントラまたはインター)に適用され得るし、インターベースレイヤブロックのための2つの異なる予測コーディング手法のどちらかの選択は最高レベルのデータ圧縮及び/または最高のビデオ品質を提供する予測コーディング手法に基づいて起こり得る。レート及び歪は、しばしば、この選択をなすときにバランスを保たれる。シンタクス情報は、デコーダがエンコーダにおいて適用された予測エンコード手法を適切に通知されるように、ビットストリームにおいてコーディングされる。それから、デコーダにおいて、ビデオブロックタイプ(イントラまたはインター)及びシンタクス情報は、デコーダが正しい予測エンコード手法を適用することになるように、使用され得る。特に、デコーダにおいて、インターベースレイヤブロックのための2つの異なるインターレイヤ予測コーディング手法のどちらかの選択は、ビットストリームにおいて送信されたシンタクス情報に基づいて起こり得る。デコーダにおいて、種々の予測コーディング手法が、Nビットエンハンスメントレイヤ予測ビデオブロックと、エンコーダデバイスからデコーダデバイスに伝送されたNビットエンハンスメントレイヤ残差ビデオブロックとを加算することによりNビットエンハンスメントレイヤビデオブロックを復元するために使用される。
以下に大いに詳しく概説されるように、この開示に従って使用されるシンタクス情報は第1のシンタクス情報及び第2のシンタクス情報を備える。第1のシンタクス情報は、エンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤに基づいてコーディングされているかどうかを伝達するために使用され、ビデオブロック毎に1ビットを備える。この第1のシンタクス情報は、エンハンスメントレイヤビデオブロックがベースレイヤに基づいてコーディングされるときにのみ本願において記述される種々のコーディングモードをコーディングすることが適用され得る限りにおいて、本願において記述される手法に基本的な不可欠なものとなり得る。
第2のシンタクス情報は、エンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤビデオブロックに基づいてコーディングされていることを第1のシンタクス情報が識別するとき、及び対応するベースレイヤビデオブロックがインターブロックであるときに、エンハンスメントレイヤビデオブロックが第1または第2のインターレイヤ予測コーディング手法を用いて予測コーディングされたかどうかを定めるために送信される1ビットを備え得る。代替的には、第2のシンタクス情報は、エンハンスメントレイヤビデオブロックがインターレイヤ予測を用いてベースレイヤビデオブロックに基づいてコーディングされていることを第1のシンタクス情報が識別するときに、インターベースレイヤブロックまたはイントラベースレイヤブロックに基づいてコーディングされた各ビデオブロックと共に送信される1ビットのシンタクスを備え得る。後者の場合は、イントラコーディングされたベースレイヤブロックについて追加のビットを付加するが、これは伸張を達成するためには不必要であろう。しかしながら、(インターベースレイヤブロックに基づいてコーディングされたブロックだけでなく)イントラベースレイヤブロックに基づいてコーディングされたブロックに関してこの追加のビットを送信することにより、ビデオデコーダはベース及びエンハンスメントレイヤの並列的なエントロピーコーディングを行うことが可能となり得るし、これはデコード処理を加速するために多くの場合に望ましい。
図1は、ビデオエンコード及びデコードシステム10を説明するブロック図である。図1に示されるように、システム10は、通信チャネル15を介してデスティネーション(destination)デバイス16へエンコードされたビデオデータを送信するソースデバイス12を含む。ソースデバイス12はビデオエンコード処理の一部としてこの開示の手法を実行し得る一方、デスティネーションデバイス16はビデオデコード処理の一部としてこの開示の手法を実行し得る。
ソースデバイス12は、ビデオソース20、ビデオエンコーダ22及び変調器/送信器24を含み得る。デスティネーションデバイス16は受信器/復調器26、ビデオデコーダ28及び表示デバイス30を含み得る。システム10は、ビット深度ベースのスケーラブルビデオコーディング(SVC)方式を適用するように構成され得る。
SVCは、ベースレイヤ及び1つまたは複数のスケーラブルエンハンスメントレイヤが使用されるビデオコーディングを参照する。SVCに関して、ベースレイヤは、典型的には、ベースレベル品質のビデオデータを搬送する。1つまたは複数のエンハンスメントレイヤは、より高度な空間、時間及び/または信号対雑音SNRレベルをサポートするための追加的なビデオデータを搬送する。SVCの一例は、ビット深度ベースのSVCである。ビット深度ベースのSVCにおいて、ベースレイヤは第1のビット深度に従うベースレベル品質でピクセル値を定め得るし、エンハンスメントレイヤはベース及びエンハンスメントレイヤが一緒に例えば第1のビット深度よりも大きい第2のビット深度に従うより高度な品質レベルでピクセル値を定めるような追加的なデータを付加し得る。ビット深度スケーラビリティは、特により高い解像度の表示ケイパビリティ(これは、大抵の従来のディスプレイよりも高度なビット深度に基づいたピクセル再生をサポートする)の出現によって、ますます望ましくなりつつある。
この開示に従って、デバイス12及び16は、ベースレイヤイントラブロックに対応するエンハンスメントレイヤビデオブロックが第1のインターレイヤ予測コーディングに従う特定の方法でコーディングされる、エンハンスメントレイヤビデオブロックに関してのインターレイヤ予測コーディング手法を行う。また、ベースレイヤインターブロックに対応するエンハンスメントレイヤビデオブロックは、第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法のどちらかに基づいてコーディングされる。本願において記述されるイントラベースレイヤブロック及びインターブロックに対応するエンハンスメントレイヤブロックのためのビデオコーディング手法の独特な(unique)組合せは、ビデオ圧縮及び/またはビデオ品質における改善を提供し得る。また、この独特な組合せは、特に、一度エンハンスメントレイヤブロックがベースレイヤブロックに基づいてコーディングされていると判定されると、適用される。
図1の例において、通信チャネル15は、RF(radio frequency)スペクトルまたは1つまたは複数の物理伝送線などの任意の無線または有線通信媒体、または無線及び有線媒体の任意の組み合わせを備え得る。通信チャネル15は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなどの、パケットベースネットワークの一部を形成し得る。通信チャネル15は、一般的には、ソースデバイス12からデスティネーションデバイス16へとビデオデータを伝送するための、任意の適した通信媒体、または異なる通信媒体の集積を表す。この開示の手法は、デバイス12及び16間のいずれのタイプの通信にも限定されないし、無線または有線ベースのセッティングに適用され得る。しかしながら、スケーラブル手法は、しばしば無線通信に関連する。
ソースデバイス12は、デスティネーションデバイス16への送信のためにコーディングされたビデオデータを生成する。しかしながら、一部の場合において、デバイス12、16は、実質的に対称の方法で動作し得る。例えば、デバイス12、16の各々はビデオエンコード及びデコードコンポーネントを含み得る。従って、システム10は、例えば、ビデオストリーミング、ビデオ放送またはビデオ電話通信など、ビデオデバイス12、16間の一方向または双方向のビデオ伝送をサポートし得る。
ソースデバイス12のビデオソース20は、ビデオカメラなどのビデオキャプチャデバイス、以前にキャプチャされたビデオを含むビデオアーカイブ、またはビデオコンテンツプロバイダからのビデオフィードを含み得る。更なる選択肢として、ビデオソース20は、ソースビデオとしてコンピュータグラフィックベースデータ、またはライブビデオ及びコンピュータ生成されたビデオの組み合わせを生成し得る。一部の場合において、ビデオソース20がビデオカメラであるならば、ソースデバイス12及びデスティネーションデバイス16はいわゆるカメラフォンまたはビデオフォンを形成し得る。どちらの場合でも、キャプチャされ、プリキャプチャされ、またはコンピュータ生成されたビデオは、変調器/送信器22、通信チャネル15及び受信器/復調器26を介してのビデオソースデバイス12からデスティネーションデバイス16のビデオデコーダ28への伝送のためにビデオエンコーダ22によってエンコードされ得る。表示デバイス30は、ユーザにデコードされたビデオデータを表示し、ブラウン管、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、または別のタイプの表示デバイスなどの任意の種々の表示デバイスを備え得る。
ビデオエンコーダ22及びビデオデコーダ28は、ビット深度ベーススケーラビリティのためのSVCをサポートするように構成され得る。特に、エンコーダ22及びデコーダ28は、ベースレイヤ及び1つまたは複数のスケーラブルエンハンスメントレイヤのエンコード、伝送及びデコードをサポートすることによって様々な程度のスケーラビリティをサポートし得る。更に、ビット深度ベースSVCに関して、ベースレイヤは第1のビット深度Mに従うベースレベル品質を備えるビデオデータを搬送する。1つまたは複数のエンハンスメントレイヤは、第2のビット深度N(NはMより大きい)に従うより高いレベルの品質をサポートするための追加的なデータを搬送する。一部の場合において、ベースレイヤはエンハンスメントレイヤの伝送よりも信頼度の高い方法で伝送され得る。例えば、変調信号のうち最も信頼度の高い部分がベースレイヤを伝送するために使用され得る一方、変調信号のうち信頼度の劣る部分がエンハンスメントレイヤを伝送するために使用され得る。他の場合において、ベース及びエンハンスメントレイヤ情報は任意の方法で伝送され得るし、受信デバイスはベースレイヤのみをデコードすること、または復元ピクセル値のビット深度増大による品質改善のためにベースレイヤ及びエンハンスメントレイヤをデコードすることを選択し得る。
SVCをサポートするために、ビデオエンコーダ22は、ベースレイヤ及び1つまたは複数のエンハンスメントレイヤの夫々のエンコードを行うように設計されたスケーラブルビット深度ビデオコーダを備え得る。同様に、ビデオデコーダ28は、ベース及びエンハンスメントレイヤの両方に関してビデオブロックをデコードするスケーラブルビット深度デコーダを備え得る。ビデオデコーダ28は、ベース及びエンハンスメントレイヤの両方に関してビデオブロックをデコードし、ビデオシーケンスのフレームを復元するためにデコードされたビデオを結合させる。表示デバイス30は、デコードされたビデオシーケンスを受信し、ユーザにビデオシーケンスを提示する。
ビデオエンコーダ22及びビデオデコーダ28は、MPEG−2、MPEG−4、ITU−T H.263、またはITU−T H.264/MPEG−4,Part 10,AVC(Advanced Video Coding)などのビデオ圧縮標準に従って動作し得る。図1に示されていないが、一部の態様において、ビデオエンコーダ22及びビデオデコーダ28はオーディオエンコーダ及びデコーダと夫々統合され得るし、共通のデータストリームまたは別個のデータストリーム内のオーディオ及びビデオ両方のエンコードを扱うために、適切なMUX−DEMUXユニット、または他のハードウェア及びソフトウェアを含み得る。適用可能であるならば、MUX−DEMUXユニットは、ITU H.223マルチプレクサプロトコル、またはユーザデータグラムプロトコル(UDP)などの他のプロトコルに従い得る。
H.264/MPEG−4 Part 10 AVC標準は、JVT(Joint Video Team)として知られる集合的パートナシップの成果として、ISO/IEC MPEG(Moving Picture Experts Group)と一緒にITU−T VCEG(Video Coding Experts Group)によって公式化された。一部の態様において、この開示において記述される手法は、通常はH.264標準、またはその拡張に従うデバイスに適用され得る。H.264標準は、2005年3月付けの、ITU−T研究グループ(Study Group)による、“ITU-T Recommendation H.264, Advanced Video Coding for generic audiovisual services”に記述されており、これはH.264標準またはH.264仕様書、またはH.264/AVC標準または仕様書として本願において参照され得る。
JVT(Joint Video Team)は、H.264/MPEG−4 AVCに対するSVC拡張の取り組みを継続している。発展中の(evolving)SVC拡張の仕様書は、しばしばJD(Joint Draft)の形式でリリースされる。JVTによって創造されたJSVM(Joint Scalable Video Model)はスケーラブルビデオで用いるツールを実装しており、これはこの開示において記述される種々のコーディングタスクのためにシステム10内で使用され得る。
一部の態様において、ビデオ放送のために、この開示において記述される手法は、技術標準TIA−1099(“FLO仕様書”)として公表されている、フォワードリンクオンリー(FLO)エアインタフェース仕様書、“Forward Link Only Air Interface Specification for Terrestrial Mobile Multimedia Multicast”を用いて地上波(terrestrial)モバイルマルチメディアマルチキャスト(TM3)システムにおいてリアルタイムビデオサービスを配信するためにエンハンストH.264ビデオコーディングに適用され得る。即ち、通信チャネル15はFLO仕様書または同種のものに従って無線ビデオ情報を放送するために使用される無線情報チャネルを備え得る。FLO仕様書は、ビットストリームシンタクス及びセマンティクス及びFLOエアインタフェースに適したデコード処理を定める例を含む。代替的に、ビデオは、DVB−H(digital video broadcast-handheld)、ISDB−T(integrated services digital broadcast - terrestrial)、またはDMB(digital media broadcast)などの他の標準に従って放送され得る。従って、ソースデバイス12はモバイル無線端末、ビデオストリーミングサーバ、またはビデオ放送サーバであり得る。しかしながら、前述のように、この開示において記述される手法は、いずれの特定のタイプの放送、マルチキャストまたは2点間システムにも限定されない。放送の場合には、ソースデバイス12は多数のデスティネーションデバイスへいくつかのビデオデータのチャネルを放送し得るが、これらの各々は図1のデスティネーションデバイス16と同様であり得る。
ビデオエンコーダ22及びビデオデコーダ28は、夫々、1つまたは複数のマイクロプロセッサ、DSP(digital signal processor)、ASIC(application specific integrated circuit)、FPGA(field programmable gate array)、ディスクリートロジック、ソフトウェア、ハードウェア、ファームウェアまたはそれらの任意の組み合わせとして実装され得る。ビデオエンコーダ22及びビデオデコーダ28の各々は1つまたは複数のエンコーダまたはデコーダに含まれ得るが、これらのどちらかが個別のモバイルデバイス、加入者デバイス、放送デバイス、サーバまたは同種のものにおける結合されたエンコーダ/デコーダ(CODEC)の一部として統合され得る。また、ソースデバイス12及びデスティネーションデバイス16は、夫々、無線通信をサポートするのに十分なRF(radio frequency)ワイヤレスコンポーネント及びアンテナを含む、エンコードされたビデオの送信及び受信のための適切な変調、復調、周波数変換、フィルタリング及び増幅コンポーネントを、適用可能なように、含み得る。しかしながら、説明の容易性のために、係るコンポーネントは、図1におけるソースデバイス12の変調器/送信器及びデスティネーションデバイス16の受信器/復調器であるとして要約されている。
ビデオシーケンスは一連のビデオフレームを含み、これはスライスまたは他のコーディング単位に更に分割され得る。ビデオエンコーダ22は、ビデオデータをエンコードするために、個別のビデオフレーム内のビデオブロック(またはスライスまたは他のコーディング単位内のビデオブロック)の処理をする。ビデオブロックはルーマ及びクロマブロックを備え得るし、例えば任意のコーディング標準に従って定められるような固定または可変サイズを持ち得る。更に、一部の場合において、各ビデオフレームは、一連のスライスを含み得る。更に、各スライスは一連のマクロブロックを含み得るし、これはサブブロックに整理(arrange)され得る。例として、ITU−T H.264標準は、ルーマコンポーネントについて16×16、8×8、または4×4ブロックサイズなどの種々のブロックサイズでのイントラ予測と、クロマコンポーネントについて8×8ブロックサイズでのイントラ予測と、同様に、ルーマコンポーネントについて16×16、16×8、8×16、8×8、8×4、4×8、及び4×4ブロックサイズ及びクロマコンポーネントについて対応するブロックサイズなどの種々のブロックサイズでのインター予測とをサポートする。ビデオシーケンスがYUV4:2:0フォーマットであるならば、クロマコンポーネントについての対応するインター予測ブロックサイズは、水平及び垂直方向の各々で2という因数によってダウンサンプルされた対応するルーマブロックサイズである。ビデオブロックは、ピクセルデータのブロック、または例えば離散コサイン変換(DCT)などの変換処理の後の変換係数のブロックを備え得る。
より小さなビデオブロックはより優れた解像度を提供可能であり、より高レベルな細部を含むビデオフレームの位置について使用され得る。一般的には、マクロブロック(MB)及び種々のサブブロックが、ビデオブロックであるとみなされ得る。また、スライスは、一連の、MB及び/またはサブブロックなどのビデオブロックであるとみなされ得る。各スライスは、ビデオフレームに属する独立してデコード可能な単位であり得る。予測の後に、変換が8×8残差ブロックまたは4×4残差ブロックに実行され得るが、イントラ16×16予測モードが使用されるならば追加的な変換がクロマコンポーネントまたはルーマコンポーネントについて4×4ブロックのDC係数に適用され得る。更に、変換の後に、データは、ビデオブロック、即ち、変換係数のブロックとして依然参照され得る。イントラまたはインターベース予測コーディング及び変換手法(H.264/AVCにおいて使用される4×4または8×8DCTのような整数変換、またはDCTの別の形式)及び量子化手法(スカラー量子化など)の後に、ランレングスコーディングが行われ得る。
この開示の手法によれば、エンハンスメントレイヤビデオブロックは、イントラベースレイヤブロックに対応するビデオブロックに第1のインターレイヤ予測コーディング手法を適用し、インターベースレイヤブロックに対応するビデオブロックについて第1のインターレイヤコーディング手法と第2のインターレイヤ予測コーディング手法との間でどちらかを選択する方法論に従って予測コーディングされる。これらの異なる予測パスは、特に、一度エンハンスメントレイヤビデオブロックがベースレイヤブロックに基づいてコーディングされていると判定されると、適用される。特に、エンコーダにおいて、第1のインターレイヤ予測コーディング手法は、対応する復元Mビットベースレイヤブロックに基づくNビット予測ブロックの生成を含む。第2のインターレイヤ予測コーディング手法は、本質的には、ベースレイヤブロックの動き情報を取り入れ、Mビットドメインに対応するベースレイヤブロックの動き情報を用いてNビットドメインのビデオブロックに基づいて予測エンハンスメントレイヤブロックを生成する。Nビットはエンハンスメントレイヤデータのビット深度でありMビットはベースレイヤデータのビット深度であるよう、Nの値はMよりも大きい。デコーダにおいて、同様の予測コーディング手法がエンコーダからデコーダに伝達されるNビット残差エンハンスメントレイヤビデオブロックに基づいて原(original)ビデオブロックを復元するために使用され、シンタクス情報はデコーダがどの予測コーディング手法を種々のビデオブロックについて使用するかを識別するのに役立ち得る。
図2は、この開示に調和した例示的なスケーラブルビデオエンコーダ200の別の描写を説明するブロック図である。スケーラブルビデオエンコーダ200は、図1のスケーラブルビット深度ビデオエンコーダ22に対応し得る。スケーラブルビデオエンコーダ200は、ベースレイヤエンコーダ180及びエンハンスメントレイヤエンコーダ150を備える。別々に説明されているが、一部の実装において、ベースレイヤエンコーダ180及びエンハンスメントレイヤエンコーダ150の種々のユニットは共有または結合され得る。ベースレイヤエンコーダ180はベースレイヤビデオブロックをエンコードする一方、エンハンスメントレイヤエンコーダ150はエンハンスメントレイヤビデオブロックをエンコードする。エンコード側では、この開示の手法は、通常、エンハンスメントレイヤエンコーダ150によるエンハンスメントレイヤビデオブロックのエンコードに関する。
エンハンスメントレイヤエンコーダ150は、残差ビデオブロックを生成するために入力(incoming)Nビットエンハンスメントレイヤビデオブロックから予測ビデオブロックを減算する加算器114を備え得る。スイッチ118は、以下に大いに詳細に概説されるように、エンコーダ150内の予測パスを定める。エンハンスメントレイヤエンコーダ150は、残差ビデオブロックを変換及び量子化するための変換ユニット102及び量子化ユニットを含む。また、エンハンスメントレイヤエンコーダ150はユニット108を含み得るが、これは逆量子化ユニット及び逆変換ユニットの両方を表す。エントロピーコーディングユニット106は、動きベクトル、イントラ予測シンタクス、または使用される予測手法を識別するための本願において定められる情報などの任意のシンタクス情報と一緒に残差ブロックをエントロピーコーディングする。加算器116は、ユニット108からの残差ブロック及び係る残差ブロックをコーディングするために使用された予測ブロックに基づいてビデオブロックを復元する。デブロックフィルタユニット112は復元データをフィルタリングすることができ、それからこれは本願において記述されるようなイントラまたはインター予測における予測ユニット110による使用のためのフレームバッファ111に転送される。
ベースレイヤエンコーダ180は、ベースレイヤビデオブロックのイントラまたはインター予測における使用のための予測ユニット120を含む、種々のユニットを備え得る。加算器126は、残差ビデオブロックを生成するために、入力(incoming)Mビットベースレイヤビデオブロックから予測ビデオブロックを減算する。変換ユニット128はDCTなどの変換を行い、量子化ユニット130は量子化を行う。ユニット134は、逆量子化ユニット及び逆変換ユニットの両方を表す。エントロピーコーディングユニット132は、ベースレイヤビデオブロックについての動きベクトルまたはイントラ予測シンタクスなどの任意のシンタクス情報と一緒に残差ブロックをエントロピーコーディングする。加算器124は、ユニット134からの復元残差ブロック及び係る残差ブロックをコーディングするために使用された予測ブロックに基づいてビデオブロックを復元する。デブロックフィルタユニット122は復元データをフィルタリングすることができ、それからこれはベースレイヤデータの後続のイントラまたはインター予測における予測ユニット120による使用のためのフレームバッファ121に転送される。
スケーラブルビデオエンコーダ200は、エンハンスメントレイヤエンコーダ150からのNビットサンプルをベースレイヤエンコーダ180のためのMビットサンプルにダウンサンプルするトーンマッピングユニット114も備える。また、スケーラブルビデオエンコーダ200は、ベースレイヤエンコーダ180からのMビットサンプルをエンハンスメントレイヤエンコーダ150のためのNビットサンプルにアップサンプルする逆トーンマッピングユニットを備える。多重化ユニット118は、コーディングされたデジタルビデオのスケーリングされた出力ストリームを生成するために、エンハンスメントレイヤエンコーダ150からのNビット出力サンプルの復元のための情報を搬送するエンハンスメントレイヤビットストリームをベースレイヤエンコーダ180からのMビット出力サンプルの復元のための情報を搬送するベースレイヤビットストリームと結合する。
エンハンスメントレイヤエンコーダ150は、エンハンスメントレイヤビデオブロックをコーディングするために、対応するベースレイヤデータ(例えば、空間的及び時間的に同様に位置するベースレイヤのコーディング単位)に依存する1つまたは複数の予測手法を行い得る。この開示によれば、ビット深度スケーラブルビデオエンコードは、エンハンスメントレイヤエンコーダ150及びベースレイヤエンコーダ180によって適用される。ベースレイヤエンコーダ180はベースレイヤを生成する一方、エンハンスメントレイヤエンコーダ150はエンハンスメントレイヤを生成する。ベースレイヤはMビットのビット深度を持つビデオデータを定め、エンハンスメントレイヤはMより大きいNビットのビット深度までのビットデータのエンハンスメントを定める。
この開示の技術は、特に、一度予測ユニット110がエンハンスメントレイヤビデオブロックはベースレイヤデータに基づいてコーディングされるべきであると判定すると、エンハンスメントレイヤエンコーダ150によって行われるエンハンスメントレイヤエンコードに関して適用される。しかしながら、より一般的には、予測ユニット110は、以前に復元されたエンハンスメントレイヤデータに基づくエンハンスメントレイヤ予測を含む、多種多様の他のタイプの予測手法もサポートし得る。予測ユニット110は、例えば、全くのエンハンスメントレイヤ内でのイントラベースの空間的予測及びインターベースの時間的予測をサポートし得る。この開示の手法は、より具体的には、ベースレイヤデータがエンハンスメントレイヤデータの予測において使用されるインターレイヤ予測を予測ユニット110がサポートするときに適用される。
一度予測ユニット110が一部のタイプのインターレイヤ予測が使用されるであろうことを判定すると、この開示の手法が使用され得る。特に、スイッチ118を制御することにより、エンコーダ150は、イントラコーディングされたベースレイヤブロックに対応する任意のエンハンスメントレイヤビデオブロックに第1のインターレイヤ予測コーディング手法を適用する。第1のインターレイヤ予測コーディング手法は、Nビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分として残差ビデオブロックを生成することを含む。対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンは、逆トーンマッピングユニット116によって加算器114に供給され得る。
インターコーディングされたベースレイヤブロックに対応する任意のエンハンスメントレイヤビデオブロックに関して、スイッチ118は2つの異なる予測パスの間でどちらかを選択する。スイッチ118は、予測パス(例えば、第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法が使用されるかどうか)を制御する制御ロジック(またはソフトウェアルーチン)を備え得る。Nビットエンハンスメントレイヤビデオブロックがインターブロックに対応するならば、スイッチ118は加算器に2つの異なる予測パスの間でどちらかを選択させる。第1のパスは第1のインターレイヤ予測コーディング手法に対応し、第2のパスは第2のインターレイヤ予測コーディング手法に対応する。上述のように、第2のインターレイヤ予測コーディング手法は、Nビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分として、残差ビデオブロックを生成することを含む。
エンハンスメントレイヤエンコーダ150は、それから、デコーダがエンコードされたデータをどのようにデコードするかを判定できるように、デコーダによって使用される情報をエンコードし得る。特に、エンハンスメントレイヤエンコーダ150は、第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法がNビットエンハンスメントレイヤビデオブロックをエンコードするために使用されたかどうかを判定するためにデコーダによって使用される、エンコードされたエンハンスメントレイヤビットストリーム内の情報をエンコードする。
係るシンタクスはインターレイヤ予測が使用されているかどうかを示す第1のシンタクス情報を含み得るが、これはビデオブロック毎に1ビットを備え得る。また、シンタクスはデコーダによって使用される第2のシンタクス情報を含むことができ、これはインターレイヤ予測が使用されるビデオブロックに毎に別の情報ビットを備え得るが、これは第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する。
代替的には、前述のように、イントラベースレイヤブロックに対応するエンハンスメントレイヤブロックは常に第1のインターレイヤ予測コーディング手法を用いてコーディングされ、デコーダはイントラベースレイヤブロックに対応するエンハンスメントレイヤブロックが第1のインターレイヤ予測コーディング手法を用いてデコードされるべきであることを知るようにプログラムされ得るので(インターレイヤ予測が第1のシンタクス情報によって示される通りにサポートされることを仮定する)、デコーダによって使用される第2のシンタクス情報はインターベースレイヤブロックに対応するビデオブロック毎に1つの情報ビットを備え得る。この場合に、第2のシンタクス情報の1ビットと、Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤビデオブロックまたはインターベースレイヤビデオブロックに対応するかどうかの判定との組み合わせが、第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する。即ち、第2のシンタクス情報は、インターレイヤ予測が使用され、かつ、対応するベースレイヤビデオブロックがインターコーディングされたビデオブロック毎に1ビットを備え得る。
また一方では、この第2のシンタクス情報のためにビデオブロック毎に1ビットを含めること、または代替的に、インターレイヤ予測が使用され、かつ、インターコーディングされたベースレイヤビデオブロックに対応するビデオブロック毎にのみ1ビットを含めることの実装決定は、デコードがエンハンスメントレイヤ及びベースレイヤビットストリームの別々のエントロピーデコード及び構文解析(parsing)をサポートするかどうかに依存し得る。例えばデコードを加速するために、エンハンスメントレイヤ及びベースレイヤビットストリームの別々のエントロピーデコード及び構文解析が望まれているならば、対応するインターベースレイヤブロックに基づいてコーディングされるブロックについてのみビデオブロック毎に単に1ビットが第2のシンタクスのために使用されるよりも、ビデオブロック(例えば、対応するイントラベースレイヤブロックまたは対応するインターベースレイヤブロックに基づいてコーディングされる)毎に1ビットが第2のシンタクスのために使用されるべきである。さもなければ、デコーダは、第1のインターレイヤ予測コーディング手法及び第2のインターレイヤ予測コーディング手法のどちらかを識別するビットをデコードするかどうかについてエンハンスメントレイヤビデオブロックのために判定をなすために、デコードされたベースレイヤビデオブロックのコーディングタイプの知識を必要とするだろう。
ビデオブロックのために使用される予測コーディング手法を識別するためにデコーダによって使用される任意の予測シンタクス及び任意の追加ビットと同様に、エンコードされたエンハンスメントレイヤビデオブロックは、ユニット106によってエントロピーコーディングされる。多重化ユニット118は、出力ビットストリームを作るために、ベースレイヤビットストリームをエンハンスメントレイヤビットストリームと結合する。出力ビットストリームは、保存され、及び/または、変調されて別のデバイスに送信され得る。
一部の態様において、この開示の手法は、この手法が予測パスの独特かつ有用な組合せを提供する限りにおいて従来の手法とは異なる。エンハンスメントレイヤ予測は、対応するベースレイヤデータに関連する予測データ(例えば、動きベクトル)に基づいて可能となる。他方では、エンハンスメントレイヤ予測は対応するベースレイヤデータのアップサンプルされたバージョンに基づいても可能となり、このタイプの予測はインターコーディングされたベースレイヤブロックに対応するエンハンスメントレイヤビデオブロックまたはイントラコーディングされたベースレイヤブロックに対応するエンハンスメントレイヤビデオブロックのどちらにも許容される。更に、これらの手法は、一部のタイプのベースレイヤデータがエンハンスメントレイヤデータの予測に使用されることになる場合に一部の形式のインターレイヤ予測が選択されるという条件で適用される。
図3は、図1のスケーラブルビット深度ビデオエンコーダ22に対応し得る例示的なスケーラブルビデオエンコーダ35を説明するブロック図である。スケーラブルビデオエンコーダ35は、ベースレイヤエンコーダ60及びエンハンスメントレイヤエンコーダ40を備える。別個に説明されているが、一部の実装において、ベースレイヤエンコーダ60及びエンハンスメントレイヤエンコーダ40の種々の要素が共有または結合され得る。ベースレイヤエンコーダ60はベースレイヤブロックをエンコードする一方、エンハンスメントレイヤエンコーダ40はエンハンスメントレイヤビデオブロックをエンコードする。エンコード側では、この開示の技術は、一般的には、Nビットエンハンスメントレイヤビデオブロックがベースレイヤに基づいてコーディングされるべきであると判定するときのエンハンスメントレイヤエンコーダ40によるエンハンスメントレイヤビデオブロックのエンコードに関する。
エンハンスメントレイヤエンコーダ40は、制御ユニット42によって制御される種々のエンコードユニット44を備え得る。同様に、ベースレイヤエンコーダ60は、制御ユニット62によって制御される種々のエンコードユニット64を備え得る。スケーラブルビデオエンコーダ35は、エンハンスメントレイヤエンコーダ40からのNビットサンプルをベースレイヤエンコーダ60のためのMビットサンプルにダウンサンプルするトーンマッピングユニット54も備える。また、スケーラブルビデオエンコーダ35は、ベースレイヤエンコーダ60からのMビットサンプルをエンハンスメントレイヤエンコーダ40のためのNビットサンプルにアップサンプルする逆トーンマッピングユニット55を備える。多重化ユニット58は、コーディングされたデジタルビデオデータのスケーリングされた出力ストリームを生成するために、エンハンスメントレイヤエンコーダ40からのNビット出力サンプルの復元のための情報を搬送するエンハンスメントレイヤビットストリームを、ベースレイヤエンコーダ60からのMビット出力サンプルの復元のための情報を搬送するベースレイヤビットストリームと結合する。多重化ユニット58は、MPEG−2ファイルフォーマットに従って係るデータを結合し得る。
ベースレイヤエンコードに関して、ベースレイヤエンコーダ60はイントラユニット66、インターユニット68及びエントロピーコーディングユニット69を含む。量子化ユニット及びDCTユニットなどの種々の他のユニットが予測ビデオコーディングにおいて一般に使用されるが、説明の単純性及び容易性のために図3において説明されていない。イントラユニット66はイントラビデオブロックのイントラベースエンコードを行う一方、インターユニット68はインタービデオブロックのインターベースエンコードを行う。エントロピーコーディングユニット69は、エントロピーコーディング方法論に従ってエンコードされたデータ及びシンタクス情報を更に圧縮する。
ベースレイヤブロックのイントラベースエンコードに関して、イントラユニット66は、コーディングされているビデオブロックと同じコーディング単位(例えば、同じフレームまたはスライス)内のデータに基づいて予測データを生成し得る。予測データは残差を生成するためにコーディングされているビデオブロックから減算され、それからこれは変換されて量子化され得る。残差データ及び予測シンタクス(例えば、適用されたイントラ予測のモードまたは方法を識別する)は、エントロピーコーディングのためにエントロピーコーディングユニット69に供給され得る。
ベースレイヤビデオブロックのイントラベースエンコードに関して、インターユニット68は異なるコーディング単位(例えば、ビデオシーケンスの先行のまたは後続のフレームまたはスライス)内のデータに基づいて予測データを生成し得る。予測データは残差を生成するためにコーディングされているビデオブロックから減算され、それからこれは変換されて量子化され得る。残差データ及び予測シンタクス(例えば、先行のまたは後続するコーディング単位から予測ブロックを識別する1つまたは複数の動きベクトル)は、エントロピーコーディングのためにエントロピーコーディングユニット69に供給され得る。
エンハンスメントレイヤエンコーダ40は、ベースレイヤエンコーダ60とはわずかに異なる方法で予測ベースエンコードを行い得る。具体的には、エンハンスメントレイヤエンコーダ40は、エンハンスメントレイヤビデオブロックをコーディングするために、対応するベースレイヤデータ(例えば、空間的及び時間的に同様に位置するベースレイヤのコーディング単位)に依存する1つまたは複数のインターレイヤ予測手法を行い得る。更に、エンハンスメントレイヤエンコーダ40は他のタイプの予測(例えば、エンハンスメントレイヤデータのみに基づく1つまたは複数の他の手法)もサポートし得るが、この開示の手法はベースレイヤデータに依存する予測手法に適用される。
この開示によれば、ビット深度スケーラブルビデオエンコードは、エンハンスメントレイヤエンコーダ40及びベースレイヤエンコーダ60によって適用される。ベースレイヤエンコーダ60はベースレイヤビットストリームを生成する一方、エンハンスメントレイヤエンコーダ40はエンハンスメントレイヤビットストリームを生成する。ベースレイヤビットストリームはMビットのビット深度を持つビデオデータを定め、エンハンスメントレイヤビットストリームはMより大きいNビットのビット深度のためにビデオデータのエンハンスメントを定める。
この開示の手法は、特に、Nビットエンハンスメントレイヤビデオブロックがベースレイヤに基づいてコーディングされるべきであるとエンハンスメントレイヤエンコーダ40が判定するときにエンハンスメントレイヤエンコーダ40によって行われるエンハンスメントレイヤエンコードに関して適用される。エンハンスメントレイヤエンコーダ40は、第1の予測ユニット46、第2の予測ユニット48、及びエントロピーコーディングユニット52を含む、種々のエンコードユニット44を含む。これら種々のエンコードユニット44は、本願において記述される異なるタイプのコーディングを実行するために、統合され、及び/または、共有のロジックまたはルーチンを持ち得る。更に、ベースレイヤエンコーダ60と同様に、エンハンスメントレイヤエンコーダ40は、例えば残差ビデオブロックをDCT係数に変換するため及びDCT係数を量子化するための、量子化ユニット及び変換ユニット(図示されない)を更に含み得る。更に、これらコンポーネントは、説明の単純性及び容易性のために図3において示されていないが、第1及び第2の予測ユニット46及び48の一部であるとみなすこともできる。エンハンスメントレイヤエンコーダ60がNビットドメインにおけるイントラ及びインター予測もサポートし得ることも注意されるべきである。エンハンスメントレイヤエンコーダ60のこれらイントラ及びインターユニットは、説明の単純性及び容易性のために示されていない。
第1の予測ユニット46は、イントラコーディングされたベースレイヤビデオブロックに対応するエンハンスメントレイヤビデオブロックのエンコードのために使用され得る。第1の予測ユニット46は、Nビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分として残差ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法を適用する。対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンは、逆トーンマッピングユニット56によって第1の予測ユニット46に供給され得る。
第2の予測ユニット48は第2のタイプの予測コーディング手法を適用し、これはNビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分として残差ビデオブロックを生成することを含む。この場合には、対応するベースレイヤビデオブロックのアップサンプルされたバージョンを使用するよりも、第2の予測ユニット48 50はエンハンスメントレイヤデータに関して動き補償を行うために対応するベースレイヤビデオブロックの予測シンタクス(例えば、動きベクトルを)を単に使用する。第2の予測ユニット48は、以前に復元されたエンハンスメントレイヤデータ(例えば、以前にエンコードされたフレームまたはスライスのデコードされたバージョン)を保存するメモリを備え得る。対応するベースレイヤビデオブロックに関連する動きベクトル(例えば、「ベースレイヤの動き情報」)を用いて、第2の予測ユニット48は、Nビットドメインでの予測ブロックを生成するために、この保存されたエンハンスメントレイヤデータに関して動き補償を行うことができる。
斯くして、この開示によれば、制御ユニット42は、Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定する。Nビットエンハンスレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、制御ユニット42の指示で、第1の予測ユニット46は第1のインターレイヤ予測コーディング手法に従ってNビットエンハンスメントレイヤビデオブロックをコーディングし、ここで第1のインターレイヤ予測コーディング手法はNビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分として残差ビデオブロックを生成することを含む。Nビットエンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、制御ユニット42は第1のインターレイヤ予測コーディング手法(これは第1の予測ユニット46によって適用され得る)と第2のインターレイヤ予測コーディング手法(これは第2の予測ユニット48によって適用され得る)との間でどちらかを選択する。前述のように、第2のインターレイヤ予測コーディング手法は、Nビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分として残差ビデオブロックを生成することを含む。
制御ユニット42は、それから、デコーダがエンコードされたデータをどのようにデコードするかを判定できるよう、デコーダによって使用される情報をエンコードする。特に、制御ユニット42は、Nビットエンハンスメントレイヤビデオブロックをエンコードするために第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法が使用されたかどうかを判定するためにデコーダによって使用される、エンコードされたビットストリーム内の情報をエンコードする。一例において、このデコーダによって使用される「第2の」シンタクス情報はインターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備え得るが、ここでこの1ビットの情報と、Nビットエンハンスメントレイヤビデオブロックがイントラブロックまたはインターブロックに対応するかどうかの判定との組み合わせが第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する。
代替的には、イントラベースレイヤブロックに基づいてコーディングされたエンハンスメントレイヤブロックは常に第1のインターレイヤ予測コーディング手法を用いてコーディングされ、デコーダはイントラベースレイヤブロックに対応するエンハンスメントレイヤブロックが第1のインターレイヤ予測コーディング手法を用いてデコードされるべきであることを知るようにプログラムされ得るので、デコーダによって使用される「第2の」シンタクス情報はインターベースレイヤビデオブロックに基づいてコーディングされたビデオブロック毎に1ビットの情報を備え得る。この場合には、1ビットの情報と、Nビットエンハンスメントレイヤビデオブロックがイントラブロックまたはインターブロックに対応するかどうかの判定との組み合わせが、第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する。更に、「第2の」シンタクス情報は、ビデオブロック毎に1ビットある「第1の」シンタクス情報が任意の形式のインターレイヤ予測が選択されたかどうかを識別する場合に限ってコーディングされる。
この「第2の」シンタクス情報に関して、ビデオブロック毎に1ビットを含めること、または代替的に、インターベースレイヤビデオブロックに対応するビデオブロック毎にのみ1ビットを含めることの決定は、デコーダがエンハンスメントレイヤ及びベースレイヤの別々のエントロピーデコード及び構文解析をサポートするかどうかに依存し得る。例えばデコードを加速するために、エンハンスメントレイヤ及びベースレイヤの別々のエントロピーデコード及び構文解析が望まれているのならば、インターブロック毎に単に1ビットが使用されるよりもビデオブロック毎に1ビットが使用されるべきである。さもなければ、デコーダは、第1のインターレイヤ予測コーディング手法及び第2のインターレイヤ予測コーディング手法のどちらかを識別するビットをデコードするかどうかについてエンハンスメントレイヤビデオブロックのために判定をなすために、対応するベースレイヤビデオブロックのコーディングタイプの知識を必要とするだろう。
ビデオブロックのために使用された予測コーディング手法を識別するためにデコーダによって使用される任意の予測シンタクス及び任意の追加ビットと同様に、エンコードされたエンハンスメントレイヤビデオブロックは、ユニット52によってエントロピーコーディングされ得る。多重化ユニット58は、それから、出力ビットストリームを作り出すために、ベースレイヤをエンハンスメントレイヤと結合し得る。出力ビットストリームは、ベースレイヤ、エンハンスメントレイヤ、及び関連するシンタクスを含む。出力ビットストリームは保存され、及び/または、変調されて別のデバイスに送信され得る。
図4は、図1のスケーラブルビット深度ビデオデコーダ28に対応し得る例示的なスケーラブルビデオデコーダ100を説明するブロック図である。スケーラブルビデオデコーダ100は、ベースレイヤデコーダ90及びエンハンスメントレイヤデコーダ70を備える。別個に説明されているが、一部の実装において、ベースレイヤデコーダ90及びエンハンスメントレイヤデコーダ90の種々のユニットが共有または結合され得る。更に、スケーラブルビデオデコーダ100は、結合されたコーデック(エンコーダ−デコーダ)を形成するために、スケーラブルビデオエンコーダ35(図2)と一体化され得る。この場合において、スケーラブルビデオデコーダ100の種々のコンポーネントは、スケーラブルビデオエンコーダ35のそれらと重複し得る。
基本的に、スケーラブルビデオデコーダ100のデコード機能性は、スケーラブルビデオエンコーダ35に関して前述のエンコード機能性の相補的(reciprocal)な動作とみなされ得る。ベースレイヤデコーダ90はベースレイヤビデオブロックをデコードする一方、エンハンスメントレイヤデコーダ70はエンハンスメントレイヤビデオブロックをデコードする。逆多重化ユニット86は、SVCビットストリームを受信し、エンハンスメントレイヤデータからベースレイヤデータを分離する。受信ベースレイヤデータはベースレイヤデコーダ90に送られ、エンハンスメントレイヤデータはエンハンスメントレイヤデコーダ70に送られる。デコード側では、この開示の手法は、一般的には、Nビットエンハンスメントレイヤビデオブロックがベースレイヤに基づいてコーディングされたと判定するときのエンハンスメントレイヤデコーダ70によるエンハンスメントレイヤビデオブロックのデコードに関する。ビデオブロック毎に1ビットを備える、ビットストリームにおける第1のシンタクス情報は、Nビットエンハンスメントレイヤビデオブロックがベースレイヤに基づいてコーディングされたかどうかを示し得る(例えば、そのビデオブロックについてインターレイヤ予測が有効(enable)であるかどうかを示すことによって)。
説明されたように、エンハンスメントレイヤデコーダ70は、制御ユニット72によって制御される種々のデコードユニット74を備え得る。同様に、ベースレイヤデコーダ90は、制御ユニット92によって制御される種々のデコードユニット94を備え得る。スケーラブルビデオデコーダ100は、ベースレイヤデコーダ90からのMビットサンプルをエンハンスメントレイヤデコーダ70のためのNビットサンプルにアップサンプルする逆トーンマッピングユニット84も備える。逆多重化ユニット58は、受信ビットストリームをベースレイヤ及びエンハンスメントレイヤに分離し得る。別個のエントロピーコーディングユニット82及び99がエンハンスメントレイヤデコーダ70及びベースレイヤデコーダ90に夫々含まれ得るが、結合されたエントロピーデコードユニットが一部の実施形態のために代替的に使用され得る。
ベース及びエンハンスメントレイヤのための別々のエントロピーコーディングユニット82及び99の実装は、デコード処理を加速し得る。この場合には、コーディングされたビットストリームは、対応するベースレイヤビデオブロックがイントラまたはインターコーディングされているかどうかに関わらず、第1または第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別するためのビデオブロック毎の1ビットを含むことが望ましい。もし1ビットがインターベースレイヤブロックに対応するブロックのためにだけ送信されるならば、エンハンスメントレイヤデコーダ70のエントロピーコーディングユニット32は、エンハンスメントレイヤデコーダ70がベースレイヤブロックタイプを識別できるよう、ベースレイヤデコーダ90のエントロピーコーディングユニット99がベースレイヤビットストリームを構文解析するのを待つ必要があるだろう。遅延を回避するために、この場合には、常に第1のインターレイヤ予測コーディング手法に従ってコーディングされ得る、ベースレイヤイントラブロックに対応するエンハンスメントレイヤブロックについてさえも、第1または第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別するためにビデオブロック毎に1ビットを含めることが望ましいだろう。更に、この1ビットのシンタクス情報は、インターレイヤ予測が有効(enable)であったことを(既にデコードされた)第1の1ビットシンタクス情報が識別する場合に限りデコードされる。
ベースレイヤデコードのために、ベースレイヤデコーダ90は、イントラユニット96、インターユニット98及びエントロピーコーディングユニット99を含む。逆量子化ユニット及び逆変換ユニットなどの種々の他のユニットも、予測ビデオデコードにおいて一般的に使用されるが、説明の単純性及び容易性のために図4において説明されていない。イントラユニット96はイントラビデオブロックのイントラベースデコードを行う一方、インタービデオブロックのインターベースデコードを行う。エントロピーデコードユニット99は、エントロピーデコード方法論に従って、コーディングされたデータ及びシンタクス情報を伸張するために、受信ベースレイヤビットストリームを構文解析する。
ベースレイヤビデオブロックのイントラベースデコードのために、イントラユニット96は、例えば説明の単純性及び容易性のために図4に示されていない逆量子化及び逆変換の後に、残差ビデオブロックを受信し得る。イントラユニット96は、デコードされている残差ビデオブロックと同じコーディング単位(例えば、同じフレームまたはスライス)内のデータに基づいて予測データを生成し得る。予測シンタクス(予測データを生成するために使用されたイントラモードなど)は受信ビットストリームの一部を形成し得るが、この予測シンタクスが予測データを生成するために使用され得る。この予測データは残差ビデオブロックに加算され、これが復元ビデオブロックを形成する。
ベースレイヤビデオブロックのインターベースデコードのために、インターユニット98は、例えば逆量子化及び逆変換の後に、残差ビデオブロックを受信し得る。この場合には、インターユニット98は異なるコーディング単位(例えば、先行または後続のビデオシーケンスのフレームまたはスライス)内のデータに基づいて予測データを生成する。予測シンタクス(この場合には、例えば、予測データを生成するために使用された1つまたは複数の動きベクトル)は受信ビットストリームの一部を形成し得るが、この予測シンタクスが予測データを生成するために使用され得る。予測データは残差ビデオブロックに加算され、これが復元ビデオブロックを形成する。
エンハンスメントレイヤデコーダ70は、ベースレイヤデコーダ90とわずかに異なる方法で予測ベースデコードを行い得る。特に、エンハンスメントレイヤデコーダ70は、エンハンスメントレイヤビデオブロックをデコードするために、対応するベースレイヤデータ(例えば、空間的及び時間的に同様に位置するベースレイヤのコーディング単位)に依存する1つまたは複数のインターレイヤ予測手法を行い得る。
この開示の手法は、特に、一度エンハンスメントレイヤデコーダ70が所与のエンハンスメントレイヤビデオブロックが一部のタイプのインターレイヤ予測を用いてベースレイヤデータに基づいてコーディングされたことを判定するとエンハンスメントレイヤデコーダ70によって行われるエンハンスメントレイヤデコードに関して適用される。エンハンスメントレイヤデコーダ70は、この最初の判定をなすために、シンタクス情報の第1のビットを検査し得る。
エンハンスメントレイヤデコーダ70は、第1の予測ユニット76、第2の予測ユニット78、及びエントロピーコーディングユニット82を含む、種々のデコードユニット74を含む。エンコーダと同様に、これらの種々のエンハンスメントレイヤデコーダ70のデコードユニット74は統合され、及び/または、本願において記述される異なるタイプのコーディングを実行するために共有のロジックまたはルーチンを持ち得る。更に、ベースレイヤデコーダ90と同様に、エンハンスメントレイヤデコーダ70は、例えば変換係数を逆量子化するために、及び逆量子化された係数をピクセルドメインでの残差ビデオブロックに変換するために、逆量子化ユニット及び逆変換ユニット(図示されない)を更に含み得る。図3と同様に、これらのコンポーネントは、説明の単純性及び容易性のために図4に示されていないが、第1及び第2の予測コーディングユニット76及び78の一部であるとみなされ得る。更に、エンハンスメントレイヤデコーダ70がNビットドメインでのイントラ及びインター予測もサポートし得ることに注意されたい。エンハンスメントレイヤデコーダ70のこれらのイントラ及びインターユニットは、説明の単純性及び容易性のために示されていない。
第1の予測ユニット76は、イントラコーディングされたベースレイヤビデオブロックに対応するエンハンスメントレイヤビデオブロックのデコードのために使用され得る。第1の予測ユニット76は、Nビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法を適用する。対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンは、逆トーンマッピングユニット84によって第1の予測ユニット76に供給され得る。
第2の予測ユニット78は第2のタイプの予測コーディング手法を適用し、これはNビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として復元ビデオブロックを生成することを含む。この場合には、対応するベースレイヤビデオブロックのアップサンプルされたバージョンを使用するよりもむしろ、第2の予測ユニット78はエンハンスメントレイヤデータに関して動き補償を行うために対応するベースレイヤビデオブロックの動き情報(例えば、図4に示される「ベースレイヤの動き情報」)などの予測シンタクスを単純に使用し、これはエンハンスメントレイヤデコーダ70に関連するメモリ(図示されない)に保存された復元エンハンスメントレイヤビデオフレームまたはスライスであり得る。
この開示によれば、制御ユニット72は、Nビットエンハンスメントレイヤビデオブロックがベースレイヤにおけるイントラブロックまたはインターブロックに対応するかどうかを判定する。Nビット残差エンハンスメントレイヤビデオブロックがベースレイヤにおけるイントラブロックに対応するならば、制御ユニット72の指示で、第1の予測ユニット76は第1のインターレイヤ予測コーディング手法に従ってNビットエンハンスメントレイヤビデオブロックをデコードし、ここで第1のインターレイヤ予測コーディング手法はNビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む。
Nビット残差エンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、制御ユニット72は第1のインターレイヤ予測コーディング手法(これは第1の予測ユニット76によって適用され得る)と第2のインターレイヤ予測コーディング手法(これは第2の予測ユニット78によって適用され得る)との間でどちらかを選択する。前述のように、第2のインターレイヤ予測コーディング手法は、Nビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として復元ビデオブロックを生成することを含む。
制御ユニット72は、デコーダがエンコードされたデータをどのようにデコードするかを判定するのに役立ち得る情報もデコードする。特に、制御ユニット72は、第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法がNビットエンハンスメントレイヤビデオブロックをエンコードするために使用されたかどうかを判定するために、エンコードされたビットストリーム内の情報をデコードする。一例において、エンハンスメントレイヤデコーダ70によって使用されるこの情報は、第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法が使用されたかどうかを示すために、インターレイヤコーディングされたビデオブロック毎に1ビットの「第2の」シンタクス情報を備える。「第1の」シンタクス情報は、対照的に、エンハンスメントレイヤビデオブロックの予測がベースレイヤの情報を使用したかどうかを指定する。そのようなものとして、「第2の」シンタクス情報は、エンハンスメントレイヤビデオブロックの予測がベースレイヤの情報を使用したことを第1のシンタクス情報が識別するときに限って受信される。
或いは、イントラベースレイヤブロックに対応するエンハンスメントレイヤブロックは常に第1のインターレイヤ予測コーディング手法を用いてコーディングされ得るし、エンハンスメントレイヤデコーダ70はイントラベースレイヤブロックに対応するエンハンスメントレイヤブロックは第1のインターレイヤ予測コーディング手法を用いてデコードされるべきであることを知るようにプログラムされ得るので、エンハンスメントレイヤデコーダ70によって使用される情報はインターベースレイヤブロックに対応するビデオブロック毎に1ビットの「第2の」シンタクス情報を備え得る。この場合には、1ビットの情報と、Nビットエンハンスメントレイヤビデオブロックがベースレイヤにおけるイントラブロックまたはインターブロックに対応するかどうかの判定との組み合わせが、第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する。
「第2の」シンタクス情報についてインターレイヤコーディングされたビデオブロック毎に1ビットを含めるか、または代替的に、特にインターベースレイヤブロックに対応するビデオブロック毎にのみ1ビットを含めるかどうかの実装決定は、スケーラブルビット深度エンコーダ100がエンハンスメントレイヤ及びベースレイヤの別々のエントロピーデコード及び構文解析をサポートするかどうかに依存し得る。もし、図4に説明されるように、例えばデコードを加速するために、エンハンスメントレイヤ及びベースレイヤの別々のエントロピーデコード及び構文解析が実装されているならば、インターベースレイヤビデオブロックに対応するビデオブロック毎に単純に1ビットが使用されるよりもむしろビデオブロック毎に1ビットが使用されるべきである。さもなければ、エンハンスメントレイヤデコーダ70は、第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法のどちらかを識別するビットをデコードするかどうかについてエンハンスメントレイヤビデオブロックのために判定をなすために、デコードされたベースレイヤビデオブロックのコーディングタイプの知識を必要とするだろう。
図5は、この開示に調和した例示的なエンコード手法を説明するフロー図である。図5は、図3のスケーラブルビデオエンコーダ35の観点から記述されることになる。図5に示されるように、スケーラブルビデオエンコーダ35はベースレイヤ及びエンハンスメントレイヤ及びエンハンスメントレイヤビデオブロックを生成し、スケーラブルビデオエンコーダ35はエンハンスメントレイヤビデオブロックがベースレイヤデータに基づいてコーディングされるべきであると判定する(501)。例えば、スケーラブルビデオエンコーダ35はNビットサンプルを受信し、エンハンスメントレイヤを定めるためにエンハンスメントレイヤエンコーダ40にNビットサンプルを供給し、ベースレイヤを定めるためにNビットサンプルをMビットサンプルにダウンサンプルし得る。ベースレイヤ及びエンハンスメントレイヤは、夫々ベースレイヤエンコーダ60及びエンハンスメントレイヤエンコーダ40によって別々にコーディングされ得る。エンハンスメントレイヤエンコーダ40がエンハンスメントレイヤビデオブロックはベースレイヤデータに基づいてコーディングされるべきであると判定すると、図5の手法が適用され得る。
この場合に、エンハンスメントレイヤエンコードに関して、制御ユニット42は、Nビットエンハンスメントレイヤビデオブロックがベースレイヤにおけるイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定する(502)。エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば(「イントラ」 502)、第1の予測ユニット46は第1のインターレイヤ予測手法に従ってNビットエンハンスメントレイヤビデオブロックをエンコードする(503)。第1のインターレイヤ予測コーディング手法は、Nビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分として残差ビデオブロックを生成することを含む。他方では、エンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば(「インター」 502)、制御ユニット42は第1のインターレイヤ予測コーディング手法と第2のインターレイヤ予測コーディング手法との間でどちらかを選択する(504)。1つまたは複数のユニット44は、選択された予測コーディング手法に従ってNビットエンハンスメントレイヤビデオブロックをエンコードする(505)。特に、選択次第で、第1の予測ユニット46が第1のインターレイヤ予測コーディング手法を行い、または、第2の予測ユニット48が第2のインターレイヤ予測コーディング手法を行い得る。
制御ユニット42は、レート−歪アルゴリズムを適用することにより、第1及び第2のインターレイヤ予測コーディング手法のどちらかの選択を行い得る(504)。特に、制御ユニット42は、第1のインターレイヤ予測コーディング手法に従ってコーディングされたビデオブロックと、第2のインターレイヤ予測コーディング手法に従ってコーディングされたビデオブロックとの間のビデオ品質差を考慮し得る。また、制御ユニット42は、ビデオブロックが第1のインターレイヤ予測コーディング手法を用いて、または、第2のインターレイヤ予測コーディング手法を用いてコーディングされた場合に達成される圧縮レベルを考慮し得る。一部の場合において、エンハンスメントレイヤエンコーダ40は両方のインターレイヤ予測コーディング手法を用いてビデオブロックを実際にエンコードし、それから品質及び圧縮レベルに基づいて選択をなし得る(504)。シナリオ次第で、できる限りの最高の品質(即ち、最小の歪)を達成することがより望まれ得るし、または、例えばデータ通信の最高のレートを容易にするために最高の圧縮を達成することがより望まれ得る。一部の場合において、これらの要素は、選択をなすために、レート−歪アルゴリズムに従ってバランスを保たれる。
制御ユニット42は、Nビットエンハンスメントレイヤビデオブロックのために使用された予測コーディング手法をデコーダに通知するためのシンタクス情報も生成する(506)。上に大いに詳しく述べられているように、このシンタクス情報は、ベースレイヤデータがエンハンスメントレイヤビデオブロックをエンコードするために使用された(インターレイヤ予測が使用された)ことを示す第1のシンタクス情報と、使用されたインターレイヤ予測手法のタイプをデコーダに通知するために使用される第2のシンタクス情報とを含み得る。第1のシンタクス情報は、ビデオブロック毎に1ビットを備え得る。第2のシンタクス情報は、インターレイヤコーディングされたビデオブロック毎に1ビット、または特にインターベースレイヤブロックに対応する、インターレイヤコーディングされたビデオブロック毎に1ビットを備え得る。前述のように、インターベースレイヤブロックに対応するビデオブロック毎の1ビットはより高い圧縮レベルという利点を持つ一方、インターレイヤコーディングされた全てのブロック毎の1ビットはデコーダにおけるベース及びエンハンスメントレイヤの別々のエントロピーコーディング及び構文解析を容易にするという利点を持ち、これはデコード処理を加速する。どの場合でも、エントロピーコーディングユニット52は、コーディングされたビットストリームを生成するために、データ(コーディングされたビデオブロック及びシンタクス情報を含む)をエントロピーエンコードし得る(507)。スケーラブルビデオエンコーダ35は、それから、図1の変調器/送信器24を介するなど、信号変調及び別のデバイスへのコーディングされたビットストリームの送信のための1つまたは複数の変調器及び送信器に、コーディングされたビットストリームを転送し得る(508)。
図6は、この開示に調和した例示的なデコード手法を説明するフロー図である。図6は、図3のスケーラブルビデオエンコーダ100の観点から記述されることになる。図6に示されるように、スケーラブルビデオデコーダ100はベースレイヤ及びエンハンスメントレイヤビデオデータ及びシンタクス情報を備えるビットストリームを受信する(601)。逆多重化ユニット86はベースレイヤ及びエンハンスメントレイヤデータを分離し(602)、エンハンスメントレイヤデコーダ70及びベースレイヤデコーダ90に夫々データを転送する。シンタクス情報は、エンハンスメントレイヤビデオブロックをエンコードするためにベースレイヤデータが使用されたかどうか(即ち、インターレイヤ予測が使用されているかどうか)を示す第1のシンタクス情報と、使用されたインターレイヤ予測手法のタイプをデコーダに通知するために使用される第2のシンタクス情報とを含み得る。ベースレイヤデータがエンハンスメントレイヤビデオブロックをエンコードするために使用されたことを第1のシンタクス情報が示さないならば、この開示の手法は適用されなくてよい。一方、この開示の手法は、特に、ベースレイヤデータがインターレイヤ予測を用いてエンハンスメントレイヤビデオブロックをエンコードするために使用されたことを第1のシンタクス情報が示すときに適用される。
エンハンスメントレイヤデコーダ70において、制御ユニット72は、Nビットエンハンスメントレイヤビデオブロックがベースレイヤにおけるイントラブロックまたはインターブロックに対応するかどうかを判定する(603)。エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば(「イントラ」 503)、第1の予測ユニット76は、第1のインターレイヤ予測手法に従ってNビットエンハンスメントレイヤビデオブロックをデコードする(604)。特に、デコードに関して、第1のインターレイヤ予測コーディング手法は、Nビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む。
他方では、エンハンスメントレイヤビデオブロックがインターベースレイヤビデオブロックに対応するならば(「インター」 603)、制御ユニット72は、第1のインターレイヤ予測コーディング手法及び第2のインターレイヤ予測コーディング手法のどちらかを選択し(605)、選択された予測手法に従ってNビットエンハンスメントレイヤビデオブロックをデコードする。特に、選択次第で、第1の予測ユニット76が第1のインター予測コーディング手法を行い、または、第2の予測ユニット78が第2のインター予測コーディング手法を行い得る。また、第1のインターレイヤ予測コーディング手法は、Nビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む。対照的に、第2のインターレイヤ予測コーディング手法は、デコードに関して、Nビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として復元ビデオブロックを生成することを含む。選択(「605」)はビットストリームにおける「第2の」シンタクス情報に少なくとも一部において基づき得るが、これは、上に概説されているように、第1のインターレイヤ予測コーディング手法または第2のインターレイヤ予測コーディング手法がNビット残差エンハンスメントレイヤビデオブロックをデコードするために使用されるべきであるかどうかを判定するためにエンコーダにおいて定められ得る。
本願において記述された手法は、ハードウェア、ソフトウェア、ファームウェアまたはそれらの任意の組み合わせにおいて実装され得る。モジュールまたはコンポーネントとして記述された任意の特徴(feature)は、集積ロジックデバイスにおいて一緒に、または、ディスクリートであるが相互運用可能なロジックデバイスとして別々に、実装され得る。ソフトウェアで実装されるならば、手法は、実行時に1つまたは複数の前述の方法を実行する命令を備えるコンピュータ可読媒体によって少なくとも一部において実現され得る。コンピュータ可読なデータストレージ媒体は、パッケージング材料を含み得るコンピュータプログラム製品の一部を形成し得る。コンピュータ可読媒体は、SDRAM(synchronous dynamic random access memory)などのRAM(random access memory)、ROM(read-only memory)、NVRAM(non-volatile random access memory)、EEPROM(electrically erasable programmable read-only memory)、FLASHメモリ、磁気または光学データストレージ媒体、及び同種のものを備え得る。手法は、追加的に、または代替的に、コンピュータによってアクセス、読み込み、及び/または実行可能な命令またはデータ構造の形式のコードを搬送または伝達するコンピュータ可読通信媒体によって少なくとも一部において実現され得る
コードは、1つまたは複数のDSP(digital signal processor)、ASIC(application specific integrated circuit)、FPGA(field programmable logic array)、または他の同等の集積またはディスクリートロジック回路などの1つまたは複数のプロセッサによって実行され得る。従って、「プロセッサ」という用語は、本願において使用されるように、任意の前述の構造または本願において記述された手法の実装に適した任意の他の構造を参照し得る。また、一部の態様において、本願において記述された機能性は、エンコード及びデコードのために構成された専用のソフトウェアモジュールまたはハードウェアモジュール内で提供され得るし、結合されたビデオエンコーダ−デコーダ(CODEC)に組み込まれ得る。
ハードウェアで実装されるならば、この開示は、集積回路などの回路、チップセットASIC(application specific integrated circuit)、FPGA(field programmable gate array)、ロジック、または本願に記載された1つまたは複数の手法を行うように構成されたそれらの種々の組み合わせに向けられ得る。
本発明の種々の実施形態が記載されてきた。これらの及び他の実施形態は、次のクレームの範囲内である。
以下に、本願の出願当初の特許請求の範囲に記載された発明が付記される。
[1]ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを生成することと、前記ベースレイヤ及び前記エンハンスメントレイヤをエンコードすることとを具備し、前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、前記エンハンスメントレイヤをエンコードすることは、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであるかどうかを判定することを含み、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであると判定するときに、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定することと、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分として残差ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法に従って前記Nビットエンハンスメントレイヤビデオブロックをコーディングすることと、前記Nビットエンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分として前記残差ビデオブロックを生成することを含む第2のインターレイヤ予測コーディング手法とのどちらかを選択することとを含む、ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをエンコードする方法。
[2]前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたことを判定するためにデコーダによって使用される第1の情報をエンコードすることと、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをエンコードするために使用されたかどうかを判定するためにデコーダによって使用される第2の情報をエンコードすることとを更に具備する、[1]の方法。
[3]前記デコーダによって使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記デコーダによって使用される前記第2の情報は、インターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備える、[2]の方法。
[4]前記デコーダによって使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記デコーダによって使用される前記第2の情報は、インターレイヤ予測が使用され、かつ、対応するベースレイヤビデオブロックがインターコーディングされるビデオブロック毎に1ビットの情報を備え、前記第2の情報と、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかの判定との組み合わせが、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する、[2]の方法。
[5]ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを受信することと、前記ベースレイヤ及び前記エンハンスメントレイヤをデコードすることとを具備し、前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、前記エンハンスメントレイヤをデコードすることは、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定することを含み、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたと判定するときに、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定することと、Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法に従って前記Nビット残差エンハンスメントレイヤビデオブロックをデコードすることと、前記Nビット残差エンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として前記復元ビデオブロックを生成することを含む第2のインターレイヤ予測コーディング手法のどちらかを選択することとを含む、ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをデコードする方法。
[6]前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するために使用される第1の情報を受信することと、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをデコードするために使用されるべきであるかどうかを判定するために使用される第2の情報を受信することとを更に具備する、[5]の方法。
[7]前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するために使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されるべきであるかどうかを判定するために使用される前記第2の情報は、インターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備える、[6]の方法。
[8]前記ベースレイヤ及び前記エンハンスメントレイヤを別々にエントロピーデコードすることを更に具備する、[7]の方法。
[9]前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するために使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されるべきであるかどうかを判定するために使用される前記第2の情報は、インターレイヤ予測が使用され、かつ、対応するベースレイヤビデオブロックがインターコーディングされるビデオブロック毎に1ビットの情報を備え、前記第2の情報と、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかの判定との組み合わせが、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する、[6]の方法。
[10]ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを生成し、前記ベースレイヤ及び前記エンハンスメントレイヤをエンコードするビット深度ベーススケーラブルビデオエンコーダを具備し、前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、前記エンハンスメントレイヤに関して、前記ビデオエンコーダは、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであるかどうかを判定し、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであると判定するときに、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定し、前記Nビットエンハンスメントレイヤビデオブロックがイントラブロックに対応するならば、前記Nビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分としての残差ビデオブロックの生成を含む第1のインターレイヤ予測コーディング手法に従って前記Nビットエンハンスメントレイヤビデオブロックをエンコードし、前記Nビットエンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分としての前記残差ビデオブロックの生成を含む第2のインターレイヤ予測コーディング手法とのどちらかを選択する、ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをエンコードする装置。
[11]前記ビット深度ベーススケーラブルビデオエンコーダは、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたことを判定するためにデコーダによって使用される第1の情報をエンコードし、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをエンコードするために使用されたかどうかを判定するためにデコーダによって使用される第2の情報をエンコードする、[10]の装置。
[12]前記デコーダによって使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記デコーダによって使用される前記第2の情報は、インターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備える、[11]の装置。
[13]前記デコーダによって使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記デコーダによって使用される前記第2の情報は、インターレイヤ予測が使用され、かつ、対応するベースレイヤビデオブロックがインターコーディングされるビデオブロック毎に1ビットの情報を備え、前記第2の情報と、前記エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかの判定との組み合わせが、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する、[11]の装置。
[14]集積回路及びマイクロプロセッサのうち一方を具備する、[10]の装置。
[15]ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを受信し、前記ベースレイヤ及び前記エンハンスメントレイヤをデコードするビット深度ベーススケーラブルビデオデコーダを具備し、前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、前記エンハンスメントレイヤに関して、前記ビデオデコーダは、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定し、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたと判定するときに、Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定し、前記Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法に従って前記Nビット残差エンハンスメントレイヤビデオブロックをデコードし、前記Nビット残差エンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として前記復元ビデオブロックを生成することを含む第2のインターレイヤ予測コーディング手法とのどちらかを選択する、ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをデコードする装置。
[16]前記デコーダは、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するために使用される第1の情報を受信し、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをデコードするために使用されるべきであるかどうかを判定するために使用される第2の情報を受信する、[15]の装置。
[17]前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するために使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されるべきであるかどうかを判定するために使用される前記第2の情報は、インター予測が使用されるビデオブロック毎に1ビットの情報を備える、[16]の装置。
[18]前記デコーダは、前記ベースレイヤ及び前記エンハンスメントレイヤを別々にエントロピーデコードする2つの別個のエントロピーデコードユニットを備える、[17]の装置。
[19]前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するために使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されるべきであるかどうかを判定するために使用される前記第2の情報は、インターレイヤ予測が使用され、かつ、対応するベースレイヤビデオブロックがインターコーディングされるビデオブロック毎に1ビットの情報を備え、前記第2の情報と、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかの判定との組み合わせが、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する、[16]の装置。
[20]集積回路及びマイクロプロセッサのうちの一方を備える、[15]の装置。
[21]実行時にビデオコーディングデバイスに、ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをエンコードさせる命令を具備し、前記命令は、前記デバイスに、前記ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを生成させ、前記ベースレイヤ及び前記エンハンスメントレイヤをエンコードさせ、前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、前記エンハンスメントレイヤに関して、前記命令は、前記デバイスに、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであるかどうかを判定させ、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであると判定するときに、Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定させ、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分としての残差ビデオブロックの生成を含む第1のインターレイヤ予測コーディング手法に従って前記Nビットエンハンスメントレイヤビデオブロックをエンコードさせ、前記Nビットエンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分としての前記残差ビデオブロックの生成を含む第2のインターレイヤ予測コーディング手法とのどちらかを選択させる、コンピュータ可読媒体。
[22]前記命令は、前記デバイスに更に、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたことを判定するためにデコーダによって使用される第1の情報をエンコードさせ、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをエンコードするために使用されたかどうかを判定するためにデコーダによって使用される第2の情報をエンコードさせる、[21]のコンピュータ可読媒体。
[23]前記デコーダによって使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記デコーダによって使用される前記第2の情報は、インターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備える、[22]のコンピュータ可読媒体。
[24]前記デコーダによって使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記デコーダによって使用される前記第2の情報は、インターレイヤ予測が使用され、かつ、対応するベースレイヤビデオブロックがインターコーディングされるビデオブロック毎に1ビットの情報を備え、前記第2の情報と、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかの判定との組み合わせが、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する、[22]のコンピュータ可読媒体。
[25]実行時にビデオコーディングデバイスに、ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをデコードさせる命令を具備し、前記命令は、前記デバイスに、前記ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを受信するときに、前記ベースレイヤ及び前記エンハンスメントレイヤをデコードさせ、前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、前記エンハンスメントレイヤに関して、前記命令は、前記デバイスに、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定させ、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたと判定するときに、Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定させ、Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法に従って前記Nビット残差エンハンスメントレイヤビデオブロックをデコードさせ、前記Nビット残差エンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として前記復元ビデオブロックを生成することを含む第2のインターレイヤ予測コーディング手法とのどちらかを選択させる、コンピュータ可読媒体。
[26]前記命令は、前記デバイスに更に、エンコーダによって定められる受信情報に少なくとも一部において基づいて、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをエンコードするために使用されたかどうかを判定させる、[25]のコンピュータ可読媒体。
[27]エンコーダによって定められる前記受信情報は、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するために使用され、ビデオブロック毎に1ビットの情報を備える第1の情報と、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されるべきであるかどうかを判定するために使用され、インターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備える第2の情報とを備える、[26]のコンピュータ可読媒体。
[28]前記命令は、前記デバイスに、前記ベースレイヤ及び前記エンハンスメントレイヤを別々にデコードさせる、[27]のコンピュータ可読媒体。
[29]エンコーダによって定められる前記受信情報は、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するために使用され、ビデオブロック毎に1ビットの情報を備える第1の情報と、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されるべきであるかどうかを判定するために使用される、インターレイヤ予測が使用され、かつ、対応するベースレイヤビデオブロックがインターコーディングされるビデオブロック毎に1ビットの情報を備える第2の情報とを備え、前記第2の情報と、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかの判定との組み合わせが、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する、[26]のコンピュータ可読媒体。
[30]ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを生成するための手段と、前記ベースレイヤをエンコードするための手段と、前記エンハンスメントレイヤをエンコードするための手段とを具備し、前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、前記エンハンスメントレイヤをエンコードするための手段は、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであるかどうかを判定するための手段を含み、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであると判定するときに、Nビットエンハンスメントレイヤがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定するための手段と、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分として残差ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法に従って前記Nビットエンハンスメントレイヤビデオブロックをエンコードするための手段と、前記Nビットエンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分として前記残差ビデオブロックを生成することを含む第2のインターレイヤ予測コーディング手法とのどちらかを選択するための手段とを含む、ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをエンコードするデバイス。
[31]前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたと判定するためにデコーダによって使用される第1の情報をエンコードするための手段と、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをエンコードするために使用されたかどうかを判定するためにデコーダによって使用される第2の情報をエンコードするための手段とを更に具備する、[30]のデバイス。
[32]前記デコーダによって使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記デコーダによって使用される前記第2の情報は、インターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備える、[31]のデバイス。
[33]前記デコーダによって使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記デコーダによって使用される前記第2の情報は、インターレイヤ予測が使用され、かつ、対応するベースレイヤビデオブロックがインターコーディングされるビデオブロック毎に1ビットの情報を備え、前記第2の情報と、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかの判定との組み合わせが、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する、[31]のデバイス。
[34]ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを受信するための手段と、前記ベースレイヤをデコードするための手段と、前記エンハンスメントレイヤをデコードするための手段とを具備し、前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、前記エンハンスメントレイヤをデコードするための手段は、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するための手段を含み、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたと判定するときに、Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定するための手段と、前記Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビット残差エンハンスメントレイヤと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法に従って前記Nビット残差エンハンスメントレイヤビデオブロックをデコードするための手段と、前記Nビット残差エンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として前記復元ビデオブロックを生成することを含む第2のインターレイヤ予測コーディング手法とのどちらかを選択するための手段とを含む、ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをデコードするデバイス。
[35]前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するために使用される第1の情報を受信するための手段と、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをデコードするために使用されるべきであるかどうかを判定するために使用される第2の情報を受信するための手段とを更に具備する、[34]のデバイス。
[36]前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するために使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されるべきであるかどうかを判定するために使用される前記第2の情報は、インターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備える、[35]のデバイス。
[37]前記ベースレイヤ及び前記エンハンスメントレイヤを別々にエントロピーデコードするための手段を更に具備する、[36]のデバイス。
[38]前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するために使用される前記第1の情報は、ビデオブロック毎に1ビットの情報を備え、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されるべきであるかどうかを判定するために使用される前記第2の情報は、インターレイヤ予測が使用され、かつ、対応するベースレイヤブロックがインターコーディングされるビデオブロック毎に1ビットの情報を備え、前記第2の情報と、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかの判定との組み合わせが、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されたかどうかを識別する、[36]のデバイス。
[39]ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを生成し、前記ベースレイヤ及び前記エンハンスメントレイヤをエンコードするビット深度ベーススケーラブルビデオエンコーダと、前記ベースレイヤ及び前記エンハンスメントレイヤを別のデバイスに送信する無線送信器とを具備し、前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、前記エンハンスメントレイヤに関して、前記ビデオエンコーダは、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきかであるかどうかを判定し、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであると判定するときに、Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定し、前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分としての残差ビデオブロックの生成を含む第1のインターレイヤ予測コーディング手法に従って前記Nビットエンハンスメントレイヤビデオブロックをエンコードし、前記Nビットエンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分としての前記残差ビデオブロックの生成を含む第2のインターレイヤ予測コーディング手法とのどちらかを選択する、ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをエンコードするデバイス。
[40]無線通信ハンドセットを備える、[39]のデバイス。
[41]ビデオデータを受信する無線受信器と、前記ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを受信し、前記ベースレイヤ及び前記エンハンスメントレイヤをデコードするビット深度ベーススケーラブルビデオデコーダとを具備し、前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、前記エンハンスメントレイヤに関して、前記ビデオデコーダは、Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定し、前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたと判定するときに、Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定し、前記Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法に従って前記Nビット残差エンハンスメントレイヤビデオブロックをデコードし、前記Nビット残差エンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として前記復元ビデオブロックを生成することを含む第2のインターレイヤ予測コーディング手法とのどちらかを選択する、ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをデコードするデバイス。
[42]無線通信ハンドセットを備える、[39]のデバイス。

Claims (8)

  1. ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを生成することと、
    前記ベースレイヤ及び前記エンハンスメントレイヤをエンコードすることと
    を具備し、
    前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、
    前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、
    前記エンハンスメントレイヤをエンコードすることは、
    Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであるかどうかを判定することを含み、
    前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであると判定するときに、
    前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定することと、
    前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分として残差ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法に従って前記Nビットエンハンスメントレイヤビデオブロックをコーディングすることと、
    前記Nビットエンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分として前記残差ビデオブロックを生成することを含む第2のインターレイヤ予測コーディング手法とのどちらかを選択することとを含
    前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをエンコードするために使用されたかどうかを判定するためにデコーダによって使用される情報をエンコードすることをさらに具備し、
    前記デコーダによって使用される前記情報は、インターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備える、
    ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをエンコードする方法。
  2. ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを受信することと、
    前記ベースレイヤ及び前記エンハンスメントレイヤをデコードすることと
    を具備し、
    前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、
    前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、
    前記エンハンスメントレイヤをデコードすることは、
    Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定することを含み、
    前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたと判定するときに、
    前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定することと、
    Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法に従って前記Nビット残差エンハンスメントレイヤビデオブロックをデコードすることと、
    前記Nビット残差エンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として前記復元ビデオブロックを生成することを含む第2のインターレイヤ予測コーディング手法のどちらかを選択することとを含
    前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをデコードするために使用されるべきであるかどうかを判定するために使用される情報を受信することをさらに具備し、
    前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されるべきであるかどうかを判定するために使用される前記情報は、インターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備える、
    ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをデコードする方法。
  3. ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを生成するビット深度ベーススケーラブルビデオエンコーダを具備し、
    前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、
    前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、
    前記ビット深度ベーススケーラブルビデオエンコーダは、前記ベースレイヤ及び前記エンハンスメントレイヤをエンコードし、
    前記エンハンスメントレイヤに関して、前記ビデオエンコーダは、
    Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであるかどうかを判定し、
    前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであると判定するときに、
    前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定し、
    前記Nビットエンハンスメントレイヤビデオブロックがイントラブロックに対応するならば、前記Nビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分としての残差ビデオブロックの生成を含む第1のインターレイヤ予測コーディング手法に従って前記Nビットエンハンスメントレイヤビデオブロックをエンコードし、
    前記Nビットエンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分としての前記残差ビデオブロックの生成を含む第2のインターレイヤ予測コーディング手法とのどちらかを選択
    前記ビット深度ベーススケーラブルビデオエンコーダは、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをエンコードするために使用されたかどうかを判定するためにデコーダによって使用される情報をエンコードし、
    前記デコーダによって使用される前記情報は、インターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備える、
    ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをエンコードする装置。
  4. ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを受信するビット深度ベーススケーラブルビデオデコーダを具備し、
    前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、
    前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、
    前記ビット深度ベーススケーラブルビデオデコーダは、前記ベースレイヤ及び前記エンハンスメントレイヤをデコードし、
    前記エンハンスメントレイヤに関して、前記ビデオデコーダは、
    Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定し、
    前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたと判定するときに、
    Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定し、
    前記Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法に従って前記Nビット残差エンハンスメントレイヤビデオブロックをデコードし、
    前記Nビット残差エンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として前記復元ビデオブロックを生成することを含む第2のインターレイヤ予測コーディング手法とのどちらかを選択
    前記ビット深度ベーススケーラブルビデオデコーダは、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをデコードするために使用されるべきであるかどうかを判定するために使用される情報を受信し、
    前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されるべきであるかどうかを判定するために使用される前記情報は、インターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備える、
    ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをデコードする装置。
  5. 実行時にビデオコーディングデバイスに、ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをエンコードさせる命令を具備し、
    前記命令は、前記デバイスに、前記ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを生成させ、前記ベースレイヤ及び前記エンハンスメントレイヤをエンコードさせ、
    前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、
    前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、
    前記エンハンスメントレイヤに関して、前記命令は、前記デバイスに、
    Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであるかどうかを判定させ、
    前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであると判定するときに、
    Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定させ、
    前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分としての残差ビデオブロックの生成を含む第1のインターレイヤ予測コーディング手法に従って前記Nビットエンハンスメントレイヤビデオブロックをエンコードさせ、
    前記Nビットエンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分としての前記残差ビデオブロックの生成を含む第2のインターレイヤ予測コーディング手法とのどちらかを選択させ、
    前記命令は、前記デバイスに、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをエンコードするために使用されたかどうかを判定するためにデコーダによって使用される情報をエンコードさせ、
    前記デコーダによって使用される前記情報は、インターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備える、
    コンピュータ可読記録媒体。
  6. 実行時にビデオコーディングデバイスに、ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをデコードさせる命令を具備し、
    前記命令は、前記デバイスに、
    前記ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを受信するときに、前記ベースレイヤ及び前記エンハンスメントレイヤをデコードさせ、
    前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、
    前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、
    前記エンハンスメントレイヤに関して、前記命令は、前記デバイスに、
    Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定させ、
    前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたと判定するときに、
    Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定させ、
    Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法に従って前記Nビット残差エンハンスメントレイヤビデオブロックをデコードさせ、
    前記Nビット残差エンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として前記復元ビデオブロックを生成することを含む第2のインターレイヤ予測コーディング手法とのどちらかを選択させ、
    前記命令は、前記デバイスに、エンコーダによって定められる受信情報に少なくとも一部において基づいて、前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをエンコードするために使用されたかどうかを判定させ、
    前記受信情報は、インターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備える情報を備える、
    コンピュータ可読記録媒体。
  7. ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを生成するための手段と、
    前記ベースレイヤをエンコードするための手段と、
    前記エンハンスメントレイヤをエンコードするための手段と
    を具備し、
    前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、
    前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、
    前記エンハンスメントレイヤをエンコードするための手段は、
    Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであるかどうかを判定するための手段を含み、
    前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされるべきであると判定するときに、
    Nビットエンハンスメントレイヤがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定するための手段と、
    前記Nビットエンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビットエンハンスメントレイヤビデオブロックと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの間の差分として残差ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法に従って前記Nビットエンハンスメントレイヤビデオブロックをエンコードするための手段と、
    前記Nビットエンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビットエンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの間の差分として前記残差ビデオブロックを生成することを含む第2のインターレイヤ予測コーディング手法とのどちらかを選択するための手段と
    を含
    前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをエンコードするために使用されたかどうかを判定するためにデコーダによって使用される情報をエンコードするための手段をさらに具備し、
    前記デコーダによって使用される前記情報は、インターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備える、
    ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをエンコードするデバイス。
  8. ビデオデータに関連するベースレイヤ及びエンハンスメントレイヤを受信するための手段と、
    前記ベースレイヤをデコードするための手段と、
    前記エンハンスメントレイヤをデコードするための手段と
    を具備し、
    前記ベースレイヤは、Mビットのビット深度を持つ前記ビデオデータを定め、
    前記エンハンスメントレイヤは、Mより大きいNビットまでの前記ビット深度のエンハンスメントを定め、
    前記エンハンスメントレイヤをデコードするための手段は、
    Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたかどうかを判定するための手段を含み、
    前記Nビットエンハンスメントレイヤビデオブロックがインターレイヤ予測を用いて前記ベースレイヤに基づいてコーディングされたと判定するときに、
    Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックまたはインターベースレイヤブロックに対応するかどうかを判定するための手段と、
    前記Nビット残差エンハンスメントレイヤビデオブロックがイントラベースレイヤブロックに対応するならば、前記Nビット残差エンハンスメントレイヤと、対応する復元MビットベースレイヤビデオブロックのアップサンプルされたNビットバージョンとの和として復元ビデオブロックを生成することを含む第1のインターレイヤ予測コーディング手法に従って前記Nビット残差エンハンスメントレイヤビデオブロックをデコードするための手段と、
    前記Nビット残差エンハンスメントレイヤビデオブロックがインターベースレイヤブロックに対応するならば、前記第1のインターレイヤ予測コーディング手法と、前記Nビット残差エンハンスメントレイヤビデオブロックと、対応するMビットベースレイヤビデオブロックに関連する動きベクトルによって識別されるNビット予測ブロックとの和として前記復元ビデオブロックを生成することを含む第2のインターレイヤ予測コーディング手法とのどちらかを選択するための手段と
    を含
    前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が前記Nビットエンハンスメントレイヤビデオブロックをデコードするために使用されるべきであるかどうかを判定するために使用される情報を受信するための手段をさらに具備し、
    前記第1のインターレイヤ予測コーディング手法または前記第2のインターレイヤ予測コーディング手法が使用されるべきであるかどうかを判定するために使用される前記情報は、インターレイヤ予測が使用されるビデオブロック毎に1ビットの情報を備える、
    ビット深度ベーススケーラブルビデオコーディング(SVC)方式に従ってビデオデータをデコードするデバイス。
JP2014187844A 2007-10-15 2014-09-16 スケーラブルビット深度のためのスケーラブルビデオコーディング手法 Expired - Fee Related JP5795416B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US97992107P 2007-10-15 2007-10-15
US60/979,921 2007-10-15
US12/251,174 2008-10-14
US12/251,174 US8432968B2 (en) 2007-10-15 2008-10-14 Scalable video coding techniques for scalable bitdepths

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2010530086A Division JP5661465B2 (ja) 2007-10-15 2008-10-15 スケーラブルビット深度のためのスケーラブルビデオコーディング手法

Publications (2)

Publication Number Publication Date
JP2015039182A JP2015039182A (ja) 2015-02-26
JP5795416B2 true JP5795416B2 (ja) 2015-10-14

Family

ID=40534155

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2010530086A Expired - Fee Related JP5661465B2 (ja) 2007-10-15 2008-10-15 スケーラブルビット深度のためのスケーラブルビデオコーディング手法
JP2014187844A Expired - Fee Related JP5795416B2 (ja) 2007-10-15 2014-09-16 スケーラブルビット深度のためのスケーラブルビデオコーディング手法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2010530086A Expired - Fee Related JP5661465B2 (ja) 2007-10-15 2008-10-15 スケーラブルビット深度のためのスケーラブルビデオコーディング手法

Country Status (7)

Country Link
US (1) US8432968B2 (ja)
EP (1) EP2213100A1 (ja)
JP (2) JP5661465B2 (ja)
KR (2) KR20120060921A (ja)
CN (1) CN101828399B (ja)
TW (1) TW200934252A (ja)
WO (1) WO2009052205A1 (ja)

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8774269B2 (en) 2006-10-25 2014-07-08 Franuhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Quality scalable coding with mapping different ranges of bit depths
US8175158B2 (en) * 2008-01-04 2012-05-08 Sharp Laboratories Of America, Inc. Methods and systems for inter-layer image prediction parameter determination
US8184693B2 (en) 2008-04-11 2012-05-22 Intel Corporation Adaptive filtering for bit-depth scalable video codec
DK2835976T3 (en) 2008-04-16 2016-12-05 Ge Video Compression Llc Bit depth scalability
JP5564853B2 (ja) * 2009-08-14 2014-08-06 ソニー株式会社 受信装置および方法、プログラム、並びに受信システム
DE102009039095A1 (de) * 2009-08-27 2011-03-10 Siemens Aktiengesellschaft Verfahren und Vorrichtung zum Erzeugen, Decodieren und Transcodieren eines codierten Videodatenstroms
US8885714B2 (en) * 2010-01-14 2014-11-11 Texas Instruments Incorporated Method and system for intracoding in video encoding
US8995527B2 (en) * 2010-02-19 2015-03-31 Qualcomm Incorporated Block type signalling in video coding
US8559512B2 (en) * 2010-05-05 2013-10-15 Ceva D.S.P. Ltd. Device, system, and method for predicting residual data for intra and inter frame encoding of image or video data
US9313523B2 (en) * 2010-07-16 2016-04-12 Sharp Laboratories Of America, Inc. System for low resolution power reduction using deblocking
US20120014447A1 (en) * 2010-07-16 2012-01-19 Sharp Laboratories Of America, Inc. System for low resolution power reduction with high resolution deblocking
WO2012050758A1 (en) * 2010-10-12 2012-04-19 Dolby Laboratories Licensing Corporation Joint layer optimization for a frame-compatible video delivery
GB2500835B (en) * 2010-12-10 2014-02-12 Ibm High-dynamic range video tone mapping
US20120257675A1 (en) * 2011-04-11 2012-10-11 Vixs Systems, Inc. Scalable video codec encoder device and methods thereof
WO2012173449A2 (ko) * 2011-06-17 2012-12-20 한국전자통신연구원 비디오 인코딩 및 디코딩 방법과 이를 이용한 장치
US9445093B2 (en) * 2011-06-29 2016-09-13 Qualcomm Incorporated Multiple zone scanning order for video coding
US9736489B2 (en) 2011-09-17 2017-08-15 Qualcomm Incorporated Motion vector determination for video coding
US9253508B2 (en) 2011-11-04 2016-02-02 Futurewei Technologies, Inc. Differential pulse code modulation intra prediction for high efficiency video coding
JP2013102297A (ja) * 2011-11-07 2013-05-23 Canon Inc 画像符号化方法、画像符号化装置及びプログラム、画像復号方法、画像復号装置及びプログラム
JP5871628B2 (ja) 2011-11-07 2016-03-01 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
CN104185991B (zh) 2011-11-09 2018-07-06 弗劳恩霍夫应用研究促进协会 不同动态采样值范围的层之间的层间预测
WO2013106190A1 (en) 2012-01-09 2013-07-18 Dolby Laboratories Licensing Corporation Hybrid reference picture reconstruction method for single and multiple layered video coding systems
US9838688B2 (en) * 2012-06-22 2017-12-05 Mediatek Inc. Method and apparatus of adaptive intra prediction for inter-layer and inter-view coding
US20150208092A1 (en) * 2012-06-29 2015-07-23 Samsung Electronics Co., Ltd. Method and apparatus for encoding scalable video, and method and apparatus for decoding scalable video
US20140003504A1 (en) * 2012-07-02 2014-01-02 Nokia Corporation Apparatus, a Method and a Computer Program for Video Coding and Decoding
MX361767B (es) * 2012-07-09 2018-12-17 Vid Scale Inc Arquitectura de códec para codificación de video de múltiples capas.
WO2014010943A1 (ko) * 2012-07-10 2014-01-16 한국전자통신연구원 영상 부호화/복호화 방법 및 장치
US20150229967A1 (en) * 2012-08-21 2015-08-13 Samsung Electronics Co., Ltd. Inter-layer video coding method and device for predictive information based on tree structure coding unit, and inter-layer video decoding method and device for predictive informationbased on tree structure coding unit
CN104620281B (zh) * 2012-09-12 2018-08-14 皇家飞利浦有限公司 使hdr观看为内容所有者同意的过程
WO2014050677A1 (ja) * 2012-09-28 2014-04-03 ソニー株式会社 画像処理装置および方法
US9124899B2 (en) 2012-09-28 2015-09-01 Sharp Laboratories Of America, Inc. Motion derivation and coding for scaling video
GB2506853B (en) * 2012-09-28 2015-03-18 Canon Kk Method and apparatus for encoding an image into a video bitstream and decoding corresponding video bitstream
EP2911397A1 (en) * 2012-09-28 2015-08-26 Intel Corporation Inter-layer pixel sample prediction
US9380307B2 (en) 2012-11-19 2016-06-28 Qualcomm Incorporated Method and system for intra base layer (BL) transform in video coding
US10085017B2 (en) * 2012-11-29 2018-09-25 Advanced Micro Devices, Inc. Bandwidth saving architecture for scalable video coding spatial mode
CN104854872B (zh) * 2012-12-13 2018-07-20 索尼公司 发送装置、传输方法、接收装置以及接收方法
US20140169467A1 (en) * 2012-12-14 2014-06-19 Ce Wang Video coding including shared motion estimation between multple independent coding streams
US9414058B2 (en) * 2012-12-25 2016-08-09 Mediatek Inc. Video processing apparatus capable of generating output video pictures/sequence with color depth different from color depth of encoded video bitstream
US9532057B2 (en) * 2012-12-28 2016-12-27 Qualcomm Incorporated Inter-layer prediction using sample-adaptive adjustments for bit depth scalable video coding
EP2961167A4 (en) * 2013-02-25 2016-08-10 Samsung Electronics Co Ltd DEVICE AND METHOD FOR EVOLVING VIDEO ENCODING USING MEMORY BANDWIDTH AND QUANTITY OF CALCULATION, AND DEVICE AND METHOD FOR EVOLVING VIDEO DECODING
US9578339B2 (en) 2013-03-05 2017-02-21 Qualcomm Incorporated Parallel processing for video coding
US9800884B2 (en) * 2013-03-15 2017-10-24 Qualcomm Incorporated Device and method for scalable coding of video information
US9491460B2 (en) * 2013-03-29 2016-11-08 Qualcomm Incorporated Bandwidth reduction for video coding prediction
KR20140121315A (ko) 2013-04-04 2014-10-15 한국전자통신연구원 참조 픽처 리스트를 이용한 다 계층 기반의 영상 부호화/복호화 방법 및 그 장치
WO2014163418A1 (ko) * 2013-04-04 2014-10-09 한국전자통신연구원 영상 부호화/복호화 방법 및 장치
TW201507443A (zh) * 2013-05-15 2015-02-16 Vid Scale Inc 基於單迴路解碼之多層視訊編碼
US9509999B2 (en) * 2013-06-11 2016-11-29 Qualcomm Incorporated Inter-layer prediction types in multi-layer video coding
US20150010083A1 (en) * 2013-07-08 2015-01-08 Electronics And Telecommunications Research Institute Video decoding method and apparatus using the same
GB2516424A (en) 2013-07-15 2015-01-28 Nokia Corp A method, an apparatus and a computer program product for video coding and decoding
KR20150075040A (ko) 2013-12-24 2015-07-02 주식회사 케이티 멀티 레이어 비디오 신호 인코딩/디코딩 방법 및 장치
US9794558B2 (en) * 2014-01-08 2017-10-17 Qualcomm Incorporated Support of non-HEVC base layer in HEVC multi-layer extensions
US9445111B2 (en) * 2014-01-08 2016-09-13 Sony Corporation Image processing apparatus and image processing method
US9906804B2 (en) * 2014-01-16 2018-02-27 Qualcomm Incorporated Reference layer sample position derivation for scalable video coding
KR20150110295A (ko) * 2014-03-24 2015-10-02 주식회사 케이티 멀티 레이어 비디오 신호 인코딩/디코딩 방법 및 장치
MX2018008368A (es) 2014-05-09 2022-01-27 Electronics & Telecommunications Res Inst Aparato de multiplexion de señal usando multiplexion por division en capas y metodo de multiplexion de señal.
EP3010231A1 (en) * 2014-10-17 2016-04-20 Thomson Licensing Method for color mapping a video signal based on color mapping data and method of encoding a video signal and color mapping data and corresponding devices
FR3030975B1 (fr) * 2014-12-19 2018-03-09 Orange Procede de codage d'une image numerique, procede de decodage, dispositifs, terminal d'utilisateur et programmes d'ordinateurs associes
EP3301925A1 (en) * 2016-09-30 2018-04-04 Thomson Licensing Method for local inter-layer prediction intra based
US11496747B2 (en) * 2017-03-22 2022-11-08 Qualcomm Incorporated Intra-prediction mode propagation
CA3152728A1 (en) * 2019-10-03 2021-04-08 Han GAO Coding process for geometric partition mode
US11140445B1 (en) 2020-06-03 2021-10-05 Western Digital Technologies, Inc. Storage system and method for storing scalable video
CN112862073B (zh) * 2021-02-03 2022-11-18 北京大学 一种压缩数据分析方法、装置、存储介质及终端

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7929610B2 (en) * 2001-03-26 2011-04-19 Sharp Kabushiki Kaisha Methods and systems for reducing blocking artifacts with reduced complexity for spatially-scalable video coding
JP2008517498A (ja) 2004-10-15 2008-05-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 中間レイヤ動きデータ予測を用いて符号化されたビデオシーケンスを生成するための装置および方法
KR100746007B1 (ko) 2005-04-19 2007-08-06 삼성전자주식회사 엔트로피 코딩의 컨텍스트 모델을 적응적으로 선택하는방법 및 비디오 디코더
KR100763181B1 (ko) 2005-04-19 2007-10-05 삼성전자주식회사 기초계층과 향상계층의 데이터를 바탕으로 예측 정보를코딩하여 코딩율을 향상시키는 방법 및 장치
AU2006201490B2 (en) 2005-04-19 2008-05-22 Samsung Electronics Co., Ltd. Method and apparatus for adaptively selecting context model for entropy coding
US7894523B2 (en) * 2005-09-05 2011-02-22 Lg Electronics Inc. Method for modeling coding information of a video signal for compressing/decompressing coding information
CN100594735C (zh) * 2006-03-28 2010-03-17 联詠科技股份有限公司 图像处理装置及其选择图像递色的方法
KR100781524B1 (ko) 2006-04-04 2007-12-03 삼성전자주식회사 확장 매크로블록 스킵 모드를 이용한 인코딩/디코딩 방법및 장치
EP1871113A1 (en) 2006-06-20 2007-12-26 THOMSON Licensing Method and apparatus for encoding video enhancement layer with multiresolution color scalability
US7535383B2 (en) * 2006-07-10 2009-05-19 Sharp Laboratories Of America Inc. Methods and systems for signaling multi-layer bitstream data
CN100393099C (zh) * 2006-08-31 2008-06-04 北京北大方正电子有限公司 调频调幅混合网点层次连续调控制方法

Also Published As

Publication number Publication date
KR101354053B1 (ko) 2014-01-27
TW200934252A (en) 2009-08-01
EP2213100A1 (en) 2010-08-04
US8432968B2 (en) 2013-04-30
KR20100074283A (ko) 2010-07-01
JP2011501571A (ja) 2011-01-06
CN101828399A (zh) 2010-09-08
US20090097558A1 (en) 2009-04-16
JP5661465B2 (ja) 2015-01-28
KR20120060921A (ko) 2012-06-12
CN101828399B (zh) 2013-06-26
WO2009052205A1 (en) 2009-04-23
JP2015039182A (ja) 2015-02-26

Similar Documents

Publication Publication Date Title
JP5795416B2 (ja) スケーラブルビット深度のためのスケーラブルビデオコーディング手法
TWI357766B (en) Variable length coding table selection based on vi
KR101067308B1 (ko) 정제 계수 코딩을 위한 블록 형식 통계치에 기초한 가변 길이 코딩 테이블 선택
CA2677973C (en) Combined run-length coding of refinement and significant coefficients in scalable video coding enhancement layers
JP5175303B2 (ja) スケーラブルビデオコーディング用の適応アップサンプリング
TWI425837B (zh) 用於編碼區塊樣式之可變長度編碼技術
JP4981927B2 (ja) Svccgs拡張層コーディングに関するcavlc拡張
CA2666055C (en) Refinement coefficient coding based on history of corresponding transform coefficient values
CA2701200A1 (en) Adaptive coding of video block header information

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150714

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150812

R150 Certificate of patent or registration of utility model

Ref document number: 5795416

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees