JP5108026B2

JP5108026B2 - 空間スケーラビリティーのための拡張されたレイヤ間符号化

Info

Publication number: JP5108026B2
Application number: JP2009545628A
Authority: JP
Inventors: サゲトン、フォーム; チュン、ヒュクジュネ; カークゼウィックズ、マルタ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2007-01-08
Filing date: 2008-01-07
Publication date: 2012-12-26
Anticipated expiration: 2028-01-07
Also published as: KR20090097903A; US8548056B2; RU2009130392A; EP2116060A1; BRPI0806523A2; TW200838320A; JP2010516194A; CN101584217A; CN101584217B; EP2116060B1; WO2008086324A1; KR101067305B1; US20080165850A1; CA2673887A1

Description

（関連出願の相互参照）
本出願は、２００７年１月８日付け提出され、参照によってその全体が本明細書に組み込まれる、米国仮出願第６０／８８３，８８１号の利益を主張する。
この開示は、デジタルビデオ符号化に関し、より詳しくは空間スケーラビリティーを提供するスケーラブルビデオ符号化（scalable video coding）（ＳＶＣ）技術に関する。

デジタルビデオの機能（capabilities）は、デジタルテレビ、デジタルダイレクトブロードキャストシステム、無線通信デバイス、無線ブロードキャストシステム、携帯情報端末（ＰＤＡ）、ラップトップ又はデスクトップコンピュータ、デジタルカメラ、デジタル記録装置、ビデオゲーム機器、ビデオゲームコンソール、セルラー無線電話又はサテライト無線電話、及び同類のものを含む、広範なデバイスに取り入れることが可能である。デジタルビデオデバイスは、より効率良くデジタルビデオを送信及び受信するために、例えばＭＰＥＧ−２、ＭＰＥＧ−４、又はＨ．２６４／ＭＰＥＧ−４， Part 10、高度ビデオ符号化（Advanced Video Coding）（ＡＶＣ）のようなビデオ圧縮技術を実装する。ビデオ圧縮技術は、ビデオシーケンス中に内在する冗長性を削減又は除去するために、空間予測（spatial prediction）及び時間予測（temporal prediction）を実行する。

ビデオ符号化において、ビデオ圧縮は、しばしば、空間予測、動き推定（motion estimation）及び動き補償（motion compensation）を含む。イントラ符号化（Intra-coding）は、与えられたビデオフレーム内のビデオブロック間の空間的冗長性を削減するための空間予測に依存する。インター符号化（Inter-coding）は、ビデオシーケンスの連続するビデオフレームのビデオブロック間の時間的冗長性を削減するための時間予測に依存する。インター符号化のために、ビデオ符号器（encoder）は、２以上の隣接するフレーム間のマッチするビデオブロックの移動（movement）を追跡するための動き推定を実行する。動き推定は、１又は複数の参照フレーム中の対応する予測ビデオブロックに関連するビデオブロックの移動を示す、動きベクトルを生成する。動き補償は、参照フレームから予測ビデオブロックを識別（identify）するために、動きベクトルを利用する。動き補償の後、残差（residual）ビデオブロックは、符号化すべきオリジナルのビデオブロックから、予測ビデオブロックを減算することによって、形成される。ビデオ符号器は、通常、残差ブロックの通信に関係するビットレートを更に削減するために、変換処理、量子化処理及び変換係数の符号化処理を適用する。

あるビデオ符号化は、スケーラブル技術を使用する。例えば、スケーラブルビデオ符号化（ＳＶＣ）は、一つのベースレイヤ及び一つ又は複数のスケーラブル強化レイヤが用いられるビデオ符号化を指す。ＳＶＣに関して、ベースレイヤは、典型的には、ベースレベルの品質で、ビデオデータを運ぶ。一つ又は複数の強化レイヤは、より高い水準の空間的レベル、時間的レベル及び／又はＳＮＲレベルをサポートするために、追加的なビデオデータを運ぶ。ベースレイヤは、強化レイヤの伝送に比較して、より信頼性のある方法で伝送されても良い。ＳＶＣ技術は、多くのビデオ符号化環境において使用されても良く、また、無線ブロードキャストセッティング、例えば、テレビのような無線ハンドセットに対するブロードキャストにおいて特に有用であっても良い。

空間スケーラビリティーは、強化レイヤがベースレイヤのフレームに空間分解能を追加する、ＳＶＣスキームの一つのタイプである。このケースにおいて、ベースレイヤは、符号化データのベースレイヤ・ビデオブロックの数を定義しても良く、また、強化レイヤは、強化レイヤ・ビデオブロックの数を定義しても良い。強化レイヤ・ビデオブロックの数は、ベースレイヤ・ビデオブロックの数に比較して、より多くても良く、それによって、ビデオシーケンスのフレームに空間分解能を追加するようにしても良い。空間スケーラビリティーをサポートするＳＶＣセッティングにおいて、レイヤ間予測（inter-layer prediction）は、強化レイヤを搬送する必要のあるデータの総量を削減するために使用されても良い。レイヤ間予測において、ベースレイヤのビデオブロックに完全にオーバーラップする強化レイヤのビデオブロックは、動き推定及び動き補償に類似する予測技術によって符号化されても良い。特に、レイヤ間予測において、強化レイヤ情報は、ベースレイヤの予測ビデオブロックに基づいて符号化されても良い。このように、レイヤ間冗長性は、データ圧縮を与えるために有効に利用されても良い。

一般に、この開示は、空間スケーラビリティーをサポートするスケーラブルビデオ符号化（ＳＶＣ）スキームにおける、情報を符号化するのための技術を説明する。ＳＶＣにおいて、ビデオブロックは、一つのベースレイヤ及び一つ又は複数の強化レイヤについて符号化される。強化レイヤの符号化は、ベースレイヤにおいて識別される予測ビデオブロックに基づいて強化レイヤの少なくとも一部のビデオブロックが符号化される、レイヤ間予測を含む。

強化レイヤが、ベースレイヤに関連するビデオシーケンスのフレームに対して空間分解能を付加するように、強化レイヤ・ビデオブロックの数が、ベースレイヤ・ビデオブロックに比較して、より多くても良い。強化レイヤのビデオブロックの多くが、ベースレイヤのビデオブロックに、空間的に完全にオーバーラップしていても良い。この場合、レイヤ間予測が使用可能である。強化レイヤのビデオブロックの一部が、ベースレイヤのビデオブロックに、空間的に全くオーバーラップしなくても良い。この場合、時間予測又は空間予測を優先し、レイヤ間予測を回避しても良い。この開示は、ベースレイヤのビデオブロックに、空間的に部分的にのみオーバーラップする強化レイヤのビデオブロックのためのレイヤ間予測をサポートする技術を提供する。その技術は、データ圧縮、ビデオ品質、又はその両方を向上しても良い。

一つの例において、この開示は、ケーラブルビデオ符号化（ＳＶＣ）スキームのベースレイヤにおいて定義された第１のビデオブロックを符号化（coding）することと、前記ＳＶＣスキームの拡張レイヤにおいて定義された第２のビデオブロックを符号化することを含み、前記第２のビデオブロックは、第１のビデオブロックに関係する空間スケーラビリティー拡張を提供するものである、前記ＳＶＣスキームにおける情報を符号化する方法を提供する。前記第２のビデオブロックを符号化することは、前記第１のビデオブロックに完全にオーバーラップする前記第２のビデオブロックの第１のサブセットについて前記ベースレイヤに関係する前記拡張レイヤをレイヤ間予測することを実行することと、前記第１のビデオブロックに部分的にオーバーラップする前記第２のビデオブロックの第２のサブセットについて前記ベースレイヤに関係する前記拡張レイヤをレイヤ間予測することを実行することを含む。

他の例において、この開示は、スケーラブルビデオ符号化（ＳＶＣ）スキームに従って情報を符号化する装置を提供する。前記装置は、前記ＳＶＣスキームのベースレイヤにおいて定義された第１のビデオブロックを符号化（coding）し、及び、前記ＳＶＣスキームの拡張レイヤにおいて定義された第２のビデオブロックを符号化する符号化ユニット（coding unit）を含み、前記第２のビデオブロックは、第１のビデオブロックに関係する空間スケーラビリティー拡張を提供するものである。さらに、前記第２のビデオブロックに関して、前記符号化ユニットは、前記第１のビデオブロックに完全にオーバーラップする前記第２のビデオブロックの第１のサブセットについて前記ベースレイヤに関係する前記拡張レイヤをレイヤ間予測することを実行し、及び、前記第１のビデオブロックに部分的にオーバーラップする前記第２のビデオブロックの第２のサブセットについて前記ベースレイヤに関係する前記拡張レイヤをレイヤ間予測することを実行する。

他の例において、本開示は、スケーラブルビデオ符号化（ＳＶＣ）スキームにおける情報を符号化する装置を提供するものであり、前記装置は、前記ＳＶＣスキームのベースレイヤにおいて定義された第１のビデオブロックを符号化（coding）するための手段と、前記ＳＶＣスキームの拡張レイヤにおいて定義された第２のビデオブロックを符号化するための手段とを含み、前記第２のビデオブロックは、第１のビデオブロックに関係する空間スケーラビリティー拡張を提供するものである。前記第２のビデオブロックを符号化するための手段は、前記第１のビデオブロックに完全にオーバーラップする前記第２のビデオブロックの第１のサブセットについて前記ベースレイヤに関係する前記拡張レイヤをレイヤ間予測することを実行するための手段と、前記第１のビデオブロックに部分的にオーバーラップする前記第２のビデオブロックの第２のサブセットについて前記ベースレイヤに関係する前記拡張レイヤをレイヤ間予測することを実行するための手段とを含む。

この開示において説明される技術は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組み合わせにより実現されても良い。ソフトウェアにより実現される場合には、ソフトウェアは、例えばマイクロプロセッサ、特定用途向けＩＣ（ＡＳＩＣ）、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）、又はデジタルシグナルプロセッサ（ＤＳＰ）のような、１又は複数のプロセッサにより実行されても良い。その技術を実行するソフトウェアは、最初にコンピュータ読み取り可能な媒体にインストールされ、そして、プロセッサにロードされて実行されても良い。

したがって、この開示はまた、ビデオ符号化装置において実行されたときに、該装置に、スケーラブルビデオ符号化（ＳＶＣ）スキームにおける情報を符号化させる（code）インストラクションを含む、コンピュータ読み取り可能な媒体を提供するものであり、前記インストラクションは、前記装置に、前記ＳＶＣスキームのベースレイヤにおいて定義された第１のビデオブロックを符号化（coding）させ、及び、前記ＳＶＣスキームの拡張レイヤにおいて定義された第２のビデオブロックを符号化させるものであり、前記第２のビデオブロックは、第１のビデオブロックに関係する空間スケーラビリティー拡張を提供するものである。この場合において、前記第２のビデオブロックに関して、前記インストラクションは、前記装置に、前記第１のビデオブロックに完全にオーバーラップする前記第２のビデオブロックの第１のサブセットについて前記ベースレイヤに関係する前記拡張レイヤをレイヤ間予測することを実行させ、及び、前記第１のビデオブロックに部分的にオーバーラップする前記第２のビデオブロックの第２のサブセットについて前記ベースレイヤに関係する前記拡張レイヤをレイヤ間予測することを実行させるものである。

場合によっては、コンピュータ読み取り可能な媒体は、製造者へ販売され及び／又はビデオ符号化装置に用いられてもよいコンピュータプログラムプロダクトの一部を形成しても良い。該コンピュータプログラムプロダクトは、コンピュータ読み取り可能な媒体を含んでも良く、また、場合によっては、包装材料を含んでも良い。

更なる例において、この開示は、ベースレイヤ・ビデオブロックに部分的にオーバーラップする強化レイヤ・ビデオブロックを識別することと、ベースレイヤ・ビデオブロックに関係する前記識別された強化レイヤ・ビデオブロックのうちの少なくとも一部又は全部の部分をインター符号化することを含む、スケーラブルビデオ符号化（ＳＶＣ）のための方法を提供する。この方法はまた、ハードウェア、ソフトウェア、ファームウェア、又は、以下で説明される一般的な任意の実装において、実装されても良い。

他の例において、この開示は、例えば、集積回路、チップセット、特定用途向けＩＣ（ＡＳＩＣ）、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）、ロジック、又は、本明細書で説明される技術のうちの１又は複数を実行するように構成された、それらの様々な組み合わせのような回路が対象にされても良い。

本開示の１又は複数の態様の詳細は、添付図面及び以下の説明に記述されている。この開示で説明される技術の他の特徴、目的、及び利点は、該説明及び図面から並びに特許請求の範囲から、明白であろう。

図１は、ビデオ符号化の間、ビデオ復号化の間又はそれら両方の間に、この開示の技術を実施する、ビデオ符号化及び復号化システムを説明する例示的なブロック図である。図２は、空間スケーラビリティーをサポートするスケーラブルビデオ符号化（ＳＶＣ）スキームのベースレイヤと強化レイヤとの間の例示的な関係を説明する概念図である。図３は、ベースレイヤのビデオブロックと、ベースレイヤのビデオブロックに、完全にオーバーラップする、部分的にオーバーラップする又はオーバーラップしない、強化レイヤの異なるビデオブロックとを説明する概念図である。図４Ａは、ベースレイヤのビデオブロックと、完全にオーバーラップする強化レイヤのビデオブロックを識別するためのシェーディングを有する強化レイヤのビデオブロックとを説明する概念図である。図４Ｂは、ベースレイヤのビデオブロックと、部分的にオーバーラップする強化レイヤのビデオブロックを識別するためにシェーディングを有する強化レイヤのビデオブロックとを説明する概念図である。図４Ｃは、ベースレイヤのビデオブロックと、ベースレイヤのそれらにオーバーラップしない強化レイヤのビデオブロックを識別するためにシェーディングを有する強化レイヤのビデオブロックとを説明する概念図である。図５は、この開示に合致する技術を説明するフローチャートである。

詳細な説明

この開示は、空間スケーラビリティーをサポートするスケーラブルビデオ符号化（ＳＶＣ）スキームにおける、情報を符号化するための技術を説明する。そのＳＶＣスキームは、一つのベースレイヤ及び一つ又は複数の強化レイヤを含んでも良い。レイヤ間予測は、ベースレイヤの類似するビデオブロックに基づく、強化レイヤの各種のビデオブロックの符号化において使用される。強化レイヤのビデオブロックのためのレイヤ間予測は、ベースレイヤの予測ビデオブロック、及び、符号化をされている強化レイヤのビデオブロックと該ベースレイヤの予測ビデオブロックとの間の差分を表す符号化残差情報を、識別することを伴っても良い。代わりに、レイヤ間予測は、ベースレイヤの予測ビデオブロックを識別すること、及び、予測ビデオブロックから符号化されているビデオブロックへ、テクスチャー及び動きデータを割り当てる（assigning）又は継承する（inheriting）ことによって、ベースレイヤのビデオブロックを符号化することを、伴うこともあり得る。

強化レイヤのビデオブロックの多くは、ベースレイヤのビデオブロックに空間的に完全にオーバーラップしても良い。この場合には、レイヤ間予測が非常に効果的に利用可能である。しかしながら、強化レイヤのビデオブロックの一部は、ベースレイヤのビデオブロックに空間的にオーバーラップしていなくても良い。この場合には、これらビデオブロックのための時間予測又は空間予測を優先し、これらビデオブロックのためのレイヤ間予測を回避しても良い。一部の強化レイヤのビデオブロックは、ベースレイヤのビデオブロックに空間的に部分的にオーバーラップしていても良い。この開示は、ベースレイヤのビデオブロックに対して空間的に部分的にのみオーバーラップする、強化レイヤのそれらビデオブロックのための、レイヤ間予測をサポートする技術を提供する。この場合には、符号化ユニットは、強化レイヤの空間的に部分的にオーバーラップするビデオブロックのオーバーラップする部分を符号化するために、レイヤ間予測を実行しても良く、また、強化レイヤの空間的に部分的にオーバーラップするビデオブロックのオーバーラップしない部分を符号化するために、例えばパディング（padding）、補間（interpolation）又はミラーリング（mirroring）のような補助的な（supplemental）符号化技術を実行しても良い。

図１は、ビデオ符号化及び復号化システム１０を説明するブロック図である。図１に示されるように、システム１０は、符号化されたビデオを、通信チャネル１５を通して受信デバイス６へ送信する、ソースデバイス２を含む。ソースデバイス２は、ビデオソース１１、符号化（coding）ユニット１２及び変調器／送信機１４を含んでも良い。受信デバイス６は、受信機／復調器１６、符号化（coding）ユニット１８及びディスプレイ装置２０を含んでも良い。システム１０は、ベースレイヤに関連するレイヤ間予測を用いて、少なくとも幾らか（some）部分的にオーバーラップする強化レイヤのビデオブロックを符号化するＳＶＣ技術を適用するように構成されても良い。

スケーラブルビデオ符号化（ＳＶＣ）は、一つのベースレイヤ及び一つ又は複数のスケーラブル強化レイヤが使用されるところのビデオ符号化を指す。ＳＶＣに関して、ベースレイヤは、典型的には、ベースレベルの品質で、ビデオデータを運ぶ。一つ又は複数の強化レイヤは、より高い水準の空間的レベル、時間的レベル及び／又は信号対雑音のＳＮＲレベルをサポートするために、追加的なビデオデータを運ぶ。強化レイヤは、前もって符号化（encoded）されたレイヤに関連して定義されても良い。空間スケーラビリティーに関して、強化レイヤは、ベースレイヤに対して空間データを追加しても良い。強化レイヤのビデオブロックの一部は、ベースレイヤのそれらに空間的にオーバーラップしていても良く、一部は、ベースレイヤのビデオブロックに空間的に部分的にオーバーラップしていても良く、また、一部は、ベースレイヤのビデオブロックに空間的にオーバーラップしていなくても良い。

この開示において、“ビデオブロック（video blocks）”は、ビデオシーケンスの画像フレームのブロックを表すデータのセットを指す。ビデオブロックは、画像フレームのブロックを表すピクセル値又は他のタイプの係数を定義しても良い。さらに、ビデオブロックは、幅広い種類の形状及びサイズを仮定しても良い。例として、ビデオブロックは、H.264／MPEG-4, Part 10，高度ビデオ符号化（ＡＶＣ）で定義されるようないわゆる“マクロブロック（macroblocks）”を含んでも良いし、又は、マクロブロックのパーティション若しくはサブパーティションを含んでも良い。

図１の例において、通信チャネル１５は、例えば無線周波数（ＲＦ）スペクトラム、又は、１又は複数の物理伝送線路、又は、無線媒体若しくは有線媒体の任意の組み合わせのような、任意の無線又は有線の通信媒体を含んでも良い。通信チャネル１５は、例えばローカルエリアネットワーク、ワイドエリアネットワーク、又はインターネットなどのグローバルネットワークのような、パケットベースのネットワークの一部を形成していても良い。通信チャネル１５は、広く、ソースデバイス２から受信デバイス６へビデオデータを送信するための、任意の適切な通信媒体、又は異なる通信媒体の集まりを表す。

幾つかの態様において、ビデオブロードキャストに関して、この開示において説明される技術は、技術標準ＴＩＡ−１０９９（“ＦＬＯ仕様（ＦＬＯ Specification）”）として公表された、フォワードリンクオンリー（ＦＬＯ）エアインタフェース仕様，“Forward Link Only Air Interface Specification for Terrestrial Mobile Multimedia Multicast”を用いて、地上モバイルマルチメディアマルチキャスト（terrestrial mobile multimedia multicast）（ＴＭ３）システムにおけるリアルタイムビデオサービスを配信するためのEnhanced H.264ビデオ符号化に適用されても良い。すなわち、通信チャネル１５は、ＦＬＯ仕様又は同種のものに従うブロードキャスト無線ビデオ情報に対して使用される無線情報チャネルを含んでも良い。

ＦＬＯ仕様は、ＦＬＯエアインタフェースに適している、ビットストリームシンタックス及びセマンティックス並びに復号化プロセスを定義する例を含んでいる。あるいは、ビデオは、例えばＤＶＢ−Ｈ（ハンドヘルド向けデジタルビデオブロードキャスト（digital video broadcast-handheld））、ＩＳＤＢ−Ｔ（地上デジタル統合放送サービス（integrated services digital broadcast - terrestrial））、又はＤＭＢ（デジタルメディア放送（digital media broadcast））のような他の標準に従ってブロードキャストされても良い。それゆえ、ソースデバイス２は、携帯無線端末（mobile wireless terminal）、無線ビデオストリーミングサーバ（wireless video streaming server）、又は無線ビデオブロードキャストサーバ（wireless video broadcast server）であっても良い。しかしながら、この開示において説明される技術は、ブロードキャスト、マルチキャスト、又はポイントツーポイントシステムの特定のタイプに限定されない。ブロードキャストの場合は、ソースデバイス２は、ビデオデータの幾つかのチャネルを同時に複数の受信デバイスへブロードキャストしても良い。複数の受信デバイスの各々は、図２に示される受信デバイス６と同様でも良い。デバイス６は、例えば無線通信用に構成された携帯電話機（mobile handset）…例えばセルラー無線電話…のような無線通信デバイスを含んでも良い。

ソースデバイス２は、受信デバイス６への伝送のために、符号化ビデオデータを生成する。また一方、場合によっては、デバイス２，６は、実質的に対称的な方法で動作しても良い。例えば、デバイス２，６の各々が、ビデオ符号化コンポーネント及びビデオ復号化コンポーネントを含んでも良い。それゆえ、システム１０は、例えば、ビデオストリーミング、ビデオブロードキャスティング、又はビデオ電話のために、ビデオデバイス２，６間の一方向又は双方向の伝送をサポートしても良い。

ソースデバイス２のビデオソース１１は、例えばビデオカメラ、前もってとられたビデオが入っているビデオアーカイブ、又はビデオコンテンツプロバイダから供給されたビデオのような、ビデオキャプチャーデバイスを含んでも良い。無線ブロードキャストネットワークに関して、ビデオソース１１は、衛星又はケーブルテレビチャネルを受信し復号化するための機器又は当該データを前処理するための機器を含んでも良い。図１には示されていないが、ブロードキャスティングに関して、ソースデバイス２において複数のチャネルからの符号化ビデオを一つのマルチキャスト内に混合するために、多重化ユニットが使用されても良い。この場合は、複数の符号化ユニットが、異なるコンテンツチャネルのための情報を符号化しても良く、また、その符号化された情報は、変調器／送信機１４による変調及び送信に先立って、多重化ユニット（図示せず）により混合されても良い。

更に別の方法としては、ビデオソース１１は、ソースビデオとしてのコンピュータグラフィックス・ベースのデータ、又は、ライブビデオとコンピュータ生成ビデオとの合成を生成しても良い。場合によっては、ビデオソース１１がビデオカメラならば、ソースデバイス２及び受信デバイス６は、カメラ付き携帯電話（camera phones）又はテレビ電話（video phones）を形成しても良い。いずれの場合にも、キャプチャーされた、プリキャプチャーされた、又はコンピュータ生成されたビデオは、ビデオソースデバイス２からビデオ受信デバイス６の符号化ユニット１８への、変調器／送信機１４、通信チャネル１５及び受信機／復調器１６を通した伝送のために、符号化ユニット１２により符号化（encoded）されても良い。符号化ユニット１２及び１８のビデオ符号化プロセス及びビデオ復号化プロセスは、強化レイヤにおけるデータ圧縮及び／又はデータ品質を向上するために、この開示の技術を実施しても良い。ディスプレイ装置２０は、復号化されたビデオデータをユーザに表示する。また、ディスプレイ装置２０は、例えばブラウン管、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、又は他のタイプのディスプレイ装置のような、さまざまなディスプレイ装置のうちの任意のものを含んでも良い。

符号化ユニット１２及び８は、空間スケーラビリティーのためのＳＶＣをサポートするように構成されても良い。符号化ユニット１２及び１８は、一つのベースレイヤ及び一つ又は複数のスケーラブル強化レイヤの符号化（encoding）、伝送（transmission）及び復号化（decoding）をサポートすることにより、さまざまな程度のスケーラビリティーをサポートしても良い。この場合も先と同様に、スケーラブルビデオ符号化に関して、ベースレイヤは、ベースラインレベルの品質でビデオデータを運ぶ。一つ又は複数の強化レイヤは、より高い水準の空間的レベル、時間的レベル及び／又はＳＮＲレベルをサポートするために、追加的なデータを運ぶ。ベースレイヤは、強化レイヤの伝送に比較して、より信頼性のある方法で伝送されても良い。例えば、変調信号のうちで信頼性のより高い部分が、ベースレイヤを送信するために使用されても良く、一方、変調信号のうちで信頼性のより低い部分が、強化レイヤを送信するために使用されても良い。

空間スケーラビリティーのためのＳＶＣをサポートするために、符号化ユニット１２は、一つのベースレイヤ及び一つ又は複数の強化レイヤの符号化をそれぞれ実行するための一つのベースレイヤ符号器（encoder）２２及び一つ又は複数の強化レイヤ符号器（encoders）２４を含んでも良い。完全にオーバーラップするビデオブロックのためのレイヤ間予測を含むこの開示の技術は、ＳＶＣにおける強化レイヤのビデオブロックの符号化に適用可能である。この開示に従って、強化レイヤのビデオブロックは、それらがベースレイヤ・ビデオブロックと、完全なオーバーラップを有するか、部分的なオーバーラップを有するか、又はオーバーラップを有しないかに応じて、異なる符号化がなされても良い。

受信デバイス６において、符号化ユニット１８は、ベース及び強化レイヤの両方に関係するビデオブロックを復号化する、一体とされたベース／強化復号器（decoder）２５を含んでも良い。符号化ユニット１８のベース／強化復号器２５は、ベース及び強化レイヤの両方に関係するビデオブロックを復号化しても良く、また、ビデオシーケンスのフレームを再構成するために、復号化されたビデオを結合しても良い。ディスプレイ装置２０は、復号化されたビデオシーケンスを受信し、また、そのビデオシーケンスをユーザに提示する。

符号化ユニット１２及び符号化ユニット１８は、例えばＭＰＥＧ−２、ＭＰＥＧ−４、ＩＴＵ−ＴＨ．２６３、又はＩＴＵ−ＴＨ．２６４／ＭＰＥＧ−４， Part 10、高度ビデオ符号化（ＡＶＣ）のようなビデオ圧縮標準に従って動作しても良い。図２には示されていないが、幾つかの態様において、共通のデータストリーム又は分離したデータストリーム群におけるオーディオ及びビデオの両方の符号化を処理するために、符号化ユニット１２及び符号化ユニット１８は、それぞれ、オーディオ符号器及びオーディオ復号器と一体化されていても良く、また、適当なＭＵＸ−ＤＥＭＵＸユニット、又は他のハードウェア及びソフトウェアを含んでも良い。適用可能な場合には、ＭＵＸ−ＤＥＭＵＸユニットは、ＩＴＵＨ．２２３マルチプレクサプロトコル、又は、例えばユーザデータグラムプロトコル（ＵＤＰ）のような他のプロトコルに従っても良い。

Ｈ．２６４／ＭＰＥＧ−４（ＡＶＣ）標準は、ＩＳＯ／ＩＥＣ動画専門家グループ（Moving Picture Experts Group）（ＭＰＥＧ）と一緒のＩＴＵ−Ｔビデオ符号化専門家グループ（Video Coding Experts Group）（ＶＣＥＧ）によって、共同ビデオチーム（Joint Video Team）（ＪＶＴ）として知られている集合的なパートナーシップの成果として、策定された。幾つかの態様において、この開示において説明される技術は、一般にＨ．２６４標準に従うデバイスに適用されても良い。Ｈ．２６４は、２００５年３月にＩＴＵ−Ｔ研究委員会（Study Group）により、ＩＴＵ−ＴリコメンデーションＨ．２６４，オーディオビジュアルサービス全般のための高度ビデオ符号化（ITU-T Recommendation H.264, Advanced Video Coding for generic audiovisual services）において記述されている。本明細書において、それは、Ｈ．２６４標準（standard）若しくはＨ．２６４仕様（specification）、又はＨ．２６４／ＡＶＣ標準若しくは仕様と呼ばれることもある。

ＪＶＴは、Ｈ．２６４／ＭＰＥＧ−４ＡＶＣへのＳＶＣ拡張に取り組み続けている。進展するＳＶＣ拡張（evolving SVC extension）の仕様は、共同ドラフト（Joint Draft）（ＪＤ）の形をとっている。ＪＶＴにより作り出されたジョイントスケーラブルビデオモデル（Joint Scalable Video Model）（ＪＳＶＭ）は、スケーラブルビデオで用いるツールを提供する。それは、この開示において説明される各種の符号化タスクのために、システム１０の内部で使用されても良い。

符号化ユニット１２及び符号化ユニット１８それぞれは、一つ又は複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向けＩＣ（ＡＳＩＣ）、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）、個別論理（discrete logic）、ソフトウェア、ハードウェア、ファームウェア、又はそれらの任意の組み合わせとして実装されても良い。符号化ユニット１２及び符号化ユニット１８の各々は、一つ又は複数の符号器又は復号器に含まれていても良く、また、それらのいずれも、個別の（respective）モバイルデバイス（mobile device）、加入者デバイス（subscriber device）、ブロードキャストデバイス、サーバ、又は同種のものにおける結合された符号器／復号器（encoder/decoder）（ＣＯＤＥＣ）の一部として統合されていても良い。加えて、ソースデバイス２及び受信デバイス６それぞれは、符号化されたビデオを送信及び受信するための、適当な変調コンポーネント、復調コンポーネント、周波数変換コンポーネント、フィルタリングコンポーネント、及び増幅コンポーネントを含んでも良く、適用できる場合には、無線通信をサポートするのに十分な、無線周波数（ＲＦ）の無線コンポーネント及びアンテナを含む。しかしながら、説明を簡略化するために、当該コンポーネントは、図２における、ソースデバイス２の変調器／送信機１４及び受信デバイス６の受信機／復調器１６であるものとして集約される。

ビデオシーケンスは、ビデオフレームのシリーズを含む。符号化ユニット１２は、ビデオデータを符号化するために、個々のビデオフレーム内のピクセルのブロック（または、係数のブロック）を操作する。ビデオブロックは、サイズが固定でも可変でも良く、また、特定の符号化標準に従ってサイズが異なっても良い。ある場合には、各々のビデオフレームは、符号化されたユニットであり、一方、他の場合には、各々のビデオフレームは、符号化されたユニットを形成するスライスのシリーズに分割されたものであっても良い。各々のスライスは、マクロブロックのシリーズを含んでも良い。マクロブロックは、サブブロック（パーティション及びサブパーティション）に配列されても良い。例えば、ＩＴＵ−ＴＨ．２６４標準は、例えば輝度成分のための、１６行１６列、１６行８列、８行１６列、８行８列、８行４列、４行８列及び４行４列、並びに色度成分のための対応する基準化されたサイズのような、種々のブロックサイズにおけるインター予測（inter prediction）だけでなく、例えば輝度成分のための、１６行１６列、８行８列、又は４行４列、並びに色度成分のための８行８列のような種々のブロックサイズにおけるイントラ予測（intra prediction）もサポートする。

より小さいビデオブロックは、より良い分解能を提供することができ、また、より高い水準の細部を含むビデオフレームの配置に用いられても良い。一般に、マクロブロック（ＭＢ）及び各種のサブブロックは、ビデオブロックであると考えられても良い。加えて、スライスは、例えばＭＢ及び／又はサブブロックのようなビデオブロックのシリーズあると考えられても良い。言及されるように、各々のスライスは、独立して復号化可能なビデオフレームのユニットであっても良い。

ベースレイヤ符号器２２は、ベースレイヤのビデオブロックを符号化するために、標準的なイントラベース又はインターベースの予測符号化を実行しても良い。イントラベースの予測符号化は、空間予測を用いる符号化を指す。この場合は、符号化されているフレームのビデオブロックは、そのフレームの他のビデオブロックと比べられる。残差情報は、イントラベースの予測符号化プロセスにおいて識別される予測ビデオブロックから、符号化されるべき現在のビデオブロックを減じることによって、生成される。

インターベースの予測符号化は、時間予測を用いる符号化を指す。特に、インターベースの予測符号化は、動き推定又は動き補償と呼ばれるプロセスを用いても良い。この場合は、ベースレイヤ符号器２２は、動きベクトルを生成するために、動き推定を実行する。動きベクトルは、１又は複数の参照フレーム中の対応する予測ビデオブロックに関連する、符号化されているビデオブロックの移動を示す。そして、ベースレイヤ符号器２２は、動き補償を実行する。動き補償は、参照フレームから予測ビデオブロックを識別するために、動きベクトルを利用する。動き補償の後、ベースレイヤ符号器２２は、符号化されるビデオブロックから予測ビデオブロックを減じることによって、残差ビデオブロックを形成する。イントラベース及びインターベースの符号化の両方について、ベースレイヤ符号器２２は、残差ブロックの通信に関係するビットレートを更に削減するために、変換、量子化及びエントロピー符号化の処理を適用しても良い。

強化レイヤ符号器２４は、空間スケーラビリティーを提供するために、強化レイヤのビデオブロックの符号化を実行しても良い。強化レイヤ符号器２４は、各種のビデオブロックのイントラベース又はインターベース符号化をサポートしても良い。加えて、強化レイヤ符号器２４は、強化レイヤのビデオブロッの一部のためのレイヤ間予測符号化をサポートしても良い。ある場合には、レイヤ間予測符号化は、イントラベースの時間符号化及びインターベースの空間符号化に本質的に類似している。しかしながら、レイヤ間予測符号化において、強化レイヤ・ビデオブロックを符号化するために用いられる予測ブロックは、与えられたフレームに対する対応するベースレイヤ中に位置する。それゆえ、強化レイヤ符号器２４は、ベースレイヤ中の予測ビデオブロックを識別するために、強化レイヤのビデオブロックを、対応するベースレイヤのビデオブロックと比べても良い。レイヤ間ベクトルは、予測ビデオブロックを識別するために用いられても良い。残差情報は、レイヤ間予測符号化プロセスの間、ベースレイヤ中で識別される予測ビデオブロックから、符号化されるビデオブロックを減じることによって、生成される。

代わりに、予測ビデオブロックからのテクスチャー及び動きデータを、符号化されているビデオブロックに割り当てることによって、レイヤ間予測が、ベースレイヤの予測ビデオブロックの識別及びベースレイヤの対応するビデオブロックの符号化をもたらしても良い。この代わりのシナリオにおいて、強化レイヤ・ビデオブロックは、残差差分を生成することなしに、ベースレイヤのオーバーラップする予測ビデオブロックの値を、継ぐ（assumes）又は承継する（inherits）。

復号化側に関して、符号化ユニット１８のベース／強化復号器２５は、ベースレイヤ・ビデオブロック及び強化レイヤ・ビデオブロックのために逆の復号化機能を実行する。それゆえ、符号化ユニット１８は、イントラベースの空間予測符号化、インターベースの時間予測符号化、及びレイヤ間ベースの予測符号化をサポートしても良い。以下でより詳しく述べられるように、符号化ユニット１２の強化レイヤ符号器２４及び符号化ユニット１８のベース／強化復号器２５はまた、強化レイヤの部分的にオーバーラップするビデオブロックのオーバーラップしない部分を扱うために、例えばパディング、ミラーリング又は補間のような補助的な符号化技術をサポートしても良い。この場合には、部分的にオーバーラップするビデオブロックのオーバーラップする部分は、レイヤ間予測を用いて符号化されても良く、また、オーバーラップしない部分は、それら補助的な符号化技術を用いて符号化されても良い。次の説明は、一般に、符号化プロセス中に例えば符号器により実行される符号化を中心に取り上げる。しかしながら、類似する逆の復号化プロセスが復号器により実行されても良いことは理解される。この開示において、用語“符号化（coding）”は、一般に、符号化（encoding）、復号化（decoding）、又は符号化と復号化との両方を実行するプロセスを指す。

図２は、空間スケーラビリティーをサポートするスケーラブルビデオ符号化（ＳＶＣ）スキームのベースレイヤ１７と強化レイヤ１９との間の例示的な関係を説明する概念図である。空間スケーラビリティー（時々、拡張された空間スケーラビリティー（extended spatial scalability）又は“ＥＳＳ”と呼ばれる）は、連続する空間レイヤの間の一般化された関係を可能にする。下位の空間レイヤのピクチャーは、より高い解像度のピクチャーのクロッピングされた（cropped）領域を表しても良く、また、連続する空間レイヤの間の関係は、ダイアディック（dyadic）である必要はない。クロッピングウィンドウ（cropping window）及びダウンサンプリング比を定義する幾何学的なパラメータは、シーケンスレベルで定義されるか、または、ピクチャーレベルで展開されるかのいずれかが可能である。

ＥＳＳは、二つのツールを含んでも良い。第１のツールは、クロッピングツールを含んでも良い。第２は、任意の水平及び垂直レイヤ間サイズ比を適用できる一般的なアップサンプリングツールを含んでも良い。表１における次の組み合わせを考慮することが可能であり、また、異なる組み合わせは、シンタックスエレメントextended_spatial_scalabilityの異なる値に対応する。

再度、図２を参照して、各種の幾何学的な関係により関連付けられた二つの連続する空間レイヤ…下位のレイヤ（ベースレイヤ１９）及び上位のレイヤ（強化レイヤ１７）…を考える。強化レイヤのピクチャーの幅及び高さは、それぞれ、ｗ_ｅｎｈ及びｈ_ｅｎｈとして定義できる。ベースレイヤのピクチャーのディメンションは、ｗ_ｂａｓｅ及びｈ_ｂａｓｅとして定義できる。ベースレイヤのピクチャーは、サブサンプリングされたバージョンのピクチャーのディメンションｗ_{ｅｘｔｒａｃｔ}及びｈ_{ｅｘｔｒａｃｔ}を含んでも良い。ベースレイヤのピクチャーは、強化レイヤのピクチャー内部の一部分又は全体であっても良く、また、強化レイヤのピクチャーの座標システムにおける座標（ｘ_ｏｒｉｇ，ｙ_ｏｒｉｇ）に位置していても良い。

図２において、強化のピクチャー及びベースレイヤのピクチャーは、マクロブロックに分割される。値ｗ_{ｅｘｔｒａｃｔ}／ｗ_ｂａｓｅ及び値ｈ_{ｅｘｔｒａｃｔ}／ｈ_ｂａｓｅは、ベースレイヤのピクチャーと強化レイヤ中の抽出ピクチャーとの間のアップサンプリング・ファクターに対応する。パラメータ（ｘ_ｏｒｉｇ，ｙ_ｏｒｉｇ，ｗ_{ｅｘｔｒａｃｔ}，ｈ_{ｅｘｔｒａｃｔ}）は、上位レイヤピクチャーと下位レイヤピクチャーとの間の幾何学的な関係を完全に定義しても良い。標準的な動的スケーラブル・コンフィグレーション（例えば、ここで、extended_spatial_scalability ＝０）において、パラメータ（ｘ_ｏｒｉｇ，ｙ_ｏｒｉｇ，ｗ_{ｅｘｔｒａｃｔ}，ｈ_{ｅｘｔｒａｃｔ}）は、それぞれ、（０，０，２＊ｗ_ｂａｓｅ，２＊ｈ_ｂａｓｅ）に等しくても良い。このフレームワークは、強化レイヤのそれぞれのビデオブロックが、ベースレイヤのビデオブロックと、完全にオーバーラップするか、部分的にオーバーラップするか、又はオーバーラップしないかを判定するために用いられても良い。以下でより詳しく説明されるように、これら異なるシナリオは、この開示に合致するいろいろなタイプの符号化技術をもたらしても良い。

図３は、ベースレイヤ３１のビデオブロックと、ベースレイヤのビデオブロックに、完全にオーバーラップする、部分的にオーバーラップする又はオーバーラップしない、強化レイヤ３２の異なるビデオブロックとを説明する概念図である。具体的には、強化レイヤ３２のビデオブロック３５は、ベースレイヤ３１のビデオブロックと完全にオーバーラップする。強化レイヤ３２のビデオブロック３６は、ベースレイヤ３１のビデオブロックと部分的にオーバーラップし、また、オーバーラップする部分３８及びオーバーラップしない部分３９を定義する。強化レイヤ３２のビデオブロック３７は、ベースレイヤ３１のビデオブロックとオーバーラップしない。

この開示によると、強化レイヤ３２の幾つかのビデオブロックは、レイヤ内予測（intra-layer prediction）を用いて符号化されても良く、一方、強化レイヤ３２の他のビデオブロックは、空間又は時間予測を用いて符号化されても良い。具体的には、（例えばビデオブロック３７のような）オーバーラップしないビデオブロックは、空間又は時間予測を用いて符号化され、（例えばビデオブロック３５のような）オーバーラップするビデオブロックは、レイヤ間予測を用いて符号化される。（例えばビデオブロック３６のような）部分的にオーバーラップするビデオブロックの一部又は全部は、レイヤ間予測を用いて符号化されても良い。しかしながら、レイヤ間予測を用いて符号化される、任意の部分的にオーバーラップするビデオブロックに関して、そのレイヤ間予測は、（例えば部分３８のような）オーバーラップする部分を符号化するために用いられても良い。部分的にオーバーラップするブロックの（例えば部分３９のような）オーバーラップしない部分は、例えばパディング、ミラーリング又は補間のような補助的な符号化技術を用いて符号化されても良い。

部分的にオーバーラップするブロック３６は、実際には、相対的にプアな（poor）、レイヤ内予測のための候補である。これは、オーバーラップしない部分３９は、オーバーラップする部分３８に比較して非常に大きいという事実に起因する。この開示の幾つかの態様において、部分的にオーバーラップするビデオブロックは、その部分的にオーバーラップするビデオブロックの各々について、オーバーラップのレベルを判定するために解析されても良い。そして、部分的にオーバーラップするビデオブロックの一部は、その部分的にオーバーラップするビデオブロックの各々について判定されたオーバーラップのレベルに基づいて、レイヤ間予測のための良好な候補であるものとして定義されても良い。閾値は、例えば、部分的にオーバーラップするビデオブロックのセットから、レイヤ間予測のための良好な候補をレイヤ間予測のための不良な候補から区別するために、定義されても良い。一例として、５０％を超えるオーバーラップ（すなわち、過半数のオーバーラップ）を有するビデオブロックが、レイヤ間予測のための良好な候補として定義されても良い。それゆえ、インター符号化は良好な候補に適用されても良く、一方、不良な候補は、例えば空間又は時間予測符号化技術のような他の技術を用いて符号化されても良い。

図４Ａは、ベースレイヤ３１のビデオブロックと、完全にオーバーラップする強化レイヤのビデオブロックを識別するためにシェーディングを有する強化レイヤ３２のビデオブロックとを説明する概念図である。図４Ｂは、ベースレイヤ３１のビデオブロックと、部分的にオーバーラップする強化レイヤのビデオブロックを識別するためにシェーディングを有する強化レイヤ３２のビデオブロックとを説明する概念図である。図４Ｃは、ベースレイヤ３１のビデオブロックと、ベースレイヤのそれらとオーバーラップしない強化レイヤのビデオブロックを識別するためにシェーディングを有する強化レイヤ３２のビデオブロックとを説明する概念図である。

さて、図１及び図４Ａ〜４Ｃ参照して、符号化ユニット１２のベースレイヤ符号器２２は、ＳＶＣスキームのベースレイヤ３１中に定義された第１のビデオブロックを符号化する。符号化ユニット１２の強化レイヤ符号器２４は、ＳＶＣスキームの強化レイヤ３２中に定義された第２のビデオブロックを符号化する。ここで、第２のビデオブロックは、第１のビデオブロックに関連する空間スケーラビリティーの強化を提供する。具体的には、符号化ユニット１２の強化レイヤ符号器２４は、第１のビデオブロックと完全にオーバーラップする第２のビデオブロックの第１の部分（例えば、図４Ａ中でシェーディングされたそれら）について、ベースレイヤ３１に関連する強化レイヤ３２に対するレイヤ間予測を実行しても良い。加えて、符号化ユニット１２の強化レイヤ符号器２４は、第１のビデオブロックと部分的にオーバーラップする第２のビデオブロックの第２の部分（例えば、図４Ｂ中でシェーディングされたそれらの一部又は全部）について、ベースレイヤ３１に関連する強化レイヤ３２に対するレイヤ間予測を実行しても良い。ある場合には、符号化ユニット１２の強化レイヤ符号器２４は、第１のビデオブロックとオーバーラップしない第２のビデオブロックの第３の部分（例えば、図４Ｃ中でシェーディングされたそれら）について、空間又は時間予測を実行しても良い。ここで、その空間又は時間予測は、レイヤ間予測を含まない。

第１のビデオブロックと部分的にオーバーラップする第２のビデオブロックの第２の部分（例えば、図４Ｂ中でシェーディングされたそれらの一部又は全部）について、強化レイヤ符号器２４は、その第２のビデオブロックの第２の部分のオーバーラップする部分を符号化するために、レイヤ間予測を実行しても良く、また、その第２のビデオブロックの第２の部分のオーバーラップしない部分を符号化するために、補助的な符号化技術を実行しても良い。これら補助的な技術は、パディング、ミラーリング又は補間を含んでも良いが、必ずしもこれらに限定されない。

部分的にオーバーラップするビデオブロックのオーバーラップしない部分にパディング技術が適用される場合には、強化レイヤ符号器２４は、そのオーバーラップしない部分のピクセルについて、ベースレイヤのオーバーラップする部分から得られるパディングピクセルを挿入しても良い。部分的にオーバーラップするビデオブロックのオーバーラップしない部分にミラーリング技術が適用される場合には、強化レイヤ符号器２４は、そのビデオブロックの近隣のレイヤ間符号化された（inter-layer coded）部分をミラーする、そのオーバーラップしない部分のためのピクセル値を作成しても良い（あるいは、場合により、そのオーバーラップする部分におけるベースレイヤのピクセルに基づいて、ピクセル値を作成しても良い）。部分的にオーバーラップするビデオブロックのオーバーラップしない部分に補間技術が適用される場合には、強化レイヤ符号器２４は、そのビデオブロックの近隣のレイヤ間符号化された部分から、そのオーバーラップしない部分のための値を補間しても良い（あるいは、場合により、そのオーバーラップする部分におけるベースレイヤのピクセルに基づいて、補間しても良い）。

これらの方法において、そのオーバーラップする部分のためにレイヤ間符号化（inter-layer coding）を用いる能力は、補助的な符号化技術を通して、オーバーラップしない部分を処理することによって、維持されても良い。補助的な符号化技術は、より低い品質を提供しても良いが、オーバーラップする部分のレイヤ間符号化に関係する品質の拡張及びビットの節約は、全体的な品質及び／又は圧縮の向上をもたらし得る。

さらに、ある場合には、部分的にオーバーラップするビデオブロックのためのレイヤ間符号化は、その部分的にオーバーラップするビデオブロックがその技術を価値のあるものにするのに十分なオーバーラップを有するときのみ実行される。この場合において、第１のビデオブロックと部分的にオーバーラップする第２のビデオブロックの第２の部分は、強化レイヤの部分的にオーバーラップするビデオブロックの一部（例えば、図４Ｂに示されるシェーディングされたビデオブロックの一部）を含んでも良い。強化レイヤ符号器２４は、部分的にオーバーラップするビデオブロック（図４Ｂ中でシェーディングされたそれら）の各々について、オーバーラップのレベルを判定しても良く、また、その部分的にオーバーラップするビデオブロックの各々について判定されたオーバーラップのレベルに基づいて、第２のビデオブロックの第２の部分を定義しても良い。図４Ｂの部分的にオーバーラップするビデオブロック４１は、ビデオブロック４１のオーバーラップする部分がビデオブロック４２のそれより非常に大きい範囲で、部分的にオーバーラップするビデオブロック４２よりもレイヤ間符号化に適していても良い。

オーバーラップの不十分なレベルのために、レイヤ間予測を通して符号化されない、部分的にオーバーラップするビデオブロックのいずれについても、強化レイヤ符号器２４は、空間又は時間予測を実行しても良い。ここで、その空間又は時間予測は、レイヤ間予測を含まない。それゆえ、ビデオブロック４２は、空間又は時間予測を用いて符号化されても良く、また、ビデオブロック４１は、オーバーラップする部分のためのレイヤ間予測及びオーバーラップしない部分のための補助的な符号化を用いて符号化されても良い。

図５は、この開示に合致する技術を説明するフローチャートである。図５に示されるように、符号化ユニット１２のベースレイヤ符号器２２は、ベースレイヤ・ビデオブロックを符号化し（１０１）、また、強化レイヤ符号器２４は、そのベースレイヤに関連する強化レイヤ中の空間スケーラビリティーを得るために、強化レイヤ・ビデオブロックを符号化する（１０２）。ベースレイヤ・ビデオブロックは、標準的な空間又は時間予測技術を用いて符号化されても良い。図５において、ステップ１０３〜１１０（以下で述べられる）は、ステップ１０２のサブステップと考えられても良い。

強化レイヤ・ビデオブロックを符号化するために、各々のビデオブロックが、ベースレイヤ・ビデオブロックと完全にオーバーラップするか、部分的にオーバーラップするか、又はオーバーラップしないかを判定しても良い（１０３）。もし、強化レイヤ・ビデオブロックが、ベースレイヤ・ビデオブロックと完全にオーバーラップするならば（１０４）、強化レイヤ符号器２４は、レイヤ間予測を用いて、ビデオブロックを符号化する（１０７）。もし、強化レイヤ・ビデオブロックが、ベースレイヤ・ビデオブロックとオーバーラップしないならば（１０６）、強化レイヤ符号器２４は、レイヤ間予測を用いないで、ビデオブロックを符号化する（１０７）。この場合において、空間又は時間予測符号化が用いられても良い。

もし、強化レイヤ・ビデオブロックが、ベースレイヤ・ビデオブロックと完全にオーバーラップするならば（１０５）、強化レイヤ符号器２４は、そのオーバーラップのレベルが、予め定義された閾値よりも大きいかどうか判定する（１０８）。もし、そのオーバーラップのレベルが、その定義された閾値以下ならば（１０８のＮＯの分岐）、強化レイヤ符号器２４は、レイヤ間予測を用いないで、ビデオブロックを符号化する（１０７）。この場合において、強化レイヤ・ビデオブロックは、レイヤ間符号化のための不良な候補として考えられても良い。もし、そのオーバーラップのレベルが、その定義された閾値より大きいならば（１０８のＹＥＳの分岐）、強化レイヤ符号器２４は、レイヤ間予測を用いて、部分的にオーバーラップする強化レイヤ・ビデオブロックのオーバーラップする部分を符号化する（１１０）。この場合において、強化レイヤ・ビデオブロックは、レイヤ間符号化のための良好な候補として考えられても良い。強化レイヤ符号器２４は、パディング、ミラーリング又は補間を用いて、オーバーラップしない部分を符号化する（１１１）。

他の例として、この開示に従うＳＶＣのための方法は、ベースレイヤ・ビデオブロックと空間的に部分的にオーバーラップする強化レイヤ・ビデオブロックを識別することと、ベースレイヤ・ビデオブロックに関連する識別された強化レイヤ・ビデオブロックの少なくとも一部の部分をインター符号化することを含んでも良い。この場合には、強化レイヤ符号器２４は、ベースレイヤ３１のビデオブロックと部分的にオーバーラップする、（例えばブロック３６のような）強化レイヤ３２のビデオブロックを識別しても良い。そして、強化レイヤ符号器２４は、（例えばブロック３６のオーバーラップする部分３８のような）識別された強化レイヤ３２のビデオブロックの少なくとも一部又は全部の部分を符号化しても良い。

本明細書で説明される技術は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組み合わせにより実装されても良い。モジュール又はコンポーネントとして説明された任意の特徴は、集積論理素子と一緒に、又は、分離しているが相互利用可能な論理素子として独立して、実行されても良い。ソフトウェアにより実装される場合には、該技術は、少なくとも一部分において、実行されるときに上述の方法の一つ又は複数を実行するインストラクションを含むコンピュータ読み取り可能な媒体により実現されても良い。コンピュータ読み取り可能な媒体は、コンピュータプログラム製品の一部を形成しても良い。コンピュータプログラム製品は、包装材料を含んでも良い。コンピュータ読み取り可能な媒体は、例えば、シンクロナスダイナミックランダムアクセスメモリ（ＳＤＲＡＭ）、リードオンリーメモリ（ＲＯＭ）、不揮発性ランダムアクセスメモリ（ＮＶＲＡＭ）、電気的消去可能プログラマブルリードオンリーメモリ（electrically erasable programmable read only memory）（ＥＥＰＲＯＭ）、ＦＬＡＳＨメモリ、磁気又は光データ記憶媒体（magnetic or optical data storage media）、及び同類のもののような、ランダムアクセスメモリ（ＲＡＭ）を含んでも良い。加えて又は代わりに、該技術は、少なくとも一部において、インストラクション又はデータ構造の形でコードを運び又は通信し、且つ、コンピュータによりアクセス、リード及び／又は実行されることの可能な、コンピュータ読み取り可能な通信媒体を形成しても良い。

該コードは、例えば、１又は複数のデジタル信号プロセッサ（ＤＳＰ）、汎用マイクロプロセッサ、特定用途向けＩＣ（ＡＳＩＣ）、フィールド・プログラマブル・ロジック・アレイ（field programmable logic arrays）（ＦＰＧＡ）、又は他の同等の集積された若しくは分離した論理回路のような、１又は複数のプロセッサにより実行されても良い。したがって、本明細書で用いられる用語“プロセッサ（processor）”は、上述の構造の任意のもの又は本明細書で説明される技術の実装に適した任意の他の構造を指すことができる。加えて、幾つかの態様では、本明細書で説明される機能性は、符号化及び復号化のために構成された専用のソフトウェアモジュール若しくはハードウェアモジュールの内部に、又は結合されたビデオ符号器−復号器（encoder-decoder）（ＣＯＤＥＣ）に組み込まれて、提供されても良い。

ハードウェアにより実装される場合には、この開示は、例えば、集積回路、チップセット、特定用途向けＩＣ（ＡＳＩＣ）、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）、ロジック、又は、本明細書で説明される技術の１又は複数を実行するように構成された、それらの各種の組み合わせ、のような回路を対象とされても良い。

本発明のさまざまな実施形態が説明された。これら及び他の実施形態は、次のクレームの範囲内である。
以下に、本願出願の当初の特許請求の範囲に記載された各請求項に対応する発明を付記する。
［１］スケーラブルビデオ符号化（ＳＶＣ）スキームにおける情報を符号化する方法において、前記ＳＶＣスキームのベースレイヤにおいて定義された第１のビデオブロックを符号化（coding）することと、前記ＳＶＣスキームの拡張レイヤにおいて定義された第２のビデオブロックを符号化することを含み、前記第２のビデオブロックは、第１のビデオブロックに関係する空間スケーラビリティー拡張を提供するものであり、前記第２のビデオブロックを符号化することは、前記第１のビデオブロックに完全にオーバーラップする前記第２のビデオブロックの第１のサブセットについて前記ベースレイヤに関係する前記拡張レイヤをレイヤ間予測することを実行することと、前記第１のビデオブロックに部分的にオーバーラップする前記第２のビデオブロックの第２のサブセットについて前記ベースレイヤに関係する前記拡張レイヤをレイヤ間予測することを実行することを含むことを特徴とする方法。
［２］前記第２のビデオブロックを符号化することは、前記第１のビデオブロックにオーバーラップしない前記第２のビデオブロックの第３のサブセットについて空間又は時間予測を実行することを含み、前記空間又は時間予測は、レイヤ間予測を含まないことを特徴とする［１］に記載の方法。
［３］前記第１のビデオブロックに部分的にオーバーラップする前記第２のビデオブロックの前記第２のサブセットについて、前記第２のビデオブロックの前記第２のサブセットのオーバーラップする部分を符号化するために、レイヤ間予測を実行することと、前記第２のビデオブロックの前記第２のサブセットのオーバーラップしない部分を符号化するために、パディング技術を実行することを更に含むことを特徴とする［１］に記載の方法。
［４］前記第１のビデオブロックに部分的にオーバーラップする前記第２のビデオブロックの前記第２のサブセットについて、前記第２のビデオブロックの前記第２のサブセットのオーバーラップする部分を符号化するために、レイヤ間予測を実行することと、前記第２のビデオブロックの前記第２のサブセットのオーバーラップしない部分を符号化するために、ミラーリング技術を実行することを更に含むことを特徴とする［１］に記載の方法。
［５］前記第１のビデオブロックに部分的にオーバーラップする前記第２のビデオブロックの前記第２のサブセットについて、前記第２のビデオブロックの前記第２のサブセットのオーバーラップする部分を符号化するために、レイヤ間予測を実行することと、前記第２のビデオブロックの前記第２のサブセットのオーバーラップしない部分を符号化するために、補間技術を実行することを更に含むことを特徴とする［１］に記載の方法。
［６］前記第１のビデオブロックに部分的にオーバーラップする前記第２のビデオブロックの前記第２のサブセットは、前記拡張レイヤの部分的にオーバーラップするビデオブロックのサブセットを含み、前記方法は、前記部分的にオーバーラップするビデオブロックの各々についてオーバーラップのレベルを決定することと、前記部分的にオーバーラップするビデオブロックの各々について前記決定されたオーバーラップのレベルに基づいて、前記第２のビデオブロックの前記第２のサブセットを定義することを更に含むことを特徴とする［１］に記載の方法。
［７］前記第２のサブセットにおいて定義されず且つオーバーラップの不十分なレベルのためにレイヤ間予測を通して符号化されない、前記部分的にオーバーラップするビデオブロックのいずれについても、空間又は時間予測を実行することを更に含み、前記空間又は時間予測は、レイヤ間予測を含まないことを特徴とする［６］に記載の方法。
［８］符号化（coding）することは、符号化すること（encoding）又は復号化すること（decoding）のいずれかを含むことを特徴とする［１］に記載の方法。
［９］スケーラブルビデオ符号化（ＳＶＣ）スキームに従って情報を符号化する装置において、前記装置は、前記ＳＶＣスキームのベースレイヤにおいて定義された第１のビデオブロックを符号化（coding）し、及び、前記ＳＶＣスキームの拡張レイヤにおいて定義された第２のビデオブロックを符号化する符号化ユニット（coding unit）を含み、前記第２のビデオブロックは、第１のビデオブロックに関係する空間スケーラビリティー拡張を提供するものであり、前記第２のビデオブロックに関して、前記符号化ユニットは、前記第１のビデオブロックに完全にオーバーラップする前記第２のビデオブロックの第１のサブセットについて前記ベースレイヤに関係する前記拡張レイヤをレイヤ間予測することを実行し、及び、前記第１のビデオブロックに部分的にオーバーラップする前記第２のビデオブロックの第２のサブセットについて前記ベースレイヤに関係する前記拡張レイヤをレイヤ間予測することを実行することを特徴とする装置。
［１０］前記第２のビデオブロックに関して、前記符号化ユニットは、前記第１のビデオブロックにオーバーラップしない前記第２のビデオブロックの第３のサブセットについて空間又は時間予測を実行することを含み、前記空間又は時間予測は、レイヤ間予測を含まないことを特徴とする［９］に記載の装置。
［１１］前記符号化ユニットは、前記第１のビデオブロックに部分的にオーバーラップする前記第２のビデオブロックの前記第２のサブセットについて、前記第２のビデオブロックの前記第２のサブセットのオーバーラップする部分を符号化するために、レイヤ間予測を実行し、及び、前記第２のビデオブロックの前記第２のサブセットのオーバーラップしない部分を符号化するために、パディング技術を実行することを特徴とする［９］に記載の装置。
［１２］前記符号化ユニットは、前記第１のビデオブロックに部分的にオーバーラップする前記第２のビデオブロックの前記第２のサブセットについて、前記第２のビデオブロックの前記第２のサブセットのオーバーラップする部分を符号化するために、レイヤ間予測を実行し、及び、前記第２のビデオブロックの前記第２のサブセットのオーバーラップしない部分を符号化するために、ミラーリング技術を実行することを特徴とする［９］に記載の装置。
［１３］前記符号化ユニットは、前記第１のビデオブロックに部分的にオーバーラップする前記第２のビデオブロックの前記第２のサブセットについて、前記第２のビデオブロックの前記第２のサブセットのオーバーラップする部分を符号化するために、レイヤ間予測を実行し、及び、前記第２のビデオブロックの前記第２のサブセットのオーバーラップしない部分を符号化するために、補間技術を実行することを特徴とする［９］に記載の装置。
［１４］前記第１のビデオブロックに部分的にオーバーラップする前記第２のビデオブロックの前記第２のサブセットは、前記拡張レイヤの部分的にオーバーラップするビデオブロックのサブセットを含み、前記符号化ユニットは、前記部分的にオーバーラップするビデオブロックの各々についてオーバーラップのレベルを決定し、及び、前記部分的にオーバーラップするビデオブロックの各々について前記決定されたオーバーラップのレベルに基づいて、前記第２のビデオブロックの前記第２のサブセットを定義することを特徴とする［９］に記載の装置。
［１５］前記第２のサブセットにおいて定義されず且つオーバーラップの不十分なレベルのためにレイヤ間予測を通して符号化されない、前記部分的にオーバーラップするビデオブロックのいずれについても、前記符号化ユニットは、空間又は時間予測を実行することを更に含み、前記空間又は時間予測は、レイヤ間予測を含まないことを特徴とする［１４］に記載の装置。
［１６］符号化ユニット（coding unit）は、符号化ユニット（encoding unit）又は復号化ユニット（decoding unit）のいずれかを含むことを特徴とする［９］に記載の装置。
［１７］前記装置は、回路及び無線通信デバイスのうちの少なくとも一つを含むことを特徴とする［９］に記載の装置。
［１８］ビデオ符号化装置において実行されたときに、該装置に、スケーラブルビデオ符号化（ＳＶＣ）スキームにおける情報を符号化させる（code）インストラクションを含む、コンピュータ読み取り可能な媒体において、前記インストラクションは、前記装置に、前記ＳＶＣスキームのベースレイヤにおいて定義された第１のビデオブロックを符号化（coding）させ、及び、前記ＳＶＣスキームの拡張レイヤにおいて定義された第２のビデオブロックを符号化させるものであり、前記第２のビデオブロックは、第１のビデオブロックに関係する空間スケーラビリティー拡張を提供するものであり、前記第２のビデオブロックに関して、前記インストラクションは、前記装置に、前記第１のビデオブロックに完全にオーバーラップする前記第２のビデオブロックの第１のサブセットについて前記ベースレイヤに関係する前記拡張レイヤをレイヤ間予測することを実行させ、及び、前記第１のビデオブロックに部分的にオーバーラップする前記第２のビデオブロックの第２のサブセットについて前記ベースレイヤに関係する前記拡張レイヤをレイヤ間予測することを実行させるものであることを特徴とするコンピュータ読み取り可能な媒体。
［１９］前記第２のビデオブロックに関して、前記インストラクションは、前記装置に、前記第１のビデオブロックにオーバーラップしない前記第２のビデオブロックの第３のサブセットについて空間又は時間予測を実行させるものであり、前記空間又は時間予測は、レイヤ間予測を含まないことを特徴とする［１８］に記載のコンピュータ読み取り可能な媒体。
［２０］前記第１のビデオブロックに部分的にオーバーラップする前記第２のビデオブロックの前記第２のサブセットについて、前記インストラクションは、前記装置に、前記第２のビデオブロックの前記第２のサブセットのオーバーラップする部分を符号化するために、レイヤ間予測を実行させ、前記第２のビデオブロックの前記第２のサブセットのオーバーラップしない部分を符号化するために、パディング技術を実行させることを特徴とする［１８］に記載のコンピュータ読み取り可能な媒体。
［２１］前記第１のビデオブロックに部分的にオーバーラップする前記第２のビデオブロックの前記第２のサブセットについて、前記インストラクションは、前記装置に、前記第２のビデオブロックの前記第２のサブセットのオーバーラップする部分を符号化するために、レイヤ間予測を実行させ、前記第２のビデオブロックの前記第２のサブセットのオーバーラップしない部分を符号化するために、ミラーリング技術を実行させることを特徴とする［１８］に記載のコンピュータ読み取り可能な媒体。
［２２］前記第１のビデオブロックに部分的にオーバーラップする前記第２のビデオブロックの前記第２のサブセットについて、前記インストラクションは、前記装置に、前記第２のビデオブロックの前記第２のサブセットのオーバーラップする部分を符号化するために、レイヤ間予測を実行させ、前記第２のビデオブロックの前記第２のサブセットのオーバーラップしない部分を符号化するために、補間技術を実行させることを特徴とする［１８］に記載のコンピュータ読み取り可能な媒体。
［２３］前記第１のビデオブロックに部分的にオーバーラップする前記第２のビデオブロックの前記第２のサブセットは、前記拡張レイヤの部分的にオーバーラップするビデオブロックのサブセットを含み、前記インストラクションは、前記装置に、前記部分的にオーバーラップするビデオブロックの各々についてオーバーラップのレベルを決定させ、前記部分的にオーバーラップするビデオブロックの各々について前記決定されたオーバーラップのレベルに基づいて、前記第２のビデオブロックの前記第２のサブセットを定義させ、前記第２のサブセットにおいて定義されず且つオーバーラップの不十分なレベルのためにレイヤ間予測を通して符号化されない、前記部分的にオーバーラップするビデオブロックのいずれについても、前記インストラクションは、前記装置に、空間又は時間予測を実行させ、前記空間又は時間予測は、レイヤ間予測を含まないことを特徴とする［１８］に記載のコンピュータ読み取り可能な媒体。
［２４］スケーラブルビデオ符号化（ＳＶＣ）スキームにおける情報を符号化する装置において、前記装置は、前記ＳＶＣスキームのベースレイヤにおいて定義された第１のビデオブロックを符号化（coding）するための手段と、前記ＳＶＣスキームの拡張レイヤにおいて定義された第２のビデオブロックを符号化するための手段とを含み、前記第２のビデオブロックは、第１のビデオブロックに関係する空間スケーラビリティー拡張を提供するものであり、前記第２のビデオブロックを符号化するための手段は、前記第１のビデオブロックに完全にオーバーラップする前記第２のビデオブロックの第１のサブセットについて前記ベースレイヤに関係する前記拡張レイヤをレイヤ間予測することを実行するための手段と、前記第１のビデオブロックに部分的にオーバーラップする前記第２のビデオブロックの第２のサブセットについて前記ベースレイヤに関係する前記拡張レイヤをレイヤ間予測することを実行するための手段とを含むことを特徴とする装置。
［２５］スケーラブルビデオ符号化（ＳＶＣ）のための方法において、ベースレイヤ・ビデオブロックに部分的にオーバーラップする拡張レイヤ・ビデオブロックを識別することと、ベースレイヤ・ビデオブロックに関係する前記識別された拡張レイヤ・ビデオブロックのうちの少なくとも一部又は全部の部分をインター符号化することを含むことを特徴とする方法。

Claims

スケーラブルビデオ符号化（ＳＶＣ）スキームにおける情報を復号化する方法において、
前記ＳＶＣスキームのベースレイヤにおいて定義された第１のビデオブロックを復号化することと、
前記ＳＶＣスキームの拡張レイヤにおいて定義された第２のビデオブロックを復号化することを含み、
前記第２のビデオブロックは、第１のビデオブロックに関係する空間スケーラビリティー拡張を提供するものであり、
前記第２のビデオブロックを復号化することは、
前記第１のビデオブロックに完全にオーバーラップする前記第２のビデオブロックの第１のサブセットについて前記ベースレイヤに関係する前記拡張レイヤをレイヤ間予測することを実行することと、
前記第２のビデオブロックの第２のサブセットのオーバーラップする部分を復号化するためにレイヤ間予測することを実行することと、ここで、該第２のビデオブロックの該第２のサブセットは、前記第１のビデオブロックに部分的にオーバーラップする、
前記第２のビデオブロックの前記第２のサブセットのオーバーラップしない部分を復号化するために補助的な復号化技術を実行することを含むことを特徴とする方法。
前記第２のビデオブロックを復号化することは、前記第１のビデオブロックにオーバーラップしない前記第２のビデオブロックの第３のサブセットについて空間又は時間予測を実行することを含み、
前記空間又は時間予測は、レイヤ間予測を含まないことを特徴とする請求項１に記載の方法。
前記補助的な復号化技術は、前記第２のビデオブロックの前記第２のサブセットのオーバーラップしない部分を復号化するために、パディング技術を含むことを特徴とする請求項１に記載の方法。
前記補助的な復号化技術は、前記第２のビデオブロックの前記第２のサブセットのオーバーラップしない部分を復号化するために、ミラーリング技術を含むことを特徴とする請求項１に記載の方法。
前記補助的な復号化技術は、前記第２のビデオブロックの前記第２のサブセットのオーバーラップしない部分を復号化するために、補間技術を含むことを特徴とする請求項１に記載の方法。
前記第１のビデオブロックに部分的にオーバーラップする前記第２のビデオブロックの前記第２のサブセットは、前記拡張レイヤの部分的にオーバーラップするビデオブロックのサブセットを含み、
前記方法は、
前記部分的にオーバーラップするビデオブロックの各々についてオーバーラップのレベルを決定することと、
前記部分的にオーバーラップするビデオブロックの各々について前記決定されたオーバーラップのレベルに基づいて、前記第２のビデオブロックの前記第２のサブセットを定義することを更に含むことを特徴とする請求項１に記載の方法。
前記第２のサブセットにおいて定義されず且つオーバーラップの不十分なレベルのためにレイヤ間予測を通して復号化されない、前記部分的にオーバーラップするビデオブロックのいずれについても、空間又は時間予測を実行することを更に含み、
前記空間又は時間予測は、レイヤ間予測を含まないことを特徴とする請求項６に記載の方法。
前記復号化する方法は、符号化すること及び復号化することの両方を実行するプロセスの一部として実行されることを特徴とする請求項１に記載の方法。
スケーラブルビデオ符号化（ＳＶＣ）スキームに従って情報を復号化する装置において、
前記装置は、
前記ＳＶＣスキームのベースレイヤにおいて定義された第１のビデオブロックを復号化し、及び、前記ＳＶＣスキームの拡張レイヤにおいて定義された第２のビデオブロックを復号化する復号化ユニットを含み、
前記第２のビデオブロックは、第１のビデオブロックに関係する空間スケーラビリティー拡張を提供するものであり、
前記第２のビデオブロックに関して、前記復号化ユニットは、
前記第１のビデオブロックに完全にオーバーラップする前記第２のビデオブロックの第１のサブセットについて前記ベースレイヤに関係する前記拡張レイヤをレイヤ間予測することを実行し、
前記第２のビデオブロックの第２のサブセットのオーバーラップする部分を復号化するためにレイヤ間予測することを実行し、ここで、該第２のビデオブロックの該第２のサブセットは、前記第１のビデオブロックに部分的にオーバーラップする、及び、
前記第２のビデオブロックの前記第２のサブセットのオーバーラップしない部分を復号化するために補助的な復号化技術を実行することを特徴とする装置。
前記第２のビデオブロックに関して、前記復号化ユニットは、前記第１のビデオブロックにオーバーラップしない前記第２のビデオブロックの第３のサブセットについて空間又は時間予測を実行することを含み、
前記空間又は時間予測は、レイヤ間予測を含まないことを特徴とする請求項９に記載の装置。
前記補助的な復号化技術は、前記第２のビデオブロックの前記第２のサブセットのオーバーラップしない部分を復号化するために、パディング技術を含むことを特徴とする請求項９に記載の装置。
前記補助的な復号化技術は、前記第２のビデオブロックの前記第２のサブセットのオーバーラップしない部分を復号化するために、ミラーリング技術を含むことを特徴とする請求項９に記載の装置。
前記補助的な復号化技術は、前記第２のビデオブロックの前記第２のサブセットのオーバーラップしない部分を復号化するために、補間技術を含むことを特徴とする請求項９に記載の装置。
前記第１のビデオブロックに部分的にオーバーラップする前記第２のビデオブロックの前記第２のサブセットは、前記拡張レイヤの部分的にオーバーラップするビデオブロックのサブセットを含み、
前記復号化ユニットは、
前記部分的にオーバーラップするビデオブロックの各々についてオーバーラップのレベルを決定し、及び、
前記部分的にオーバーラップするビデオブロックの各々について前記決定されたオーバーラップのレベルに基づいて、前記第２のビデオブロックの前記第２のサブセットを定義することを特徴とする請求項９に記載の装置。
前記第２のサブセットにおいて定義されず且つオーバーラップの不十分なレベルのためにレイヤ間予測を通して復号化されない、前記部分的にオーバーラップするビデオブロックのいずれについても、前記復号化ユニットは、空間又は時間予測を実行することを更に含み、
前記空間又は時間予測は、レイヤ間予測を含まないことを特徴とする請求項１４に記載の装置。
前記復号化ユニットは、符号化及び復号化の両方を実行するプロセスの一部として復号化を実行することを特徴とする請求項９に記載の装置。
前記装置は、無線通信デバイスを含むことを特徴とする請求項９に記載の装置。
ビデオ復号化装置において実行されたときに、該装置に、スケーラブルビデオ符号化（ＳＶＣ）スキームにおける情報を復号化させるインストラクションを含む、コンピュータ読み取り可能な媒体において、
前記インストラクションは、前記装置に、
前記ＳＶＣスキームのベースレイヤにおいて定義された第１のビデオブロックを復号化させ、及び、
前記ＳＶＣスキームの拡張レイヤにおいて定義された第２のビデオブロックを復号化させるものであり、
前記第２のビデオブロックは、第１のビデオブロックに関係する空間スケーラビリティー拡張を提供するものであり、
前記第２のビデオブロックに関して、前記インストラクションは、前記装置に、
前記第１のビデオブロックに完全にオーバーラップする前記第２のビデオブロックの第１のサブセットについて前記ベースレイヤに関係する前記拡張レイヤをレイヤ間予測することを実行させ、
前記第２のビデオブロックの第２のサブセットのオーバーラップする部分を復号化するためにレイヤ間予測することを実行させ、ここで、該第２のビデオブロックの該第２のサブセットは、前記第１のビデオブロックに部分的にオーバーラップする、及び
前記第２のビデオブロックの前記第２のサブセットのオーバーラップしない部分を復号化するために補助的な復号化技術を実行させるものであることを特徴とするコンピュータ読み取り可能な媒体。
前記第２のビデオブロックに関して、前記インストラクションは、前記装置に、前記第１のビデオブロックにオーバーラップしない前記第２のビデオブロックの第３のサブセットについて空間又は時間予測を実行させるものであり、
前記空間又は時間予測は、レイヤ間予測を含まないことを特徴とする請求項１８に記載のコンピュータ読み取り可能な媒体。
前記補助的な復号化技術は、前記第２のビデオブロックの前記第２のサブセットのオーバーラップしない部分を復号化するために、パディング技術を含むことを特徴とする請求項１８に記載のコンピュータ読み取り可能な媒体。
前記補助的な復号化技術は、前記第２のビデオブロックの前記第２のサブセットのオーバーラップしない部分を復号化するために、ミラーリング技術を含むことを特徴とする請求項１８に記載のコンピュータ読み取り可能な媒体。
前記補助的な復号化技術は、前記第２のビデオブロックの前記第２のサブセットのオーバーラップしない部分を復号化するために、補間技術を含むことを特徴とする請求項１８に記載のコンピュータ読み取り可能な媒体。
前記第１のビデオブロックに部分的にオーバーラップする前記第２のビデオブロックの前記第２のサブセットは、前記拡張レイヤの部分的にオーバーラップするビデオブロックのサブセットを含み、
前記インストラクションは、前記装置に、
前記部分的にオーバーラップするビデオブロックの各々についてオーバーラップのレベルを決定させ、
前記部分的にオーバーラップするビデオブロックの各々について前記決定されたオーバーラップのレベルに基づいて、前記第２のビデオブロックの前記第２のサブセットを定義させ、
前記第２のサブセットにおいて定義されず且つオーバーラップの不十分なレベルのためにレイヤ間予測を通して復号化されない、前記部分的にオーバーラップするビデオブロックのいずれについても、前記インストラクションは、前記装置に、空間又は時間予測を実行させ、
前記空間又は時間予測は、レイヤ間予測を含まないことを特徴とする請求項１８に記載のコンピュータ読み取り可能な媒体。
スケーラブルビデオ符号化（ＳＶＣ）スキームにおける情報を復号化する装置において、
前記装置は、
前記ＳＶＣスキームのベースレイヤにおいて定義された第１のビデオブロックを復号化するための手段と、
前記ＳＶＣスキームの拡張レイヤにおいて定義された第２のビデオブロックを復号化するための手段とを含み、
前記第２のビデオブロックは、第１のビデオブロックに関係する空間スケーラビリティー拡張を提供するものであり、
前記第２のビデオブロックを復号化するための手段は、
前記第１のビデオブロックに完全にオーバーラップする前記第２のビデオブロックの第１のサブセットについて前記ベースレイヤに関係する前記拡張レイヤをレイヤ間予測することを実行するための手段と、
前記第２のビデオブロックの第２のサブセットのオーバーラップする部分を復号化するためにレイヤ間予測することを実行するための手段と、ここで、該第２のビデオブロックの該第２のサブセットは、前記第１のビデオブロックに部分的にオーバーラップする、
前記第２のビデオブロックの前記第２のサブセットのオーバーラップしない部分を復号化するために補助的な復号化技術を実行するための手段とを含むことを特徴とする装置。
スケーラブルビデオ符号化（ＳＶＣ）のための方法において、
ベースレイヤ・ビデオブロックに部分的にオーバーラップする拡張レイヤ・ビデオブロックを識別することと、
ベースレイヤ・ビデオブロックに関係する前記識別された拡張レイヤ・ビデオブロックのうちの少なくとも一部又は全部の部分をレイヤ間復号化することと、
前記識別された拡張レイヤ・ビデオブロックのオーバーラップしない部分を復号化するために補助的な復号化技術を実行することを含むことを特徴とする方法。