これ以降、例示的な実施形態の詳細な説明について、様々な図面を参照して説明される。この説明は、とり得る実施態様の詳細な例を提供するが、詳細は例示的であることが意図されており、本出願の範囲を限定しないことに留意されたい。本明細書において使用されるように、さらなる修飾または特徴付けのない冠詞「a」および「an」は、たとえば、「1つ以上(one or more)」または「少なくとも1つ(at least one)」を意味するものと理解されてもよい。
図1Aは、1つまたは複数の開示される実施形態を実施することができる例示的な通信システム100を示す図である。通信システム100は、音声、データ、ビデオ、メッセージング、ブロードキャストなどのコンテンツを、複数の無線ユーザに提供する多重アクセスシステムであってもよい。通信システム100は、複数の無線ユーザが、無線帯域幅を含むシステムリソースの共用を通じて、そのようなコンテンツにアクセスすることを可能にする。たとえば、通信システム100は、符号分割多元接続(CDMA)、時分割多元接続(TDMA)、周波数分割多元接続(FDMA)、直交FDMA(OFDMA)、およびシングルキャリアFDMA(SC−FDMA)などの、1つまたは複数のチャネルアクセス方法を採用してもよい。
図1Aにおいて示されるように、通信システム100は、無線送信/受信ユニット(WTRU)102a、102b、102c、および/または102d(総称してWTRU102と称されてもよい)、無線アクセスネットワーク(RAN)103/104/105、コアネットワーク106/107/109、公衆交換電話網(PSTN)108、インターネット110、およびその他のネットワーク112を含んでもよいが、開示される実施形態は、任意の数のWTRU、基地局、ネットワーク、および/またはネットワーク要素を考慮していることが理解されるであろう。WTRU102a、102b、102c、102dは各々、無線環境において動作および/または通信するように構成された任意のタイプのデバイスであってもよい。一例として、WTRU102a、102b、102c、102dは、無線信号を送信および/または受信するように構成されてもよく、ユーザ機器(UE)、移動局、固定または移動加入者ユニット、ページャ、携帯電話、携帯情報端末(PDA)、スマートフォン、ラップトップ、ネットブック、パーソナルコンピュータ、無線センサー、および家庭用電化製品などを含んでもよい。
通信システム100はまた、基地局114aおよび基地局114bを含んでもよい。基地局114a、114bはそれぞれ、WTRU102a、102b、102c、102dのうちの少なくとも1つと無線でインタフェースして、コアネットワーク106/107/109、インターネット110、および/またはネットワーク112などの1つまたは複数の通信ネットワークへのアクセスを容易にするように構成された任意のタイプのデバイスであってもよい。一例として、基地局114a、114bは、ベーストランシーバステーション(BTS)、NodeB、eNodeB、ホームNodeB、ホームeNodeB、サイトコントローラ、アクセスポイント(AP)、および無線ルータなどであってもよい。基地局114a、114bはそれぞれ単一の要素として示されるが、基地局114a、114bは、任意の数の相互接続された基地局および/またはネットワーク要素を含んでもよいことが理解されよう。
基地局114aは、基地局コントローラ(BSC)、無線ネットワークコントローラ(RNC)、中継ノードなどのその他の基地局および/またはネットワーク要素(図示せず)を含むこともできる、RAN103/104/105の一部であってもよい。基地局114aおよび/または基地局114bは、セル(図示せず)と称されてもよい特定の地理的領域内で無線信号を送信および/または受信するように構成されてもよい。セルは、セルセクタにさらに分割されてもよい。たとえば、基地局114aに関連付けられているセルは、3つのセクタに分割されてもよい。したがって、1つの実施形態において、基地局114aは、3つの送受信機、すなわちセルのセクタごとに1つの送受信機を含んでもよい。別の実施形態において、基地局114aは、多入力多出力(MIMO)技術を採用してもよく、したがって、セルの各セクタに対して複数の送受信機を利用することができる。
基地局114a、114bは、任意の適切な無線通信リンク(たとえば、無線周波数(RF)、マイクロ波、赤外線(IR)、紫外線(UV)、可視光線など)とすることができる、エアインタフェース115/116/117上で、WTRU102a、102b、102c、102dのうちの1つまたは複数と通信してもよい。エアインタフェース115/116/117は、任意の適切な無線アクセス技術(RAT)を使用して確立されてもよい。
特に、上述したように、通信システム100は、多元接続システムであってもよく、ならびに、CDMA、TDMA、FDMA、OFDMA、およびSC−FDMAなどの、1つまたは複数のチャネルアクセス方式を採用してもよい。たとえば、RAN103/104/105における基地局114aおよびWTRU102a、102b、102cは、広帯域CDMA(WCDMA:登録商標)を使用して、エアインタフェース115/116/117を確立することができるユニバーサルモバイルテレコミュニケーションシステム(UMTS)地上波無線アクセス(UTRA)などの無線技術を実装してもよい。WCDMAは、高速パケットアクセス(HSPA)および/または進化型HSPA(HSPA+)などの通信プロトコルを含んでもよい。HSPAは、高速ダウンリンクパケットアクセス(HSDPA)および/または高速アップリンクパケットアクセス(HSUPA)を含んでもよい。
別の実施形態において、基地局114aおよびWTRU102a、102b、102cは、ロングタームエボリューション(LTE)および/またはLTE−Advanced(LTE−A)を使用して、エアインタフェース115/116/117を確立することができる進化型UMTS地上波無線アクセス(E−UTRA)などの無線技術を実装してもよい。
別の実施形態において、基地局114aおよびWTRU102a、102b、102cは、IEEE802.16(すなわち、Worldwide Interoperability for Microwave Access(WiMAX))、CDMA2000、CDMA2000 1X、CDMA2000 EV−DO、Interim Standard 2000(IS−2000)、Interim Standard 95(IS−95)、Interim Standard 856(IS−856)、Global System for Mobile communications(GSM:登録商標)、Enhanced Data rates for GSM Evolution(EDGE)、GSM EDGE(GERAN)などの無線技術を実装してもよい。
図1Aにおける基地局114bは、たとえば、無線ルータ、ホームNodeB、ホームeNodeB、またはアクセスポイントであってもよく、ならびに、事業所、家庭、車両、およびキャンパスなどの局在的な領域において無線接続を容易にするために、任意の適切なRATを利用してもよい。1つの実施形態において、基地局114bおよびWTRU102c、102dは、IEEE802.11などの無線技術を実装して、無線ローカルエリアネットワーク(WLAN)を確立してもよい。別の実施形態において、基地局114bおよびWTRU102c、102dは、IEEE802.15などの無線技術を実装して、無線パーソナルエリアネットワーク(WPAN)を確立してもよい。さらなる別の実施形態において、基地局114bおよびWTRU102c、102dは、セルラーベースのRAT(たとえばWCDMA、CDMA2000、GSM、LTE、LTE−Aなど)を利用して、ピコセルまたはフェムトセルを確立してもよい。図1Aにおいて示されるように、基地局114bは、インターネット110への直接接続を有してもよい。したがって、基地局114bが、コアネットワーク106/107/109を介してインターネット110にアクセスすることを要求されない。
RAN103/104/105は、音声、データ、アプリケーション、および/またはボイスオーバーインターネットプロトコル(VoIP)サービスを、WTRU102a、102b、102c、102dのうちの1つまたは複数に提供するように構成された任意のタイプのネットワークとすることができる、コアネットワーク106/107/109と通信してもよい。たとえば、コアネットワーク106/107/109は、コール制御、課金サービス、モバイルロケーションベースのサービス、プリペイドコール、インターネット接続、ビデオ配信などを提供し、および/または、ユーザ認証などの高レベルのセキュリティ機能を実行してもよい。図1Aにおいて示されていないが、RAN103/104/105および/またはコアネットワーク106/107/109が、RAN103/104/105と同一のRATまたは異なるRATを採用するその他のRANと直接または間接的に通信してもよいことが理解されよう。たとえば、E−UTRA無線技術を使用しているRAN103/104/105に接続されていることに加えて、コアネットワーク106/107/109はまた、GSM無線技術を採用する別のRAN(図示せず)と通信してもよい。
コアネットワーク106/107/109はまた、WTRU102a、102b、102c、102dのゲートウェイとしてサービスして、PSTN108、インターネット110、および/またはその他のネットワーク112にアクセスしてもよい。PSTN108は、従来のアナログ電話回線サービス(POTS)を提供する回線交換電話ネットワークを含んでもよい。インターネット110は、TCP/IPインターネットプロトコルスイートにおける伝送制御プロトコル(TCP)、ユーザデータグラムプロトコル(UDP)、およびインターネットプロトコル(IP)などの、共通通信プロトコルを使用する、相互接続されたコンピュータネットワークおよびデバイスのグローバルシステムを含んでもよい。ネットワーク112は、その他のサービスプロバイダによって所有および/または運用される有線または無線の通信ネットワークを含んでもよい。たとえば、ネットワーク112は、RAN103/104/105と同一のRATまたは異なるRATを採用することができる、1つまたは複数のRANに接続された別のコアネットワークを含んでもよい。
通信システム100におけるWTRU102a、102b、102c、102dの1つもしくは複数または全部は、マルチモード機能を含んでもよく、すなわち、WTRU102a、102b、102c、102dは様々な無線リンク上で様々な無線ネットワークと通信するための複数の送受信機を含んでもよい。たとえば、図1Aに示されるWTRU102cは、セルラベースの無線技術を採用することができる基地局114a、および、IEEE802無線技術を採用することができる基地局114bと通信するように構成されてもよい。
図1Bは、例示的なWTRU102を示すシステム図である。図1Bにおいて示されるように、WTRU102は、プロセッサ118、送受信機120、送信/受信要素122、スピーカ/マイクロフォン124、キーパッド126、ディスプレイ/タッチパッド128、着脱不能メモリ130、着脱可能メモリ132、電源134、全地球測位システム(GPS)チップセット136、およびその他の周辺機器138を含んでもよい。WTRU102が、実施形態との整合性を維持しながら前述の要素の任意の部分的組み合わせを含んでもよいことが理解されよう。また実施形態は、基地局114aおよび114b、および/または、特にこれらに限定されないが、無線基地局(BTS)、NodeB、サイトコントローラ、アクセスポイント(AP)、ホームNodeB、進化型NodeB(eNodeB)、ホーム進化型NodeB(HeNB)、ホーム進化型NodeBゲートウェイ、およびプロキシノードなどの、基地局114aおよび114bを表すノードが、図1Bに示され、ならびに、本明細書において説明される要素の1つもしくは複数、または全部を含んでもよいことを意図する。
プロセッサ118は、汎用プロセッサ、特殊用途プロセッサ、従来型プロセッサ、デジタルシグナルプロセッサ(DSP)、複数のマイクロプロセッサ、DSPコアと関連する1つまたは複数のマイクロプロセッサ、コントローラ、マイクロコントローラ、特殊用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)回路、任意の別のタイプの集積回路(IC)、および状態機械などであってもよい。プロセッサ118は、信号符号化、データ処理、電力制御、入出力処理、および/またはWTRU102が無線環境で動作することを可能にする任意の他の機能を実行してもよい。プロセッサ118は、送信/受信要素122に結合することができる送受信機120に結合されてもよい。図1Bはプロセッサ118および送受信機120を別個のコンポーネントとして示すが、プロセッサ118および送受信機120が電子パッケージまたはチップに統合されてもよいことが理解されよう。
送信/受信要素122は、エアインタフェース115/116/117上で基地局(たとえば、基地局114a)に信号を送信し、または、基地局から信号を受信するように構成されてもよい。たとえば、1つの実施形態において、送信/受信要素122は、RF信号を送信および/または受信するように構成されたアンテナであってもよい。別の実施形態において、送信/受信要素122は、たとえば、IR、UV、または可視光信号を送信および/または受信するように構成されたエミッタ/ディテクタであってもよい。さらなる別の実施形態において、送信/受信要素122は、RF信号および光信号を送信および受信するように構成されてもよい。送信/受信要素122は、無線信号の任意の組み合わせを送信および/または受信するように構成されてもよいことが理解されよう。
加えて、図1Bにおいて、送信/受信要素122は単一の要素として示されるが、WTRU102は任意の数の送信/受信要素122を含んでもよい。特に、WTRU102は、MIMO技術を採用してもよい。したがって、1つの実施形態において、WTRU102は、エアインタフェース115/116/117上で無線信号を送信および受信するための2つ以上の送信/受信要素122(たとえば、複数のアンテナ)を含んでもよい。
送受信機120は、送信/受信要素122によって送信されることになる信号を変調し、および、送信/受信要素122によって受信される信号を復調するように構成されてもよい。上述したように、WTRU102は、マルチモード機能を有してもよい。したがって、送受信機120は、WTRU102が、たとえばUTRAおよびIEEE802.11などの複数のRATを介して通信することを可能にする複数の送受信機を含んでもよい。
WTRU102のプロセッサ118は、スピーカ/マイクロフォン124、キーパッド126、および/またはディスプレイ/タッチパッド128(たとえば、液晶ディスプレイ(LCD)ディスプレイユニット、または有機発光ダイオード(OLED)ディスプレイユニット)に結合されてもよく、ならびに、これらの機器からユーザ入力データを受信してもよい。プロセッサ118はまた、スピーカ/マイクロフォン124、キーパッド126、および/またはディスプレイ/タッチパッド128にユーザデータを出力してもよい。加えて、プロセッサ118は、着脱不能メモリ130および/または着脱可能メモリ132などの任意のタイプの適切なメモリから情報にアクセスし、ならびに、それらにデータを格納してもよい。着脱不能メモリ130は、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、ハードディスク、または任意のタイプのメモリストレージデバイスを含むことができる。着脱可能メモリ132は、加入者識別モジュール(SIM)カード、メモリスティック、セキュアデジタル(SD)メモリカードなどを含んでもよい。その他の実施形態において、プロセッサ118は、サーバ上、またはホームコンピュータ(図示せず)上などの、WTRU102に物理的に位置していないメモリから情報にアクセスし、および、そのようなメモリにデータを格納してもよい。
プロセッサ118は、電源134から電力を受信してもよく、および、WTRU102におけるその他のコンポーネントに電力を配信および/または制御するように構成されてもよい。電源134は、WTRU102に電力を供給するための任意の適切なデバイスであってもよい。たとえば、電源134は、1つまたは複数の乾電池(たとえば、ニッケルカドミウム(NiCd)、ニッケル亜鉛(NiZn)、ニッケル水素(NiMH)、リチウムイオン(Li−ion)など)、太陽電池、燃料電池などを含んでもよい。
プロセッサ118はまた、WTRU102の現在位置に関するロケーション情報(たとえば、緯度および経度)を提供するように構成することができる、GPSチップセット136に結合されてもよい。GPSチップセット136からの情報に加えて、またはその情報の代わりに、WTRU102は、基地局(たとえば、基地局114a、114b)からエアインタフェース115/116/117上でロケーション情報を受信してもよく、および/または、2つ以上の近隣の基地局から受信されている信号のタイミングに基づいてその位置を判定してもよい。WTRU102が、実施形態との整合性を維持しながら、任意の適切な位置判定の方法によってロケーション情報を取得してもよいことが理解されよう。
プロセッサ118はさらに、追加の特徴、機能、および/または有線もしくは無線接続を提供する1つまたは複数のソフトウェアおよび/またはハードウェアモジュールを含むことができる、その他の周辺機器138に結合されてもよい。たとえば、周辺機器138は、加速度計、電子コンパス、衛星送受信機、デジタルカメラ(写真またはビデオ用)、ユニバーサルシリアルバス(USB)ポート、振動装置、テレビ送受信機、ハンドフリーヘッドセット、Bluetooth(登録商標)モジュール、周波数変調(FM)無線装置、デジタル音楽プレイヤー、メディアプレイヤー、テレビゲームプレイヤーモジュール、およびインターネットブラウザなどを含んでもよい。
図1Cは、1つの実施形態に従ったRAN103およびコアネットワーク106のシステム図である。上述したように、RAN103は、UTRA無線技術を採用して、エアインタフェース115上でWTRU102a、102b、102cと通信してもよい。RAN103はまた、コアネットワーク106と通信してもよい。図1Cに示されるように、RAN103は、各々が、エアインタフェース115上でWTRU102a、102b、102cと通信するための1つまたは複数の送受信機を含むことができる、NodeB140a、140b、140cを含んでもよい。NodeB140a、140b、140cは、RAN103における特定のセル(図示せず)にそれぞれ関連付けられてもよい。RAN103はまた、RNC142a、142bを含んでもよい。RAN103が、実施形態との整合性を維持しながら、任意の数のNode−BおよびRNCを含んでもよいことが理解されよう。
図1Cに示すように、NodeB140a、140bは、RNC142aと通信してもよい。加えて、Node−B140cは、RNC142bと通信してもよい。NodeB140a、140b、140cは、Iubインタフェースを介してそれぞれRNC142a、142bと通信してもよい。RNC142a、142bは、Iurインタフェースを介して相互に通信してもよい。RNC142a、142bは各々、それぞれ接続されているNodeB140a、140b、140cを制御するように構成されてもよい。加えて、RNC142a、142bは各々、アウターループ電力制御、負荷制御、アドミッション制御、パケットスケジューリング、ハンドオーバ制御、マクロダイバーシティ、セキュリティ機能、およびデータ暗号化などの、その他の機能を実行またはサポートするように構成されてもよい。
図1Cに示されるコアネットワーク106は、メディアゲートウェイ(MGW)144、モバイルスイッチングセンタ(MSC)146、サービングGPRSサポートノード(SGSN)148、および/またはゲートウェイGPRSサポートノード(GGSN)150を含んでもよい。前述の要素は各々、コアネットワーク106の一部として示されているが、それらの要素のうちのいずれかがコアネットワークオペレータ以外のエンティティによって所有および/または運用されてもよいことが理解されよう。
RAN103におけるRNC142aは、コアネットワーク106におけるMSC146にIuCSインタフェースを介して接続されてもよい。MSC146は、MGW144に接続されてもよい。MSC146およびMGW144は、PSTN108などの回線交換ネットワークへのアクセスをWTRU102a、102b、102cに提供して、WTRU102a、102b、102cと従来の地上通信線通信デバイスとの間の通信を容易にしてもよい。
RAN103におけるRNC142aはまた、IuPSインタフェースを介してコアネットワーク106におけるSGSN148に接続されてもよい。SGSN148は、GGSN150に接続されてもよい。SGSN148およびGGSN150は、インターネット110などのパケット交換ネットワークへのアクセスをWTRU102a、102b、102cに提供して、WTRU102a、102b、102cとIP対応のデバイスとの間の通信を容易にしてもよい。
上述したように、コアネットワーク106はまた、その他のサービスプロバイダによって所有および/または運用される他の有線または無線ネットワークを含むことができる、ネットワーク112に接続されてもよい。
図1Dは、1つの実施形態に従ったRAN104およびコアネットワーク107のシステム図である。上述したように、RAN104は、E−UTRA無線技術を採用して、エアインタフェース116上でWTRU102a、102b、102cと通信してもよい。RAN104はまた、コアネットワーク107と通信してもよい。
RAN104はeNodeB160a、160b、160cを含んでもよいが、実施形態との整合性を維持しながら、RAN104は任意の数のeNodeBを含んでもよいことが理解されよう。eNodeB160a、160b、160cは各々、エアインタフェース116上でWTRU102a、102b、102cと通信するための1つまたは複数の送受信機を含んでもよい。1つの実施形態において、eNodeB160a、160b、160cはMIMO技術を実装してもよい。したがって、たとえば、eNodeB160aは、複数のアンテナを使用して、WTRU102aに無線信号を送信し、および、WTRU102aから無線信号を受信してもよい。
eNodeB160a、160b、160cは各々、特定のセル(図示せず)に関連付けられてもよく、ならびに、無線リソース管理決定、ハンドオーバ決定、およびアップリンクおよび/またはダウンリンクにおけるユーザのスケジューリングなどを処理するように構成されてもよい。図1Dに示されるように、eNodeB160a、160b、160cは、X2インタフェース上で相互に通信してもよい。
図1Dに示されるコアネットワーク107は、モビリティ管理ゲートウェイ(MME)162、サービングゲートウェイ164、およびパケットデータネットワーク(PDN)ゲートウェイ166を含んでもよい。前述の要素は各々、コアネットワーク107の一部として示されているが、それらの要素のうちのいずれかがコアネットワークオペレータ以外のエンティティによって所有および/または運用されてもよいことが理解されよう。
MME162は、S1インタフェースを介してRAN104におけるeNodeB160a、160b、160cの各々に接続されてもよく、ならびに、制御ノードとしてサービスしてもよい。たとえば、MME162は、WTRU102a、102b、102cのユーザを認証すること、ベアラのアクティブ化/非アクティブ化、ならびに、WTRU102a、102b、102cの初期接続中に特定のサービングゲートウェイを選択することなどを担当してもよい。MME162はまた、RAN104と、GSMまたはWCDMAなどの他の無線技術を採用するその他のRAN(図示せず)とを切り替えるための制御プレーン機能を提供してもよい。
サービングゲートウェイ164は、S1インタフェースを介してRAN104におけるeNodeB160a、160b、160cの各々に接続されてもよい。サービングゲートウェイ164は一般に、ユーザデータパケットを、WTRU102a、102b、102cとの間でルーティングおよび転送してもよい。サービングゲートウェイ164はまた、eNodeB間ハンドオーバの間にユーザプレーンをアンカリングすること、ダウンリンクデータがWTRU102a、102b、102cに使用可能なときにページングをトリガすること、ならびに、WTRU102a、102b、102cのコンテキストを管理および格納することなどのその他の機能を実行してもよい。
サービングゲートウェイ164はまた、インターネット110などのパケット交換ネットワークへのアクセスをWTRU102a、102b、102cに提供して、WTRU102a、102b、102cとIP対応のデバイスとの間の通信を容易にすることができる、PDNゲートウェイ166に接続されてもよい。
コアネットワーク107は、その他のネットワークとの通信を容易にしてもよい。たとえば、コアネットワーク107は、PSTN108などの回線交換ネットワークへのアクセスをWTRU102a、102b、102cに提供して、WTRU102a、102b、102cと従来の地上通信線通信デバイスとの間の通信を容易にしてもよい。たとえば、コアネットワーク107は、コアネットワーク107とPSTN108との間のインタフェースとしてサービスするIPゲートウェイ(たとえば、IPマルチメディアサブシステム(IMS)サーバ)を含んでもよく、または、当該IPゲートウェイと通信してもよい。加えて、コアネットワーク107は、その他のサービスプロバイダによって所有および/または運用される他の有線または無線ネットワークを含むことができる、ネットワーク112へのアクセスをWTRU102a、102b、102cに提供してもよい。
図1Eは、1つの実施形態に従ったRAN105およびコアネットワーク109のシステム図である。RAN105は、IEEE802.16無線技術を採用して、エアインタフェース117を介してWTRU102a、102b、102cと通信することができる、アクセスサービスネットワーク(ASN)であってもよい。以下でさらに説明されるように、WTRU102a、102b、102c、RAN105、およびコアネットワーク109の様々な機能エンティティの間の通信リンクは、参照ポイントとして定義されてもよい。
図1Eに示されるように、RAN105は、基地局180a、180b、180c、およびASNゲートウェイ182を含んでもよいが、実施形態との整合性を維持しながら、RAN105は、任意の数の基地局およびASNゲートウェイを含んでもよいことが理解されよう。基地局180a、180b、180cは各々、RAN105における特定のセル(図示せず)に関連付けられてもよく、ならびに、エアインタフェース117上でWTRU102a、102b、102cと通信するための1つまたは複数の送受信機を含んでもよい。1つの実施形態において、基地局180a、180b、180cは、MIMO技術を実装してもよい。したがって、たとえば、基地局180aは、複数のアンテナを使用して、WTRU102aに無線信号を送信し、および、WTRU102aから無線信号を受信してもよい。基地局180a、180b、180cはまた、ハンドオフトリガリング、トンネル確立、無線リソース管理、トラフィック分類、およびサービス品質(QoS)ポリシー実施などの、モビリティ管理機能を提供してもよい。ASNゲートウェイ182は、トラフィックアグリゲーションポイントとしてサービスしてもよく、および、ページング、加入者プロファイルのキャッシ、およびコアネットワーク109へのルーティングなどを担当してもよい。
WTRU102a、102b、102cとRAN105との間のエアインタフェース117は、IEEE802.16仕様を実装する、R1参照ポイントとして定義されてもよい。加えて、WTRU102a、102b、102cの各々は、コアネットワーク109との論理インタフェース(図示せず)を確立してもよい。WTRU102a、102b、102cとコアネットワーク109との間の論理インタフェースは、認証、承認、IPホスト構成管理、および/またはモビリティ管理に使用することができる、R2参照ポイントとして定義されてもよい。
基地局180a、180b、180cの各々の間の通信リンクは、WTRUハンドオーバおよび基地局間のデータの転送を容易にするためのプロトコルを含む、R8参照ポイントとして定義されてもよい。基地局180a、180b、180cとASNゲートウェイ182との間の通信リンクは、R6参照ポイントとして定義されてもよい。R6参照ポイントは、WTRU102a、102b、102cの各々に関連付けられているモビリティイベントに基づいて、モビリティ管理を容易にするためのプロトコルを含んでもよい。
図1Eに示されるように、RAN105は、コアネットワーク109に接続されてもよい。RAN105とコアネットワーク109との間の通信リンクは、たとえば、データ転送およびモビリティ管理機能を容易にするためのプロトコルを含む、R3参照ポイントとして定義されてもよい。コアネットワーク109は、モバイルIPホームエージェント(MIP−HA)184、認証、承認、アカウンティング(AAA)サーバ186、およびゲートウェイ188を含んでもよい。前述の要素の各々は、コアネットワーク109の一部として示されているが、それらの要素のうちのいずれかがコアネットワークオペレータ以外のエンティティによって所有および/または運用されてもよいことが理解されよう。
MIP−HAは、IPアドレス管理を担当してもよく、ならびに、WTRU102a、102b、102cが様々なASNおよび/または様々なコアネットワークの間でローミング可能にしてもよい。MIP−HA184は、インターネット110などのパケット交換ネットワークへのアクセスをWTRU102a、102b、102cに提供して、WTRU102a、102b、102cとIP対応のデバイスとの間の通信を容易にしてもよい。AAAサーバ186は、ユーザ認証およびユーザサービスのサポートを担当してもよい。ゲートウェイ188は、その他のネットワークとの相互作用を容易にしてもよい。たとえば、ゲートウェイ188は、PSTN108などの回線交換ネットワークへのアクセスをWTRU102a、102b、102cに提供して、WTRU102a、102b、102cと従来の地上通信線通信デバイスとの間の通信を容易にしてもよい。加えて、ゲートウェイ188は、その他のサービスプロバイダによって所有および/または運用される他の有線または無線ネットワークを含むことができる、ネットワーク112へのアクセスをWTRU102a、102b、102cに提供してもよい。
図1Eには示されていないが、RAN105がその他のASNに接続されてもよく、および、コアネットワーク109がその他のコアネットワークに接続されてもよいことが理解されるであろう。RAN105とその他のASNとの間の通信リンクは、RAN105とその他のASNとの間でWTRU102a、102b、102cのモビリティを調整するためのプロトコルを含むことができる、R4参照ポイントとして定義されてもよい。コアネットワーク109とその他のコアネットワークとの間の通信リンクは、ホームコアネットワークとアクセス先コアネットワークとの間の相互作用を容易にするためのプロトコルを含むことができる、R5参照ポイントとして定義されてもよい。
実施形態は、衛星、ケーブル、および/または地上波送信チャネル上でのデジタルビデオサービスと比較して、ビデオチャット、モバイルビデオ、およびストリーミングビデオなどのさらに多くのその他のビデオアプリケーションが、クライアント側およびネットワーク側で異機種環境(heterogeneous)とすることができる環境において採用されてもよいことを理解する。たとえば、スマートフォン、タブレット、およびTVの3つのスクリーンが、クライアント側を支配する(dominate)ことがあるが、ビデオはインターネット、モバイルネットワーク、および/またはその両方の組み合わせにわたって送信されてもよい。サービスのユーザ経験および/またはビデオ品質を向上させるため、スケーラブルビデオコーディングが使用されてもよい。スケーラブルビデオコーディングは、信号を高く(たとえば、「最高の」解像度で)1回エンコードし、および/または、他の要因の中で、クライアントデバイスによってサポートすることができる特定のアプリケーションによって要求される固有のレートおよび解像度に応じて、ストリームのサブセットからデコーディングすることを可能にしてもよい。実施形態は、国際ビデオ規格MPEG−2 Video、H.263、MPEG4 Visual、およびH.264が、スケーラビリティモードをサポートするツールおよび/またはプロファイルを有していることを認識している。
図2は、汎用ブロックベースのハイブリッドスケーラブルビデオエンコーディングシステムの例示的なブロック図である。レイヤ0(基本レイヤ)によって表されることになる空間/時間信号解像度は、入力ビデオ信号をダウンサンプリングすることによって、最初に生成されてもよい。後続のエンコーディングステージにおいて、量子化器(Q0)の適切な設定は、基本情報(たとえば、ビデオ信号)の特定の品質レベルをもたらしてもよい。基本レイヤ再構築Y0は、上位レイヤ解像度レベルの1つもしくは複数、または全部の近似であってもよく、ならびに、後続のレイヤのエンコーディングおよび/またはデコーディングに使用することができる。アップサンプリングユニットは、上位レイヤの1つもしくは複数、またはいずれかにおける解像度と一致するように、基本レイヤ再構築信号のアップサンプリングを実行してもよい。ダウンサンプリングおよびアップサンプリングは、レイヤの1つもしくは複数、または全部(たとえば、0、1、2、...N)を通じて実行されてもよいが、ダウンサンプリングおよび/またはアップサンプリングレートは、他の要因の中で、様々なレイヤにおけるビデオ信号の相対的な大きさ(dimension)に応じて、異なっていてもよい。たとえば、レイヤn(0<=n<=N)のデコーディング能力を有することができる端末デバイスに対して、レイヤ0からレイヤnへのビットストリームのサブセット(または一部の実施形態において、そのようなサブセットのみ)は、その端末デバイスに送信されてもよい。上位レイヤ(たとえば、n+1、...N)のサブストリームは、他の理由の中で、帯域幅を節約するため、送信されることなく、廃棄されてもよい。2つの層、n1およびn2によって表されるビデオ信号が同一または類似する空間解像度を有する場合、対応するダウンサンプリングおよびアップサンプリング動作は、たとえば、バイパスされてもよい。
実施形態は、スケーラブルビデオコーディング(SVC)が、部分ビットストリームのレートに対して高くすることができる再構築品質を保持しながら、部分ビットストリームの送信およびデコーディングが、より低い時間もしくは空間解像度、または、減少された忠実度(fidelity)でビデオサービスを提供することを可能にするH.264の拡張であると理解する。図3は、スケーラブルコーディングの効率を向上させるための例示的な2レイヤSVCインターレイヤ予測メカニズムを示す図である。一部の実施形態において、同一のメカニズムを、複数レイヤSVCコーディング構造にも適用することができる。図3において、基本レイヤおよびエンハンスメントレイヤ(enhancement layer)は、異なる解像度での2つの隣接する空間スケーラブルレイヤを表してもよい。1つもしくは複数、または各々の、単一レイヤ内で、動き補償予測およびイントラ予測(intra-prediction)は、規格H.264エンコーダ(図において点線で表される)として採用されてもよい。インターレイヤ予測は、エンハンスメントレイヤのレート歪み(rate distortion)の効率を向上させるために、空間テクスチャ、動きベクトル予測子、参照ピクチャインデックス、および残差信号(residual signals)などの(ただし、これらに限定されない)、可能な限り多くの基本レイヤ情報を採用してもよい。一部の実施形態において、SVCは、下位レイヤからの参照ピクチャが完全に再構築されることを要求しなくてもよい。
実施形態は、HEVCの複数レイヤスケーラブルエンハンスメント拡張(scalable enhancement extension)をサポートするために、時間予測(または推定)および/またはインターレイヤ予測(または推定)の参照ピクチャのシグナリングを含むことができるシステムおよび方法を意図する(HEVCのスケーラブルエンハンスメント拡張は、スケーラブルHEVCビデオコーディング(SHVC)と称されてもよく、これは本明細書において限定的ではなく説明のために、スケーラブルHEVCと称されてもよい)。一部の実施形態は、単一レイヤHEVC参照ピクチャバッファリングおよび/またはリスト構築プロシージャに準拠してもよく、ならびに、複数レイヤスケーラブルコーディングに対するインターレイヤ予測をサポートしてもよい。一部の実施形態において、シグナリングは、たとえば、単一レイヤHEVC参照ピクチャバッファリングおよび/もしくはリスト構築に準拠してもよく、ならびに/または、インターレイヤ時間参照ピクチャセット予測をサポートしてもよく(たとえば、帯域幅を節約するため)、および/もしくは、エンハンスメントレイヤおよび/または低参照レイヤの間のインターレイヤピクチャ予測をサポートしてもよい。
実施形態は、インターレイヤ予測方法論が、他の理由の中で、効率を高めるために、HEVCスケーラブルコーディング拡張に採用されてもよいことを意図する。図4は、HEVCスケーラブルコーディングのために考慮された例示的なインターレイヤ予測構造を示す。エンハンスメントレイヤの予測(または推定)は、再構築された基本レイヤ信号から(たとえば、2つのインターレイヤの空間解像度が異なる場合のアップサンプリングの後)、もしくは、カレントエンハンスメントレイヤ内の時間参照ピクチャから、時間予測信号でそのような基本レイヤ再構築信号を平均化することにより、ならびに/または、複数の予測ソースの組み合わせから、動き補償済み予測によって形成されてもよい。一部の実施形態において、SVCと比較すると(図3を参照して説明されているような)、この手法は、下位レイヤピクチャの、少なくとも一部の再構築、またはおそらくは完全な再構築を必要とすることがある。一部の実施形態において、同一のメカニズムが、複数レイヤ(たとえば、2レイヤよりも多い)HEVCスケーラブルコーディング構造に対して配備されてもよい。
実施形態は、参照ピクチャバッファリングおよびリスト構築のためのHEVCシグナリングが、単一レイヤ内の時間動き補償予測をサポートすることを理解する。実施形態はまた、スライスヘッダからframe_numを除去することによる参照ピクチャバッファリング管理の簡略化、および、H.264/SVCにより採用されたメモリ管理制御動作(MMCO:memory management control operation)コマンドを理解する。実施形態は、パラメータセット構文(Parameter Set syntax)およびスライスヘッダにおける参照ピクチャセット(RPS)の追加されたシグナリングをさらに理解し、たとえば、1つもしくは複数、または各々のセットがカレントピクチャ(current picture)によって使用される参照ピクチャの数を含んでもよく、または、将来のピクチャの予測(または推定)に保存されてもよいことをさらに理解する。
表1は、例示的な参照ピクチャセット構文を示す。1つもしくは複数、または各々の参照ピクチャは、カレントピクチャと参照ピクチャとの間の距離とすることができる、デルタPOC(ピクチャオーダーカウント)を通じて識別されてもよい。たとえば、第1のピクチャに対するPOCは0であってもよく、第2のピクチャに対するPOCは1であってもよく、および、第3のピクチャに対するPOCは2であってもよく、第1のピクチャと第3のピクチャとの間の距離は2であってもよい。または例として、カレントピクチャのPOCが10であり、エンコーダが、POC={9、7}で2つの参照ピクチャを含めようとすると仮定する。エンコーダは、num_negative_pics=2およびnum_positive_pics=0をシグナリングしてもよい。POC10からPOC9を減算すると1であるので、delta_poc_s0_minus1[0]の値は0である。そして、POC9からPOC7を減算すると2であるので、delta_poc_s0_minus1[1]は1となる。
表1 例示的な参照ピクチャセット構文
図5は、ダイアディックおよびネスト時間スケーラブルコーディング構造(dyadic and nested temporal scalable coding structure)の例である。一部の実施形態において、簡略化のために、デルタPOCは、表2で定義される参照ピクチャセット構成に使用されてもよい(たとえば、RPS0からRPS10)。1つもしくは複数、または各々のピクチャは、RefPicList0およびRefPicList1において少なくとも1つの参照ピクチャを有することができる。
表2 例示的な参照ピクチャセット(RPS:reference Picture Set)
表3は、1つもしくは複数、または各々のコーディングピクチャ、および、デコードされたピクチャバッファ(DPB)で使用可能な対応する参照ピクチャによって使用することができる例示的な参照ピクチャセットインデックスを示す。一部の実施形態において、1つもしくは複数、または各々の参照ピクチャリスト(RefPicList0/1)は、他の要因の中で、パラメータセットおよび/またはスライスヘッダにおけるアクティブな参照ピクチャ設定(num_ref_idx_l0_default_active_minus1、num_ref_idx_l1_default_active_minus1)の数に応じて、DPBから1つまたは複数の参照ピクチャを選択してもよい。
表3 リストごとの1参照ピクチャでの時間スケーラビリティの例示的な参照ピクチャセット
実施形態は、HEVCスケーラブルコーディングに対する1つまたは複数のインターレイヤ予測技術を意図する。実施形態は、空間スケーラビリティ、SNRまたは品質スケーラビリティ、および/または時間スケーラビリティなどの、HEVCのスケーラブルエンハンスメント(scalable enhancement)のための1つまたは複数のスケーラブルなシナリオを理解する。図6および図7は、空間スケーラビリティ、および組み合わされた時間/空間スケーラビリティに対する2つの例示的なインターレイヤ予測コーディング構造を示す。図6は、3つの空間的スケーラブルレイヤを有し、ならびに、1つもしくは複数、または各々のレイヤは異なる空間解像度を有することができる。基本レイヤ(レイヤ0)は、最も低い空間階層度を有してもよく、および、レイヤ2は最も高い空間解像度を有してもよい。下位レイヤから再構築されたピクチャは、たとえば、インターレイヤ予測に対する参照ピクチャとして、エンハンスメントレイヤの空間解像度と一致するようにアップサンプリング(up-sampled)されてもよい。
表4は、インターレイヤ予測なしのDPBにおいてバッファリングされた時間参照ピクチャの例を示す。一部の実施形態において、RPS構成は、表2に示されるのと同一、または類似してもよい。この例において、1つもしくは複数、または各々のレイヤは、同一のフレームレートを有してもよく(たとえば、時間解像度)、サイズ8の同一のGOP(ピクチャのグループ:Group of picture)構造を使用してもよい。一部の実施形態において、DPBにおいてバッファリングされた参照ピクチャは、1つもしくは複数、または各々のレイヤに対して同一、または類似であってもよい。
表4 時間参照ピクチャリストの例(リストごとの1参照ピクチャ)
表5は、図6に示されるスケーラブルコーディング構造に対する例示的なインターレイヤ予測参照ピクチャおよびインターレイヤ予測参照ピクチャリスト(IlpRefPicList0/1)である。一部の実施形態において、エンハンスメントレイヤが下位参照レイヤからの再構築および/またはアップスケールされた(up-scaled)参照ピクチャを使用することができるので、参照ピクチャは、表4の参照ピクチャよりも複雑(complicated)であってもよい。そのようなシナリオにおいて、レイヤ2は、レイヤ0およびレイヤ1のいずれか、または両方から、アップスケーリング再構築参照ピクチャ(up-scaled reconstructed reference pictures)から予測されてもよい。一部の実施形態において、特定の下位レイヤは、インターレイヤ予測に対する参照レイヤとなるよう指定されてもよい。たとえば、レイヤ2のピクチャは、他の理由の中で、複雑さ(complexity)を軽減するように、レイヤ1から予測(または推定)されてもよい(または一部の実施形態において、レイヤ1のみから予測されるよう制限される)。
表5 インターレイヤ予測参照ピクチャおよびリストの例(リストごとの参照レイヤごとの1参照ピクチャ)
図7は、組み合わされた空間および時間スケーラブル構造の例である。これは3レイヤを有し、基本レイヤ(レイヤ0)は、低フレームレートにおいて低空間解像度を有してもよく(たとえば、720p30)、レイヤ1は、高空間解像度および基本レイヤと同一のフレームレートを有してもよく(たとえば、1080P30)、レイヤ2はレイヤ1と同一の高空間解像度を有するが、より高いフレームレート(たとえば、1080p60)を有してもよい。レイヤ0の再構築されたピクチャは、レイヤ1および/またはレイヤ2のインターレイヤ予測(または推定)に対する参照ピクチャとしてアップサンプリングされてもよい。他の理由の中で、レイヤ1および/またはレイヤ2の空間解像度が同一とすることができるので、レイヤ1の再構築されたピクチャは、レイヤ2のインターレイヤ予測(または推定)に対する参照ピクチャとして使用されてもよい。エンハンスメントレイヤ(レイヤ1および/またはレイヤ2)の1つもしくは複数、または各々のピクチャは、同一のレイヤ内で、および/または、参照ピクチャがDPBで使用可能な限り、下位参照レイヤの参照ピクチャから、動き補償済み予測を時間的に(temporally)実行してもよく、または、2つのタイプの参照信号(たとえば、同一のレイヤおよびインターレイヤ)の加重平均(weighted average)を使用してもよい。
レイヤ2は、表2で定義されている同一の参照ピクチャセット構成を使用してもよいが、レイヤ0およびレイヤ1は、表6で定義されるように異なる参照ピクチャセットを使用してもよい。インターレイヤ予測なしで1つもしくは複数、または各々の単一レイヤの例示的な時間参照ピクチャリストは、表6に示される。
表6 時間参照ピクチャリストの例2(リストごとの1参照ピクチャ)
一部の実施形態において、HEVCに準拠するため、基本レイヤDPBにおける参照ピクチャは変更されなくてもよい。エンハンスメントレイヤDPBは、表7に示されるように、インターレイヤ予測に対する下位参照レイヤからの追加のインターレイヤ参照ピクチャを含んでもよい。
表7 インターレイヤ参照ピクチャおよびリストの例2(リストごとの参照レイヤごとの1参照ピクチャ)
表7は、インターレイヤ予測および相対IlpRefPicList0/1での1つもしくは複数、または各々のレイヤのDPBで使用可能なインターレイヤ参照ピクチャ(ILR)の例を示す。そのようなシナリオにおいて、1つもしくは複数、または各々の参照レイヤからの少なくとも1つの参照ピクチャは、IlpRefPicList0/1に対して選択されてもよい。一部の実施形態において、エンコーダは、1つもしくは複数、または各々のリストのピクチャの数を判定してもよく、動き推定のレート−歪みのコストに基づいて、どの参照ピクチャがリストに含まれることになるかを判定してもよい。
実施形態は、HEVCスケーラブルコーディングのための時間参照ピクチャシグナリングを意図する。1つまたは複数の実施形態は、基本レイヤおよびエンハンスメントレイヤの時間参照ピクチャセットが、1つもしくは複数、または各々のレイヤが、低遅延予測またはダイアディックコーディング構造などの、同一の予測構造、ならびに同一のGOPサイズおよびフレームレートを使用しているときに、同一となってもよいことを意図する。マルチレイヤスケーラブルコーディングの場合、エンハンスメントレイヤの時間参照ピクチャセットは、基本レイヤおよび/またはパラメータセットで同一の時間参照セットを指定されている任意の下位参照レイヤの時間参照ピクチャセットから予測されてもよい。
表8、表9、表10、および表11は、実施形態により理解されるシーケンスパラメータセット(SPS:sequence parameter set)構文、ピクチャパラメータセット(PPS)構文、およびスライスヘッダ構文の例である。時間参照ピクチャセットおよび/または時間参照ピクチャリストに関連する構文は、ダブルアスタリスクでマーキングされている。
表8 例示的なHEVCシーケンスパラメータセット構文
表9 例示的なHEVCピクチャパラメータセット構文
表10 例示的なショートターム(Short-term)参照ピクチャセット構文
表11 例示的なHEVCスライスヘッダ構文
実施形態は、下位参照レイヤからのエンハンスメントレイヤの参照ピクチャセットおよび/または参照ピクチャリストの予測(または推定)に対する1つまたは複数の構文(たとえば、そのような予測(または推定)に対するこれまで定義されていない1つまたは複数の構文)を意図する。以下の表は、1つまたは複数の意図される構文を示す。
表12 HEVCのスケーラブルエンハンスメント拡張をサポートする例示的なシーケンスパラメータセット構文
1つまたは複数の実施形態において、layer_index構文は、カレントシーケンスが位置するレイヤを指定してもよい。一部の実施形態において、レンジ(range)は、0から、関連する規格によって許可することができる最大のレイヤであってもよい。
表13は、1つまたは複数の実施形態によって意図されるHEVCスケーラブルコーディングのための時間的ショートターム参照ピクチャセット(RPS)構文である。一部の実施形態において、それを、元のHEVC RPS構造とインターレイヤ時間参照ピクチャセット予測との間で切り替えることができる。一部の実施形態において、「st_rps_prediction_flag」が0と等しいとき、レイヤはそのアクティブなPPSヘッダおよび/またはスライスヘッダにおいて各自のRPSを定義してもよい。一部の実施形態において、「st_rps_prediction_flag」が1と等しいとき、ショートターム時間RPSは下位参照レイヤの少なくとも1つのショートタームRPSと同一であってもよい。一部の実施形態において、下位参照レイヤ番号を、「abs_diff_layer_idx_minus1」によって取り出すことができ、および、ショートタームRPSインデックスは、「short_term_ref_pic_set_idx」によって与えられてもよい。
一部の実施形態において、st_rps_prediction_flagが1と等しいとき、カレントレイヤのショートターム時間RPSを、下位参照レイヤからのショートタームRPSから予測することができる。一部の実施形態において、st_rps_prediction_flagが0と等しいとき、カレントレイヤのショートターム参照ピクチャセットのインターレイヤ予測は、無効(disable)にされてもよい。
表13 HEVCのスケーラブルエンハンスメント拡張をサポートする例示的なショートターム時間参照ピクチャセット構文
1つまたは複数の実施形態は、abs_diff_layer_idx_minus1に1を加えたものが、カレントレイヤインデックスと下位参照レイヤインデックスとの間の絶対差を指定してもよいことを意図する。一部の実施形態において、abs_diff_layer_idx_minus1の値は、たとえば、レイヤの合計数から2を減算した値を超えない。
1つまたは複数の実施形態は、short_term_ref_pic_set_idxが、カレントピクチャのインターレイヤ参照ピクチャセットの作成に使用することができるアクティブなパラメータセットで指定されているショートターム参照ピクチャセットのリストにインデックスを指定してもよいことを意図する。
表14は、1つまたは複数の実施形態によって意図されるスケーラブルコーディングに対するショートターム時間RPS値の例である。基本レイヤ(レイヤ0)は、0で定義されるショートタームRPSを使用してもよい。レイヤ1および/またはレイヤ2のショートターム時間RPSの1つまたは両方は、基本レイヤ時間RPSから予測(または推定)されてもよい。レイヤ2ショートターム時間RPSはまた、たとえば、レイヤ1のRPSをレイヤ0からさらに予測することができるので、一部の実施形態において、RPSの反復的解析(recursive parsing)を含むことができるレイヤ1のRPSから予測されてもよい。
表14 スケーラブルコーディングの例示的なショートターム時間RPS値
実施形態は、HEVCスケーラブルコーディングのためのインターレイヤ参照ピクチャシグナリングを意図する。一部の実施形態において、他の理由の中で、様々な下位参照レイヤからの参照ピクチャを識別するために、対応するインターレイヤ予測(ILP)シグナリングがビットストリーム構文に追加されてもよい。シグナリングは、たとえば、他の理由の中で、コーディングの効率をさらに高めるために、エンハンスメントピクチャを任意のアップサンプリング(up-sampled)された(たとえば、おそらくは有用な場合、または一部の実施形態において必要に応じて)インターレイヤ参照ピクチャから予測することができるように、エンハンスメントレイヤDPBが、1つまたは複数の下位参照レイヤからの1つもしくは複数、または全部の有用な(または一部の実施形態において、必要とされる)再構築された参照ピクチャを含むことができるようにしてもよい。
実施形態は、HEVCスケーラブルコーディングのためのシーケンスパラメータセット構文を意図する。1つまたは複数の実施形態において、インターレイヤピクチャ予測に対するSPS構文は、表12に示される構文と同一であってもよく、これはカレントシーケンスが位置することができるレイヤを指定するための追加のレイヤインデックスを含んでもよい。一部の実施形態において、レイヤインデックスは、さまざまな参照レイヤからの参照ピクチャを識別するために使用されてもよい。
実施形態は、HEVCスケーラブルコーディングのための1つまたは複数のピクチャパラメータセット構文を意図する。表15は、HEVCスケーラブルコーディングのためのインターレイヤピクチャ予測を可能にする例示的な意図されたPPS構文を示す。
表15 HEVCのスケーラブルエンハンスメント拡張をサポートする例示的なピクチャパラメータセット構文
1つまたは複数の実施形態において、num_st_ilp_ref_pic_setsは、PPSで指定することができるショートタームインターレイヤ参照ピクチャセットの数(the number)を指定してもよい。一部の実施形態において、num_st_ilp_ref_pic_setsの値は、たとえば、0から64の範囲であってもよい(0および64を含む)。
1つまたは複数の実施形態において、0と等しいlong_term_ilp_ref_pics_present_flagは、ピクチャパラメータを参照する任意のコーディングされたピクチャのインターレイヤ予測に、ロングターム(long term)参照ピクチャが使用されないことを指定(または示す)してもよい。一部の実施形態において、1と等しいフラグは、たとえば、ピクチャパラメータを参照する任意のコーディングされたピクチャのインターレイヤ予測に、ロングターム参照ピクチャが使用されてもよいことを指定(または示す)してもよい。
1つまたは複数の実施形態において、num_ilp_ref_idx_l0_default_active_minus1に1を加えたものは、デフォルトで、インターレイヤ参照ピクチャリスト0(IlpRefPicList0)において許可することができる参照ピクチャがいくつあるかを指定(または示す)してもよい。一部の実施形態において、値は、たとえば、0から31の範囲であってもよい(0および31を含む)。
1つまたは複数の実施形態において、num_ilp_ref_idx_l1_default_active_minus1に1を加えたものは、デフォルトで、インターレイヤ参照ピクチャリスト1(IlpRefPicList1)において許可することができる参照ピクチャがいくつあるかを指定(または示す)してもよい。値は、たとえば、0から31の範囲であってもよい(0および31を含む)。
実施形態は、ショートタームILP参照ピクチャセットに対する1つまたは複数のシナリオ(シナリオ1を含む)を意図する。表16は、パラメータセットおよび/またはスライスヘッダに存在することができる、意図されるインターレイヤ参照ピクチャセットを示す。
表16 ショートタームILP参照ピクチャセット構文(例示的なシナリオ1)
1つまたは複数の実施形態は、abs_diff_layer_idx_minus1に1を加えたものが、カレントレイヤインデックスと下位参照レイヤインデックスとの間の絶対差を指定(または示す)してもよいことを意図する。一部の実施形態において、abs_diff_layer_idx_minus1の値は、たとえば、レイヤの合計数から2を減算した値を超えない。
1つまたは複数の実施形態は、fps_ratio_minus1に1を加えたものが、カレントレイヤと参照レイヤとの間のフレームレート比率を指定(または示す)してもよいことを意図する。たとえば、エンハンスメントレイヤフレームレートは、毎秒30フレームであってもよく、基本レイヤフレームレートは、毎秒15フレームであってもよいので、fps_ratio_minus1は1である。
1つまたは複数の実施形態は、num_negative_picsが以下のdelta_poc_s0[i]およびused_by_curr_pic_s0_flag[i]構文要素の数(the number)を指定(または示す)してもよいことを意図する。一部の実施形態において、num_negative_picsの値は、たとえば、0から、シーケンスパラメータセット(SPS)構文で指定することができるmax_num_ref_framesの範囲であってもよい(0およびmax_num_ref_framesを含む)。
1つまたは複数の実施形態は、num_positive_picsが以下のdelta_poc_s1[i]およびused_by_curr_pic_s1_flag1[i]構文要素の数を指定(または示す)してもよいことを意図する。一部の実施形態において、num_positive_picsの値は、たとえば、0からmax_num_ref_frames−num_negative_picsの範囲であってもよい(0およびmax_num_ref_frames−num_negative_picsを含む)。
1つまたは複数の実施形態は、delta_poc_s0[i]が2つのピクチャオーダーカウント値の間の絶対差を指定(または示す)してもよいことを意図する。一部の実施形態において、delta_poc_s0[i]の値は、たとえば、0から215−1の範囲であってもよい(0および215−1を含む)。
1つまたは複数の実施形態は、1と等しいused_by_curr_pic_ilp_s0_flag[i]を、参照レイヤからのi番目のインターレイヤ参照ピクチャがカレントピクチャによってインターレイヤ予測に使用することができることを指定(または示す)してもよいことを意図する。1つまたは複数の実施形態は、0と等しいused_by_curr_pic_s0_flag[i]が、たとえば、i番目の参照ピクチャがカレントピクチャのインターレイヤ予測によって使用されないことを指定してもよいことを意図する。
1つまたは複数の実施形態は、delta_poc_s1[i]が2つのピクチャオーダーカウント値の間の絶対差を指定してもよいことを意図する。一部の実施形態において、delta_poc_s1_minus1[i]の値は、たとえば、0から215−1の範囲であってもよい(0および215−1を含む)。
1つまたは複数の実施形態は、1と等しいused_by_curr_pic_ilp_s1_flag[i]が、参照レイヤからのi番目のインターレイヤ参照ピクチャがカレントピクチャによってインターレイヤ予測に使用されないことを指定(または示す)してもよいことを意図する。1つまたは複数の実施形態は、0と等しいused_by_curr_pic_s1_flag[i]が、i番目の参照ピクチャがカレントピクチャのインターレイヤ予測によって使用されないことを指定(または示す)してもよいことを意図する。
実施形態は、ショートタームILP参照ピクチャセットシグナリングが、エンハンスメントレイヤが1つまたは複数の下位参照レイヤからの任意の再構築された参照ピクチャをそのDPBに格納できるようにすることを可能にする柔軟なアプローチとなってもよいことを意図する。一部の実施形態において、対応する参照ピクチャは、下位参照レイヤのDPBから除去されてもよい。そのようなシグナリングはまた、基本レイヤがH.264でエンコードされ、エンハンスメントレイヤがHEVCでエンコードされる、ハイブリッドコーディング構造をサポートしてもよい。一部の実施形態において、これは、1つもしくは複数、または各々のエンハンスメントレイヤが各自のショートタームILP参照ピクチャセットを有することができる場合、そのようなシグナリングにおいて有用となることがある。一部の実施形態において、同一の参照ピクチャは、たとえば、複数のレイヤのDPBで複製されてもよい。
1つまたは複数の実施形態において、参照ピクチャセットは、デルタPOCを使用して参照ピクチャの位置を示してもよい。インターレイヤ予測に対して、異なるレイヤは、異なるフレームレートを有してもよい。下位レイヤのILP参照ピクチャPOCは、IlpRefPicPOC=(CurrPicPOC+deltaPOC)/(fps_ratio_minus1+1)として計算されてもよい。表17は、ILP参照ピクチャがレイヤ1からとすることができる、レイヤ2のインターレイヤ予測の例を示す。レイヤ2のフレームレートは60fpsであってもよく、および、レイヤ1のフレームレートは30であってもよい。例は、どのようにしてカレントピクチャPOCおよび/またはILP参照ピクチャセットからILP参照ピクチャPOC値を取り出すかを示す。
表17 図7のスケーラブル構造に対するILP参照ピクチャ(POC)の例
ショートタームILP参照ピクチャセットのための1つまたは複数のシナリオを意図する実施形態はまた、例示的なシナリオ2を含む。一部の実施形態は、一部の(または多くの)インターレイヤ予測参照ピクチャのデルタPOCが、参照レイヤのコロケートされた(co-located)参照ピクチャを除いて、下位参照レイヤの時間予測参照ピクチャと同一であってもよいことを意図する。ショートタームILP参照ピクチャセットに対する例示的なシナリオ2は、表18に示される。
表18 ショートタームILP参照ピクチャセット構文(例示的なシナリオ2)
1つまたは複数の実施形態は、abs_diff_layer_idx_minus1および/またはfps_ratio_minus1が、表16の場合と同一の定義を有してもよいことを意図する。
1つまたは複数の実施形態は、0と等しいcolocated_ref_pic_present_flagが、参照レイヤからのコロケートされた参照ピクチャがショートタームILP参照ピクチャセットに含まれなくてもよいことを指定(または示す)してもよいことを意図する。1つまたは複数の実施形態は、1と等しいcolocated_ref_pic_present_flagが、たとえば、参照レイヤからのコロケートされた参照ピクチャがショートタームILP参照ピクチャセットに含まれてもよいことを指定(または示す)してもよいことを意図する。
一部の実施形態は、0と等しいcolocated_ref_pic_used_by_curr_pic_s0_flagが、たとえば、コロケートされた参照ピクチャがカレントピクチャによってインターレイヤ予測に使用されなくてもよいことを指定(または示す)してもよいことを意図する。
一部の実施形態は、0と等しいcolocated_ref_pic_used_by_curr_pic_s1_flagが、たとえば、コロケートされた参照ピクチャがカレントピクチャによってインターレイヤ予測に使用されなくてもよいことを指定(または示す)してもよいことを意図する。
一部の実施形態は、0と等しいst_rps_used_by_curr_inter_layer_flagが、アクティブなパラメータセットで指定することができる参照ピクチャセットがショートタームインターレイヤ参照ピクチャセットに使用されなくてもよいことを指定(または示す)してもよいことを意図する。
一部の実施形態は、short_term_ref_pic_set_idxが、たとえば、カレントピクチャのインターレイヤ参照ピクチャセットの作成に使用することができる、対応する参照レイヤのアクティブなパラメータセットで指定することができるショートターム時間参照ピクチャセットにインデックスを指定(または示す)してもよいことを意図する。
表19 図7に対するショートタームILP参照ピクチャセット(例示的なシナリオ2)
表19は、図7のスケーラブル構造に対する例示的なシナリオ2のシグナリング構文構造を使用するレイヤ2のショートタームILP参照ピクチャセットの例である。このショートタームILP参照ピクチャセットシグナリングは、エキストラビット(extra bits)を保存することができるように、および/または複製されたILP参照ピクチャがエンハンスメントレイヤに格納されない(または一部の実施形態において、複製されたILP参照ピクチャはエンハンスメントレイヤに格納される必要はない)ように、ILP参照ピクチャセットが下位参照レイヤの時間参照ピクチャセットと同一であってもよいシナリオに設計されてもよい。
1つまたは複数の実施形態は、異なるレイヤの異なるフレームレートを処理するための少なくとも1つの手法が、ショートタームILP参照ピクチャセットに関して本明細書において説明されるアプローチ(たとえば、例示的なシナリオ1)と同一であってもよいことを意図する。
ショートタームILP参照ピクチャセットのための1つまたは複数のシナリオを意図する実施形態はまた、例示的なシナリオ3を含む。実施形態は、例示的なシナリオ1と例示的なシナリオ2とを組み合わせるために、エキストラフラグ(extra flag)ilp_rps_prediction_flagが、表20に示されるように例示的なシナリオ1と例示的なシナリオ2との間を切り替えるように設定されてもよいことを意図する。一部の実施形態において、たとえば、決定をシーケンスまたはピクチャ全体に対して行うことができるように、類似するフラグをSPSまたはPPSヘッダに移動することができる。
表20 ショートターム(ILP)参照ピクチャセット構文(例示的なシナリオ3)
実施形態は、HEVCスケーラブルコーディングのための1つまたは複数のスライスヘッダ構文を意図する。表21は、HEVCのスケーラブルエンハンスメント拡張のためのショートタームおよび/またはロングタームインターレイヤ予測をサポートすることができる、意図されたスライスヘッダ構文を示す。
表21 HEVCのスケーラブルエンハンスメント拡張をサポートする例示的なスライスヘッダ構文
一部の実施形態は、1と等しいshort_term_ilp_ref_pic_set_pps_flagが、カレントピクチャのショートタームインターレイヤ参照ピクチャセットがアクティブなパラメータセットの構文要素を使用して作成されてもよいことを指定(または示す)してもよいことを意図する。一部の実施形態において、0と等しいshort_term_ilp_ref_pic_set_pps_flagは、たとえば、カレントピクチャのショートタームインターレイヤ参照ピクチャセットがスライスヘッダのshort_term_ilp_ref_pic_set()構文構造の構文要素を使用して作成されてもよいことを指定(または示す)してもよい。
一部の実施形態は、short_term_ilp_ref_pic_set_idxが、カレントピクチャのインターレイヤ参照ピクチャセットの作成のために使用することができるアクティブなパラメータセットで指定されてもよい、ショートタームインターレイヤ参照ピクチャセットのリストにインデックスを指定(または示す)してもよいことを意図する。一部の実施形態において、構文要素short_term_ilp_ref_pic_set_idxは、ceil(log2(num_st_ilp_ref_pic_sets))ビットによって表されてもよい。short_term_ref_pic_set_idxの値は、たとえば、0から、num_st_inter_layer_ref_pic_sets−1の範囲であってもよく(0およびnum_st_inter_layer_ref_pic_sets−1を含む)、num_st_ilp_ref_pic_setsはアクティブなパラメータセットの構文要素であってもよい。
一部の実施形態は、num_long_term_ilp_picsが、カレントピクチャのロングターム参照ピクチャセットに含まれてもよいロングターム参照ピクチャの数を指定(または示す)してもよいことを意図する。一部の実施形態において、num_long_term_ilp_picsの値は、たとえば、0からmax_num_ref_frames−NumNegativePics[StRpsIdx]−NumPositivePics[StRpsIdx]−NumNegativeInterLayerPics[StRpsIlpIdz]−NumPositivePics[StIlpRpsIdz]の範囲であってもよい(両端の値を含む)。一部の実施形態において、存在しないときは、num_long_term_ilp_picsの値は0と等しくなるように推測(infer)されてもよい。
1つまたは複数の実施形態において、変数StRpsIdxは、以下のように導出されてもよい。
if (short_term_ref_pic_set_pps_flag)
StRpsIdx=short_term_ref_pic_set_idx
else
StRpsIdx=num_short_term_ref_pic_sets
1つまたは複数の実施形態において、変数StRpsIlpIdxは、以下のように導出されてもよい。
if (short_term_ilp_ref_pic_set_pps_flag)
StIlpRpsIdx=short_term_ilp_ref_pic_set_idx
else
StIlpRpsIdx=num_st_ilp_ref_pic_sets
そのようなシナリオにおいて、max_num_ref_framesは、時間参照ピクチャおよび/またはILP参照ピクチャによって共有されてもよい。一部の実施形態は、時間参照ピクチャおよび/またはILP参照ピクチャに対してSPSヘッダにそれぞれ別個の数の参照ピクチャを定義してもよい。
1つまたは複数の実施形態において、delta_poc_lsb_ilp_lt[i]は、たとえば、カレントピクチャのロングタームインターレイヤ参照ピクチャセットに含まれてもよいi番目のロングタームインターレイヤ参照ピクチャのピクチャオーダーカウント値の最下位ビットの値を判定するために使用されてもよい。
一部の実施形態において、0と等しいused_by_curr_pic_ilp_lt_flag[i]は、カレントピクチャのロングタームインターレイヤ参照ピクチャセットに含まれてもよいi番目のロングターム参照ピクチャがカレントピクチャによってインターレイヤ予測に使用されなくてもよいことを指定(または示す)してもよい。一部の実施形態において、1と等しいこのフラグは、カレントピクチャのロングタームインターレイヤ参照ピクチャセットに含まれてもよいi番目のロングターム参照ピクチャがカレントピクチャによってインターレイヤ予測に使用されてもよいことを指定(または示す)してもよい。
1つまたは複数の実施形態は、1と等しいnum_ilp_ref_idx_active_override_flagが、構文要素num_ilp_ref_idx_10_active_minus1がPおよび/またはBスライスに対して存在してもよく、および、構文要素num_ilp_ref_idx_l1_active_minus1がBスライスに対して存在してもよいことを指定(または示す)してもよいことを意図する。一部の実施形態は、0と等しいnum_ilp_ref_idx_active_override_flagが、構文要素num_ilp_ref_idx_l0_active_minus1および/またはnum_ilp_ref_idx_l1_active_minus1が存在しなくてもよいことを指定(または示す)してもよいことを意図する。
1つまたは複数の実施形態は、1つまたは複数のインターレイヤ予測(ILP)参照ピクチャリスト構築技術を意図する。実施形態は、HEVCが、時間参照ピクチャセットおよび/または参照ピクチャリスト構築のためのデコーディングプロセスを指定してもよいことを理解する。実施形態は、少なくとも2つの参照ピクチャリスト、RefPicList0およびRefPicList1が、PおよびBピクチャに対するデコーディングプロセスの間に構築および/または更新されてもよいことを意図する。1つまたは複数の実施形態は、HEVCスケーラブルコーディングに対して、インターレイヤ予測(ILP)に対する少なくとも2つのさらなる参照ピクチャリスト、ILPRefPicList0およびILPRfePicList1を意図する。一部の実施形態において、インターレイヤ参照ピクチャリストは、ショートタームおよび/もしくはロングタームインターレイヤ参照ピクチャ、またはその両方を含んでもよい。
実施形態は、ILP参照ピクチャセットのための1つまたは複数のデコーディング技術を意図する。一部の実施形態において、そのようなデコーディング技術は、スライスヘッダのデコーディングの後、および/または、任意のコーディングユニットのデコーディングの前に、ピクチャごとに1回起動(invoke)されてもよい。一部の実施形態において、そのようなプロセスは、HEVCで指定することができる時間参照ピクチャセットのデコーディングプロセスと並列であってもよい。一部の実施形態において、そのようなプロセスは、たとえば、1つまたは複数の参照ピクチャを「参照に使用されていない(unused for reference)」としてマーキングすることになってもよい。
1つまたは複数の実施形態において、ILP参照ピクチャセットは、たとえば、少なくとも6つのサブセット、つまり、IlpRpsStCurr0、IlpRpsStCurr1、IlpRpsStFoll0、IlpRpsStFoll1、IlpRpsLtCurr、およびIlpRpsLtFollを含んでもよいが、これらに限定されない。
一部の実施形態において、IlpRpsStCurr0は、下位参照レイヤからのデコーディング順および/または出力順でカレントピクチャの前であってもよく、ならびに、カレントピクチャのインターレイヤ予測に使用することができる1つもしくは複数、または全部のILP参照ピクチャを含んでもよい。
一部の実施形態において、IlpRpsStCurr1は、デコーディング順でカレントピクチャの前であってもよく、下位参照レイヤからの出力順でカレントピクチャの後に続いて(succeed)もよく、ならびに、カレントピクチャのインターレイヤ予測に使用することができる1つもしくは複数、または全部のILP参照ピクチャを含んでもよい。
一部の実施形態において、IlpRpsStFoll0は、下位参照レイヤからのデコーディング順および/または出力順でカレントピクチャの前であってもよく、デコーディング順でカレントピクチャの後に続く(following)ピクチャの1つまたは複数のインターレイヤ予測に使用されてもよく、ならびに/または、カレントピクチャのインターレイヤ予測に使用されなくてもよい1つもしくは複数、または全部のILP参照ピクチャを含んでもよい。
一部の実施形態において、IlpRpsStFoll1は、デコーディング順でカレントピクチャの前であってもよく、下位参照レイヤから出力順でカレントピクチャの後に続いてもよく、デコーディング順でカレントピクチャの後に続くピクチャの1つまたは複数のインターレイヤ予測に使用されてもよく、ならびに/または、カレントピクチャのインターレイヤ予測に使用されなくてもよい1つもしくは複数、または全部の参照ピクチャを含んでもよい。
一部の実施形態において、IlpRpsLtCurrは、カレントピクチャのインターレイヤ予測に使用することができる1つもしくは複数、または全部のロングタームILP参照ピクチャを含んでもよい。
一部の実施形態において、IlpRpsLtFollは、カレントピクチャのインターレイヤ予測に使用されなくてもよい1つもしくは複数、または全部のロングタームILP参照ピクチャを含んでもよい。
1つまたは複数の実施形態は、IlpRpsStCurr0、IlpRpsStCurr1、IlpRpsStFoll0、IlpRpsStFoll1、IlpRpsLtCurr、および/またはIlpRpsLtFollのエントリの数が、それぞれNumIlpRpsStCurr0、NumIlpRpsStCurr1、NumIlpRpsStFoll0、NumIlpRpsStFoll1、NumIlpRpsLtCurr、および/またはNumIlpRpsLtFollであってもよいことを意図する。
一部の実施形態において、IlpRpsStCurr0、IlpRpsStCurr1、IlpRpsStFoll0、およびIlpRpsStFoll1は総称して、1つもしくは複数、または各々の参照レイヤから使用可能とすることができるインターレイヤ参照ピクチャセットのショートタームサブセットと称されてもよい。一部の実施形態において、IlpRpsLtCurrおよび/またはIlpRpsLtFollは総称して、1つもしくは複数、または各々の参照レイヤからのインターレイヤ参照ピクチャセットのロングタームサブセットと称されてもよい。
1つまたは複数の実施形態は、以下の事項が、6つのサブセットの偏差(derivation)および/またはエントリの数に対して適用されてもよいことを意図する。
一部の実施形態において、MaxPicOrderCntLsbは、HEVCシーケンスパラメータセットセマンティクスで指定されてもよい。
1つまたは複数の実施形態は、deltaPOCをゼロとすることができる、コロケートされたILP参照ピクチャが、デフォルトで、正のピクチャとしてカウントされてもよいことを意図する。一部の実施形態において、それはまた、負のピクチャとしてカウントされてもよい。
一部の実施形態は、0からnum_st_inter_layer_ref_pic_sets−1の範囲(0およびnum_st_inter_layer_ref_pic_sets−1を含む)のStIlpRpsIdxの値が、アクティブパラメータセットからのショートタームインターレイヤ参照ピクチャセットが使用することができることを示してもよいことを意図する。StIlpRpsIdxは、パラメータセットでシグナリングすることができる順序でのショートタームインターレイヤ参照ピクチャセットのリストへの、ショートタームインターレイヤ参照ピクチャセットのインデックスであってもよい(たとえば、表15)。一部の実施形態は、num_st_inter_layer_ref_pic_setsと等しいStIlpRpsIdxを、スライスヘッダ(たとえば、表21)で信号シグナリングすることができる(たとえば、暗黙的または明示的に)ショートタームインターレイヤ参照ピクチャが使用されてもよいことを示してもよいことを意図する。
1つまたは複数の実施形態は、インターレイヤ参照ピクチャセットが導出された後、たとえば、インターレイヤ参照ピクチャセットに含まれない「参照に使用された(used for reference)」としてマーキングすることができる1つもしくは複数、または全部のインターレイヤ参照ピクチャが「参照に使用されていない(unused for reference)」としてマーキングされてもよいことを意図する。
実施形態は、ILP参照ピクチャリスト構築をデコーディングするための1つまたは複数の技術を意図する。1つまたは複数の実施形態において、インターレイヤ予測参照ピクチャリスト構築のためのデコーディングプロセスは、1つもしくは複数、または各々の、PまたはBスライスに対するデコーディングプロセスの開始において起動されてもよい。Pおよび/またはBスライスをデコーディングするとき、IlpRpsStCurr0、IlpRpsStCurr1、および/またはIlpRpsLtCurrにおける下位参照レイヤからの少なくとも1つのILP参照ピクチャが存在してもよい。
一部の実施形態において、初期IlpRefPicList0を構築するために以下の技術が使用されてもよい。
一部の実施形態において、以下のプロシージャは、初期IlpRefPicList1を構築するために実施されてもよい。
一部の実施形態において、デフォルトのリスト順序は、最初にレイヤインデックスによって、次いでピクチャインデックスによって配列されてもよい。リストはまた、たとえば、最初にピクチャインデックスによって、次いでレイヤインデックスによって順序付けられるように配列されてもよい。
実施形態は、インターレイヤ参照リストの変更を、1つもしくは複数、または各々の個々の参照レイヤに対してHEVCで指定されている同一の参照ピクチャリスト変更プロセスで達成されてもよいことを意図する。
以下の表22および表23(図8に示される)は、図7に示されるスケーラブルコーディング構造に対するレイヤ2 ILP参照ピクチャセットおよびリスト構築の例である。レイヤ1からのILP参照ピクチャは、アスタリスク(*)で示され、レイヤ0からのILP参照ピクチャは2つのアスタリスク(**)で示される。
この例において、レイヤ1からのピクチャPOC−0は、ロングタームILP参照ピクチャとなるように設定されてもよい。IlpRefPicList0およびIlpRefPicList1のアクティブエンティティの数は、最大に設定されてもよい。1つもしくは複数、またはすべてのILP参照ピクチャは、カレントピクチャによって使用されるように設定されてもよい。
ILP参照ピクチャリスト0は、レイヤ1からの負のILP参照ピクチャ、後に続いてレイヤ0からの負のILP参照ピクチャ、次いでレイヤ1からの正のILP参照ピクチャ(使用可能な場合、コロケートされたピクチャを含む)、およびレイヤ0からの正のILP参照ピクチャ、次いでロングタームILP参照ピクチャ(使用可能な場合)を含んでもよい。
ILP参照ピクチャリスト1は、レイヤ1からの正のILP参照ピクチャ(使用可能な場合、コロケートされたピクチャを含む)、後に続いてレイヤ0からの正のILP参照ピクチャ、次いでレイヤ1からの負のILP参照ピクチャ、およびレイヤ0からの負のILP参照ピクチャを含んでもよい。
表22 レイヤ2 ILP参照ピクチャ(POC)の例
実施形態は、HEVCスケーラブルコーディングに対する組み合わされた時間および/またはインターレイヤ予測シグナリングを意図する。本明細書において説明されるように、HEVCスケーラブルコーディングに対する時間参照ピクチャシグナリングは、時間参照ピクチャセット(RPS)のインターレイヤ予測をサポートするシグナリングを指定してもよい。本明細書において説明されるように、HEVCスケーラブルコーディングに対するインターレイヤ参照ピクチャシグナリングは、インターレイヤピクチャ予測をサポートするシグナリングを指定してもよい。実施形態は、参照ピクチャセットおよび/または参照ピクチャリストの少なくとも2つの別個のグループが、様々な目的のために設計されてもよいことを意図する。一部の実施形態は、stRPSおよび/またはRefPicListO/1が、インターレイヤ時間RPS予測に設計されてもよいことを意図する。一部の実施形態は、stIlpRpsおよび/またはIlpRefPicList0/1が、インターレイヤピクチャ予測に設計されてもよいことを意図する。
1つまたは複数の実施形態は、時間および/またはインターレイヤピクチャ予測を既存の参照ピクチャリストフレームワークに統合する(consolidate)ため、1つもしくは複数、または各々のコーディングユニットが、いずれかのリスト(RefPicList0/1またはIlpRefPicList0/1)を参照することができるかを示すようにさらに多くの構文シグナリングを追加することができるので、別個の参照ピクチャリストが、スライスレベルでさらに複雑なシグナリングを生じさせることがあることを意図する。
実施形態は、HEVCスケーラブルコーディングに対する統合シーケンスパラメータセット(SPS)構文を意図する。一部の実施形態において、SPS構文構造は、表12に示される構造と同一であってもよい。実施形態は、HEVCスケーラブルコーディングに対する統合ピクチャパラメータセット(PPS)構文を意図する。一部の実施形態において、PPS構文構造は、表9に示される構造と同一であってもよい。
実施形態は、HEVCスケーラブルコーディングに対する統合ショートターム参照ピクチャセット(stRPS)構文を意図する。一部の実施形態において、ショートターム参照ピクチャセット構文は、表24に示される例と同一であってもよい。一部の実施形態において、表24の例は、時間ピクチャ予測および/もしくはインターレイヤピクチャ予測、またはその両方に対するショートターム参照ピクチャセットをカバーしてもよい。
一部の実施形態は、1と等しいrps_prediction_flagが、カレントstRPSが下位参照レイヤのstRPSから予測されてもよいことを指定(または示す)してもよいことを意図する。一部の実施形態は、0と等しいrps_prediction_flagが、カレントstRPSが下位参照レイヤのstRPSから予測されなくてもよいことを指定(または示す)してもよいことを意図する。
一部の実施形態は、abs_diff_layer_idxが、カレントレイヤインデックスと参照レイヤインデックスとの間の絶対差を指定(または示す)してもよいことを意図する。一部の実施形態は、カレントレイヤおよび参照レイヤが同一のレイヤである場合、abs_diss_layer_idxが0と等しくてもよいことを意図する。
一部の実施形態は、fps_ratio_minus1に1を加えることが、カレントレイヤと参照レイヤとの間のフレームレート比率を指定(または示す)してもよいことを意図する。一部の実施形態は、カレントレイヤおよび参照レイヤが同一のレイヤである場合、fps_ratio_minus1が0と等しくてもよいことを意図する。
一部の実施形態は、1と等しいcollocated_ref_pic_present_flagが、下位参照レイヤからのコロケートされた参照ピクチャをstRPSに含めることができることを指定(または示す)してもよいことを意図する。一部の実施形態は、0と等しいcollocated_ref_pic_present_flagが、下位参照レイヤからのコロケートされた参照ピクチャがstRPSに含まれなくてもよいことを指定(または示す)してもよいことを意図する。
一部の実施形態は、0と等しいcolocated_ref_pic_used_by_curr_pic_s0_flagが、たとえば、コロケートされた参照ピクチャがカレントピクチャによってインターレイヤ予測に使用されなくてもよいことを指定(または示す)してもよいことを意図する。一部の実施形態は、0と等しいcolocated_ref_pic_used_by_curr_pic_s1_flagが、たとえば、コロケートされた参照ピクチャがカレントピクチャによってインターレイヤ予測に使用されなくてもよいことを指定(または示す)してもよいことを意図する。
一部の実施形態は、0と等しいst_rps_ilp_flagが、対応する参照レイヤのアクティブなパラメータセットで指定することができるショートターム参照ピクチャセットが現在レイヤのショートタームインターレイヤ参照ピクチャセットに使用されなくてもよいことを指定(または示す)してもよいことを意図する。一部の実施形態は、1と等しいst_rps_ilp_flagが、対応する参照レイヤのアクティブなパラメータセットで指定することができるショートターム参照ピクチャセットがカレントレイヤのショートタームインターレイヤ参照ピクチャセットに使用されてもよいことを指定(または示す)してもよいことを意図する。
一部の実施形態は、short_term_ref_pic_set_idxが、カレントピクチャのショートターム参照ピクチャセットの作成に使用することができる、対応する参照レイヤのアクティブなパラメータセットで指定することができるショートターム参照ピクチャセットにインデックスを指定してもよいことを意図する。
一部の実施態様において、たとえば、構文num_negative_pics、num_positive_pics、delta_pc_s0、used_by_curr_pic_s0_flag、および/またはused_by_curr_pic_s1_flagは、HEVCで指定されている構文と同一であってもよい。
表23 統合(Consolidated)ショートターム参照ピクチャセット構文
実施形態は、HEVCスケーラブルコーディングに対する統合スライスヘッダ構文を意図する。例示的な統合スライスヘッダは、表24に示される。他のパラメータの間で、実施形態は、少なくとも2つの信号「abs_diff_layer_idx」および「fps_ratio_minus1」がロングターム参照ピクチャに追加されてもよいことを意図する。これらの2つの信号のセマンティクスは、本明細書において説明されるセマンティクスと同一であってもよい。
表24 HEVCのスケーラブルエンハンスメント拡張をサポートする例示的な統合スライスヘッダ構文
実施形態は、1つまたは複数の統合参照リスト構築技術を意図する。2つの追加のILP参照ピクチャリスト(IlpRefPicList0およびIlpRefPicList1)の構築プロセスは、本明細書において説明される。統合ショートタームおよびロングターム参照ピクチャセットを、同一のレイヤ内で、および/もしくは、異なるレイヤにわたり、またはその両方において、ピクチャ予測に適用することができるので、参照ピクチャリストはまた、時間予測に対するカレントレイヤからの参照ピクチャ、および/またはインターレイヤ予測に対する下位参照レイヤからの参照ピクチャを含むように統合されてもよい。
1つまたは複数の実施形態は、以下のように定義される変数を意図する。
1つまたは複数の実施形態は、参照ピクチャセットが、少なくとも6つのサブセット、つまり、RpsStCurr0、RpsStCurr1、RpsStFoll0、RpsStFoll1、RpsLtCurr、および/またはRpsLtFollを含んでもよいことを意図する。
一部の実施形態において、RpsStCurr0は、現在または下位参照レイヤからデコーディング順および/または出力順でカレントピクチャの前とすることができ、ならびに、カレントピクチャの時間またはインターレイヤ予測に使用することができる、1つもしくは複数、または全部の参照ピクチャを含んでもよい。
一部の実施形態において、RpsStCurr1は、デコーディング順でカレントピクチャの前とすることができ、カレントレイヤおよび/または下位参照レイヤからの出力順でカレントピクチャの後に続くことができ、ならびに、カレントピクチャの時間またはインターレイヤ予測に使用することができる、1つもしくは複数、または全部の参照ピクチャを含んでもよい。
一部の実施形態において、RpsStFoll0は、現在または下位参照レイヤからデコーディング順および/または出力順でカレントピクチャの前とすることができ、デコーディング順でカレントピクチャの後に続くピクチャの1つまたは複数の時間またはインターレイヤ予測に使用することができ、ならびに、カレントピクチャの時間またはインターレイヤ予測に使用されなくてもよい、1つもしくは複数、または全部の参照ピクチャを含んでもよい。
一部の実施形態において、RpsStFoll1は、デコーディング順でカレントピクチャの前とすることができ、現在または下位参照レイヤから出力順でカレントピクチャの後に続くことができ、デコーディング順でカレントピクチャの後に続くピクチャの1つもしくは複数の時間またはインターレイヤ予測に使用されてもよく、カレントピクチャの時間またはインターレイヤ予測に使用されなくてもよい、1つもしくは複数、または全部の参照ピクチャを含んでもよい。
一部の実施形態において、RpsLtCurrは、カレントピクチャの時間またはインターレイヤ予測に使用することができる、1つもしくは複数、または全部のロングタームILP参照ピクチャを含んでもよい。
一部の実施形態において、RpsLtFollは、カレントピクチャの時間またはインターレイヤ予測に使用されなくてもよい、1つもしくは複数、または全部のロングタームILP参照ピクチャを含んでもよい。
一部の実施形態において、RpsStCurr0、RpsStCurr1、RpsStFoll0、RpsStFoll1、RpsLtCurr、および/またはRpsLtFollのエントリの数は、それぞれ、NumRpsStCurr0、NumRpsStCurr1、NumRpsStFoll0、NumRpsStFoll1、NumRpsLtCurr、および/またはNumRpsLtFollであってもよい。
1つまたは複数の実施形態は、以下の事項が、少なくとも6つのサブセットの偏差(derivation)および/またはエントリの数に対して適用されてもよいことを意図する。
一部の実施形態において、MaxPicOrderCntLsbは、HEVCシーケンスパラメータセットセマンティクスにおいて指定されてもよい。
1つまたは複数の実施形態は、以下の例示的な技術がRefPicList0を構築するために実施されてもよいことを意図する。
1つまたは複数の実施形態は、以下の技術が初期RefPicList1を構築するために実施されてもよいことを意図する。
以下の表25および表26(図9に示される)は、図7に示されるスケーラブルコーディング構造に対するレイヤ2統合参照ピクチャセットおよびリスト構築の例である。レイヤ2からの時間参照ピクチャは、1つのアスタリスク(*)で示され、レイヤ1からの参照ピクチャは2つのアスタリスク(**)で示され、および、レイヤ0からの参照ピクチャは(***)で示される。
この例において、レイヤ1からのピクチャPOC−0は、ロングタームILP参照ピクチャとなるように設定されてもよい。RefPicList0および/またはRefPicList1のアクティブなエンティティの数は、参照ピクチャセットの1つもしくは複数、または全部の参照ピクチャがリストに含まれうるように、最大に設定されてもよい。さらに、1つもしくは複数、または全部の参照ピクチャは、カレントピクチャによって使用されるように設定されてもよい。
参照ピクチャリスト0は、たとえば、カレントレイヤ、レイヤ1、および/またはレイヤ0からの負の参照ピクチャ、カレントレイヤ、レイヤ1、およびレイヤ0からの後に続く正のILP参照ピクチャ(使用可能な場合、コロケートされたピクチャを含む)、次いで(一部の実施形態において、おそらくは最後)使用可能な場合、ロングタームILP参照ピクチャを含んでもよい。
参照ピクチャリスト1は、カレントレイヤ2、レイヤ1、および/またはレイヤ0からの正の参照ピクチャ(使用可能な場合、レイヤ1およびレイヤ0のコロケートされたピクチャを含む)、次いで後に続くカレントレイヤ2、レイヤ1、および/またはレイヤ0からの負の参照ピクチャを含んでもよい。
1つまたは複数の実施形態は、デフォルトの参照ピクチャ構築をまた、参照ピクチャサブセットにおける参照ピクチャのインデックスによって順序付けることができることを意図する。たとえば、1つもしくは複数、または各々のレイヤのRPSの第1の負のピクチャを、たとえば、最初にlist0に含むことができ、次いで後に1つもしくは複数、または各々のレイヤのRPSの第2の負のピクチャを含むことができ、以下同様に続く。レイヤ2 POC6を例としてあげると、表26からのデフォルトのリストは、RefPicListO={4*、2*、0*、2**、1**、2***、1***、0***、8*、3**、4**、3***、4***}の類似のものであってもよい。代わりに、または加えて、それはまた、RefPicListO={4*、2**、2***、2*、1**、1***、0*、0***、8*、3**、3***、4**、4***}のように構築されてもよい。一部の実施形態において、同一の構築順序を、たとえば、RefPicList1にも適用することができる。
表25 空間およびインターレイヤ予測の両方を含むレイヤ参照ピクチャ(POC)の例
実施形態は、ビデオコーディングシステムが、デジタルビデオ信号を圧縮するのに使用されて、そのような信号のストレージ必要量および/または送信帯域幅を低減できることを認識する。実施形態は、ブロックベース、ウェーブレットベース、およびオブジェクトベースのシステム、ならびに/またはブロックベースのハイブリッドビデオコーディングシステムなどの、様々なタイプのビデオコーディングシステムを認識する。ブロックベースのビデオコーディングシステムの例は、MPEG1/2/4 part 2、H.264/MPEG−4 part 10 AVCおよびVC−1規格などの、国際ビデオコーディング規格を含む。実施形態は、デジタルビデオ能力を、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、無線ブロードキャストシステム、携帯情報端末(PDA)、ラップトップまたはデスクトップコンピュータ、デジタルカメラ、デジタルレコーディングデバイス、ビデオゲーミングデバイス、ビデオゲームコンソール、ならびにセルラおよび/または衛星無線電話などを含む、広範囲のデバイスに組み込むことができる。実施形態は、多くのデジタルビデオデバイスが、MPEG−2、MPEG−4、ITU−T H.263またはITU−T H.264/MPEG−4、Part 10、Advanced Video Coding(AVC)、およびそのような規格の拡張によって定義される規格で記述されているような、ビデオ圧縮技術を実装して、デジタルビデオ情報をさらに効率的に送信および受信してもよいことを認識する。実施形態は、無線通信技術が、無線帯域幅を増大させ、および、モバイルデバイスのユーザに対するサービス品質を向上させることができることを認識し、ならびに、実施形態はまた、モバイルインターネット上での高解像度(HD)ビデオコンテンツなどのビデオコンテンツの急激な需要の高まりが、モバイルビデオコンテンツプロバイダ、ディストリビュータ、およびキャリアサービスプロバイダに対する課題をもたらすことを認識する。
実施形態は、デジタルビデオサービス(衛星、ケーブル、および地上波送信チャネルを上でTV信号を送信するなどの)と比較して、ビデオチャット、モバイルビデオ、およびストリーミングビデオなどの、さらに多くのその他のビデオアプリケーションが、異機種環境(heterogeneous environment)に配備されることがあることを認識する。そのような異機種は、ネットワークと同様にクライアント側に存在してもよい。クライアント側において、3画面シナリオ(たとえば、スマートフォン、タブレット、および/またはTV)が例である。ネットワーク側において、ビデオは、インターネット、WiFiネットワーク、モバイル(3Gおよび4G)ネットワーク、および/またはそれらの任意の組み合わせにわたって送信されてもよい。サービスのユーザ経験および/またはビデオ品質を向上させるため、他の利点の中で、実施形態はスケーラブルビデオコーディングを意図する。一部の実施形態において、スケーラブルビデオコーディングは、信号を全体的に高い解像度で複数のストリームにエンコードすることを含んでもよく、特定のアプリケーションに有用であり(または一部の実施形態において特定のアプリケーションによって必要とされ)、クライアントデバイスによってサポートされてもよい固有のレートおよび解像度に応じて、ストリームのサブセットからのデコーディングを可能にしてもよい。
一部の実施形態は、用語「解像度」が、これらには限定されないが、空間解像度(たとえば、ピクチャサイズ)、時間解像度(たとえば、フレームレート)、および/またはビデオ品質(たとえば、MOSなどの主観的品質、および/またはPSNR、SSIMまたはVQMなどの客観的品質)を含む、多数のビデオパラメータによって定義されてもよいことを意図する。実施形態はまた、彩度フォーマット(chroma format)(たとえば、YUV420またはYUV422またはYUV444など)、ビット深度(たとえば、8ビットまたは10ビットビデオなど)、および/またはアスペクト比(aspect ratio)(たとえば、16:9または4:3)などのその他のビデオパラメータを意図する。実施形態は、国際ビデオ規格MPEG−2 Video、H.263、MPEG4 Visual、およびH.264が、スケーラビリティモードをサポートするツールおよび/またはプロファイルを有してもよいことを意図する。スケーラブルコーディングは、少なくとも時間スケーラビリティ(たとえば、スケーラブルビットストリームは1つまたは複数のフレームレートでのビデオ信号を含んでもよい)、空間スケーラビリティ(たとえば、スケーラブルビットストリームは1つまたは複数の空間解像度での信号を含んでもよい)、および/または、品質スケーラビリティ(たとえば、スケーラブルビットストリームは1つまたは複数の品質レベルでの信号を含んでもよい)を含んでもよい。加えて、ビュースケーラビリティ(たとえば、スケーラブルビットストリームは2Dおよび/または3Dビデオ信号を含んでもよい)が含まれてもよい。汎用性を失うことなく、空間スケーラビリティは、1つまたは複数のスケーラブルHEVC実施形態を説明するのに使用されてもよいが、本明細書において説明される意図される実施形態は、その他のタイプのスケーラビリティ(たとえば、品質スケーラビリティ、または本明細書において説明される他のスケーラビリティなど)に拡張されてもよい。
図10は、本明細書において説明されるビデオエンコーディング/デコーディング技術を利用することができる例示的なビデオエンコーディングおよびデコーディングシステム1000を示すブロック図である。図10に示されるように、システム1000は、エンコードビデオを、通信チャネル2116を介して宛先デバイス2114に送信することができるソースデバイス2112を含む。ソースデバイス2112および/または宛先デバイス2114は、任意の広範囲のデバイスを備えてもよい。一部のケースでは、ソースデバイス2112および/または宛先デバイス2114は、通信チャネル2116上でビデオ情報を通信することができる無線ハンドセットまたは任意の無線デバイスなどの、無線送信/受信ユニット(WRTU)を備えてもよく、この場合、通信チャネル2116は無線であってもよい。本明細書において説明されるシステムおよび方法は、無線アプリケーションまたはセッティングに限定されることはない。たとえば、これらの技術は、オーバジエア(over-the-air)テレビジョンブロードキャスト、ケーブルテレビジョン送信、衛星テレビジョン送信、インターネットビデオ送信、記憶媒体(たとえば、DVDまたはSDカードなど)上でのエンコードデジタルビデオ、および/またはその他のシナリオに適用してもよい。したがって、通信チャネル2116は、エンコードビデオデータの送信に適切な無線または有線媒体の任意の組み合わせを含んでもよい。
図10の例において、ソースデバイス2112は、ビデオソース2118、ビデオエンコーダ2120、モジュレータ(たとえば、モデム)2122、および/または送信機2124を含んでもよい。宛先デバイス2114は、受信機2126、デモジュレータ(たとえば、モデム)2128、ビデオデコーダ2130、および/またはディスプレイデバイス2132を含んでもよい。1つまたは複数の実施形態において、ソースデバイス2112のビデオエンコーダ2120は、本明細書において説明される動き予測技術を適用するように構成されてもよい。その他の例において、ソースデバイスおよび宛先デバイスは、その他のコンポーネントまたは配列を含んでもよい。たとえば、ソースデバイス2112は、外部カメラなどの外部ビデオソース2118からビデオデータを受信してもよい。同様に、宛先デバイス2114は、統合ディスプレイデバイスを含むのではなく、外部ディスプレイデバイスとインタフェースしてもよい。一部の実施形態において、ビデオエンコーダによって生成されたデータストリームは、ダイレクトデジタル転送などによって、データをキャリア信号に変調することなく、その他のデバイスに搬送されてもよく、その他のデバイスは送信に対してデータを変調してもよく、または変調しなくてもよい。
本明細書において説明される技術は、任意のデジタルビデオエンコーディングおよび/またはデコーディングデバイスによって実行されてもよい。このように、本明細書において説明されるシステムおよび方法は、非限定的に、無線送信、有線送信に対してコーディングされ、および/または、記憶媒体からアクセス可能なビデオデータで使用されてもよい。さらに、本開示の技術は、ビデオエンコーディングデバイスによって実行されてもよいが、技術はまた、「CODEC」と称されてもよいビデオエンコーダ/デコーダによって実行されてもよい。さらに、本開示の技術はまた、ビデオプロセッサおよび/またはプリプロセッサによって実行されてもよい。ソースデバイス2112および/または宛先デバイス2114は、ソースデバイス2112が宛先デバイス2114への送信に対するコーディングされたビデオデータを生成することができる、そのようなコーディングデバイスの例である。一部の例において、デバイス2112、2114は、デバイス2112、2114の各々がビデオエンコーディングおよびデコーディングコンポーネントを含むことができるように、実質的に対称的な方法で動作してもよい。一部の実施形態において、システム1000は、たとえば、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、および/またはビデオテレフォニーなどに対して、デバイス2112、2114の間で単方向または双方向のビデオ伝送をサポートしてもよい。一部の実施形態において、ソースデバイスは、1つまたは複数の宛先デバイスに対するエンコードビデオデータを生成するためのビデオストリーミングサーバであってもよく、宛先デバイスは、有線および/または無線通信システム上でソースデバイスと通信してもよい。
ソースデバイス2112のビデオソース2118は、ビデオカメラなどのビデオキャプチャデバイス、以前キャプチャされたビデオを含むビデオアーカイブ、および/またはビデオコンテンツプロバイダからのビデオフィード(video feed)を含んでもよい。一部の実施形態において、ビデオソース2118は、ソースビデオ、またはライブビデオ、アーカイブビデオおよび/もしくはコンピュータ生成ビデオの組み合わせなどの、コンピュータグラフィックスベースのデータを生成してもよい。一部のケースでは、ビデオソース2118がビデオカメラである場合、ソースデバイス2112および/または宛先デバイス2114は、いわゆるカメラフォンおよび/またはビデオフォンを形成してもよい。さらなるトランスコーディング(transcoding)の実施形態において、ソース2118は、たとえばH.264などの別のビデオ規格に準拠することができるエンコードビットストリームであってもよい。エンコーダ2120は、本明細書において説明される技術に従ってエンコードすることができる、非コーディングビデオデータを取得するための初期デコーディング段階を含んでもよい。上述したように、本開示において説明される技術は、一般にビデオコーディングに適用可能であってもよく、ならびに、無線および/または有線アプリケーションに適用されてもよい。一部の実施形態において、キャプチャされ、事前にキャプチャされ、デコードされ、および/またはコンピュータ生成されたビデオは、ビデオエンコーダ2120によってエンコードされてもよい。次いで、エンコードビデオ情報は、通信規格に従ってモデム2122によって変調されてもよく、および、送信機2124を介して宛先デバイス2114に送信されてもよい。モデム2122は、種々のミキサ、フィルタ、増幅器、または信号変調に対して設計されたその他のコンポーネントを含んでもよい。送受信機2124は、増幅器、フィルタ、および1つまたは複数のアンテナを含む、データを送信するために設計された回路を含んでもよい。
宛先デバイス2114の受信機2126は、チャネル2116上で情報を受信してもよく、および、モデム2128は情報を復調してもよい。ビデオデコーディングプロセスは、本明細書において説明される技術の1つまたは複数を実装してもよい。チャネル2116上で通信される情報は、ビデオデコーダ2130によって使用することができるビデオエンコーダ2120によって定義される構文情報を含んでもよく、構文情報は、ビデオブロックおよび/または、たとえばGOPなどのその他のコーディングユニットの特徴および/または処理を記述することができる構文要素を含んでもよい。ディスプレイデバイス2132は、デコードビデオデータをユーザに表示してもよく、および、ブラウン管(CRT:cathode ray tube)、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、および/またはその他のタイプのディスプレイデバイスなどの、多種多様なディスプレイデバイスのいずれかを備えてもよい。
図10の例において、通信チャネル2116は、無線周波数(RF)スペクトルもしくは1つもしくは複数の物理送信線、および/または無線および有線媒体の任意の組み合わせなどの、任意の無線または有線の通信媒体を備えてもよい。通信チャネル2116は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなどの、パケットベースのネットワークの一部を形成してもよい。通信チャネル2116は、有線または無線媒体の任意の適切な組み合わせを含む、ソースデバイス2112から宛先デバイス2114にビデオデータを送信するための、任意の適切な通信媒体、および/または様々な通信媒体の集合を表してもよい。通信チャネル2116は、ルータ、スイッチ、基地局、および/または、ソースデバイス2112から宛先デバイス2114への通信を容易にするために有用となってもよい任意のその他の機器を含んでもよい。
ビデオエンコーダ2120および/またはビデオデコーダ2130は、現在JCT−VCによって開発されている次世代ビデオコーディング規格HEVCなどの、ビデオ圧縮規格に従って動作してもよい。本開示の技術は、任意の特定のコーディング規格に限定されない。図10には示されていないが、一部の態様において、ビデオエンコーダ2120および/またはビデオデコーダ2130はそれぞれ、オーディオエンコーダおよびデコーダと統合されてもよく、ならびに、共通のデータストリームまたは別個のデータストリームでオーディオおよびビデオの両方のエンコーディングを処理する、適切なMUX−DEMUXユニット、またはその他のハードウェアおよびソフトウェアを含んでもよい。一部の実施形態において、MUX−DEMUXユニットは、ITU H.223マルチプレクサプロトコル、またはユーザデータグラムプロトコル(UDP)などのその他のプロトコルに準拠してもよい。
ビデオエンコーダ2120および/またはビデオデコーダ2130は、1つまたは複数のマイクロプロセッサ、デジタルシグナルプロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、個別論理、ソフトウェア、ハードウェア、ファームウェア、またはその任意の組み合わせなどの、多種多様な適切なエンコーダ回路のいずれかとして実装されてもよい。ビデオエンコーダ2120および/またはビデオデコーダ2130の1つもしくは複数、または各々は、1つまたは複数のエンコーダまたはデコーダに含まれてもよく、そのいずれかは、それぞれのカメラ、コンピュータ、モバイルデバイス、加入者デバイス、ブロードキャストデバイス、セットトップボックス、サーバ、または媒体アウェアネットワーク要素などにおける復号エンコーダ/デコーダ(CODEC)の一部として統合されてもよい。
一部の実施態様において、ビデオシーケンスは、一連のビデオフレームを含んでもよい。ピクチャのグループ(GOP)は、一連の1つまたは複数のビデオフレームを備えてもよい。GOPは、GOPのヘッダ、GOPの1つまたは複数のフレームのヘッダ、またはその他の場所に構文データを含めてもよく、構文データはGOPに含めることができるフレームの番号を記述することができる。1つもしくは複数、または各々のフレームは、それぞれのフレームに対するエンコーディングモードを記述することができるフレーム構文データを含んでもよい。ビデオエンコーダ2120は、ビデオデータをエンコードするために、個々のビデオフレーム内のビデオブロックで動作してもよい。ビデオブロックは、固定または可変のサイズを有してもよく、ならびに、指定されたコーディング規格に従ってサイズが異なってもよい。1つもしくは複数、または各々のビデオフレームは、複数のスライスを含んでもよい。1つもしくは複数、または各々のスライスは、複数のビデオブロックを含んでもよい。
図11は、本明細書において説明されるスケーラブルビデオエンコーディングシステムおよび方法の様々な個々のレイヤを実装するのに使用することができるビデオエンコーダ200の例を示すブロック図である。ビデオエンコーダ200は、ビデオブロック、またはビデオブロックのパーティションもしくはサブパーティションを含む、ビデオフレーム内のブロックのイントラおよびインターコーディングを実行してもよい。イントラコーディングは、空間予測(spatial prediction)を使用して、所与のビデオフレーム内のビデオにおける空間冗長性(spatial redundancy)を低減および/または除去してもよい。インターコーディングは、時間予測(temporal prediction)を使用して、ビデオシーケンスの隣接フレーム内のビデオにおける時間冗長性(temporal redundancy)を低減および/または除去してもよい。イントラモード(たとえば、Iモード)は、いくつかの空間ベース圧縮モード、および/または単方向予測(uni-directional prediction)(たとえば、Pモード)もしくは双方向予測(bi-directional prediction)(たとえば、Bモード)などのインターモードのいずれに言及(refer to)してもよく、ならびに/または、いくつかの時間ベース圧縮モードのいずれかに言及してもよい。
一部の実施形態において、入力ビデオ信号202は、ブロックごとに処理されてもよい。ビデオブロックユニットは、16ピクセル×16ピクセル(たとえば、マクロブロック(MB))であってもよい。実施形態は、ITU−T/SG16/Q.6/VCEGおよびISO/IEC/MPEGのJCT−VC(Joint Collaborative Team on Video Coding)が、高効率ビデオコーディング(HEVC)と称される次世代ビデオコーディング規格を開発していることを認識する。HEVCにおいて、拡張されたブロックサイズ(「コーディングユニット」またはCUと称される)は、高解像度(1080p以上)ビデオ信号をさらに効率的に圧縮するために使用されてもよい。HEVCにおいて、CUは、最大64×64ピクセルとすることができ、最小4×4ピクセルとすることができる。CUを、予測ユニットまたはPUにさらに区分することができ、それらに対して別個の予測方法が適用されてもよい。1つもしくは複数、または各々の入力ビデオブロック(MB、CU、PUなど)は、空間予測ユニット260および/または時間予測ユニット262を使用することによって処理されてもよい。
一部の実施形態において、空間予測(たとえば、イントラ予測)は、同一のビデオピクチャ/スライスにおける既にコーディングされた隣接ブロックからのピクセルを使用して、カレントビデオブロックを予測してもよい。空間予測は、ビデオ信号に特有(inherent)であってもよい空間冗長性を低減することができる。時間予測(たとえば、インター予測または動き補償予測)は、既にコーディングされたビデオピクチャからのピクセルを使用して、カレントビデオブロックを予測してもよい。時間予測は、ビデオ信号に特有であってもよい時間的冗長性を低減することができる。所与のビデオブロックに対する時間予測は、カレントブロックとその参照ブロックの1つまたは複数との間の動きの量および/または方向を示すことができる、1つまたは複数の動きベクトルによってシグナリングされてもよい。
一部の実施形態において、複数の参照ピクチャをサポートすることができる場合(たとえば、H.264/AVCまたはHEVCなどの最新のビデオコーディング規格の場合)、1つもしくは複数、または各々のビデオブロックに対して、その参照ピクチャインデックスもまた送信されてもよい。参照インデックスは、参照ピクチャストア264におけるどの参照ピクチャから時間予測信号が生じているのかを識別するのに使用されてもよい。空間、時間および/またはインターレイヤ予測の後、エンコーダにおけるモード決定および/またはエンコーダコントローラ280は、たとえば、レート−歪み最適化技術の少なくとも一部に基づいて、予測モードを選択してもよい。予測ブロックは、加算器216においてカレントビデオブロックから減算されてもよく、ならびに/または、予測残差(prediction residual)は変換ユニット204によって変換および/もしくは量子化ユニット206によって量子化されてもよい。量子化残差係数(quantized residual coefficients)は、逆量子化ユニット210において逆量子化されてもよく、および、逆変換ユニット212において逆変換されて、再構築された残差を形成してもよい。再構築されたブロックは、加算器226において予測ブロックに再び追加されて、再構築されたビデオブロックを形成してもよい。非ブロック化フィルタおよび/または適応ループフィルタ266などのさらなるインループフィルタリングは、参照ピクチャストア264に置かれ、および、将来のビデオブロックをコーディングするために使用される前に、再構築されたビデオブロックに適用されてもよい。出力ビデオビットストリーム220を形成するために、他の目的の中で、コーディングモード(たとえば、インターまたはイントラ)、予測モード情報、動き情報、および/または量子化残差係数は、エントロピーコーディングユニット208に送信されてもよく、および、さらに圧縮されてもよく、ならびに/または、ビットストリーム220を形成するようにパッキングされてもよい。
図12は、スケーラブルビデオエンコードストリームの種々のレイヤの1つもしくは複数、または各々をデコードするために1つまたは複数の実施形態において使用することができるブロックベースのビデオデコーダのブロック図である。対応するレイヤに対するビデオビットストリーム302は、エントロピーデコーディングユニット308においてアンパッキングおよび/またはエントロピーデコーディングされてもよい。コーディングモードおよび/または予測情報は、空間予測ユニット360(たとえば、イントラコーディングされる場合)および/または時間予測ユニット362(たとえば、インターコーディングされる場合)のいずれかに送信されて、予測ブロックを形成してもよい。残差変換係数は、残差ブロックを再構築するために使用することができる逆量子化ユニット310および/または逆変換ユニット312に送信されてもよい。予測ブロックおよび/または残差ブロックは、326において共に加算されてもよい。再構築ブロックは、参照ピクチャストア364に格納される前に、インループフィルタリングユニット366を通過(go through)してもよい。再構築ビデオ320は、表示デバイスを駆動するために送信されてもよく、および/または、将来のビデオブロックを予測するのに使用されてもよい。
一部の実施形態において、本明細書において説明されるシステムおよび方法は、種々の形状およびサイズのビデオブロックに適用されてもよい。少なくとも1つの実施形態において、たとえば、ブロックは、16×16ピクセルのブロック(たとえば、マクロブロック)、または最大コーディングユニット(LCU:Largest Coding Unit)から最小コーディングユニット(SCU:Smallest Coding Unit)の間のいずれかの所与のサイズのコーディングユニット、および/または非正方形サイズのブロックに設定されてもよい。さらに、エンコーダは、より正確な重量およびオフセット計算を可能にする任意のブロック形状および/またはサイズを採用してもよい。一部の実施形態において、エンコーダは、ピクチャ内の様々な領域のトップレベルの分析を実行し、ピクチャにおける様々な領域にわたって様々なブロック形状/サイズを採用し、および/または、そのような可変のブロックサイズに本明細書において説明される技術を適用してもよい。
1つまたは複数の実施形態において、参照ピクチャセット(RPS)は、デコーディング順で関連付けられたピクチャの前とすることができる、関連するピクチャのインター予測に使用されてもよく、および/または、デコーディング順で関連付けられたピクチャの後に続く任意のピクチャの1つもしくは複数、または全部の参照ピクチャを含む、ピクチャに関連付けられている参照ピクチャのセットであってもよい。実施形態は、単一レイヤ内の時間動き補償予測をサポートするために参照ピクチャの概念がHEVCによって採用されることを認識する。RPSは、1つもしくは複数、または各々の、ピクチャのコーディングされたスライスのスライスヘッダで送信されてもよく、デコードピクチャバッファ(DPB)のどの参照ピクチャがカレントピクチャおよび/または将来のピクチャを予測するのに使用されてもよいかを記述するために使用されてもよい。
表26は、実施形態によって意図される、例示的なショートターム参照ピクチャセット構文を示す。1つもしくは複数、または各々の参照ピクチャは、カレントピクチャと参照ピクチャとの間の距離とすることができる(本明細書において前に説明されているように)、デルタPOC(ピクチャオーダーカウント)を通じて識別されてもよい。さらなるPOCの例として、カレントピクチャのPOCが10であり、エンコーダが、POC={9、7}で2つの参照ピクチャを使用してカレントピクチャをコーディングすると仮定する。エンコーダは、num_negative_pics=2およびnum_positive_pics=0をシグナリングしてもよい。POC10からPOC9を減算すると1であるので、delta_poc_s0_minus1[0]の値は0であり、POC9からPOC7を減算すると2であるので、delta_poc_s0_minus1[1]の値は1である。参照ピクチャセットを、たとえば、inter_ref_pic_set_prediction_flagが1と等しいときに、アクティブパラメータセットにおける別の参照ピクチャセットから予測することができる。
表26 例示的なショートターム参照ピクチャセット構文
一部の実施形態において、参照ピクチャリストは、Pおよび/またはBスライスの単一予測(uni-prediction)に使用することができる参照ピクチャのリストであってもよい。Pスライスのデコーディングプロセスに対し、1つの参照ピクチャリストが存在してもよい。Bスライスのデコーディングプロセスに対し、1つまたは複数の参照ピクチャリスト(たとえば、リスト0およびリスト1の2つのリストにおいて)および/または参照ピクチャリストの組み合わせが存在してもよい。
表27は、図5における1つもしくは複数、または各々のコーディングピクチャによって使用することができる、例示的な参照ピクチャセット、およびデコードピクチャバッファ(DPB)に格納されている参照ピクチャのセットを示す。RPSによって示される使用可能な参照ピクチャを仮定すると、参照ピクチャリストは、DPBにおける1つまたは複数の使用可能な参照ピクチャを選択することによって構築されてもよい。HEVCは、1つまたは複数の(たとえば2つの)参照ピクチャリスト、たとえばRefPicList0およびRefPicList1の使用をサポートしてもよい。一部の実施形態において、1つもしくは複数、または各々のリスト(num_ref_idx_10_active_minus1およびnum_ref_idx_11_active_minus1)のアクティブな参照ピクチャの数に応じて、1つもしくは複数、または各々の、スライスは、RefPicList0およびRefPicList1における参照ピクチャの可変数を有してもよい。
表27 リストごとの参照ピクチャでの時間スケーラビリティの例示的な参照ピクチャリスト
図13は、カレントピクチャの動き補償予測に対する参照ピクチャをどのようにマーキングすることができるかを示す例を示す。カレントピクチャPOC数は6であってもよく、そのRPSは(−6、−4、−2、2)であってもよく、これはDPBにおける使用可能な参照ピクチャがピクチャ0、2、4、および8であってもよいことを示してもよい。一部の実施形態において、参照ピクチャリストのサイズは、動き補償予測に許可されてもよい参照ピクチャの数に依存してもよい。一部の実施形態において、許容することができる参照ピクチャの数は、リストあたり1つであってもよい(たとえば、図13におけるリスト)。たとえば、参照ピクチャリスト0は、ピクチャ4を含んでもよく、および/または、参照ピクチャリスト1は、ピクチャ8を含んでもよい。次いで、動き補償予測は、ピクチャ4および/またはピクチャ8から、1つもしくは複数、または各々の、カレントピクチャ(POC6)の予測ユニットを予測してもよい。
実施形態は、HEVCの複数レイヤスケーラブル拡張をサポートするための参照ピクチャセット(RPS)シグナリングを拡張する1つまたは複数の技術を意図する。一部の実施形態において、技術は、スケーラブルコーディングに対する追加のエンハンスメントレイヤをサポートするためにRPSシグナリングを拡張しながら、単一レイヤHEVC RPS使用および/またはシグナリング(ならびに関連付けられた参照ピクチャバッファリングおよび/またはリスト構築プロシージャ)で有用であってもよい。一部の実施形態において、エンハンスメントレイヤに対するインターレイヤRPS予測は、パラメータセットレベル(Parameter Set Level)および/またはスライスレベルでRPSシグナリングオーバーヘッドをセーブするために使用されてもよい。一部の実施形態において、RPS構文および構造は、HEVCで指定された単一レイヤHEVC参照ピクチャセットで有用であってもよい。一部の実施形態において、時間予測に対する1つまたは複数のエンハンスメントレイヤのRPSは、他の理由の中で、ビットオーバーヘッドをセーブするために、下位レイヤのRPSから予測されてもよい。一部の実施形態において、インターレイヤ予測(ILP)に使用することができるエンハンスメントレイヤのRPSは、他の理由の中で、ビットオーバーヘッドをセーブするために、下位レイヤのRPSから予測されてもよい。一部の実施形態において、デコーディングプロセスは、スケーラブルHEVCに対する参照ピクチャセットおよび/またはリスト構築をサポートするように定義されてもよい。
一部の実施形態において、一般的なスケーラブルコーディングスキームにおいて、エンハンスメントレイヤのコーディングピクチャを予測するために1つまたは複数の下位レイヤから再構築されたピクチャを使用することは有用となることがある。実施形態は、H.264ビデオコーディング規格ベースのスケーラブルコーディングスキームにおいて(および、そのようなスキームにおいてのみ)配備することができる、参照ピクチャリストにおけるインターレイヤ参照ピクチャをシグナリングするための技術を認識する。実施形態は、参照ピクチャセットベースのシグナリング構文および動き予測に対するデコーディングプロセスを使用することができ、インターレイヤ参照ピクチャは参照ピクチャセットなしで直接にシグナリングおよびデコーディングされない、HEVCなどの、その他のビデオコーディング規格を認識する。実施形態は、配備することができるスケーラブルHEVCが、互換性の懸念に対してHEVC規格に基づいてもよいことを認識する。1つまたは複数の実施形態により意図される参照ピクチャセットシグナリングおよび予測技術は、スケーラブルコーディングアーキテクチャにおいて効率的なインターレイヤ予測をサポート、および/または本明細書において説明される特徴を満足することができる。
1つまたは複数の実施形態は、HEVCスケーラブルコーディングのための1つまたは複数のショートターム参照ピクチャセット拡張設計を意図する。また、1つまたは複数の実施形態は、ショートターム参照ピクチャセット拡張の1つまたは複数のコーディングプロセスを意図する。加えて、1つまたは複数の実施形態は、1つまたは複数の参照ピクチャリスト構築を意図する。また、1つまたは複数の実施形態は、1つまたは複数のロングターム参照ピクチャセット予測設計を意図する。
1つまたは複数の実施形態は、HEVCスケーラブルコーディングのための1つまたは複数のショートターム参照ピクチャセット拡張を意図する。一部の実施形態において、基本レイヤおよびエンハンスメントレイヤの時間参照ピクチャセットが、同一のGOPサイズおよび/またはフレームレートで、たとえば、低遅延予測および/またはダイアディックコーディング構造などの時間予測構造を使用している場合、両方のレイヤが同一であってもよい。マルチレイヤスケーラブルコーディングにおいて、エンハンスメントレイヤの時間参照ピクチャセットは、同一の時間予測構造を有する基本レイヤまたは別の参照レイヤ(たとえば、カレントレイヤのインターレイヤ予測に使用することができる下位レイヤは、参照レイヤと称されてもよい)の時間参照ピクチャセットから予測(たとえば推定)/取得されてもよい。
表28は、スケーラブルHEVCに使用することができる、例示的なネットワーク抽象レイヤ(NAL:Network Abstraction Layer)ユニット構造である。layer_idは、カレントデータユニットがどのレイヤに属すかを示すことができるNALユニットヘッダにおいて指定されてもよい。
表28 例示的なNALユニット構文
表29は、実施形態によって認識されるHEVCにおいて指定されるシーケンスパラメータセット(SPS)構文の例を示す。
表29 例示的なHEVCシーケンスパラメータセット構文
表30は、例示的なスライスヘッダ構文である。カレントピクチャのショートタームRPSは、short_term_ref_pic_set_sps_flagが0と等しいときに、スライスヘッダにおいて作成されてもよい。スライスヘッダはまた、カレントピクチャのロングタームRPSに含まれてもよいロングターム参照ピクチャの数および/または構文を指定してもよい。現在のHEVCで指定することができるショートタームおよび/またはロングタームRPSの構文はまた、表30に示される。
表30 HEVCスライスヘッダ構文
表31は、エンハンスメントレイヤに対するショートターム参照ピクチャセット拡張を導入するのに使用することができるSPS構文の例である。基本レイヤ(layer_id=0)に対して、1つ実施形態のSPSは、HEVCで指定されるSPSと同一であってもよい。1つまたは複数の実施形態によって意図される構文は、表に示される。
表31 RPS予測を有効にする例示的なシーケンスパラメータセット構文
一部の実施形態において、num_short_term_ref_pic_set_extは、シーケンスパラメータセットで指定することができるショートターム参照ピクチャセット拡張の数を指定してもよい。
1つまたは複数のスケーラビリティ使用の実施形態において、エンハンスメントレイヤのショートターム参照ピクチャセット拡張は、時間予測に対する参照ピクチャを有する時間参照ピクチャサブセット、および/または、インターレイヤ予測(ILP)に対する参照レイヤからの参照ピクチャを有するインターレイヤ参照ピクチャサブセットの両方を含んでもよい。表32は、時間RPSサブセット(たとえば表33)および/またはインターレイヤRPSサブセット(たとえば、表34)をサポートすることができる、例示的な意図されるショートターム参照ピクチャセット拡張を示す。新たな提案される構文は、以下の表に示される。
表32 例示的なショートターム参照ピクチャセット拡張構文
表33 例示的なショートターム時間参照ピクチャサブセット
表34 例示的なショートタームインターレイヤ参照ピクチャサブセット
一部の実施形態において、1と等しいst_temporal_rps_prediction_flagは、参照レイヤからの時間参照ピクチャサブセットからの時間RPSサブセットの予測を可能にすることができる。一部の実施形態において、temporal_ref_layer_idは、ショートターム時間参照ピクチャサブセット予測に使用される参照レイヤを指定してもよい。一部の実施形態において、temporal_ref_rps_idxは、ショートターム時間参照ピクチャサブセット予測に使用することができる時間参照ピクチャレイヤにおける参照ピクチャセットインデックスを指定してもよい。一部の実施形態において、rps_scale_factor_minus1は、RPSのDeltaPOCをスケーリングする倍率(scaling factor)を指定してもよい。一部の実施形態において、1と等しいilp_enable_flagは、エンハンスメントレイヤILPを可能にすることができる。一部の実施形態において、ilp_ref_layer_idは、ILPに使用することができる参照レイヤを指定してもよい。一部の実施形態において、1と等しいcolocated_ref_pic_present_flagは、ILPに使用することができる参照レイヤからのコロケートされた参照ピクチャを指定してもよい。一部の実施形態において、1と等しいilp_rps_prediction_flagは、インターレイヤ参照ピクチャサブセットが参照レイヤの時間参照ピクチャサブセットから予測されてもよいことを示してもよい。一部の実施形態において、ilp_ref_rps_idxは、インターレイヤRPSサブセット予測に使用することができる参照レイヤの参照ピクチャセットのインデックスを指定してもよい。一部の実施形態において、1と等しいused_by_curr_ilp_pic_flagは、対応するインターレイヤ参照ピクチャがILPに対するカレントエンハンスメントレイヤに使用することができるかを指定してもよい。
1つまたは複数の実施形態では、ショートタームRPS拡張は、参照レイヤの時間参照ピクチャサブセット(short_term_ref_pic_subset())からの個々の時間参照ピクチャサブセットを予測する柔軟性を提供してもよい(たとえば、一部の実施形態において、参照レイヤが基本レイヤである場合、時間参照ピクチャサブセットはHEVCで指定することができるショートタームRPS(short_term_ref_pic_set())と同一であってもよい)。これはまた、参照ピクチャサブセットが任意の参照レイヤから予測されない場合(ただし、これに限定されない)に、時間参照ピクチャの明示的なシグナリングをサポートしてもよい。
1つまたは複数の実施形態は、スケーラブルコーディング方式が、他の理由の中で、エンハンスメントレイヤのコーディング効率を高めるために、インターレイヤ予測に対する参照ピクチャとして参照レイヤDPBに格納されている再構築されたピクチャを利用してもよいことを意図する。カレントエンハンスメントレイヤピクチャを予測するために参照レイヤのDPBにおけるどのピクチャをILPで使用することができるかが、所与の参照レイヤにおける所与の時間RPSを参照することによって、および/または、ピクチャあたり1ビットを送信することによって使用することができる参照ピクチャをマーキングすることによって判定されてもよい。一部の実施形態において、参照レイヤDPBに格納することができるピクチャあたり1ビット(および一部の実施形態において、ピクチャあたり1ビットのみ)は、ILP参照ピクチャをシグナリングするのに使用されてもよく、これは、他の結果の中で、明示的なシグナリングと比較して低減されたビットオーバーヘッドをもたらすことができる。一部の実施形態において、ILP参照ピクチャを、たとえば、デルタPOC値を送信することによって、明示的にシグナリングすることができる。
一部の実施形態において、本明細書において説明されるピクチャセット予測技術は、エンハンスメントレイヤの1つもしくは複数、または各々の、個々の参照ピクチャセット拡張に対して配備されてもよい。一部の実施形態において、たとえば空間および/またはSNRスケーラビリティ使用の場合において、エンハンスメントレイヤのショートターム時間参照ピクチャサブセットの一部および/または全体は、ピクチャのグループ(GOP)のフレームレートおよび/またはサイズが同一になる場合の実施形態において、所与の参照レイヤのショートターム参照ピクチャセットと同一であってもよい。時間参照ピクチャサブセットの一部および/または全体は、参照レイヤから予測されてもよい。表31および表32に示されていないが、カレントレイヤの時間参照ピクチャサブセットが参照レイヤからの時間参照ピクチャサブセットと同一であってもよいことを示すことができる追加のフラグがパラメータセットに追加されてもよい。一部の実施形態において、フラグが設定されるときに、個々の時間参照ピクチャサブセット(st_temporal_rps())のシグナリングは、参照ピクチャセット拡張(short_term_ref_pic_set_ext())から省略されてもよい。
一部の実施形態において、基本レイヤの参照ピクチャセットは、基本レイヤ内に時間予測に対する参照ピクチャを含めてもよい(または一部の実施形態において、この参照ピクチャのみを含めてもよい)(たとえば、ILPに使用可能な基本レイヤよりも下位のレイヤには存在しなくてもよい)。一部の実施形態において、エンハンスメントレイヤの参照ピクチャセット拡張は、時間予測および/またはインターレイヤ予測に対する参照ピクチャを含むことができる。一部の実施形態において、複数のエンハンスメントレイヤが使用されるときに、参照ピクチャセット拡張は、2つ以上のエンハンスメントレイヤの間で同一であってもよい。そのようなシナリオにおいて、表31および表32に示されていないが、カレントレイヤの参照ピクチャセット(たとえば、時間サブセットおよび/またはインターレイヤサブセットを含む)が所与の参照レイヤと実質的にまたは完全に同一であってもよいことを示すことができる追加のフラグがパラメータセットに導入されてもよい。一部の実施形態において、そのようなフラグが設定されるときに、パラメータ「num_short_term_ref_pic_set_ext」および/または「short_term_ref_pic_set_ext()」は、パラメータセットから省略されてもよい。
一部の実施形態において、時間予測に使用することができる参照ピクチャ(たとえば、時間参照ピクチャサブセットでシグナリングされるような)および/またはILPに使用することができるより下位の参照レイヤからの参照ピクチャ(たとえば、インターレイヤ参照ピクチャサブセットでシグナリングされるような)は、時間ドメインにおいてコロケートされてもよい。たとえば、これらは、カレントピクチャから同一のPOC間隔(POC distance)(DeltaPOC)を有してもよい。また、一例として、図18に示されるように、カレントピクチャを予測するため、その時間参照のうちの3つ、およびそのインターレイヤ参照のうちの4つが使用されてもよく、一部の実施形態において時間参照および/またはインターレイヤ参照の3つのペアが時間的にコロケートされてもよい。1つまたは両方のレイヤからのさらに多くの参照ピクチャを有することは、コーディング性能を高めるが、一部の実施形態において、これはまたシステムの複雑性を増大させる結果をもたらすこともある。たとえば、モバイルビデオチャットまたはフェイスタイム(facetime)などの、限られたDPBバッファサイズおよび/またはコーデック処理能力を有するアプリケーションに対して、DPBバッファに格納される参照ピクチャの数は制限されてもよい。そのようなシナリオにおいて、実施形態は、参照ピクチャの数をさらに低減することができるシグナリング技術が、時間的にコロケートされる参照ピクチャペアの1つ(または一部の実施形態において、1つのみ)を使用することによって、スケーラブルコーディングに配備されてもよいことを意図する。表31および表32に示されていないが、複雑性を軽減するために、追加のフラグが導入されてもよい。一部の実施形態において、このフラグが設定されるときに、時間参照ピクチャは、参照レイヤからの時間的にコロケートされたインターレイヤ参照ピクチャによって置き換えられてもよい(たとえば、そのようなインターレイヤ参照ピクチャが使用可能である場合)。一部の実施形態において、これは、カレントレイヤDPBバッファにおける参照ピクチャの数を減少させることができる。
1つまたは複数の実施形態は、参照ピクチャセット拡張のためのデコーディングプロセスを意図する。時間参照ピクチャサブセットおよびインターレイヤ参照ピクチャサブセットの例示的なデコーディングプロセスは、図15および図16に示される。
1つまたは複数の実施形態は、参照ピクチャセット拡張のための1つまたは複数のデコーディング技術を意図し、一部の実施形態において、スライスヘッダのデコーディング後、ならびに、一部の実施形態において、任意のコーディングユニットのデコーディングの前および/またはスライスの参照ピクチャリスト構築のためのデコーディングプロセスの前に、ピクチャごとに1回、起動されてもよい。
一部の実施形態は、ピクチャオーダーカウント値の少なくとも3つの時間リストが構築されて、それぞれ要素の数NumPocStTCurrBefore、NumPocStTCurrAfter、およびNumPocStTFollを有する時間参照ピクチャサブセット、PocStTCurrBefore、PocStTCurrAfter、PocStTFollを導出してもよいことを意図する。
一部の実施形態において、ピクチャオーダーカウント(POC)値の少なくとも3つのインターレイヤリストが構築されて、それぞれ要素の数NumPocStlLCurrCol、NumPocStlLCurrBefore、およびNumPocStlLCurrAfterを有するインターレイヤ参照ピクチャサブセット、PocStlLCurrCol、PocStlLCurrBefore、PocStlLCurrAfterを導出してもよい
一部の実施形態において、カレントピクチャがIDRピクチャである場合、PocStTCurrBefore、PocStTCurrAfter、PocStTFoll、PocStIlpCurrCol、PocStIlpCurrBeforeおよび/またはPocStIlpCurrAfterは空白(empty)に設定されてもよく、ならびに、NumPocStTCurrBefore、NumPocStTCurrAfter、NumPocStTFoll、NumPocStIlpCurrCol、NumPocStIlpCurrBefore、および/またはNumPocStIlpCurrAfterは0に設定されてもよい。それ以外の場合、一部の実施形態において、以下は、ピクチャオーダーカウント値の5つのリストおよびエントリの数の導出に対して適用してもよい。
一部の実施形態において、参照ピクチャセットは、参照ピクチャの少なくとも5つのリスト、RefPicSetStTCurrBefore、RefPicSetStTCurrAfter、RefPicSetStTFoll、RefPicSetStIlpCurrCol、RefPicSetStIlpCurrBeforeおよび/またはRefPicSetStIlpCurrAfterを含んでもよい。変数NumPocTotalCurrは、NumPocStTCurrBefore+NumPocStTCurrAfter+NumPocStIlpCurrCol+NumPocStIlpCurrBefore+NumPocStIlpCurrAfterと等しく設定されてもよい。PまたはBスライスをデコーディングするとき、NumPocTotalCurrの値が0と等しくない場合に、ビットストリームに有用であってもよい。一部の実施形態において、参照ピクチャセットおよび/またはピクチャマーキングの導出プロセスは、以下に従って実行されてもよい。
一部の実施形態において、以下は時間参照ピクチャサブセットに対して適用してもよい。
一部の実施形態において、以下はインターレイヤ参照ピクチャサブセットに対して適用する。
1つまたは複数の実施形態は、参照ピクチャリスト構築のための1つまたは複数のデコーディング技術を意図する。一部の実施形態において、これらの技術は、1つもしくは複数、または各々の、PまたはBスライスに対するデコーディングプロセスの開始の時点で起動されてもよい。変数NumRpsCurrTempList0は、Max(num_ref_idx_l0_active_minus1+1、NumPocTotalCurr)と等しく設定され、および、リストRefPicListTemp0は以下のように構築される。
一部の実施形態において、リストRefPicList0は、以下のようにデフォルトで構築されてもよい。
一部の実施形態において、スライスがBスライスとなるときに、変数NumRpsCurrTempList1は、Max(num_ref_idx_l1_active_minus1+1、NumPocTotalCurr)と等しく設定されてもよく、および、リストRefPicListTemp1は以下のように構築されてもよい。
一部の実施形態において、スライスがBスライスとなるときに、リストRefPicList1は、デフォルトで以下のように構築されてもよい。
図13は、例示的なエンハンスメントレイヤ時間参照ピクチャサブセット構築プロセスを示す図である。時間参照ピクチャサブセットは、所与の参照レイヤの所与の時間参照ピクチャサブセットから予測されてもよく、ならびに/または、同一のレイヤ内の既存の参照ピクチャサブセットから予測されてもよく、および/もしくは、明示的にシグナリングされてもよい。図14は、ショートターム参照ピクチャセットおよび/またはセット拡張を予測する複数の例示的な実施形態を示す。
図16は、例示的なエンハンスメントレイヤのインターレイヤ予測(ILP)参照ピクチャサブセット構築プロセスを示す。ILP参照ピクチャサブセットは、所与の参照レイヤからの所与の時間参照ピクチャセットから予測されてもよく、または、明示的にシグナリングされるかのいずれであってもよい。参照ピクチャセット拡張に対する例示的なデコーディングプロセスは、図17に示される。デコーダは、解析NALユニットヘッダを使用して、layer_idに応じて、ユニットが基本レイヤまたはエンハンスメントレイヤに対してであるかを判定してもよい。一部の実施形態において、layer_idが0である場合、NALユニットのペイロードデータは、基本レイヤからであってもよく、および、デコーディングプロセスはHEVCコーディング規格に準拠してもよく、ならびに/または、対応する参照ピクチャセットは、HEVC規格で指定されているように導出されてもよい。
一部の実施形態において、layer_idが0よりも大きい場合、NALユニットのペイロードデータは、エンハンスメントレイヤからであってもよく、および/または、SPSヘッダは、本明細書において説明されるように、ショートターム参照ピクチャセット拡張を搬送してもよい。
一部の実施形態において、時間参照ピクチャサブセットは、参照ピクチャセット拡張において示されてもよい。時間参照ピクチャサブセットを、下位レイヤからの予測された時間参照ピクチャセットから構築することができ、および/または、明示的シグナリングによって構築することができる。
一部の実施形態において、インターレイヤ予測が使用可能となる場合(たとえば、ilp_enable_flagが真である)、インターレイヤ参照ピクチャサブセットは、DPBにおいて使用可能なインターレイヤ参照ピクチャをマーキングするように構築されてもよい。コロケートされた参照ピクチャは、collocated_ref_pic_present_flagによってシグナリングされてもよく、および/または、インターレイヤ参照ピクチャの残りは、例えば、明示的にシグナリングされ、または、下位レイヤのインターレイヤ参照ピクチャサブセットの予測からシグナリングされるかのいずれかであってもよい。
図19は、異なるフレームレートでの2レイヤダイアディックおよびネスト時間スケーラブルコーディング構造の例を示す。基本レイヤは、より低いフレームレートを有してもよく、および、そのGOPサイズは4であってもよく、エンハンスメントレイヤは、高いフレームレートを有してもよく、および、そのGOPサイズは8であってもよい。
表35は、図19に示されるスケーラブルコーディング構造に対する予測例である。表36は、HEVCで指定されている明示的なRPSシグナリングの方法と比較した、1つもしくは複数、または各々の、例示的なRPSのビット減少の例を示す。一部の実施形態において、最大70%のビットの節約(saving)が達成されてもよい。一部の実施形態において、インターRPS予測(JCTVC−G198)と比較して、追加の(たとえば、大幅な)ビット節約が達成されてもよい。
表35 例示的な時間RPS予測
表36 ビット削減の例
一部の実施形態において、時間参照ピクチャサブセット全体が基本レイヤまたは参照レイヤのRPSと同一であるときに、ビット節約はより大きくなってもよい。そのようなシナリオにおいて、たとえば、基本レイヤからエンハンスメントレイヤの時間参照ピクチャサブセット全体を複製するために、1つの1ビットフラグおよび/または1ビットlayer_id(0)が使用されてもよい。
1つまたは複数の実施形態は、参照ピクチャリスト構築のための1つまたは複数のデコーディング技術を意図する。参照ピクチャリストは、カレントコーディングピクチャの動き補償予測に対する参照ピクチャセット拡張によって示される参照ピクチャの一部または全部を含んでもよい。単一レイヤビデオに対する参照ピクチャリストの構築は、HEVCにおいて指定されてもよい。実施形態は、スケーラブルHEVCコーディングに対し、エキストラインターレイヤ参照ピクチャ(extra inter-layer reference pictures)は参照ピクチャリストにマーキングされてもよいことを意図する。
一部の実施形態において、参照ピクチャリストにおける時間参照ピクチャは、HEVCに指定されている方法と同様に構築されてもよい。インターレイヤ参照ピクチャは、本明細書において説明されているように、参照ピクチャリストにおいてマーキングされてもよい。下位参照レイヤからのコロケートされた参照ピクチャ(たとえば、カレントレイヤよりも下位のレイヤからのカレントピクチャと同一の時間インスタンスにおいて)が使用可能である場合、コロケートされた参照ピクチャは、参照ピクチャリストにおいて時間参照ピクチャよりも前に配置されてもよい。エキストラインターレイヤ参照ピクチャ(たとえば、コロケートされていない参照ピクチャ)がインターレイヤ動き予測に使用される場合、それらの参照ピクチャは、参照ピクチャリストにおいてそれらの時間参照ピクチャの後に配置されてもよい。
一部の実施形態において、HEVCはまた、表30に示されるスライスヘッダにおける参照ピクチャセットの仕様をサポートしてもよい。一部の実施形態において、short_term_ref_pic_set_sps_flagが0と等しい場合、類似するRPS予測方法もまたスライスレベルで適用することができる。
表37は、スケーラブルHEVCのためのショートタームRPS拡張をサポートすることができる、例示的なスライスヘッダ構文変更を示す。一部の実施形態において、num_short_term_ref_ouc_set_extによってインデックス付けされたRPSは、適用可能であるときに、参照レイヤのスライスヘッダで指定されているRPSから予測されてもよい。
表37 例示的なスケーラブルHEVCスライスヘッダ構文
1つまたは複数の実施形態は、HEVCスケーラブルコーディングのためのロングターム参照ピクチャセット予測を意図する。ロングターム参照ピクチャセットは、スライスヘッダに含まれてもよい。他の理由の中で、スライスがパラメータセットよりも頻繁に発生し、および/または、複数のスライスが同一のフレームに使用されうるので、スライスヘッダにおける節約ビットオーバーヘッドは有用となることがある。HEVCロングターム参照ピクチャセット構文の態様は、表30に示される。他の要因の中で、空間スケーラビリティおよび/または品質スケーラビリティのシナリオを考慮として、ショートタームおよび/またはロングタームRPSは、基本レイヤおよび/またはエンハンスメントレイヤに対して類似してもよい。一部の実施形態において、たとえば、ロングタームRPSを参照レイヤからのロングタームRPSから予測することができるかを示すことができる追加のフラグがスライスヘッダに追加されてもよい。
表38は、1つまたは複数の実施形態により意図されるスケーラブルHEVCのための例示的なロングタームRPS予測構文を示す。
表38 スケーラブルHEVCに対するロングタームRPS予測構文
一部の実施形態において、1と等しいIt_rps_prediction_flagは、同一のロングタームRPSを、参照レイヤからのスライスのスライスヘッダから抽出することができることを指定してもよい。一部の実施形態において、ref_layer_idは、同一のロングタームRPSを含むことができる参照レイヤを指定してもよい。一部の実施形態において、It_rps_idxは、参照レイヤのロングターム参照ピクチャセットのインデックスを指定してもよい。一部の実施形態において、rps_scale_factor_minus1は、参照レイヤからのロングターム参照ピクチャセットのDeltaPOCをスケーリングするための倍率を指定してもよい。
上記の説明および図面を考慮に入れると、1つまたは複数の実施形態は、ビットストリームを生成するように少なくとも部分的に構成することができるビデオデータコーディングのための少なくとも1つのデバイスを意図する。ビットストリームは、1つまたは複数のデコーディングピクチャバッファ(DPB)に対する1つまたは複数のインターレイヤ参照ピクチャを示すことができる1つまたは複数の参照ピクチャセット(RPS)拡張を含んでもよい。1つまたは複数のDPBは、それぞれ、1つまたは複数のビデオコーディングレイヤに関連付けられてもよい。
一部の実施形態において、デバイスは、1つまたは複数のビデオコーディングレイヤのビデオコーディングレイヤが、1つまたは複数のビデオコーディングレイヤの少なくとも1つの上位ビデオコーディングレイヤの少なくとも1つのインターレイヤ予測のための参照レイヤとしてサービスすることができることの、少なくとも1つのインジケーションをさらに含むように、ビットストリームが生成されるようにさらに構成されてもよい。
一部の実施形態において、デバイスは、1つまたは複数のビデオコーディングレイヤの第1のビデオコーディングレイヤのDPBに関連付けられている1つまたは複数のインターレイヤ参照ピクチャの少なくとも1つがまた、1つまたは複数のビデオコーディングレイヤの第2のビデオコーディングレイヤのDPBに関連付けられてもよいことのインジケーションをさらに含むように、ビットストリームが生成されるようにさらに構成されてもよい。
一部の実施形態において、1つまたは複数のビデオコーディングレイヤの第2のビデオコーディングレイヤは、1つまたは複数のビデオコーディングレイヤの第1のビデオコーディングレイヤよりも上位であってもよい。
一部の実施形態において、デバイスは、ビットストリームが、1つまたは複数のDPBに対する1つまたは複数の時間参照ピクチャを示すことができる1つまたは複数のRPS拡張をさらに含むように生成されるように、さらに構成されてもよい。ビットストリームは、1つまたは複数の時間参照ピクチャ、および、1つまたは複数のインターレイヤ参照ピクチャを少なくとも1つの参照ピクチャリストに含むことのインジケーションをさらに含んでもよい。
一部の実施形態において、1つまたは複数のインターレイヤ参照ピクチャは、1つまたは複数のコロケートされた参照ピクチャ、および、1つまたは複数のコロケートされていない参照ピクチャを含んでもよい。デバイスは、ビットストリームが、1つまたは複数の時間参照ピクチャの少なくとも1つの位置の前または後のうちの少なくとも1つの位置において、1つまたは複数のコロケートされた参照ピクチャの少なくとも1つの参照ピクチャリストへの配置のインジケーションをさらに含むよう生成されるようにさらに構成されてもよい。
一部の実施形態において、デバイスは、配置のインジケーションが、1つまたは複数の時間参照ピクチャの少なくとも1つの位置の前または後のうちの少なくとも1つの位置において、1つまたは複数のコロケートされていない参照ピクチャの少なくとも1つの配置をさらに示すことができるように、ビットストリームが生成されるようにさらに構成されてもよい。
一部の実施形態において、1つまたは複数のインターレイヤ参照ピクチャは、1つまたは複数のコロケートされたインターレイヤ参照ピクチャ、および、1つまたは複数のコロケートされていないインターレイヤ参照ピクチャを含んでもよい。デバイスは、1つまたは複数のRPS拡張が、1つまたは複数のDPBに対する1つまたは複数のコロケートされたインターレイヤ参照ピクチャを示すことができるようにさらに構成されてもよい。
一部の実施形態において、デバイスは、ビットストリームが、1つまたは複数のDPBに対する1つまたは複数の時間参照ピクチャを示す、1つまたは複数のRPS拡張をさらに含むよう生成されるようにさらに構成されてもよい。ビットストリームは、1つまたは複数のコロケートされていないインターレイヤ参照ピクチャの少なくとも1つが、1つまたは複数の時間参照ピクチャから予測可能であってもよいというインジケーションをさらに含んでもよい。
一部の実施形態において、デバイスは、ビットストリームが、パラメータセット内で1つまたは複数のデコーディングピクチャバッファ(DPB)に対する1つまたは複数のインターレイヤ参照ピクチャを示す1つまたは複数の参照ピクチャセット(RPS)拡張を含むよう生成されうるようにさらに構成されてもよい。
一部の実施形態において、デバイスは、第1のビデオコーディングレイヤの第1のDPBに関連付けられている1つまたは複数のインターレイヤ参照ピクチャが、第2のビデオコーディングレイヤの第2のDPBに含まれてもよいことの少なくとも1つのインジケーションをさらに含むように、ビットストリームが生成されるようにさらに構成されてもよい。
一部の実施形態において、第2のビデオコーディングレイヤは、第1のビデオコーディングレイヤよりも上位であってもよい。
1つまたは複数の実施形態は、ビットストリームを生成するように少なくとも部分的に構成することができるビデオデータコーディングのための少なくとも1つのデバイスを意図する。ビットストリームは、1つまたは複数のインターレイヤデルタピクチャオーダーカウント(POC)を示すことができる1つまたは複数の参照ピクチャセット(RPS)拡張を含んでもよい。1つまたは複数のPOCは、それぞれ、1つまたは複数のビデオコーディングレイヤに関連付けられてもよい。
一部の実施形態において、デバイスは、ビットストリームが、1つまたは複数のビデオコーディングレイヤに対する1つまたは複数の時間参照ピクチャを示すことができる1つまたは複数のRPS拡張をさらに含むように、生成されるようにさらに構成されてもよい。
一部の実施形態において、デバイスは、第1のビデオコーディングレイヤに関連付けられている1つまたは複数の時間参照ピクチャが、第2のビデオコーディングレイヤに使用することができることのインジケーションをさらに含むように、ビットストリームが生成されるようにさらに構成されてもよい。
一部の実施形態において、インジケーションは、1ビットのフラグであってもよい。第1のビデオコーディングレイヤは、基本レイヤまたは参照レイヤのうちの少なくとも1つであってもよい。第2のビデオコーディングレイヤは、エンハンスメントレイヤであってもよい。エンハンスメントレイヤは、第1のビデオコーディングレイヤよりも上位であってもよい。
1つまたは複数の実施形態は、第1のビデオコーディングレイヤを生成するように少なくとも部分的に構成することができるビデオデータ処理のための少なくとも1つのデバイスを意図する。第1のビデオコーディングレイヤは、第1の参照ピクチャセット(RPS)を含んでもよい。第1のRPSは、第1のデコーディングピクチャバッファ(DPB)に1つまたは複数の時間参照ピクチャを含めてもよい。デバイスは、第1のRPSの時間参照ピクチャに少なくとも部分的に基づいて、第2のビデオコーディングレイヤを生成するようにさらに構成されてもよい。第2のビデオコーディングレイヤは、第2のRPSを含んでもよい。第2のRPSは、第2のDPBに、1つまたは複数の時間参照ピクチャ、および1つまたは複数のインターレイヤ参照ピクチャを含めてもよい。デバイスは、第1のRPSまたは第2のRPSの少なくとも1つに、少なくとも部分的に基づいて、第3のビデオコーディングレイヤを生成するようにさらに構成されてもよい。
一部の実施形態において、少なくとも第1のビデオコーディングレイヤは、高効率ビデオコーディング(HEVC)プロトコルに従って生成されてもよい。
一部の実施形態において、デバイスは、第2のビデオコーディングレイヤまたは第3のビデオコーディングレイヤのうちの少なくとも1つの中で、動き補償予測を時間的に実行するようにさらに構成されてもよい。
一部の実施形態において、第3のビデオコーディングレイヤは、第3のDPBを含んでもよい。第3のDPBは、第1のDPBまたは第2のDPBの少なくとも1つに含まれてもよい1つまたは複数のインターレイヤ参照ピクチャのうちの少なくとも1つを含んでもよい。
一部の実施形態において、デバイスは、第3のビデオコーディングレイヤの生成が、第1のRPSまたは第2のRPSの少なくとも1つに基づいて、第3のRPSの1つまたは複数の時間参照ピクチャの予測を含むことができるようにさらに構成されてもよい。
一部の実施形態において、デバイスは、第1のRPSまたは第2のRPSの少なくとも1つをスケーリングするためのインジケーションを受信するようにさらに構成されてもよい。第3のビデオコーディングレイヤの生成は、スケーリングされた第1のRPSまたはスケーリングされた第2のRPSの少なくとも1つに基づいて、第3のRPSの1つまたは複数の時間参照ピクチャの予測を含んでもよい。
一部の実施形態において、デバイスは、第2のビデオコーディングレイヤのRPS拡張が、第2のDPBの1つまたは複数の時間参照ピクチャのセット、および、第2のDPBの1つまたは複数のインターレイヤ参照ピクチャのセットを含むことができるようにさらに構成されてもよい。第3のビデオコーディングレイヤのRPS拡張は、第2のビデオコーディングレイヤのRPS拡張から予測可能であってもよい。
特徴および要素が特定の組み合わせで上記説明されたが、各々の特徴または要素を、単独で使用または他の特徴および要素の任意の組み合わせで使用することができることを、当業者であれば理解するであろう。加えて、本明細書において説明される方法は、コンピュータまたはプロセッサによる実行のためのコンピュータ可読媒体に組み込まれたコンピュータプログラム、ソフトウェア、またはファームウェアにおいて実施されてもよい。コンピュータ可読媒体の例は、電子信号(有線または無線接続を介して伝送される)およびコンピュータ可読記憶媒体を含む。コンピュータ可読記憶媒体の例は、リードオンリメモリ(ROM)、ランダムアクセスメモリ(RAM)、レジスタ、キャッシュメモリ、半導体メモリデバイス、内蔵ハードディスクおよび着脱可能ディスクなどの磁気媒体、磁気光学媒体、CD−ROMディスクおよびデジタル多用途ディスク(DVD)などの光学媒体を含むが、これらに限定されない。ソフトウェアと関連するプロセッサは、WTRU、UE、端末、基地局、RNC、または任意のホストコンピュータにおいて使用する無線周波数送受信機を実装するように使用されてもよい。