JP2016519508A - 高レベルシンタックス専用shvcにおける一般化残差予測ならびにそのシグナリングおよび管理 - Google Patents

高レベルシンタックス専用shvcにおける一般化残差予測ならびにそのシグナリングおよび管理 Download PDF

Info

Publication number
JP2016519508A
JP2016519508A JP2016506589A JP2016506589A JP2016519508A JP 2016519508 A JP2016519508 A JP 2016519508A JP 2016506589 A JP2016506589 A JP 2016506589A JP 2016506589 A JP2016506589 A JP 2016506589A JP 2016519508 A JP2016519508 A JP 2016519508A
Authority
JP
Japan
Prior art keywords
reference picture
residual prediction
picture
prediction reference
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016506589A
Other languages
English (en)
Other versions
JP6352390B2 (ja
JP2016519508A5 (ja
Inventor
リ、シャン
ワン、イェ−クイ
チェン、イン
チェン、ジャンレ
ラマスブラモニアン、アダルシュ・クリシュナン
カークゼウィックズ、マルタ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2016519508A publication Critical patent/JP2016519508A/ja
Publication of JP2016519508A5 publication Critical patent/JP2016519508A5/ja
Application granted granted Critical
Publication of JP6352390B2 publication Critical patent/JP6352390B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

いくつかの態様による、ビデオ情報を復号するための装置は、メモリユニットと、メモリユニットに動作可能に結合されたプロセッサとを含む。メモリユニットは、エンハンスメントレイヤの少なくとも1つの参照ピクチャリストを記憶するように構成され、少なくとも1つの参照ピクチャリストは、残差予測参照ピクチャの情報を備える。プロセッサは、残差予測参照ピクチャの生成についてのシグナリングされた情報を復号することと、生成される残差予測参照ピクチャが、当該残差予測参照ピクチャが生成されるエンハンスメントレイヤ参照ピクチャと同じ動きフィールドおよび同じピクチャ順序カウント(POC)を有するように、エンハンスメントレイヤ参照ピクチャおよび復号されたシグナリングされた情報に基づいて、残差予測参照ピクチャを生成することと、生成された残差予測参照ピクチャをエンハンスメントレイヤの少なくとも1つの参照ピクチャリストに記憶することと、を行うように構成される。【選択図】図10

Description

本開示は、HEVC(高効率ビデオコーディング)などのアドバンスドビデオコーデックのコンテキストで、高レベルシンタックス専用のスケーラブルビデオコーディングおよび3Dビデオコーディングにおいて、一般化残差予測(GRP)参照ピクチャをシグナリングおよび管理することに関する。
[0002]デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末(PDA)、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、セルラーまたは衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスに組み込まれ得る。デジタルビデオデバイスは、MPEG−2、MPEG−4、ITU−T H.263、ITU−T H.264/MPEG−4,Part 10,Advanced Video Coding(AVC)、現在開発中の高効率ビデオコーディング(HEVC:High Efficiency Video Coding)規格によって定義された規格、およびそのような規格の拡張に記載されているビデオコーディング技法など、ビデオコーディング技法を実装する。ビデオデバイスは、そのようなビデオコーディング技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、および/または記憶し得る。
[0003]ビデオコーディング技法は、ビデオシーケンスに固有の冗長性を低減または除去するための空間的(イントラピクチャ)予測および/または時間的(インターピクチャ)予測を含む。ブロックベースのビデオコーディングの場合、ビデオスライス(たとえば、ビデオフレームまたはビデオフレームの一部分)が、ツリーブロック、コーディングユニット(CU)および/またはコーディングノードと呼ばれることもあるビデオブロックに区分され得る。ピクチャのイントラコーディングされた(I)スライス中のビデオブロックは、同じピクチャ中の近隣ブロック中の参照サンプルに対する空間的予測を使用して符号化される。ピクチャのインターコーディングされた(PまたはB)スライス中のビデオブロックは、同じピクチャ中の近隣ブロック中の参照サンプルに対する空間的予測、または他の参照ピクチャ中の参照サンプルに対する時間的予測を使用し得る。ピクチャはフレームと呼ばれることがあり、参照ピクチャは参照フレームと呼ばれることがある。
[0004]空間的予測または時間的予測は、コーディングされるべきブロックの予測ブロックを生じる。残差データは、コーディングされるべき元のブロックと予測ブロックとの間のピクセル差分を表す。インターコード化ブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトルと、コード化ブロックと予測ブロックとの間の差分を示す残差データとに従って符号化される。イントラコード化ブロックは、イントラコーディングモードと残差データとに従って符号化される。さらなる圧縮のために、残差データは、ピクセル領域から変換領域に変換されて、残差変換係数が得られ得、その残差変換係数は、次いで量子化され得る。量子化変換係数は、最初は2次元アレイで構成され、変換係数の1次元ベクトルを生成するために走査され得、なお一層の圧縮を達成するために、エントロピーコーディングが適用され得る。
[0005]本開示のシステム、方法、およびデバイスは、いくつかの革新的な態様をそれぞれ有し、それらの態様は、1つとして、本明細書に開示される望ましい属性を単独で担うものではない。
[0006]概して、いくつかの態様では、本開示は、エンハンスメントレイヤ参照ピクチャに基づいて、1つまたは複数の残差予測参照ピクチャを生成する技法を記載する。いくつかの態様によれば、生成された残差予測参照ピクチャは、ブロックレベルで重み付けされた一般化残差予測を適用する効果をもたらすことができる。生成された残差予測参照ピクチャは、それらが基づいているエンハンスメントレイヤからの参照ピクチャと同じ動きフィールドを共有することができる。生成された残差予測参照ピクチャは、それらが基づいているエンハンスメントレイヤ参照ピクチャと同じピクチャ順序カウント(POC)番号を有することもできる。残差予測参照ピクチャは、復号されるのではなく、ビットストリーム内で受信されるシグナリングされた情報に基づいて、生成され得る。本技法は、残差予測参照ピクチャをどのように生成するかに関する情報をシグナリングし得る。
[0007]いくつかの態様による、ビデオ情報を復号するための装置は、メモリユニットと、メモリユニットに動作可能に結合されたプロセッサとを含む。メモリユニットは、エンハンスメントレイヤの少なくとも1つの参照ピクチャリストを記憶するように構成され、少なくとも1つの参照ピクチャリストは、残差予測参照ピクチャの情報を備える。プロセッサは、残差予測参照ピクチャの生成についてのシグナリングされた情報を復号することと、生成される残差予測参照ピクチャが、当該残差予測参照ピクチャが生成されるエンハンスメントレイヤ参照ピクチャと同じ動きフィールドおよび同じピクチャ順序カウント(POC)を有するように、エンハンスメントレイヤ参照ピクチャおよび復号されたシグナリングされた情報に基づいて、残差予測参照ピクチャを生成することと、生成された残差予測参照ピクチャをエンハンスメントレイヤの少なくとも1つの参照ピクチャリストに記憶することと、を行うように構成される。
[0008]いくつかの態様による、ビデオ情報を符号化するための装置は、メモリユニットと、メモリユニットに動作可能に結合されたプロセッサとを含む。メモリユニットは、スケーラブルビデオコーディングにおいて、ビデオ情報の1つまたは複数のレイヤに関連する少なくとも1つの参照ピクチャリストを記憶するように構成される。プロセッサは、エンハンスメントレイヤに関連する、対応するエンハンスメントレイヤ参照ピクチャに少なくとも部分的に基づいて、残差予測参照ピクチャを生成することについての情報を符号化することと、残差予測参照ピクチャは、当該残差予測参照ピクチャが生成されるべきエンハンスメントレイヤ参照ピクチャと同じ動きフィールドおよび同じピクチャ順序カウント(POC)を有するように構成される、符号化された情報をビットストリーム内でシグナリングすることと、を行うように構成される。
[0009]1つまたは複数の例の詳細は、添付の図面および以下の説明に記載されている。他の特徴、目的、および利点は、その説明および図面から、ならびに特許請求の範囲から明らかになろう。
[0010]本開示で説明する態様による技法を利用し得る例示的なビデオ符号化および復号システムを示すブロック図。 [0011]本開示で説明する態様による技法を実装し得るビデオエンコーダの一例を示すブロック図。 [0012]本開示で説明する態様による技法を実装し得るビデオデコーダの一例を示すブロック図。 [0013]様々な寸法でスケーラビリティの一例を示す図。 [0014]スケーラブルビデオコーディング(SVC)のコーディング構造の一例を示す図。 [0015]SVCのコンテキストでアクセスユニットを示す図。 [0016]一般化残差予測(GRP)の単予測ケースを示す図。 [0017]本開示の態様による、残差予測参照ピクチャの生成を示すブロック図。 [0018]本開示の態様による、残差予測参照ピクチャを生成し、関連情報をシグナリングするための例示的な方法を示すフローチャート。 [0019]本開示の態様による、シグナリングされた情報に基づいて残差予測参照ピクチャを生成するための例示的な方法を示すフローチャート。 [0020]高度レイヤ間参照(EILR)を生成することを示す図。
[0021]本開示で説明する技法は、概して、スケーラブルビデオコーディング(SVC)および3Dビデオコーディングに関係する。たとえば、本技法は、高効率ビデオコーディング(HEVC)スケーラブルビデオコーディング(SVC)拡張に関係し、それとともにまたはそれの中で使用され得る。HEVC SVC拡張は、スケーラブルHEVC(SHVC)と呼ばれることもある。SVC拡張では、ビデオ情報の複数のレイヤがあり得る。最下位レベルにあるレイヤはベースレイヤ(BL:base layer)として働き、最上位にあるレイヤはエンハンストレイヤ(EL:enhanced layer)として働き得る。「エンハンストレイヤ」は「エンハンスメントレイヤ」と呼ばれることがあり、これらの用語は互換的に使用され得る。中間にあるすべてのレイヤは、ELまたはBLの一方または両方として働き得る。たとえば、中間にあるレイヤは、ベースレイヤまたは介在エンハンスメントレイヤ(intervening enhancement layer)など、それの下のレイヤのためのELであり、同時にそれの上のエンハンスメントレイヤのためのBLとして働き得る。
[0022]単に説明のために、本開示で説明する技法は、単に2つのレイヤ(たとえば、ベースレイヤなどの下位レベルレイヤと、エンハンストレイヤなどの上位レベルレイヤ)を含む例を用いて説明する。本開示で説明する例が、複数のベースレイヤおよびエンハンスメントレイヤをもつ例にも拡張され得ることを理解されたい。
[0023]ビデオコーディング規格には、ITU−T H.261、ISO/IEC MPEG−1ビデオ、ITU−T H.262またはISO/IEC MPEG−2ビデオ、ITU−T H.263、ISO/IEC MPEG−4 Visual、および、それのスケーラブルビデオコーディング(SVC)拡張とマルチビュービデオコーディング(MVC)拡張とを含む(ISO/IEC MPEG−4 AVCとしても知られる)ITU−T H.264が含まれる。SVCおよびMVCの最新のジョイントドラフトは、「Advanced Video Coding for Generic Audiovisual Services」、ITU−T勧告H.264、2010年3月に記載されている。さらに、新しいビデオコーディング規格、すなわち、高効率ビデオコーディング(HEVC)が、ITU−Tビデオコーディングエキスパートグループ(VCEG:Video Coding Experts Group)とISO/IECモーションピクチャエキスパートグループ(MPEG:Motion Picture Experts Group)とのジョイントコラボレーションチームオンビデオコーディング(JCT−VC:Joint Collaboration Team on Video Coding)によって開発されている。バージョン7とバージョン8とを含むHEVC仕様の様々な作業ドラフトが入手可能になっている。承認されたHECV仕様がhttp://www.itu.int/rec/T−REC−H.265−201304−Iで見られ、これらの各々は、その全体が参照により組み込まれる。
[0024]さらに、以下の刊行物の各々が参照によりその全体が本明細書に組み込まれる。以下の参照文献は、説明を容易にするために、本開示において参照文献に先行する対応する番号によって参照され得る。
[1]W.J.Han、J.Min、I.K.Kim、E.Alshina、A.Alshin、T.Lee;J.Chen;V.Seregin、S.Lee、Y.MHong、M.S.Cheon、N.Shlyakhov、K.McCann、T.Davies、J.H.Park、「Improved Video Compression Efficiency Through Flexible Unit Representation and Corresponding Extension of Coding Tools」、IEEE Transaction on Circuits and Systems for Video Technology、第20巻、第12号、ページ1709〜1720、2010年12月
[2]B.Bross、W.−J.Han、J.−R.Ohm、G.J.Sullivan、T.Wiegand、Y.−K.Wang、「High efficiency video coding(HEVC) text specification draft 10 (for FDIS & Consent)」、Joint Collaborative Team on Video Coding(JCT−VC) of ITU−T SG16 WP3 and ISO/IEC JTC1/SC29/WG11、JCTVC−L1003、ジュネーブ、スイス、2013年1月
[3]E.Francois、J.Taquet、C.Gisquet、G.Laroche、P.Onno、「Non−TE3:Simplification of Generalized Residual Inter−Layer Prediction(GRILP) in SHVC」、doc.JCTVC−L0104、Joint Collaborative Team on Video Coding(JCT−VC) of ITU−T SG16 WP3 and ISO/IEC JTC1/SC29/WG11の第12回会議、ジュネーブ、スイス、2013年1月14日〜23日
[4]R.Sjoeberg、Y.Chen、A.Fujibayashi、M.M.Hannuksela、J.Samuelsson、T.K.Tan、Y.−K.Wang、およびS.Wenger、「Overview of HEVC High−Level Syntax and Reference Picture Management」、IEEE Transaction on Circuits and Systems for Video Technology、第22巻、第12号、ページ1858〜1870、2012年12月
[5]J.Chen、J.Boyce、Y.Ye、M.M.Hannuksela、「SHVC Working Draft 1」、JCTVC−L1008、2013年3月
[6]J.Chen、Y.Ye、J.Boyce、M.M.Hannuksela、「SHVC Test Model 1(SHM1)」、JCTVC−L1007、2013年2月
[7]A.Aminlou、J.Lainema、K.Ugur、M.Hannuksela、「Non−CE3:Enhanced inter layer reference picture for RefIdx based scalability」、JCTVC−M0155、2013年4月
[8]Y.He、Y.Ye、「Non−SCE3:ILR enhancement with differential coding for RefIdx framework」、JCTVC−M0189、2013年4月
[0025]スケーラブルビデオコーディング(SVC)は、(信号対雑音比(SNR)とも呼ばれる)品質スケーラビリティ、空間スケーラビリティ、および/または時間スケーラビリティを提供するために使用され得る。強調されたレイヤは、ベースレイヤとは異なる空間解像度を有し得る。たとえば、ELとBLとの間の空間アスペクト比は、1.0、1.5、2.0または他の異なる比であり得る。言い換えれば、ELの空間アスペクトは、BLの空間アスペクトの1.0倍、1.5倍、または2.0倍に等しくなり得る。いくつかの例では、ELのスケーリングファクタはBLよりも大きくなり得る。たとえば、EL中のピクチャのサイズは、BL中のピクチャのサイズよりも大きくなり得る。このようにして、限定はしないが、ELの空間解像度がBLの空間解像度よりも大きくなることが可能であり得る。
[0026]一般化残差予測(GRP)のフレームワークは、それらの開示が参照によりそれらの全体で本明細書に組み込まれる、2012年7月10日に出願された米国仮出願第61/670,075号、2012年9月27日に出願された米国仮出願第61/706,692号、2013年7月2日に出願された米国出願第13/933,588号、2012年8月7日に出願された米国仮出願第61/680,522号、および2013年8月2日に出願された米国出願第13/957,841号に記載されている。GRPのフレームワークは、参照レイヤの残差に重み係数を適用することができる。レイヤ間残差予測は、現在のビデオユニット、たとえば、ブロックまたはフレームを予測する際に参照レイヤの残差を使用する。一般化残差予測では、現在のビデオユニットのレイヤ間残差予測は、現在のレイヤの残差、現在のレイヤの時間予測または空間予測、および参照レイヤの残差に基づき得る。参照レイヤの残差は、重み係数によって調整され得る。重み係数を適宜に調整することによって、残差予測の有効なコーディング利得がもたらされ得る。重み係数が1に設定されるとき、GRPは従来の残差予測に適応することができる。
[0027]しかしながら、高レベルシンタックス専用SHVC(high-level syntax only SHVC)では、HEVCシングルレイヤコーディングと比較されると、新しいブロックレベルのコーディングツールは存在せず、したがって、GRPはブロックレベルで提供され得ない。高レベルシンタックス専用SHVCでは、スライスおよびその上のレベルのシンタックス変更、ならびにピクチャのフィルタリングおよび/またはアップサンプリングを含むピクチャレベルの動作のみが許可される。
[0028]本開示に記載される技法は、高レベルシンタックス専用SHVCに重み付けされた一般化残差予測を組み込むことに対処し得る。本開示に記載される技法は、エンハンスメントレイヤ参照ピクチャに基づいて、1つまたは複数の残差予測参照ピクチャを生成することができる。残差予測参照ピクチャは、「GRP参照ピクチャ」と呼ばれることもある。いくつかの態様によれば、生成された残差予測参照ピクチャは、ブロックレベルで重み付けされた一般化残差予測を適用する効果をもたらすことができる。たとえば、残差予測参照ピクチャは、GRPで使用される重み係数を組み込むことができる。生成された残差予測参照ピクチャは、それらが基づいているエンハンスメントレイヤからの参照ピクチャと同じ動きフィールドを共有することができる。生成された残差予測参照ピクチャは、それらが基づいているエンハンスメントレイヤ参照ピクチャと同じピクチャ順序カウント(POC)番号を有することもできる。残差予測参照ピクチャは、復号されるのではなく、ビットストリーム内で受信されるシグナリングされた情報に基づいて、生成され得る。本技法は、残差予測参照ピクチャをどのように生成するかをシグナリングすることができる。一般に、SHVCは、POC番号にただ1つの参照ピクチャを提供する。複数の参照ピクチャが同じPOCに提供され得るので、本技法は、どの参照ピクチャが使用されるべきかをシグナリングする様々な方法を提供することもできる。
[0029]添付の図面を参照しながら新規のシステム、装置、および方法の様々な態様について以下でより十分に説明する。ただし、本開示は、多くの異なる形態で実施され得、本開示全体にわたって提示される任意の特定の構造または機能に限定されるものと解釈されるべきではない。むしろ、これらの態様は、本開示が周到で完全になり、本開示の範囲を当業者に十分に伝えるように与えられる。本明細書の教示に基づいて、本開示の範囲は、本発明の他の態様とは無関係に実装されるにせよ、または本開示の他の態様と組み合わせて実装されるにせよ、本明細書で開示する新規のシステム、装置、および方法のいかなる態様をもカバーするものであることを、当業者なら諒解されたい。たとえば、本明細書に記載の態様の複数を使用しても、装置は実装され得、または方法は実施され得る。さらに、本発明の範囲は、本明細書に記載の発明の様々な態様に加えてまたはそれらの態様以外に、他の構造、機能、または構造および機能を使用して実施されるそのような装置またはそのような方法をカバーするものとする。本明細書で開示する任意の態様が請求項の1つまたは複数の要素によって実施され得ることを理解されたい。
[0030]本明細書では特定の態様について説明するが、これらの態様の多くの変形および置換は本開示の範囲内に入る。好ましい態様のいくつかの利益および利点について説明するが、本開示の範囲は特定の利益、使用、または目的に限定されるものではない。むしろ、本開示の態様は、様々なワイヤレス技術、システム構成、ネットワーク、および伝送プロトコルに広く適用可能であるものとし、それらのいくつかを例として、図および好適な態様についての以下の説明において示す。発明を実施するための形態および図面は、本開示を限定するものではなく説明するものにすぎず、本開示の範囲は添付の特許請求の範囲およびそれの均等物によって定義される。
[0031]図1は、本開示で説明する態様による技法を利用し得る例示的なビデオ符号化および復号システムを示すブロック図である。図1に示すように、システム10は、宛先デバイス14によって後で復号されるべき符号化ビデオデータを与えるソースデバイス12を含む。特に、ソースデバイス12は、コンピュータ可読媒体16を介してビデオデータを宛先デバイス14に与える。ソースデバイス12および宛先デバイス14は、デスクトップコンピュータ、ノートブック(たとえば、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスのいずれかを備え得る。場合によっては、ソースデバイス12および宛先デバイス14は、ワイヤレス通信のために装備され得る。
[0032]宛先デバイス14は、コンピュータ可読媒体16を介して復号されるべき符号化ビデオデータを受信し得る。コンピュータ可読媒体16は、ソースデバイス12から宛先デバイス14に符号化されたビデオデータを移動させることができる任意のタイプの媒体またはデバイスを備え得る。一例では、コンピュータ可読媒体16は、ソースデバイス12が、符号化ビデオデータを宛先デバイス14にリアルタイムで直接送信することを可能にするための通信媒体を備え得る。符号化ビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先デバイス14に送信され得る。通信媒体は、無線周波数(RF)スペクトルまたは1つもしくは複数の物理伝送線路など、任意のワイヤレスまたはワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなど、パケットベースネットワークの一部を形成し得る。通信媒体は、ソースデバイス12から宛先デバイス14への通信を可能にするために有用であり得るルータ、スイッチ、基地局、または任意の他の機器を含み得る。
[0033]いくつかの例では、符号化データは、出力インターフェース22からストレージデバイスに出力され得る。同様に、符号化データは、入力インターフェースによってストレージデバイスからアクセスされ得る。ストレージデバイスは、ハードドライブ、ブルーレイ(登録商標)ディスク、DVD、CD−ROM、フラッシュメモリ、揮発性もしくは不揮発性メモリ、または符号化ビデオデータを記憶するための任意の他の好適なデジタル記憶媒体など、様々な分散されたまたはローカルにアクセスされるデータ記憶媒体のいずれかを含み得る。さらなる一例では、ストレージデバイスは、ソースデバイス12によって生成された符号化ビデオを記憶し得るファイルサーバまたは別の中間ストレージデバイスに対応し得る。宛先デバイス14は、ストリーミングまたはダウンロードを介してストレージデバイスから、記憶されたビデオデータにアクセスし得る。ファイルサーバは、符号化ビデオデータを記憶し、その符号化ビデオデータを宛先デバイス14に送信することが可能な任意のタイプのサーバであり得る。例示的なファイルサーバは、(たとえば、ウェブサイトのための)ウェブサーバ、FTPサーバ、ネットワーク接続ストレージ(NAS)デバイス、またはローカルディスクドライブを含む。宛先デバイス14は、インターネット接続を含む、任意の標準のデータ接続を介して符号化ビデオデータにアクセスし得る。これは、ファイルサーバに記憶された符号化ビデオデータにアクセスするのに好適であるワイヤレスチャネル(たとえば、Wi−Fi(登録商標)接続)、ワイヤード接続(たとえば、DSL、ケーブルモデムなど)、または両方の組合せを含み得る。ストレージデバイスからの符号化ビデオデータの送信は、ストリーミング送信、ダウンロード送信、またはそれらの組合せであり得る。
[0034]本開示の技法は、必ずしもワイヤレス適用例または設定に限定されるとは限らない。本技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、動的適応ストリーミングオーバーHTTP(DASH:dynamic adaptive streaming over HTTP)などのインターネットストリーミングビデオ送信、データ記憶媒体上に符号化されたデジタルビデオ、データ記憶媒体に記憶されたデジタルビデオの復号、または他の適用例など、様々なマルチメディア適用例のいずれかをサポートするビデオコーディングに適用され得る。いくつかの例では、システム10は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、および/またはビデオテレフォニーなどの適用例をサポートするために、一方向または双方向のビデオ送信をサポートするように構成され得る。
[0035]図1の例では、ソースデバイス12は、ビデオソース18と、ビデオエンコーダ20と、出力インターフェース22とを含む。宛先デバイス14は、入力インターフェース28と、ビデオデコーダ30と、ディスプレイデバイス32とを含む。本開示によれば、ソースデバイス12のビデオエンコーダ20は、複数の規格または規格拡張に準拠するビデオデータを含むビットストリームをコーディングするための技法を適用するように構成され得る。他の例では、ソースデバイスおよび宛先デバイスは他の構成要素または構成を含み得る。たとえば、ソースデバイス12は、外部カメラなど、外部ビデオソース18からビデオデータを受信し得る。同様に、宛先デバイス14は、内蔵ディスプレイデバイスを含むのではなく、外部ディスプレイデバイスとインターフェースし得る。
[0036]図1の図示のシステム10は一例にすぎない。現在のブロックの動きベクトル予測子の候補リストの候補を判断するための技法は、任意のデジタルビデオ符号化および/または復号デバイスによって実行され得る。概して、本開示の技法はビデオ符号化デバイスによって実行されるが、本技法は、一般に「コーデック」と呼ばれるビデオエンコーダ/デコーダによっても実行され得る。さらに、本開示の技法は、ビデオプリプロセッサによっても実行され得る。ソースデバイス12および宛先デバイス14は、ソースデバイス12が宛先デバイス14に送信するためのコード化ビデオデータを生成するような、コーディングデバイスの例にすぎない。いくつかの例では、デバイス12、14は、デバイス12、14の各々がビデオ符号化構成要素とビデオ復号構成要素とを含むように、実質的に対称的に動作し得る。したがって、システム10は、たとえば、ビデオストリーミング、ビデオ再生、ビデオブロードキャストまたはビデオ電話のための、ビデオデバイス12とビデオデバイス14との間の一方向または双方向のビデオ送信をサポートし得る。
[0037]ソースデバイス12のビデオソース18は、ビデオカメラなどのビデオキャプチャデバイス、あらかじめキャプチャされたビデオを含んでいるビデオアーカイブ、および/またはビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェースを含み得る。さらなる代替として、ビデオソース18は、ソースビデオとしてのコンピュータグラフィックスベースのデータ、またはライブビデオとアーカイブビデオとコンピュータ生成ビデオとの組合せを生成し得る。場合によっては、ビデオソース18がビデオカメラである場合、ソースデバイス12および宛先デバイス14は、いわゆるカメラフォンまたはビデオフォンを形成し得る。ただし、上述のように、本開示で説明する技法は、概してビデオコーディングに適用可能であり得、ワイヤレスおよび/またはワイヤード適用例に適用され得る。各場合において、キャプチャされたビデオ、以前にキャプチャされたビデオ、またはコンピュータ生成ビデオは、ビデオエンコーダ20によって符号化され得る。符号化されたビデオ情報は、次いで、出力インターフェース22によってコンピュータ可読媒体16上に出力され得る。
[0038]コンピュータ可読媒体16は、ワイヤレスブロードキャストまたはワイヤードネットワーク送信などの一時媒体、またはハードディスク、フラッシュドライブ、コンパクトディスク、デジタルビデオディスク、ブルーレイディスク、または他のコンピュータ可読媒体などの記憶媒体(すなわち、非一時的記憶媒体)を含み得る。いくつかの例では、ネットワークサーバ(図示せず)は、ソースデバイス12から符号化ビデオデータを受信し、たとえば、ネットワーク送信、直接ワイヤード通信などを介して、その符号化ビデオデータを宛先デバイス14に与え得る。同様に、ディスクスタンピング設備など、媒体製造設備のコンピューティングデバイスは、ソースデバイス12から符号化ビデオデータを受信し、その符号化ビデオデータを含んでいるディスクを生成し得る。したがって、様々な例では、コンピュータ可読媒体16は、様々な形態の1つまたは複数のコンピュータ可読媒体を含むと理解され得る。
[0039]宛先デバイス14の入力インターフェース28は、コンピュータ可読媒体16から情報を受信する。コンピュータ可読媒体16の情報は、ビデオエンコーダ20によって定義され、またビデオデコーダ30によって使用される、ブロックおよび他のコード化ユニット、たとえば、GOPの特性および/または処理を記述するシンタックス要素を含む、シンタックス情報を含み得る。ディスプレイデバイス32は、復号されたビデオデータをユーザに対して表示し、陰極線管(CRT)、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、または別のタイプのディスプレイデバイスなど、様々なディスプレイデバイスのいずれかを備え得る。
[0040]ビデオエンコーダ20およびビデオデコーダ30は、現在開発中の高効率ビデオコーディング(HEVC)規格などのビデオコーディング規格に従って動作し得、HEVCテストモデル(HM)に準拠し得る。代替的に、ビデオエンコーダ20およびビデオデコーダ30は、代替的にMPEG−4,Part 10,Advanced Video Coding(AVC)と呼ばれるITU−T H.264規格など、他のプロプライエタリ規格もしくは業界規格、またはそのような規格の拡張に従って動作し得る。ただし、本開示の技法は、限定はしないが、上記に記載した規格のいずれかを含む特定のコーディング規格に限定されない。ビデオコーディング規格の他の例としては、MPEG−2およびITU−T H.263がある。図1には示されていないが、いくつかの態様では、ビデオエンコーダ20およびビデオデコーダ30は、それぞれオーディオエンコーダおよびオーディオデコーダと統合され得、適切なMUX−DEMUXユニット、または他のハードウェアおよびソフトウェアを含んで、共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を処理し得る。適用可能な場合、MUX−DEMUXユニットは、ITU H.223マルチプレクサプロトコル、またはユーザデータグラムプロトコル(UDP)などの他のプロトコルに準拠し得る。
[0041]ビデオエンコーダ20およびビデオデコーダ30はそれぞれ、1つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアまたはそれらの任意の組合せなど、様々な好適なエンコーダ回路のいずれかとして実装され得る。本技法が部分的にソフトウェアで実装されるとき、デバイスは、好適な非一時的コンピュータ可読媒体にソフトウェアの命令を記憶し、1つまたは複数のプロセッサを使用してその命令をハードウェアで実行して、本開示の技法を実行し得る。ビデオエンコーダ20およびビデオデコーダ30の各々は1つまたは複数のエンコーダまたはデコーダ中に含まれ得、そのいずれも、それぞれのデバイスにおいて複合エンコーダ/デコーダ(コーデック)の一部として統合され得る。ビデオエンコーダ20および/またはビデオデコーダ30を含むデバイスは、集積回路、マイクロプロセッサ、および/またはセルラー電話などのワイヤレス通信デバイスを備え得る。
[0042]JCT−VCは、HEVC規格の開発に取り組んでいる。HEVC規格化の取り組みは、HEVCテストモデル(HM)と呼ばれるビデオコーディングデバイスの発展的モデルに基づく。HMは、たとえば、ITU−T H.264/AVCに従う既存のデバイスに対してビデオコーディングデバイスのいくつかの追加の能力を仮定する。たとえば、H.264は9つのイントラ予測符号化モードを提供するが、HMは33個ものイントラ予測符号化モードを提供し得る。
[0043]概して、HMの作業モデルは、ビデオフレームまたはピクチャが、ルーマサンプルとクロマサンプルの両方を含む一連のツリーブロックまたは最大コーディングユニット(LCU:largest coding unit)に分割され得ることを記載している。ビットストリーム内のシンタックスデータが、ピクセルの数に関して最大コーディングユニットであるLCUのサイズを定義し得る。スライスは、コーディング順序でいくつかの連続するツリーブロックを含む。ビデオフレームまたはピクチャは、1つまたは複数のスライスに区分され得る。各ツリーブロックは、4分木に従ってコーディングユニット(CU)に分割され得る。概して、4分木データ構造はCUごとに1つのノードを含み、ルートノードはツリーブロックに対応する。CUが4つのサブCUに分割された場合、CUに対応するノードは4つのリーフノードを含み、リーフノードの各々はサブCUのうちの1つに対応する。
[0044]4分木データ構造の各ノードは、対応するCUのシンタックスデータを与え得る。たとえば、4分木のノードは、そのノードに対応するCUがサブCUに分割されるかどうかを示す分割フラグを含み得る。CUのシンタックス要素は、再帰的に定義され得、かつCUがサブCUに分割されるかどうかに依存し得る。CUがさらに分割されない場合、そのCUはリーフCUと呼ばれる。本開示では、元のリーフCUの明示的分割が存在しない場合でも、リーフCUの4つのサブCUをリーフCUとも呼ぶ。たとえば、16×16サイズのCUがさらに分割されない場合、この16×16CUが決して分割されなくても、4つの8×8サブCUをリーフCUとも呼ぶ。
[0045]CUは、CUがサイズの差異を有さないことを除いて、H.264規格のマクロブロックと同様の目的を有する。たとえば、ツリーブロックは、4つの子ノード(サブCUとも呼ばれる)に分割され得、各子ノードは、今度は親ノードとなり、別の4つの子ノードに分割され得る。4分木のリーフノードと呼ばれる、最後の分割されていない子ノードは、リーフCUとも呼ばれるコーディングノードを備える。コード化ビットストリームに関連するシンタックスデータは、最大CU深さと呼ばれる、ツリーブロックが分割され得る最大回数を定義し得、また、コーディングノードの最小サイズを定義し得る。それに応じて、ビットストリームは最小コーディングユニット(SCU:smallest coding unit)をも定義し得る。本開示では、HEVCのコンテキストにおけるCU、PU、もしくはTU、または他の規格のコンテキストにおける同様のデータ構造(たとえば、H.264/AVCにおけるマクロブロックおよびそれのサブブロック)のいずれかを指すために「ブロック」という用語を使用する。
[0046]CUは、コーディングノードと、コーディングノードに関連する予測ユニット(PU:prediction unit)および変換ユニット(TU:transform unit)とを含む。CUのサイズは、コーディングノードのサイズに対応し、かつ形状が方形でなければならない。CUのサイズは、8×8ピクセルから最大64×64以上のピクセルを有するツリーブロックのサイズまでに及び得る。各CUは、1つまたは複数のPUと、1つまたは複数のTUとを含み得る。CUに関連するシンタックスデータは、たとえば、CUを1つまたは複数のPUに区分することを記述し得る。区分モードは、CUが、スキップモード符号化もしくはダイレクトモード符号化されるか、イントラ予測モード符号化されるか、またはインター予測モード符号化されるかによって異なり得る。PUは、形状が非方形になるように区分され得る。CUに関連するシンタックスデータは、たとえば、4分木に従って、CUを1つまたは複数のTUに区分することも記述し得る。TUは、形状が方形または非方形(たとえば、矩形)であり得る。
[0047]HEVC規格は、CUごとに異なり得るTUに従う変換を可能にする。TUは、一般に、区分されたLCUについて定義された所与のCU内のPUのサイズに基づいてサイズ決定されるが、常にそうであるとは限らない。TUは、一般にPUと同じサイズであるかまたはPUよりも小さい。いくつかの例では、CUに対応する残差サンプルは、「残差クワッドツリー」(RQT:residual quad tree)として知られるクワッドツリー構造を使用して、より小さいユニットに再分割され得る。RQTのリーフノードは変換ユニット(TU)と呼ばれることがある。TUに関連するピクセル差分値は、量子化され得る変換係数を生成するために変換され得る。
[0048]リーフCUは、1つまたは複数の予測ユニット(PU)を含み得る。概して、PUは、対応するCUの全部または一部分に対応する空間的エリアを表し、そのPUの参照サンプルを取り出すためのデータを含み得る。その上、PUは、予測に関係するデータを含む。たとえば、PUがイントラモード符号化されるとき、PUについてのデータは、PUに対応するTUについてのイントラ予測モードを記述するデータを含み得る残差4分木(RQT)中に含まれ得る。別の例として、PUがインターモード符号化されるとき、PUは、PUのための1つまたは複数の動きベクトルを定義するデータを含み得る。PUの動きベクトルを定義するデータは、たとえば、動きベクトルの水平成分、動きベクトルの垂直成分、動きベクトルの解像度(たとえば、1/4ピクセル精度または1/8ピクセル精度)、動きベクトルが指す参照ピクチャ、および/または動きベクトルの参照ピクチャリスト(たとえば、リスト0、リスト1、またはリストC)を記述し得る。
[0049]1つまたは複数のPUを有するリーフCUはまた、1つまたは複数の変換ユニット(TU)を含み得る。変換ユニットは、上記で説明したように、(TU4分木構造とも呼ばれる)RQTを使用して指定され得る。たとえば、分割フラグは、リーフCUが4つの変換ユニットに分割されるかどうかを示し得る。次いで、各変換ユニットは、さらに、さらなるサブTUに分割され得る。TUがさらに分割されないとき、そのTUはリーフTUと呼ばれることがある。概して、イントラコーディングの場合、リーフCUに属するすべてのリーフTUは同じイントラ予測モードを共有する。すなわち、概して、リーフCUのすべてのTUの予測値を計算するために同じイントラ予測モードが適用される。イントラコーディングの場合、ビデオエンコーダは、イントラ予測モードを使用して各リーフTUの残差値をTUに対応するCUの一部と元のブロックとの間の差分として計算し得る。TUは、必ずしもPUのサイズに制限されるとは限らない。したがって、TUはPUよりも大きくまたは小さくなり得る。イントラコーディングの場合、PUは、同じCUの対応するリーフTUとコロケートされ得る。いくつかの例では、リーフTUの最大サイズは、対応するリーフCUのサイズに対応し得る。
[0050]さらに、リーフCUのTUはまた、残差4分木(RQT)と呼ばれる、それぞれの4分木データ構造に関連付けられ得る。すなわち、リーフCUは、リーフCUがどのようにTUに区分されるかを示す4分木を含み得る。TU4分木のルートノードは概してリーフCUに対応し、CU4分木のルートノードは概してツリーブロック(またはLCU)に対応する。分割されないRQTのTUはリーフTUと呼ばれる。概して、本開示では、特に明記しない限り、リーフCUおよびリーフTUに言及するためにそれぞれCUおよびTUという用語を使用する。
[0051]ビデオシーケンスは、一般に、一連のビデオフレームまたはピクチャを含む。ピクチャグループ(GOP)は、概して、ビデオピクチャのうちの一連の1つまたは複数を備える。GOPは、GOP中に含まれるいくつかのピクチャを記述するシンタックスデータを、GOPのヘッダ中、ピクチャのうちの1つまたは複数のヘッダ中、または他の場所に含み得る。ピクチャの各スライスは、それぞれのスライスの符号化モードを記述するスライスシンタックスデータを含み得る。ビデオエンコーダ20は、一般に、ビデオデータを符号化するために個々のビデオスライス内のビデオブロックに対して動作する。ビデオブロックは、CU内のコーディングノードに対応し得る。ビデオブロックは、固定サイズまたは可変サイズを有し得、かつ指定のコーディング規格に応じてサイズが異なり得る。
[0052]一例として、HMは、様々なPUサイズでの予測をサポートする。特定のCUのサイズが2N×2Nであると仮定すると、HMは、2N×2NまたはN×NのPUサイズでのイントラ予測をサポートし、2N×2N、2N×N、N×2N、またはN×Nの対称的なPUサイズでのインター予測をサポートする。HMはまた、2N×nU、2N×nD、nL×2N、およびnR×2NのPUサイズでのインター予測のための非対称区分をサポートする。非対称区分では、CUの一方向は区分されないが、他の方向は25%と75%とに区分される。25%の区分に対応するCUの部分は、「n」とその後ろに付く「Up」、「Down」、「Left」、または「Right」という表示によって示される。したがって、たとえば、「2N×nU」は、上部の2N×0.5N PUと下部の2N×1.5N PUとで水平方向に区分された2N×2N CUを指す。
[0053]本開示では、「N×N(NxN)」および「N×N(N by N)」は、垂直寸法および水平寸法に関するビデオブロックのピクセル寸法、たとえば、16×16(16x16)ピクセルまたは16×16(16 by 16)ピクセルを指すために互換的に使用され得る。概して、16×16ブロックは、垂直方向に16ピクセルを有し(y=16)、水平方向に16ピクセルを有する(x=16)。同様に、N×Nブロックは、概して、垂直方向にNピクセルを有し、水平方向にNピクセルを有し、ただし、Nは非負整数値を表す。ブロック中のピクセルは行と列で構成され得る。さらに、ブロックは、必ずしも、水平方向に垂直方向と同じ数のピクセルを有する必要はない。たとえば、ブロックはN×Mピクセルを備え得、ただし、Mは必ずしもNに等しいとは限らない。
[0054]CUのPUを使用したイントラ予測コーディングまたはインター予測コーディングの後、ビデオエンコーダ20は、CUのTUのための残差データを計算し得る。PUは、(ピクセル領域とも呼ばれる)空間領域において予測ピクセルデータを生成する方法またはモードを記述するシンタックスデータを備え得、TUは、変換、たとえば、残差ビデオデータへの離散コサイン変換(DCT)、整数変換、ウェーブレット変換、または概念的に同様の変換の適用後に、変換領域において係数を備え得る。残差データは、符号化されていないピクチャのピクセルと、PUに対応する予測値との間のピクセル差分に対応し得る。ビデオエンコーダ20は、CUのための残差データを含むTUを形成し、次いで、TUを変換して、CUの変換係数を生成し得る。
[0055]変換係数を生成するための任意の変換の後に、ビデオエンコーダ20は、変換係数の量子化を実行し得る。一般に、量子化は、係数を表すために使用されるデータの量をできるだけ低減するために変換係数が量子化され、さらなる圧縮を行うプロセスを指す。量子化プロセスは、係数の一部または全部に関連するビット深度を低減し得る。たとえば、量子化中にnビット値がmビット値に切り捨てられ得、ただし、nはmよりも大きい。
[0056]量子化の後に、ビデオエンコーダは、変換係数を走査して、量子化変換係数を含む2次元行列から1次元ベクトルを生成し得る。走査は、より高いエネルギー(したがってより低い周波数)の係数をアレイの前方に配置し、より低いエネルギー(したがってより高い周波数)の係数をアレイの後方に配置するように設計され得る。いくつかの例では、ビデオエンコーダ20は、エントロピー符号化され得るシリアル化ベクトルを生成するために、量子化変換係数を走査するためにあらかじめ定義された走査順序を利用し得る。他の例では、ビデオエンコーダ20は適応型走査を実行し得る。量子化変換係数を走査して1次元ベクトルを形成した後に、ビデオエンコーダ20は、たとえば、コンテキスト適応型可変長コーディング(CAVLC:context-adaptive variable length coding)、コンテキスト適応型バイナリ算術コーディング(CABAC:context-adaptive binary arithmetic coding)、シンタックスベースコンテキスト適応型バイナリ算術コーディング(SBAC:syntax-based context-adaptive binary arithmetic coding)、確率間隔区分エントロピー(PIPE:Probability Interval Partitioning Entropy)コーディング、または別のエントロピー符号化方法に従って1次元ベクトルをエントロピー符号化し得る。ビデオエンコーダ20はまた、ビデオデータを復号する際にビデオデコーダ30が使用するための符号化ビデオデータに関連するシンタックス要素をエントロピー符号化し得る。
[0057]CABACを実行するために、ビデオエンコーダ20は、送信されるべきシンボルに、コンテキストモデル内のコンテキストを割り当て得る。コンテキストは、たとえば、シンボルの隣接値が非0であるか否かに関係し得る。CAVLCを実行するために、ビデオエンコーダ20は、送信されるべきシンボルのための可変長コードを選択し得る。VLCにおけるコードワードは、比較的短いコードが優勢シンボルに対応し、より長いコードが劣勢シンボルに対応するように構成され得る。このようにして、VLCの使用は、たとえば、送信されるべき各シンボルのために等長コードワードを使用するよりも、ビット節約を達成し得る。確率判断は、シンボルに割り当てられたコンテキストに基づき得る。
[0058]ビデオエンコーダ20は、さらに、ブロックベースのシンタックスデータ、フレームベースのシンタックスデータ、およびGOPベースのシンタックスデータなどのシンタックスデータを、たとえば、フレームヘッダ、ブロックヘッダ、スライスヘッダ、またはGOPヘッダ中でビデオデコーダ30に送り得る。GOPシンタックスデータは、それぞれのGOP中のいくつかのフレームを記述し得、かつフレームシンタックスデータは、対応するフレームを符号化するために使用される符号化/予測モードを示し得る。
[0059]図2は、本開示で説明する態様による技法を実装し得るビデオエンコーダの例を示すブロック図である。ビデオエンコーダ20は、本開示の技法のいずれかまたはすべてを実行するように構成され得る。一例として、モード選択ユニット40は、本開示で説明する技法のいずれかまたはすべてを実行するように構成され得る。ただし、本開示の態様はそのように限定されない。いくつかの例では、本開示で説明する技法は、ビデオエンコーダ20の様々な構成要素間で共有され得る。いくつかの例では、追加としてまたは代わりに、プロセッサ(図示せず)が、本開示で説明する技法のいずれかまたはすべてを実行するように構成され得る。
[0060]いくつかの実施形態では、モード選択ユニット40、動き推定ユニット42、動き補償ユニット44(もしくはモード選択ユニット40の別の構成要素、図示済みもしくは図示せず)、またはエンコーダ20の別の構成要素(図示済みもしくは図示せず)が本開示の技法を実行し得る。たとえば、モード選択ユニット40は、どの動き推定および動き補償が実行され得るかに基づいて、1つまたは複数の残差予測参照ピクチャを生成し得る。エンコーダ20は、エンハンスメントレイヤに関連する、対応するエンハンスメントレイヤ参照ピクチャに少なくとも部分的に基づいて、残差予測参照ピクチャを生成することについての情報を符号化し得る。生成されるべき残差予測参照ピクチャは、それから残差予測参照ピクチャが生成されるべきエンハンスメントレイヤ参照ピクチャと同じ動きフィールドおよび同じピクチャ順序カウント(POC)を有することができる。エンコーダ20は、符号化された情報をビットストリーム内でシグナリングすることができる。
[0061]ビデオエンコーダ20は、ビデオスライス内のビデオブロックのイントラコーディングおよびインターコーディングを実行し得る。イントラコーディングは、所与のビデオフレームまたはピクチャ内のビデオの空間的冗長性を低減または除去するために空間的予測に依拠する。インターコーディングは、ビデオシーケンスの隣接フレームまたはピクチャ内のビデオの時間的冗長性を低減または除去するために時間的予測に依拠する。イントラ(I)モードは、いくつかの空間ベースのコーディングモードのいずれかを指し得る。単方向予測(Pモード)または双方向予測(Bモード)などのインターモードは、いくつかの時間ベースのコーディングモードのいずれかを指し得る。
[0062]図2に示すように、ビデオエンコーダ20は、符号化されるべきビデオフレーム内の現在のビデオブロックを受信する。図1の例では、ビデオエンコーダ20は、モード選択ユニット40と、参照フレームメモリ64と、加算器50と、変換処理ユニット52と、量子化ユニット54と、エントロピー符号化ユニット56とを含む。モード選択ユニット40は、今度は、動き補償ユニット44と、動き推定ユニット42と、イントラ予測ユニット46と、パーティションユニット48とを含む。ビデオブロック再構成のために、ビデオエンコーダ20はまた、逆量子化ユニット58と、逆変換ユニット60と、加算器62とを含む。再構成されたビデオからブロッキネスアーティファクトを除去するためにブロック境界をフィルタ処理するデブロッキングフィルタ(図2に図示せず)も含まれ得る。所望される場合、デブロッキングフィルタは、一般に、加算器62の出力をフィルタ処理することになる。また、デブロッキングフィルタに加えて追加のフィルタ(ループ内またはループ後)が使用され得る。そのようなフィルタは、簡潔のために示されていないが、所望される場合、(ループ内フィルタとして)加算器50の出力をフィルタ処理し得る。
[0063]符号化プロセス中に、ビデオエンコーダ20は、コーディングされるべきビデオフレームまたはスライスを受信する。フレームまたはスライスは複数のビデオブロックに分割され得る。動き推定ユニット42および動き補償ユニット44は、時間的予測を行うために、1つまたは複数の参照フレーム中の1つまたは複数のブロックに対して、受信されたビデオブロックのインター予測コーディングを実行する。イントラ予測ユニット46は、代替的に、空間的予測を行うために、コーディングされるべきブロックと同じフレームまたはスライス中の1つまたは複数の隣接ブロックに対して受信されたビデオブロックのイントラ予測コーディングを実行し得る。ビデオエンコーダ20は、たとえば、ビデオデータのブロックごとに適切なコーディングモードを選択するために、複数のコーディングパスを実行し得る。
[0064]その上、パーティションユニット48は、前のコーディングパスにおける前の区分方式の評価に基づいて、ビデオデータのブロックをサブブロックに区分し得る。たとえば、パーティションユニット48は、初めにフレームまたはスライスをLCUに区分し、レートひずみ分析(たとえば、レートひずみ最適化)に基づいてLCUの各々をサブCUに区分し得る。モード選択ユニット40は、LCUをサブCUに区分することを示す4分木データ構造をさらに生成し得る。4分木のリーフノードCUは、1つまたは複数のPUおよび1つまたは複数のTUを含み得る。
[0065]モード選択ユニット40は、たとえば、誤差結果に基づいて、コーディングモード、すなわち、イントラまたはインターのうちの1つを選択することができ、残差ブロックデータを生成するために、得られたイントラコーディングされたブロックまたはインターコーディングされたブロックを加算器50に与え、かつ参照フレームとして使用するための符号化されたブロックを復元するために、得られたイントラコーディングされたブロックまたはインターコーディングされたブロックを加算器62に与える。モード選択ユニット40はまた、動きベクトル、イントラモードインジケータ、パーティション情報、および他のそのようなシンタックス情報などのシンタックス要素をエントロピー符号化ユニット56に与える。
[0066]動き推定ユニット42および動き補償ユニット44は、高度に統合され得るが、概念的な目的のために別々に示してある。動き推定ユニット42によって実行される動き推定は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、たとえば、現在のフレーム(または他のコード化ユニット)内でコーディングされている現在のブロックに対する参照フレーム(または他のコード化ユニット)内の予測ブロックに対する現在のビデオフレームまたはピクチャ内のビデオブロックのPUの変位を示し得る。予測ブロックは、絶対値差分和(SAD:sum of absolute difference)、2乗差分和(SSD:sum of square difference)、または他の差分メトリックによって判断され得るピクセル差分に関して、コーディングされるべきブロックにぴったり一致することがわかるブロックである。いくつかの例では、ビデオエンコーダ20は、参照フレームメモリ64に記憶された参照ピクチャのサブ整数ピクセル位置の値を計算し得る。たとえば、ビデオエンコーダ20は、参照ピクチャの1/4ピクセル位置、1/8ピクセル位置、または他の分数ピクセル位置の値を補間し得る。したがって、動き推定ユニット42は、フルピクセル位置と分数ピクセル位置とに対する動き探索を実行し、分数ピクセル精度で動きベクトルを出力し得る。
[0067]動き推定ユニット42は、PUの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコード化スライスにおけるビデオブロックのPUのための動きベクトルを計算する。参照ピクチャは、第1の参照ピクチャリスト(リスト0)または第2の参照ピクチャリスト(リスト1)から選択され得、それらの参照ピクチャリストの各々は、参照フレームメモリ64に記憶された1つまたは複数の参照ピクチャを識別する。動き推定ユニット42は、計算された動きベクトルをエントロピー符号化ユニット56と動き補償ユニット44とに送る。
[0068]動き補償ユニット44によって実行される動き補償は、動き推定ユニット42によって判断された動きベクトルに基づいて予測ブロックをフェッチまたは生成することに関与し得る。この場合も、いくつかの例では、動き推定ユニット42および動き補償ユニット44は機能的に統合され得る。現在のビデオブロックのPUについての動きベクトルを受信すると、動き補償ユニット44は、動きベクトルが参照ピクチャリストのうちの1つにおいて指す予測ブロックの位置を特定し得る。加算器50は、以下で説明するように、コーディングされている現在のビデオブロックのピクセル値から予測ブロックのピクセル値を減算し、ピクセル差分値を形成することによって、残差ビデオブロックを形成する。概して、動き推定ユニット42はルーマ成分に対して動き推定を実行し、かつ動き補償ユニット44は、クロマ成分とルーマ成分の両方のためにルーマ成分に基づいて計算された動きベクトルを使用する。モード選択ユニット40はまた、ビデオスライスのビデオブロックを復号する際にビデオデコーダ30が使用するためのビデオブロックとビデオスライスとに関連するシンタックス要素を生成し得る。
[0069]イントラ予測ユニット46は、上記で説明したように、動き推定ユニット42と動き補償ユニット44とによって実行されるインター予測の代替として、現在ブロックをイントラ予測し得る。特に、イントラ予測ユニット46は、現在のブロックを符号化するために使用すべきイントラ予測モードを決定し得る。いくつかの例では、イントラ予測ユニット46は、たとえば、別個の符号化パス中に、様々なイントラ予測モードを使用して現在のブロックを符号化し得、イントラ予測ユニット46(または、いくつかの例では、モード選択ユニット40)は、テストされたモードから使用するのに適切なイントラ予測モードを選択し得る。
[0070]たとえば、イントラ予測ユニット46は、様々なテストされたイントラ予測モードのためのレートひずみ分析を使用してレートひずみ値を計算し、テストされたモードの中で最良のレートひずみ特性を有するイントラ予測モードを選択し得る。レートひずみ分析は、概して、符号化ブロックと、符号化ブロックを生成するために符号化された元の符号化されていないブロックとの間のひずみ(または誤差)の量、ならびに符号化ブロックを生成するために使用されるビットレート(すなわち、ビット数)を決定する。イントラ予測ユニット46は、どのイントラ予測モードがブロックについて最良のレートひずみ値を呈するかを決定するために、様々な符号化ブロックのひずみおよびレートから比率を計算し得る。
[0071]ブロックのためのイントラ予測モードを選択した後に、イントラ予測ユニット46は、ブロックのための選択されたイントラ予測モードを示す情報をエントロピー符号化ユニット56に提供し得る。エントロピー符号化ユニット56は、選択されたイントラ予測モードを示す情報を符号化し得る。ビデオエンコーダ20は、送信ビットストリーム中に、複数のイントラ予測モードインデックステーブルおよび複数の変更されたイントラ予測モードインデックステーブル(コードワードマッピングテーブルとも呼ばれる)と、様々なブロックの符号化コンテキストの定義と、コンテキストの各々について使用すべき、最確イントラ予測モード、イントラ予測モードインデックステーブル、および変更されたイントラ予測モードインデックステーブルの指示とを含み得る構成データを含み得る。
[0072]ビデオエンコーダ20は、コーディングされている元のビデオブロックから、モード選択ユニット40からの予測データを減算することによって残差ビデオブロックを形成する。加算器50は、この減算演算を実行する1つまたは複数の構成要素を表す。変換処理ユニット52は、離散コサイン変換(DCT)または概念的に同様の変換などの変換を残差ブロックに適用し、残差変換係数値を備えるビデオブロックを生成する。変換処理ユニット52は、DCTと概念的に同様である他の変換を実行し得る。ウェーブレット変換、整数変換、サブバンド変換または他のタイプの変換も使用され得る。いずれの場合も、変換処理ユニット52は、変換を残差ブロックに適用し、残差変換係数のブロックを生成する。変換は、残差情報をピクセル値領域から周波数領域などの変換領域に変換し得る。変換処理ユニット52は、得られた変換係数を量子化ユニット54に送り得る。量子化ユニット54は、ビットレートをさらに低減するために変換係数を量子化する。量子化プロセスは、係数の一部または全部に関連するビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって変更され得る。いくつかの例では、量子化ユニット54は、次いで、量子化変換係数を含む行列の走査を実行し得る。代替的に、エントロピー符号化ユニット56が走査を実行し得る。
[0073]量子化の後、エントロピー符号化ユニット56は、量子化変換係数をエントロピーコーディングする。たとえば、エントロピー符号化ユニット56は、コンテキスト適応型可変長コーディング(CAVLC)、コンテキスト適応型バイナリ算術コーディング(CABAC)、シンタックスベースコンテキスト適応型バイナリ算術コーディング(SBAC)、確率間隔区分エントロピー(PIPE)コーディングまたは別のエントロピーコーディング技法を実行し得る。コンテキストベースのエントロピーコーディングの場合、コンテキストは、隣接するブロックに基づき得る。エントロピー符号化ユニット56によるエントロピーコーディングの後、符号化されたビットストリームは、別のデバイス(たとえば、ビデオデコーダ30)に送信されるか、または後で送信するかまたは取り出すためにアーカイブされ得る。
[0074]逆量子化ユニット58および逆変換ユニット60は、それぞれ逆量子化および逆変換を適用して、たとえば参照ブロックとして後で使用するために、ピクセル領域中で残差ブロックを再構成する。動き補償ユニット44は、残差ブロックを参照フレームメモリ64のフレームのうちの1つの予測ブロックに加算することによって参照ブロックを計算し得る。動き補償ユニット44はまた、再構成された残差ブロックに1つまたは複数の補間フィルタを適用して、動き推定において使用するサブ整数ピクセル値を計算し得る。加算器62は、再構成された残差ブロックを、動き補償ユニット44によって生成された動き補償予測ブロックに加算して、参照フレームメモリ64に記憶するための再構成されたビデオブロックを生成する。再構成されたビデオブロックは、後続のビデオフレーム中のブロックをインターコーディングするために動き推定ユニット42および動き補償ユニット44によって参照ブロックとして使用され得る。
[0075]図3は、本開示で説明する態様による技法を実装し得るビデオデコーダの例を示すブロック図である。ビデオデコーダ30は、本開示の技法のいずれかまたはすべてを実行するように構成され得る。一例として、動き補償ユニット72、および/またはイントラ予測ユニット74は、本開示で説明する技法のいずれかまたはすべてを実行するように構成され得る。ただし、本開示の態様はそのように限定されない。いくつかの例では、本開示で説明する技法は、ビデオデコーダ30の様々な構成要素間で共有され得る。いくつかの例では、追加としてまたは代わりに、プロセッサ(図示せず)が、本開示で説明する技法のいずれかまたはすべてを実行するように構成され得る。
[0076]いくつかの実施形態では、エントロピー復号ユニット70、動き補償ユニット72、またはデコーダ30の別の構成要素(図示済みまたは図示せず)が本開示の技法を実行し得る。デコーダ30は、残差予測参照ピクチャの生成についてのシグナリングされた情報を復号することができる。動き補償ユニット72は、生成される残差予測参照ピクチャが、当該残差予測参照ピクチャが生成されるエンハンスメントレイヤ参照ピクチャと同じ動きフィールドおよび同じピクチャ順序カウント(POC)を有するように、エンハンスメントレイヤ参照ピクチャおよび復号されたシグナリングされた情報に基づいて、残差予測参照ピクチャを生成することができる。動き補償ユニット72は、エンハンスメントレイヤの少なくとも1つの参照ピクチャリスト(たとえば、参照フレームメモリ82)に生成された残差予測参照ピクチャを記憶することができる。
[0077]図3の例では、ビデオデコーダ30は、エントロピー復号ユニット70と、動き補償ユニット72と、イントラ予測ユニット74と、逆量子化ユニット76と、逆変換ユニット78と、参照フレームメモリ82と、加算器80とを含む。ビデオデコーダ30は、いくつかの例では、ビデオエンコーダ20(図2)に関して説明した符号化パスとは概して逆の復号パスを実行し得る。動き補償ユニット72は、エントロピー復号ユニット70から受信された動きベクトルに基づいて予測データを生成し得、イントラ予測ユニット74は、エントロピー復号ユニット70から受信されたイントラ予測モードインジケータに基づいて予測データを生成し得る。
[0078]復号プロセス中に、ビデオデコーダ30は、ビデオエンコーダ20から、符号化ビデオスライスのビデオブロックと、関連するシンタックス要素とを表す符号化ビデオビットストリームを受信する。ビデオデコーダ30のエントロピー復号ユニット70は、量子化係数、動きベクトルまたはイントラ予測モードインジケータ、および他のシンタックス要素を生成するためにビットストリームをエントロピー復号する。エントロピー復号ユニット70は、動きベクトルと他の予測シンタックス要素とを動き補償ユニット72に転送する。ビデオデコーダ30は、ビデオスライスレベルおよび/またはビデオブロックレベルでシンタックス要素を受信し得る。
[0079]ビデオスライスがイントラコード化(I)スライスとしてコーディングされるとき、イントラ予測ユニット74は、シグナリングされたイントラ予測モードと、現在フレームまたはピクチャの、前に復号されたブロックからのデータとに基づいて、現在のビデオスライスのビデオブロックのための予測データを生成し得る。ビデオフレームがインターコード化(たとえば、B、PまたはGPB)スライスとしてコーディングされるとき、動き補償ユニット72は、エントロピー復号ユニット70から受信された動きベクトルと他のシンタックス要素とに基づいて、現在のビデオスライスのビデオブロックのための予測ブロックを生成する。予測ブロックは、参照ピクチャリストのうちの1つ内の参照ピクチャのうちの1つから生成され得る。ビデオデコーダ30は、参照フレームメモリ82に記憶された参照ピクチャに基づいて、デフォルトの構成技法を使用して、参照フレームリスト、すなわち、リスト0およびリスト1を構成し得る。動き補償ユニット72は、動きベクトルと他のシンタックス要素とをパースすることによって現在のビデオスライスのビデオブロックのための予測情報を決定し、その予測情報を使用して、復号されている現在のビデオブロックのための予測ブロックを生成する。たとえば、動き補償ユニット72は、ビデオスライスのビデオブロックをコーディングするために使用される予測モード(たとえば、イントラまたはインター予測)と、インター予測スライスタイプ(たとえば、Bスライス、Pスライス、またはGPBスライス)と、スライスの参照ピクチャリストのうちの1つまたは複数のための構成情報と、スライスの各インター符号化ビデオブロックのための動きベクトルと、スライスの各インターコード化ビデオブロックのためのインター予測ステータスと、現在のビデオスライス中のビデオブロックを復号するための他の情報とを決定するために、受信されたシンタックス要素のいくつかを使用する。
[0080]動き補償ユニット72はまた、補間フィルタに基づいて補間を実行し得る。動き補償ユニット72は、ビデオブロックの符号化中にビデオエンコーダ20によって使用された補間フィルタを使用して、参照ブロックのサブ整数ピクセルの補間値を計算し得る。この場合、動き補償ユニット72は、受信されたシンタックス要素からビデオエンコーダ20によって使用された補間フィルタを決定し、その補間フィルタを使用して予測ブロックを生成し得る。
[0081]逆量子化ユニット76は、ビットストリーム中で与えられ、エントロピー復号ユニット70によって復号された量子化変換係数を逆量子化(inverse quantize)、たとえば、逆量子化(de-quantize)する。逆量子化プロセスは、量子化の程度を決定し、同様に、適用されるべき逆量子化の程度を決定するための、ビデオスライス中のビデオブロックごとにビデオデコーダ30によって計算される量子化パラメータQPYの使用を含み得る。
[0082]逆変換ユニット78は、ピクセル領域において残差ブロックを生成するために、逆変換、たとえば逆DCT、逆整数変換、または概念的に同様の逆変換プロセスを変換係数に適用する。
[0083]動き補償ユニット72が、動きベクトルと他のシンタックス要素とに基づいて現在のビデオブロックのための予測ブロックを生成した後に、ビデオデコーダ30は、逆変換ユニット78からの残差ブロックを動き補償ユニット72によって生成された対応する予測ブロックに加算することによって、復号されたビデオブロックを形成する。加算器80は、この加算演算を実行する1つまたは複数の構成要素を表す。所望される場合、ブロッキネスアーティファクトを除去するために、復号ブロックをフィルタ処理するためにデブロッキングフィルタも適用され得る。ピクセル遷移を平滑化するために、または場合によってはビデオ品質を改善するために、他のループフィルタも(コーディングループ中またはコーディングループ後のいずれかで)使用され得る。所与のフレームまたはピクチャ中の復号されたビデオブロックは、次いで、その後の動き補償のために使用される参照ピクチャを記憶する参照フレームメモリ82に記憶される。参照フレームメモリ82はまた、図1のディスプレイデバイス32などのディスプレイデバイス上での後の表示のための、復号されたビデオを記憶する。
HEVCにおける動き補償
[0084]一般に、HEVCは以前のビデオコーディング規格のフレームワークに追従する。HEVCの動き補償ループは、H.264/AVCにおける動き補償ループと同じに保持される、たとえば、現在のフレーム
Figure 2016519508
の復元は、逆量子化係数rプラス時間予測Pに等しい。
Figure 2016519508
ここで、Pは、Pフレームに対する単方向予測、またはBフレームに対する双方向予測を示す。
[0085]HEVCにおける動き補償の単位は、以前のビデオコーディング規格における単位とは異なる。以前のビデオコーディング規格におけるマクロブロックの概念は、HEVCには存在しない。マクロブロックは、一般的な4分木方式に基づく極めて柔軟な階層構造によって置き換えられる。この方式内で、3つのタイプのブロック、たとえば、コーディングユニット(CU)、予測ユニット(PU)、および変換ユニット(TU)が定義される。CUは領域分割の基本単位である。CUはマクロブロックの概念に類似するが、それは最大サイズを制限せず、それは4つの等しいサイズのCUへの再帰分割がコンテンツの適応性を向上させることを可能にする。PUはインター/イントラ予測の基本単位であり、それは単一のPU内に複数の任意の形状のパーティションを含んで、不規則な画像パターンを効果的にコーディングすることができる。TUは変換の基本単位である。それはPUとは無関係に定義され得るが、そのサイズはTUが属するCUに限定される。このようにブロック構造を3つの異なる概念に分割すると、各々がその役割に応じて最適化されることが可能になり、その結果、コーディング効率が改善される。
HEVCにおける参照管理
[0086]HEVCでは、以前に復号されたピクチャは、参照パラメータセット(RPS)の概念の下で、参照用の復号ピクチャバッファ(DPB)内で管理される。DPB内のピクチャは、「短期参照に使用される」、「長期参照に使用される」、または「参照に使用されない」としてマーキングされ得る。ピクチャが「参照に使用されない」としてマーキングされていると、それはもはや予測に使用され得ず、それがもはや出力に必要とされないとき、それはDPBから削除され得る。参照ピクチャ管理用のRPSの概念は、以前のビデオコーディング規格の参照ピクチャ管理とは基本的に異なる。DPBに対する相対的変化をシグナリングする代わりに、DPBのステータスが各スライス内でシグナリングされる。参照ピクチャ管理についてのHEVC開発における目標は、すべての規格に適合するビットストリームおよびデコーダにおいて、基本レベルのエラーロバストネスを有することであった。
RPSのシグナリング
[0087]HEVCにおける各スライスヘッダは、スライスを含むピクチャ用のRPSをシグナリングするためのパラメータを含まなければならない。唯一の例外は、瞬時デコーダリフレッシュ(IDR)スライスについてはRPSがシグナリングされないことである。代わりに、RPSは空であると推論される。IDRピクチャに属さないIスライスの場合、それらがIピクチャに属する場合でも、復号順序でIピクチャに先行したピクチャからのインター予測を使用する、復号順序でIピクチャに続くピクチャが存在し得るので、RPSが提供され得る。RPS内のピクチャの数は、シーケンスパラメータセット(SPS)内のsps_max_dec_pic_bufferingシンタックス要素によって指定されたDPBのサイズ制限を超えるべきではない。
[0088]各ピクチャは、出力順序を表すピクチャ順序カウント(POC)値に関連付けられる。スライスヘッダは、POC LSBとしても知られる、完全なPOC値の最下位ビットを表す、固定長のコードワードpic_order_cnt_lsbを含む。コードワードの長さは、SPS内でシグナリングされ、4ビットと16ビットの間であり得る。RPSの概念は、参照ピクチャを識別するためにPOCを使用する。それ自体のPOC値に加えて、各スライスヘッダは、RPS内の各ピクチャのPOC値のコード化表現を直接含むか、またはSPSから引き継ぐ。
[0089]ピクチャごとのRPSは、5個のRPSサブセットとも呼ばれる、参照ピクチャの5個の異なるリストからなる。
・ RefPicSetStCurrBeforeは、復号順序と出力順序の両方で現在のピクチャに先立ち、現在のピクチャのインター予測において使用され得る、すべての短期参照ピクチャを備える。
・ RefPicSetStCurrAfterは、復号順序では現在のピクチャに先立ち、出力順序では現在のピクチャの後に続き、現在のピクチャのインター予測において使用され得る、すべての短期参照ピクチャを備える。
・ RefPicSetStFollは、復号順序で現在のピクチャの後に続くピクチャの1つまたは複数のインター予測で使用され得るし、現在のピクチャのインター予測においては使用されない、すべての短期参照ピクチャを備える。
・ RefPicSetLtCurrは、現在のピクチャのインター予測において使用され得る、すべての長期参照ピクチャを備える。
・ RefPicSetLtFollは、復号順序で現在のピクチャの後に続くピクチャの1つまたは複数のインター予測で使用され得るし、現在のピクチャのインター予測においては使用されない、すべての長期参照ピクチャを備える。
[0090]様々なタイプの参照ピクチャである、現在のピクチャよりも低いPOC値を有する短期参照ピクチャ、現在のピクチャよりも高いPOC値を有する短期参照ピクチャ、および長期参照ピクチャにわたって繰り返す3つまでのループを使用して、RPSはシグナリングされる。さらに、参照ピクチャが現在のピクチャによる参照に使用される(リストRefPicSetStCurrBefore、RefPicSetStCurrAfter、またはRefPicSetLtCurrのうちの1つに含まれる)か否か(リストRefPicSetStFollまたはRefPicSetLtFollのうちの1つに含まれる)を示すフラグ(used_by_curr_pic_X_flag)が参照ピクチャごとに送られる。
ピクチャのマーキング
[0091]ピクチャの復号の前に、通常、いくつかのピクチャがDPB内に存在する。それらのうちのいくつかは予測に利用可能であり得るし、したがって「参照に使用される」としてマーキングされる。他は、予測に利用不可であり得るが、出力を待ち、したがって「参照に使用されない」としてマーキングされる。スライスヘッダがパース(parse)されたとき、ピクチャのマーキングプロセスは、スライスデータが復号される前に遂行される。DPB内に存在し、「参照に使用される」としてマーキングされるが、RPSに含まれていないピクチャは、「参照に使用されない」としてマーキングされる。DPB内に存在しないが、参照ピクチャセットに含まれているピクチャは、used_by_curr_pic_X_flagがゼロに等しい場合無視される。しかしながら、代わりにused_by_curr_pic_X_flagが1に等しい場合、この参照ピクチャは現在のピクチャ内で予測に使用されるように意図されたが、紛失している。次いで、偶発的なピクチャ損失が推測され、デコーダは適切なアクションをとるべきである。現在のピクチャを復号した後、それは「短期参照に使用される」とマーキングされる。
短期参照ピクチャセットのシンタックス
[0092]短期参照ピクチャセット用のシンタックスの例が下記に提供される。
Figure 2016519508
参照リストの初期化
[0093]参照ピクチャリストの初期化は、3つのRPSサブセット、RefPicSetStCurrBefore、RefPicSetStCurrAfter、およびRefPicSetLtCurrに基づいて、(スライスがBスライスである場合)2つのデフォルトのリスト、リスト0とリスト1とを作成する。最初に、早い出力順序を有する短期ピクチャが現在のピクチャまでのPOC間隔の昇順でリスト0に挿入され、次いで、遅い出力順序を有する短期ピクチャが現在のピクチャまでのPOC間隔の昇順でリスト0に挿入され、最終的に、長期ピクチャが最後に挿入される。同様に、最初に、遅い出力順序を有する短期ピクチャが現在のピクチャまでのPOC間隔の昇順でリスト1に挿入され、次いで、早い出力順序を有する短期ピクチャが現在のピクチャまでのPOC間隔の昇順でリスト1に挿入され、最終的に、長期ピクチャが最後に挿入される。RPSに関して、リスト0の場合、RefPicSetStCurrBefore内のエントリが最初のリストに挿入され、RefPicSetStCurrAfter内のエントリが後に続く。その後、RefPicSetLtCurr内のエントリが、利用可能な場合追加される。HEVCでは、リスト内のエントリの数が、(ピクチャパラメータセットまたはスライスヘッダ内でシグナリングされた)アクティブな参照ピクチャの目標数よりも小さいとき、上記のプロセスが繰り返される(参照ピクチャリストにすでに加えられている参照ピクチャが再び加えられる)。エントリの数が目標数よりも大きいとき、リストは切り捨てられる。
H.264/AVCのスケーラブルな拡張
[0094]スケーラブルビデオコーディング、すなわちH.264/AVCのスケーラブルな拡張の簡単な紹介が下記に提供される。
SVCの構造
[0095]様々な次元におけるスケーラビリティの一例が図4に示される。スケーラビリティは、3つの次元において使用可能である。時間次元では、7.5Hz、15Hz、または30Hzを有するフレームレートが時間スケーラビリティ(T)410によってサポートされ得る。空間スケーラビリティ(S)420がサポートされるとき、QCIF(1/4共通中間フォーマット)、CIF(共通中間フォーマット)、および4CIFなどの様々な解像度が使用可能である。特定の空間解像度およびフレームレートごとに、SNR(Q)レイヤ430が、ピクチャ品質を改善するために追加され得る。ビデオコンテンツがそのようなスケーラブルな方法で符号化されると、たとえば、クライアントまたは送信チャネルに依存するアプリケーション要件に従って、実際の配信されたコンテンツを適応させるために、エキストラクタ(extractor)ツールが使用され得る。図4に示された例では、各立方体450は、同じフレームレート(時間レベル)と、空間解像度と、SNRレイヤとを有するピクチャを含む。それらの立方体(ピクチャ)450を任意の次元で追加することによって、より良い表現が達成され得る。使用可能な2つ、3つ、またはさらに多くのスケーラビリティがあるとき、複合スケーラビリティがサポートされる。
[0096]SVCの仕様によれば、最も低い空間レイヤと品質レイヤとを有するピクチャは、H.264/AVCと互換性があり、最も低い時間レベルにあるピクチャは、より高い時間レベルにあるピクチャで増強(enhance)され得る時間ベースレイヤを形成する。H.264/AVC互換レイヤに加えて、空間スケーラビリティおよび/または品質スケーラビリティを提供するために、いくつかの空間エンハンスメントレイヤおよび/またはSNRエンハンスメントレイヤが追加され得る。SNRスケーラビリティは、品質スケーラビリティとも呼ばれる。各々の空間エンハンスメントレイヤまたはSNRエンハンスメントレイヤ自体は時間的にスケーラブルであり得るし、H.264/AVC互換レイヤと同じ時間スケーラビリティ構造を有する。1つの空間エンハンスメントレイヤまたはSNRエンハンスメントレイヤの場合、それが依存するより低いレイヤは、その特定の空間エンハンスメントレイヤまたはSNRエンハンスメントレイヤのベースレイヤとも呼ばれる。
[0097]SVCコーディング構造の一例が図5に示される。最も低い空間レイヤと品質レイヤとを有するピクチャ(QCIF解像度を有する、レイヤ0(510)およびレイヤ1(520)内のピクチャ)は、H.264/AVCと互換性がある。これらの中で、最も低い時間レベルのそれらのピクチャは、図5のレイヤ0(510)に示されるように、時間ベースレイヤを形成する。この時間ベースレイヤ(レイヤ0(510))は、より高い時間レベル(レイヤ1(520))のピクチャで増強され得る。H.264/AVC互換レイヤに加えて、空間スケーラビリティおよび/または品質スケーラビリティを提供するために、いくつかの空間エンハンスメントレイヤおよび/またはSNRエンハンスメントレイヤが追加され得る。たとえば、エンハンスメントレイヤは、レイヤ2(530)と同じ解像度を有するCIF表現であり得る。この例では、レイヤ3(540)はSNRエンハンスメントレイヤである。この例に示されたように、各々の空間エンハンスメントレイヤまたはSNRエンハンスメントレイヤ自体は時間的にスケーラブルであり得るし、H.264/AVC互換レイヤと同じ時間スケーラビリティ構造を有する。また、エンハンスメントレイヤは、空間解像度とフレームレートの両方を増強することができる。たとえば、レイヤ4(550)は、フレームレートを15Hzから30Hzにさらに増大させる、4CIFエンハンスメントレイヤを提供する。
[0098]図6に示されたように、同じ時間インスタンスでコーディングされたスライスは、ビットストリームの順序で連続しており、SVCのコンテキストで1つのアクセスユニット610を形成する。次いで、それらのSVCアクセスユニット610は、表示順序とは異なる、たとえば時間予測関係によって決定される可能性がある、復号順序に従う。
H.264/AVCのスケーラブルな拡張の特徴
[0099]SVCのいくつかの機能は、H.264/AVCから引き継がれている。以前のスケーラブルな規格と比較して、レイヤ間予測およびシングルループ復号などのいくつかの重要な特徴が下記で概説される。
シングルループ復号
[00100]低複雑度のデコーダを保持するために、SVCではシングルループ復号が必須である。シングルループ復号で、各々のサポートされるレイヤは、単一の動き補償ループで復号され得る。これを達成するために、レイヤ間イントラ予測の使用は、エンハンスメントレイヤのマクロブロックのみに許可され、そのためにコロケート(co-locate)された参照レイヤ信号がイントラコーディングされる。より高いレイヤをレイヤ間予測するために使用されるすべてのレイヤが、制約付きイントラ予測を使用してコーディングされることがさらに必要である。
レイヤ間予測
[00101]SVCは、テクスチャ、残差、および動きに基づいて、空間スケーラビリティおよびSNRスケーラビリティのためのレイヤ間予測を導入する。SVCにおける空間スケーラビリティは、2つのレイヤ間の任意の解像度比に一般化されている。SNRスケーラビリティは、粗粒度スケーラビリティ(CGS:coarse granularity scalability)または中粒度スケーラビリティ(MGS:medium granularity scalability)によって実現され得る。SVCでは、2つの空間レイヤまたはCGSレイヤは、(NALユニットヘッダ内でdependency_idによって示される)異なる従属レイヤに属するが、2つのMGSレイヤは同じ従属レイヤ内にあり得る。1つの従属レイヤは、品質エンハンスメントレイヤに対応する、0からより高い値までのquality_idを有する品質レイヤを含む。SVCでは、レイヤ間の冗長性を低減するために、レイヤ間予測方法が利用される。それらは以下の段落で簡単に紹介される。
レイヤ間イントラ予測
[00102]レイヤ間イントラ予測を使用するコーディングモードは、SVCでは「イントラBL」モードと呼ばれる。シングルループ復号をイネーブルにするために、制約付きイントラモードとしてコーディングされるベースレイヤ中のコロケートされたマクロブロック(MB)を有するMBのみが、レイヤ間イントラ予測モードを使用することができる。制約付きイントラモードのMBは、隣接するインターコーディングされたMBからのいかなるサンプルも参照せずにイントラコーディングされる。
レイヤ間残差予測
[00103]MBが残差予測を使用するように指示された場合、レイヤ間予測のためにベースレイヤ内でコロケートされたMBは、インターMBであるに違いなく、その残差は空間解像度比に従ってアップサンプリングされ得る。エンハンスメントレイヤとベースレイヤのそれとの間の差分がコーディングされる。すなわち、エンハンスメントレイヤの現在のフレーム
Figure 2016519508
の復元は、エンハンスメントレイヤの逆量子化係数reと、エンハンスメントレイヤからの時間予測Peと、ベースレイヤの量子化正規化残差係数rbとの和に等しい。
Figure 2016519508
[00104]多くの実装形態では、残差はピクチャレベルでバッファリングされることに留意されたい。オンザフライ残差予測が可能であるが、それはビットストリーム内のベースレイヤブロックに位置し、ベースブロックの残差を得るためにそのブロックを再びパースする必要があるので、多くのコストがかかるはずである。
レイヤ間動き予測
[00105]コロケートされたベースレイヤの動きベクトルは、エンハンスメントレイヤ内のMBまたはMBパーティションの動きベクトル用の予測子を生成するためにスケーリングされ得る。加えて、MBごとに1つのフラグを送る、基本モードと命名された1つのMBタイプが存在する。このフラグが真であり、対応するベースレイヤのMBがイントラでない場合、動きベクトル、区分化モード、および参照インデックスは、すべてベースレイヤから導出される。
HEVCのSVC拡張
[00106]H.264/AVCと同様に、HEVCは、少なくとも時間スケーラビリティとSNRスケーラビリティと空間スケーラビリティとを提供する、スケーラブルビデオコーディング拡張も有する。
HEVCのSVC拡張および3DV拡張のための一般化残差予測
[00107]スケーラブルビデオコーディングおよび3Dビデオコーディングのための一般化残差予測(GRP)は、それらの開示が参照によりそれらの全体で本明細書に組み込まれる、2012年7月10日に出願された米国仮出願第61/670,075号、2012年9月27日に出願された米国仮出願第61/706,692号、2013年7月2日に出願された米国出願第13/933,588号、2012年8月7日に出願された米国仮出願第61/680,522号、および2013年8月2日に出願された米国出願第13/957,841号に記載されている。本技法では、エンハンスメントレイヤ中の現在ブロックのインター予測残差を予測するために、コロケートされた参照レイヤブロックのインター予測残差が使用され得る。この方法は、インターCUおよびスキップモードCUに適用され得る。この方法のフレームワークの一例が図7に示され、そこでは単予測の場合が示されている。
[00108]Be(725)およびBb(715)は、それぞれ、エンハンスメントレイヤのピクチャおよびそのコロケートされた参照レイヤブロック内の現在のブロックを意味するものとする。Pe0(720)は、動きベクトルMVe0を使用することによって取得された、ブロックBe(725)についての時間予測を意味するものとする(ここで、サブインデックス0は参照リスト0を指す)。同様に、Pb0(710)は、(必要な場合)アップサンプリングされた参照レイヤの参照ピクチャ内で同じ動きベクトルMVe0を使用することによって取得された、ブロックBb(715)についての時間予測を表すものとする。次いで、参照レイヤブロックRb0のインター予測された残差が、
b0=(Bb−Pb0) (3)
として取得される。
ブロックBe(725)についての時間予測Pe0(720)を考慮すると、ブロックBe(725)についての最終的な単予測Pは、
P=Pe0+w・(Bb−Pb0) (4)
である。ここで、wは、0、0.5または1の値をとる、重み係数である。
Pフレームなどのいくつかの場合によっては、(4)の以下の変形形態がより効率的な場合があり、
P=Bb+w・(Pe0−Pb0) (5)
ここで、w=0.5である。したがって、4つの重み付けモード、たとえば、(4)におけるw=0、0.5、および1、ならびに(5)におけるw=0.5がGRPモード用に提案される。
[00109]重み係数wは、重み付けインデックスとしてCUレベルでシグナリングされ得る。たとえば、重み付けインデックス0、1、2、および3(または異なる順序で)は、それぞれ、(4)における重み付けモード0、0.5、および1、ならびに(5)におけるw=0.5を示すために使用され得る。正規CABACモードでの短縮単項コードがシグナリングのために使用され得る。
単一のMC補間GRP
[00110]GRPの計算の複雑さとメモリ帯域幅要件とを低減するために、単一のMC補間が2012年11月29日に出願された米国仮出願第61/731,448号に記載されており、それは参照によりその全体が本明細書に組み込まれる。その出願では、(4)は(6)、すなわち、
P=(Pe0−w・Pb0)+w・Bb (6)
に書き換えられている。
e0とPb0が同じ動きを共有すると考えると、MC補間は、差分ブロック(Pe0−w・Pb0)に直接適用され得、その結果、MC補間の数は2から1に削減される。その結果、計算の複雑さとメモリアクセスの両方が低減される。
高レベルシンタックス専用SHVC
[00111]高レベルシンタックス専用SHVCでは、HEVCシングルレイヤコーディングと比較されると、新しいブロックレベルのコーディングツールは存在しない。本手法では、スライスおよびその上のレベルのシンタックス変更、ならびにピクチャのフィルタリングまたはアップサンプリングなどのピクチャレベルの動作のみが許可される。
[00112]レイヤ間の冗長性を低減するために、アップサンプリングされたコロケートされた参照レイヤのピクチャがエンハンスメントレイヤの参照バッファに入れられ、その結果、同じレイヤ内のフレーム間予測と同じ方法でレイヤ間予測が達成される。SHVCの現在の作業ドラフト([5]Chen、「SHVC Working Draft 1」)およびテストモデル([6]Chen、「SHVC Test Model 1」)では、レイヤ間参照ピクチャが、長期参照ピクチャとしてマーキングされる。レイヤ間参照の動きベクトルの差分はゼロに制約される。
高レベルシンタックス専用SHVCにおけるGRPの模倣
[00113]GRPは、下記に記載されるように、高レベルシンタックス専用SHVCまたはマルチビューHEVCにおいて模倣され得る。さらなる詳細は、2012年9月30日に出願された米国仮出願第61/708,011号、2013年1月7日に出願された米国仮出願第61/749,874号、および2013年9月27日に出願された米国出願第14/040,290号に記載され、それらの開示が参照によりそれらの全体で本明細書に組み込まれる。
GRP参照ピクチャの生成
[00114]GRPは、双方向予測のフレームワークでブロックレベルのGRP予測を模倣することによって、高レベルシンタックス専用SHVCにおいて実現され得る。この場合、単方向GRP予測のみが模倣され得る。現在、以下のような3つのGRP単予測モード(たとえば、(3)〜(5))が存在する。
Figure 2016519508
ここで、Bbは、現在のピクチャのためのレイヤ間参照を示す。GRP参照ピクチャの場合、POCおよび動き情報は、GRP参照を生成するために使用されるエンハンスメント参照ピクチャのOCおよび動き情報と同じであるべきである。
あらかじめ定義されたGRP参照ピクチャの生成
[00115]差分ピクチャの中でピクセルサンプルの妥当なダイナミックレンジを保持するために、2つのタイプのGRP参照ピクチャが以下のように定義される。
RGhalf=min(max(0, 2・Pe0−Pb0),2bitdepth−1) (10)
RGone=min(max(0, Pe0−Pb0+2bitdepth-1),2bitdepth−1) (11)
[00116]一般に、エンハンスメントレイヤ参照ピクチャと(アップサンプリングされた)コロケートされた参照レイヤのピクチャの両方が利用可能であるときはいつでも、RGhalfとRGoneが生成され得る。
[00117](7)における単方向GRP予測を模倣するために、
Figure 2016519508
基本的に、RGhalfとBbが参照ピクチャとして使用されるとき、(7)におけるGRPは容易に模倣され得る。
[00118](8)における単方向GRP予測の場合、
Figure 2016519508
この場合、RGoneとBbの両方に対するさらなる重み付け2およびオフセット−2bitdepth-1が、重み付け予測パラメータのシンタックスとともにシグナリングされる必要がある([2]Bross、「HEVC Specification Draft 10」)。
[00119](9)における単方向GRP予測の場合、
Figure 2016519508
この場合、Bbに対するさらなる重み付け2およびオフセット−2bitdepth-1が、重み付け予測パラメータのシンタックスとともにシグナリングされる必要がある([2]Bross、「HEVC Specification Draft 10」)。
[00120]一般に、エンハンスメント参照ピクチャごとに、GRP参照RGhalfとRGoneが生成され、GRPを模倣するために参照ピクチャリストの中に配置され得る。しかしながら、ピクチャをコーディングするときいくつのGRP参照ピクチャが使用されるかは、エンコーダの最適化に依存し得る。
GRP参照ピクチャのマーキング
[00121]差分ピクチャがDPBに記憶される。差分ピクチャ参照ピクチャセット(DPRPS)が以下のように作成される。
・RefPicSetLtCurr、RefPicSetLtFoll、RefPicSetStCurrBefore、RefPicSetStCurrAfter、またはRefPicSetStFollの中のピクチャごとに、その差分ピクチャがDPRPSに挿入される。
・DPRPSにない他のすべての差分ピクチャがDPBから削除される。
・現在のピクチャを予測するためにどのピクチャが使用され得るかを決定するために、DPRPS内のエントリがさらに選択され得る。たとえば、現在のピクチャに最も近いピクチャのみが、currDiffRPSの形態になるように選ばれる。一代替では、currDiffRPSはDPRPSに等しい。
・さらに、より多くの差分ピクチャがDPRPSから削除され得る。
・レイヤ間参照ピクチャセットに類似する参照ピクチャリストを形成するために、currDiffRPSが使用される。
・currDiffRPS内のエントリが短期参照ピクチャとしてマーキングされる。
高レベルシンタックス専用SHVCにおける一般化残差予測のシグナリングおよび管理
[00122]本開示は、GRP参照ピクチャをどのように効率的にシグナリングおよび管理するかを定義するための解決策に対処することができる。さらに、現在のSHVCのフレームワークでは、エンハンスメントレイヤで現在のピクチャをコーディングするとき、ただ1つのレイヤ間参照ピクチャが生成され、使用される。本開示は、複数のレイヤ間参照ピクチャを管理する効率的な方法をどのように提供するかの説明を提供する。
[00123]本開示に記載された技法は、GRP参照ピクチャを生成し、それらをエンハンスメントレイヤの参照ピクチャリストの中に配置することができる。GRP参照ピクチャは、どのGRP参照ピクチャが生成されるかに基づいて、エンハンスメントレイヤ参照ピクチャと同じ動き情報およびPOCを共有することができる。たとえば、どのGRP参照ピクチャが生成されるかに基づくエンハンスメントレイヤ参照ピクチャのPOC番号および動きフィールドが、GRP参照ピクチャにコピーされる。上記で説明されたように、POCは、ピクチャの出力の順序を示す、ピクチャに関連する値を指すことができる。POC番号は、参照ピクチャを識別するために使用され得る。動きフィールドは、ピクチャ内の様々なブロックに関する動き情報を指し得るし、1つまたは複数の動きベクトルを含むことができる。GRP参照ピクチャは、エンハンスメントレイヤ参照ピクチャからコピーされたPOC番号および動きフィールドに基づいて、生成される。このようにして生成されたGRP参照ピクチャは、参照ピクチャリストに記憶され得る。
[00124]本開示では、GRP参照および他のビデオデータ(たとえば、エンハンスメントレイヤ参照、復元されるべき現在のピクチャなど)がピクチャに関して説明されたが、本技法はビデオデータの他の単位(たとえば、フレームなど)に適用することもできる。たとえば、本技法は、GRP参照フレーム、エンハンスメントレイヤ参照フレーム、現在のフレームなどに適用することができる。プログレッシブコーディングの場合、ピクチャとフレームは同じであり得る。
[00125]図8は、本開示の態様による、残差予測参照ピクチャの生成を示すブロック図である。図8は、時刻T0の場合のベースレイヤ(「BL」)参照810と、エンハンスメントレイヤ(「EL」)参照820と、GRP参照830とを示す。BL参照810は、(たとえば、アップサンプリングされた)エンハンスメントレイヤに関連するベースレイヤからの参照であり得る。上記で説明されたように、GRP参照830は、対応するEL参照820に基づいて生成され得る。一実施形態では、EL参照820はPOC番号nを有する。BL参照810も同じPOC番号nを有する。EL参照820は、それに関連する動きフィールドを有し、動きフィールドは動きベクトルを含む。GRP参照830はEL参照820に基づいて生成され、その結果、GRP参照830はEL参照820と同じPOC番号nを有し、EL参照820と同じ動きフィールドを有する。これは、EL参照820からPOC番号nと動きフィールドとをコピーすることによって行われ得る。GRP参照830は、参照リスト870(たとえば、GRP参照830用の特定のサブセット)に記憶され得る。時刻T1の場合のELの現在のピクチャまたはフレーム825は、GRP参照830に基づいて復元され得る。時刻T1は時刻T0よりも後である。GRP参照830は生成されるが、出力されない場合がある。たとえば、GRP参照830は、ピクチャの復元を生成するために予測で使用され得るが、それ自体はディスプレイデバイスに出力されない場合がある。
[00126]一実施形態では、2つのタイプのGRP参照830が存在し得るし、GRP参照ピクチャ830は、たとえば、式(10)および(11)に基づいて、上記で説明されたように生成され得る。RGhalf、RGone、または両方は、実施形態に応じて生成され得る。RGhalfおよびRGoneは異なる重み係数を反映することができる。たとえば、RGhalfは0.5の重み付けを反映することができ、RGoneは1の重み付けを反映することができ、RGhalfは0.5の重み係数を有するブロックレベルのGRPを模倣することができ、RGoneは1の重み係数を有するブロックレベルのGRPを模倣することができる。一実施形態では、式(7)に示された重み付け0.5を有するブロックレベルのGRPを模倣するために、RGhalfが(12)に示されたように使用される。別の実施形態では、式(8)に示された重み付け1を有するブロックレベルのGRPを模倣するために、RGoneが式(13)に示されたように使用される。さらに別の実施形態では、RGoneは0.5の重み付けを反映するためにも使用され得る。たとえば、式(9)に示された重み付け0.5を有するブロックレベルのGRPを模倣するために、RGoneが式(14)に示されたように使用される。
[00127]GRP参照ピクチャ830を使用すると、高レベルシンタックス専用SHVCにおいて、ブロックレベルでの重み付けされた残差予測の組込みが可能になり得る。たとえば、GRPで使用される重み係数は、予測に使用され得るGRP参照ピクチャ830にすでに適用されている。GRP参照ピクチャ830は、GRP参照ピクチャ830が導出または生成されたエンハンスメントレイヤ参照ピクチャ820と同じ動きフィールドとPOCとを共有することができる。対応するエンハンスメントレイヤ参照ピクチャ820と同じ動きフィールドとPOCとを共有するGRP参照ピクチャ830を有することは、より良い予測結果につながり得る。一般に、エンハンスメントレイヤ参照ピクチャ820は、より良い品質の動きフィールドを有し、したがって、EL参照ピクチャ820の動きフィールドをコピーすることは、より良い予測結果がもたらされ得る。GRP参照830ピクチャはEL参照ピクチャ820と同じPOCを有するので、同じPOCに利用可能なより多くの参照ピクチャが存在し得るし、それらはより良い予測結果につながり得る。
[00128]本技法は、GRP参照ピクチャ830に関する情報をシグナリングすることもできる。本技法は、たとえば、ビデオパラメータセット(VPS)またはSPSにおいて、GRP参照ピクチャ830が使用されるかどうかをシグナリングすることができる。本技法は、GRP参照ピクチャ830がどのように生成されるか(たとえば、どの短期参照に基づくか、および何の重み付けタイプを用いるか)をシグナリングすることもできる。一般に、ただ1つの参照ピクチャがPOCに利用可能である。複数の参照ピクチャがGRP参照ピクチャ830の生成で利用可能であり得るので、どの参照ピクチャを使用するかは、ビットストリーム内でシグナリングされ得る。同じピクチャに属するすべてのスライスは同じGRP参照情報を共有するべきであるという適合制約が適用され得る。
[00129]本技法は、GRP参照ピクチャ用の2つのさらなるRPSサブセット、RefPicSetGRPRefCurrBefore 875aとRefPicSetGRPRefCurrAfter 875bとを作成することによって、GRP参照を管理することができる。これら2つのサブセットは、RefPicSetStCurrBeforeおよびRefPicSetStCurrAfterと同様の方式で管理され得る。GRP参照ピクチャ830だけが、これら2つのサブセットに入れられ得る。その上、GRP参照ピクチャ830は、他のサブセットの中に配置されない場合がある。GRP参照ピクチャ830は現在のピクチャ825にのみ使用され得るという適合制限が適用され得るし、その結果、GRP参照ピクチャ830はDPBに記憶されない。
[00130]様々な適合制限がGRP参照ピクチャの使用に適用され得る。たとえば、GRP参照ピクチャ830は双予測でペア(GRP参照およびレイヤ間参照)として使用されなければならないという適合制限が適用され得る。
[00131]GRP参照管理のための技法は、アップサンプリングされた参照レイヤのピクチャなどの、他の生成されたピクチャにも適用され得る。たとえば、コロケートされた参照レイヤのピクチャをどのように生成/アップサンプリングするかが、ビットストリーム内で、たとえばスライスヘッダ内でシグナリングされ得る。任意の生成されたピクチャは現在のピクチャ825にのみ使用され得るという適合制限が適用され得るし、その結果、生成されたピクチャはDPBに記憶されない。
[00132]このようにして、下記でさらに説明されるように、本技法は、GRP参照ピクチャ830をどのように効率的にシグナリングおよび管理するかを定義することができる。
シグナリングをイネーブルにする/制御するツール
[00133]本技法は、GRP参照ピクチャ830がレイヤに使用されるかどうかを示すために、(エンハンスメントレイヤごとの)VPSまたはSPS内でフラグをシグナリングすることができる。たとえば、以下のシンタックスがSPSに追加され得る。
Figure 2016519508
1に等しいgrp_ref_enabled_flagは、GRP参照830がレイヤで使用されることを指定する。0に等しいgrp_ref_enabled_flagは、GRP参照830がレイヤで使用されないことを指定する。grp_ref_enabled_flagが存在しないとき、それは0に等しいと推定される。
GRP参照ピクチャのシグナリング
[00134]本技法は、ビットストリーム内で、たとえば、ピクチャパラメータセット(PPS)、スライスヘッダ、およびRPS内で、GRP参照ピクチャ830の使用情報をシグナリングすることができる。GRP参照ピクチャ830をシグナリングする様々な実施形態が下記に記載される。
実施形態1
[00135]一実施形態では、現在のピクチャ825用にあらかじめ定義されたタイプ(RGhalfおよびRGone)を有するGRP参照ピクチャ830の数が、スライスヘッダまたはPPS内でシグナリングされる。シグナリングされた数は、RGhalfおよびRGoneの総数(たとえば、組み合わされたRGhalfおよびRGoneの総数)であり得る。代替として、両方の数がシグナリングされ得る(たとえば、RGhalfの数およびRGoneの数が別個にシグナリングされ得る)。本実施形態では、GRP参照ピクチャ830のシグナリングされた数に到達するまで、RGhalfおよびRGoneが現在のピクチャ825の短期参照ピクチャごとに生成され、RefPicSetGRPRefCurrBefore 875aおよびRefPicSetGRPRefCurrAfter 875bの中に配置される。RGhalfとRGoneの両方が同じ短期参照ピクチャ用に生成されるとき、RGoneの前にRGhalfが配置される。本実施形態は、生成されるべきGRP参照ピクチャ830の数のみをシグナリングすることができ、RGhalfおよびRGoneの両方は、GRP参照830のシグナリングされた数に到達するまで、(たとえば、あらかじめ定義されたように)生成され得る。
実施形態2
[00136]本実施形態では、GRP参照ピクチャ830は、以下のようにスライスヘッダ内でシグナリングされる。
Figure 2016519508
Figure 2016519508
grp_ref_s0_flag[i]およびgrp_ref_s1_flag[i]は、GRP参照ピクチャが短期参照ピクチャに基づいて生成されるかどうかを指定する。grp_ref_s0_flag[i](grp_ref_s1_flag[i])が0に等しいとき、GRP参照ピクチャは短期参照ピクチャに基づいて生成されない。grp_ref_s0_flag[i](grp_ref_s1_flag[i])が1に等しいとき、RGhalfが短期参照ピクチャに基づいて生成される。代替として、grp_ref_s0_flag[i](grp_ref_s1_flag[i])が1に等しいとき、RGoneが短期参照ピクチャに基づいて生成される。grp_ref_s0_flag[i]およびgrp_ref_s1_flag[i]が存在しないとき、それらは0であると推定される。本実施形態では、ただ1つのGRP参照タイプまたは他のタイプの2つのGRP参照タイプが生成される。どちらのタイプのGRP参照を使用するかは、あらかじめ定義され得る。たとえば、grp_ref_s0_flag[i](grp_ref_s1_flag[i])が1に等しいとき、RGhalfのみが使用されるか、またはRGoneのみが使用される。
実施形態3
[00137]本実施形態では、GRP参照ピクチャ830は、以下のようにスライスヘッダ内でシグナリングされる。
Figure 2016519508
Figure 2016519508
grp_ref_s0_idc[i]およびgrp_ref_s1_idc[i]は、GRP参照ピクチャ830が短期参照ピクチャに基づいてどのように生成されるかを指定する。grp_ref_s0_idc[i](grp_ref_s1_idc[i])が0に等しいとき、GRP参照ピクチャは短期参照ピクチャに基づいて生成されない。grp_ref_s0_idc[i](grp_ref_s1_idc[i])が1に等しいとき、RGhalfが短期参照ピクチャに基づいて生成される。grp_ref_s0_idc[i](grp_ref_s1_idc[i])が2に等しいとき、RGoneが短期参照ピクチャに基づいて生成される。grp_ref_s0_idc[i](grp_ref_s1_idc[i])が3に等しいとき、RGhalfとRGoneの両方が短期参照ピクチャに基づいて生成される。grp_ref_s0_idc[i]およびgrp_ref_s1_idc[i]が存在しないとき、それらは0であると推定される。grp_ref_s0_idc[i]およびgrp_ref_s1_idc[i]は、2ビット固定コーディングまたはトランケーテッド・ユーナリー・コーディング(truncated unary coding)でコーディングされ得る。
[00138]本実施形態では、すべてのタイプのGRP参照830が生成され得る。上記で説明されたように、grp_ref_s0_idc[i](grp_ref_s1_idc[i])の値に応じて、RGhalfもしくはRGone、または両方が作成され得るか、または両方とも作成され得ない。本実施形態は、実施形態1、2、および4よりも多くの情報をシグナリングし得る。
実施形態4
[00139]コーディング効率と複雑さとの間のトレードオフとして、GRP参照830は、短期参照ピクチャのうちのいくつかに基づいてのみ、生成され得る。一実施形態では、GRP参照情報は、以下のようにスライスヘッダ内でシグナリングされ得る。
Figure 2016519508
1に等しいone_grp_ref_in_one_listは、1つのGRP参照ピクチャがPスライス用のリスト0内の最初の短期参照ピクチャに基づいて生成されることと、2つのGRP参照ピクチャ830がBスライス用のリスト0およびリスト1内の最初の短期参照ピクチャに基づいて生成される(各リストが1つのGRP参照を有する)こととを指定する。0に等しいone_grp_ref_in_one_listは、GRP参照ピクチャがこのスライス用に生成されないことを指定する。one_grp_ref_in_one_listが存在しないとき、それは0であると推定される。本実施形態は、リスト0および/またはリスト1内の最初の短期参照ピクチャ用のみにGRP参照ピクチャ830を生成し、したがって、シグナリングの量を低減することができる。生成されるGRP参照ピクチャのタイプは、あらかじめ定義され得る(たとえば、RGhalfまたはRGone)。
GRP参照管理
[00140]本技法は、効率的な方式でGRP参照ピクチャ830を管理する方法も提供し得る
GRP参照ピクチャによる参照リストの初期化
[00141]一実施形態では、RPSの5つのサブセット875に加えて、2つの新しいサブセットがGRP参照ピクチャ830に提供される。2つの新しいサブセット875a、875bは、RefPicSetGRPRefCurrBefore 875aおよびRefPicSetGRPRefCurrAfter 875bと呼ばれ得る。GRP参照ピクチャ830は、これら2つのサブセット875a、875bのみに追加され得る。
・ RefPicSetGRPRefCurrBefore 875aは、現在のピクチャ825よりも小さいPOCを有するすべてのGRP参照ピクチャ830からなる。リストは、POC値の降順で初期化される。2つのGRP参照ピクチャ830が同じPOCを共有するとき、GRP参照タイプRGhalfを有する1つが最初に配置される。または代替として、RGoneが最初に配置される。
・ RefPicSetGRPRefCurrAfter 875bは、現在のピクチャ825よりも大きいPOCを有するすべてのGRP参照ピクチャ830からなる。リストは、POC値の昇順で初期化される。2つのGRP参照ピクチャ830が同じPOCを共有するとき、GRP参照タイプRGhalfを有する1つが最初に配置される。または代替として、RGoneが最初に配置される。
参照リストを初期化するとき、RefPicSetGRPRefCurrBefore 875aおよびRefPicSetGRPRefCurrAfter 875b内のエントリは、RefPicSetLtCurr内のエントリの後に順次挿入される。代替として、RefPicSetGRPRefCurrBefore 875aおよびRefPicSetGRPRefCurrAfter 875b内のエントリは、RefPicSetLtCurr 875b内のエントリの前に順次挿入される。
GRP参照ピクチャの使用に対する適合制限
[00142]GRP参照ピクチャを生成する目的の1つは、高レベルシンタックス専用SHVCにおいてGRPコーディングモードを模倣することである。その結果、(12)、(13)、および(14)に示されたように、GRP参照ピクチャ830のみが、双方向予測において、関係するアップサンプリングされた参照レイヤのピクチャとともに使用され得ることがさらに制約され得る。これにより、より良い予測結果につながり得る。
[00143]生成されたGRP参照ピクチャ830のみが現在のピクチャ825に使用され得るという別の適合制限が適用され得、その結果、現在のピクチャ825が復号された後、それらはDPBに入れられない。
他の生成されたレイヤ間参照ピクチャの管理
[00144]GRP参照ピクチャ830と同様に、レイヤ間参照ピクチャは、復号されたピクチャではない場合があるが、コロケートされた参照レイヤのピクチャに基づいて生成され得る。GRP参照ピクチャ830に関する技法は、レイヤ間参照ピクチャにも使用され得る。
[00145]一実施形態では、適応型アップサンプリングフィルタまたは第2のアップサンプリングフィルタがイネーブルにされる。その結果、現在のピクチャ825用のレイヤ間参照ピクチャの2つ以上のバージョンが存在し得る。参照リストを初期化するとき、最も近い参照レイヤからのレイヤ間ピクチャが最初に挿入されるべきである。複数のレイヤ間ピクチャが同じ参照レイヤからのものであるとき、適応型アップサンプリングフィルタまたは第2のアップサンプリングフィルタによって生成されたレイヤ間ピクチャは、デフォルトのアップサンプリングフィルタで生成されたレイヤ間ピクチャの後に挿入されるべきである。
[00146]その上、レイヤ間参照ピクチャの数は、ビットストリーム内で、たとえば、SPS、PPS、スライスヘッダ、またはRPS内でシグナリングされ得る。すべてのレイヤ間参照ピクチャが現在のピクチャ825のみに使用され得るという別の適合制限が適用され得、その結果、現在のピクチャ825が復号された後、それらはDPBに入れられない。
[00147]図9は、本開示の態様による、残差予測参照ピクチャを生成し、関連情報をシグナリングするための例示的な方法を示すフローチャートである。プロセス900は、エンコーダ(たとえば、図2に示したエンコーダなど)、デコーダ(たとえば、図3に示したデコーダなど)、または任意の他の構成要素によって実行され得る。プロセス900のブロックについて図2のエンコーダ20に関して説明するが、プロセス900は、上述のように、デコーダなどの他の構成要素によって実行され得る。図9に関して記載されるすべての実施形態は、別個に、または互いに組み合わせて実装され得る。プロセス900に関するいくつかの詳細が、たとえば、図8に関して上記で説明されている。
[00148]上記で説明されたように、GRP参照ピクチャは、残差予測参照ピクチャ(「RPRP」)とも呼ばれ得る。プロセス900は、ブロック901で開始する。ブロック902で、エンコーダ20は、残差予測参照ピクチャがデコーダでのピクチャの復元に利用可能であるかどうかを決定する。エンコーダ20は、レートひずみトレードオフ、計算の複雑さ、メモリアクセス、要件、エンコーダの最適化などの様々な要因に基づいて、決定を行い得る。いくつかの実施形態では、スライスのグループ、スライスなどの、ピクチャ以外のビデオの単位が復元され得る。
[00149]ブロック903で、エンコーダ20は、残差予測参照ピクチャを生成することについての情報を符号化する。情報は、エンハンスメントレイヤに関連する、対応するエンハンスメントレイヤ参照ピクチャに少なくとも部分的に基づいて、残差予測参照ピクチャをどのように生成するかについての情報を含むことができる。たとえば、残差予測参照ピクチャは、エンハンスメントレイヤからのエンハンスメントレイヤ参照ピクチャに基づいて、生成され得る。残差予測参照ピクチャは、それから残差予測参照ピクチャが生成されるべきエンハンスメントレイヤ参照ピクチャと同じ動きフィールドおよび同じピクチャ順序カウント(POC)を有するように構成され得る。情報は、残差予測参照ピクチャの使用がイネーブルにされるか否かを含むことができる。たとえば、エンコーダ20は、残差予測参照ピクチャの使用がイネーブルにされるか否かを示すフラグを符号化することができる。
[00150]エンコーダ20は、上記で説明されたように、様々な方法で情報をシグナリングすることができる。いくつかの実施形態では、デコーダは、ある特定の方法で残差予測参照ピクチャを生成する(たとえば、RGhalfのみ、RGoneのみ、または両方を生成する)ように事前構成され得るし、エンコーダ20は、生成する残差予測参照ピクチャの数のみをシグナリングする。他の実施形態では、デコーダは、ある特定のタイプの残差予測参照ピクチャを生成する(たとえば、RGhalfまたはRGoneのみを生成する)ように事前構成され、エンコーダ20は、その特定のタイプの残差予測参照ピクチャが生成されるべきか否かを示す、1つまたは複数のシンタックス要素をシグナリングする。たとえば、フラグが1の値を示す場合、それは、あらかじめ定義されたタイプの残差予測参照ピクチャを生成することを意味し、フラグが0の値を示す場合、それは、あらかじめ定義されたタイプの残差予測参照ピクチャを生成しないことを意味する。
[00151]いくつかの実施形態では、デコーダは、様々なタイプの残差予測参照ピクチャを生成するように構成され、エンコーダ20は、残差予測参照ピクチャが作成されるべきかどうかと、どのタイプの残差予測参照ピクチャが作成されるべきかと、を示す、1つまたは複数のシンタックス要素をシグナリングする。たとえば、フラグは複数の値を示すことができ、各値は、どの(1つまたは複数の)タイプの残差予測参照ピクチャを作成するかに関連付けられ得る。上記の実施形態3では、0は残差予測参照ピクチャを生成しないことを意味し、1はRGhalfを生成することを意味し、2はRGoneを生成することを意味し、3はRGhalfとRGoneの両方を生成することを意味する。
[00152]いくつかの実施形態では、デコーダは、参照ピクチャリスト内の最初の短期参照ピクチャのみに基づいて、残差予測参照ピクチャを生成するように構成され得る。エンコーダ20は、残差予測参照ピクチャを生成するか否かのみをシグナリングする。たとえば、フラグは、残差予測参照ピクチャが生成されるべきであることを示す1の値と、残差予測参照ピクチャが生成されるべきではないことを示す0の値とを有する。
[00153]情報は、様々な制約または適合制限に関する情報も含み得る。そのような制約または適合制限の例には、以下が含まれ得る。
・ 同じピクチャに属するスライスは同じGRP参照情報を共有するべきである。たとえば、ピクチャのすべてのスライスは、参照リスト内の同じGRP参照を有する。
・ GRP参照はペアで使用されるべきである。たとえば、エンハンスメントレイヤのピクチャは、少なくとも2つのGRP参照に基づいて復元されるべきである。
・ GRP参照ピクチャは、レイヤ間参照ピクチャとともに使用されるべきである。たとえば、エンハンスメントレイヤのピクチャは、GRP参照ピクチャおよび参照レイヤのアップサンプリングされたコロケートされた参照ピクチャに基づいて、復元されるべきである。参照レイヤは、どのGRP参照ピクチャが生成されるかに基づいて、エンハンスメントレイヤ参照ピクチャに関連するエンハンスメントレイヤに対応することができる。
・ GRP参照ピクチャは、現在のピクチャのみに使用され得、その結果、DPBの中に配置されない。
[00154]これらの制約は、復号されるか、またはデコーダにあると推定され、残差予測参照ピクチャの生成時に適用され得る。
[00155]ブロック904で、エンコーダ20は、ビットストリーム内で符号化された情報をシグナリングする。符号化された情報は、復号されるためにデコーダにシグナリングされ得る。情報は、スライスまたはその上のレベルで指定され得る。たとえば、符号化された情報は、ピクチャパラメータセット(PPS)、ビデオパラメータセット(VPS)、シーケンスパラメータセット(SPS)、参照パラメータセット(RPS)、スライスヘッダなどで指定され得る。シグナリングされた情報の復号に関するいくつかの詳細が、図10に関して下記で説明される。プロセス900は、ブロック905で終了する。
[00156]エンコーダ20は、スケーラブルビデオコーディングにおいて、ビデオ情報の1つまたは複数のレイヤに関連する少なくとも1つの参照ピクチャリストを記憶するように構成された、メモリユニットを含むことができる。エンコーダ20は、たとえば、残差予測参照ピクチャを生成することについての情報を符号化するプロセスにおいて参照するために、残差予測参照ピクチャを生成および/または記憶し得る。
[00157]図10は、本開示の態様による、シグナリングされた情報に基づいて残差予測参照ピクチャを生成するための例示的な方法を示すフローチャートである。プロセス1000は、エンコーダ(たとえば、図2に示されたエンコーダなど)、デコーダ(たとえば、図3に示されたデコーダなど)、または任意の他の構成要素によって実行され得る。プロセス1000のブロックが図3のデコーダ30に関して記載されるが、プロセス1000は、上述されたように、エンコーダなどの他の構成要素によって実行され得る。図10に関して記載されるすべての実施形態は、別個に、または互いに組み合わせて実装され得る。プロセス1000に関するいくつかの詳細が、たとえば、図8および図9に関して上記で説明されている。
[00158]プロセス1000は、ブロック1001で開始する。ブロック1002で、デコーダ30は、残差予測参照ピクチャの生成についてのシグナリングされた情報を復号する。シグナリングされた情報は、図9に関して上記で説明された情報を含み得る。たとえば、シグナリングされた情報は、残差予測参照ピクチャを生成するかどうか、および/またはどのタイプの残差予測参照ピクチャを生成するかを示すことができる。実施形態に応じて、シグナリングされた情報に含まれる情報は変化することができる。いくつかの実施形態が図9とともに記載され、シグナリングされた情報は、これらの様々な実施形態における情報のうちのいずれも含むことができる。
[00159]シグナリングされた情報は、残差予測参照ピクチャの使用がイネーブルにされるか否かを含むことができる。たとえば、フラグは、残差予測参照ピクチャの使用がイネーブルにされる否かを示し得る。シグナリングされた情報は、スライスまたはその上のレベルで指定され得る。たとえば、シグナリングされた情報は、ピクチャパラメータセット(PPS)、ビデオパラメータセット(VPS)、シーケンスパラメータセット(SPS)、参照パラメータセット(RPS)、スライスヘッダなどで指定され得る。シグナリングされた情報の符号化に関するいくつかの詳細が、図9に関して上記で説明されている。
[00160]残差予測参照ピクチャを生成するかどうか、および/またはどのように生成するかについての情報は、様々な方法でシグナリングされ得る。いくつかの実施形態では、デコーダ30は、ある特定の方法で残差予測参照ピクチャを生成する(たとえば、RGhalfのみ、RGoneのみ、または両方を生成する)ように構成され得るし、シグナリングされた情報は、生成する残差予測参照ピクチャの数を含む。他の実施形態では、デコーダ30は、ある特定のタイプの残差予測参照ピクチャを生成する(たとえば、RGhalfまたはRGoneのみを生成する)ように構成され、シグナリングされた情報は、その特定のタイプの残差予測参照ピクチャが生成されるべきか否かを示す、1つまたは複数のシンタックス要素を含む。たとえば、フラグが1の値を示す場合、それは、あらかじめ定義されたタイプの残差予測参照ピクチャを生成することを意味し、フラグが0の値を示す場合、それは、あらかじめ定義されたタイプの残差予測参照ピクチャを生成しないことを意味する。
[00161]いくつかの実施形態では、デコーダ30は、様々なタイプの残差予測参照ピクチャを生成するように構成され、シグナリングされた情報は、残差予測参照ピクチャが作成されるべきかどうかと、どのタイプの残差予測参照ピクチャが作成されるべきかと、を示す、1つまたは複数のシンタックス要素を含む。たとえば、フラグは複数の値を示すことができ、各値は、どの(1つは複数の)タイプの残差予測参照ピクチャを作成するかに関連付けられ得る。上記の実施形態3では、0は残差予測参照ピクチャを生成しないことを意味し、1はRGhalfを生成することを意味し、2はRGoneを生成することを意味し、3はRGhalfとRGoneの両方を生成することを意味する。
[00162]いくつかの実施形態では、デコーダ30は、参照ピクチャリスト内の最初の短期参照ピクチャのみに基づいて、残差予測参照ピクチャを生成するように構成され得る。シグナリングされた情報は、残差予測参照ピクチャを生成するか否かのみを示す。たとえば、フラグは、残差予測参照ピクチャが生成されるべきであることを示す1の値と、残差予測参照ピクチャが生成されるべきではないことを示す0の値とを有する。
[00163]図9に記載された制約および/または適合制限のうちのいずれも、デコーダ30によって適用され得る。制約または制限に関する情報は、シグナリングされた情報から復号され得るか、シグナリングされた情報に基づいて推定され得るか、または両方である。制約または適合制限のいくつかの例には、以下が含まれ得る。
・ 同じピクチャに属するスライスは同じGRP参照情報を共有するべきである。たとえば、ピクチャのすべてのスライスは、参照リスト内の同じGRP参照を有する。
・ GRP参照はペアで使用されるべきである。たとえば、エンハンスメントレイヤのピクチャは、少なくとも2つのGRP参照に基づいて復元されるべきである。
・ GRP参照ピクチャは、レイヤ間参照ピクチャとともに使用されるべきである。たとえば、エンハンスメントレイヤのピクチャは、GRP参照ピクチャおよび参照レイヤのアップサンプリングされたコロケートされた参照ピクチャに基づいて、復元されるべきである。参照レイヤは、どのGRP参照ピクチャが生成されるかに基づいて、エンハンスメントレイヤ参照ピクチャに関連するエンハンスメントレイヤに対応することができる。
・ GRP参照ピクチャは、現在のピクチャのみに使用され得、その結果、DPBの中に配置されない。
[00164]これらの制約または制限は、残差予測参照ピクチャを生成するか、またはエンハンスメントレイヤのピクチャを復元する際に適用され得る。デコーダ30は、あらかじめ定義されたシンタックスに従って、シグナリングされた情報を復号し、1つまたは複数の残差予測参照ピクチャを生成する際に復号された情報を使用することができる。
[00165]ブロック1003で、デコーダ30は、エンハンスメントレイヤ参照ピクチャおよび復号されたシグナリングされた情報に基づいて、残差予測参照ピクチャを生成する。残差予測参照ピクチャは、エンハンスメントレイヤ内の参照ピクチャに基づいて生成され、エンハンスメントレイヤの参照ピクチャリストに記憶され得る。生成された残差予測参照ピクチャは、それから残差予測参照ピクチャが生成されたエンハンスメントレイヤ参照ピクチャと同じ動きフィールドおよび同じピクチャ順序カウント(POC)を有することができる。一実施形態では、残差予測参照ピクチャは、残差予測参照ピクチャがエンハンスメントレイヤ参照ピクチャと同じ動きフィールドとPOCとを有するような方式で、生成される。たとえば、残差予測参照ピクチャは、それが基づいているエンハンスメントレイヤ参照ピクチャと同じ動きフィールドを使用し、エンハンスメントレイヤ参照ピクチャ用の同じPOCが残差予測参照ピクチャに割り当てられる。
[00166]ブロック1004で、デコーダ30は、メモリユニット内のエンハンスメントレイヤの少なくとも1つの参照ピクチャリストに、生成された残差予測参照ピクチャを記憶する。残差予測参照ピクチャは、記憶され、予測で使用され得るが、(たとえば、ディスプレイデバイスに)出力されない場合がある。デコーダ30は、残差予測参照ピクチャを記憶する追加のRPSサブセットを有し得る。残差予測参照ピクチャのみがこれらのRPSサブセットに記憶され得、残差予測参照ピクチャは、エンハンスメントレイヤの参照リストの他の既存のサブセットには記憶され得ない。
[00167]デコーダ30は、残差予測参照ピクチャに基づいて、エンハンスメントレイヤの復元されたピクチャを生成し得る。一実施形態では、デコーダ30は、エンハンスメントレイヤの参照レイヤのアップサンプリングされたコロケートされた参照ピクチャを生成し、残差予測参照ピクチャおよび参照レイヤのアップサンプリングされたコロケートされた参照ピクチャに基づいて、エンハンスメントレイヤの復元されたピクチャを生成する。たとえば、これは、GRP参照がレイヤ間参照とともに使用されるという制約のときに、行われ得る。ある特定の実施形態では、残差予測参照ピクチャは現在のピクチャのみに使用され得、その結果、DPBの中へ配置されない。
[00168]これらの技法は、高レベルシンタックス専用SHVCにおいて使用され得る。高レベルシンタックス専用SHVCでは、シグナリングされた情報は、スライスレベルまたはその上のレベルで指定される。GRPはブロックレベルで利用可能ではないので、デコーダ30は、エンハンスメントレイヤに関連する参照レイヤ内の対応するピクチャの残差に重み係数を適用することなく、エンハンスメントレイヤの復元されたピクチャを生成し得る。代わりに、デコーダ30は、1つまたは複数の残差予測参照ピクチャを使用することができる。プロセス1000は、ブロック1005で終了する。
[00169]本開示においてGRP参照に関して記載された任意の特徴および/または実施形態は、別個に、またはそれらの任意の組合せで実装され得る。
高レベルシンタックス専用SHVCにおいてGRPを模倣する別の手法
[00170][7]Aminlou、「Enhanced Inter Layer Reference Picture」では、高レベルシンタックス専用SHVCにおいてGRPを模倣する別の方法が提案された。この手法では、ベースレイヤ動き情報と、ベースレイヤ参照フレームと、エンハンスメントレイヤ参照とを使用して、高度レイヤ間参照(「EILR」)ピクチャと呼ばれる新しい参照フレームが生成される。この新しく生成された参照フレームを用いて、ブロックレベルのGRPが模倣され得る。
[00171]EILRピクチャは、エンハンスメントレイヤからの動き補償された高周波成分を、ベースレイヤの復元されたサンプル値に加算することによって、生成される。図11に示されたように、EILR1150の各ブロック(H(x,y))1125について、対応するコロケートされたブロックがベースレイヤ(B(x,y))1115に位置し、参照フレームと動きベクトル(MVBL)とを含むその動き情報が抽出される。ベースレイヤの動き情報を使用して、ベースレイヤ参照ピクチャ(R’(x,y))1110および対応するエンハンスメントレイヤ参照ピクチャ(R(x,y))1120から、動き補償された予測によって2つのブロックが生成される。次いで、これら2つのブロック間の差分(D(x,y))1130が計算され、重み係数(w)によって乗算され、ベースレイヤ参照フレームのコロケートされたブロック1115のサンプル値に加算されて、EILR1150のブロック1125を形成する。[7]Aminlouでは、ルーマ成分用の7/8およびクロマ成分用の1(すなわち、重み付けなし)の重み係数が使用される。
[00172][8]He、「ILR Enhancement with Differential Coding」では、重み係数は、エンコーダによって決定され、デコーダにシグナリングされる。しかしながら、それらの開示が参照によりそれらの全体で本明細書に組み込まれる、2013年3月8日に出願された米国仮出願第61/775,352号、2013年3月19日に出願された米国仮出願第61/803,368号、2013年6月7日に出願された米国仮出願第61/832,623号、および2014年1月7日に出願された米国出願第14/149,260号に記載されたように、計算の複雑さとメモリアクセス要件とを低減するために、GRPブロックの動きベクトルは、整数ピクセル位置に丸められ得る。
[00173]本開示では、様々な実施形態は、以下の態様を改善することに向けられている。
・ [7]Aminlouで導入されたGRP参照の生成は、それほど効率的ではなく、計算の複雑さに関して込み入っている。
・ GRP参照がエンハンスメントレイヤの参照リストに挿入された後、GRP参照の使用は制約されず、コーディング性能および実装コストに関して効率性が小さくなることにつながる。
・ 高い計算の複雑さおよび高いメモリアクセス要件のために、GRP参照の生成中、動き補償補間は望ましくない。動きベクトルは整数ピクセル位置に丸められ得るが、整数ピクセル精度の動きベクトルは、特に4:2:0のカラーフォーマット内のビデオコンテンツの場合、クロマ成分用の動き補償補間にさらにつながり得るので、問題は完全には解決されない。
[00174]本開示のいくつかの態様によれば、GRP参照ピクチャは、いかなる追加の重み係数もなしに、コロケートされたベースレイヤブロック、およびエンハンスメントレイヤ参照とベースレイヤ参照との間の動き補償された差分によって直接生成される。一実施形態では、GRP参照ピクチャは、追加の重み係数を組み込むことなく(たとえば、0.5および1のみの重み係数を与え、他の重み係数を与えずに)、式(10)および(11)に従って生成される。いくつかの実施形態では、参照によりその全体が本明細書に組み込まれる、2013年1月30日に出願された米国仮出願第61/758,723号に記載された、3タップまたは4タップのアップサンプリング/平滑化フィルタは、エンハンスメントレイヤ参照とベースレイヤ参照との間の動き補償された差分を導出するために使用され得る。そのような実施形態では、GRP参照は以下のように生成され得る。コロケートされたベースレイヤブロックが動きベクトルを有していないか、またはイントラコーディングされているとき、ベースレイヤのアップサンプリング/フィルタリングされた復元は、GRP参照内のコロケートされたブロックに使用される。代替として、GRP参照内のコロケートされたブロックを生成するために、ゼロの動きなどのデフォルトの動きベクトルがベースブロック用に想定される。代替として、GRP参照内のコロケートされたブロックを生成するために、隣接ブロックからの動きベクトルが使用される。
[00175]上述されたように、GRPピクチャ内のブロックを生成するために、ベースレイヤ内のコロケートされたベースレイヤブロックの参照ピクチャは、コロケートされたベースレイヤブロックのスケーリングされたMVによって示される。次いで、エンハンスメントレイヤ内の対応する参照ピクチャは、ベースレイヤの参照ピクチャと同じアクセスユニットに属するエンハンスメントレイヤのピクチャに設定される。必要なエンハンスメントレイヤおよび/または参照レイヤが、コーディングされたビットストリーム内に存在しない場合があり得る。GRPピクチャ内の現在のブロックを形成するために使用される(インターコーディングされた)コロケートされたベースブロックのMVによって示されたエンハンスメントレイヤ内の2つの参照のうちの1つが利用可能ではないとき、ブロックは単方向予測を使用することによって生成される。(インターコーディングされた)コロケートされたベースブロックの両方の参照がエンハンスメントレイヤ内で利用可能ではないとき、ブロックはイントラコーディングされたと見なされ得るし、以下の動作のうちのいずれかが適用され得る。
・ (インターコーディングされた)コロケートされたベースブロックの参照が利用可能ではない場合、同じ参照リスト内のエンハンスメントレイヤとベースレイヤの両方で利用可能な最初の参照が、動き補償された差分を導出するために使用され得る。この場合、新しい参照用の動きベクトルは、時間距離、たとえばPOC差分に基づいてスケーリングされるべきである。
・ GRP参照ピクチャ内の現在のブロックを形成するために、コロケートされたベースブロックを使用する。
[00176]GRP参照ピクチャの動きフィールドは、レイヤ間参照ピクチャ(アップサンプリングされたコロケートされたベースピクチャ)の動きフィールドと同じ方法で生成され得る。エンハンスメント参照とベースレイヤ参照との間の動き補償された差分を導出する動き補償プロセスは、GRP参照ピクチャの生成された動きフィールド、および16×16ブロックのレベルなどの動きフィールド内の最小単位のサイズのレベルに基づき得る。
[00177]参照リストにGRP参照を挿入するとき、
・ GRP参照ピクチャは、短期参照としてマーキングされ得、また、非ゼロの動きベクトルを有し得る。
・ GRP参照ピクチャは、長期参照としてマーキングされ得、また、必ずゼロの動きを有する。
・ GRP参照ピクチャが現在のエンハンスメントのピクチャにのみ使用でき、DPBに入れられない、という制約が適用され得る。
・ GRP参照ピクチャが単方向予測のソースとしてのみ使用され得るという制約は、GRP参照ピクチャが双方向予測の要素ではあり得ないことを意味する。
[00178]エンハンスメント参照リストを初期化するとき、GRP参照ピクチャは、レイヤ間参照ピクチャの直前に配置され得る。代替として、GRP参照ピクチャは、レイヤ間参照ピクチャを置き換える。GRP参照と同様に、それらの各々の開示が参照によりその全体で本明細書に組み込まれる、2013年1月7日に出願された米国仮出願第61/749,865号、2012年12月7日に出願された第61/734,920号、および2013年1月4日に出願された第61/749,077号に記載された推定モードなどのいくつかの他の低レベルツールは、ベースレイヤの動きおよびエンハンスメント参照を用いてエンハンスメントレイヤ用の新しい参照フレームを生成することによって、模倣され得る。
[00179]GRP参照ピクチャを生成するとき、丸められた動きベクトルは、動き補償補間がルーマ成分とクロマ成分の両方に必要とされないように、使用され得る。一実施形態では、ルーマ成分とクロマ成分は、同じ丸められた動きベクトルを共有する。ビデオコンテンツが4:2:0のカラーフォーマットであるとき、動きベクトルは、動き補償補間がクロマ成分に必要とされないことを保証するために、2倍ピクセル精度で丸められる。ビデオコンテンツが4:2:2のカラーフォーマットであるとき、動きベクトルの水平成分は2倍ピクセル精度で丸められ、動きベクトルの垂直成分は整数ピクセル精度で丸められる。
[00180]別の実施形態では、動き補償補間が必要とされないことを保証するために、同じ動きベクトルの異なる丸められたバージョンがルーマ成分およびクロマ成分に使用される。たとえば、4:2:0のカラーフォーマットのビデオの場合、ブロック用の(1/4ピクセル精度で、32ビットで表現される)動きベクトルは、(MVx,MVy)である。ルーマ成分の場合、丸められたMVは、((MVx+4)&0xFFFFFFFC,(MVy+4)&0xFFFFFFFC)であり得る。クロマ成分の場合、丸められたMVは、((MVx+8)&0xFFFFFFF8,(MVy+8)&0xFFFFFFF8)であり得る。ここで、「&」はビット単位の論理演算「論理積(アンド)」を示すことに留意されたい。
[00181]動きベクトルは、常に、ゼロ、正の無限大、または負の無限大に向かって丸められ得る。代替として、動きベクトルは、その値に基づいて、正/負の無限大に向かって丸められ得る。たとえば、動きベクトルの垂直成分は、それが正であるとき正の無限大に向かって丸められ、それが負であるとき負の無限大に向かって丸められる。同様に、動きベクトルの水平成分は、それが正であるとき正の無限大に向かって丸められ、それが負であるとき負の無限大に向かって丸められる。
GRP参照ピクチャの生成
[00182]本実施形態では、GRP参照ピクチャは、復元されたコロケートされたベースレイヤブロックに基づいて生成される。IBがアップサンプリングされたコロケートされたベースピクチャを示すとする。IBの動きフィールドが、レイヤ間参照の動きフィールドを生成するための動きマッピングと同じ動きマッピングによって生成されていると仮定する。BがIB内のPUを意味し、MVがBの中の動きベクトルを表し、Re、R’bが、それぞれエンハンスメント参照、アップサンプリング/平滑化されたベース参照を示すとする。GRP参照内のコロケートされたブロックは以下のように生成され得る。
GRP=B+w・MV(Re−R’b) (15)
ここで、MV(R)は、動きベクトルMVを有する参照R内の参照ブロックを示す。wは重み係数を示し、wの通常の値は1であり得る。wの値は、スライスタイプもしくは他のスライスレベルまたは上記の情報に基づいて、あらかじめ定義される。wはまた、ビットストリーム内でシグナリングされ得る。ビットストリーム内でシグナリングするとき、wはあらかじめ定義された値に基づいて量子化され得る。さらなるフィルタリングが、B、Re、R’b、MV(Re−R’b)、または任意の組合せに適用され得る。ブロックBが2つの動きベクトルを有するとき、(15)の双方向性の形態が使用され得る。ブロックBがイントラコーディングされたとき、MV(R)は0として見なされ得るし、その結果、RGRP=Bである。生成されたGRP参照は、コロケートされたベースピクチャのPOCと同じPOCを共有することができる。
[00183]例によっては、本明細書で説明された技法のうちいずれかの、いくつかの行為またはイベントは、異なるシーケンスで実行され得、追加、マージ、または完全に除外され得る(たとえば、すべての説明した作用またはイベントが、本技法の実施のために必要であるとは限らない)ことを認識されたい。さらに、いくつかの例では、行為またはイベントは、連続的にではなく、たとえば、マルチスレッド処理、割込み処理、または複数のプロセッサを通して、同時に実行され得る。
[00184]本明細書で開示された情報および信号は、多種多様な技術および技法のいずれかを使用して表され得る。たとえば、上記の説明全体にわたって参照され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、およびチップは、電圧、電流、電磁波、磁場もしくは磁性粒子、光場もしくは光学粒子、またはそれらの任意の組合せによって表され得る。
[00185]本明細書で開示された実施形態に関して記載された様々な例示的な論理ブロック、モジュール、回路、およびアルゴリズムステップは、電子ハードウェア、コンピュータソフトウェア、または両方の組合せとして実装され得る。ハードウェアとソフトウェアのこの互換性を明確に示すために、様々な例示的な構成要素、ブロック、モジュール、回路、およびステップが、概してそれらの機能に関して上述されている。そのような機能がハードウェアとして実装されるか、またはソフトウェアとして実装されるかは、特定の適用例および全体的なシステムに課された設計制約に依存する。当業者は、特定の適用例ごとに様々な方法で記載された機能を実装し得るが、そのような実装の決定は、本発明の範囲からの逸脱を引き起こすと解釈されるべきではない。
[00186]本明細書に記載された技術は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せに実装され得る。そのような技法は、汎用コンピュータ、ワイヤレス通信デバイスハンドセット、またはワイヤレス通信デバイスハンドセットおよび他のデバイスにおける適用例を含む複数の用途を有する集積回路デバイスなどの、様々なデバイスのいずれかにおいて実装され得る。モジュールまたは構成要素として記載された任意の特徴は、集積論理デバイス内で一緒に、または個別であるが相互運用可能な論理デバイスとして別々に実装され得る。ソフトウェアに実装された場合、本技法は、実行されたとき、上述された方法のうちの1つまたは複数を実行する命令を含むプログラムコードを備えるコンピュータ可読データ記憶媒体によって、少なくとも部分的に実現され得る。コンピュータ可読データ記憶媒体は、パッケージング材料を含むことがあるコンピュータプログラム製品の一部を形成し得る。コンピュータ可読媒体は、同期型ダイナミックランダムアクセスメモリ(SDRAM)などのランダムアクセスメモリ(RAM)、読取り専用メモリ(ROM)、不揮発性ランダムアクセスメモリ(NVRAM)、電気消去可能プログラマブル読取り専用メモリ(EEPROM(登録商標))、フラッシュメモリ、磁気または光学データ記憶媒体などの、メモリまたはデータ記憶媒体を備え得る。本技法は、追加または代替として、伝搬信号または電波などの、命令またはデータ構造の形態でプログラムコードを搬送または伝達し、コンピュータによってアクセスされ、読み取られ、および/または実行され得るコンピュータ可読通信媒体によって、少なくとも部分的に実現され得る。
[00187]プログラムコードは、1つまたは複数のデジタル信号プロセッサ(DSP)などの1つまたは複数のプロセッサ、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブルロジックアレイ(FPGA)、または他の等価の集積回路もしくはディスクリート論理回路を含み得るプロセッサによって実行され得る。そのようなプロセッサは、本開示に記載された技法のいずれかを実行するように構成され得る。汎用プロセッサはマイクロプロセッサであり得るが、代替として、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械であり得る。プロセッサはまた、コンピューティングデバイスの組合せ、たとえば、DSPとマイクロプロセッサとの組合せ、複数のマイクロプロセッサ、DSPコアと連携する1つもしくは複数のマイクロプロセッサ、または任意の他のそのような構成として実装され得る。したがって、本明細書で使用する「プロセッサ」という用語は、上記の構造、上記の構造の任意の組合せ、または本明細書に記載された技法の実装に適した任意の他の構造もしくは装置を指し得る。さらに、いくつかの態様では、本明細書に記載された機能は、符号化および復号のために構成された専用のソフトウェアモジュールもしくはハードウェアモジュール内に提供され得るか、または複合ビデオエンコーダ/デコーダ(コーデック)に組み込まれ得る。
[00188]本発明の様々な実施形態が記載された。これらおよび他の実施形態は、以下の特許請求の範囲内に入る。
[00188]本発明の様々な実施形態が記載された。これらおよび他の実施形態は、以下の特許請求の範囲内に入る。
[C1] ビデオ情報を復号するための装置であって、
エンハンスメントレイヤの少なくとも1つの参照ピクチャリストを記憶するように構成されたメモリユニットと、前記少なくとも1つの参照ピクチャリストは残差予測参照ピクチャの情報を備え、
前記メモリユニットに動作可能に結合され、
残差予測参照ピクチャの生成についてのシグナリングされた情報を復号することと、
生成される残差予測参照ピクチャが、前記残差予測参照ピクチャが生成されるエンハンスメントレイヤ参照ピクチャと同じ動きフィールドおよび同じピクチャ順序カウント(POC)を有するように、前記エンハンスメントレイヤ参照ピクチャおよび前記復号されたシグナリングされた情報に基づいて、前記残差予測参照ピクチャを生成することと、
前記エンハンスメントレイヤの前記少なくとも1つの参照ピクチャリストに、前記生成された残差予測参照ピクチャを記憶することと、
を行うように構成された、プロセッサと、
を備える、装置。
[C2] ピクチャの複数のスライスは、同じ生成された残差予測参照ピクチャを有する、C1に記載の装置。
[C3] 前記シグナリングされた情報は、残差予測参照ピクチャが使用されるかどうかを示すフラグを備え、前記プロセッサは、残差予測参照ピクチャが使用されることを前記フラグが示すとき、前記残差予測参照ピクチャを生成するようにさらに構成された、C1に記載の装置。
[C4] 前記プロセッサは、残差予測参照ピクチャのみを含む参照パラメータセット(RPS)のサブセットに、前記生成された残差予測参照ピクチャを記憶するようにさらに構成された、C1に記載の装置。
[C5] 前記シグナリングされた情報は、生成されるべき残差予測参照ピクチャの数を備える、C1に記載の装置。
[C6] 前記残差予測参照ピクチャは、残差予測参照の複数のタイプから選択されたタイプに関連する、C1に記載の装置。
[C7] 前記シグナリングされた情報は、前記残差予測参照ピクチャを生成するかどうかを示す1つまたは複数のシンタックス要素を備え、残差予測参照の前記複数のタイプのうちのただ1つが、生成されるべき前記残差予測参照ピクチャに利用可能である、C6に記載の装置。
[C8] 残差予測参照ピクチャの前記複数のタイプのうちの少なくとも2つのタイプが利用可能であり、前記シグナリングされた情報は、前記残差予測参照ピクチャを生成するかどうかを示すとともに前記残差予測参照ピクチャ用の前記少なくとも2つのタイプのうちの1つを示す1つまたは複数のシンタックス要素を備える、C6に記載の装置。
[C9] 前記プロセッサは、
前記残差予測参照ピクチャに基づいて、前記エンハンスメントレイヤの復元されたピクチャを生成すること、
を行うようにさらに構成された、C1に記載の装置。
[C10] 前記プロセッサは、
前記エンハンスメントレイヤの参照レイヤのアップサンプリングされたコロケートされた参照ピクチャを生成することと、
前記残差予測参照ピクチャおよび前記参照レイヤの前記アップサンプリングされたコロケートされた参照ピクチャに基づいて、前記エンハンスメントレイヤの前記復元されたピクチャを生成することと、
を行うようにさらに構成された、C9に記載の装置。
[C11] 前記残差予測参照ピクチャは復号ピクチャバッファ(DPB)の中に配置されない、C9に記載の装置。
[C12] 前記シグナリングされた情報は、スライスレベルまたはその上のレベルで指定される、C1に記載の装置。
[C13] 前記プロセッサは、前記エンハンスメントレイヤに関連する参照レイヤ内の対応するピクチャの残差に重み係数を適用することなく、前記エンハンスメントレイヤの前記復元されたピクチャを生成するようにさらに構成された、C9に記載の装置。
[C14] 前記シグナリングされた情報は、ピクチャパラメータセット(PPS)、ビデオパラメータセット(VPS)、シーケンスパラメータセット(SPS)、参照パラメータセット(RPS)、またはスライスヘッダから選択されたレベルで指定される、C1に記載の装置。
[C15] 前記装置は、デスクトップコンピュータ、ノートブックコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、セットトップボックス、電話ハンドセット、スマートフォン、スマートパッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、およびビデオストリーミングデバイスのうちの1つまたは複数からなるグループから選択される、C1に記載の装置。
[C16] ビデオ情報を復号する方法であって、
メモリユニットに動作可能に結合されたプロセッサを使用して、残差予測参照ピクチャの生成についてのシグナリングされた情報を復号することと、
生成される残差予測参照ピクチャが、前記残差予測参照ピクチャが生成されるエンハンスメントレイヤ参照ピクチャと同じ動きフィールドおよび同じピクチャ順序カウント(POC)を有するように、エンハンスメントレイヤの前記エンハンスメントレイヤ参照ピクチャおよび前記復号されたシグナリングされた情報に基づいて、前記残差予測参照ピクチャを生成することと、
前記メモリユニット内の前記エンハンスメントレイヤの少なくとも1つの参照ピクチャリストに、前記生成された残差予測参照ピクチャを記憶することと、
を備える、方法。
[C17] 前記残差予測参照ピクチャは、残差予測参照の複数のタイプから選択されたタイプに関連する、C16に記載の方法。
[C18] 前記シグナリングされた情報は、前記残差予測参照ピクチャを生成するかどうかを示す1つまたは複数のシンタックス要素を備え、残差予測参照の前記複数のタイプのうちのただ1つが、生成されるべき前記残差予測参照ピクチャに利用可能である、C17に記載の方法。
[C19] 残差予測参照ピクチャの前記複数のタイプのうちの少なくとも2つのタイプが利用可能であり、前記シグナリングされた情報は、前記残差予測参照ピクチャを生成するかどうかを示すとともに前記残差予測参照ピクチャ用の前記少なくとも2つのタイプのうちの1つを示す1つまたは複数のシンタックス要素を備える、C17に記載の方法。
[C20] ビデオ情報を符号化するための装置であって、
スケーラブルビデオコーディングにおいて、ビデオ情報の1つまたは複数のレイヤに関連する少なくとも1つの参照ピクチャリストを記憶するように構成されたメモリユニットと、
前記メモリユニットに動作可能に結合され、
エンハンスメントレイヤに関連する、対応するエンハンスメントレイヤ参照ピクチャに少なくとも部分的に基づいて、残差予測参照ピクチャを生成することについての情報を符号化することと、前記残差予測参照ピクチャは、前記残差予測参照ピクチャが生成される前記エンハンスメントレイヤ参照ピクチャと同じ動きフィールドおよび同じピクチャ順序カウント(POC)を有するように構成され、
前記符号化された情報をビットストリーム内でシグナリングすることと、
を行うように構成された、プロセッサと、
を備える、装置。
[C21] 前記プロセッサは、ピクチャの複数のスライスが同じ生成された残差予測参照ピクチャを有するという制約を適用するようにさらに構成された、C20に記載の装置。
[C22] 前記符号化された情報は、生成されるべき残差予測参照ピクチャの数を備える、C20に記載の装置。
[C23] 前記残差予測参照ピクチャは、残差予測参照の複数のタイプから選択されたタイプに関連する、C20に記載の装置。
[C24] 前記複数のタイプは、0.5の重み係数を表す第1のタイプと、1の重み係数を表す第2のタイプとを含む、C23に記載の装置。
[C25] 前記符号化された情報は、前記残差予測参照ピクチャを生成するかどうかを示す1つまたは複数のシンタックス要素を備え、残差予測参照の前記複数のタイプのうちのただ1つが、生成されるべき前記残差予測参照ピクチャに利用可能である、C23に記載の装置。
[C26] 残差予測参照ピクチャの前記複数のタイプのうちの少なくとも2つのタイプが利用可能であり、前記符号化された情報は、前記残差予測参照ピクチャを生成するかどうかを示すとともに前記残差予測参照ピクチャ用の前記少なくとも2つのタイプのうちの1つを示す1つまたは複数のシンタックス要素を備える、C23に記載の装置。
[C27] 前記符号化された情報は、前記エンハンスメントレイヤに関連する参照ピクチャリスト内の第1の短期参照ピクチャに基づいて前記残差予測参照ピクチャを生成するかどうかを示す1つまたは複数のシンタックス要素を備える、C20に記載の装置。
[C28] 前記符号化された情報は、ピクチャパラメータセット(PPS)、ビデオパラメータセット(VPS)、シーケンスパラメータセット(SPS)、参照パラメータセット(RPS)、またはスライスヘッダから選択されたレベルで指定される、C20に記載の装置。
[C29] ビデオ情報を符号化する方法であって、
メモリユニットに動作可能に結合されたプロセッサを使用して、エンハンスメントレイヤに関連する、対応するエンハンスメントレイヤ参照ピクチャに少なくとも部分的に基づいて、残差予測参照ピクチャを生成することについての情報を符号化することと、
ここで、前記残差予測参照ピクチャは、前記残差予測参照ピクチャが生成され前記エンハンスメントレイヤ参照ピクチャと同じ動きフィールドおよび同じピクチャ順序カウント(POC)を有するように構成され、
前記メモリユニットは、スケーラブルビデオコーディングにおいて、ビデオ情報の1つまたは複数のレイヤに関連する少なくとも1つの参照ピクチャリストを記憶するように構成され、
前記符号化された情報をビットストリーム内でシグナリングすることと、
を備える、方法。
[C30] 前記残差予測参照ピクチャは、残差予測参照の複数のタイプから選択されたタイプに関連し、残差予測参照ピクチャの前記複数のタイプのうちの少なくとも2つのタイプが利用可能であり、前記符号化された情報は、前記残差予測参照ピクチャを生成するかどうかを示すとともに前記残差予測参照ピクチャ用の前記少なくとも2つのタイプのうちの1つを示す1つまたは複数のシンタックス要素を備える、C29に記載の方法。

Claims (30)

  1. ビデオ情報を復号するための装置であって、
    エンハンスメントレイヤの少なくとも1つの参照ピクチャリストを記憶するように構成されたメモリユニットと、前記少なくとも1つの参照ピクチャリストは残差予測参照ピクチャの情報を備え、
    前記メモリユニットに動作可能に結合され、
    残差予測参照ピクチャの生成についてのシグナリングされた情報を復号することと、
    生成される残差予測参照ピクチャが、前記残差予測参照ピクチャが生成されるエンハンスメントレイヤ参照ピクチャと同じ動きフィールドおよび同じピクチャ順序カウント(POC)を有するように、前記エンハンスメントレイヤ参照ピクチャおよび前記復号されたシグナリングされた情報に基づいて、前記残差予測参照ピクチャを生成することと、
    前記エンハンスメントレイヤの前記少なくとも1つの参照ピクチャリストに、前記生成された残差予測参照ピクチャを記憶することと、
    を行うように構成された、プロセッサと、
    を備える、装置。
  2. ピクチャの複数のスライスは、同じ生成された残差予測参照ピクチャを有する、請求項1に記載の装置。
  3. 前記シグナリングされた情報は、残差予測参照ピクチャが使用されるかどうかを示すフラグを備え、前記プロセッサは、残差予測参照ピクチャが使用されることを前記フラグが示すとき、前記残差予測参照ピクチャを生成するようにさらに構成された、請求項1に記載の装置。
  4. 前記プロセッサは、残差予測参照ピクチャのみを含む参照パラメータセット(RPS)のサブセットに、前記生成された残差予測参照ピクチャを記憶するようにさらに構成された、請求項1に記載の装置。
  5. 前記シグナリングされた情報は、生成されるべき残差予測参照ピクチャの数を備える、請求項1に記載の装置。
  6. 前記残差予測参照ピクチャは、残差予測参照の複数のタイプから選択されたタイプに関連する、請求項1に記載の装置。
  7. 前記シグナリングされた情報は、前記残差予測参照ピクチャを生成するかどうかを示す1つまたは複数のシンタックス要素を備え、残差予測参照の前記複数のタイプのうちのただ1つが、生成されるべき前記残差予測参照ピクチャに利用可能である、請求項6に記載の装置。
  8. 残差予測参照ピクチャの前記複数のタイプのうちの少なくとも2つのタイプが利用可能であり、前記シグナリングされた情報は、前記残差予測参照ピクチャを生成するかどうかを示すとともに前記残差予測参照ピクチャ用の前記少なくとも2つのタイプのうちの1つを示す1つまたは複数のシンタックス要素を備える、請求項6に記載の装置。
  9. 前記プロセッサは、
    前記残差予測参照ピクチャに基づいて、前記エンハンスメントレイヤの復元されたピクチャを生成すること、
    を行うようにさらに構成された、請求項1に記載の装置。
  10. 前記プロセッサは、
    前記エンハンスメントレイヤの参照レイヤのアップサンプリングされたコロケートされた参照ピクチャを生成することと、
    前記残差予測参照ピクチャおよび前記参照レイヤの前記アップサンプリングされたコロケートされた参照ピクチャに基づいて、前記エンハンスメントレイヤの前記復元されたピクチャを生成することと、
    を行うようにさらに構成された、請求項9に記載の装置。
  11. 前記残差予測参照ピクチャは復号ピクチャバッファ(DPB)の中に配置されない、請求項9に記載の装置。
  12. 前記シグナリングされた情報は、スライスレベルまたはその上のレベルで指定される、請求項1に記載の装置。
  13. 前記プロセッサは、前記エンハンスメントレイヤに関連する参照レイヤ内の対応するピクチャの残差に重み係数を適用することなく、前記エンハンスメントレイヤの前記復元されたピクチャを生成するようにさらに構成された、請求項9に記載の装置。
  14. 前記シグナリングされた情報は、ピクチャパラメータセット(PPS)、ビデオパラメータセット(VPS)、シーケンスパラメータセット(SPS)、参照パラメータセット(RPS)、またはスライスヘッダから選択されたレベルで指定される、請求項1に記載の装置。
  15. 前記装置は、デスクトップコンピュータ、ノートブックコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、セットトップボックス、電話ハンドセット、スマートフォン、スマートパッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、およびビデオストリーミングデバイスのうちの1つまたは複数からなるグループから選択される、請求項1に記載の装置。
  16. ビデオ情報を復号する方法であって、
    メモリユニットに動作可能に結合されたプロセッサを使用して、残差予測参照ピクチャの生成についてのシグナリングされた情報を復号することと、
    生成される残差予測参照ピクチャが、前記残差予測参照ピクチャが生成されるエンハンスメントレイヤ参照ピクチャと同じ動きフィールドおよび同じピクチャ順序カウント(POC)を有するように、エンハンスメントレイヤの前記エンハンスメントレイヤ参照ピクチャおよび前記復号されたシグナリングされた情報に基づいて、前記残差予測参照ピクチャを生成することと、
    前記メモリユニット内の前記エンハンスメントレイヤの少なくとも1つの参照ピクチャリストに、前記生成された残差予測参照ピクチャを記憶することと、
    を備える、方法。
  17. 前記残差予測参照ピクチャは、残差予測参照の複数のタイプから選択されたタイプに関連する、請求項16に記載の方法。
  18. 前記シグナリングされた情報は、前記残差予測参照ピクチャを生成するかどうかを示す1つまたは複数のシンタックス要素を備え、残差予測参照の前記複数のタイプのうちのただ1つが、生成されるべき前記残差予測参照ピクチャに利用可能である、請求項17に記載の方法。
  19. 残差予測参照ピクチャの前記複数のタイプのうちの少なくとも2つのタイプが利用可能であり、前記シグナリングされた情報は、前記残差予測参照ピクチャを生成するかどうかを示すとともに前記残差予測参照ピクチャ用の前記少なくとも2つのタイプのうちの1つを示す1つまたは複数のシンタックス要素を備える、請求項17に記載の方法。
  20. ビデオ情報を符号化するための装置であって、
    スケーラブルビデオコーディングにおいて、ビデオ情報の1つまたは複数のレイヤに関連する少なくとも1つの参照ピクチャリストを記憶するように構成されたメモリユニットと、
    前記メモリユニットに動作可能に結合され、
    エンハンスメントレイヤに関連する、対応するエンハンスメントレイヤ参照ピクチャに少なくとも部分的に基づいて、残差予測参照ピクチャを生成することについての情報を符号化することと、前記残差予測参照ピクチャは、前記残差予測参照ピクチャが生成される前記エンハンスメントレイヤ参照ピクチャと同じ動きフィールドおよび同じピクチャ順序カウント(POC)を有するように構成され、
    前記符号化された情報をビットストリーム内でシグナリングすることと、
    を行うように構成された、プロセッサと、
    を備える、装置。
  21. 前記プロセッサは、ピクチャの複数のスライスが同じ生成された残差予測参照ピクチャを有するという制約を適用するようにさらに構成された、請求項20に記載の装置。
  22. 前記符号化された情報は、生成されるべき残差予測参照ピクチャの数を備える、請求項20に記載の装置。
  23. 前記残差予測参照ピクチャは、残差予測参照の複数のタイプから選択されたタイプに関連する、請求項20に記載の装置。
  24. 前記複数のタイプは、0.5の重み係数を表す第1のタイプと、1の重み係数を表す第2のタイプとを含む、請求項23に記載の装置。
  25. 前記符号化された情報は、前記残差予測参照ピクチャを生成するかどうかを示す1つまたは複数のシンタックス要素を備え、残差予測参照の前記複数のタイプのうちのただ1つが、生成されるべき前記残差予測参照ピクチャに利用可能である、請求項23に記載の装置。
  26. 残差予測参照ピクチャの前記複数のタイプのうちの少なくとも2つのタイプが利用可能であり、前記符号化された情報は、前記残差予測参照ピクチャを生成するかどうかを示すとともに前記残差予測参照ピクチャ用の前記少なくとも2つのタイプのうちの1つを示す1つまたは複数のシンタックス要素を備える、請求項23に記載の装置。
  27. 前記符号化された情報は、前記エンハンスメントレイヤに関連する参照ピクチャリスト内の第1の短期参照ピクチャに基づいて前記残差予測参照ピクチャを生成するかどうかを示す1つまたは複数のシンタックス要素を備える、請求項20に記載の装置。
  28. 前記符号化された情報は、ピクチャパラメータセット(PPS)、ビデオパラメータセット(VPS)、シーケンスパラメータセット(SPS)、参照パラメータセット(RPS)、またはスライスヘッダから選択されたレベルで指定される、請求項20に記載の装置。
  29. ビデオ情報を符号化する方法であって、
    メモリユニットに動作可能に結合されたプロセッサを使用して、エンハンスメントレイヤに関連する、対応するエンハンスメントレイヤ参照ピクチャに少なくとも部分的に基づいて、残差予測参照ピクチャを生成することについての情報を符号化することと、
    ここで、前記残差予測参照ピクチャは、前記残差予測参照ピクチャが生成され前記エンハンスメントレイヤ参照ピクチャと同じ動きフィールドおよび同じピクチャ順序カウント(POC)を有するように構成され、
    前記メモリユニットは、スケーラブルビデオコーディングにおいて、ビデオ情報の1つまたは複数のレイヤに関連する少なくとも1つの参照ピクチャリストを記憶するように構成され、
    前記符号化された情報をビットストリーム内でシグナリングすることと、
    を備える、方法。
  30. 前記残差予測参照ピクチャは、残差予測参照の複数のタイプから選択されたタイプに関連し、残差予測参照ピクチャの前記複数のタイプのうちの少なくとも2つのタイプが利用可能であり、前記符号化された情報は、前記残差予測参照ピクチャを生成するかどうかを示すとともに前記残差予測参照ピクチャ用の前記少なくとも2つのタイプのうちの1つを示す1つまたは複数のシンタックス要素を備える、請求項29に記載の方法。
JP2016506589A 2013-04-05 2014-04-02 高レベルシンタックス専用shvcにおける一般化残差予測ならびにそのシグナリングおよび管理 Expired - Fee Related JP6352390B2 (ja)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201361809216P 2013-04-05 2013-04-05
US61/809,216 2013-04-05
US201361811070P 2013-04-11 2013-04-11
US61/811,070 2013-04-11
US201361845037P 2013-07-11 2013-07-11
US61/845,037 2013-07-11
US14/242,679 2014-04-01
US14/242,679 US9380305B2 (en) 2013-04-05 2014-04-01 Generalized residual prediction in high-level syntax only SHVC and signaling and management thereof
PCT/US2014/032707 WO2014165613A1 (en) 2013-04-05 2014-04-02 Generalized residual prediction in high-level syntax only shvc and signaling and management thereof

Publications (3)

Publication Number Publication Date
JP2016519508A true JP2016519508A (ja) 2016-06-30
JP2016519508A5 JP2016519508A5 (ja) 2017-04-13
JP6352390B2 JP6352390B2 (ja) 2018-07-04

Family

ID=51654449

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016506589A Expired - Fee Related JP6352390B2 (ja) 2013-04-05 2014-04-02 高レベルシンタックス専用shvcにおける一般化残差予測ならびにそのシグナリングおよび管理

Country Status (6)

Country Link
US (1) US9380305B2 (ja)
EP (1) EP2982112A1 (ja)
JP (1) JP6352390B2 (ja)
KR (1) KR20150139554A (ja)
CN (1) CN105052142B (ja)
WO (1) WO2014165613A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140121315A (ko) * 2013-04-04 2014-10-15 한국전자통신연구원 참조 픽처 리스트를 이용한 다 계층 기반의 영상 부호화/복호화 방법 및 그 장치
US9510001B2 (en) * 2013-07-09 2016-11-29 Electronics And Telecommunications Research Institute Video decoding method and apparatus using the same
US20150103924A1 (en) * 2013-10-13 2015-04-16 Sharp Laboratories Of America, Inc. On operation of decoded picture buffer for interlayer pictures
WO2015056735A1 (ja) * 2013-10-16 2015-04-23 シャープ株式会社 画像復号装置
WO2015082763A1 (en) * 2013-12-02 2015-06-11 Nokia Technologies Oy Video encoding and decoding
JP2015216632A (ja) * 2014-04-22 2015-12-03 ソニー株式会社 符号化装置および符号化方法
US20160127728A1 (en) * 2014-10-30 2016-05-05 Kabushiki Kaisha Toshiba Video compression apparatus, video playback apparatus and video delivery system
CN111147845B (zh) * 2014-11-27 2023-10-10 株式会社Kt 对视频信号进行解码的方法和对视频信号进行编码的方法
CN117201808A (zh) * 2016-08-01 2023-12-08 韩国电子通信研究院 图像编码/解码方法和装置以及存储比特流的记录介质
US10511853B2 (en) * 2016-11-24 2019-12-17 Ecole De Technologie Superieure Method and system for parallel rate-constrained motion estimation in video coding
CN116320476A (zh) * 2016-12-22 2023-06-23 株式会社Kt 对视频进行解码或编码的方法和发送视频数据的方法
EP3563571A4 (en) * 2016-12-30 2020-02-12 Telefonaktiebolaget LM Ericsson (publ) DECODED IMAGE BUFFER MEMORY MANAGEMENT FOR PROCESSING PREDICTION OF CROSS IMAGE DATA
CN112740705A (zh) * 2018-09-21 2021-04-30 夏普株式会社 用于在视频编码中发送信号通知参考图片的系统和方法
CN109522518B (zh) * 2018-10-19 2021-09-14 中国矿业大学 数据流值域和频域分布的动态互耦合元数据发布方法
JP7231727B2 (ja) 2018-11-05 2023-03-01 北京字節跳動網絡技術有限公司 精緻化を伴うインター予測のための補間

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008527811A (ja) * 2005-01-10 2008-07-24 株式会社エヌ・ティ・ティ・ドコモ 一連のフレームを予測的にコード化する装置
JP2008543138A (ja) * 2005-05-27 2008-11-27 トムソン ライセンシング ビデオ・データを符号化および復号するための方法および装置
JP2013031141A (ja) * 2011-06-24 2013-02-07 Panasonic Corp 動画像符号化装置および動画像符号化方法
WO2013047811A1 (ja) * 2011-09-29 2013-04-04 シャープ株式会社 画像復号装置、画像復号方法および画像符号化装置

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8467459B2 (en) * 2004-10-13 2013-06-18 Thomson Licensing Method and apparatus for complexity scalable video encoding and decoding
DE102004059993B4 (de) * 2004-10-15 2006-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer codierten Videosequenz unter Verwendung einer Zwischen-Schicht-Bewegungsdaten-Prädiktion sowie Computerprogramm und computerlesbares Medium
KR100888962B1 (ko) * 2004-12-06 2009-03-17 엘지전자 주식회사 영상 신호의 인코딩 및 디코딩 방법
KR100746007B1 (ko) * 2005-04-19 2007-08-06 삼성전자주식회사 엔트로피 코딩의 컨텍스트 모델을 적응적으로 선택하는방법 및 비디오 디코더
WO2006129184A1 (en) * 2005-06-03 2006-12-07 Nokia Corporation Residual prediction mode in scalable video coding
KR100746006B1 (ko) * 2005-07-19 2007-08-06 삼성전자주식회사 계층적 구조에 적합하게 시간적 다이렉트 모드로인코딩하며, 디코딩하는 방법 및 장치
EP1806930A1 (en) * 2006-01-10 2007-07-11 Thomson Licensing Method and apparatus for constructing reference picture lists for scalable video
BRPI0608004B1 (pt) * 2006-03-22 2019-08-27 Fraunhofer Ges Forschung esquema de codificação permitindo escalabilidade de precisão
CA2647723A1 (en) * 2006-03-29 2007-10-11 Vidyo, Inc. System and method for transcoding between scalable and non-scalable video codecs
US20100091845A1 (en) * 2006-03-30 2010-04-15 Byeong Moon Jeon Method and apparatus for decoding/encoding a video signal
CN101601300B (zh) * 2006-12-14 2012-07-18 汤姆逊许可公司 用自适应增强层预测对位深度可分级视频数据进行编码和/或解码的方法和设备
TWI338869B (en) * 2007-08-03 2011-03-11 Via Tech Inc Method and apparatus for block-based digital encoded picture
EP2622857A1 (en) * 2010-10-01 2013-08-07 Dolby Laboratories Licensing Corporation Optimized filter selection for reference picture processing
JP2012169763A (ja) * 2011-02-10 2012-09-06 Sony Corp 画像符号化装置と画像符号化方法およびプログラム
JP2014523708A (ja) * 2011-07-01 2014-09-11 モトローラ モビリティ エルエルシー 動きベクトル予測設計の簡易化
JP2013110518A (ja) * 2011-11-18 2013-06-06 Canon Inc 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
JP6110410B2 (ja) * 2012-01-31 2017-04-05 ヴィド スケール インコーポレイテッド スケーラブルな高効率ビデオコーディング(hevc)のための参照ピクチャセット(rps)シグナリング
CA2807404C (en) * 2012-09-04 2017-04-04 Research In Motion Limited Methods and devices for inter-layer prediction in scalable video compression
WO2014049196A1 (en) * 2012-09-27 2014-04-03 Nokia Corporation Method and techniqal equipment for scalable video coding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008527811A (ja) * 2005-01-10 2008-07-24 株式会社エヌ・ティ・ティ・ドコモ 一連のフレームを予測的にコード化する装置
JP2008543138A (ja) * 2005-05-27 2008-11-27 トムソン ライセンシング ビデオ・データを符号化および復号するための方法および装置
JP2013031141A (ja) * 2011-06-24 2013-02-07 Panasonic Corp 動画像符号化装置および動画像符号化方法
WO2013047811A1 (ja) * 2011-09-29 2013-04-04 シャープ株式会社 画像復号装置、画像復号方法および画像符号化装置

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
DANNY HONG, ET AL.: "1:2 Spatial Scalability Support for HEVC", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 4TH M, vol. JCTVC-D202, JPN6017050806, 25 January 2011 (2011-01-25), pages 1 - 9, ISSN: 0003715762 *
GANG WU, ET AL.: "An inter layer prediction scheme for SNR scalability of HEVC", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JCTVC-L0109, JPN6017050798, 7 January 2013 (2013-01-07), pages 1 - 13, ISSN: 0003715758 *
JIANLE CHEN, ET AL.: "Description of scalable video coding technology proposal by Qualcomm (configuration1)", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 11TH, vol. JCTVC-K0035, JPN6017050802, 2 October 2012 (2012-10-02), pages 1 - 18, ISSN: 0003715760 *
SEBASTIEN LASSERRE, ET AL.: "Description of the scalable video coding technology proposal by Canon Research Centre France", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 11TH, vol. JCTVC-K0041, JPN6017050800, 1 October 2012 (2012-10-01), pages 43 - 46, ISSN: 0003715759 *
XIANG LI, ET AL.: "Non-TE3: Extension of Test 4.6.2.1 on Generalized Residual Prediction", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 12TH, vol. JCTVC-L0190, JPN6017050804, 8 January 2013 (2013-01-08), pages 1 - 3, ISSN: 0003715761 *
XIANG LI, ET AL.: "TE3: Results of Test 4.6.2.1 on Generalized Residual Prediction", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 12TH, vol. JCTVC-L0078, JPN6017050796, 8 January 2013 (2013-01-08), pages 1 - 8, ISSN: 0003715757 *

Also Published As

Publication number Publication date
EP2982112A1 (en) 2016-02-10
KR20150139554A (ko) 2015-12-11
US9380305B2 (en) 2016-06-28
JP6352390B2 (ja) 2018-07-04
US20140301466A1 (en) 2014-10-09
CN105052142A (zh) 2015-11-11
CN105052142B (zh) 2018-06-08
WO2014165613A1 (en) 2014-10-09

Similar Documents

Publication Publication Date Title
JP6352390B2 (ja) 高レベルシンタックス専用shvcにおける一般化残差予測ならびにそのシグナリングおよび管理
JP6297670B2 (ja) ハイレベルシンタックスのみのスケーラブルビデオコーディングのための、レイヤ間参照ピクチャ制限
JP6285024B2 (ja) マルチレイヤビデオコーディングのためのレイヤ間予測シグナリングに対する最適化
JP6388929B2 (ja) マルチレイヤビデオコーディングにおけるレイヤ間予測タイプに関するビットストリーム制約を処理すること
JP6285020B2 (ja) コンポーネント間フィルタ処理
JP6231128B2 (ja) ビデオ情報のスケーラブル及びマルチビュー/3dコード化のための機器及び方法
JP2020123963A (ja) ビットストリームパーティションのためのhrdパラメータを信号伝達すること
JP6441354B2 (ja) マルチレイヤビデオコーディングのためのpoc値設計
US9479778B2 (en) Device and method for coding video information using base layer motion vector candidate
JP2018530246A (ja) ビデオコーディングのために位置依存の予測組合せを使用する改善されたビデオイントラ予測
JP6352391B2 (ja) Shvcのための複数のベースレイヤ参照ピクチャ
JP6495268B2 (ja) パラメータセット内のビューidビット深度のシグナリング
JP2016506185A (ja) ビデオコーディング拡張規格のための時間動きベクトル予測
JP2016518776A (ja) アラインされていないirapピクチャを含み得るマルチレイヤビットストリームのクロスレイヤpocアラインメント
JP2016501483A (ja) ビデオコーディングにおけるhevc拡張用の多重レイヤの低複雑度サポート
JP6526574B2 (ja) レイヤ間シンタックス予測制御
JP2016513913A (ja) 異なるアスペクト比を伴う空間スケーラビリティのためのレイヤ間の参照ピクチャの構築
JP2016518766A (ja) レイヤ間ピクチャシグナリングおよび関連プロセス
JP2016537843A (ja) Mv−hevcにおけるビュー間依存タイプ
JP6479798B2 (ja) マルチレイヤビデオコーディングのためのpoc値設計
JP6466349B2 (ja) スケーラブルビデオコーディングのための空間動きベクトルスケーリング

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170310

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170310

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180403

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180508

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180606

R150 Certificate of patent or registration of utility model

Ref document number: 6352390

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees