JP2017535184A - Hevc拡張の搬送用データストリームのhrd記述子およびバッファモデルの設計 - Google Patents

Hevc拡張の搬送用データストリームのhrd記述子およびバッファモデルの設計 Download PDF

Info

Publication number
JP2017535184A
JP2017535184A JP2017519873A JP2017519873A JP2017535184A JP 2017535184 A JP2017535184 A JP 2017535184A JP 2017519873 A JP2017519873 A JP 2017519873A JP 2017519873 A JP2017519873 A JP 2017519873A JP 2017535184 A JP2017535184 A JP 2017535184A
Authority
JP
Japan
Prior art keywords
parameter
hrd
stream
index
hevc
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017519873A
Other languages
English (en)
Other versions
JP6612338B2 (ja
Inventor
ヘンドリー、フヌ
ワン、イェ−クイ
ラマスブラモニアン、アダルシュ・クリシュナン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2017535184A publication Critical patent/JP2017535184A/ja
Application granted granted Critical
Publication of JP6612338B2 publication Critical patent/JP6612338B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/61Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234327Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/24Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
    • H04N21/2401Monitoring of the client buffer

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Synchronizing For Television (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

ビデオ処理デバイスは、複数のエレメンタリストリームと高効率ビデオコーディング(HEVC)タイミングおよび仮想参照デコーダ(HRD)記述子とを備えるデータストリームを取得する。HEVCタイミングおよびHRD記述子は、配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備える。ビデオ処理デバイスは、パラメータのセットに基づいて、ビデオパラメータセット(VPS)内のシンタックス要素のアレイ内のシンタックス要素を識別することができる。パラメータのセットは、ターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える場合がある。ビデオ処理デバイスは、識別されたシンタックス要素によって指定されたインデックスに基づいて、複数のHRDパラメータシンタックス構造内の特定のHRDパラメータシンタックス構造を、特定のエレメンタリストリームに適用可能であると識別することができる。

Description

[0001] 本出願は、その内容全体が参照により本明細書に組み込まれる、2014年10月15日に出願された米国仮特許出願第62/064,414号の利益を主張する。
[0002] 本開示は、ビデオの符号化および復号に関する。
[0003] デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末(PDA)、ラップトップコンピュータまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、携帯電話または衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどを含む、広範囲のデバイスに組み込まれ得る。デジタルビデオデバイスは、MPEG−2、MPEG−4、ITU−T H.263、ITU−T H.264/MPEG−4、Part10、アドバンストビデオコーディング(AVC:Advanced Video Coding)、高効率ビデオコーディング(HEVC:High Efficiency Video Coding)規格によって定義された規格、およびそのような規格の拡張に記述されているビデオ圧縮技法など、ビデオ圧縮技法を実装する。ビデオデバイスは、そのようなビデオ圧縮技法を実装することにより、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、および/または記憶することができる。
[0004] ビデオ圧縮技法は、空間(イントラピクチャ)予測および/または時間(インターピクチャ)予測を実施して、ビデオシーケンスに固有の冗長性を低減または削除する。ブロックベースのビデオコーディングの場合、ビデオスライス(すなわち、ビデオフレームまたはビデオフレームの一部分)がビデオブロックに区分化される場合がある。ピクチャのイントラコード化(I)スライス内のビデオブロックは、同じピクチャの中の隣接ブロック内の参照サンプルに対する空間予測を使用して符号化される。ピクチャのインターコード化(PまたはB)スライス内のビデオブロックは、同じピクチャの中の隣接ブロック内の参照サンプルに対する空間予測、または他の参照ピクチャの中の参照サンプルに対する時間予測を使用する場合がある。ピクチャはフレームと呼ばれる場合がある。
[0005] 空間予測または時間予測は、コーディングされるべきブロックのための予測ブロックをもたらす。残差データは、コーディングされるべき元のブロックと予測ブロックとの間のピクセル差分を表す。インターコード化ブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトルに従って符号化され、残差データは、コード化ブロックと予測ブロックとの間の差分を示す。イントラコード化ブロックは、イントラコーディングモードおよび残差データに従って符号化される。さらなる圧縮のために、残差データは、ピクセル領域から変換領域に変換されて、残差係数をもたらす場合があり、残差係数は、次いで量子化される場合がある。
[0006] 一般に、本開示は、仮想参照デコーダ(HRD:Hypothetical Reference Decoder)関連情報をシグナリングするための記述子の設計、およびHEVC拡張の搬送用MPEG−2トランスポートストリーム(TS)のバッファモデルの設計に関する。本明細書に記載されるように、ビデオ処理デバイス(video processing device)は、モーションピクチャエキスパートグループ(MPEG:Motion Picture Experts Group)−2データストリーム内のエレメンタリストリーム(elementary stream)に適用可能な(applicable)HRDパラメータのセットを決定(determine)することができる。
[0007] 一態様では、本開示はビデオデータ(video data)を処理(process)する方法を記載し、方法は、複数のエレメンタリストリームと高効率ビデオコーディング(HEVC)タイミング(High Efficiency Video Coding (HEVC) timing)および仮想参照デコーダ(HRD)記述子とを備えるデータストリーム(data stream)を取得することと、ここにおいて、HEVCタイミングおよびHRD記述子が配信スケジュール(delivery schedule)のインデックス(index)を示すターゲットスケジュールインデックスシンタックス要素(target schedule index syntax element)を備える、パラメータ(parameter)のセットに基づいて、ビデオパラメータセット(VPS:video parameter set)内のシンタックス要素(syntax element)のアレイ(array)内のシンタックス要素を識別(identify)することと、ここにおいて、VPSが複数のHRDパラメータシンタックス構造(HRD parameters syntax structure)を備え、ここにおいて、複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造がHRDパラメータのそれぞれのセットを備え、シンタックス要素のアレイの各それぞれのシンタックス要素が複数のHRDパラメータシンタックス構造内のHRDパラメータシンタックス構造のインデックスを指定し、パラメータのセットがターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える、識別されたシンタックス要素によって指定された(specified)インデックスに基づいて、複数のHRDパラメータシンタックス構造内の特定のHRDパラメータシンタックス構造を、動作点(operation point)の一部である特定のエレメンタリストリームに適用可能であると識別することとを備え、複数のエレメンタリストリームは特定のエレメンタリストリームを含む。
[0008] 別の態様では、本開示はビデオデータを処理する方法を記載し、方法は、シンタックス要素のアレイと複数の仮想参照デコーダ(HRD)パラメータシンタックス構造とを含むビデオパラメータセット(VPS)を生成することと、ここにおいて、複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造がHRDパラメータのそれぞれのセットを備え、シンタックス要素のアレイの各それぞれのシンタックス要素が複数のHRDパラメータシンタックス構造内のHRDパラメータシンタックス構造のインデックスを指定する、配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備える高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子を生成することと、複数のエレメンタリストリームと高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子とを備えるデータストリームを生成することとを備え、パラメータのセットは、特定のエレメンタリストリームに適用可能な特定のHRDパラメータシンタックス構造のインデックスを指定するシンタックス要素のアレイ内のシンタックス要素を識別し、特定のHRDパラメータシンタックス構造は複数のHRDパラメータシンタックス構造のうちの1つであり、特定のHRDパラメータシンタックス構造は動作点の一部であり、パラメータのセットはターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える。
[0009] 別の態様では、本開示はビデオデータを処理するためのデバイスを記載し、デバイスは、ビデオデータを記憶するように構成されたメモリと、1つまたは複数のプロセッサとを備え、1つまたは複数のプロセッサが、複数のエレメンタリストリームと高効率ビデオコーディング(HEVC)タイミングおよび仮想参照デコーダ(HRD)記述子とを備えるデータストリームを取得することと、ここにおいて、HEVCタイミングおよびHRD記述子が配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備え、エレメンタリストリームがビデオデータの符号化表現を備える、パラメータのセットに基づいて、ビデオパラメータセット(VPS)内のシンタックス要素のアレイ内のシンタックス要素を識別することと、ここにおいて、VPSが複数のHRDパラメータシンタックス構造を備え、ここにおいて、複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造がHRDパラメータのそれぞれのセットを備え、シンタックス要素のアレイの各それぞれのシンタックス要素が複数のHRDパラメータシンタックス構造内のHRDパラメータシンタックス構造のインデックスを指定し、パラメータのセットがターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える、識別されたシンタックス要素によって指定されたインデックスに基づいて、複数のHRDパラメータシンタックス構造内の特定のHRDパラメータシンタックス構造を、動作点の一部である特定のエレメンタリストリームに適用可能であると識別することとを行うように構成され、複数のエレメンタリストリームは特定のエレメンタリストリームを含む。
[0010] 別の態様では、本開示はビデオデータを処理するためのデバイスを記載し、デバイスは、ビデオデータを記憶するように構成されたメモリと、1つまたは複数のプロセッサとを備え、1つまたは複数のプロセッサが、シンタックス要素のアレイと複数の仮想参照デコーダ(HRD)パラメータシンタックス構造とを含むビデオパラメータセット(VPS)を生成することと、ここにおいて、複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造がHRDパラメータのそれぞれのセットを備え、シンタックス要素のアレイの各それぞれのシンタックス要素が複数のHRDパラメータシンタックス構造内のHRDパラメータシンタックス構造のインデックスを指定する、配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備える高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子を生成することと、複数のエレメンタリストリームと高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子とを備えるデータストリームを生成することとを行うように構成され、複数のエレメンタリストリームはビデオデータの符号化表現を備え、パラメータのセットは、特定のエレメンタリストリームに適用可能な特定のHRDパラメータシンタックス構造のインデックスを指定するシンタックス要素のアレイ内のシンタックス要素を識別し、特定のHRDパラメータシンタックス構造は複数のHRDパラメータシンタックス構造のうちの1つであり、特定のHRDパラメータシンタックス構造は動作点の一部であり、パラメータのセットはターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える。
[0011] 別の態様では、本開示はビデオデータを処理するためのデバイスを記載し、デバイスは、複数のエレメンタリストリームと高効率ビデオコーディング(HEVC)タイミングおよび仮想参照デコーダ(HRD)記述子とを備えるデータストリームを取得するための手段と、ここにおいて、HEVCタイミングおよびHRD記述子が配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備える、パラメータのセットに基づいて、ビデオパラメータセット(VPS)内のシンタックス要素のアレイ内のシンタックス要素を識別するための手段と、ここにおいて、VPSが複数のHRDパラメータシンタックス構造を備え、ここにおいて、複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造がHRDパラメータのそれぞれのセットを備え、シンタックス要素のアレイの各それぞれのシンタックス要素が複数のHRDパラメータシンタックス構造内のHRDパラメータシンタックス構造のインデックスを指定し、パラメータのセットがターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える、識別されたシンタックス要素によって指定されたインデックスに基づいて、複数のHRDパラメータシンタックス構造内の特定のHRDパラメータシンタックス構造を、動作点の一部である特定のエレメンタリストリームに適用可能であると識別するための手段とを備え、複数のエレメンタリストリームは特定のエレメンタリストリームを含む。
[0012] 別の態様では、本開示はビデオデータを処理するためのデバイスを記載し、デバイスは、シンタックス要素のアレイと複数の仮想参照デコーダ(HRD)パラメータシンタックス構造とを含むビデオパラメータセット(VPS)を生成するための手段と、ここにおいて、複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造がHRDパラメータのそれぞれのセットを備え、シンタックス要素のアレイの各それぞれのシンタックス要素が複数のHRDパラメータシンタックス構造内のHRDパラメータシンタックス構造のインデックスを指定する、配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備える高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子を生成するための手段と、複数のエレメンタリストリームと高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子とを備えるデータストリームを生成するための手段とを備え、パラメータのセットは、特定のエレメンタリストリームに適用可能な特定のHRDパラメータシンタックス構造のインデックスを指定するシンタックス要素のアレイ内のシンタックス要素を識別し、特定のHRDパラメータシンタックス構造は複数のHRDパラメータシンタックス構造のうちの1つであり、特定のHRDパラメータシンタックス構造は動作点の一部であり、パラメータのセットはターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える。
[0013] 別の態様では、本開示は命令を記憶したコンピュータ可読記憶媒体(computer-readable storage medium)を記載し、命令は、実行されると、複数のエレメンタリストリームと高効率ビデオコーディング(HEVC)タイミングおよび仮想参照デコーダ(HRD)記述子とを備えるデータストリームを取得することと、ここにおいて、HEVCタイミングおよびHRD記述子が配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備える、パラメータのセットに基づいて、ビデオパラメータセット(VPS)内のシンタックス要素のアレイ内のシンタックス要素を識別することと、ここにおいて、VPSが複数のHRDパラメータシンタックス構造を備え、ここにおいて、複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造がHRDパラメータのそれぞれのセットを備え、シンタックス要素のアレイの各それぞれのシンタックス要素が複数のHRDパラメータシンタックス構造内のHRDパラメータシンタックス構造のインデックスを指定し、パラメータのセットがターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える、識別されたシンタックス要素によって指定されたインデックスに基づいて、複数のHRDパラメータシンタックス構造内の特定のHRDパラメータシンタックス構造を、動作点の一部である特定のエレメンタリストリームに適用可能であると識別することとをデバイスの1つまたは複数のプロセッサに行わせ、複数のエレメンタリストリームは特定のエレメンタリストリームを含む。
[0014] 別の態様では、本開示は命令を記憶したコンピュータ可読記憶媒体を記載し、命令は、実行されると、シンタックス要素のアレイと複数の仮想参照デコーダ(HRD)パラメータシンタックス構造とを含むビデオパラメータセット(VPS)を生成することと、ここにおいて、複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造がHRDパラメータのそれぞれのセットを備え、シンタックス要素のアレイの各それぞれのシンタックス要素が複数のHRDパラメータシンタックス構造内のHRDパラメータシンタックス構造のインデックスを指定する、配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備える高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子を生成することと、複数のエレメンタリストリームと高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子とを備えるデータストリームを生成することとをデバイスの1つまたは複数のプロセッサに行わせ、パラメータのセットは、特定のエレメンタリストリームに適用可能な特定のHRDパラメータシンタックス構造のインデックスを指定するシンタックス要素のアレイ内のシンタックス要素を識別し、特定のHRDパラメータシンタックス構造は複数のHRDパラメータシンタックス構造のうちの1つであり、特定のHRDパラメータシンタックス構造は動作点の一部であり、パラメータのセットはターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える。
[0015] 本開示の1つまたは複数の例の詳細が添付の図面および以下の説明に記載されている。他の特徴、目的、および利点は、説明、図面、および特許請求の範囲から明らかになる。
[0016] 本開示に記載される技法を利用することができる例示的なビデオコーディングシステムを示すブロック図。 [0017] ビットストリームパーティション固有のコード化ピクチャバッファ(CPB)の動作向けのトランスポートシステムターゲットデコーダ(T−STD)モデル拡張を示す概念図。 [0018] 本開示に記載される技法を実装することができる例示的なビデオエンコーダを示すブロック図。 [0019] 本開示に記載される技法を実装することができる例示的なビデオデコーダを示すブロック図。 [0020] 本開示の技法による、ビデオエンコーダの例示的な動作を示すフローチャート。 [0021] 本開示の技法による、ビデオデコーダの例示的な動作を示すフローチャート。 [0022] 本開示の技法による、ビデオコーダがパラメータの値を決定する例示的な動作を示すフローチャート。
[0023] 特定のビデオコーディング規格は、仮想参照デコーダ(HRD)と呼ばれる場合があるバッファモデルを規定する。HRDは、データが復号のためにどのようにバッファリングされるべきかと、復号データが出力のためにどのようにバッファリングされるかとを記述する。たとえば、HRDは、コード化ピクチャバッファ(「CPB」)、復号ピクチャバッファ(「DPB」)、およびビデオ復号プロセスの動作を記述する。CPBは、HRDによって指定された復号順序でアクセスユニットを含んでいる先入れ先出しバッファである。DPBは、HRDによって指定されたように、参照、出力並べ替え、または出力遅延のために復号ピクチャを保持する(たとえば、記憶する)バッファである。CPBおよびDPBの挙動は、数学的に規定される場合がある。HRDは、タイミング、バッファサイズ、およびビットレートに対して直接的に制約(constraint)を課する場合がある。さらに、HRDは、様々なビットストリームの特性および統計値に対して間接的に制約を課する場合がある。HRDはある種類のデコーダとして命名されたが、ビデオエンコーダは、通常、ビットストリームの適合性を保証するためにHRDを使用するが、ビデオデコーダは、通常、HRDを必要としない。言い換えれば、HRDは、通常、ビットストリームを検査するために使用される。高効率ビデオコーディング(HEVC)では、ビデオパラメータセット(VPS)は、HRDパラメータシンタックス構造のセットを含んでいる。HRDパラメータシンタックス構造の各々は、HRDの動作を制御するためのHRDパラメータを含んでいる。
[0024] スケーラブルHEVC(SHVC)およびマルチビューHEVC(MV−HEVC)は、スケーラブルビデオコーディングおよびマルチビュービデオコーディングのためのHEVCの拡張である。SHVCおよびMV−HEVCでは、ビットストリームは複数のレイヤを備える場合がある。したがって、SHVCおよびMV−HEVCは、総称して「積層HEVC」または「L−HEVC」と呼ばれる場合がある。SHVCでは、ベースレイヤおよび1つまたは複数のエンハンスメントレイヤが存在する。エンハンスメントレイヤは、ビットストリーム内で符号化されるビデオデータの視覚的品質および/またはフレームレートを高めることができる。MV−HEVCでは、各レイヤは異なるビューに対応する場合がある。各レイヤは、異なるレイヤ識別子(たとえば、nuh_layer_id)に関連付けられる場合がある。SHVCおよびMV−HEVCでは、ビットストリームのレイヤは、区分化方式に従って「パーティション」に分割される場合がある。したがって、各パーティションはビットストリームの1つまたは複数のレイヤを備える場合がある。さらに、SHVCおよびMV−HEVCでは、各パーティションは、VPS内のHRDパラメータシンタックス構造のうちの1つを指す場合がある。したがって、パーティション用のHRDパラメータシンタックス構造によって含まれるHRDパラメータは、HRDを使用してパーティションを検査するときにHRDの動作を制御することができる。
[0025] さらに、レイヤ内のいくつかのピクチャは、同じレイヤ内の他のピクチャを参照せずに復号される場合がある。したがって、レイヤのいくつかのピクチャのデータをカプセル化しているネットワークアブストラクションレイヤ(NAL)ユニットは、そのレイヤ内の他のピクチャの復号可能性に影響を及ぼすことなく、ビットストリームから削除される場合がある。そのようなピクチャのデータをカプセル化しているNALユニットを削除すると、ビットストリームのフレームレートが低減される場合がある。レイヤ内の他のピクチャを参照せずに復号される場合があるレイヤ内のピクチャのサブセットは、本明細書では「サブレイヤ」または「時間サブレイヤ」と呼ばれる場合がある。NALユニットは、temporal_idシンタックス要素を含む場合がある。NALユニットのtemporal_idシンタックス要素は、NALユニットの時間識別子を指定する。NALユニットの時間識別子は、そのNALユニットが関連付けられるサブレイヤを識別する。したがって、ビットストリームの各サブレイヤは、異なる時間識別子に関連付けられる場合がある。第1のNALユニットの時間識別子が第2のNALユニットの時間識別子よりも小さい場合、第1のNALユニットによってカプセル化されたデータは、第2のNALユニットによってカプセル化されたデータを参照せずに復号される場合がある。
[0026] 「HEVCサブパーティション」という用語は、HEVCベースサブパーティションまたはHEVCエンハンスメントサブパーティションのいずれかを指す。「HEVCベースサブパーティション」という用語は、HEVC規格に適合し、ターゲットレイヤ識別子リストが0に等しいnuh_layer_id値を含むターゲットHEVC動作点によって識別された、ターゲット最上位TemporalIdまでの1つまたは複数のレイヤのすべてのビデオコーディングレイヤ(VCL)NALユニットを含んでいる、HEVCビデオサブビットストリームである。サブビットストリーム(たとえば、HEVCビデオサブビットストリーム)は、ターゲット最上位TemporalIdおよびターゲットレイヤ識別子リストによって決定される、ターゲットセットに属さないビットストリーム内のNALユニットが、ターゲットセットに属するビットストリーム内のNALユニットからなる出力サブビットストリームを有するビットストリームから削除されるプロセス(たとえば、サブビットストリーム抽出プロセス)からもたらされるビットストリームである。「HEVCエンハンスメントサブパーティション」という用語は、HEVCベースサブパーティションおよびゼロ以上の他のHEVCサブパーティションを有するそのHEVCレイヤ集合が、最上位レイヤの動作点のレイヤリストおよびこのビデオサブビットストリーム含まれる最上位TemporalIdに従って、有効なHEVC積層ビデオストリームをもたらす、1つもしくは複数のHEVCレイヤ、またはそのHEVC時間ビデオサブビットストリームもしくはHEVC時間ビデオサブセットを指す。
[0027] MPEG−2システム仕様は、デジタル送信または記憶に適した単一のデータストリームを形成するために、圧縮マルチメディア(ビデオおよびオーディオ)データストリームが他のデータとともにどのように多重化され得るかを記述している。MPEG−2システム仕様は、エレメンタリストリームの概念を定義する。具体的には、エレメンタリストリームは、プログラムの単一のデジタルコーディングされた(場合によってはMPEG圧縮された)構成要素である。たとえば、プログラムの符号化されたビデオまたはオーディオの部分は、エレメンタリストリームであり得る。さらに、HEVC拡張(たとえば、L−HEVC)の搬送向けのMPEG−2システム仕様の拡張では、各それぞれのHEVCサブパーティションは、MPEG−2データストリーム内のそれぞれのエレメンタリストリームに対応する。VPSを含んでいるNALユニットなどの、L−HEVCビデオデータの非ビデオコーディングレイヤ(VCL)ネットワークアブストラクションレイヤ(NAL)ユニットは、MPEG−2データストリーム内の1つまたは複数のエレメンタリストリームに対応する場合がある。
[0028] MPEG−2データストリームは、プログラムまたはプログラムの構成要素のエレメンタリストリームについての情報を搬送する記述子のセットを含む場合もある。たとえば、MPEG−2データストリームは、HEVCサブパーティションに対応するフォー各それぞれのエレメンタリストリームを含む場合があり、MPEG−2データストリームは、HEVCサブパーティション用の階層記述子(hierarchy descriptor)を備える場合がある。HEVCサブパーティション用の階層記述子は、コーディングレイヤ階層のテーブル内のHEVCサブパーティションの一意のインデックスを定義する階層レイヤインデックスを含む場合がある。加えて、記述子のセットは、HEVCタイミングおよびHRD記述子を含む場合がある。HEVCタイミングおよびHRD記述子は、適用可能なタイミングおよびHRDのパラメータを提供する場合がある。
[0029] しかしながら、HEVC規格またはHEVC拡張の搬送向けのMPEG−2システム仕様では、どのHRDパラメータシンタックス構造がどのHEVCサブパーティションに適用可能であるかが明確ではない。言い換えれば、HRDを使用してHEVCサブパーティションを検査するときに、どのHRDパラメータシンタックス構造を使用するべきかをどのように決定するかが規定されていない。HEVCビットストリームでは、HRD情報が存在するとき、1つまたは複数のHRDセットが存在する可能性があるので、どのHRDパラメータシンタックス構造がサブパーティションに適用可能であるかを決定することは有用であり得る。さらに、HRDセットの各々がMPEG−2バッファモデルに必要とされる情報を含んでいる場合があるので、どのHRDパラメータシンタックス構造がサブパーティションに適用可能であるかを決定することは望ましい場合がある。
[0030] 本開示は、HEVCサブパーティションに適用可能なHRDパラメータシンタックス構造を決定するための技法を記載する。たとえば、本明細書に記載されたように、ビデオデコーダは、複数のエレメンタリストリームとHEVCタイミングおよびHRD記述子とを備えるMPEG−2データストリームを受信することができる。エレメンタリストリームは、ビデオデータの符号化表現を備える場合がある。この例では、HEVCタイミングおよびHRD記述子は、配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備える。さらに、ビデオデコーダは、パラメータのセットに基づいて、VPS内のシンタックス要素のアレイ内のシンタックス要素を識別することができる。この例では、VPSは、複数のHRDパラメータシンタックス構造を備える。複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造は、HRDパラメータのそれぞれのセットを含む。さらに、この例では、シンタックス要素のアレイの各それぞれのシンタックス要素は、複数のHRDパラメータシンタックス構造の中のHRDパラメータシンタックス構造に関連付けられたインデックスを指定する。パラメータのセットは、ターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを含む場合がある。
[0031] さらに、いくつかの例では、パラメータのセットは、第1、第2、第3、第4、および第5のパラメータを含む場合がある。第1のパラメータは、動作点のターゲット出力レイヤセットインデックス(target output layer set index)を指定する。第2のパラメータは、動作点のターゲット区分化方式インデックス(target partitioning scheme index)を指定する。第3のパラメータは、動作点の最上位時間識別子(highest temporal identifier)を指定する。ビデオデコーダは、識別されたシンタックス要素によって指定されたインデックスに基づいて、複数のHRDパラメータシンタックス構造内の特定のHRDパラメータシンタックス構造を、動作点の一部である特定のエレメンタリストリームに適用可能であると識別することができ、複数のエレメンタリストリームは特定のエレメンタリストリームを含む。
[0032] 図1は、本開示の技法を利用することができる例示的なビデオコーディングシステム10を示すブロック図である。本明細書で使用する「ビデオコーダ」という用語は、ビデオエンコーダとビデオデコーダの両方を総称的に指す。本開示では、「ビデオコーディング」または「コーディング」という用語は、ビデオ符号化またはビデオ復号を総称的に指す場合がある。
[0033] 図1に示されたように、ビデオコーディングシステム10は、ソースデバイス12と、宛先デバイス14とを含む。ソースデバイス12は符号化ビデオデータを生成する。したがって、ソースデバイス12は、ビデオ符号化デバイスまたはビデオ符号化装置と呼ばれる場合がある。宛先デバイス14は、ソースデバイス12によって生成された符号化ビデオデータを復号することができる。したがって、宛先デバイス14は、ビデオ復号デバイスまたはビデオ復号装置と呼ばれる場合がある。ソースデバイス12および宛先デバイス14は、ビデオコーディングデバイスまたはビデオコーディング装置の例であり得る。本開示は、「ビデオ処理デバイス」という用語を使用して、ビデオデータを処理するデバイスを指す場合がある。ソースデバイス12および宛先デバイス14はビデオ処理デバイスの例である。他のタイプのビデオ処理デバイスには、MPEG−2データストリームなどのメディアデータを多重化および逆多重化するデバイスが含まれる。
[0034] ソースデバイス12および宛先デバイス14は、デスクトップコンピュータ、モバイルコンピューティングデバイス、ノートブック(たとえば、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、車内コンピュータなどを含む、広範囲のデバイスを備える場合がある。
[0035] 宛先デバイス14は、チャネル16を介してソースデバイス12から符号化ビデオデータを受信することができる。チャネル16は、ソースデバイス12から宛先デバイス14に符号化ビデオデータを移動させることが可能な1つまたは複数の媒体またはデバイスを備える場合がある。一例では、チャネル16は、ソースデバイス12が符号化ビデオデータを宛先デバイス14にリアルタイムで直接送信することを可能にする1つまたは複数の通信媒体を備える場合がある。この例では、ソースデバイス12は、ワイヤレス通信プロトコルなどの通信規格に従って、符号化ビデオデータを変調することができ、変調されたビデオデータを宛先デバイス14に送信することができる。1つまたは複数の通信媒体には、無線周波数(RF)スペクトルまたは1つもしくは複数の物理伝送線路などの、ワイヤレスおよび/または有線の通信媒体が含まれ得る。1つまたは複数の通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはグローバルネットワーク(たとえば、インターネット)などの、パケットベースネットワークの一部を形成することができる。1つまたは複数の通信媒体には、ソースデバイス12から宛先デバイス14への通信を容易にする、ルータ、スイッチ、基地局、または他の機器が含まれ得る。
[0036] 別の例では、チャネル16は、ソースデバイス12によって生成された符号化ビデオデータを記憶する記憶媒体を含む場合がある。この例では、宛先デバイス14は、たとえば、ディスクアクセスまたはカードアクセスを介して、記憶媒体にアクセスすることができる。記憶媒体には、Blu−ray(登録商標)ディスク、DVD、CD−ROM、フラッシュメモリ、または符号化ビデオデータを記憶するための他の適切なデジタル記憶媒体などの、様々なローカルにアクセスされるデータ記憶媒体が含まれ得る。
[0037] さらなる例では、チャネル16は、ソースデバイス12によって生成された符号化ビデオデータを記憶する、ファイルサーバまたは別の中間ストレージデバイスを含む場合がある。この例では、宛先デバイス14は、ストリーミングまたはダウンロードを介して、ファイルサーバまたは他の中間ストレージデバイスに記憶された符号化ビデオデータにアクセスすることができる。ファイルサーバは、符号化ビデオデータを記憶すること、および符号化ビデオデータを宛先デバイス14に送信することが可能なタイプのサーバであり得る。例示的なファイルサーバには、(たとえば、ウェブサイト用の)ウェブサーバ、ファイル転送プロトコル(FTP)サーバ、ネットワーク接続ストレージ(NAS)デバイス、およびローカルディスクドライブが含まれる。
[0038] 宛先デバイス14は、インターネット接続などの標準データ接続を介して、符号化ビデオデータにアクセスすることができる。例示的なタイプのデータ接続には、ファイルサーバに記憶された符号化ビデオデータにアクセスすることに適した、ワイヤレスチャネル(たとえば、Wi−Fi(登録商標)接続)、有線接続(たとえば、DSL、ケーブルモデムなど)、またはその両方の組合せが含まれ得る。ファイルサーバからの符号化ビデオデータの送信は、ストリーミング送信、ダウンロード送信、またはその両方の組合せであり得る。
[0039] 本開示の技法は、ワイヤレスの用途または設定に限定されない。本技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、たとえばインターネットを介したストリーミングビデオ送信、データ記憶媒体に記憶するためのビデオデータの符号化、データ記憶媒体に記憶されたビデオデータの復号、または他の用途などの、様々なマルチメディア用途をサポートするビデオコーディングに適用される場合がある。いくつかの例では、ビデオコーディングシステム10は、単方向または双方向のビデオ送信をサポートして、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、および/またはビデオテレフォニーなどの用途をサポートするように構成される場合がある。
[0040] 図1に示されたビデオコーディングシステム10は例にすぎず、本開示の技法は、符号化デバイスと復号デバイスとの間の任意のデータ通信を必ずしも含むとは限らないビデオコーディング設定(たとえば、ビデオ符号化またはビデオ復号)に適用される場合がある。他の例では、データがローカルメモリから取り出されること、ネットワークを介してストリーミングされることなどが行われる。ビデオ符号化デバイスはデータを符号化し、メモリに記憶することができ、および/または、ビデオ復号デバイスはデータをメモリから取り出し、復号することができる。多くの例では、符号化および復号は、互いに通信しないが、メモリにデータを符号化し、および/またはメモリからデータを取り出し、復号するだけのデバイスによって実施される。
[0041] 図1の例では、ソースデバイス12は、ビデオソース18と、ビデオエンコーダ20と、出力インターフェース22とを含む。いくつかの例では、出力インターフェース22は、変調器/復調器(モデム)および/または送信機を含む場合がある。ビデオソース18には、ビデオキャプチャデバイス、たとえば、ビデオカメラ、以前にキャプチャされたビデオデータを含んでいるビデオアーカイブ、ビデオコンテンツプロバイダからビデオデータを受信するビデオフィードインターフェース、および/もしくはビデオデータを生成するためのコンピュータグラフィクスシステム、またはビデオデータのそのようなソースの組合せが含まれ得る。
[0042] ビデオエンコーダ20は、ビデオソース18からのビデオデータを符号化することができる。いくつかの例では、ソースデバイス12は、出力インターフェース22を介して宛先デバイス14に符号化ビデオデータを直接送信する。他の例では、符号化ビデオデータは、復号および/または再生のための宛先デバイス14による後のアクセスのために記憶媒体またはファイルサーバ上に記憶される場合もある。
[0043] 図1の例では、宛先デバイス14は、入力インターフェース28と、ビデオデコーダ30と、ディスプレイデバイス32とを含む。いくつかの例では、入力インターフェース28は、受信機および/またはモデムを含む。入力インターフェース28は、チャネル16を介して符号化ビデオデータを受信することができる。ディスプレイデバイス32は、宛先デバイス14と一体化され得るか、またはその外部にあり得る。一般に、ディスプレイデバイス32は、復号ビデオデータを表示する。ディスプレイデバイス32は、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、または別のタイプのディスプレイデバイスなどの、様々なディスプレイデバイスを備える場合がある。
[0044] ビデオエンコーダ20およびビデオデコーダ30は、各々、1つもしくは複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理、ハードウェア、またはそれらの任意の組合せなどの、様々な適切な回路のうちのいずれかとして実装される場合がある。本技法が部分的にソフトウェアに実装される場合、デバイスは、適切な非一時的コンピュータ可読記憶媒体にソフトウェア用の命令を記憶することができ、1つまたは複数のプロセッサを使用してその命令をハードウェア内で実行して、本開示の技法を実施することができる。(ハードウェア、ソフトウェア、ハードウェアとソフトウェアとの組合せなどを含む)上記のいずれも、1つまたは複数のプロセッサであると考えることができる。ビデオエンコーダ20およびビデオデコーダ30の各々は、1つまたは複数のエンコーダまたはデコーダに含まれる場合があり、両者のいずれかがそれぞれのデバイス内の複合エンコーダ/デコーダ(CODEC)の一部として組み込まれる場合がある。
[0045] 本開示は、一般に、ビデオエンコーダ20が、ある情報をビデオデコーダ30などの別のデバイスに「シグナリングすること」または「送信すること」に言及する場合がある。「シグナリングすること」または「送信すること」という用語は、一般に、圧縮されたビデオデータを復号するために使用されるシンタックス要素および/または他のデータの通信を指す場合がある。そのような通信は、リアルタイムまたはほぼリアルタイムで行われる場合がある。代替として、そのような通信は、符号化時に符号化ビットストリーム内でシンタックス要素をコンピュータ可読記憶媒体に記憶するときに行われる場合があるなどの、ある時間期間にわたって行われる場合があり、次いで、シンタックス要素は、この媒体に記憶された後の任意の時間に復号デバイスによって取り出される場合がある。
[0046] 本開示に記載された技法は、特定のビデオコーディング規格に関係しないビデオコーディング技法を含む、様々なビデオコーディング規格とともに使用可能であり得る。ビデオコーディング規格の例には、ITU−T H.261、ISO/IEC MPEG−1 Visual、ITU−T H.262またはISO/IEC MPEG−2 Visual、ITU−T H.263、ISO/IEC MPEG−4 Visual、ならびに、そのスケーラブルビデオコーディング(SVC)およびマルチビュービデオコーディング(MVC)の拡張を含む(ISO/IEC MPEG−4 AVCとしても知られている)ITU−T H.264が含まれる。いくつかの例では、ビデオエンコーダ20およびビデオデコーダ30は、上述されたHEVC規格などのビデオ圧縮規格に従って動作する。ベースHEVC規格に加えて、HEVC向けのスケーラブルビデオコーディング拡張、マルチビュービデオコーディング拡張、および3Dコーディング拡張を作成する作業が進行中である。最近、高効率ビデオコーディング(HEVC)という名前の新しいビデオコーディング規格、MV−HEVCという名前のHEVCに対するマルチビュー拡張、およびSHVCいう名前のHEVCに対するスケーラブル拡張の設計が、ITU−Tビデオコーディングエキスパートグループ(VCEG)およびISO/IECモーションピクチャエキスパートグループ(MPEG)のビデオコーディング共同研究部会(JCT−VC)によって確定された。HEVC規格は、Rec.ITU−T H.265|ISO/IEC23008−2と呼ばれる場合もある。
[0047] ITU−T SG16 WP3およびISO/IEC JTC1/SC29/WG11のJCT−VC第18回会合:札幌、日本、2014年6月30日〜7月9日のための「ドラフト高効率ビデオコーディング(HEVC)バージョン2、複合フォーマット範囲拡張(RExt)、スケーラビリティ拡張(SHVC)、およびマルチビュー拡張(MV−HEVC)」と題するHEVCドラフト仕様(JCTVC−R1013_v6)、(以下、「JCTVC−R1013」または「Rec.ITU−T H.265|ISO/IEC23008−2」と呼ばれる)は、http://phenix.int−evry.fr/jct/doc_end_user/documents/18_Sapporo/wg11/JCTVC−R1013−v6.zipから利用可能である。MV−HEVCは、Rec.ITU−T H.265|ISO/IEC23008−2の付属書類Gとして組み込まれている。SHVCは、Rec.ITU−T H.265|ISO/IEC23008−2の付属書類Hとして組み込まれている。
[0048] ITU−T SG16 WP3およびISO/IEC JTC1/SC29/WG11の3Dビデオコーディング拡張共同研究部会第9回会合:札幌、日本、2014年6月3〜9日のための「MV−HEVCドラフトテキスト9」と題するMV−HEVCドラフト仕様(JCT3V−I1002−v7)は、「MV−HEVCドラフトテキスト9」と呼ばれる場合があり、http://phenix.int−evry.fr/jct3v/doc_end_user/documents/9_Sapporo/wg11/JCT3V−I1002−v7.zipから利用可能である。
[0049] ITU−T SG16 WP3およびISO/IEC JTC1/SC29/WG11のJCT−VC第18回会合:札幌、日本、2014年6月30日〜7月9日のための「高効率ビデオコーディング(HEVC)スケーラブル拡張ドラフト7」と題するSHVCドラフト仕様(JCTVC−R1008v7)は、「SHVCドラフトテキスト7」と呼ばれる場合があり、http://phenix.int−evry.fr/jct/doc_end_user/documents/18_Sapporo/wg11/JCTVC−R1008−v7.zipから利用可能である。
[0050] HEVCおよび他のビデオコーディング規格では、ビデオシーケンスは、通常、一連のピクチャを含む。ピクチャは、「フレーム」と呼ばれる場合もある。ピクチャは、1つまたは複数のサンプルアレイを含む場合がある。たとえば、ピクチャは、SL、SCb、およびSCrと表記される3つのサンプルアレイを含む場合がある。SLは、ルーマサンプルの2次元アレイ(すなわち、ブロック)である。SCbは、Cbクロミナンスサンプルの2次元アレイである。SCrは、Crクロミナンスサンプルの2次元アレイである。クロミナンスサンプルは、本明細書では「クロマ」サンプルと呼ばれる場合もある。他の例では、ピクチャは、モノクロームの場合があり、ルーマサンプルのアレイのみを含む場合がある。
[0051] ピクチャの符号化表現を生成するために、ビデオエンコーダ20は、コーディングツリーユニット(CTU)のセットを生成することができる。CTUの各々は、ルーマサンプルのコーディングツリーブロック、クロマサンプルの2つの対応するコーディングツリーブロック、およびコーディングツリーブロックのサンプルをコーディングするために使用されるシンタックス構造であり得る。コーディングツリーブロックは、サンプルのN×Nブロックであり得る。CTUは、「ツリーブロック」または「最大コーディングユニット」(LCU)と呼ばれる場合もある。HEVCのCTUは、H.264/AVCなどの他の規格のマクロブロックに広い意味で類似する場合がある。しかしながら、CTUは、必ずしも特定のサイズに限定されるとは限らず、1つまたは複数のコーディングユニット(CU)を含む場合がある。スライスは、ラスタ走査順序などの走査順序で連続的に順序付けられた整数個のCTUを含む場合がある。
[0052] コード化CTUを生成するために、ビデオエンコーダ20は、CTUのコーディングツリーブロックに対して4分木区分化を再帰的に実施して、コーディングツリーブロックをコーディングブロックに分割することができ、したがって、「コーディングツリーユニット」という名称がある。コーディングブロックは、サンプルのN×Nブロックである。CUは、ルーマサンプルアレイと、Cbサンプルアレイと、Crサンプルアレイとを有するピクチャの、ルーマサンプルのコーディングブロック、クロマサンプルの2つの対応するコーディングブロック、およびコーディングブロックのサンプルをコーディングするために使用されるシンタックス構造であり得る。モノクロームピクチャまたは3つの別々の色平面を有するピクチャでは、CUは、単一のコーディングブロックと、コーディングブロックのサンプルをコーディングするために使用されるシンタックス構造とを備える場合がある。
[0053] ビデオエンコーダ20は、CUのコーディングブロックを1つまたは複数の予測ブロックに区分化することができる。予測ブロックは、同じ予測が適用されるサンプルの長方形(すなわち、正方形または非正方形)ブロックであり得る。CUの予測ユニット(PU)は、ルーマサンプルの予測ブロック、ピクチャのクロマサンプルの2つの対応する予測ブロック、および予測ブロックサンプルを予測するために使用されるシンタックス構造であり得る。ビデオエンコーダ20は、CUの各PUのルーマ予測ブロック、Cb予測ブロック、およびCr予測ブロックのための予測ルーマブロック、予測Cbブロック、および予測Crブロックを生成することができる。モノクロームピクチャまたは3つの別々の色平面を有するピクチャでは、PUは、単一の予測ブロックと、予測ブロックを予測するために使用されるシンタックス構造とを備える場合がある。
[0054] ビデオエンコーダ20は、イントラ予測またはインター予測を使用して、PU用の予測ブロックを生成することができる。ビデオエンコーダ20がイントラ予測を使用してPUの予測ブロックを生成する場合、ビデオエンコーダ20は、PUに関連付けられたピクチャの復号サンプルに基づいて、PUの予測ブロックを生成することができる。
[0055] ビデオエンコーダ20がインター予測を使用してPUの予測ブロックを生成する場合、ビデオエンコーダ20は、PUに関連付けられたピクチャ以外の1つまたは複数のピクチャの復号サンプルに基づいて、PUの予測ブロックを生成することができる。ビデオエンコーダ20は、単予測または双予測を使用して、PUの予測ブロックを生成することができる。ビデオエンコーダ20が単予測を使用してPU用の予測ブロックを生成するとき、PUは単一の動きベクトル(MV)を有する場合がある。ビデオエンコーダ20が双予測を使用してPU用の予測ブロックを生成するとき、PUは2つのMVを有する場合がある。
[0056] ビデオエンコーダ20がCUの1つまたは複数のPU用の予測ブロック(たとえば、予測ルーマブロック、予測Cbブロック、および予測Crブロック)を生成した後で、ビデオエンコーダ20は、CUの残差ブロックを生成することができる。CUの残差ブロック内の各サンプルは、CUのPU用の予測ブロック内のサンプルと、CUのコーディングブロック内の対応するサンプルとの間の差分を示す。たとえば、ビデオエンコーダ20は、CUのルーマ残差ブロックを生成することができる。CUのルーマ残差ブロック内の各サンプルは、CUのPUの予測ルーマブロック内のルーマサンプルと、CUのルーマコーディングブロック内の対応するサンプルとの間の差分を示す。加えて、ビデオエンコーダ20は、CUのCb残差ブロックを生成することができる。CUのCb残差ブロック内の各サンプルは、CUのPUの予測Cbブロック内のCbサンプルと、CUのCbコーディングブロック内の対応するサンプルとの間の差分を示す場合がある。ビデオエンコーダ20は、CUのCr残差ブロックを生成することもできる。CUのCr残差ブロック内の各サンプルは、CUのPU用の予測Crブロック内のCrサンプルと、CUのCrコーディングブロック内の対応するサンプルとの間の差分を示す場合がある。
[0057] さらに、ビデオエンコーダ20は、4分木区分化を使用して、CUの残差ブロック(たとえば、ルーマ残差ブロック、Cb残差ブロック、およびCr残差ブロック)を、1つまたは複数の変換ブロック(たとえば、ルーマ変換ブロック、Cb変換ブロック、およびCr変換ブロック)に分解することができる。変換ブロックは、同じ変換が適用されるサンプルの長方形ブロックであり得る。CUの変換ユニット(TU)は、ルーマサンプルの変換ブロック、クロマサンプルの2つの対応する変換ブロック、および変換ブロックサンプルを変換するために使用されるシンタックス構造であり得る。したがって、CUの各TUは、ルーマ変換ブロック、Cb変換ブロック、およびCr変換ブロックに関連付けられる場合がある。TUに関連付けられたルーマ変換ブロックは、CUのルーマ残差ブロックのサブブロックであり得る。Cb変換ブロックは、CUのCb残差ブロックのサブブロックであり得る。Cr変換ブロックは、CUのCr残差ブロックのサブブロックであり得る。モノクロームピクチャまたは3つの別々の色平面を有するピクチャでは、TUは、単一の変換ブロックと、変換ブロックのサンプルを変換するために使用されるシンタックス構造とを備える場合がある。
[0058] ビデオエンコーダ20は、TU用の変換ブロックに1つまたは複数の変換を適用して、TU用の係数ブロックを生成することができる。たとえば、ビデオエンコーダ20は、TU用のルーマ変換ブロックに1つまたは複数の変換を適用して、TU用のルーマ係数ブロックを生成することができる。ビデオエンコーダ20は、TUのCb変換ブロックに1つまたは複数の変換を適用して、TU用のCb係数ブロックを生成することができる。ビデオエンコーダ20は、TUのCr変換ブロックに1つまたは複数の変換を適用して、TU用のCr係数ブロックを生成することができる。係数ブロックは変換係数の2次元アレイであり得る。変換係数はスカラー量であり得る。
[0059] 係数ブロック(たとえば、ルーマ係数ブロック、Cb係数ブロック、またはCr係数ブロック)を生成した後に、ビデオエンコーダ20は、係数ブロックを量子化することができる。量子化は、一般に、変換係数を表すために使用されるデータの量をできるだけ低減するために変換係数が量子化され、さらなる圧縮を実現するプロセスを指す。ビデオエンコーダ20が係数ブロックを量子化した後に、ビデオエンコーダ20は、量子化変換係数を示すシンタックス要素をエントロピー符号化することができる。たとえば、ビデオエンコーダ20は、量子化変換係数を示すシンタックス要素に対してコンテキスト適応型バイナリ算術コーディング(CABAC)を実施することができる。ビデオエンコーダ20は、エントロピー符号化シンタックス要素をビットストリーム内に出力することができる。
[0060] ビデオエンコーダ20は、エントロピー符号化シンタックス要素を含むビットストリームを出力することができる。ビットストリームは、コード化ピクチャおよび関連データの表現を形成するビットのシーケンスを含む場合がある。ビットストリームは、ネットワークアブストラクションレイヤ(NAL)ユニットのシーケンスを備える場合がある。NALユニットの各々は、NALユニットヘッダを含み、ローバイトシーケンスペイロード(RBSP)をカプセル化する。NALユニットヘッダは、NALユニットタイプコードを示すシンタックス要素を含む場合がある。NALユニットのNALユニットヘッダによって指定されるNALユニットタイプコードは、NALユニットのタイプを示す。RBSPは、NALユニット内にカプセル化された整数個のバイトを含んでいるシンタックス構造であり得る。いくつかの例では、RBSPはゼロビットを含む。
[0061] 様々なタイプのNALユニットは、様々なタイプのRBSPをカプセル化することができる。たとえば、様々なタイプのNALユニットは、ビデオパラメータセット(VPS)、シーケンスパラメータセット(SPS:sequence parameter set)、ピクチャパラメータセット(PPS:picture parameter set)、コード化スライス、補足エンハンスメント情報(SEI:Supplemental Enhancement Information)メッセージなどのための様々なRBSPをカプセル化することができる。たとえば、第1のタイプのNALユニットはPPS用のRBSPをカプセル化することができ、第2のタイプのNALユニットはコード化スライス用のRBSPをカプセル化することができ、第3のタイプのNALユニットは補足エンハンスメント情報(SEI)用のRBSPをカプセル化することができ、以下同様である。(パラメータセットおよびSEIメッセージのためのRBSPとは対照的に)ビデオコーディングデータ用のRBSPをカプセル化するNALユニットは、ビデオコーディングレイヤ(VCL)NALユニットと呼ばれる場合がある。たとえば、JCTVC−R1013は、VCL NALユニットという用語が、JCTVC−R1013においてVCL NALユニットとして分類されるnal_unit_typeの予約値を有するコード化スライスセグメントのNALユニットおよびNALユニットのサブセット用の総称であると定義する。SEIは、VCL NALユニットからのコード化ピクチャのサンプルを復号するために必要ではない情報を含んでいる。
[0062] 図1の例では、ビデオデコーダ30は、ビデオエンコーダ20によって生成されたビットストリームを受信する。加えて、ビデオデコーダ30は、ビットストリームを構文解析して、ビットストリームからシンタックス要素を取得することができる。ビデオデコーダ30は、ビットストリームから取得されたシンタックス要素に少なくとも部分的に基づいて、ビデオデータのピクチャを復元することができる。ビデオデータを復元するプロセスは、一般に、ビデオエンコーダ20によって実施されたプロセスの逆であり得る。たとえば、ビデオデコーダ30は、イントラ予測またはインター予測を使用して、現在CUのPUの予測ブロックを決定することができる。加えて、ビデオデコーダ30は、現在CUのTU用の係数ブロックを逆量子化することができる。ビデオデコーダ30は、係数ブロックに対して逆変換を実施して、現在CUのTU用の変換ブロックを復元することができる。ビデオデコーダ30は、現在CUのPU用の予測ブロックのサンプルを現在CUのTU用の変換ブロックの対応するサンプルに加えることにより、現在CUのコーディングブロックを復元することができる。ピクチャのCUごとにコーディングブロックを復元することにより、ビデオデコーダ30はピクチャを復元することができる。
[0063] 上記で簡単に示されたように、NALユニットは、ビデオパラメータセット(VPS)、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)のためのRBSPをカプセル化することができる。VPSは、0個以上のコード化ビデオシーケンス(CVS)全体に適用されるシンタックス要素を備えるシンタックス構造である。SPSも、0個以上のCVS全体に適用されるシンタックス要素を備えるシンタックス構造である。SPSは、SPSがアクティブであるときにアクティブであるVPSを識別するシンタックス要素を含む場合がある。したがって、VPSのシンタックス要素は、SPSのシンタックス要素よりも一般的に適用可能であり得る。PPSは、0個以上のコード化ピクチャに適用されるシンタックス要素を備えるシンタックス構造である。PPSは、PPSがアクティブであるときにアクティブであるSPSを識別するシンタックス要素を含む場合がある。スライスのスライスヘッダは、スライスがコーディングされているときにアクティブであるPPSを示すシンタックス要素を含む場合がある。
[0064] マルチビューコーディングでは、様々な視点からの同じシーンの複数のビューが存在する場合がある。マルチビューコーディングのコンテキストでは、同じ時間インスタンスに対応するピクチャのセットを指すために、「アクセスユニット」という用語が使用される場合がある。したがって、ビデオデータは、時間とともに生じる一連のアクセスユニットとして概念化される場合がある。「ビュー成分」は、単一のアクセスユニット内のビューのコード化表現であり得る。本開示では、「ビュー」は、同じビュー識別子に関連付けられた一連のビュー成分を指す場合がある。いくつかの例では、ビュー成分は、テクスチャビュー成分(すなわち、テクスチャピクチャ)または深度ビュー成分(すなわち、深度ピクチャ)であり得る。
[0065] MV−HEVCおよびSHVCでは、ビデオエンコーダは、一連のNALユニットを備えるビットストリームを生成することができる。ビットストリームの様々なNALユニットは、ビットストリームの様々なレイヤに関連付けられる場合がある。レイヤは、同じレイヤ識別子を有するVCL NALユニットおよび関連する非VCL NALユニットのセットとして定義される場合がある。レイヤは、マルチビュービデオコーディングにおけるビューと等価であり得る。マルチビュービデオコーディングでは、レイヤは、様々な時間インスタンスを有する同じレイヤのすべてのビュー成分を含むことができる。各ビュー成分は、特定の時間インスタンスにおいて特定のビューに属するビデオシーンのコード化ピクチャであり得る。マルチビュービデオコーディングまたは3次元ビデオコーディングのいくつかの例では、レイヤは、特定のビューのすべてのコード化深度ピクチャ、または特定のビューのコード化テクスチャピクチャのいずれかを含んでいる場合がある。3Dビデオコーディングの他の例では、レイヤは、特定のビューのテクスチャビュー成分と深度ビュー成分の両方を含んでいる場合がある。同様に、スケーラブルビデオコーディングのコンテキストでは、レイヤは、通常、他のレイヤ内のコード化ピクチャとは異なるビデオ特性を有するコード化ピクチャに対応する。そのようなビデオ特性は、通常、空間解像度と品質レベル(たとえば、信号対雑音比)とを含む。HEVCおよびその拡張では、時間スケーラビリティは、特定の時間レベルを有するピクチャのグループをサブレイヤとして定義することにより、1つのレイヤ内で実現される場合がある。
[0066] ビットストリームのそれぞれのレイヤごとに、下位レイヤ内のデータは、いかなる上位レイヤ内のデータも参照せずに復号される場合がある。スケーラブルビデオコーディングでは、たとえば、ベースレイヤ内のデータは、エンハンスメントレイヤ内のデータを参照せずに復号される場合がある。一般に、NALユニットは、単一のレイヤのデータをカプセル化することだけができる。したがって、ビットストリームの最上位残存レイヤのデータをカプセル化するNALユニットは、ビットストリームの残存レイヤ内のデータの復号可能性に影響を及ぼすことなく、ビットストリームから削除される場合がある。マルチビューコーディングでは、上位レイヤは、さらなるビュー成分を含む場合がある。SHVCでは、上位レイヤは、信号対雑音比(SNR)エンハンスメントデータ、空間エンハンスメントデータ、および/または時間エンハンスメントデータを含む場合がある。MV−HEVCおよびSHVCでは、ビデオデコーダがレイヤ内のピクチャをいかなる他のレイヤのデータも参照せずに復号することができる場合、そのレイヤは「ベースレイヤ」と呼ばれる場合がある。ベースレイヤは、HEVC基本仕様(たとえば、Rec.ITU−T H.265|ISO/IEC23008−2)に適合することができる。
[0067] スケーラブルビデオコーディングでは、ベースレイヤ以外のレイヤは「エンハンスメントレイヤ」と呼ばれる場合があり、ビットストリームから復号されるビデオデータの視覚的品質を向上させる情報を提供する場合がある。スケーラブルビデオコーディングは、空間解像度、信号対雑音比(すなわち、品質)、または時間レートを向上させることができる。スケーラブルビデオコーディング(たとえば、SHVC)では、「レイヤ表現」は、単一のアクセスユニット内の空間レイヤのコード化表現であり得る。説明を簡単にするために、本開示は、ビュー成分および/またはレイヤ表現を「ビュー成分/レイヤ表現」または単に「ピクチャ」と呼ぶ場合がある。
[0068] マルチビューコーディングはビュー間予測をサポートする。ビュー間予測は、HEVCにおいて使用されるインター予測に類似し、同じシンタックス要素を使用することができる。しかしながら、ビデオコーダが(PUなどの)現在ビデオユニットに対してビュー間予測を実施するとき、ビデオエンコーダ20は、参照ピクチャとして、現在ビデオユニットと同じアクセスユニット内にあるが異なるビューの中にあるピクチャを使用することができる。対照的に、従来のインター予測は、参照ピクチャとして様々なアクセスユニット内のピクチャのみを使用する。
[0069] マルチビューコーディングでは、ビデオデコーダ(たとえば、ビデオデコーダ30)が、ビュー内のピクチャをいかなる他のビュー内のピクチャも参照せずに復号することができる場合、そのビューは「ベースビュー」と呼ばれる場合がある。非ベースビューのうちの1つの中のピクチャをコーディングするとき、ピクチャが異なるビュー内にあるが、ビデオコーダが現在コーディングしているピクチャと同じ時間インスタンス(すなわち、アクセスユニット)内にある場合、(ビデオエンコーダ20またはビデオデコーダ30などの)ビデオコーダは、参照ピクチャリストにそのピクチャを追加することができる。他のインター予測参照ピクチャと同様に、ビデオコーダは、参照ピクチャリストの任意の位置にビュー間予測参照ピクチャを挿入することができる。
[0070] たとえば、NALユニットは、ヘッダ(すなわち、NALユニットヘッダ)とペイロード(たとえば、RBSP)とを含む場合がある。NALユニットヘッダは、nuh_layer_idシンタックス要素と呼ばれる場合もある、nuh_reserved_zero_6bitsシンタックス要素を含む場合がある。様々な値を指定するnuh_layer_idシンタックス要素を有するNALユニットは、ビットストリームの様々な「レイヤ」に属する。したがって、マルチビューコーディング、MV−HEVC、SVC、またはSHVCでは、NALユニットのnuh_layer_idシンタックス要素は、NALユニットのレイヤ識別子(すなわち、レイヤID)を指定する。NALユニットがマルチビューコーディング、MV−HEVC、またはSVCにおけるベースレイヤに関係する場合、NALユニットのnuh_layer_idシンタックス要素は0に等しい。ビットストリームのベースレイヤ内のデータは、ビットストリームのいずれの他のレイヤ内のデータも参照せずに復号される場合がある。NALユニットがマルチビューコーディング、MV−HEVC、またはSHVCにおけるベースレイヤに関係しない場合、nuh_layer_idシンタックス要素は非0値を有する場合がある。マルチビューコーディングでは、ビットストリームの様々なレイヤは、様々なビューに対応する場合がある。SVCまたはSHVCでは、ベースレイヤ以外のレイヤは「エンハンスメントレイヤ」と呼ばれる場合があり、ビットストリームから復号されるビデオデータの視覚的品質を向上させる情報を提供する場合がある。
[0071] さらに、レイヤ内のいくつかのピクチャは、同じレイヤ内の他のピクチャを参照せずに復号される場合がある。したがって、レイヤのいくつかのピクチャのデータをカプセル化しているNALユニットは、そのレイヤ内の他のピクチャの復号可能性に影響を及ぼすことなく、ビットストリームから削除される場合がある。そのようなピクチャのデータをカプセル化しているNALユニットを削除すると、ビットストリームのフレームレートが低減される場合がある。レイヤ内の他のピクチャを参照せずに復号される場合があるレイヤ内のピクチャのサブセットは、本明細書では「サブレイヤ」または「時間サブレイヤ」と呼ばれる場合がある。
[0072] NALユニットは、temporal_idシンタックス要素を含む場合がある。NALユニットのtemporal_idシンタックス要素は、NALユニットの時間識別子を指定する。NALユニットの時間識別子は、そのNALユニットが関連付けられる時間サブレイヤを識別する。したがって、ビットストリームの各時間サブレイヤは、異なる時間識別子に関連付けられる場合がある。第1のNALユニットの時間識別子が第2のNALユニットの時間識別子よりも小さい場合、第1のNALユニットによってカプセル化されたデータは、第2のNALユニットによってカプセル化されたデータを参照せずに復号される場合がある。
[0073] ビットストリームは、複数の動作点に関連付けられる場合がある。いくつかの例では、ビットストリームの各動作点は、レイヤ識別子のセット(すなわち、nuh_reserved_zero_6bits値のセット)および時間識別子に関連付けられる場合がある。レイヤ識別子のセットはOpLayerIdSetと表記される場合があり、時間識別子はTemporalIDと表記される場合がある。NALユニットのレイヤ識別子が動作点のレイヤ識別子のセット内にあり、NALユニットの時間識別子が動作点の時間識別子以下である場合、NALユニットは動作点に関連付けられる。したがって、動作点は、サブビットストリーム抽出プロセスへの入力として別のビットストリーム、ターゲット最上位TemporalId、およびターゲットレイヤ識別子リストを有するサブビットストリーム抽出プロセスの動作によって、別のビットストリームから作り出されたビットストリームであり得る。動作点表現と呼ばれる場合もある動作点は、動作点に関連付けられた各NALユニットを含む場合がある。いくつかの例では、動作点は、動作点に関連付けられていないVCL NALユニットを含まない。
[0074] VPS、SPS、およびPPSなどのパラメータセットは、HEVC規格の拡張に固有の拡張シンタックス構造を含む場合がある。たとえば、パラメータセットは、SHVC、MV−HEVCなどに固有の拡張を含む場合がある。拡張シンタックス構造は、HEVC規格の拡張に適用可能なシンタックス要素を含む場合がある。下記の表1は、SHVCドラフトテキスト7およびMV−HEVCドラフトテキスト9において定義されたVPS拡張の一部分を示す。
Figure 2017535184
[0075] 上記の表1の例、および本開示の他のシンタックス表では、タイプ記述子ue(v)を有するシンタックス要素は、左ビットが先頭の0次指数ゴロム(Exp−Golomb)コーディングを使用して符号化される可変長の符号なし整数であり得る。表1および以下の表の例では、形式u(n)の記述子を有するシンタックス要素は、長さnの符号なし値であり、ここで、nは非負整数である。
[0076] 表1において定義されたVPS拡張の部分は、1つまたは複数の出力レイヤセット(OLS)を定義するシンタックス要素を含む。出力レイヤセットは、VPS内で指定されたレイヤセットのうちの1つのレイヤからなるレイヤのセットであり、ここで、レイヤのセット内の1つまたは複数のレイヤが出力レイヤであるように示される。詳細には、layer_set_idx_for_ols_minus1[i]シンタックス要素プラス1は、i番目の出力レイヤセットのインデックスを指定する。1に等しいoutput_layer_flag[i][j]シンタックス要素は、i番目のOLS内のj番目のレイヤが出力レイヤであることを指定する。0に等しいoutput_layer_flag[i][j]シンタックス要素は、i番目のOLS内のj番目のレイヤが出力レイヤではないことを指定する。
[0077] 出力レイヤセットは、1つまたは複数の区分化方式を有する場合がある。出力レイヤセットの区分化方式は、出力レイヤセット内のレイヤを1つまたは複数のパーティションに分割する。出力レイヤセット内の各レイヤは、区分化方式においてちょうど1つのパーティションに属する。
[0078] 少なくともいくつかのビデオコーディング規格は、ビデオバッファリングモデルを規定する。H.264/AVCおよびHEVCでは、バッファリングモデルは、「仮想参照デコーダ」または「HRD」と呼ばれる。HEVCドラフト仕様では、HRDは付属書類Cにおいて記述されている。HRDは、データが復号のためにどのようにバッファリングされるべきかと、復号データが出力のためにどのようにバッファリングされるかとを記述する。たとえば、HRDは、コード化ピクチャバッファ(「CPB」)、復号ピクチャバッファ(「DPB」)、およびビデオ復号プロセスの動作を記述する。CPBは、HRDによって指定された復号順序でアクセスユニットを含んでいる先入れ先出しバッファである。DPBは、HRDによって指定された参照、出力並べ替え、または出力遅延のために復号ピクチャを保持するバッファである。CPBおよびDPBの挙動は、数学的に規定される場合がある。HRDは、タイミング、バッファサイズ、およびビットレートに対して直接的に制約を課する場合がある。さらに、HRDは、様々なビットストリームの特性および統計値に対して間接的に制約を課する場合がある。
[0079] H.264/AVCおよびHEVCでは、ビットストリームの適合性およびデコーダの適合性がHRD仕様の一部として規定される。言い換えれば、HRDモデルは、ビットストリームが規格に適合するかどうかを決定する検査と、デコーダが規格に適合するかどうかを決定する検査とを規定する。HRDはある種類のデコーダとして命名されたが、ビデオエンコーダは、通常、ビットストリームの適合性を保証するためにHRDを使用するが、ビデオデコーダは、通常、HRDを必要としない。
[0080] H.264/AVCおよびHEVCは両方とも、2つのタイプのビットストリームまたはHRDの適合性、すなわちタイプIとタイプIIとを規定する。タイプIのビットストリームは、ビットストリーム内のすべてのアクセスユニット用のVCL NALユニットおよびフィラーデータNALユニットのみを含んでいるNALユニットストリームである。少なくともいくつかの例では、NALユニットストリームはNALユニットのシーケンスである。タイプIIのビットストリームは、ビットストリーム内のすべてのアクセスユニット用のVCL NALユニットおよびフィラーデータNALユニットに加えて、以下のフィラーデータNALユニット以外のさらなる非VCL NALユニット、ならびに、NALユニットストリームからバイトストリームを形成するすべてのleading_zero_8bits、zero_byte、start_coded_prefix_one_3bytes、およびtrailing_zero_8bitsのシンタックス要素のうちの少なくとも1つを含んでいるNALユニットストリームである。
[0081] ビットストリームがビデオコーディング規格に適合するかどうかを決定するビットストリーム適合性検査をデバイスが実施するとき、デバイスはビットストリームの動作点を選択することができる。次いで、デバイスは、選択された動作点に適用可能なHRDパラメータのセットを決定することができる。デバイスは、選択された動作点に適用可能なHRDパラメータのセットを使用して、HRDの挙動を構成することができる。より詳細には、デバイスは、HRDパラメータの適用可能なセットを使用して、仮想ストリームスケジューラ(HSS)、CPB、復号プロセス、DPBなどの、HRDの特定の構成要素の挙動を構成することができる。その後、HSSは、特定のスケジュールに従って、HRDのCPBにビットストリームのコード化ビデオデータを注入することができる。さらに、デバイスは、CPB内のコード化ビデオデータを復号する復号プロセスを起動することができる。復号プロセスは、DPBに復号ピクチャを出力することができる。デバイスがHRDを介してデータを移動させるとき、デバイスは、制約の特定のセットが満たされたままであるかどうかを決定することができる。たとえば、デバイスは、HRDが選択された動作点を復号している間、CPBまたはDPBにおいてオーバーフローまたはアンダーフローの状態が発生しているかどうかを決定することができる。デバイスは、このようにして、ビットストリームの各動作点を選択し処理することができる。制約が破られることをビットストリームの動作点が引き起こさない場合、デバイスは、ビットストリームがビデオコーディング規格に適合すると決定することができる。
[0082] H.264/AVCとHEVCの両方は、2つのタイプのデコーダ適合性、すなわち、出力タイミングデコーダ適合性と出力順序デコーダ適合性とを規定する。特定のプロファイル、ティア、およびレベルに対する適合性を主張するデコーダは、HEVCなどのビデオコーディング規格のビットストリーム適合性要件に適合するすべてのビットストリームをうまく復号することができる。
[0083] デバイスがデコーダ適合性検査を実施して、検査対象のデコーダ(DUT)がビデオコーディング規格に適合するかどうかを決定するとき、デバイスは、ビデオコーディング規格に適合するビットストリームをHRDとDUTの両方に供給することができる。HRDは、ビットストリーム適合性検査に関して上述された方式でビットストリームを処理することができる。DUTによって出力される復号ピクチャの順序が、HRDによって出力される復号ピクチャの順序と一致する場合、デバイスは、DUTがビデオコーディング規格に適合すると決定することができる。その上、DUTが復号ピクチャを出力するタイミングが、HRDが復号ピクチャを出力するタイミングと一致する場合、デバイスは、DUTがビデオコーディング規格に適合すると決定することができる。
[0084] H.264/AVCおよびHEVCのHRDモデルでは、復号またはCPB削除はアクセスユニット(AU)ベースであり得る。すなわち、HRDは、一度に完全なアクセスユニットを復号し、CPBから完全なアクセスユニットを削除すると見なされる。さらに、H.264/AVCおよびHEVCのHRDモデルでは、ピクチャの復号は瞬時であると見なされる。ビデオエンコーダ20は、ピクチャタイミングSEIメッセージ(picture timing SEI message)内で、アクセスユニットの復号を開始する復号時間をシグナリングすることができる。実際の用途では、適合するビデオデコーダがアクセスユニットの復号を開始するためにシグナリングされた復号時間に厳密に従う場合、特定の復号ピクチャを出力する最早可能時間は、その特定のピクチャの復号時間プラスその特定のピクチャを復号するために必要な時間に等しい。しかしながら、現状では、ピクチャを復号するために必要な時間はゼロに等しい可能性はない。
[0085] HRDパラメータは、HRDの様々な態様を制御することができる。言い換えれば、HRDはHRDパラメータに依存する場合がある。HRDパラメータには、初期CPB削除遅延、CPBサイズ、ビットレート、初期DPB出力遅延、およびDPBサイズが含まれ得る。ビデオエンコーダ20は、VPSおよび/またはSPSにおいて指定されたhrd_parameters()シンタックス構造内で、これらのHRDパラメータをシグナリングすることができる。個々のVPSおよび/またはSPSは、HRDパラメータの様々なセットについての複数のhrd_parameters()シンタックス構造を含む場合がある。いくつかの例では、ビデオエンコーダ20は、バッファリング期間SEIメッセージ(buffering period SEI message)またはピクチャタイミングSEIメッセージ内で、HRDパラメータをシグナリングすることができる。下記の表2は、HEVCにおけるhrd_parameters()シンタックス構造についての例示的シンタックスである。
Figure 2017535184
[0086] 表2では、cpb_cnt_minus1[i]プラス1は、HighestTidがiに等しいときのCVSのビットストリーム内の代替CPB仕様の数を指定する。cpb_cnt_minus1[i]の値は、両端値を含む0〜31の範囲内である。存在しないとき、cpb_cnt_minus1[i]の値は0に等しいと推論される。
[0087] さらに、VPSは、ビデオ有用性情報(VUI)シンタックス構造を含む場合がある。Rec.ITU−T H.265|ISO/IEC23008−2では、VPS内のVUIシンタックス構造はvps_vui()と表記される。VPS VUIシンタックス構造は、VUIビットストリームのHRDパラメータシンタックス構造を含む。Rec.ITU−T H.265|ISO/IEC23008−2では、VPS内のVUIビットストリームのHRDパラメータシンタックス構造は、vps_vui_bsp_hrd_params()と表記される。下記の表3は、Rec.ITU−T H.265|ISO/IEC23008−2におけるvps_vui_bsp_hrd_params()シンタックス構造についてのシンタックス表である。
Figure 2017535184
[0088] 上記の表3では、bsp_hrd_idx[h][i][t][j][k]は、HighestTidがtに等しいときのh番目のOLS用のi番目の区分化方式のk番目のビットストリームパーティションのために指定されたj番目の配信スケジュール用のVPS内のhrd_parameters()シンタックス構造のインデックスを指定する。上記で示されたように、ビットストリームパーティションは、出力レイヤセット内のレイヤを1つまたは複数のパーティションに分割する区分化方式に従うビットストリームのサブセットである、NALユニットストリームまたはバイトストリームの形態のビットのシーケンスである。bsp_hrd_idx[h][i][t][j][k]シンタックス要素の長さは、Ceil(Log2(vps_num_hrd_parameters+vps_num_add_hrd_params))ビットである。bsp_hrd_idx[h][i][t][j][k]の値は、両端値を含む、0〜vps_num_hrd_parameters+vps_num_add_hrd_params−1の範囲内である。vps_num_hrd_parameters+vps_num_add_hrd_paramsが1に等しいとき、bsp_hrd_idx[h][i][t][j][k]の値は0に等しいと推論される。
[0089] HEVCおよび他のビデオコーディング規格は、プロファイルと、ティアと、レベルとを規定する。プロファイル、ティア、およびレベルは、ビットストリームに対する制限を指定し、したがって、ビットストリームを復号するために必要とされる能力に対する限界を指定する。プロファイル、ティア、およびレベルは、個々のデコーダ実装形態間の相互運用性ポイントを示すために使用される場合もある。各プロファイルは、そのプロファイルに適合するすべてのビデオデコーダによってサポートされるアルゴリズムの特徴および限界のサブセットを指定する。ビデオエンコーダは、プロファイル内でサポートされるすべての特徴を利用することは必要とされない。
[0090] ティアの各レベルは、シンタックス要素および変数が有する場合がある値に対する限界のセットを指定する場合がある。すべてのプロファイルとともにティアおよびレベルの定義の同じセットが使用される場合があるが、個々の実装形態は、サポートされるプロファイルごとに異なるティアをサポートし、ティア内で異なるレベルをサポートする場合がある。所与のプロファイルについて、ティアのレベルは、一般に、特定のデコーダ処理の負荷およびメモリ能力に対応する場合がある。ビデオデコーダの能力は、特定のプロファイル、ティア、およびレベルの制約に適合するビデオストリームを復号する能力に関して指定される場合がある。そのようなプロファイルごとに、そのプロファイルのためにサポートされるティアおよびレベルが表現される場合もある。いくつかのビデオデコーダは、特定のプロファイル、ティア、またはレベルを復号することができない場合がある。
[0091] HEVCでは、プロファイル、ティア、およびレベルは、シンタックス構造profile_tier_level()シンタックス構造によってシグナリングされる場合がある。profile_tier_level()シンタックス構造は、VPSおよび/またはSPSに含まれる場合がある。profile_tier_level()シンタックス構造は、general_profile_idcシンタックス要素と、general_tier_flagシンタックス要素と、general_level_idcシンタックス要素とを含む場合がある。general_profile_idcシンタックス要素は、CVSが適合するプロファイルを示すことができる。general_tier_flagシンタックス要素は、general_level_idcシンタックス要素の解釈のためのティアコンテキストを示すことができる。general_level_idcシンタックス要素は、CVSが適合するレベルを示すことができる。これらのシンタックス要素のための他の値は予約済みであり得る。
[0092] ビデオデコーダの能力は、プロファイル、ティア、およびレベルの制約に適合するビデオストリームを復号する能力に関して指定される場合がある。そのようなプロファイルごとに、そのプロファイルのためにサポートされるティアおよびレベルが表現される場合もある。いくつかの例では、ビデオデコーダは、HEVCにおいて指定された値の間のgeneral_profile_idcシンタックス要素の予約済み値が、指定されたプロファイル間の中間の能力を示すとは推論しない。しかしながら、ビデオデコーダは、HEVCにおいて指定された値の間のgeneral_tier_flagシンタックス要素の特定の値に関連付けられたgeneral_level_idcシンタックス要素の予約済み値が、ティアの指定されたレベル間の中間の能力を示すと推論することができる。
[0093] MPEG−2システム仕様は、デジタル送信または記憶に適した単一のデータストリームを形成するために、圧縮マルチメディア(ビデオおよびオーディオ)データストリームが他のデータとともにどのように多重化され得るかを記述している。MPEG−2 TSの最新仕様は、ITU−T勧告H.222.0、2012年6月版(本明細書では「MPEG−2 TS」)であり、アドバンストビデオコーディング(AVC)およびAVC拡張のサポートが提供される。最近、HEVC向けのMPEG−2 TSの改正案が開発された。最新文書は、MPEG出力文書N13656、2013年6月の中の「Text of ISO/IEC13818−1:2013/Final Draft Amendment 3−Transport of HEVC video over MPEG−2 Systems」(以下、「文書N13656」または「HEVC TS仕様」)である。
[0094] MPEG−2システム仕様は、エレメンタリストリームの概念を定義する。具体的には、エレメンタリストリームは、プログラムの単一のデジタルコーディングされた(場合によってはMPEG圧縮された)構成要素である。たとえば、プログラムのコーディングされたビデオまたはオーディオの部分は、エレメンタリストリームであり得る。エレメンタリストリームは、第1に、プログラムストリーム(program stream)またはトランスポートストリーム(transport stream)に多重化される前に、パケット化エレメンタリストリーム(PES)に変換される。同じプログラム内では、1つのエレメンタリストリームに属するPESパケットを別のものと区別するために、stream_idが使用される。
[0095] 各それぞれのエレメンタリストリームは、それぞれのエレメンタリストリームのストリームタイプ(stream type)を識別するストリームタイプ識別子を有する。0x24に等しいストリームタイプを有するエレメンタリストリームは、HEVCビデオストリームまたはHEVC時間ビデオサブビットストリームまたはHEVCベースサブパーティションである。文書N13656において定義されているように、HEVCビデオストリーム(HEVC video stream)は、Rec.ITU−T H.265|ISO/IEC23008−2の付属書類Bにおいて規定されたバイトストリームである。HEVC時間ビデオサブビットストリームは、0に等しいTemporalIDを有するHEVC時間サブレイヤ、または0に等しくないTemporalIDを有するゼロ以上のHEVC時間サブレイヤを備えるビットストリームである。文書N13656において定義されているように、HEVCベースサブパーティションは、ターゲットレイヤ識別子リストが0に等しいnuh_layer_id値を含むターゲットHEVC動作点によって識別された、ターゲット最上位TemporalIdまでの1つまたは複数のレイヤのすべてのVCL NALユニットと関連する非VCL NALユニットとを含んでいる、Rec.ITU−T H.265|ISO/IEC23008−2において規定された適合ビットストリームでもあるHEVCビデオサブビットストリームである。
[0096] 0x27に等しいストリームタイプを有するエレメンタリストリームは、ITU−T Rec.H.265|ISO/IEC23008−2の付属書類Gにおいて定義された1つまたは複数のプロファイルに適合するHEVCビデオストリームのTemporalId
0を含むHEVCエンハンスメントサブパーティションである。文書N13656において定義されているように、HEVCエンハンスメントサブパーティションは、HEVCベースサブパーティションとゼロ以上の他のHEVCサブパーティションとを有するそのHEVCレイヤ集合が、最上位レイヤの動作点のレイヤリストおよびこのビデオサブビットストリーム含まれる最上位TemporalIdに従って、有効なHEVC積層ビデオストリームをもたらす、1つもしくは複数のHEVCレイヤ、またはHEVC時間ビデオサブビットストリームもしくはそのHEVC時間ビデオサブセットである。HEVC時間ビデオサブセットは、1つまたは複数のHEVC時間サブレイヤを備える。HEVC時間ビデオサブセットは、その中にHEVC時間ビデオサブセットが0に等しいTemporalIDを有するHEVC時間サブレイヤを必ずしも含むとは限らないHEVC時間ビデオサブビットストリームとは異なる。
[0097] 文書N13656において定義されているように、HEVCレイヤ集合は、HEVCビデオシーケンス内のすべてのHEVCレイヤ成分の連続するHEVCレイヤ成分集合である。文書N13656において定義されているように、HEVCレイヤ成分は、HEVCサブパーティションに属するHEVCアクセスユニットのVCL NALユニットおよび関連する非VCL NALユニットである。さらに、文書N13656において定義されているように、HEVCレイヤ成分集合は、HEVCレイヤリストによって示された順序でHEVCレイヤリスト内で示されたすべてのHEVCサブパーティションからの同じ出力時間を有するすべてのHEVCレイヤ成分の連結であり、Rec.ITU−T H.265|ISO/IEC23008−2の付属書類Fにおいて定義された有効なアクセスユニットをもたらす。
[0098] MPEG−2 TSのコンテキスト内で使用される「HEVCサブパーティション」という用語は、HEVCベースサブパーティションまたはHEVCエンハンスメントサブパーティションのいずれかを指す。SHVCおよびMV−HEVCのコンテキストでは、同じ概念が「パーティション」と呼ばれる場合がある。HEVC TS仕様において定義されているように、「HEVCベースサブパーティション」という用語は、HEVC規格に適合し、ターゲットレイヤ識別子リストが0に等しいnuh_layer_id値を含むターゲットHEVC動作点によって識別された、ターゲット最上位TemporalIdまでの1つまたは複数のレイヤのすべてのVCL NALユニットを含んでいる、HEVCビデオサブビットストリームである。さらに、HEVC TS仕様において定義されているように、「HEVCエンハンスメントサブパーティション」という用語は、HEVCベースサブパーティションとゼロ以上の他のHEVCサブパーティションとを有するそのHEVCレイヤ集合が、最上位レイヤの動作点のレイヤリストおよびこのビデオサブビットストリーム含まれる最上位TemporalIdに従って、有効なHEVC積層ビデオストリームをもたらす、1つもしくは複数のHEVCレイヤ、またはHEVC時間ビデオサブビットストリームもしくはそのHEVC時間ビデオサブセットを指す。
[0099] 0x28に等しいストリームタイプを有するエレメンタリストリームは、ITU−T Rec.H.265|ISO/IEC23008−2の付属書類Gにおいて定義された1つまたは複数のプロファイルに適合するHEVCビデオストリームのHEVC時間エンハンスメントサブパーティションである。文書N13656において定義されているように、HEVC時間エンハンスメントサブパーティションは、Rec.ITU−T H.265|ISO/IEC23008−2において規定された1つまたは複数の補完時間サブレイヤを含んでいる、同じHEVCビデオストリームの別のHEVCエンハンスメントサブパーティションと同じHEVCレイヤのセットのHEVC時間ビデオサブセットである。本開示では、補完時間サブレイヤは、メインサブパーティションに時間(フレームレート)拡張を提供するHEVC時間エンハンスメントサブパーティションである。たとえば、2つの時間サブレイヤ(Tid 0およびTid 1)を有するレイヤを仮定する。この例では、Tid 0がメインサブパーティション内にあり、Tid 1が時間エンハンスメントサブパーティション内にある2つのエレメンタリストリーム(または2つのサブパーティション)内に、2つの時間サブレイヤを搬送することが可能である。
[0100] さらに、0x29に等しいストリームタイプを有するエレメンタリストリームは、ITU−T Rec.H.265|ISO/IEC23008−2の付属書類Hにおいて定義された1つまたは複数のプロファイルに適合するHEVCビデオストリームのTemporalId 0を含むHEVCエンハンスメントサブパーティションである。0x2Aに等しいストリームタイプを有するエレメンタリストリームは、ITU−T Rec.H.265|ISO/IEC23008−2の付属書類Hにおいて定義された1つまたは複数のプロファイルに適合するHEVCビデオストリームのHEVC時間エンハンスメントサブパーティションである。
[0101] 上記で簡単に示されたように、MPEG−2システム仕様は、プログラムストリームおよびトランスポートストリームの概念を定義する。プログラムストリームおよびトランスポートストリームは、様々な用途を対象にする2つの代替的な多重化である。プログラムストリームは、デジタルストレージサービスからの単一のプログラムの記憶および表示のためにバイアスされ、プログラムストリームは、誤りがかなり起こりやすいので、誤りのない環境での使用を対象とする。対照的に、トランスポートストリームは、潜在的に誤りを起こしやすいチャネルを介するいくつかのプログラムの同時配信を対象とする。一般に、トランスポートストリームは、単一のトランスポートストリームが多くの独立したプログラムに適応することができるように、ブロードキャストなどのマルチプログラムアプリケーションのために考案された多重化である。プログラムストリームは、それに属するエレメンタリストリームを備えるにすぎず、通常、可変長のパケットを含んでいる。
[0102] プログラムストリームでは、寄与しているエレメンタリストリームから導出されたPESパケットが「パック」に編成される。パックは、パックヘッダと、オプションのシステムヘッダと、寄与しているエレメンタリストリーム(すなわち、プログラムストリームのエレメンタリストリーム)のいずれかから取られる任意の数のPESパケットとを任意の順序で備える。システムヘッダは、プログラムストリームの最大データレート、プログラムストリームの寄与しているビデオおよびオーディオのエレメンタリストリームの数、およびさらなるタイミング情報などの、プログラムストリームの特性の概要を含んでいる。デコーダ30などのデコーダは、システムヘッダに含まれている情報を使用して、デコーダがプログラムストリームを復号することが可能であるか否かを決定することができる。
[0103] トランスポートストリームは、一連のトランスポートパケットを備える。トランスポートパケットは、PESパケットの1つのタイプである。トランスポートパケットの各々は、188バイト長である。トランスポートストリーム内の短い固定長パケットの使用は、トランスポートストリームがプログラムストリームよりも誤りが起こりにくいことを意味する。さらに、リードソロモン符号化などの標準的な誤り保護プロセスを介してトランスポートパケットを処理すると、各々188バイト長のトランスポートパケットのさらなる誤り保護を与えることができる。トランスポートストリームの誤り耐性が向上することは、ブロードキャスト環境において発見されるものなどの、誤りを起こしやすいチャネルを克服するより良い機会をトランスポートストリームが有することを意味する。トランスポートストリームの誤り耐性が高まること、およびトランスポートストリーム内で多くの同時プログラムを搬送できることを考慮すると、トランスポートストリームが明らかに2つの多重化(すなわち、プログラムストリームおよびトランスポートストリーム)のうちの良い方であるように見える。しかしながら、トランスポートストリームは、プログラムストリームよりもさらに高度な多重化であり、その結果、作成および逆多重化を行うことがより困難である。
[0104] トランスポートパケットの最初のバイトは同期バイトであり、0x47である。単一のトランスポートストリームは、各々が多くのパケット化エレメンタリストリームを備える、多くの様々なプログラムを搬送することができる。加えて、トランスポートパケットは、13ビットのパケット識別子(PID)フィールドを含む。PIDフィールドは、あるエレメンタリストリームのデータを含んでいるトランスポートパケットを、他のエレメンタリストリームのデータを搬送するトランスポートパケットと区別するために使用される。各エレメンタリストリームが一意のPID値を与えられることを保証することは、マルチプレクサの責務である。トランスポートパケットの最後のバイトは連続カウントフィールドである。連続カウントフィールドの値は、同じエレメンタリストリームに属する連続するトランスポートパケットの間で増分される。連続カウントフィールドの値を増分すると、デコーダ30などのデコーダが、トランスポートパケットの減少または増加を検出し、そうでない場合トランスポートパケットの減少または増加からもたらされる場合がある誤りを潜在的に隠すことが可能になる。
[0105] トランスポートパケットが属するエレメンタリストリームは、トランスポートパケットのPID値に基づいて決定される場合があるが、デコーダは、どのエレメンタリストリームがどのプログラムに属するかを決定することができる必要があり得る。したがって、プログラム固有情報は、プログラムと構成要素のエレメンタリストリームとの間の関係を明示的に指定する。たとえば、プログラム固有情報は、プログラムとプログラムに属するエレメンタリストリームとの間の関係を指定することができる。トランスポートストリームのプログラム固有情報には、プログラムマップテーブル(PMT)、プログラム関連テーブル(PAT)、限定受信テーブル、およびネットワーク情報テーブルが含まれ得る。
[0106] トランスポートストリーム内で搬送されるあらゆるプログラムは、プログラムマップテーブル(PMT)に関連付けられる。PMTは、2つ以上のプログラムを含むことが許される。たとえば、トランスポートストリーム内で搬送される複数のプログラムは、同じPMTに関連付けられる場合がある。プログラムに関連付けられたPMTは、そのプログラムおよびそのプログラムを備えるエレメンタリストリームについての詳細を与える。たとえば、番号3を有するプログラムは、PID33を有するビデオと、PID57を有する英語のオーディオと、PID60を有する中国語のオーディオとを含んでいる場合がある。言い換えれば、この例では、PMTは、そのトランスポートパケットが33に等しい値を有するPIDフィールドを含むエレメンタリストリームが、3に等しい番号(たとえば、program_number)を有するプログラムのビデオを含んでいることと、そのトランスポートパケットが57に等しい値を有するPIDフィールドを含むエレメンタリストリームが、番号3を有するプログラムの英語のオーディオを含んでいることと、そのトランスポートパケットが60に等しい値を有するPIDフィールドを含むエレメンタリストリームが、番号3を有するプログラムの中国語のオーディオを含んでいることとを指定する場合がある。
[0107] 基本PMTは、MPEG−2システム仕様内で規定された多くの記述子のうちのいくつかで装飾される場合がある。言い換えれば、PMTは1つまたは複数の記述子を含む場合がある。記述子は、プログラムまたはプログラムの構成要素のエレメンタリストリームについてのさらなる情報を搬送する。記述子は、ビデオ符号化パラメータ、オーディオ符号化パラメータ、言語識別情報、パンアンドスキャン情報、限定アクセス詳細、著作権情報などを含む場合がある。放送事業者または他のユーザは、必要な場合、追加のプライベート記述子を定義することができる。ビデオ関連構成要素のエレメンタリストリームでは、階層記述子が存在する場合もある。階層記述子は、階層的にコーディングされたビデオ、オーディオ、およびプライベートストリームの構成要素を含んでいるプログラム要素を識別する情報を提供する。プライベートストリームは、プログラム固有情報のストリームなどのメタデータを含む場合がある。一般に、プログラム要素は、プログラム(すなわち、プログラムの構成要素のエレメンタリストリーム)に含まれるデータまたはエレメンタリストリームのうちの1つである。MPEG−2トランスポートストリームでは、プログラム要素は、通常、パケット化される。MPEG−2プログラムストリームでは、プログラム要素はパケット化されない。
[0108] プログラムストリームのプログラム固有情報は、プログラムストリームマップ(PSM)を含む場合がある。プログラムストリームのPSMは、プログラムストリーム内のエレメンタリストリームの記述と、エレメンタリストリームの互いとの関係とを提供する。トランスポートストリーム内で搬送されるとき、この構造は修正されてはならない。PSMは、stream_id値が0xBCであるときにPESパケットとして存在する。
[0109] 上記で示されたように、トランスポートストリームのプログラム固有情報は、プログラム関連テーブル(PAT)を含む場合がある。トランスポートストリームのPATは、トランスポートストリーム内で利用可能なすべてのプログラムの完全なリストを含んでいる。PATは、常にPID値0を有する。言い換えれば、0に等しいPID値を有するトランスポートパケットは、PATを含んでいる。PATは、それぞれのプログラムに関連付けられたプログラムマップテーブルを含んでいるトランスポートパケットのPID値とともに、トランスポートストリームの各それぞれのプログラムを列記する。たとえば、上述された例示的なPMTでは、PATは、プログラム番号3のエレメンタリストリームを指定するPMTが1001のPIDを有することを指定する情報を含む場合があり、別のPMTが1002の別のPIDを有することを指定する情報を含む場合がある。言い換えれば、この例では、PATは、そのPIDフィールドが1001に等しい値を有するトランスポートパケットが、プログラム番号3のPMTを含んでいることを指定する場合があり、PATは、そのPIDフィールドが1002に等しい値を有するトランスポートパケットが、別のプログラムのPMTを含んでいることを指定する場合がある。
[0110] さらに、上記で示されたように、トランスポートストリームのプログラム固有情報は、ネットワーク情報テーブル(NIT)を含む場合がある。トランスポートストリームのPAT内で指定されたプログラム番号0は、特別な意味を有する。具体的には、プログラム番号0はNITを指す。トランスポートストリームのNITはオプションであり、存在するとき、NITは、トランスポートストリームを搬送する物理ネットワークについての情報を提供する。たとえば、NITは、チャネル周波数、衛星トランスポンダ詳細、変調特性、サービス発信者、サービス名称、および利用可能な代替ネットワークの詳細などの情報を提供することができる。
[0111] 上記で示されたように、トランスポートストリームのプログラム固有情報は、限定受信テーブル(CAT)を含む場合がある。いくつかの例では、トランスポートストリーム内の任意のエレメンタリストリームがスクランブルされる場合、CATは存在しなければならない。CATは、使用中のスクランブリングシステムの詳細を提供し、限定アクセス管理と資格情報とを含んでいるトランスポートパケットのPID値を提供する。MPEG−2は、この情報のフォーマットを規定しない。
[0112] 上記で示されたように、PMTは、プログラムまたはプログラムの構成要素のエレメンタリストリームについての情報を搬送する、1つまたは複数の記述子を含む場合がある。PMT内の1つまたは複数の記述子は、階層記述子を含む場合がある。MPEG−2トランスポートストリーム(TS)では、階層記述子は、様々なエレメンタリストリーム内でサブビットストリームの階層をシグナリングするように設計されている。階層記述子は、L−HEVC内のレイヤなどの、階層的にコーディングされたビデオ、オーディオ、およびプライベートストリームの構成要素を含んでいるプログラム要素を識別する情報を提供する。下記の表2−49は、階層記述子のシンタックスを示す。表2−49に続く段落は、階層記述子のフィールドのセマンティクスを記載する。
Figure 2017535184
[0113] temporal_scalability_flag−「0」に設定されると、関連するプログラム要素が、hierarchy_embedded_layer_indexによって参照されるプログラム要素から得られるビットストリームのフレームレートを向上させることを示す、1ビットフラグ。このフラグの「1」の値は予約済みである。
[0114] spatial_scalability_flag−「0」に設定されると、関連するプログラム要素が、hierarchy_embedded_layer_indexによって参照されるプログラム要素から得られるビットストリームの空間解像度を向上させることを示す、1ビットフラグ。このフラグの「1」の値は予約済みである。
[0115] quality_scalability_flag−「0」に設定されると、関連するプログラム要素が、hierarchy_embedded_layer_indexによって参照されるプログラム要素から得られるビットストリームのSNR品質または忠実度を向上させることを示す、1ビットフラグ。このフラグの「1」の値は予約済みである。
[0116] hierarchy_type−関連する階層レイヤとその階層組込み型レイヤとの間の階層関係が(下記に示される)表2−50において定義される。スケーラビリティが2つ以上の次元において適用される場合、このフィールドは、「8」の値(「複合スケーラビリティ」)に設定されなければならず、フラグtemporal_scalability_flag、spatial_scalability_flag、およびquality_scalability_flagはそれに応じて設定されなければならない。MVCビデオサブビットストリームの場合、このフィールドは、「9」の値(「MVCビデオサブビットストリーム」)に設定されなければならず、フラグtemporal_scalability_flag、spatial_scalability_flag、およびquality_scalability_flagは、「1」に設定されなければならない。MVCベースビューサブビットストリームの場合、hierarchy_typeフィールドは、「15」の値に設定されなければならず、フラグtemporal_scalability_flag、spatial_scalability_flag、およびquality_scalability_flagは、「1」に設定されなければならない。
[0117] hierarchy_layer_index−hierarchy_layer_indexは、コーディングレイヤ階層のテーブルにおいて関連するプログラム要素の一意のインデックスを定義する6ビットフィールドである。インデックスは、シングルプログラム定義内で一意にならなければならない。Rec.ITU−T H.264|ISO/IEC14496−10の付属書類Gにおいて定義されている1つまたは複数のプロファイルに適合するAVCビデオストリームのビデオサブビットストリームの場合、これは、同じアクセスユニットのビデオサブビットストリームの関連するスケーラブルビデオコーディング依存性表現が、hierarchy_layer_indexの昇順(ascending order)で再アセンブルされる場合にビットストリーム順序が正しくなるように割り当てられる、プログラム要素インデックスである。Rec.ITU−T H.264|ISO/IEC14496−10の付属書類Hにおいて定義されている1つまたは複数のプロファイルに適合するAVCビデオストリームのMVCビデオサブビットストリームの場合、これは、同じアクセスユニットのMVCビデオサブビットストリームの関連するMVCビュー成分サブセットが、hierarchy_layer_indexの昇順で再アセンブルされる場合にビットストリーム順序が正しくなるように割り当てられる、プログラム要素インデックスである。
[0118] tref_present_flag−「0」に設定されると、TREFフィールドが関連するエレメンタリストリーム内のPESパケットヘッダ内に存在する場合があることを示す、1ビットフラグ。このフラグの「1」の値は予約済みである。
[0119] hierarchy_embedded_layer_index−hierarchy_embedded_layer_indexは、このhierarchy_descriptorに関連付けられたエレメンタリストリームの復号の前に、復号順序でアクセスされ存在する必要があるプログラム要素のhierarchy_layer_indexを定義する6ビットフィールドである。hierarchy_type値が15である場合、hierarchy_embedded_layer_indexフィールドは未定義になる。
[0120] hierarchy_channel−hierarchy_channelは、送信チャネルの順序セットにおいて関連するプログラム要素のための所期のチャネル番号を示す6ビットフィールドである。最もロバストな送信チャネルは、全体的な送信階層定義に関して、このフィールドの最低値によって定義される。所与のhierarchy_channelは、いくつかのプログラム要素に同時に割り当てられる場合がある。
[0121] 下記の表2−50は、階層記述子のhierarchy_typeフィールドの値の意味を記載する。
Figure 2017535184
[0122] L−HEVC TSドラフトでは、(PTL情報と呼ばれる)プロファイル、ティア、およびレベルの情報、ならびに動作点情報は、HEVC拡張記述子およびHEVC動作点記述子内でシグナリングされる。2つの記述子のシンタックス表が以下の表に示される。
Figure 2017535184
Figure 2017535184
[0123] 最近、積層HEVCの搬送向けのMPEG−2 TSの改正が開始された。最新文書は、MPEG文書w14562、2014年7月の中の「Text of ISO/IEC13818−1:2013/Study of PDAM 7−Carriage of Layered HEVC」(以下、「L−HEVC TSドラフト」)である。L−HEVC TSドラフトでは、現在のバッファモデルが以下のように記述されている。ITU−T Rec.H.222.0|ISO/IEC13818−1プログラムの中に0x27〜0x2Aの範囲内のstream_type値を有する少なくとも1つのストリームが存在するとき、および、ビットストリームパーティション固有のコード化ピクチャバッファ(CPB)動作をシグナリングするために、アクティブHRDパラメータシンタックス構造内のsub_pic_hrd_params_present_flagが1に等しく設定されたとき、2.4.2に記述されたトランスポートシステムターゲットデコーダ(T−STD)モデルは、図2に示されたように、および下記に指定されるように拡張される。図2は、ビットストリームパーティション固有のCPB動作向けのT−STDモデル拡張を示す概念図である。
[0124] 以下の追加記法は、T−STD拡張を記述するために使用され、図2に示されている。
[0125] t(i)は、トランスポートストリームのi番目のバイトがシステムターゲットデコーダに入るときの秒単位の時間を示す。
[0126] lは、(TemporalId 0を含む)stream_type 0x27または0x29の受信HEVCサブパーティションへのインデックスである。HEVCサブパーティションの順序は、存在する場合、HEVC動作点記述子によって示され、存在しない場合、順序は、階層記述子によって示される依存関係によって与えられる。同じインデックスが、対応するHEVC時間エンハンスメントサブパーティションにも適用される。ここで、lは、HEVCベースサブパーティションに関連付けられたnから始まり、(n+m)に達し、ここで、mは下記で指定される。
[0127] mは、stream_type 0x27または0x29の受信HEVCサブパーティションの数である。
[0128] Hlは、同じHEVCベースサブパーティションを有する階層記述子によって関連付けられた、stream_type 0x27または0x29のl番目の受信HEVCサブパーティションの受信HEVC対応時間エンハンスメントサブパーティションの数である。
[0129] ESl,kは、stream_type 0x27もしくは0x29のl番目の受信HEVCサブパーティションのk番目のHEVC対応時間エンハンスメントサブパーティション、またはkが0に等しい場合、stream_type 0x27もしくは0x29のl番目のHEVCサブパーティションを含んでいる受信エレメンタリストリームである。
[0130] ESn+m,Hmは、受信エレメンタリストリームのセット内の最上位HEVC動作点のHEVCサブパーティションを含んでいる受信エレメンタリストリームである。
[0131] PIDn+m,Hmは、ESn+m,Hmを識別するパケット識別子値である。
[0132] jは、出力HEVCアクセスユニットへのインデックスである。
[0133] Cl(j)は、stream_type 0x27もしくは0x29のl番目の受信HEVCサブパーティション、またはHEVC対応時間エンハンスメントサブパーティションのHEVCレイヤ成分である。
[0134] An(j)は、HEVC完全時間表現のj番目のHEVCアクセスユニットである。
[0135] tdn(j)は、システムターゲットデコーダ内のAn(j)の復号時間である。
[0136] trl(j)は、Cl(j)に添付されたPESヘッダ内で利用可能である場合、TREFの値であり、そうでない場合、システムターゲットデコーダ内のAn(j)の復号時間である。
[0137] TBl,kは、エレメンタリストリームESl,k用のトランスポートバッファである。
[0138] TBSl,kは、バイト単位で測定されたトランスポートバッファTBl,kのサイズである。
[0139] MBl,kは、エレメンタリストリームESl,k用の多重化バッファである。
[0140] MBSl,kは、バイト単位で測定された多重化バッファMBl,kのサイズである。
[0141] EBlは、受信HEVC時間ビデオサブビットストリームESl,0および受信HEVC時間ビデオサブセットESl,1〜ESl,H用のエレメンタリストリームバッファである。注X1−各バッファEBlは、ITU−T Rec.H.265|ISO/IEC23008−2の付属書類Fにおいて規定されたように、1つまたは複数のパーティションを含んでいる。
[0142] EBSlは、バイト単位で測定されたエレメンタリストリームバッファEBlのサイズである。
[0143] Rxl,kは、下記に規定されるように、k番目のトランスポートバッファTBl,kからk番目の多重化バッファMBl,kへの転送レートである。
[0144] Rbxl,kは、下記に規定されるように、k番目の多重化バッファMBl,kからエレメンタリストリームバッファEBlへの転送レートである。注X2−インデックスnは、使用される場合、受信エレメンタリストリームおよび関連するバッファがある特定のHEVCベースサブパーティションに属することを示し、これらのエレメンタリストリームおよび関連するバッファを、他のエレメンタリストリームおよびバッファから区別し、図2の記法および他のT−STD拡張との一貫性を維持する。
[0145] TBl,k、MBl,k、EBlのバッファ管理に関して、以下が適用される。
・受信エレメンタリストリームESl,kごとに1つのトランスポートバッファTBl,kが存在し、サイズTBSl,kは512バイトに固定される。
・受信エレメンタリストリームESl,kごとに1つの多重化バッファMBl,kが存在し、多重化バッファMBl,kのサイズMBSl,kは以下のように制約される。
Figure 2017535184
ここで、
BSoh、パケットオーバーヘッドバッファリング、およびBSmux、追加多重化バッファリングは、文書N13656の項2.17.2に規定されている通りである。
MaxCPB[tier,level]およびMaxBR[tier,level]は、ESl,kに関連付けられたHEVC動作点のティアおよびレベルについての、HEVCのティアおよびレベルの仕様から取られる。
cpb_sizeは、Rec.ITU−T H.265|ISO/IEC23008−2の付属書類Fにおいて規定されているように、サブレイヤHRDパラメータから取られ、ESl,kに関連付けられたHEVC動作点に含まれる。
・受信エレメンタリストリームのセット内のHl+1個のエレメンタリストリームESl,0〜ESlm,Hl用に1つのエレメンタリストリームバッファEBlが存在し、合計サイズEBSlは、
Figure 2017535184
であり、ここで、cpb_sizeは、Rec.ITU−T H.265|ISO/IEC23008−2の付属書類Fにおいて規定されているように、サブレイヤHRDパラメータから取られ、ESl,Hに関連付けられたHEVC動作点に含まれる。
・TBl,kからMBl,kへの転送は、以下のように適用される。
・TBl、k内にデータが存在しない場合、Rxl、kはゼロに等しい。
・そうでない場合、Rxl,k=bit_rateであり、
ここで、bit_rateは、バイトストリームフォーマットのためのCPBへのデータフローのCpbBrNalFactor/CpbBrVclFactor×BitRate[i]であり、BitRate[i]は、サブレイヤHRDパラメータがESl,k内のHEVCビデオサブパーティション用のVPS内に存在するとき、Rec.ITU−T H.265|ISO/IEC23008−2において定義されている通りである。
・MBl、kからEBlへの転送は、以下のように適用される。
・HEVCビデオサブビットストリーム用のhrd_management_valid_flagが「1」に設定されたHEVC_timing_and_HRD_descriptorが存在する場合、MBl,kからEBlへのデータの転送は、Rec.ITU−T H.265|ISO/IEC23008−2の付属書類Cにおいて定義されているように、エレメンタリストリームESl,HのCPB内のデータ到達についてのHRD定義方式に従わなければならない。
・そうでない場合、以下のように、MBl、kからEBlにデータを転送するために漏洩方法が使用されなければならない。
Figure 2017535184
ここで、MaxBR[tier,level]は、エレメンタリストリームESl,k内の関連するHEVC積層ビデオサブビットストリーム(まで)を再アセンブルすることからもたらされる、HEVC動作点のティアおよびレベルについて、Rec.ITU−T H.265|ISO/IEC23008−2(表A.2)の中のティアおよびレベルの仕様内のバイトストリームフォーマット用に定義されている通りである。
MBl,k内にPESパケットペイロードデータが存在し、EBlが一杯でない場合、PESパケットペイロードは、Rbxl、kに等しいレートでMBl、kからEBlに転送される。EBlが一杯である場合、データはMBl、kから取り出されない。1バイトのデータがMBl、kからEBlに転送されるとき、MBl、k内にあり、そのバイトに先行するすべてのPESパケットヘッダバイトは、瞬時に取り出され、廃棄される。MBl、k内にPESパケットペイロードデータが存在しないとき、MBl、kからデータは取り出されない。MBl、kに入るすべてのデータはMBl、kから出る。すべてのPESパケットペイロードデータバイトは、MBl、kから出ると瞬時にEBlに入る。
[0146] 2014年10月10日に出願された米国仮特許出願第62/062,681号に記載されている、HEVC拡張の搬送向けのMPEG−2 TSの設計が関係する。
[0147] 上記に示された記述子に加えて、記述子は、1つまたは複数のHEVCタイミングおよびHRD記述子を含む場合がある。HEVCタイミングおよびHRD記述子は、HEVCビデオストリーム、HEVC時間ビデオサブビットストリーム、またはHEVC時間ビデオサブセット用のタイミングおよびHRDのパラメータを提供する。下記の表2−110は、文書N13656において定義された、HEVCタイミングおよびHRD記述子用のシンタックス表である。
Figure 2017535184
[0148] 表2−110では、hrd_management_valid_flagは、トランスポートストリーム内で使用するためにのみ定義された1ビットフラグである。HEVCタイミングおよびHRD記述子が、トランスポートストリーム内で搬送されるHEVCビデオストリームまたはHEVC最上位時間サブレイヤ表現に関連付けられるとき、以下が適用される。hrd_management_valid_flagが「1」に設定された場合、バッファリング期間SEIメッセージおよびピクチャタイミングSEIメッセージは、Rec.ITU−T H.265|ISO/IEC23008−2の付属書類Cにおいて定義されているように、関連するHEVCビデオストリームまたはHEVC最上位時間サブレイヤ表現の中に存在しなければならない。これらのバッファリング期間SEIメッセージは、コーディングされたnal_initial_cpb_removal_delayおよびnal_initial_cpb_removal_delay_offsetの値を搬送しなければならず、NAL HRD用のnal_initial_alt_removal_delayおよびnal_initial_alt_cpb_removal_delay_offsetの値をさらに搬送することができる。hrd_management_valid_flagが「1」に設定された場合、文書N13656の2.17.2において定義されているT−STD内のMBnからEBnへの各バイトの転送、または文書N13656の2.17.3において定義されているT−STD内のMBn,kからEBnへの転送は、Rec.ITU−T H.265|ISO/IEC23008−2の付属書類Cにおいて規定されているように、cpb_cnt_minus1に等しいSchedSelIdx用の、コーディングされたnal_initial_cpb_removal_delayおよびnal_initial_cpb_removal_delay_offsetの値から、またはコーディングされたnal_initial_alt_removal_delayおよびnal_initial_alt_cpb_removal_delay_offsetの値から決定された、NAL HRD内のCPBへのそのバイト用の配信スケジュールに従わなければならない。hrd_management_valid_flagが「0」に設定されると、文書N13656の2.17.2において定義されているT−STD内のMBnからEBnへの転送、または文書N13656の2.17.3において定義されているT−STD内のMBn,kからEBnへの転送のために、漏洩方法が使用されなければならない。
[0149] したがって、N13656において規定されたHEVCタイミングおよびHRD記述子のバージョンでは、SchedSelIdxの値は、cpb_cnt_minus1に等しく設定される。HRDの動作では、仮想ストリームスケジューラは、SchedSelIdxによって示された配信スケジュールに従ってテストビットストリームを配信する。
[0150] 上述されたように、現在のHEVCタイミングおよびHRD記述子では、SchedSelIdxの値は、cpb_cnt_minus1に等しく設定される。しかしながら、HEVC仕様では、cpb_cnt_minus1の1つ値だけではなく(すなわち、単一の値だけではなく)、値のアレイ、時間サブレイヤごとのそれぞれの値が存在する。したがって、値のうちのどれが使用されるべきかは少なくとも不明確である。さらに、0よりも大きいcpb_cnt_minus1の任意の特定の値の場合、複数の配信スケジュールが存在する可能性があり、いつも最後の配信スケジュールがなぜ常に選ばれる(すなわち、選択される)かは明確でない。最後に、SHVC/MV−HEVC HRDの最終設計では、特定の出力レイヤセット用の配信スケジュールは、様々なレイヤ用の様々な配信スケジュールの組合せである。
[0151] この問題を克服するために、本開示では、SchedSelIdx(すなわち、スケジュール選択インデックス)の値は、HEVCタイミングおよびHRD記述子内で明示的にシグナリングされることが提案される。たとえば、シンタックス要素target_scheduke_idxは、HEVCタイミングおよびHRD記述子内でシグナリングされる場合がある。一代替案では、SchedSelIdxの値は、動作点ごとにHEVC動作点記述子内でシグナリングされる。したがって、一例では、ビデオ処理デバイス(たとえば、ソースデバイス12、ビデオエンコーダ20)は、HEVCタイミングおよびHRD記述子内で、または動作点ごとにHEVC動作点記述子内で、スケジュール選択インデックスの値を明示的にシグナリングする。同様に、一例では、ビデオデコーダ30(または宛先デバイス14)は、HEVCタイミングおよびHRD記述子内で、または動作点ごとにHEVC動作点記述子内で、明示的にシグナリングされたスケジュール選択インデックスの値を取得することができる。
[0152] SHVC/MV−HEVC仕様では、1つまたは複数のHRDパラメータシンタックス構造が存在する場合があり、ビットストリームの各パーティションは、HRDパラメータシンタックス構造のうちの1つを指す。MPEG−2システム上のL−HEVCの搬送の場合、HEVCサブパーティションごとに現在適用可能なHRDパラメータは、明確に規定されていない。言い換えれば、特定のHEVCサブパーティションにどのHRDパラメータが適用されるかは明確でない。HEVCサブパーティションに適用可能なHRDパラメータシンタックス構造は、HEVCサブパーティションに関与するHRD動作を実施する際に使用される。
[0153] この問題を克服するために、本開示は、パーティションに適用可能なHRDパラメータが、SHVCドラフトテキスト7またはMV−HEVCドラフトテキスト9のvps_vui_bsp_hrd_paramsシンタックス表(すなわち、ビデオパラメータセットビデオ有用性ビットストリームパーティションHRDパラメータシンタックス表)において指定されたシンタックス要素bsp_hrd_idx[TargetOlsIdx][TargetPsIdx][HighestTid][SchedSelCombIdx][partitionIdx]によってそのインデックスが示されるHRDパラメータセットに割り当てられることを提案する。ここで、パーティションという用語がSHVC/MV−HEVCのコンテキストにおいて使用される。たとえば、ビデオデコーダ30は、ビットストリームのパーティションに適用可能はHRDパラメータが、SHVCドラフト仕様またはMV−HEVCドラフト仕様のビデオパラメータセットビデオ有用性ビットストリームパーティションHRDパラメータシンタックス表において指定されたシンタックス要素によって示されたインデックスを有するHRDパラメータに割り当てられると決定することができる。同様に、ビデオ処理デバイスは、SHVCドラフト仕様またはMV−HEVCドラフト仕様のビデオパラメータセットビデオ有用性ビットストリームパーティションHRDパラメータシンタックス表において、ビットストリームのパーティション、適用可能なHRDパラメータに対応するパーティションに割り当てられた適用可能なHRDパラメータへのインデックスを示すシンタックス要素を生成することができる。
[0154] したがって、いくつかの例では、ビデオエンコーダ20などのビデオ処理デバイスは、シンタックス要素のアレイ(たとえば、bsp_hrd_idx[TargetOlsIdx][TargetPsIdx][HighestTid][SchedSelCombIdx][partitionIdx])と、複数のHRDパラメータシンタックス構造(たとえば、hrd_parameters())とを含むVPSを生成することができる。複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造は、HRDパラメータのそれぞれのセットを備える。シンタックス要素のアレイの各それぞれのシンタックス要素は、複数のHRDパラメータシンタックス構造の中のHRDパラメータシンタックス構造のインデックスを指定する。
[0155] さらに、ビデオ処理デバイスは、配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素(たとえば、target_schedule_idx)を備えるHEVCタイミングおよびHRD記述子を生成することができる。ビデオ処理デバイスは、複数のエレメンタリストリームとHEVCタイミングおよびHRD記述子とを備えるMPEG−2データストリームなどのデータストリームを生成することができる。パラメータのセット(たとえば、bsp_hrd_idx[TargetOlsIdx][TargetPsIdx][HighestTid][SchedSelCombIdx][partitionIdx])は、特定のエレメンタリストリームに適用可能であると識別された特定のHRDパラメータシンタックス構造のインデックスを指定するシンタックス要素のアレイ内のシンタックス要素を識別する。この例では、特定のHRDパラメータシンタックス構造は、複数のHRDパラメータシンタックス構造のうちの1つであり、特定のHRDパラメータシンタックス構造は、動作点の一部である。パラメータのセットは、ターゲットスケジュールインデックスシンタックス要素の値に等しい値を有する等しいパラメータ(たとえば、SchedSelCombIdx)を含む場合がある。さらに、いくつかの例では、パラメータのセットは、その値が図7の例に示される方式で決定される第2のパラメータ(たとえば、partitionIdx)を含む。加えて、パラメータのセットは、第3、第4、および第5のパラメータを含む場合がある。第3のパラメータ(たとえば、TargetOlsIdx)は、動作点のターゲット出力レイヤセットインデックスを指定する。第4のパラメータ(たとえば、TargetPsIdx)は、動作点のターゲット区分化方式インデックスを指定し、第5のパラメータ(たとえば、HighestTid)は、動作点の最上位時間識別子を指定する。
[0156] 同様の例では、ビデオデコーダ30は、複数のエレメンタリストリームとHEVCタイミングおよびHRD記述子とを備えるMPEG−2データストリームなどのデータストリームを受信することができる。HEVCタイミングおよびHRD記述子は、配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素(たとえば、target_schedule_idx)を備える。さらに、ビデオデコーダ30は、パラメータのセットに基づいて、VPS内のシンタックス要素のアレイ内のシンタックス要素を識別することができる。VPSは、複数のHRDパラメータシンタックス構造(たとえば、hrd_parameters())を備える。複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造は、HRDパラメータのそれぞれのセットを備える。シンタックス要素のアレイの各それぞれのシンタックス要素は、複数のHRDパラメータシンタックス構造の中のHRDパラメータシンタックス構造のインデックスを指定する。パラメータのセットは、ターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータ(たとえば、SchedSelCombIdx)を含む場合がある。さらに、いくつかの例では、パラメータのセットは、その値が図7の例に示される方式で決定される第2のパラメータ(たとえば、partitionIdx)を含む。加えて、パラメータのセットは、第3、第4、および第5のパラメータを含む場合がある。第3のパラメータ(たとえば、TargetOlsIdx)は、動作点のターゲット出力レイヤセットインデックスを指定する。第4のパラメータ(たとえば、TargetPsIdx)は、動作点のターゲット区分化方式インデックスを指定し、第5のパラメータ(たとえば、HighestTid)は、動作点の最上位時間識別子を指定する。さらに、この例では、ビデオデコーダ30は、識別されたシンタックス要素によって指定されたインデックスに基づいて、複数のHRDパラメータシンタックス構造内の特定のHRDパラメータシンタックス構造を、動作点の一部である特定のエレメンタリストリームに適用可能であると識別することができる。複数のエレメンタリストリームは、特定のエレメンタリストリームを含む。
[0157] JCTーVCグループおよびJCT−3Vグループの札幌会合において、プロファイル、ティア、およびレベル(PTL)の情報が、各出力レイヤセットまたは動作点の代わりに、各レイヤに関連付けられることが合意された。この決定は、以下の2つの事実のために、L−HEVC TSドラフトにおけるバッファモデルの設計に対する影響を有する。第1に、現在、エレメンタリストリームはHEVCサブパーティション(たとえば、HEVCベースサブパーティション、HEVCエンハンスメントサブパーティション、またはHEVC時間エンハンスメントサブパーティション)であり、1つまたは複数のレイヤは、エレメンタリストリーム内で搬送され得る。第2に、バッファモデル内の各エレメンタリストリームは、トランスポートバッファ(TBn)と、多重化バッファ(MBn)と、エレメンタリストリームバッファ(EBn)とを通過する。
[0158] 現在、MBnのサイズは以下の式に基づいて計算される。
Figure 2017535184
ここで、BSmux、BSoh、およびMaxCPB[tier,level]はPTL情報に依存する。上記の式において、BSoh、パケットオーバーヘッドバッファリング、およびBSmux、追加多重化バッファリングは、文書N13656の項2.17.2において規定されている通りである。MaxCPB[tier,level]およびMaxBR[tier,level]は、ESl,kに関連付けられたESl,k HEVC動作点のティアおよびレベルについての、HEVCのティアおよびレベルの仕様から取られる。cpb_sizeは、ESl,kに関連付けられたHEVC動作点について、Rec.ITU−T H.265|ISO/IEC23008−2の付属書類Fにおいて規定されたように、適用可能なhrd_parameters()内のサブレイヤHRDパラメータから取られる。エレメンタリストリームが2つ以上のレイヤを有するとき、利用可能なPTL情報の2つ以上のセットが存在する。結果として、PTL情報のどのセットからBSmux、BSoh、およびMaxCPB[tier,level]の値が計算または導出されるべきかは明確でない。
[0159] この問題を克服するために、本開示は、2つ以上のレイヤを含まないように各エレメンタリストリーム(すなわち、HEVCサブパーティション)を制約(すなわち、制限または要求)することを提案する。たとえば、ビデオ処理デバイス(たとえば、ソースデバイス12、ビデオエンコーダ20)は、1つまたは複数のエレメンタリストリームを備えるデータストリーム(たとえば、MPEG−2のプログラムストリームまたはトランスポートストリーム)を生成することができる。この例では、データストリームは、1つまたは複数のエレメンタリストリームの各々が2つ以上のレイヤを含まないという制約に従う。同様の例では、ビデオデコーダ30は、1つまたは複数のエレメンタリストリームを備えるデータストリーム(たとえば、MPEG−2のプログラムストリームまたはトランスポートストリーム)のビデオデータを復号することができる。この例では、データストリームは、1つまたは複数のエレメンタリストリームの各々が2つ以上のレイヤを含まないという制約に従う。
[0160] 上述されたように、HEVCタイミングおよびHRD記述子は、タイミングおよびHRDのパラメータを提供する。現在のHEVCタイミングおよびHRD記述子は、現在のHEVCタイミングおよびHRD記述子がプログラムレベルの記述子(program level descriptor)であるか、プログラム要素レベルの記述子であるかを指定しない。以下の両方が可能である。第1に、HEVCタイミングおよびHRD記述子は、プログラムレベルの記述子としてシグナリングされる場合がある。HEVCタイミングおよびHRD記述子がプログラムレベルの記述子としてシグナリングされると、HEVCタイミングおよびHRD記述子のこの単一のインスタンスがstream_type 0x24、0x25、0x27〜0x2Aを有するすべてのエレメンタリストリームに適用されるので、HRDタイミングおよびHRD記述子のただ1つのインスタンスが存在するべきである。第2に、HEVCタイミングおよびHRD記述子は、プログラム要素レベルの記述子としてシグナリングされる。その記述子は特定のエレメンタリストリームのみに適用される。これにより、HEVCタイミングおよびHRD記述子がいくつかのエレメンタリストリーム用に存在し、いくつかの他のエレメンタリストリーム用に存在しない可能性が与えられる。そのようなシナリオは可能であるが、そのようなより細かい粒状のシグナリングの利点はないように見える。
[0161] この問題を克服するために、本開示は以下を提案する。存在するとき、HEVCタイミングおよびHRD記述子は、プログラムレベルの記述子としてシグナリングされなければならない。存在するとき、ITU−T Rec.H.222.0|ISO/IEC13818−1のための多くて1つのHEVCタイミングおよびHRD記述子が存在しなければならない。したがって、いくつかの例では、ビデオ処理デバイス(たとえば、ソースデバイス12、ビデオエンコーダ20)は、ITU−T勧告H.222.0規格に適合するMPEG−2データストリーム内で、プログラムレベルの記述子としてHEVCタイミングおよびHRD記述子を生成し、MPEG−2データストリーム内に多くて1つのHEVCタイミングおよびHRD記述子が存在することが必要とされる。同様の例では、ビデオデコーダ30は、ITU−T勧告H.222.0規格に適合するMPEG−2データストリームから、プログラムレベルの記述子としてHEVCタイミングおよびHRD記述子を取得し、MPEG−2データストリーム内に多くて1つのHEVCタイミングおよびHRD記述子が存在することが(たとえば、ビットストリーム適合の条件として)必要とされる。
[0162] 文書N13656内のHEVCタイミングおよびHRD記述子の記述では、hrd_management_valid_flagが「1」に等しい場合、バッファリング期間およびピクチャタイミングのSEIメッセージは、関連するHEVCビデオストリームまたはHEVC最上位時間サブレイヤ表現の中に存在しなければならないことが規定される。しかしながら、それらのSEIメッセージの存在のN13656の文書内のさらなる記述は存在しない。発生する可能性がある1つの問題は、SEIメッセージが存在するが、HEVC動作点記述子において定義された動作点の一部のみに適用可能であるか、またはどれにも適用可能でない場合があることである。上述されたように、hrd_management_valid_flagは、HEVCタイミングおよびHRD記述子において指定される。
[0163] 上記の問題を回避するために、本開示は、hrd_management_valid_flagが1に等しい場合、HEVC動作点記述子内でシグナリングされる動作点の各々に適用可能なバッファリング期間SEIメッセージおよびピクチャタイミングSEIメッセージが、HEVCビデオストリーム内に存在しなければならないことが規定されるべきであることを提案する。
[0164] したがって、この問題を克服するために、HEVCタイミングおよびHRD記述子のhrd_management_valid_flagが1に等しい場合、HEVC動作記述子(HEVC operation descriptor)内でシグナリングされる動作点の各々に適用可能なバッファリング期間SEIメッセージおよびピクチャタイミングSEIメッセージが、HEVCビデオストリーム内に存在しなければならないという制約(constraint)(すなわち、制限(restriction)または要求(requirement))を有することが提案される。したがって、いくつかの例では、ビデオ処理デバイス(たとえば、ソースデバイス12、ビデオエンコーダ20)は、HEVCタイミングおよびHRD記述子のhrd_management_valid_flagが1に等しい場合、HEVC動作記述子内でシグナリングされる各動作点に適用可能なバッファリング期間SEIメッセージおよびピクチャタイミングSEIメッセージが、HEVCビデオストリーム内に存在しなければならないという制約に従うプログラムストリームまたはトランスポートストリームを生成する。いくつかの例では、ビデオデコーダ30(または宛先デバイス14)は、HEVCタイミングおよびHRD記述子のhrd_management_valid_flagが1に等しい場合、HEVC動作記述子内でシグナリングされる各動作点に適用可能なバッファリング期間SEIメッセージおよびピクチャタイミングSEIメッセージが、HEVCビデオストリーム内に存在しなければならないという制約に従うプログラムストリームまたはトランスポートストリームのビデオデータを復号する。
[0165] JCTVC−R1013では、「復号ユニット」という用語は、SubPicHrdFlagが0に等しい場合アクセスユニットとして、または、そうでない場合、アクセスユニット内の1つもしくは複数のVCL NALユニットおよび関連する非VCL NALユニットからなるアクセスユニットのサブセットとして定義される。JCTVC−R1013の項C.1において規定されたビットストリーム適合性検査内で復号プロセスが起動された場合、選択されたhrd_parameters()シンタックス構造内のsub_pic_hrd_params_present_flagが1に等しいとき、CPBは、アクセスユニットレベル(この場合、変数SubPicHrdFlagは0に等しく設定される)またはサブピクチャレベル(この場合、変数SubPicHrdFlagは1に等しく設定される)のいずれかで動作するようにスケジュールされる。そうでない場合、SubPicHrdFlagは0に等しく設定され、CPBはパーティションユニットレベルで動作するようにスケジュールされる。そうではなく、JCTVC−R1013の項C.1において規定されたビットストリーム適合性検査内で復号プロセスが起動されない場合、SubPicHrdFlagは(SubPicHrdPreferredFlag&&sub_pic_hrd_params_present_flag)に等しく設定される。変数SubPicHrdPreferredFlagは、外部手段によって指定されるか、または外部手段によって指定されないとき0に等しく設定されるかのいずれかである。
[0166] L−HEVC TSドラフト内の現在のバッファモデルは、超低遅延バッファモデルをサポートしない。アクセスユニットレベルで束ねられた、すなわち、アクセスユニット全体に対してDTSのただ1つの値が存在する、所与の復号タイムスタンプ(DTS)に基づいて、エレメンタリストリームバッファ(EB)からバイト単位のデータが削除される。そのため、所与のアクセスユニットに関連付けられたすべてのデータ(すなわち、すべてのバイト)は、所与のDTSに基づいてエレメンタリストリームから削除される。そのような方法は、アクセスユニット全体がCPB内で利用可能になる前にデータがCPBから削除されるように予想される超低遅延モードがサポートされないことを意味する。
[0167] この問題を克服するために、本開示は以下を提案する。
・MPEG−2システム内の復号ユニットの定義を提供する。
・ビデオストリームを含んでいるプログラムごとに、復号ユニットの粒度(たとえば、アクセスユニット、アクセスユニット内のピクチャの集合、ピクチャ、スライス、スライスセグメント)の指示をシグナリングする。
・同じアクセスユニットに属する各PESパケットは異なるDTSを有する場合があるが、同じ復号ユニットに属するPESパケットのDTSは同じでなければならない。
・エレメンタリストリームバッファからのピクチャの削除はDTS値に基づく。
[0168] 上記の技法向けの代替の解決策は以下の通りであり得る。エレメンタリストリームからのデータの削除は、それらがビデオストリーム内に存在するときの復号ユニット情報SEIメッセージの存在を考慮に入れる。
[0169] 上記に示されたように、本開示の技法によれば、ビデオストリームを含んでいるプログラムごとに、復号ユニットの粒度の指示がシグナリングされる。したがって、一例では、ビデオ処理デバイス(たとえば、宛先デバイス14、ビデオデコーダ30)は、データストリームを受信し、ビデオストリームを含んでいるデータストリームのプログラムごとに、復号ユニットの粒度の指示を取得する。同様の例では、ビデオ処理デバイス(たとえば、ソースデバイス12、ビデオエンコーダ20)は、ビデオストリームを含んでいるデータストリームのプログラムごとに、復号ユニットの粒度の指示を含むデータストリームを生成することができる。これらの例では、復号ユニットの粒度は、アクセスユニット、アクセスユニット内のピクチャの集合、ピクチャ、スライス、またはスライスセグメントのうちの1つであり得る。
[0170] さらに、上記に示されたように、本開示の技法によれば、同じアクセスユニットに属する各PESパケットは異なるDTSを有する場合があるが、同じ復号ユニットに属するPESパケットのDTSは同じでなければならない。したがって、少なくともいくつかのそのような例では、同じアクセスユニットに属する各PESパケットは異なるDTSを有する場合があり、同じ復号ユニットに属するPESパケットのDTSは同じであることが必要とされる。
[0171] 加えて、上記に示されたように、本開示の技法によれば、エレメンタリストリームバッファからのピクチャの削除はDTS値に基づく場合がある。したがって、1つのそのような例では、ビデオデコーダは、バッファにデータを記憶し、データのアクセスユニット全体がバッファ内で利用可能になる前に、バッファからデータを削除する。
[0172] 本開示はいくつかの技法を提案する。これらの方法のうちのいくつかは単独で適用される場合があり、それらのうちのいくつかは組み合わせて適用される場合がある。
[0173] 図3は、本開示の技法を実装することができる例示的なビデオエンコーダ20を示すブロック図である。図3は説明のために提供され、本開示で広く例示され記載される技法を限定するものと見なされるべきではない。説明のために、本開示は、HEVCコーディングのコンテキストにおいてビデオエンコーダ20を記載する。しかしながら、本開示の技法は、他のコーディング規格または方法に適用可能であり得る。ビデオエンコーダ20は、本開示の技法を実施するように構成され得るデバイスの一例を表す。
[0174] 図3の例では、ビデオエンコーダ20は、予測処理ユニット100と、ビデオデータメモリ101と、残差生成ユニット102と、変換処理ユニット104と、量子化ユニット106と、逆量子化ユニット108と、逆変換処理ユニット110と、復元ユニット112と、フィルタユニット114と、復号ピクチャバッファ116と、エントロピー符号化ユニット118とを含む。予測処理ユニット100は、インター予測処理ユニット120と、イントラ予測処理ユニット126とを含む。インター予測処理ユニット120は、動き推定ユニットと、動き補償ユニットとを含む(図示せず)。他の例では、ビデオエンコーダ20は、より多いか、より少ないか、または異なる機能構成要素を含む場合がある。
[0175] ビデオデータメモリ101は、ビデオエンコーダ20の構成要素によって符号化されるべきビデオデータを記憶することができる。ビデオデータメモリ101に記憶されるビデオデータは、たとえば、ビデオソース18から取得される場合がある。復号ピクチャバッファ116は、たとえば、イントラコーディングモードまたはインターコーディングモードでビデオエンコーダ20によってビデオデータを符号化する際に使用するための参照ビデオデータを記憶する参照ピクチャメモリであり得る。ビデオデータメモリ101および復号ピクチャバッファ116は、同期DRAM(SDRAM)を含むダイナミックランダムアクセスメモリ(DRAM)、磁気抵抗RAM(MRAM)、抵抗RAM(RRAM(登録商標))、または他のタイプのメモリデバイスなどの、様々なメモリデバイスのいずれかによって形成される場合がある。ビデオデータメモリ101および復号ピクチャバッファ116は、同じメモリデバイスまたは別個のメモリデバイスによって提供される場合がある。様々な例では、ビデオデータメモリ101は、ビデオエンコーダ20の他の構成要素とのオンチップであるか、またはそれらの構成要素に対してオフチップであり得る。
[0176] ビデオエンコーダ20は、ビデオデータを受信する。ビデオエンコーダ20は、ビデオデータのピクチャのスライス内の各CTUを符号化することができる。CTUの各々は、等しいサイズのルーマコーディングツリーブロック(CTB)およびピクチャの対応するCTBに関連付けられる場合がある。CTUを符号化することの一部として、予測処理ユニット100は、4分木区分化を実施して、CTUのCTBを徐々により小さいブロックに分割することができる。より小さいブロックはCUのコーディングブロックであり得る。たとえば、予測処理ユニット100は、CTUに関連付けられたCTBを4つの等しいサイズのサブブロックに区分化することができ、サブブロックのうちの1つまたは複数を4つの等しいサイズのサブサブブロックに区分化することができ、以下同様である。
[0177] ビデオエンコーダ20は、CTUのCUを符号化して、CUの符号化表現(すなわち、コード化CU)を生成することができる。CUを符号化することの一部として、予測処理ユニット100は、CUの1つまたは複数のPUの間でCUに関連付けられたコーディングブロックを区分化することができる。したがって、各PUは、ルーマ予測ブロックおよび対応するクロマ予測ブロックに関連付けられる場合がある。ビデオエンコーダ20およびビデオデコーダ30は、様々なサイズを有するPUをサポートすることができる。上記で示されたように、CUのサイズはCUのルーマコーディングブロックのサイズを指す場合があり、PUのサイズはPUのルーマ予測ブロックのサイズを指す場合がある。特定のCUのサイズが2N×2Nであると仮定すると、ビデオエンコーダ20およびビデオデコーダ30は、イントラ予測の場合は2N×2NまたはN×NのPUサイズをサポートし、インター予測の場合は2N×2N、2N×N、N×2N、N×N、または同様の対称のPUサイズをサポートすることができる。ビデオエンコーダ20およびビデオデコーダ30はまた、インター予測の場合は2N×nU、2N×nD、nL×2N、およびnR×2NのPUサイズに対する非対称区分化をサポートすることができる。
[0178] インター予測処理ユニット120は、CUの各PUに対してインター予測を実施することにより、PUについての予測データを生成することができる。PUについての予測データは、PUの予測ブロックと、PUについての動き情報とを含む場合がある。インター予測処理ユニット120は、PUがIスライス内にあるか、Pスライス内にあるか、またはBスライス内にあるかに応じて、CUのPUに対して様々な演算を実施することができる。Iスライスでは、すべてのPUがイントラ予測される。したがって、PUがIスライス内にある場合、インター予測処理ユニット120は、PUに対してインター予測を実施しない。したがって、Iモードで符号化されたブロックの場合、予測ブロックは、同じフレーム内の前に符号化された隣接ブロックからの空間予測を使用して形成される。PUがPスライス内にある場合、インター予測処理ユニット120は、単方向インター予測を使用してPUの予測ブロックを生成することができる。PUがBスライス内にある場合、インター予測処理ユニット120は、単方向インター予測または双方向インター予測を使用してPUの予測ブロックを生成することができる。
[0179] イントラ予測処理ユニット126は、PUに対してイントラ予測を実施することにより、PUについての予測データを生成することができる。PUについての予測データは、PUの予測ブロックと、様々なシンタックス要素とを含む場合がある。イントラ予測処理ユニット126は、Iスライス、Pスライス、およびBスライスの中のPUに対してイントラ予測を実施することができる。
[0180] PUに対してイントラ予測を実施するために、イントラ予測処理ユニット126は、複数のイントラ予測モードを使用して、PUについての予測データの複数のセットを生成することができる。イントラ予測処理ユニット126は、隣接PUのサンプルブロックからのサンプルを使用して、PU用の予測ブロックを生成することができる。隣接PUは、PU、CU、およびCTUについて左から右、上から下の符号化順序を仮定すると、PUの上、右上、左上、または左にあり得る。イントラ予測処理ユニット126は、様々な数のイントラ予測モード、たとえば33個の方向のイントラ予測モードを使用することができる。いくつかの例では、イントラ予測モードの数は、PUに関連付けられた領域のサイズに依存する場合がある。
[0181] 予測処理ユニット100は、PUについてインター予測処理ユニット120によって生成された予測データ、またはPUについてイントラ予測処理ユニット126によって生成された予測データの中から、CUのPUについての予測データを選択することができる。いくつかの例では、予測処理ユニット100は、予測データのセットのレート/ひずみメトリックに基づいて、CUのPUについての予測データを選択する。選択された予測データの予測ブロックは、本明細書では、選択された予測ブロックと呼ばれる場合がある。
[0182] 残差生成ユニット102は、CU用のコーディングブロック(たとえば、ルーマコーディングブロック、Cbコーディングブロック、およびCrコーディングブロック)、ならびにCUのPU用の選択された予測ブロック(たとえば、予測ルーマブロック、予測Cbブロック、および予測Crブロック)に基づいて、CU用の残差ブロック(たとえば、ルーマ残差ブロック、Cb残差ブロック、およびCr残差ブロック)を生成することができる。たとえば、残差生成ユニット102は、残差ブロック内の各サンプルが、CUのコーディングブロック内のサンプルと、CUのPUの対応する選択された予測ブロック内の対応するサンプルとの間の差分に等しい値を有するように、CUの残差ブロックを生成することができる。
[0183] 変換処理ユニット104は、4分木区分化を実施して、CUに関連付けられた残差ブロックをCUのTUに関連付けられた変換ブロックに区分化することができる。したがって、TUは、ルーマ変換ブロックおよび2つのクロマ変換ブロックに関連付けられる場合がある。CUのTUのルーマ変換ブロックおよびクロマ変換ブロックのサイズおよび位置は、CUのPUの予測ブロックのサイズおよび位置に基づく場合も、基づかない場合もある。「残差4分木」(RQT)として知られる4分木構造は、領域の各々に関連付けられたノードを含む場合がある。CUのTUは、RQTのリーフノードに対応する場合がある。
[0184] 変換処理ユニット104は、TUの変換ブロックに1つまたは複数の変換を適用することにより、CUのTUごとに変換係数ブロックを生成することができる。変換処理ユニット104は、TUに関連付けられた変換ブロックに様々な変換を適用することができる。たとえば、変換処理ユニット104は、離散コサイン変換(DCT)、方向性変換、または概念的に同様の変換を変換ブロックに適用することができる。いくつかの例では、変換処理ユニット104は変換ブロックに変換を適用しない。そのような例では、変換ブロックは、変換係数ブロックとして扱われる場合がある。
[0185] 量子化ユニット106は、係数ブロック内の変換係数を量子化することができる。量子化プロセスは、変換係数の一部またはすべてに関連付けられたビット深度を低減することができる。たとえば、量子化の間にnビット変換係数がmビット変換係数に切り捨てられる場合があり、ここで、nはmよりも大きい。量子化ユニット106は、CUに関連付けられた量子化パラメータ(QP)値に基づいて、CUのTUに関連付けられた係数ブロックを量子化することができる。ビデオエンコーダ20は、CUに関連付けられたQP値を調整することにより、CUに関連付けられた係数ブロックに適用される量子化の程度を調整することができる。量子化は情報の損失をもたらす場合があり、したがって、量子化変換係数は、元の係数よりも低い精度を有する場合がある。
[0186] 逆量子化ユニット108および逆変換処理ユニット110は、それぞれ、係数ブロックに逆量子化および逆変換を適用して、係数ブロックから残差ブロックを復元することができる。復元ユニット112は、予測処理ユニット100によって生成された1つまたは複数の予測ブロックからの対応するサンプルに復元残差ブロックを加算して、TUに関連付けられた復元変換ブロックを生成することができる。このようにして、CUのTUごとに変換ブロックを復元することにより、ビデオエンコーダ20は、CUのコーディングブロックを復元することができる。
[0187] フィルタユニット114は、1つまたは複数のデブロッキング演算を実施して、CUに関連付けられたコーディングブロック内のブロッキングアーティファクトを低減することができる。復号ピクチャバッファ116は、フィルタユニット114が復元コーディングブロックに対して1つまたは複数のデブロッキング演算を実施した後、復元コーディングブロックを記憶することができる。インター予測処理ユニット120は、復元コーディングブロックを含んでいる参照ピクチャを使用して、他のピクチャのPUに対してインター予測を実施することができる。加えて、イントラ予測処理ユニット126は、復号ピクチャバッファ116内の復元コーディングブロックを使用して、CUと同じピクチャ内の他のPUに対してイントラ予測を実施することができる。
[0188] エントロピー符号化ユニット118は、ビデオエンコーダ20の他の機能構成要素からデータを受け取ることができる。たとえば、エントロピー符号化ユニット118は、量子化ユニット106から係数ブロックを受け取ることができ、予測処理ユニット100からシンタックス要素を受け取ることができる。エントロピー符号化ユニット118は、データに対して1つまたは複数のエントロピー符号化演算を実施して、エントロピー符号化データを生成することができる。たとえば、エントロピー符号化ユニット118は、CABAC演算、コンテキスト適応型可変長コーディング(CAVLC)演算、可変対可変(V2V)長コーディング演算、シンタックスベースコンテキスト適応型バイナリ算術コーディング(SBAC)演算、確率間隔区分化エントロピー(PIPE)コーディング演算、指数ゴロム符号化演算、または別のタイプのエントロピー符号化演算をデータに対して実施することができる。ビデオエンコーダ20は、エントロピー符号化ユニット118によって生成されたエントロピー符号化データを含むビットストリームを出力することができる。たとえば、ビットストリームはCU用のRQTを表すデータを含む場合がある。
[0189] 図4は、本開示の技法を実装するように構成された例示的なビデオデコーダ30を示すブロック図である。図4は説明のために提供され、本開示で広く例示され記載される技法を限定するものではない。説明のために、本開示は、HEVCコーディングのコンテキストにおいてビデオデコーダ30を記載する。しかしながら、本開示の技法は、他のコーディング規格または方法に適用可能であり得る。
[0190] 図4の例では、ビデオデコーダ30は、エントロピー復号ユニット150と、ビデオデータメモリ151と、予測処理ユニット152と、逆量子化ユニット154と、逆変換処理ユニット156と、復元ユニット158と、フィルタユニット160と、復号ピクチャバッファ162とを含む。予測処理ユニット152は、動き補償ユニット164とイントラ予測処理ユニット166とを含む。他の例では、ビデオデコーダ30は、より多いか、より少ないか、または異なる機能構成要素を含む場合がある。
[0191] ビデオデータメモリ151は、ビデオデコーダ30の構成要素によって復号されるべき、符号化ビデオビットストリームなどのビデオデータを記憶することができる。ビデオデータメモリ151に記憶されるビデオデータは、たとえば、チャネル16から、たとえば、カメラなどのローカルビデオソースから、ビデオデータの有線もしくはワイヤレスのネットワーク通信を介して、または物理データ記憶媒体にアクセスすることによって取得される場合がある。ビデオデータメモリ151は、符号化ビデオビットストリームからの符号化ビデオデータを記憶するコード化ピクチャバッファ(CPB)を形成することができる。復号ピクチャバッファ162は、たとえば、イントラコーディングモードまたはインターコーディングモードでビデオデコーダ30によってビデオデータを復号する際に使用するための参照ビデオデータを記憶する参照ピクチャメモリであり得る。ビデオデータメモリ151および復号ピクチャバッファ162は、同期DRAM(SDRAM)を含むダイナミックランダムアクセスメモリ(DRAM)、磁気抵抗RAM(MRAM)、抵抗RAM(RRAM)、または他のタイプのメモリデバイスなどの、様々なメモリデバイスのいずれかによって形成される場合がある。ビデオデータメモリ151および復号ピクチャバッファ162は、同じメモリデバイスまたは別個のメモリデバイスによって提供される場合がある。様々な例では、ビデオデータメモリ151は、ビデオデコーダ30の他の構成要素とのオンチップであるか、またはそれらの構成要素に対してオフチップであり得る。
[0192] CPB151は、ビットストリームの符号化ビデオデータ(たとえば、NALユニット)を受信し、記憶する。エントロピー復号ユニット150は、CPBから符号化ビデオデータ(たとえば、NALユニット)を受け取り、NALユニットを構文解析してシンタックス要素を取得することができる。エントロピー復号ユニット150は、NALユニット内のエントロピー符号化シンタックス要素をエントロピー復号することができる。予測処理ユニット152、逆量子化ユニット154、逆変換処理ユニット156、復元ユニット158、およびフィルタユニット160は、ビットストリームから抽出されたシンタックス要素に基づいて、復号ビデオデータを生成することができる。エントロピー復号ユニット150は、エントロピー符号化ユニット118のプロセスとは全体的に逆のプロセスを実施することができる。
[0193] ビットストリームからシンタックス要素を取得することに加えて、ビデオデコーダ30は、区分化されていないCUに対して復元演算を実施することができる。CUに対して復元演算を実施するために、ビデオデコーダ30は、CUの各TUに対して復元演算を実施することができる。CUのTUごとに復元演算を実施することにより、ビデオデコーダ30は、CUの残差ブロックを復元することができる。
[0194] CUのTUに対して復元演算を実施することの一部として、逆量子化ユニット154は、TUに関連付けられた係数ブロックを逆量子化、すなわち量子化解除することができる。逆量子化ユニット154は、TUのCUに関連付けられたQP値を使用して量子化の程度を決定し、同様に、逆量子化ユニット154が適用すべき逆量子化の程度を決定することができる。すなわち、圧縮比、すなわち、元のシーケンスと圧縮されたシーケンスとを表すために使用されるビット数の比は、変換係数を量子化するときに使用されるQPの値を調整することによって制御される場合がある。圧縮比はまた、採用されたエントロピーコーディングの方法に依存する場合がある。
[0195] 逆量子化ユニット154が係数ブロックを逆量子化した後、逆変換処理ユニット156は、TUに関連付けられた残差ブロックを生成するために、係数ブロックに1つまたは複数の逆変換を適用することができる。たとえば、逆変換処理ユニット156は、逆DCT、逆整数変換、逆カルーネンレーベ変換(KLT)、逆回転変換、逆方向変換、または別の逆変換を係数ブロックに適用することができる。
[0196] イントラ予測を使用してPUが符号化される場合、イントラ予測処理ユニット166は、イントラ予測を実施してPUの予測ブロックを生成することができる。イントラ予測処理ユニット166は、イントラ予測モードを使用して、空間的に隣接するブロックのサンプルに基づいてPUの予測ブロックを生成することができる。イントラ予測処理ユニット166は、ビットストリームから取得された1つまたは複数のシンタックス要素に基づいて、PUのためのイントラ予測モードを決定することができる。
[0197] インター予測を使用してPUが符号化される場合、エントロピー復号ユニット150は、PUについての動き情報を決定することができる。動き補償ユニット164は、PUの動き情報に基づいて、1つまたは複数の参照ブロックを決定することができる。動き補償ユニット164は、1つまたは複数の参照ブロックに基づいて、PU用の予測ブロック(たとえば、予測ルーマブロック、予測Cbブロック、および予測Crブロック)を生成することができる。
[0198] 復元ユニット158は、適用可能であれば、CUのTU用の変換ブロック(たとえば、ルーマ変換ブロック、Cb変換ブロック、およびCr変換ブロック)、ならびにCUのPUの予測ブロック(たとえば、ルーマブロック、Cbブロック、およびCrブロック)、すなわち、イントラ予測データまたはインター予測データのいずれかを使用して、CU用のコーディングブロック(たとえば、ルーマコーディングブロック、Cbコーディングブロック、およびCrコーディングブロック)を復元することができる。たとえば、復元ユニット158は、変換ブロック(たとえば、ルーマ変換ブロック、Cb変換ブロック、およびCr変換ブロック)のサンプルを、予測ブロック(たとえば、ルーマ予測ブロック、Cb予測ブロック、およびCr予測ブロック)の対応するサンプルに加算して、CUのコーディングブロック(たとえば、ルーマコーディングブロック、Cbコーディングブロック、およびCrコーディングブロック)を復元することができる。
[0199] フィルタユニット160は、デブロッキング演算を実施して、CUのコーディングブロックに関連付けられたブロッキングアーティファクトを低減することができる。ビデオデコーダ30は、復号ピクチャバッファ162にCUのコーディングブロックを記憶することができる。復号ピクチャバッファ162は、後続の動き補償、イントラ予測、および図1のディスプレイデバイス32などのディスプレイデバイス上での提示のために、参照ピクチャを供給することができる。たとえば、ビデオデコーダ30は、復号ピクチャバッファ162内のブロックに基づいて、他のCUのPUに対してイントラ予測演算またはインター予測演算を実施することができる。
[0200] 本明細書に記載された技法のすべては、個別にまたは組合せで使用される場合があることを理解されたい。例に応じて、本明細書に記載された技法のうちのいずれかのいくつかの行為またはイベントは、異なるシーケンスで実施することができ、追加、マージ、または完全に除外される場合がある(たとえば、すべての記載された行為またはイベントが本技法の実践に必要であるとは限らない)ことを認識されたい。その上、いくつかの例では、行為またはイベントは、たとえば、マルチスレッド処理、割込み処理、または複数のプロセッサを介して、連続的ではなく同時に実施される場合がある。加えて、本開示のいくつかの態様は、明確にするために、単一のモジュールまたはユニットによって実施されるものとして記載されているが、本開示の技法は、ビデオコーダと関連付けられたユニットまたはモジュールの組合せによって実施される場合があることを理解されたい。
[0201] 例示のためにHEVC規格に関して、本開示のいくつかの態様が記載された。ただし、本開示に記載された技法は、まだ開発されていない他の標準またはプロプライエタリのビデオコーディングプロセスを含む、他のビデオコーディングプロセスに対して有用であり得る。
[0202] 上記に記載された技法は、その両方が一般にビデオコーダと呼ばれる場合がある、ビデオエンコーダ20(図1および図3)ならびに/またはビデオデコーダ30(図1および図4)によって実施される場合がある。同様に、ビデオコーディングは、適用可能であれば、ビデオ符号化またはビデオ復号を指す場合がある。
[0203] 本開示のこの以下のセクションは、本開示の他の場所で記載された技法の例示的な実装形態を記載する。上記の提案を実装するために示唆されるテキストが下記に示される。削除されるテキストは二重角括弧に囲まれたイタリック体のテキスト(たとえば、[[テキスト]])として示され、追加テキストは下線付きのテキストとして示される。
5.1 HEVCタイミングおよびHRD記述子の修正
現在のL−HEVC TSドラフトのセクション2.6.97の内容を以下と差し替える。
HEVCビデオストリームの場合、HEVCタイミングおよびHRD記述子は、Rec.ITU−T H.265|ISO/IEC23008−2の付属書類Cにおいて定義されたように、適用可能なタイミングおよびHRDのパラメータを提供する。HEVCビデオストリームが「1」に設定されたvps_timing_info_present_flagを有するVPSパラメータを搬送しない限り、HEVCタイミングおよびHRD記述子の多くて1つのインスタンスが存在しなければならず、program_mapセクション内のprogram_info_lengthフィールドの直後のデータ要素のグループに含まれなければならない。
HEVCビデオストリームまたは再アセンブルされたHEVCビデオストリームのためのPMT内のHEVCタイミングおよびHRD記述子の不在は、T−STDにおける漏洩方法の使用をシグナリングする。しかし、そのような使用は、HEVCタイミングおよびHRD記述子内の「0」に設定されたhrd_management_valid_flagによってシグナリングすることもできる。バッファEBlへの転送レートがHEVCビデオストリームまたはビデオサブビットストリームから再アセンブルされたAVCビデオストリームに含まれているHRDパラメータから決定することができる場合、「1」に設定されたhrd_management_valid_flagを有するAVCタイミングおよびHRD記述子は、そのHEVCビデオストリームまたは再アセンブルされたHEVCビデオストリームのためにPMTに含まれなければならない。(表2−103septiens参照。)
Figure 2017535184
現在のL−HEVC TSドラフトのセクション2.6.98の内容を以下と差し替える。
hrd_management_valid_flag−この1ビットフラグは、トランスポートストリーム内で使用するためにのみ定義される。HEVCタイミングおよびHRD記述子が、トランスポートストリーム内で搬送されるHEVCビデオストリーム[[またはHEVC最上位時間サブレイヤ表現]]に関連付けられるとき、以下が適用される。
hrd_management_valid_flagが「1」に等しい場合、バッファリング期間SEIメッセージおよびピクチャタイミングSEIメッセージは、Rec.ITU−T H.265|ISO/IEC23008−2の付属書類Cにおいて定義されたように、関連するHEVCビデオストリーム[[またはHEVC最上位時間サブレイヤ表現]]の中に存在しなければならず、HEVC動作記述子内でシグナリングされる各動作点は、適用可能なバッファリング期間SEIメッセージとピクチャタイミングSEIメッセージとをもたなければならない。これらのバッファリング期間SEIメッセージは、コーディングされたnal_initial_cpb_removal_delayおよびnal_initial_cpb_removal_offsetの値を搬送しなければならず、NAL HRD用のnal_initial_alt_removal_delayおよびnal_initial_alt_cpb_removal_offsetの値をさらに搬送することができる。hrd_management_valid_flagが「1」に設定された場合、文書N13656の2.17.2において定義されているT−STD内のMBnからEBnへの各バイトの転送、または文書N13656の2.17.3において定義されているT−STD内のMBn,kからEBnへの転送、または文書N13656の2.17.4において定義されているT−STD内のMB n からEB n への転送は、Rec.ITU−T H.265|ISO/IEC23008−2の付属書類Cにおいて規定されているように、target_schedule_idxに等しいSchedSelIdx用の、コーディングされたnal_initial_cpb_removal_delayおよびnal_initial_cpb_removal_offsetから、またはコーディングされたnal_initial_alt_cpb_removal_delayおよびnal_initial_alt_cpb_removal_offsetの値から決定された、NAL HRD内のCPBへのそのバイト用の配信スケジュールに従わなければならない。hrd_management_valid_flagが「0」に設定されると、2.17.[[3]]において定義されているT−STD内のMBnからEBnへの転送のために、漏洩方法が使用されなければならない。
HEVC_timing_and_HRD_descriptorが存在し、hrd_management_valid_flagの値が1に等しいとき、動作点opAの一部であるエレメンタリストリームesAに適用可能なHRDパラメータは、HEVCビデオストリームのアクティブVPS内のbsp_hrd_idx[TargetOlsIdx][TargetPsIdx][HighestTid][SchedSelCombIdx][partitionIdx]番目のhrd_parameters()シンタックス構造であり、ここで、
TargetOlsIdxはopAのtarget_olsに等しく、
TargetPsIdxはopAのtarget_partitioning_schemeに等しく、
HighestTidはopAのmax_temporal_idに等しく、
SchedSelCombIdxはtarget_schedule_idxに等しく、
partitionIdxは以下のように定義されるidxAに等しい。
listAを、階層記述子または階層拡張記述子(hierarchy extension descriptor)内に存在するそれらの階層レイヤインデックス値(hierarchy layer index value)に従って、昇順でopAに含まれている、0x24、0x27、または0x29に等しいstream_typeを有するエレメンタリストリームのリスト(list)であるとする。esAがlistAのメンバ(member)である場合、idxAはlistA内のesAのインデックスであり、そうでない場合、idxAはlistA内のesBのインデックスであり、ここで、esAはesBの優待時間エンハンスメントである。
target_schedule_idx−この5ビットフィールドは、SchedSelIdxに割り当てられた配信スケジュールのインデックスを示す。hrd_management_valid_flagの値が0に等しいとき、target_schedule_idxの意味は定義されない。
picture_and_timing_info_present_flag−この1ビットフラグは、「1」に設定されると、90kHz_flagおよび90−kHzシステムクロックへの正確なマッピング用のパラメータがこの記述子に含まれていることを示す。
90kHz_flag−この1ビットフラグは、「1」に設定されると、HEVC時間基準の周波数が90kHzであることを示す。
N,K−HEVCビデオストリーム[[またはHEVC最上位時間サブレイヤ表現]]の場合、HEVC時間基準の周波数は、Rec.ITU−T H.265|ISO/IEC23008−2の付属書類Eにおいて定義されているように、VUIパラメータ内のシンタックス要素vui_time_scaleによって定義される。HEVCのtime_scaleとSTCとの間の関係は、この記述子内のパラメータNおよびKにより、以下のように定義されなければならない。
Figure 2017535184
90kHz_flagが「1」に設定された場合、Nは1に等しく、Kは300に等しい。90kHz_flagが「0」に設定された場合、NおよびKの値は、NおよびKのフィールドのコーディングされた値によって提供される。
注−これにより、たとえば、PTSまたはDTSがPESヘッダ内で符号化されないHEVCアクセスユニット用のデコーダにおいて、PTSおよびDTSのタイムスタンプの計算に必要とされる、90kHz単位までのtime_scaleの単位で表現される時間のマッピングが可能になる。
num_units_in_tick−この32ビットフィールドは、Rec.ITU−T H.265|ISO/IEC23008−2の付属書類EにおけるVUIパラメータ内のvui_num_units_in_tickフィールドとちょうど同じ方法でコーディングされる。このフィールドによって提供される情報は、HEVCタイミングおよびHRD記述子が関連付けられる、HEVCビデオストリーム[[またはHEVC最上位時間サブレイヤ表現]]全体に適用されなければならない。
[0204] 図5は、本開示の技法による、ビデオエンコーダの例示的な動作を示すフローチャートである。本開示のフローチャートは例として提供される。本開示の他の例では、より多い、より少ない、もしくは異なるアクションが存在する場合があり、および/またはアクションは異なる順序で、もしくは並行して実施される場合がある。
[0205] 図5の例では、ビデオエンコーダ20は、シンタックス要素のアレイ(たとえば、bsp_hrd_idx[TargetOlsIdx][TargetPsIdx][HighestTid][SchedSelCombIdx][partitionIdx])と、複数のHRDパラメータシンタックス構造とを含むVPSを生成する(200)。複数のHRDパラメータシンタックス構造(たとえば、hrd_parameters())の各それぞれのHRDパラメータシンタックス構造は、HRDパラメータのそれぞれのセットを備える。シンタックス要素のアレイの各それぞれのシンタックス要素は、複数のHRDパラメータシンタックス構造の中のHRDパラメータシンタックス構造のインデックスを指定する。
[0206] さらに、図5の例では、ビデオエンコーダ20は、配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素(たとえば、target_schedule_idx)を備えるHEVCタイミングおよびHRD記述子を生成する(202)。さらに、ビデオエンコーダ20は、複数のエレメンタリストリームとHEVCタイミングおよびHRD記述子とを備えるデータストリーム(たとえば、MPEG−2データストリーム)を生成する(204)。パラメータのセットは、特定のエレメンタリストリームに適用可能であると識別された特定のHRDパラメータシンタックス構造のインデックスを指定するシンタックス要素のアレイ内のシンタックス要素を識別する。この例では、特定のHRDパラメータシンタックス構造は、複数のHRDパラメータシンタックス構造のうちの1つであり、特定のHRDパラメータシンタックス構造は、動作点の一部である。パラメータのセットは、ターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータ(たとえば、SchedSelCombIdx)を含む場合がある。さらに、いくつかの例では、パラメータのセットは、その値が図7の例に示される方式で決定される第2のパラメータ(たとえば、partitionIdx)を含む。加えて、パラメータのセットは、第3、第4、および第5のパラメータを含む場合がある。第3のパラメータ(たとえば、TargetOlsIdx)は、動作点のターゲット出力レイヤセットインデックスを指定する。第4のパラメータ(たとえば、TargetPsIdx)は、動作点のターゲット区分化方式インデックスを指定し、第5のパラメータ(たとえば、HighestTid)は、動作点の最上位時間識別子を指定する。
[0207] 図6は、本開示の技法による、ビデオデコーダの例示的な動作を示すフローチャートである。図6の例では、ビデオデコーダ30は、複数のエレメンタリストリームとHEVCタイミングおよびHRD記述子とを備えるデータストリーム(たとえば、MPEG−2データストリーム)を取得する(250)。HEVCタイミングおよびHRD記述子は、配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素(たとえば、target_schedule_idx)を備える。
[0208] さらに、図6の例では、ビデオデコーダ30は、パラメータのセットに基づいて、VPS内のシンタックス要素のアレイ(たとえば、bsp_hrd_idx[TargetOlsIdx][TargetPsIdx][HighestTid][SchedSelCombIdx][partitionIdx])内のシンタックス要素を識別する(252)。図6の例では、VPSは、複数のHRDパラメータシンタックス構造(たとえば、hrd_parameters())を含む。複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造は、HRDパラメータのそれぞれのセット(たとえば、nal_hrd_parameters_present_flag、vcl_hrd_parameters_present_flagなど)を備える。シンタックス要素のアレイの各それぞれのシンタックス要素は、複数のHRDパラメータシンタックス構造の中のHRDパラメータシンタックス構造のインデックスを指定する。パラメータのセットは、ターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータ(たとえば、SchedSelCombIdx)を含む場合がある。さらに、いくつかの例では、パラメータのセットは、その値が図7の例に示される方式で決定される第2のパラメータ(たとえば、partitionIdx)を含む。加えて、パラメータのセットは、第3、第4、および第5のパラメータを含む場合がある。第3のパラメータ(たとえば、TargetOlsIdx)は、動作点のターゲット出力レイヤセットインデックスを指定する。第4のパラメータ(たとえば、TargetPsIdx)は、動作点のターゲット区分化方式インデックスを指定し、第5のパラメータ(たとえば、HighestTid)は、動作点の最上位時間識別子を指定する。
[0209] 加えて、図6の例では、ビデオデコーダ30は、識別されたシンタックス要素によって指定されたインデックスに基づいて、複数のHRDパラメータシンタックス構造内の特定のHRDパラメータシンタックス構造を、動作点の一部である特定のエレメンタリストリームに適用可能であると識別する(254)。複数のエレメンタリストリームは、特定のエレメンタリストリームを含む。
[0210] 図7は、本開示の技法による、ビデオコーダがパラメータの値を決定する例示的な動作を示すフローチャートである。図7の例では、ビデオコーダ(たとえば、ビデオエンコーダ20またはビデオデコーダ30)は、0x24、0x27、または0x29に等しいストリームタイプを有しており動作点内にある、複数のエレメンタリストリーム内のエレメンタリストリームのリストを決定する(300)。上記で示されたように、0x24に等しいストリームタイプを有するエレメンタリストリームは、HEVCビデオストリームまたはHEVC時間ビデオサブビットストリームまたはHEVCベースサブパーティションである。0x27に等しいストリームタイプを有するエレメンタリストリームは、ITU−T Rec.H.265|ISO/IEC23008−2の付属書類Gにおいて定義された1つまたは複数のプロファイルに適合するHEVCビデオストリームのTemporalId 0を含むHEVCエンハンスメントサブパーティションである。0x29に等しいストリームタイプを有するエレメンタリストリームは、ITU−T Rec.H.265|ISO/IEC23008−2の付属書類Hにおいて定義された1つまたは複数のプロファイルに適合するHEVCビデオストリームのTemporalId 0を含むHEVCエンハンスメントサブパーティションである。
[0211] 図7の例では、リストは、リスト内のエレメンタリストリーム用の階層レイヤインデックス値に従う昇順である。ビデオコーダがビデオエンコーダであるインスタンスでは、ビデオエンコーダは、データストリームを生成することの一部として、データストリーム内に、複数のエレメンタリストリームのそれぞれのエレメンタリストリームごとに、それぞれのエレメンタリストリーム用の階層レイヤインデックス値(たとえば、hierarchy_layer_index)を備える階層記述子または階層拡張記述子を含めることができる。ビデオコーダがビデオデコーダであるインスタンスでは、ビデオデコーダは、データストリームを取得することの一部として、複数のエレメンタリストリームのそれぞれのエレメンタリストリームごとに、それぞれのエレメンタリストリーム用の階層レイヤインデックス値を備える階層記述子または階層拡張記述子を取得することができる。
[0212] さらに、図7の例では、ビデオコーダは、特定のエレメンタリストリームがリストのメンバであるかどうかを決定することができる(302)。特定のエレメンタリストリームがリストのメンバである場合(302の「はい」)、ビデオコーダは、パラメータの値がリスト内の特定のエレメンタリストリームのインデックスであると決定することができる(304)。特定のエレメンタリストリームがリストのメンバではない場合(302の「いいえ」)、ビデオコーダは、パラメータの値がリスト内のエレメンタリストリームのうちの1つのインデックスであると決定することができる(306)。特定のエレメンタリストリームは、リスト内のエレメンタリストリームの補完時間エンハンスメント(complementary temporal enhancement)である。
[0213] 技法の様々な態様の特定の組合せが上述されたが、これらの組合せは、本開示に記載された技法の例を単に示すために提供される。したがって、本開示の技法は、これらの例示的な組合せに限定されるべきではなく、本開示に記載された技法の様々な態様の任意の想起可能な組合せを包含する場合がある。
[0214] 1つまたは複数の例では、記載された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せに実装される場合がある。ソフトウェアに実装される場合、機能は1つまたは複数の命令またはコードとして、コンピュータ可読媒体上に記憶されるか、またはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行される場合がある。コンピュータ可読媒体は、データ記憶媒体などの有形媒体に対応するコンピュータ可読記憶媒体、または、たとえば、通信プロトコルに従ってある場所から別の場所へのコンピュータプログラムの転送を容易にする任意の媒体を含む通信媒体を含む場合がある。このようにして、コンピュータ可読媒体は、一般に、(1)非一時的である有形コンピュータ可読記憶媒体、または(2)信号もしくは搬送波などの通信媒体に対応する場合がある。データ記憶媒体は、本開示に記載された技法の実装用の命令、コード、および/またはデータ構造を取り出すために、1つもしくは複数のコンピュータまたは1つもしくは複数のプロセッサによってアクセスされ得る、任意の利用可能な媒体であり得る。コンピュータプログラム製品は、コンピュータ可読媒体を含む場合がある。
[0215] 限定ではなく例として、そのようなコンピュータ可読記憶媒体は、RAM、ROM、EEPROM(登録商標)、CD−ROMもしくは他の光ディスクストレージ、磁気ディスクストレージもしくは他の磁気ストレージデバイス、フラッシュメモリ、または、命令もしくはデータ構造の形態の所望のプログラムコードを記憶するために使用することができ、コンピュータによってアクセスすることができる任意の他の媒体を備えることができる。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。たとえば、命令が、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者線(DSL)、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバケーブル、ツイストペア、DSL、または赤外線、無線、およびマイクロ波などのワイヤレス技術は媒体の定義に含まれる。しかしながら、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時的媒体を含まないが、代わりに非一時的有形記憶媒体を対象とすることを理解されたい。本明細書で使用するディスク(disk)およびディスク(disc)は、コンパクトディスク(disc)(CD)、レーザーディスク(登録商標)(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)、およびBlu−rayディスク(disc)を含み、ここで、ディスク(disk)は通常、データを磁気的に再生し、ディスク(disc)は、データをレーザーで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含まれるべきである。
[0216] 命令は、1つまたは複数のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブル論理アレイ(FPGA)、または他の等価な集積回路もしくはディスクリート論理回路などの、1つまたは複数のプロセッサによって実行される場合がある。したがって、本明細書で使用する「プロセッサ」という用語は、上記の構造、または、本明細書に記載された技法の実装に適した任意の他の構造のいずれかを指す場合がある。加えて、いくつかの態様では、本明細書に記載された機能は、符号化および復号のために構成された専用ハードウェアおよび/もしくはソフトウェアモジュール内に設けられるか、または複合コーデックに組み込まれる場合がある。また、本技法は、1つまたは複数の回路または論理要素内で十分に実装される可能性がある。
[0217] 本開示の技法は、ワイヤレスハンドセット、集積回路(IC)またはICのセット(たとえば、チップセット)を含む、多種多様なデバイスまたは装置に実装される場合がある。様々な構成要素、モジュール、またはユニットは、開示された技法を実施するように構成されたデバイスの機能的態様を強調するように本開示において記載されているが、様々なハードウェアユニットによる実現を必ずしも必要としない。むしろ、上述されたように、様々なユニットは、適切なソフトウェアおよび/またはファームウェアとともに、上述された1つまたは複数のプロセッサを含む、コーデックハードウェアユニットにおいて組み合わせられるか、または相互動作可能なハードウェアユニットの集合によって提供される場合がある。
[0218] 様々な例が記載された。これらおよび他の例は以下の特許請求の範囲内にある。
[0218] 様々な例が記載された。これらおよび他の例は以下の特許請求の範囲内にある。
以下に本願の出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
ビデオデータを処理する方法であって、
複数のエレメンタリストリームと高効率ビデオコーディング(HEVC)タイミングおよび仮想参照デコーダ(HRD)記述子とを備えるデータストリームを取得することと、ここにおいて、前記HEVCタイミングおよびHRD記述子が、配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備える、
パラメータのセットに基づいて、ビデオパラメータセット(VPS)内のシンタックス要素のアレイ内のシンタックス要素を識別することと、ここにおいて、
前記VPSが複数のHRDパラメータシンタックス構造を備え、ここにおいて、前記複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造が、HRDパラメータのそれぞれのセットを備える、
シンタックス要素の前記アレイの各それぞれのシンタックス要素が、前記複数のHRDパラメータシンタックス構造の中のHRDパラメータシンタックス構造のインデックスを指定する、
パラメータの前記セットが、前記ターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える、
前記識別されたシンタックス要素によって指定されたインデックスに基づいて、前記複数のHRDパラメータシンタックス構造内の特定のHRDパラメータシンタックス構造を、動作点の一部である特定のエレメンタリストリームに適用可能であると識別することとを備え、前記複数のエレメンタリストリームが前記特定のエレメンタリストリームを含む、方法。
[C2]
前記パラメータが第1のパラメータであり、パラメータの前記セットが第2のパラメータを含み、前記データストリームを受信することが、前記複数のエレメンタリストリームのそれぞれのエレメンタリストリームごとに、前記それぞれのエレメンタリストリーム用の階層レイヤインデックス値を備える階層記述子または階層拡張記述子を受信することを備え、
前記方法が、
0x24、0x27、または0x29に等しいストリームタイプを有しており前記動作点内にある、前記複数のエレメンタリストリーム内のエレメンタリストリームのリストを決定することと、前記リストが、前記リスト内の前記エレメンタリストリーム用の前記階層レイヤインデックス値に従う昇順である、
前記特定のエレメンタリストリームが前記リストのメンバである場合、前記第2のパラメータの値が前記リスト内の前記特定のエレメンタリストリームの前記インデックスであり、
前記特定のエレメンタリストリームが前記リストのメンバではない場合、前記第2のパラメータの前記値が前記リスト内の前記エレメンタリストリームのうちの1つの前記インデックスである
ように、前記第2のパラメータの前記値を決定することと
を備え、ここにおいて、前記特定のエレメンタリストリームが前記リスト内の前記エレメンタリストリームの補完時間エンハンスメントである、C1に記載の方法。
[C3]
パラメータの前記セットが第3、第4、および第5のパラメータを含み、前記第3のパラメータが動作点のターゲット出力レイヤセットインデックスを指定し、前記第4のパラメータが前記動作点のターゲット区分化方式インデックスを指定し、前記第5のパラメータが前記動作点の最上位時間識別子を指定する、C2に記載の方法。
[C4]
前記データストリームは、プログラムストリームまたはトランスポートストリームであり、前記複数のエレメンタリストリームの各々が2つ以上のレイヤを含まないという制約に従う、C1に記載の方法。
[C5]
前記データストリームは、プログラムストリームまたはトランスポートストリームであり、前記HEVCタイミングおよびHRD記述子のhrd_management_valid_flagが1に等しい場合、HEVC動作記述子内でシグナリングされる各動作点に適用可能なバッファリング期間補足エンハンスメント情報(SEI)メッセージおよびピクチャタイミングSEIメッセージがHEVCビデオストリーム内に存在しなければならないという制約に従う、C1に記載の方法。
[C6]
前記HEVCタイミングおよびHRD記述子がプログラムレベルの記述子であり、ここにおいて、前記データストリーム内に多くて1つのHEVCタイミングおよびHRD記述子が存在することが必要とされる、C1に記載の方法。
[C7]
前記データストリームが、モーションピクチャエキスパートグループ(MPEG)−2データストリームである、C1に記載の方法。
[C8]
ビデオデータを処理する方法であって、
シンタックス要素のアレイと複数の仮想参照デコーダ(HRD)パラメータシンタックス構造とを含むビデオパラメータセット(VPS)を生成することと、ここにおいて、
前記複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造が、HRDパラメータのそれぞれのセットを備える、
シンタックス要素の前記アレイの各それぞれのシンタックス要素が、前記複数のHRDパラメータシンタックス構造の中のHRDパラメータシンタックス構造のインデックスを指定する、
配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備える高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子を生成することと、
複数のエレメンタリストリームと前記高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子とを備えるデータストリームを生成することと
を備え、
パラメータのセットが、特定のエレメンタリストリームに適用可能な特定のHRDパラメータシンタックス構造のインデックスを指定するシンタックス要素の前記アレイ内のシンタックス要素を識別し、前記特定のHRDパラメータシンタックス構造が前記複数のHRDパラメータシンタックス構造のうちの1つであり、前記特定のHRDパラメータシンタックス構造が動作点の一部であり、パラメータの前記セットが前記ターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える、方法。
[C9]
前記パラメータが第1のパラメータであり、パラメータの前記セットが第2のパラメータを含み、前記データストリームを生成することが、前記データストリーム内に、前記複数のエレメンタリストリームのそれぞれのエレメンタリストリームごとに、前記それぞれのエレメンタリストリーム用の階層レイヤインデックス値を備える階層記述子または階層拡張記述子を含めることを備え、
前記方法が、
0x24、0x27、または0x29に等しいストリームタイプを有しており前記動作点内にある、前記複数のエレメンタリストリーム内のエレメンタリストリームのリストを決定することと、前記リストが、前記リスト内の前記エレメンタリストリーム用の前記階層レイヤインデックス値に従う昇順である、
前記特定のエレメンタリストリームが前記リストのメンバである場合、前記第2のパラメータの値が前記リスト内の前記特定のエレメンタリストリームの前記インデックスであり、
前記特定のエレメンタリストリームが前記リストのメンバではない場合、前記第2のパラメータの前記値が前記リスト内の前記エレメンタリストリームの前記インデックスである
ように、前記第2のパラメータの前記値を決定することと
をさらに備え、前記特定のエレメンタリストリームが前記リスト内の前記エレメンタリストリームの補完時間エンハンスメントである、C8に記載の方法。
[C10]
パラメータの前記セットが第3、第4、および第5のパラメータを含み、前記第3のパラメータが動作点のターゲット出力レイヤセットインデックスを指定し、前記第4のパラメータが前記動作点のターゲット区分化方式インデックスを指定し、前記第5のパラメータが前記動作点の最上位時間識別子を指定する、C9に記載の方法。
[C11]
前記データストリームは、前記複数のエレメンタリストリームの各々が2つ以上のレイヤを含まないという制約に従う、C8に記載の方法。
[C12]
前記データストリームは、前記HEVCタイミングおよびHRD記述子のhrd_management_valid_flagが1に等しい場合、HEVC動作記述子内でシグナリングされる各動作点に適用可能なバッファリング期間補足エンハンスメント情報(SEI)メッセージおよびピクチャタイミングSEIメッセージがHEVCビデオストリーム内に存在しなければならないという制約に従う、C8に記載の方法。
[C13]
前記HEVCタイミングおよびHRD記述子がプログラムレベルの記述子であり、ここにおいて、前記データストリーム内に多くて1つのHEVCタイミングおよびHRD記述子が存在することが必要とされる、C8に記載の方法。
[C14]
前記データストリームが、モーションピクチャエキスパートグループ(MPEG)−2データストリームである、C8に記載の方法。
[C15]
ビデオデータを処理するためのデバイスであって、
前記ビデオデータを記憶するように構成されたメモリと、
1つまたは複数のプロセッサとを備え、前記1つまたは複数のプロセッサが、
複数のエレメンタリストリームと高効率ビデオコーディング(HEVC)タイミングおよび仮想参照デコーダ(HRD)記述子とを備えるデータストリームを取得することと、ここにおいて、前記HEVCタイミングおよびHRD記述子が、配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備え、前記エレメンタリストリームが前記ビデオデータの符号化表現を備える、
パラメータのセットに基づいて、ビデオパラメータセット(VPS)内のシンタックス要素のアレイ内のシンタックス要素を識別することと、ここにおいて、
前記VPSが複数のHRDパラメータシンタックス構造を備え、ここにおいて、前記複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造が、HRDパラメータのそれぞれのセットを備える、
シンタックス要素の前記アレイの各それぞれのシンタックス要素が、前記複数のHRDパラメータシンタックス構造の中のHRDパラメータシンタックス構造のインデックスを指定する、
パラメータの前記セットが、前記ターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える、
前記識別されたシンタックス要素によって指定されたインデックスに基づいて、前記複数のHRDパラメータシンタックス構造内の特定のHRDパラメータシンタックス構造を、動作点の一部である特定のエレメンタリストリームに適用可能であると識別することと
を行うように構成され、前記複数のエレメンタリストリームが前記特定のエレメンタリストリームを含む、デバイス。
[C16]
前記パラメータが第1のパラメータであり、パラメータの前記セットが第2のパラメータを含み、前記データストリームを取得することが、前記複数のエレメンタリストリームのそれぞれのエレメンタリストリームごとに、前記それぞれのエレメンタリストリーム用の階層レイヤインデックス値を備える階層記述子または階層拡張記述子を取得することを備え、
前記1つまたは複数のプロセッサが、
0x24、0x27、または0x29に等しいストリームタイプを有しており前記動作点内にある、前記複数のエレメンタリストリーム内のエレメンタリストリームのリストを決定することと、前記リストが、前記リスト内の前記エレメンタリストリーム用の前記階層レイヤインデックス値に従う昇順である、
前記特定のエレメンタリストリームが前記リストのメンバである場合、前記第2のパラメータの値が前記リスト内の前記特定のエレメンタリストリームの前記インデックスであり、
前記特定のエレメンタリストリームが前記リストのメンバではない場合、前記第2のパラメータの前記値が前記リスト内の前記エレメンタリストリームのうちの1つの前記インデックスである
ように、前記第2のパラメータの前記値を決定することと
を行うようにさらに構成され、前記特定のエレメンタリストリームが前記リスト内の前記エレメンタリストリームの補完時間エンハンスメントである、C15に記載のデバイス。
[C17]
パラメータの前記セットが第3、第4、および第5のパラメータを含み、前記第3のパラメータが動作点のターゲット出力レイヤセットインデックスを指定し、前記第4のパラメータが前記動作点のターゲット区分化方式インデックスを指定し、前記第5のパラメータが前記動作点の最上位時間識別子を指定する、C16に記載のデバイス。
[C18]
前記データストリームは、プログラムストリームまたはトランスポートストリームであり、前記複数のエレメンタリストリームの各々が2つ以上のレイヤを含まないという制約に従う、C15に記載のデバイス。
[C19]
前記データストリームは、プログラムストリームまたはトランスポートストリームであり、前記HEVCタイミングおよびHRD記述子のhrd_management_valid_flagが1に等しい場合、HEVC動作記述子内でシグナリングされる各動作点に適用可能なバッファリング期間補足エンハンスメント情報(SEI)メッセージおよびピクチャタイミングSEIメッセージがHEVCビデオストリーム内に存在しなければならないという制約に従う、C15に記載のデバイス。
[C20]
前記HEVCタイミングおよびHRD記述子がプログラムレベルの記述子であり、ここにおいて、前記データストリーム内に多くて1つのHEVCタイミングおよびHRD記述子が存在することが必要とされる、C15に記載のデバイス。
[C21]
前記データストリームが、モーションピクチャエキスパートグループ(MPEG)−2データストリームである、C15に記載のデバイス。
[C22]
ビデオデータを処理するためのデバイスであって、
前記ビデオデータを記憶するように構成されたメモリと、
1つまたは複数のプロセッサとを備え、前記1つまたは複数のプロセッサが、
シンタックス要素のアレイと複数の仮想参照デコーダ(HRD)パラメータシンタックス構造とを含むビデオパラメータセット(VPS)を生成することと、ここにおいて、
前記複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造が、HRDパラメータのそれぞれのセットを備える、
シンタックス要素の前記アレイの各それぞれのシンタックス要素が、前記複数のHRDパラメータシンタックス構造の中のHRDパラメータシンタックス構造のインデックスを指定する、
配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備える高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子を生成することと、
複数のエレメンタリストリームと前記高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子とを備えるデータストリームを生成することと
を行うように構成され、
パラメータのセットが、特定のエレメンタリストリームに適用可能な特定のHRDパラメータシンタックス構造のインデックスを指定するシンタックス要素の前記アレイ内のシンタックス要素を識別し、前記特定のHRDパラメータシンタックス構造が前記複数のHRDパラメータシンタックス構造のうちの1つであり、前記特定のHRDパラメータシンタックス構造が動作点の一部であり、パラメータの前記セットが前記ターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える、デバイス。
[C23]
前記パラメータが第1のパラメータであり、パラメータの前記セットが第2のパラメータを含み、前記1つまたは複数のプロセッサが、
前記データストリーム内に、前記複数のエレメンタリストリームのそれぞれのエレメンタリストリームごとに、前記それぞれのエレメンタリストリーム用の階層レイヤインデックス値を備える階層記述子または階層拡張記述子を含めることと、
0x24、0x27、または0x29に等しいストリームタイプを有しており前記動作点内にある、前記複数のエレメンタリストリーム内のエレメンタリストリームのリストを決定することと、前記リストが、前記リスト内の前記エレメンタリストリーム用の前記階層レイヤインデックス値に従う昇順である、
前記特定のエレメンタリストリームが前記リストのメンバである場合、前記第2のパラメータの値が前記リスト内の前記特定のエレメンタリストリームの前記インデックスであり、
前記特定のエレメンタリストリームが前記リストのメンバではない場合、前記第2のパラメータの前記値が前記リスト内の前記エレメンタリストリームのうちの1つの前記インデックスである
ように、前記第2のパラメータの前記値を決定することと
を行うように構成され、前記特定のエレメンタリストリームが前記リスト内の前記エレメンタリストリームの補完時間エンハンスメントである、C22に記載のデバイス。
[C24]
パラメータの前記セットが第3、第4、および第5のパラメータを含み、前記第3のパラメータが動作点のターゲット出力レイヤセットインデックスを指定し、前記第4のパラメータが前記動作点のターゲット区分化方式インデックスを指定し、前記第5のパラメータが前記動作点の最上位時間識別子を指定する、C23に記載のデバイス。
[C25]
前記データストリームは、前記複数のエレメンタリストリームの各々が2つ以上のレイヤを含まないという制約に従う、C22に記載のデバイス。
[C26]
前記データストリームは、前記HEVCタイミングおよびHRD記述子のhrd_management_valid_flagが1に等しい場合、HEVC動作記述子内でシグナリングされる各動作点に適用可能なバッファリング期間補足エンハンスメント情報(SEI)メッセージおよびピクチャタイミングSEIメッセージがHEVCビデオストリーム内に存在しなければならないという制約に従う、C22に記載のデバイス。
[C27]
前記HEVCタイミングおよびHRD記述子がプログラムレベルの記述子であり、ここにおいて、前記データストリーム内に多くて1つのHEVCタイミングおよびHRD記述子が存在することが必要とされる、C22に記載のデバイス。
[C28]
前記データストリームが、モーションピクチャエキスパートグループ(MPEG)−2データストリームである、C22に記載のデバイス。
[C29]
ビデオデータを処理するためのデバイスであって、
複数のエレメンタリストリームと高効率ビデオコーディング(HEVC)タイミングおよび仮想参照デコーダ(HRD)記述子とを備えるデータストリームを取得するための手段と、ここにおいて、前記HEVCタイミングおよびHRD記述子が、配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備える、
パラメータのセットに基づいて、ビデオパラメータセット(VPS)内のシンタックス要素のアレイ内のシンタックス要素を識別するための手段と、ここにおいて、
前記VPSが複数のHRDパラメータシンタックス構造を備え、ここにおいて、前記複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造が、HRDパラメータのそれぞれのセットを備える、
シンタックス要素の前記アレイの各それぞれのシンタックス要素が、前記複数のHRDパラメータシンタックス構造の中のHRDパラメータシンタックス構造のインデックスを指定する、
パラメータの前記セットが、前記ターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える、
前記識別されたシンタックス要素によって指定されたインデックスに基づいて、前記複数のHRDパラメータシンタックス構造内の特定のHRDパラメータシンタックス構造を、動作点の一部である特定のエレメンタリストリームに適用可能であると識別するための手段と
を備え、前記複数のエレメンタリストリームが前記特定のエレメンタリストリームを含む、デバイス。
[C30]
前記パラメータが第1のパラメータであり、パラメータの前記セットが第2のパラメータを含み、前記データストリームが、前記複数のエレメンタリストリームのそれぞれのエレメンタリストリームごとに、前記それぞれのエレメンタリストリーム用の階層レイヤインデックス値を備える階層記述子または階層拡張記述子を備え、
前記デバイスが、
0x24、0x27、または0x29に等しいストリームタイプを有しており前記動作点内にある、前記複数のエレメンタリストリーム内のエレメンタリストリームのリストを決定するための手段と、前記リストが、前記リスト内の前記エレメンタリストリーム用の前記階層レイヤインデックス値に従う昇順である、
前記特定のエレメンタリストリームが前記リストのメンバである場合、前記第2のパラメータの値が前記リスト内の前記特定のエレメンタリストリームの前記インデックスであり、
前記特定のエレメンタリストリームが前記リストのメンバではない場合、前記第2のパラメータの前記値が前記リスト内の前記エレメンタリストリームのうちの1つの前記インデックスである
ように、前記第2のパラメータの前記値を決定するための手段と
をさらに備え、前記特定のエレメンタリストリームが前記リスト内の前記エレメンタリストリームの補完時間エンハンスメントである、C29に記載のデバイス。
[C31]
パラメータの前記セットが第3、第4、および第5のパラメータを含み、前記第3のパラメータが動作点のターゲット出力レイヤセットインデックスを指定し、前記第4のパラメータが前記動作点のターゲット区分化方式インデックスを指定し、前記第5のパラメータが前記動作点の最上位時間識別子を指定する、C30に記載のデバイス。
[C32]
前記データストリームは、プログラムストリームまたはトランスポートストリームであり、前記複数のエレメンタリストリームの各々が2つ以上のレイヤを含まないという制約に従う、C29に記載のデバイス。
[C33]
前記データストリームは、プログラムストリームまたはトランスポートストリームであり、前記HEVCタイミングおよびHRD記述子のhrd_management_valid_flagが1に等しい場合、HEVC動作記述子内でシグナリングされる各動作点に適用可能なバッファリング期間補足エンハンスメント情報(SEI)メッセージおよびピクチャタイミングSEIメッセージがHEVCビデオストリーム内に存在しなければならないという制約に従う、C29に記載のデバイス。
[C34]
前記HEVCタイミングおよびHRD記述子がプログラムレベルの記述子であり、ここにおいて、前記データストリーム内に多くて1つのHEVCタイミングおよびHRD記述子が存在することが必要とされる、C29に記載のデバイス。
[C35]
ビデオデータを処理するためのデバイスであって、
シンタックス要素のアレイと複数の仮想参照デコーダ(HRD)パラメータシンタックス構造とを含むビデオパラメータセット(VPS)を生成するための手段と、ここにおいて、
前記複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造が、HRDパラメータのそれぞれのセットを備える、
シンタックス要素の前記アレイの各それぞれのシンタックス要素が、前記複数のHRDパラメータシンタックス構造の中のHRDパラメータシンタックス構造のインデックスを指定する、
配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備える高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子を生成するための手段と、
複数のエレメンタリストリームと前記高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子とを備えるデータストリームを生成するための手段とを備え、
パラメータのセットが、特定のエレメンタリストリームに適用可能な特定のHRDパラメータシンタックス構造のインデックスを指定するシンタックス要素の前記アレイ内のシンタックス要素を識別し、前記特定のHRDパラメータシンタックス構造が前記複数のHRDパラメータシンタックス構造のうちの1つであり、前記特定のHRDパラメータシンタックス構造が動作点の一部であり、パラメータの前記セットが前記ターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える、デバイス。
[C36]
前記パラメータが第1のパラメータであり、パラメータの前記セットが第2のパラメータを含み、前記データストリームが、前記複数のエレメンタリストリームのそれぞれのエレメンタリストリームごとに、前記それぞれのエレメンタリストリーム用の階層レイヤインデックス値を備える階層記述子または階層拡張記述子を備え、
前記デバイスが、
0x24、0x27、または0x29に等しいストリームタイプを有しており前記動作点内にある、前記複数のエレメンタリストリーム内のエレメンタリストリームのリストを決定するための手段と、前記リストが、前記リスト内の前記エレメンタリストリーム用の前記階層レイヤインデックス値に従う昇順である、
前記特定のエレメンタリストリームが前記リストのメンバである場合、前記第2のパラメータの値が前記リスト内の前記特定のエレメンタリストリームの前記インデックスであり、
前記特定のエレメンタリストリームが前記リストのメンバではない場合、前記第2のパラメータの前記値が前記リスト内の前記エレメンタリストリームのうちの1つの前記インデックスである
ように、前記第2のパラメータの前記値を決定するための手段と
をさらに備え、前記特定のエレメンタリストリームが前記リスト内の前記エレメンタリストリームの補完時間エンハンスメントである、C35に記載のデバイス。
[C37]
パラメータの前記セットが第3、第4、および第5のパラメータを含み、前記第3のパラメータが動作点のターゲット出力レイヤセットインデックスを指定し、前記第4のパラメータが前記動作点のターゲット区分化方式インデックスを指定し、前記第5のパラメータが前記動作点の最上位時間識別子を指定する、C36に記載のデバイス。
[C38]
前記データストリームは、前記複数のエレメンタリストリームの各々が2つ以上のレイヤを含まないという制約に従う、C35に記載のデバイス。
[C39]
前記データストリームは、前記HEVCタイミングおよびHRD記述子のhrd_management_valid_flagが1に等しい場合、HEVC動作記述子内でシグナリングされる各動作点に適用可能なバッファリング期間補足エンハンスメント情報(SEI)メッセージおよびピクチャタイミングSEIメッセージがHEVCビデオストリーム内に存在しなければならないという制約に従う、C35に記載のデバイス。
[C40]
前記HEVCタイミングおよびHRD記述子がプログラムレベルの記述子であり、ここにおいて、前記データストリーム内に多くて1つのHEVCタイミングおよびHRD記述子が存在することが必要とされる、C35に記載のデバイス。
[C41]
前記データストリームが、モーションピクチャエキスパートグループ(MPEG)−2データストリームである、C35に記載のデバイス。
[C42]
命令を記憶したコンピュータ可読記憶媒体であって、前記命令が、実行されると、
複数のエレメンタリストリームと高効率ビデオコーディング(HEVC)タイミングおよび仮想参照デコーダ(HRD)記述子とを備えるデータストリームを取得することと、ここにおいて、前記HEVCタイミングおよびHRD記述子が、配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備える、
パラメータのセットに基づいて、ビデオパラメータセット(VPS)内のシンタックス要素のアレイ内のシンタックス要素を識別することと、ここにおいて、
前記VPSが複数のHRDパラメータシンタックス構造を備え、ここにおいて、前記複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造が、HRDパラメータのそれぞれのセットを備える、
シンタックス要素の前記アレイの各それぞれのシンタックス要素が、前記複数のHRDパラメータシンタックス構造の中のHRDパラメータシンタックス構造のインデックスを指定する、
パラメータの前記セットが、前記ターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える、
前記識別されたシンタックス要素によって指定されたインデックスに基づいて、前記複数のHRDパラメータシンタックス構造内の特定のHRDパラメータシンタックス構造を、動作点の一部である特定のエレメンタリストリームに適用可能であると識別することとをデバイスの1つまたは複数のプロセッサに行わせ、前記複数のエレメンタリストリームが前記特定のエレメンタリストリームを含む、コンピュータ可読記憶媒体。
[C43]
前記パラメータが第1のパラメータであり、パラメータの前記セットが第2のパラメータを含み、前記データストリームが、前記複数のエレメンタリストリームのそれぞれのエレメンタリストリームごとに、前記それぞれのエレメンタリストリーム用の階層レイヤインデックス値を備える階層記述子または階層拡張記述子を備え、
前記命令が、
0x24、0x27、または0x29に等しいストリームタイプを有しており前記動作点内にある、前記複数のエレメンタリストリーム内のエレメンタリストリームのリストを決定することと、前記リストが、前記リスト内の前記エレメンタリストリーム用の前記階層レイヤインデックス値に従う昇順である、
前記特定のエレメンタリストリームが前記リストのメンバである場合、前記第2のパラメータの値が前記リスト内の前記特定のエレメンタリストリームの前記インデックスであり、
前記特定のエレメンタリストリームが前記リストのメンバではない場合、前記第2のパラメータの前記値が前記リスト内の前記エレメンタリストリームのうちの1つの前記インデックスである
ように、前記第2のパラメータの前記値を決定することと
を行うように前記1つまたは複数のプロセッサをさらに構成し、
前記特定のエレメンタリストリームが前記リスト内の前記エレメンタリストリームの補完時間エンハンスメントである、C42に記載のコンピュータ可読記憶媒体。
[C44]
パラメータの前記セットが第3、第4、および第5のパラメータを含み、前記第3のパラメータが動作点のターゲット出力レイヤセットインデックスを指定し、前記第4のパラメータが前記動作点のターゲット区分化方式インデックスを指定し、前記第5のパラメータが前記動作点の最上位時間識別子を指定する、C43に記載のコンピュータ可読記憶媒体。
[C45]
前記データストリームは、プログラムストリームまたはトランスポートストリームであり、前記複数のエレメンタリストリームの各々が2つ以上のレイヤを含まないという制約に従う、C42に記載のコンピュータ可読記憶媒体。
[C46]
前記データストリームは、プログラムストリームまたはトランスポートストリームであり、前記HEVCタイミングおよびHRD記述子のhrd_management_valid_flagが1に等しい場合、HEVC動作記述子内でシグナリングされる各動作点に適用可能なバッファリング期間補足エンハンスメント情報(SEI)メッセージおよびピクチャタイミングSEIメッセージがHEVCビデオストリーム内に存在しなければならないという制約に従う、C42に記載のコンピュータ可読記憶媒体。
[C47]
前記HEVCタイミングおよびHRD記述子がプログラムレベルの記述子であり、ここにおいて、前記データストリーム内に多くて1つのHEVCタイミングおよびHRD記述子が存在することが必要とされる、C42に記載のコンピュータ可読記憶媒体。
[C48]
前記データストリームが、モーションピクチャエキスパートグループ(MPEG)−2データストリームである、C42に記載のコンピュータ可読記憶媒体。
[C49]
命令を記憶したコンピュータ可読記憶媒体であって、前記命令が、実行されると、
シンタックス要素のアレイと複数の仮想参照デコーダ(HRD)パラメータシンタックス構造とを含むビデオパラメータセット(VPS)を生成することと、ここにおいて、
前記複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造が、HRDパラメータのそれぞれのセットを備える、
シンタックス要素の前記アレイの各それぞれのシンタックス要素が、前記複数のHRDパラメータシンタックス構造の中のHRDパラメータシンタックス構造のインデックスを指定する、
配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備える高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子を生成することと、
複数のエレメンタリストリームと前記高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子とを備えるデータストリームを生成することと
をデバイスの1つまたは複数のプロセッサに行わせ、
パラメータのセットが、特定のエレメンタリストリームに適用可能な特定のHRDパラメータシンタックス構造のインデックスを指定するシンタックス要素の前記アレイ内のシンタックス要素を識別し、前記特定のHRDパラメータシンタックス構造が前記複数のHRDパラメータシンタックス構造のうちの1つであり、前記特定のHRDパラメータシンタックス構造が動作点の一部であり、パラメータの前記セットが前記ターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える、コンピュータ可読記憶媒体。
[C50]
前記パラメータが第1のパラメータであり、パラメータの前記セットが第2のパラメータを含み、前記データストリームが、前記複数のエレメンタリストリームのそれぞれのエレメンタリストリームごとに、前記それぞれのエレメンタリストリーム用の階層レイヤインデックス値を備える階層記述子または階層拡張記述子を備え、
前記命令が、
0x24、0x27、または0x29に等しいストリームタイプを有しており前記動作点内にある、前記複数のエレメンタリストリーム内のエレメンタリストリームのリストを決定することと、前記リストが、前記リスト内の前記エレメンタリストリーム用の前記階層レイヤインデックス値に従う昇順である、
前記特定のエレメンタリストリームが前記リストのメンバである場合、前記第2のパラメータの値が前記リスト内の前記特定のエレメンタリストリームの前記インデックスであり、
前記特定のエレメンタリストリームが前記リストのメンバではない場合、前記第2のパラメータの前記値が前記リスト内の前記エレメンタリストリームのうちの1つの前記インデックスである
ように、前記第2のパラメータの前記値を決定することと
を行うように前記1つまたは複数のプロセッサをさらに構成し、
前記特定のエレメンタリストリームが前記リスト内の前記エレメンタリストリームの補完時間エンハンスメントである、C49に記載のコンピュータ可読記憶媒体。
[C51]
パラメータの前記セットが第3、第4、および第5のパラメータを含み、前記第3のパラメータが動作点のターゲット出力レイヤセットインデックスを指定し、前記第4のパラメータが前記動作点のターゲット区分化方式インデックスを指定し、前記第5のパラメータが前記動作点の最上位時間識別子を指定する、C50に記載のコンピュータ可読記憶媒体。
[C52]
前記データストリームは、前記複数のエレメンタリストリームの各々が2つ以上のレイヤを含まないという制約に従う、C49に記載のコンピュータ可読記憶媒体。
[C53]
前記データストリームは、前記HEVCタイミングおよびHRD記述子のhrd_management_valid_flagが1に等しい場合、HEVC動作記述子内でシグナリングされる各動作点に適用可能なバッファリング期間補足エンハンスメント情報(SEI)メッセージおよびピクチャタイミングSEIメッセージがHEVCビデオストリーム内に存在しなければならないという制約に従う、C49に記載のコンピュータ可読記憶媒体。
[C54]
前記HEVCタイミングおよびHRD記述子がプログラムレベルの記述子であり、ここにおいて、前記データストリーム内に多くて1つのHEVCタイミングおよびHRD記述子が存在することが必要とされる、C49に記載のコンピュータ可読記憶媒体。
[C55]
前記データストリームが、モーションピクチャエキスパートグループ(MPEG)−2データストリームである、C49に記載のコンピュータ可読記憶媒体。

Claims (55)

  1. ビデオデータを処理する方法であって、
    複数のエレメンタリストリームと高効率ビデオコーディング(HEVC)タイミングおよび仮想参照デコーダ(HRD)記述子とを備えるデータストリームを取得することと、ここにおいて、前記HEVCタイミングおよびHRD記述子が、配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備える、
    パラメータのセットに基づいて、ビデオパラメータセット(VPS)内のシンタックス要素のアレイ内のシンタックス要素を識別することと、ここにおいて、
    前記VPSが複数のHRDパラメータシンタックス構造を備え、ここにおいて、前記複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造が、HRDパラメータのそれぞれのセットを備える、
    シンタックス要素の前記アレイの各それぞれのシンタックス要素が、前記複数のHRDパラメータシンタックス構造の中のHRDパラメータシンタックス構造のインデックスを指定する、
    パラメータの前記セットが、前記ターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える、
    前記識別されたシンタックス要素によって指定されたインデックスに基づいて、前記複数のHRDパラメータシンタックス構造内の特定のHRDパラメータシンタックス構造を、動作点の一部である特定のエレメンタリストリームに適用可能であると識別することと
    を備え、前記複数のエレメンタリストリームが前記特定のエレメンタリストリームを含む、方法。
  2. 前記パラメータが第1のパラメータであり、パラメータの前記セットが第2のパラメータを含み、前記データストリームを受信することが、前記複数のエレメンタリストリームのそれぞれのエレメンタリストリームごとに、前記それぞれのエレメンタリストリーム用の階層レイヤインデックス値を備える階層記述子または階層拡張記述子を受信することを備え、
    前記方法が、
    0x24、0x27、または0x29に等しいストリームタイプを有しており前記動作点内にある、前記複数のエレメンタリストリーム内のエレメンタリストリームのリストを決定することと、前記リストが、前記リスト内の前記エレメンタリストリーム用の前記階層レイヤインデックス値に従う昇順である、
    前記特定のエレメンタリストリームが前記リストのメンバである場合、前記第2のパラメータの値が前記リスト内の前記特定のエレメンタリストリームの前記インデックスであり、
    前記特定のエレメンタリストリームが前記リストのメンバではない場合、前記第2のパラメータの前記値が前記リスト内の前記エレメンタリストリームのうちの1つの前記インデックスである
    ように、前記第2のパラメータの前記値を決定することと
    を備え、ここにおいて、前記特定のエレメンタリストリームが前記リスト内の前記エレメンタリストリームの補完時間エンハンスメントである、請求項1に記載の方法。
  3. パラメータの前記セットが第3、第4、および第5のパラメータを含み、前記第3のパラメータが動作点のターゲット出力レイヤセットインデックスを指定し、前記第4のパラメータが前記動作点のターゲット区分化方式インデックスを指定し、前記第5のパラメータが前記動作点の最上位時間識別子を指定する、請求項2に記載の方法。
  4. 前記データストリームは、プログラムストリームまたはトランスポートストリームであり、前記複数のエレメンタリストリームの各々が2つ以上のレイヤを含まないという制約に従う、請求項1に記載の方法。
  5. 前記データストリームは、プログラムストリームまたはトランスポートストリームであり、前記HEVCタイミングおよびHRD記述子のhrd_management_valid_flagが1に等しい場合、HEVC動作記述子内でシグナリングされる各動作点に適用可能なバッファリング期間補足エンハンスメント情報(SEI)メッセージおよびピクチャタイミングSEIメッセージがHEVCビデオストリーム内に存在しなければならないという制約に従う、請求項1に記載の方法。
  6. 前記HEVCタイミングおよびHRD記述子がプログラムレベルの記述子であり、ここにおいて、前記データストリーム内に多くて1つのHEVCタイミングおよびHRD記述子が存在することが必要とされる、請求項1に記載の方法。
  7. 前記データストリームが、モーションピクチャエキスパートグループ(MPEG)−2データストリームである、請求項1に記載の方法。
  8. ビデオデータを処理する方法であって、
    シンタックス要素のアレイと複数の仮想参照デコーダ(HRD)パラメータシンタックス構造とを含むビデオパラメータセット(VPS)を生成することと、ここにおいて、
    前記複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造が、HRDパラメータのそれぞれのセットを備える、
    シンタックス要素の前記アレイの各それぞれのシンタックス要素が、前記複数のHRDパラメータシンタックス構造の中のHRDパラメータシンタックス構造のインデックスを指定する、
    配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備える高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子を生成することと、
    複数のエレメンタリストリームと前記高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子とを備えるデータストリームを生成することと
    を備え、
    パラメータのセットが、特定のエレメンタリストリームに適用可能な特定のHRDパラメータシンタックス構造のインデックスを指定するシンタックス要素の前記アレイ内のシンタックス要素を識別し、前記特定のHRDパラメータシンタックス構造が前記複数のHRDパラメータシンタックス構造のうちの1つであり、前記特定のHRDパラメータシンタックス構造が動作点の一部であり、パラメータの前記セットが前記ターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える、方法。
  9. 前記パラメータが第1のパラメータであり、パラメータの前記セットが第2のパラメータを含み、前記データストリームを生成することが、前記データストリーム内に、前記複数のエレメンタリストリームのそれぞれのエレメンタリストリームごとに、前記それぞれのエレメンタリストリーム用の階層レイヤインデックス値を備える階層記述子または階層拡張記述子を含めることを備え、
    前記方法が、
    0x24、0x27、または0x29に等しいストリームタイプを有しており前記動作点内にある、前記複数のエレメンタリストリーム内のエレメンタリストリームのリストを決定することと、前記リストが、前記リスト内の前記エレメンタリストリーム用の前記階層レイヤインデックス値に従う昇順である、
    前記特定のエレメンタリストリームが前記リストのメンバである場合、前記第2のパラメータの値が前記リスト内の前記特定のエレメンタリストリームの前記インデックスであり、
    前記特定のエレメンタリストリームが前記リストのメンバではない場合、前記第2のパラメータの前記値が前記リスト内の前記エレメンタリストリームの前記インデックスである
    ように、前記第2のパラメータの前記値を決定することと
    をさらに備え、前記特定のエレメンタリストリームが前記リスト内の前記エレメンタリストリームの補完時間エンハンスメントである、請求項8に記載の方法。
  10. パラメータの前記セットが第3、第4、および第5のパラメータを含み、前記第3のパラメータが動作点のターゲット出力レイヤセットインデックスを指定し、前記第4のパラメータが前記動作点のターゲット区分化方式インデックスを指定し、前記第5のパラメータが前記動作点の最上位時間識別子を指定する、請求項9に記載の方法。
  11. 前記データストリームは、前記複数のエレメンタリストリームの各々が2つ以上のレイヤを含まないという制約に従う、請求項8に記載の方法。
  12. 前記データストリームは、前記HEVCタイミングおよびHRD記述子のhrd_management_valid_flagが1に等しい場合、HEVC動作記述子内でシグナリングされる各動作点に適用可能なバッファリング期間補足エンハンスメント情報(SEI)メッセージおよびピクチャタイミングSEIメッセージがHEVCビデオストリーム内に存在しなければならないという制約に従う、請求項8に記載の方法。
  13. 前記HEVCタイミングおよびHRD記述子がプログラムレベルの記述子であり、ここにおいて、前記データストリーム内に多くて1つのHEVCタイミングおよびHRD記述子が存在することが必要とされる、請求項8に記載の方法。
  14. 前記データストリームが、モーションピクチャエキスパートグループ(MPEG)−2データストリームである、請求項8に記載の方法。
  15. ビデオデータを処理するためのデバイスであって、
    前記ビデオデータを記憶するように構成されたメモリと、
    1つまたは複数のプロセッサとを備え、前記1つまたは複数のプロセッサが、
    複数のエレメンタリストリームと高効率ビデオコーディング(HEVC)タイミングおよび仮想参照デコーダ(HRD)記述子とを備えるデータストリームを取得することと、ここにおいて、前記HEVCタイミングおよびHRD記述子が、配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備え、前記エレメンタリストリームが前記ビデオデータの符号化表現を備える、
    パラメータのセットに基づいて、ビデオパラメータセット(VPS)内のシンタックス要素のアレイ内のシンタックス要素を識別することと、ここにおいて、
    前記VPSが複数のHRDパラメータシンタックス構造を備え、ここにおいて、前記複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造が、HRDパラメータのそれぞれのセットを備える、
    シンタックス要素の前記アレイの各それぞれのシンタックス要素が、前記複数のHRDパラメータシンタックス構造の中のHRDパラメータシンタックス構造のインデックスを指定する、
    パラメータの前記セットが、前記ターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える、
    前記識別されたシンタックス要素によって指定されたインデックスに基づいて、前記複数のHRDパラメータシンタックス構造内の特定のHRDパラメータシンタックス構造を、動作点の一部である特定のエレメンタリストリームに適用可能であると識別することと
    を行うように構成され、前記複数のエレメンタリストリームが前記特定のエレメンタリストリームを含む、デバイス。
  16. 前記パラメータが第1のパラメータであり、パラメータの前記セットが第2のパラメータを含み、前記データストリームを取得することが、前記複数のエレメンタリストリームのそれぞれのエレメンタリストリームごとに、前記それぞれのエレメンタリストリーム用の階層レイヤインデックス値を備える階層記述子または階層拡張記述子を取得することを備え、
    前記1つまたは複数のプロセッサが、
    0x24、0x27、または0x29に等しいストリームタイプを有しており前記動作点内にある、前記複数のエレメンタリストリーム内のエレメンタリストリームのリストを決定することと、前記リストが、前記リスト内の前記エレメンタリストリーム用の前記階層レイヤインデックス値に従う昇順である、
    前記特定のエレメンタリストリームが前記リストのメンバである場合、前記第2のパラメータの値が前記リスト内の前記特定のエレメンタリストリームの前記インデックスであり、
    前記特定のエレメンタリストリームが前記リストのメンバではない場合、前記第2のパラメータの前記値が前記リスト内の前記エレメンタリストリームのうちの1つの前記インデックスである
    ように、前記第2のパラメータの前記値を決定することと
    を行うようにさらに構成され、前記特定のエレメンタリストリームが前記リスト内の前記エレメンタリストリームの補完時間エンハンスメントである、請求項15に記載のデバイス。
  17. パラメータの前記セットが第3、第4、および第5のパラメータを含み、前記第3のパラメータが動作点のターゲット出力レイヤセットインデックスを指定し、前記第4のパラメータが前記動作点のターゲット区分化方式インデックスを指定し、前記第5のパラメータが前記動作点の最上位時間識別子を指定する、請求項16に記載のデバイス。
  18. 前記データストリームは、プログラムストリームまたはトランスポートストリームであり、前記複数のエレメンタリストリームの各々が2つ以上のレイヤを含まないという制約に従う、請求項15に記載のデバイス。
  19. 前記データストリームは、プログラムストリームまたはトランスポートストリームであり、前記HEVCタイミングおよびHRD記述子のhrd_management_valid_flagが1に等しい場合、HEVC動作記述子内でシグナリングされる各動作点に適用可能なバッファリング期間補足エンハンスメント情報(SEI)メッセージおよびピクチャタイミングSEIメッセージがHEVCビデオストリーム内に存在しなければならないという制約に従う、請求項15に記載のデバイス。
  20. 前記HEVCタイミングおよびHRD記述子がプログラムレベルの記述子であり、ここにおいて、前記データストリーム内に多くて1つのHEVCタイミングおよびHRD記述子が存在することが必要とされる、請求項15に記載のデバイス。
  21. 前記データストリームが、モーションピクチャエキスパートグループ(MPEG)−2データストリームである、請求項15に記載のデバイス。
  22. ビデオデータを処理するためのデバイスであって、
    前記ビデオデータを記憶するように構成されたメモリと、
    1つまたは複数のプロセッサとを備え、前記1つまたは複数のプロセッサが、
    シンタックス要素のアレイと複数の仮想参照デコーダ(HRD)パラメータシンタックス構造とを含むビデオパラメータセット(VPS)を生成することと、ここにおいて、
    前記複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造が、HRDパラメータのそれぞれのセットを備える、
    シンタックス要素の前記アレイの各それぞれのシンタックス要素が、前記複数のHRDパラメータシンタックス構造の中のHRDパラメータシンタックス構造のインデックスを指定する、
    配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備える高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子を生成することと、
    複数のエレメンタリストリームと前記高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子とを備えるデータストリームを生成することと
    を行うように構成され、
    パラメータのセットが、特定のエレメンタリストリームに適用可能な特定のHRDパラメータシンタックス構造のインデックスを指定するシンタックス要素の前記アレイ内のシンタックス要素を識別し、前記特定のHRDパラメータシンタックス構造が前記複数のHRDパラメータシンタックス構造のうちの1つであり、前記特定のHRDパラメータシンタックス構造が動作点の一部であり、パラメータの前記セットが前記ターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える、デバイス。
  23. 前記パラメータが第1のパラメータであり、パラメータの前記セットが第2のパラメータを含み、前記1つまたは複数のプロセッサが、
    前記データストリーム内に、前記複数のエレメンタリストリームのそれぞれのエレメンタリストリームごとに、前記それぞれのエレメンタリストリーム用の階層レイヤインデックス値を備える階層記述子または階層拡張記述子を含めることと、
    0x24、0x27、または0x29に等しいストリームタイプを有しており前記動作点内にある、前記複数のエレメンタリストリーム内のエレメンタリストリームのリストを決定することと、前記リストが、前記リスト内の前記エレメンタリストリーム用の前記階層レイヤインデックス値に従う昇順である、
    前記特定のエレメンタリストリームが前記リストのメンバである場合、前記第2のパラメータの値が前記リスト内の前記特定のエレメンタリストリームの前記インデックスであり、
    前記特定のエレメンタリストリームが前記リストのメンバではない場合、前記第2のパラメータの前記値が前記リスト内の前記エレメンタリストリームのうちの1つの前記インデックスである
    ように、前記第2のパラメータの前記値を決定することと
    を行うように構成され、前記特定のエレメンタリストリームが前記リスト内の前記エレメンタリストリームの補完時間エンハンスメントである、請求項22に記載のデバイス。
  24. パラメータの前記セットが第3、第4、および第5のパラメータを含み、前記第3のパラメータが動作点のターゲット出力レイヤセットインデックスを指定し、前記第4のパラメータが前記動作点のターゲット区分化方式インデックスを指定し、前記第5のパラメータが前記動作点の最上位時間識別子を指定する、請求項23に記載のデバイス。
  25. 前記データストリームは、前記複数のエレメンタリストリームの各々が2つ以上のレイヤを含まないという制約に従う、請求項22に記載のデバイス。
  26. 前記データストリームは、前記HEVCタイミングおよびHRD記述子のhrd_management_valid_flagが1に等しい場合、HEVC動作記述子内でシグナリングされる各動作点に適用可能なバッファリング期間補足エンハンスメント情報(SEI)メッセージおよびピクチャタイミングSEIメッセージがHEVCビデオストリーム内に存在しなければならないという制約に従う、請求項22に記載のデバイス。
  27. 前記HEVCタイミングおよびHRD記述子がプログラムレベルの記述子であり、ここにおいて、前記データストリーム内に多くて1つのHEVCタイミングおよびHRD記述子が存在することが必要とされる、請求項22に記載のデバイス。
  28. 前記データストリームが、モーションピクチャエキスパートグループ(MPEG)−2データストリームである、請求項22に記載のデバイス。
  29. ビデオデータを処理するためのデバイスであって、
    複数のエレメンタリストリームと高効率ビデオコーディング(HEVC)タイミングおよび仮想参照デコーダ(HRD)記述子とを備えるデータストリームを取得するための手段と、ここにおいて、前記HEVCタイミングおよびHRD記述子が、配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備える、
    パラメータのセットに基づいて、ビデオパラメータセット(VPS)内のシンタックス要素のアレイ内のシンタックス要素を識別するための手段と、ここにおいて、
    前記VPSが複数のHRDパラメータシンタックス構造を備え、ここにおいて、前記複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造が、HRDパラメータのそれぞれのセットを備える、
    シンタックス要素の前記アレイの各それぞれのシンタックス要素が、前記複数のHRDパラメータシンタックス構造の中のHRDパラメータシンタックス構造のインデックスを指定する、
    パラメータの前記セットが、前記ターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える、
    前記識別されたシンタックス要素によって指定されたインデックスに基づいて、前記複数のHRDパラメータシンタックス構造内の特定のHRDパラメータシンタックス構造を、動作点の一部である特定のエレメンタリストリームに適用可能であると識別するための手段と
    を備え、前記複数のエレメンタリストリームが前記特定のエレメンタリストリームを含む、デバイス。
  30. 前記パラメータが第1のパラメータであり、パラメータの前記セットが第2のパラメータを含み、前記データストリームが、前記複数のエレメンタリストリームのそれぞれのエレメンタリストリームごとに、前記それぞれのエレメンタリストリーム用の階層レイヤインデックス値を備える階層記述子または階層拡張記述子を備え、
    前記デバイスが、
    0x24、0x27、または0x29に等しいストリームタイプを有しており前記動作点内にある、前記複数のエレメンタリストリーム内のエレメンタリストリームのリストを決定するための手段と、前記リストが、前記リスト内の前記エレメンタリストリーム用の前記階層レイヤインデックス値に従う昇順である、
    前記特定のエレメンタリストリームが前記リストのメンバである場合、前記第2のパラメータの値が前記リスト内の前記特定のエレメンタリストリームの前記インデックスであり、
    前記特定のエレメンタリストリームが前記リストのメンバではない場合、前記第2のパラメータの前記値が前記リスト内の前記エレメンタリストリームのうちの1つの前記インデックスである
    ように、前記第2のパラメータの前記値を決定するための手段と
    をさらに備え、前記特定のエレメンタリストリームが前記リスト内の前記エレメンタリストリームの補完時間エンハンスメントである、請求項29に記載のデバイス。
  31. パラメータの前記セットが第3、第4、および第5のパラメータを含み、前記第3のパラメータが動作点のターゲット出力レイヤセットインデックスを指定し、前記第4のパラメータが前記動作点のターゲット区分化方式インデックスを指定し、前記第5のパラメータが前記動作点の最上位時間識別子を指定する、請求項30に記載のデバイス。
  32. 前記データストリームは、プログラムストリームまたはトランスポートストリームであり、前記複数のエレメンタリストリームの各々が2つ以上のレイヤを含まないという制約に従う、請求項29に記載のデバイス。
  33. 前記データストリームは、プログラムストリームまたはトランスポートストリームであり、前記HEVCタイミングおよびHRD記述子のhrd_management_valid_flagが1に等しい場合、HEVC動作記述子内でシグナリングされる各動作点に適用可能なバッファリング期間補足エンハンスメント情報(SEI)メッセージおよびピクチャタイミングSEIメッセージがHEVCビデオストリーム内に存在しなければならないという制約に従う、請求項29に記載のデバイス。
  34. 前記HEVCタイミングおよびHRD記述子がプログラムレベルの記述子であり、ここにおいて、前記データストリーム内に多くて1つのHEVCタイミングおよびHRD記述子が存在することが必要とされる、請求項29に記載のデバイス。
  35. ビデオデータを処理するためのデバイスであって、
    シンタックス要素のアレイと複数の仮想参照デコーダ(HRD)パラメータシンタックス構造とを含むビデオパラメータセット(VPS)を生成するための手段と、ここにおいて、
    前記複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造が、HRDパラメータのそれぞれのセットを備える、
    シンタックス要素の前記アレイの各それぞれのシンタックス要素が、前記複数のHRDパラメータシンタックス構造の中のHRDパラメータシンタックス構造のインデックスを指定する、
    配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備える高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子を生成するための手段と、
    複数のエレメンタリストリームと前記高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子とを備えるデータストリームを生成するための手段と
    を備え、
    パラメータのセットが、特定のエレメンタリストリームに適用可能な特定のHRDパラメータシンタックス構造のインデックスを指定するシンタックス要素の前記アレイ内のシンタックス要素を識別し、前記特定のHRDパラメータシンタックス構造が前記複数のHRDパラメータシンタックス構造のうちの1つであり、前記特定のHRDパラメータシンタックス構造が動作点の一部であり、パラメータの前記セットが前記ターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える、デバイス。
  36. 前記パラメータが第1のパラメータであり、パラメータの前記セットが第2のパラメータを含み、前記データストリームが、前記複数のエレメンタリストリームのそれぞれのエレメンタリストリームごとに、前記それぞれのエレメンタリストリーム用の階層レイヤインデックス値を備える階層記述子または階層拡張記述子を備え、
    前記デバイスが、
    0x24、0x27、または0x29に等しいストリームタイプを有しており前記動作点内にある、前記複数のエレメンタリストリーム内のエレメンタリストリームのリストを決定するための手段と、前記リストが、前記リスト内の前記エレメンタリストリーム用の前記階層レイヤインデックス値に従う昇順である、
    前記特定のエレメンタリストリームが前記リストのメンバである場合、前記第2のパラメータの値が前記リスト内の前記特定のエレメンタリストリームの前記インデックスであり、
    前記特定のエレメンタリストリームが前記リストのメンバではない場合、前記第2のパラメータの前記値が前記リスト内の前記エレメンタリストリームのうちの1つの前記インデックスである
    ように、前記第2のパラメータの前記値を決定するための手段と
    をさらに備え、前記特定のエレメンタリストリームが前記リスト内の前記エレメンタリストリームの補完時間エンハンスメントである、請求項35に記載のデバイス。
  37. パラメータの前記セットが第3、第4、および第5のパラメータを含み、前記第3のパラメータが動作点のターゲット出力レイヤセットインデックスを指定し、前記第4のパラメータが前記動作点のターゲット区分化方式インデックスを指定し、前記第5のパラメータが前記動作点の最上位時間識別子を指定する、請求項36に記載のデバイス。
  38. 前記データストリームは、前記複数のエレメンタリストリームの各々が2つ以上のレイヤを含まないという制約に従う、請求項35に記載のデバイス。
  39. 前記データストリームは、前記HEVCタイミングおよびHRD記述子のhrd_management_valid_flagが1に等しい場合、HEVC動作記述子内でシグナリングされる各動作点に適用可能なバッファリング期間補足エンハンスメント情報(SEI)メッセージおよびピクチャタイミングSEIメッセージがHEVCビデオストリーム内に存在しなければならないという制約に従う、請求項35に記載のデバイス。
  40. 前記HEVCタイミングおよびHRD記述子がプログラムレベルの記述子であり、ここにおいて、前記データストリーム内に多くて1つのHEVCタイミングおよびHRD記述子が存在することが必要とされる、請求項35に記載のデバイス。
  41. 前記データストリームが、モーションピクチャエキスパートグループ(MPEG)−2データストリームである、請求項35に記載のデバイス。
  42. 命令を記憶したコンピュータ可読記憶媒体であって、前記命令が、実行されると、
    複数のエレメンタリストリームと高効率ビデオコーディング(HEVC)タイミングおよび仮想参照デコーダ(HRD)記述子とを備えるデータストリームを取得することと、ここにおいて、前記HEVCタイミングおよびHRD記述子が、配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備える、
    パラメータのセットに基づいて、ビデオパラメータセット(VPS)内のシンタックス要素のアレイ内のシンタックス要素を識別することと、ここにおいて、
    前記VPSが複数のHRDパラメータシンタックス構造を備え、ここにおいて、前記複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造が、HRDパラメータのそれぞれのセットを備える、
    シンタックス要素の前記アレイの各それぞれのシンタックス要素が、前記複数のHRDパラメータシンタックス構造の中のHRDパラメータシンタックス構造のインデックスを指定する、
    パラメータの前記セットが、前記ターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える、
    前記識別されたシンタックス要素によって指定されたインデックスに基づいて、前記複数のHRDパラメータシンタックス構造内の特定のHRDパラメータシンタックス構造を、動作点の一部である特定のエレメンタリストリームに適用可能であると識別することと
    をデバイスの1つまたは複数のプロセッサに行わせ、前記複数のエレメンタリストリームが前記特定のエレメンタリストリームを含む、コンピュータ可読記憶媒体。
  43. 前記パラメータが第1のパラメータであり、パラメータの前記セットが第2のパラメータを含み、前記データストリームが、前記複数のエレメンタリストリームのそれぞれのエレメンタリストリームごとに、前記それぞれのエレメンタリストリーム用の階層レイヤインデックス値を備える階層記述子または階層拡張記述子を備え、
    前記命令が、
    0x24、0x27、または0x29に等しいストリームタイプを有しており前記動作点内にある、前記複数のエレメンタリストリーム内のエレメンタリストリームのリストを決定することと、前記リストが、前記リスト内の前記エレメンタリストリーム用の前記階層レイヤインデックス値に従う昇順である、
    前記特定のエレメンタリストリームが前記リストのメンバである場合、前記第2のパラメータの値が前記リスト内の前記特定のエレメンタリストリームの前記インデックスであり、
    前記特定のエレメンタリストリームが前記リストのメンバではない場合、前記第2のパラメータの前記値が前記リスト内の前記エレメンタリストリームのうちの1つの前記インデックスである
    ように、前記第2のパラメータの前記値を決定することと
    を行うように前記1つまたは複数のプロセッサをさらに構成し、
    前記特定のエレメンタリストリームが前記リスト内の前記エレメンタリストリームの補完時間エンハンスメントである、請求項42に記載のコンピュータ可読記憶媒体。
  44. パラメータの前記セットが第3、第4、および第5のパラメータを含み、前記第3のパラメータが動作点のターゲット出力レイヤセットインデックスを指定し、前記第4のパラメータが前記動作点のターゲット区分化方式インデックスを指定し、前記第5のパラメータが前記動作点の最上位時間識別子を指定する、請求項43に記載のコンピュータ可読記憶媒体。
  45. 前記データストリームは、プログラムストリームまたはトランスポートストリームであり、前記複数のエレメンタリストリームの各々が2つ以上のレイヤを含まないという制約に従う、請求項42に記載のコンピュータ可読記憶媒体。
  46. 前記データストリームは、プログラムストリームまたはトランスポートストリームであり、前記HEVCタイミングおよびHRD記述子のhrd_management_valid_flagが1に等しい場合、HEVC動作記述子内でシグナリングされる各動作点に適用可能なバッファリング期間補足エンハンスメント情報(SEI)メッセージおよびピクチャタイミングSEIメッセージがHEVCビデオストリーム内に存在しなければならないという制約に従う、請求項42に記載のコンピュータ可読記憶媒体。
  47. 前記HEVCタイミングおよびHRD記述子がプログラムレベルの記述子であり、ここにおいて、前記データストリーム内に多くて1つのHEVCタイミングおよびHRD記述子が存在することが必要とされる、請求項42に記載のコンピュータ可読記憶媒体。
  48. 前記データストリームが、モーションピクチャエキスパートグループ(MPEG)−2データストリームである、請求項42に記載のコンピュータ可読記憶媒体。
  49. 命令を記憶したコンピュータ可読記憶媒体であって、前記命令が、実行されると、
    シンタックス要素のアレイと複数の仮想参照デコーダ(HRD)パラメータシンタックス構造とを含むビデオパラメータセット(VPS)を生成することと、ここにおいて、
    前記複数のHRDパラメータシンタックス構造の各それぞれのHRDパラメータシンタックス構造が、HRDパラメータのそれぞれのセットを備える、
    シンタックス要素の前記アレイの各それぞれのシンタックス要素が、前記複数のHRDパラメータシンタックス構造の中のHRDパラメータシンタックス構造のインデックスを指定する、
    配信スケジュールのインデックスを示すターゲットスケジュールインデックスシンタックス要素を備える高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子を生成することと、
    複数のエレメンタリストリームと前記高効率ビデオコーディング(HEVC)タイミングおよびHRD記述子とを備えるデータストリームを生成することと
    をデバイスの1つまたは複数のプロセッサに行わせ、
    パラメータのセットが、特定のエレメンタリストリームに適用可能な特定のHRDパラメータシンタックス構造のインデックスを指定するシンタックス要素の前記アレイ内のシンタックス要素を識別し、前記特定のHRDパラメータシンタックス構造が前記複数のHRDパラメータシンタックス構造のうちの1つであり、前記特定のHRDパラメータシンタックス構造が動作点の一部であり、パラメータの前記セットが前記ターゲットスケジュールインデックスシンタックス要素の値に等しい値を有するパラメータを備える、コンピュータ可読記憶媒体。
  50. 前記パラメータが第1のパラメータであり、パラメータの前記セットが第2のパラメータを含み、前記データストリームが、前記複数のエレメンタリストリームのそれぞれのエレメンタリストリームごとに、前記それぞれのエレメンタリストリーム用の階層レイヤインデックス値を備える階層記述子または階層拡張記述子を備え、
    前記命令が、
    0x24、0x27、または0x29に等しいストリームタイプを有しており前記動作点内にある、前記複数のエレメンタリストリーム内のエレメンタリストリームのリストを決定することと、前記リストが、前記リスト内の前記エレメンタリストリーム用の前記階層レイヤインデックス値に従う昇順である、
    前記特定のエレメンタリストリームが前記リストのメンバである場合、前記第2のパラメータの値が前記リスト内の前記特定のエレメンタリストリームの前記インデックスであり、
    前記特定のエレメンタリストリームが前記リストのメンバではない場合、前記第2のパラメータの前記値が前記リスト内の前記エレメンタリストリームのうちの1つの前記インデックスである
    ように、前記第2のパラメータの前記値を決定することと
    を行うように前記1つまたは複数のプロセッサをさらに構成し、
    前記特定のエレメンタリストリームが前記リスト内の前記エレメンタリストリームの補完時間エンハンスメントである、請求項49に記載のコンピュータ可読記憶媒体。
  51. パラメータの前記セットが第3、第4、および第5のパラメータを含み、前記第3のパラメータが動作点のターゲット出力レイヤセットインデックスを指定し、前記第4のパラメータが前記動作点のターゲット区分化方式インデックスを指定し、前記第5のパラメータが前記動作点の最上位時間識別子を指定する、請求項50に記載のコンピュータ可読記憶媒体。
  52. 前記データストリームは、前記複数のエレメンタリストリームの各々が2つ以上のレイヤを含まないという制約に従う、請求項49に記載のコンピュータ可読記憶媒体。
  53. 前記データストリームは、前記HEVCタイミングおよびHRD記述子のhrd_management_valid_flagが1に等しい場合、HEVC動作記述子内でシグナリングされる各動作点に適用可能なバッファリング期間補足エンハンスメント情報(SEI)メッセージおよびピクチャタイミングSEIメッセージがHEVCビデオストリーム内に存在しなければならないという制約に従う、請求項49に記載のコンピュータ可読記憶媒体。
  54. 前記HEVCタイミングおよびHRD記述子がプログラムレベルの記述子であり、ここにおいて、前記データストリーム内に多くて1つのHEVCタイミングおよびHRD記述子が存在することが必要とされる、請求項49に記載のコンピュータ可読記憶媒体。
  55. 前記データストリームが、モーションピクチャエキスパートグループ(MPEG)−2データストリームである、請求項49に記載のコンピュータ可読記憶媒体。
JP2017519873A 2014-10-15 2015-10-15 Hevc拡張の搬送用データストリームのhrd記述子およびバッファモデルの設計 Active JP6612338B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462064414P 2014-10-15 2014-10-15
US62/064,414 2014-10-15
US14/883,256 US20160112724A1 (en) 2014-10-15 2015-10-14 Hrd descriptor and buffer model of data streams for carriage of hevc extensions
US14/883,256 2015-10-14
PCT/US2015/055712 WO2016061334A1 (en) 2014-10-15 2015-10-15 Design of hrd descriptor and buffer model of data streams for carriage of hevc extensions

Publications (2)

Publication Number Publication Date
JP2017535184A true JP2017535184A (ja) 2017-11-24
JP6612338B2 JP6612338B2 (ja) 2019-11-27

Family

ID=54366510

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017519873A Active JP6612338B2 (ja) 2014-10-15 2015-10-15 Hevc拡張の搬送用データストリームのhrd記述子およびバッファモデルの設計

Country Status (10)

Country Link
US (2) US20160112724A1 (ja)
EP (1) EP3207710B1 (ja)
JP (1) JP6612338B2 (ja)
KR (1) KR102383621B1 (ja)
CN (1) CN107079176B (ja)
AU (1) AU2015332493B2 (ja)
CU (1) CU24676B1 (ja)
PE (1) PE20170758A1 (ja)
TW (1) TWI692242B (ja)
WO (1) WO2016061334A1 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160112724A1 (en) 2014-10-15 2016-04-21 Qualcomm Incorporated Hrd descriptor and buffer model of data streams for carriage of hevc extensions
JP6715467B2 (ja) * 2015-07-01 2020-07-01 パナソニックIpマネジメント株式会社 符号化方法、復号方法、符号化装置、復号装置および符号化復号装置
GB201513316D0 (en) * 2015-07-29 2015-09-09 Flynn Thomas M P19-0 encoding engine
JP6969541B2 (ja) * 2016-04-12 2021-11-24 ソニーグループ株式会社 送信装置および送信方法
CN113892271A (zh) * 2019-05-30 2022-01-04 夏普株式会社 用于在视频编码中发送信号通知假想参考解码器参数的系统和方法
US11166033B2 (en) * 2019-06-06 2021-11-02 Qualcomm Incorporated Adaptation parameter set in access unit in video coding
WO2021061390A1 (en) * 2019-09-24 2021-04-01 Futurewei Technologies, Inc. Sei message for single layer ols
KR20220115958A (ko) 2019-12-26 2022-08-19 바이트댄스 아이엔씨 코딩된 비트스트림들에서의 비디오 계층들의 시그널링에 대한 제약들
WO2021134018A1 (en) 2019-12-26 2021-07-01 Bytedance Inc. Signaling of decoded picture buffer parameters in layered video
JP2023508680A (ja) 2019-12-27 2023-03-03 バイトダンス インコーポレイテッド ビデオコーディングにおけるサブピクチャシグナリング
WO2021137597A1 (ko) * 2019-12-30 2021-07-08 엘지전자 주식회사 Ols에 대한 dpb 파라미터를 사용하는 영상 디코딩 방법 및 그 장치
WO2021142369A1 (en) 2020-01-09 2021-07-15 Bytedance Inc. Signalling of the wavefront parallel processing
CN115668944A (zh) 2020-03-30 2023-01-31 Lg电子株式会社 用信号通知dpb参数的视频编码/解码方法和设备及存储比特流的计算机可读记录介质
KR20220161426A (ko) * 2020-03-30 2022-12-06 엘지전자 주식회사 Dpb 파라미터의 개수 정보를 시그널링하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 컴퓨터 판독 가능한 기록 매체
WO2021201513A1 (ko) * 2020-03-30 2021-10-07 엘지전자 주식회사 Sps 내 ptl, dpb 및 hrd 관련 정보를 시그널링하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 컴퓨터 판독 가능한 기록 매체
KR20220162740A (ko) * 2020-04-02 2022-12-08 엘지전자 주식회사 Dpb 관련 정보 및 ptl 관련 정보를 시그널링하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 컴퓨터 판독 가능한 기록 매체
WO2021222037A1 (en) * 2020-04-26 2021-11-04 Bytedance Inc. Conditional signaling of weighted prediction information
KR20230025429A (ko) * 2020-06-06 2023-02-21 엘지전자 주식회사 스케일러빌리티를 위한 서브-비트스트림 추출 기반 영상 코딩 장치 및 방법
KR20230023721A (ko) * 2020-06-06 2023-02-17 엘지전자 주식회사 레이어 정보 시그널링 기반 영상 코딩 장치 및 방법
CN113225584B (zh) * 2021-03-24 2022-02-22 西安交通大学 一种基于编码和缓存的跨层联合的视频传输方法、系统

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5930390A (en) 1996-03-28 1999-07-27 Intel Corporation Encoding/decoding signals using a remap table
US7343037B1 (en) * 2004-02-04 2008-03-11 Microsoft Corporation Dynamic, locally-adaptive, lossless palettization of color and grayscale images
US9451252B2 (en) * 2012-01-14 2016-09-20 Qualcomm Incorporated Coding parameter sets and NAL unit headers for video coding
US9161039B2 (en) * 2012-09-24 2015-10-13 Qualcomm Incorporated Bitstream properties in video coding
US10147202B2 (en) * 2013-03-15 2018-12-04 Arm Limited Methods of and apparatus for encoding and decoding data
US9800895B2 (en) 2013-06-27 2017-10-24 Qualcomm Incorporated Depth oriented inter-view motion vector prediction
US9558567B2 (en) * 2013-07-12 2017-01-31 Qualcomm Incorporated Palette prediction in palette-based video coding
BR112016012417B1 (pt) * 2013-12-18 2023-04-11 Hfi Innovation Inc Método e aparelho para inicialização e gerenciamento de paleta
CN105900432B (zh) * 2014-01-02 2019-05-10 Vid拓展公司 用于屏幕内容编码的二维调色板编码
US10567804B2 (en) * 2014-01-08 2020-02-18 Qualcomm Incorporated Carriage of HEVC extension bitstreams and buffer model with MPEG-2 systems
KR102324004B1 (ko) * 2014-03-14 2021-11-09 브이아이디 스케일, 인크. 스크린 콘텐츠 코딩을 위한 팔레트 코딩
US10237557B2 (en) * 2014-06-20 2019-03-19 Hfi Innovation Inc. Method of run-length coding for palette predictor
US10306269B2 (en) 2014-10-10 2019-05-28 Qualcomm Incorporated Operation point for carriage of layered HEVC bitstream
US20160112724A1 (en) 2014-10-15 2016-04-21 Qualcomm Incorporated Hrd descriptor and buffer model of data streams for carriage of hevc extensions

Also Published As

Publication number Publication date
US10171842B2 (en) 2019-01-01
WO2016061334A1 (en) 2016-04-21
EP3207710B1 (en) 2021-07-14
TWI692242B (zh) 2020-04-21
AU2015332493A1 (en) 2017-03-23
KR20170072201A (ko) 2017-06-26
BR112017007798A2 (pt) 2017-12-19
CU24676B1 (es) 2023-09-07
KR102383621B1 (ko) 2022-04-05
CN107079176A (zh) 2017-08-18
US20180255324A1 (en) 2018-09-06
JP6612338B2 (ja) 2019-11-27
CN107079176B (zh) 2020-07-03
AU2015332493B2 (en) 2019-06-06
CU20170051A7 (es) 2017-08-08
PE20170758A1 (es) 2017-07-04
EP3207710A1 (en) 2017-08-23
TW201620305A (zh) 2016-06-01
US20160112724A1 (en) 2016-04-21

Similar Documents

Publication Publication Date Title
JP6612338B2 (ja) Hevc拡張の搬送用データストリームのhrd記述子およびバッファモデルの設計
RU2633100C2 (ru) Применимость битового субпотока к вложенным sei-сообщениям при кодировании видео
JP6009679B2 (ja) ビデオコーディングにおける仮想参照デコーダパラメータ
US9521393B2 (en) Non-nested SEI messages in video coding
JP6608395B2 (ja) スケーラブルビデオコード化におけるビットストリーム適合制約
WO2015168591A1 (en) Method and device for decoding multi-layer video data by determining the capability of the decoder based on profile, tier and level associated with partition containing one or more layers
JP2017508339A (ja) Mpeg−2システムによるhevc拡張ビットストリームの搬送およびバッファモデル
JP6452798B2 (ja) ビデオコーディング拡張の搬送のためのトランスポートストリーム
JP6442067B2 (ja) Hevc拡張の搬送のための動作点のシグナリング

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170628

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180919

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190925

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191001

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191030

R150 Certificate of patent or registration of utility model

Ref document number: 6612338

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250