JP6162228B2 - ビデオコード化のための長期参照ピクチャについてのデータの信号伝達 - Google Patents

ビデオコード化のための長期参照ピクチャについてのデータの信号伝達 Download PDF

Info

Publication number
JP6162228B2
JP6162228B2 JP2015516028A JP2015516028A JP6162228B2 JP 6162228 B2 JP6162228 B2 JP 6162228B2 JP 2015516028 A JP2015516028 A JP 2015516028A JP 2015516028 A JP2015516028 A JP 2015516028A JP 6162228 B2 JP6162228 B2 JP 6162228B2
Authority
JP
Japan
Prior art keywords
picture
value
pictures
long
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015516028A
Other languages
English (en)
Other versions
JP2015523012A (ja
JP2015523012A5 (ja
Inventor
ラマスブラモニアン、アダルシュ・クリシュナン
ワン、イェ−クイ
チェン、イン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2015523012A publication Critical patent/JP2015523012A/ja
Publication of JP2015523012A5 publication Critical patent/JP2015523012A5/ja
Application granted granted Critical
Publication of JP6162228B2 publication Critical patent/JP6162228B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/563Motion estimation with padding, i.e. with filling of non-object values in an arbitrarily shaped picture block or region for estimation purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

[0001]本出願は、その内容全体が参照により本明細書に組み込まれる、2012年6月7日に出願された米国仮特許出願第61/656,877号の利益を主張する。
[0002]本開示は、ビデオコード化に関する。
[0003]デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末(PDA)、ラップトップ又はデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダー、デジタルカメラ、デジタル記録機器、デジタルメディアプレーヤ、ビデオゲーム機器、ビデオゲームコンソール、セルラー又は衛星無線電話、所謂「スマートフォン」、ビデオ遠隔会議機器、ビデオストリーミング機器などを含む、広範囲にわたる機器に組み込まれ得る。デジタルビデオ機器は、MPEG−2、MPEG−4、ITU−TH.263、ITU−TH.264/MPEG−4,Part10,アドバンストビデオコード化(AVC)、現在開発中の高効率ビデオコード化(HEVC:HighEfficiencyVideoCoding)規格によって定義された規格、及びスケーラブルビデオコード化(SVC)拡張及びマルチビュービデオコード化(MVC)拡張など、そのような規格の拡張に記載されているビデオコード化技法など、ビデオコード化技法を実装する。ビデオ機器は、そのようなビデオコード化技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、及び/又は記憶し得る。
[0004]「HEVCWorkingDraft6」又は「WD6」と呼ばれる、今度のHEVC規格の最近のドラフトは、2012年6月7日現在、http://phenix.int-evry.fr/jct/doc_end_user/documents/8_SanJose/wg11/JCTVC-H1003-v22.zipからダウンロード可能である、ドキュメントJCTVC−H1003、Brossら、「Highefficiencyvideocoding(HEVC)textspecificationdraft6」、JointCollaborativeTeamonVideoCoding(JCT−VC)ofITU−TSG16WP3andISO/IECJTC1/SC29/WG11、8thMeeting:SanJose、California、USA、2012年2月に記載されている。「HEVCWorkingDraft7」又は「WD7」と呼ばれる、今度のHEVC規格の別のドラフトは、2102年6月7日現在、http://phenix.it-sudparis.eu/jct/doc_end_user/documents/9_Geneva/wg11/JCTVC-I1003-v3.zipからダウンロード可能である、ドキュメントJCTVC−I1003、Brossら、「HighEfficiencyVideoCoding(HEVC)TextSpecificationDraft7」、JointCollaborativeTeamonVideoCoding(JCT−VC)ofITU−TSG16WP3andISO/IECJTC1/SC29/WG11、9thMeeting:Geneva、Switzerland、2012年4月27日〜2012年5月7日に記載されている。
[0005]ビデオコード化技法は、ビデオシーケンスに固有の冗長性を低減又は除去するための空間的(イントラピクチャ)予測及び/又は時間的(インターピクチャ)予測を含む。ブロックベースのビデオコード化の場合、ビデオスライス(例えば、ビデオフレーム又はビデオフレームの一部分)が、ツリーブロック、コード化ツリーユニット、コード化単位(CU)及び/又はコード化ノードと呼ばれることもあるビデオブロックに区分され得る。ピクチャのイントラコード化(I)スライス中のビデオブロックは、同じピクチャ中の隣接ブロック内の参照サンプルに対する空間的予測を使用して符号化される。ピクチャのインターコード化(P又はB)スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間的予測、又は他の参照ピクチャ中の参照サンプルに対する時間的予測を使用し得る。ピクチャはフレームと呼ばれることがあり、参照ピクチャは参照フレームと呼ばれることがある。
[0006]空間的予測又は時間的予測は、コード化されるべきブロックの予測ブロックを生じる。残差データは、コード化されるべき元のブロックと予測ブロックとの間の画素差分を表す。インターコード化ブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトル、及びコード化ブロックと予測ブロックとの間の差分を示す残差データとに従って符号化される。イントラコード化ブロックは、イントラコード化モードと残差データとに従って符号化される。更なる圧縮のために、残差データは、画素領域から変換領域に変換されて、残差変換係数が得られ得、その残差変換係数は、次いで量子化され得る。量子化変換係数は、最初は2次元アレイで構成され、変換係数の1次元ベクトルを生成するために走査され得、なお一層の圧縮を達成するために、エントロピーコード化が適用され得る。
[0007]概して、本開示は、参照ピクチャセット(RPS:referencepictureset)を導出することと、RPS中に、例えば、シーケンスパラメータセット(SPS:sequenceparameterset)、ピクチャパラメータセット(PPS:pictureparameterset)中に、又はスライスヘッダ中に含まれるべき長期参照ピクチャ(LTRP:longtermreferencepicture)を信号伝達することとに関する技法について説明する。これらの技法は、LTRPのピクチャ順序カウント(POC:pictureordercount)値の最下位ビット(LSB:leastsignificantbit)の値が非減少(non-decreasing)又は非増加(non-increasing)であることを保証することを含み得る。追加又は代替として、これらの技法は、LTRPのPOC値についてのデータをSPS中又はスライスヘッダ中のいずれかで信号伝達することと、POC値についてのデータがSPS中で信号伝達されるか、又はスライスヘッダ中で信号伝達されるかを示す情報を与えることとを含み得る。
[0008]一例では、ビデオデータをコード化する方法が、ビデオデータのスライスのためのスライスヘッダをコード化すること、ここにおいて、スライスヘッダは、長期参照ピクチャについての識別情報が、スライスヘッダ中で明示的に信号伝達されるか、又はスライスに対応するシーケンスパラメータセットから導出されるかを示すシンタックス要素を含む、を含み、シンタックス要素が、長期参照ピクチャについての識別情報が明示的に信号伝達されることを示すとき、スライスヘッダをコード化することは、スライスヘッダ中の長期参照ピクチャについての識別情報の値をコード化することを更に備える。
[0009]別の例では、ビデオデータをコード化するための機器が、ビデオデータのスライスのためのスライスヘッダをコード化するための手段と、ここにおいて、スライスヘッダは、長期参照ピクチャについての識別情報が、スライスヘッダ中で明示的に信号伝達されるか、又はスライスに対応するシーケンスパラメータセットから導出されるかを示すシンタックス要素を含む、シンタックス要素が、長期参照ピクチャについての識別情報が明示的に信号伝達されることを示すとき、スライスヘッダ中の長期参照ピクチャについての識別情報の値をコード化するための手段とを含む。
[0010]別の例では、ビデオデータをコード化するための機器、ビデオコーダを備える機器は、ビデオデータのスライスのためのスライスヘッダをコード化すること、ここにおいて、スライスヘッダは、長期参照ピクチャについての識別情報が、スライスヘッダ中で明示的に信号伝達されるか、又はスライスに対応するシーケンスパラメータセットから導出されるかを示すシンタックス要素を含む、を行うように構成され得、シンタックス要素が、長期参照ピクチャについての識別情報が明示的に信号伝達されることを示すとき、スライスヘッダをコード化するために、機器は、スライスヘッダ中の長期参照ピクチャについての識別情報の値をコード化するように更に構成される。
[0011]別の例では、非一時的コンピュータ可読記憶媒体が、実行されたとき、機器のプロセッサにビデオをコード化させる命令を記憶する、ここにおいて、命令は、プロセッサに、ビデオデータのスライスのためのスライスヘッダをコード化すること、ここにおいて、スライスヘッダは、長期参照ピクチャについての識別情報がスライスヘッダ中で明示的に信号伝達されるか、又は、スライスに対応するシーケンスパラメータセットから導出されるかを示すシンタックス要素を含む、を行わせ、シンタックス要素が、長期参照ピクチャについての識別情報が明示的に信号伝達されることを示すとき、スライスヘッダをコード化するために、機器は、スライスヘッダ中の長期参照ピクチャについての識別情報の値をコード化するように更に構成される。
[0012]1つ又は複数の例の詳細は、添付の図面及び以下の説明に記載されている。他の特徴、目的、及び利点は、説明及び図面、ならびに特許請求の範囲から明らかになろう。
[0013]シーケンスパラメータセット(SPS)又はスライスヘッダ中で長期参照ピクチャ(LTRP)についてのデータを信号伝達するための技法を利用し得る例示的なビデオ符号化及び復号システムを示すブロック図。 [0014]SPS又はスライスヘッダ中でLTRPについてのデータを信号伝達するための技法を実装し得るビデオエンコーダの一例を示すブロック図。 [0015]SPS又はスライスヘッダ中でLTRPについてのデータを信号伝達するための技法を実装し得るビデオデコーダの一例を示すブロック図。 [0016]本開示で説明する1つ又は複数の例による参照ピクチャについてのデータをコード化するためのプロセスを示すフローチャート。 [0017]本開示で説明する1つ又は複数の例によるSPS又はスライスヘッダ中でLTRPについてのデータを信号伝達するためのプロセスを示すフローチャート。
[0018]ビデオシーケンスは、概して、ピクチャのシーケンスとして表される。一般に、ブロックベースのコード化技法は、個々のピクチャの各々をコード化するために使用される。即ち、各ピクチャはブロックに分割され、ブロックの各々は個別にコード化される。ビデオデータのブロックをコード化することは、概して、ブロックの予測値を形成することと、残差値、即ち、元のブロックと予測値との間の差分をコード化することとを伴う。詳細には、ビデオデータの元のブロックは画素値の行列を含み、予測値は予測された画素値の行列を含む。残差値は、元のブロックの画素値と予測された画素値との間の画素ごとの差分に対応する。
[0019]ビデオデータのブロックのための予測技法は、概して、イントラ予測及びインター予測としてカテゴリー分類される。イントラ予測、又は空間予測は、概して、隣接する、前にコード化されたブロックの画素値からブロックを予測することを伴う。インター予測、又は時間的予測は、概して、前にコード化されたピクチャの画素値からブロックを予測することを伴う。
[0020]前にコード化されたピクチャは、コード化されているピクチャよりも早く又は後に表示されるピクチャを表し得る。言い換えれば、ピクチャについて表示順序は、ピクチャの復号順序と必ずしも同じとは限らず、従って、コード化されている現在ピクチャよりも早く又は後に表示されるピクチャが、現在ピクチャのブロックをコード化するための参照として使用され得る。
[0021]例えば、(ビデオエンコーダとビデオデコーダの一方又は両方を指すことがある用語である)ビデオコーダは復号ピクチャバッファ(DPB:decodedpicturebuffer)を含む。DPBは、ピクチャをインター予測するために使用され得るピクチャである参照ピクチャを記憶する。言い換えると、ビデオコーダは、DPBに記憶された1つ又は複数の参照ピクチャに基づいてピクチャを予測し得る。概して、参照ピクチャセット(RPS)を導出することと、ビデオコード化のインター予測態様を実行するときに使用するためのコード化ピクチャのRPSに含まれるべき長期間参照ピクチャ(LTRP)を信号伝達することとのための様々な方法を提供する技法について説明する。
[0022]ビデオデコーダはまた、どの参照ピクチャがインター予測のために使用されるかを示す参照ピクチャリストを構成するというタスクを与えられ得る。これらの参照ピクチャリストのうちの2つは、それぞれリスト0及びリスト1と呼ばれる。ビデオデコーダは最初に、リスト0とリスト1とを構成するためのデフォルトの構成技法(例えば、リスト0とリスト1とを構成するための事前設定された構成方式)を採用する。随意に、最初のリスト0とリスト1とが構成された後、デコーダは、最初のリスト0とリスト1とを修正するようにビデオデコーダに命令するシンタックス要素を、存在する場合は、復号し得る。
[0023]ビデオエンコーダは、DPB中の参照ピクチャの(1つ又は複数の)識別子を示すシンタックス要素を信号伝達し得、ビデオエンコーダはまた、現在ピクチャのコード化ブロックを復号するためにどの1つ又は複数の参照ピクチャを使用すべきかを示すインデックスを、リスト0、リスト1、又はリスト0とリスト1の両方内に含むシンタックス要素を信号伝達し得る。ビデオデコーダは、次に、受信した識別子を使用して、リスト0、リスト1、又はリスト0とリスト1の両方の中にリストされた1つ又は複数の参照ピクチャの1つ又は複数のインデックス値を識別する。1つ又は複数の参照ピクチャの(1つ又は複数の)インデックス値及び(1つ又は複数の)識別子から、ビデオデコーダは、DPBから1つ又は複数の参照ピクチャを取り出し、現在ピクチャのコード化ブロックを復号する。
[0024]現在ピクチャのスライスヘッダに関連するピクチャパラメータセット(PPS)又はシーケンスパラメータセット(SPS)中で、ビデオエンコーダはRPSを信号伝達し得る。現在ピクチャのRPSは、現在ピクチャを予測するために使用され得る参照ピクチャについての識別情報と、復号順序で現在ピクチャに続くピクチャを予測するために使用され得るピクチャについての識別情報とを含む。RPS中の参照ピクチャのみが、リスト0又はリスト1中に含まれ得る。
[0025]コード化ビデオビットストリームにおいて、ビデオコーダ(即ち、ビデオエンコーダ又はビデオデコーダ)は、ピクチャを指すために2つのタイプの値、即ち、概して、ピクチャの出力順序に対応するピクチャ順序カウント(POC)値と、概して、ピクチャの復号順序に対応するフレーム番号(frame_num)値とを利用し得る。概して、「フレーム」と「ピクチャ」という用語は互換的に使用され得る。従って、フレーム番号値はピクチャの復号順序に対応する。
[0026]参照ピクチャについての識別情報は、1つ又は複数のピクチャ順序カウント(POC)値を含み得る。POC値は、コード化ビデオシーケンス内のピクチャが出力又は表示される順序(即ち、ピクチャの表示順序)を示す。例えば、より低いPOC値をもつピクチャは、同じコード化ビデオシーケンス中のより高いPOC値をもつピクチャよりも早く表示される。
[0027]ビデオコード化において、ピクチャ又はピクチャのスライスについてのデータは、一般に、ネットワークアブストラクションレイヤ(NAL:networkabstractionlayer)単位中にカプセル化される。NAL単位は、VCLNAL単位とも呼ばれる、ピクチャ又はスライスについてのコード化データなど、ビデオコード化レイヤ(VCL)データ、又は非VCLNAL単位とも呼ばれる、パラメータセット及び補足エンハンスメント情報(SEI:supplementalenhancementinformation)メッセージなど、非VCLデータを含むことができる。NAL単位は、それぞれのNAL単位中に含まれるデータのタイプを記述するヘッダデータをも含む。例えば、NAL単位は、NAL単位が参照ピクチャについてのデータを含むかどうかを示すnal_ref_flagを含み得る。このようにして、参照ピクチャは、「1」に等しいnal_ref_flagをもつピクチャとして定義され得る。参照ピクチャは、復号順序で後続のピクチャの復号プロセスにおいてインター予測のために使用され得るサンプル(即ち、画素値)を含み得る。
[0028]HEVCでは、2つ以上のタイプの参照ピクチャがあり得る。一例として、HEVCは、「長期参照のために使用される」とマークされた参照ピクチャとして定義され得る、長期参照ピクチャを定義している。更に、本開示の技法は、長期参照ピクチャを信号伝達することを対象とするが、HEVCは短期参照ピクチャをも含み得る。短期参照ピクチャは本開示の範囲外である。
[0029]HEVCは、長期参照ピクチャ(LTRP)を信号伝達し、使用するための技法について説明している。LTRPの従来の信号伝達の一例がHEVCWD6に記載されている。WD6には、LTRPの最下位ビット(LSB)の信号伝達と、LTRPに関係するシンタックス要素のセマンティクスと、参照ピクチャセットの導出とにおける変更を含む、LTRP信号伝達に関する採用された技法も記載されている。HEVCワーキングドラフトへの最近の採用は、シーケンスパラメータセット(SPS)中でのLTRPの信号伝達について説明する技法をも含む。SPS中でのLTRPの信号伝達に関する採用は、HEVCWD7に採用されたJCTVC−I0340r2に記載されており、http://phenix.int-evry.fr/jct/doc_end_user/documents/9_Geneva/wg11/JCTVC-I0340-v3.zipから利用可能である、Ramasubramonianらの、「SignalingofLongtermReferencePicturesintheSPS」、ドキュメントJCTVC−I0340r2、9thMeetingJCT−VCofITU−TSG16WP3andISO/IECJTC1/SC29/WG11、Geneva、Switzerland、2012年4月27日〜2012年5月7日に記載されている。SPS中でLTRPを信号伝達することの詳細を以下に要約する。
[0030]JCTVC−I0340r2に記載されている技法では、SPSは、LTRPがコード化ビデオシーケンスのために信号伝達されるかどうか(即ち、ビデオコーダがインター予測のためにLTRPを使用するか否か)を示すフラグシンタックス要素を含み得る。LTRPがコード化ビデオシーケンスのために信号伝達される場合、コード化ビデオシーケンスのためのアクティブSPS又はスライスヘッダのシンタックス要素が、LTRPについてのPOCのLSBの数を使用してLTRPを指し得る。POCのLSBのみを使用してLTRPを指すことは、コード化効率を改善し、コード化ビデオビットストリームの複雑さを低減し得る。ビデオコーダは、SPS中の各LTRPを参照するために使用されるLTRPLSBの数を第1のシンタックス要素中で信号伝達し、その後、LTRPのPOC値のLSBのリストを信号伝達する。
[0031]コード化ビデオシーケンスにおいて、スライスヘッダがSPSの1つ又は複数のLTRPを継承又は参照し得る。スライスヘッダ中で、ビデオコーダは、SPSから継承されるべきLTRPのPOC値のLSB値を含むリストシンタックス要素を信号伝達する。SPSから継承されるLTRPに加えて、スライスヘッダは、SPSから継承されない追加のLTRPのLSBをも明示的に信号伝達し得る。スライスヘッダは、スライスヘッダ中で明示的に信号伝達されるLTRPのPOC値のLSB値のリストを含むシンタックス要素を含む。
[0032]場合によっては、2つのLTRPがPOCLSBの同じシーケンスを有し、特定のPOCLSBシンタックス要素がどのLTRPを指すかについての曖昧さを生じることがある。シンタックス要素がどのLTRPを指すかを明瞭にするために、スライスヘッダ又はSPSは、復号ピクチャバッファ(DPB)中の2つ以上の参照ピクチャが同じLSBを有する場合、LTRPについての最上位ビット(MSB:mostsignificantbit)のうちの幾つかを信号伝達し得る。LTRPについてのMSBが信号伝達されるかどうかを示すためにフラグシンタックス要素が使用され、LTRPについてのMSB情報の信号伝達は、存在する場合、このフラグの直後に続く。最後に、ビデオコーダは、信号伝達されたLTRPが現在ピクチャによって参照ピクチャとして使用され得るかどうかを示すために、フラグをコード化し得る。SPS及びスライスヘッダ中の関係するシンタックス要素のシンタックス及びセマンティクスについて以下で説明する。シンタックステーブル中に含まれるが、セマンティクスが与えられないこれらシンタックス要素の場合、セマンティクスはHEVCWD6に記載のものと同じである。
[0033]JCTVC−I0340r2は、表1に関して以下で説明するSPSシンタックス及びセマンティクスを与える。
Figure 0006162228
[0034]JCTVC−I0340r2によって変更されたSPSのシンタックス要素のセマンティクスについて以下で説明する。
[0035]num_long_term_ref_pics_spsは、シーケンスパラメータセット中で指定される長期参照ピクチャの数を指定する。num_long_term_ref_pic_setsの値は、両端値を含む0〜32の範囲内であり得る。
[0036]lt_ref_pic_poc_lsb_sps[i]は、シーケンスパラメータセット中で指定されるi番目の長期参照ピクチャのピクチャ順序カウントの最下位ビットを指定する。lt_ref_pic_poc_lsb_sps[i]を表すために使用されるビット数は、log2_max_pic_order_cnt_lsb_minus4+4に等しい。
[0037]JCTVC−I0340r2はまた、表2に関して以下で説明するように、スライスヘッダシンタックス及びセマンティクスを変更した。
Figure 0006162228
[0038]JCTVC−I0340r2によって変更されたスライスヘッダのシンタックス要素のセマンティクスについて以下で説明する。
[0039]num_long_term_picsは、現在ピクチャの長期参照ピクチャセット中に含まれるべきでありスライスヘッダ中で直接信号伝達される、長期参照ピクチャの数を指定する。num_long_term_picsの値は、両端値を含む0〜sps_max_dec_pic_buffering[sps_max_temporal_layers_minus1]−NumNegativePics[StRpsIdx]−NumPositivePics[StRpsIdx]−num_long_term_spsの範囲内である。存在しないとき、ビデオコーダは、num_long_term_picsの値が0に等しいと推測する。
[0040]num_long_term_spsは、アクティブシーケンスパラメータセット中で指定され現在ピクチャの長期参照ピクチャセット中に含まれるべきである、長期参照ピクチャの数を指定する。num_long_term_spsが存在しないとき、ビデオコーダは、値が0に等しいと推測する。num_long_term_spsの値は、両端値を含む0〜Min(num_long_term_ref_pics_sps,max_dec_pic_buffering[max_temporal_layers_minus1]−NumNegativePics[StRpsIdx]−NumPositivePics[StRpsIdx]−num_long_term_pics)の範囲内中である。
[0041]long_term_idx_sps[i]は、参照されるシーケンスパラメータセットから現在ピクチャの長期参照ピクチャセットに継承されるi番目の長期参照ピクチャの、アクティブシーケンスパラメータセット中で指定される長期参照ピクチャのリストに対するインデックスを指定する。long_term_idx_sps[i]の値は、両端値を含む0〜num_long_term_ref_pics_sps−1の範囲内である。
[0042]poc_lsb_lt[i]は、現在ピクチャの長期参照ピクチャセット中に含まれるi番目の長期参照ピクチャのピクチャ順序カウント値の最下位ビットの値を指定する。poc_lsb_lt[i]シンタックス要素の長さはlog2_max_pic_order_cnt_lsb_minus4+4ビットである。両端値を含むnum_long_term_sps〜num_long_term_pics+num_long_term_sps−1の範囲内のj及びkの任意の値について、jがkよりも小さい場合、poc_lsb_lt[j]はpoc_lsb_lt[k]以上であるものとする。
[0043]変数PocLsbLt[i]は次のように導出される。
if(i<num_long_term_sps)
PocLsbLt[i]=lt_ref_pic_poc_lsb_sps[long_term_idx_sps[i]]
else
PocLsbLt[i]=poc_lsb_lt[i].
[0044]即ち、インデックス0〜num_long_term_spsの場合、PocLsbLt[i]の値は、スライスヘッダ中で信号伝達されるlt_ref_pic_poc_lsb_spsへのインデックスを使用して取得される。num_long_term_spsよりも大きいPocLsbLtのインデックスの場合、PocLsbLt[i]の値は、スライスヘッダ中で明示的に信号伝達されるLTRPのPOCLSBである。
[0045]1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]シンタックス要素が存在することを指定する。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを指定し、従って、PocLsbLt[i]に等しいLSBを有するただ1つの参照ピクチャがDPB中にあるので、MSBはスライスヘッダについて信号伝達されない。PocLsbLt[i]に等しいピクチャ順序カウント値の最下位ビットをもつ2つ以上の参照ピクチャが復号ピクチャバッファ中にあるとき、delta_poc_msb_present_flag[i]は1に等しい。
[0046]delta_poc_msb_cycle_lt[i]は、現在ピクチャの長期参照ピクチャセット中に含まれるi番目の長期参照ピクチャのピクチャ順序カウント値の最上位ビットの値を決定するために使用される。ビデオコーダは、delta_poc_msb_cycle_lt[i]の値を使用してi番目のLTRPのMSBを決定する。
[0047]変数DeltaPocMSBCycleLt[i]は、以下の擬似コードにおいて説明するように導出され得る。
if(i==0||PocLsbLt[i-1]!=PocLsbLt[i])
DeltaPocMSBCycleLt[i]=delta_poc_msb_cycle_lt[i]
else
DeltaPocMSBCycleLt[i]=delta_poc_msb_cycle_lt[i]+
DeltaPocMSBCycleLt[i-1]
[0048]DeltaPocMSBCycleLt[i]*MaxPicOrderCntLsb+pic_order_cnt_lsb−PocLsbLt[i]の値は、JCTVC−I0340r2に準拠する技法の場合、両端値を含む1〜224−1の範囲内である。
[0049]0に等しいused_by_curr_pic_lt_flag[i]は、現在ピクチャの長期参照ピクチャセット中に含まれるi番目の長期参照ピクチャが現在ピクチャによって参照のために使用されないことを指定する。従って、used_by_curr_pic_lt_flag[i]の値に基づいて、SPSから継承されるか又はスライスヘッダ中で明示的に信号伝達される参照ピクチャのサブセットが、現在ピクチャによって参照のために使用され得る。
[0050]JCTVC−I0340r2はまた、参照ピクチャセットのための復号プロセスを変更した。JCTVC−I0340r2によれば、このプロセスは、スライスヘッダの復号の後で、但しどのコード化単位の復号にも先立って、及びHEVCWD6の8.3.3項において指定されるようなスライスの参照ピクチャリスト構築のための復号プロセスに先立って、ピクチャごとに一度呼び出される。このプロセスにより、1つ又は複数の参照ピクチャを「参照のために使用されない」とマークすることになり得る。JCTVC−I0340r2はHEVCWD6への以下の変更を含む。
for(i=0,j=0,k=0;i<NumNegativePics[StRpsIdx];i++)
if(UsedByCurrPicS0[StRpsIdx][i])
PocStCurrBefore[j++]=PicOrderCntVal+DeltaPocS0[StRpsIdx][i]
else
PocStFoll[k++]=PicOrderCntVal+DeltaPocS0[StRpsIdx][i]
NumPocStCurrBefore=j

for(i=0,j=0;i<NumPositivePics[StRpsIdx];i++)
if(UsedByCurrPicS1[StRpsIdx][i])
PocStCurrAfter[j++]=PicOrderCntVal+DeltaPocS1[StRpsIdx][i]
else
PocStFoll[k++]=PicOrderCntVal+DeltaPocS1[StRpsIdx][i]
NumPocStCurrAfter=j
NumPocStFoll=k(8-5)
for(i=0,j=0,k=0;i<num_long_term_sps+num_long_term_pics;i++)
if(delta_poc_msb_present_flag[i])
if(used_by_curr_pic_lt_flag[i])
PocLtCurr[j++]=PicOrderCntVal-DeltaPocMSBCycleLt[i]*
MaxPicOrderCntLsb-
pic_order_cnt_lsb+PocLsbLt[i]
else
PocLtFoll[k++]=PicOrderCntVal-DeltaPocMSBCycleLt[i]*
MaxPicOrderCntLsb - pic_order_cnt_lsb+
PocLsbLt[i]
else
if(used_by_curr_pic_lt_flag[i])
PocLtCurr[j++]=PocLsbLt[i]
else
PocLtFoll[k++]=PocLsbLt[i]
NumPocLtCurr=j
NumPocLtFoll=k
[0051]LTRPを信号伝達するための既存の設計に関連する潜在的問題のうちの1つは、フラグdelta_poc_msb_present_flag[i]のセマンティクスに関する。上記で説明したように最新のセマンティクスでは、PocLsbLt[i]に等しいピクチャ順序カウント値の最下位ビットをもつ2つ以上の参照ピクチャが復号ピクチャバッファ中にあるとき、delta_poc_msb_present_flag[i]は1に等しい。従って、delta_poc_msb_present_flag[i]の値は、復号ピクチャバッファ(DPB)中の参照ピクチャに依存する。「参照のために使用されない」とマークされた参照ピクチャがDPB中にある場合でも、delta_poc_msb_present_flag[i]の値はまた、それらピクチャに依存することになる。「参照のために使用されない」とマークされたDPB中のピクチャは、存在し、出力されるのを待っているのみで、もはや参照のために使用されないので、これは望ましくないことがある。そのようなピクチャがDPB中に存在するかどうかは、概して、デコーダ出力スケジュールに依存する。
[0052]ビットストリームを仮定すれば、システム及び適用例は、復号ピクチャを記憶するために使用され得る利用可能なメモリに基づいて、異なる出力スケジュールを適用し得る。従って、そのようなピクチャをカウントすることは、delta_poc_msb_present_flag[i]の値が1になるよう要求し、従ってLTRPを信号伝達するためにより多くのビットを要求する可能性を不必要に高めることがあるだけでなく、ビットストリーム準拠及び相互運用性問題をももたらすことがある。一例として、(必要な最小のDPBメモリを厳密に使用するデコーダと比較して)デコーダが、必要な最小値よりも多いDPBメモリを実際に使用するとき、準拠するビットストリームが、出力されるのを待っているのみでもはや参照のために使用されないより多くのピクチャのように、デコーダに準拠しないように見え得、DPB中に存在し得、従って、デコーダは、ビットストリームを正しく復号することさえ可能でないことがある。
[0053]上述のセマンティクスに伴う別の潜在的問題は、long_term_idx_sps[i]の信号伝達に関する。上記で説明したセマンティクスは、SPSから継承されるLTRPが信号伝達される順序を制限しない。ビデオコーダは、LTRPのMSB及びLSBなど、情報を信号伝達するために必要であるビットよりも多くのビットを利用し得るので、順序制限のこの欠如は非効率的でもあり得る。一例として、MaxPicOrderCntLsbが256に等しく、2つのLSB、0及び10がSPS中で信号伝達されると仮定する。POC2560をもつピクチャの場合、ビデオコーダが、それぞれPOC0、10、及び256を有する3つのLTRPを信号伝達すると仮定する。POC0及び256をもつピクチャの場合、上記で説明したLTRP信号伝達技法に準拠するビデオエンコーダは、両方のLTRPのためのMSBサイクルを信号伝達しなければならないであろう。しかしながら、本開示の技法は、そのような信号伝達の効率を改善し得る。詳細には、幾つかの非効率が以下の表3によって示される。即ち、表3は、対応するSPSから継承されるLTRPの非効率的な信号伝達の一例を与える。この例では、「i」は、特定の長期参照ピクチャを記述し、LTRPPOCは、対応する長期参照ピクチャのPOC値を記述し、PocLsbLtは、SPSから継承される長期参照ピクチャのPOC値の最下位ビット(LSB)を記述し、delta_poc_msb_present_flagは、delta_poc_msb_cycle_ltが信号伝達されるかどうかを示し、信号伝達されるとき、delta_poc_msb_cycle_ltが、長期参照ピクチャのPOC値の最上位ビット(MSB)の値を決定するために使用される。
Figure 0006162228
[0054]本開示は、幾つかの事例において上記で説明した信号伝達技法に勝る利点を与え得る、長期参照ピクチャについての識別情報を信号伝達するための技法について説明する。幾つかの例では、本開示の技法は、LTRPのMSBを含むシンタックス要素を信号伝達するために使用されるビット数を低減し得る。ピクチャを信号伝達する1つのより良い方法は、LTRPのピクチャコード化順序、即ち、LTRPがpoc_lsb_lt[i]においてコード化される順序を、表4に記載されているように、LTRPのLSBが非減少(又は、実質的に同様の性能効果をもつ、非増加)のいずれかであるように定義することであり得る。LTRPのLSBを非減少又は非増加順序でコード化することは、幾つかの例では、ビデオコーダがより少ないMSBビットを信号伝達することになり得る。LTRPを非増加又は非減少LSB順序で順序付けることによって、ビデオコーダは、等しいLSBをもつLTRPを、poc_lsb_ltシンタックス要素のピクチャコード化順序で連続的に信号伝達することになる。
[0055]2つのLTRPが等しいLSB値を有する場合、ビデオコーダは、2つのLTRPのうちの少なくとも1つのMSBを表すデータ(例えば、delta_poc_msb_cycle_ltシンタックス要素)をコード化し得る。ビデオコーダは、第2のLTRPのMSB値と第1のLTRPのMSBとの差分としてMSBを表すデータを符号化し得る。delta_poc_msb_cycle_lt[i]の信号伝達された値からLTRPのMSB値を決定するために、ビデオコーダは、変数DeltaPocMSBCycleLt[i]をdelta_poc_msb_cycle_lt[i]とdelta_poc_msb_cycle_lt[i−1]との和として計算し得る。ピクチャコード化順序で前のLTRPがない場合、ビデオコーダは、delta_poc_msb_cycle_ltシンタックス要素の値においてLTRPのMSBと現在ピクチャのMSBとの差分を信号伝達し得る。
[0056]一例として、表3に示されたLTRPMSB信号伝達のための前の技法を使用して、ビデオコーダは、ピクチャカウント順序で第1のLTRP(i=0)としての0のPOC値と、POC0についての10としてのdelta_poc_msb_cycle_ltの値とをもつLTRPを信号伝達し得る。ビデオコーダは、ピクチャカウント順序で第3のLTRP(即ち、i=2)としてのPOC値256と、LTRPについての9としてのdelta_poc_msb_cycle_lt値とをもつLTRPを信号伝達し得る。
[0057]表3に関して説明したビデオコード化技法は、POC0についてのdelta_poc_msb_cycle_ltの値として10を信号伝達するが、本開示の技法に準拠するビデオコーダは、現在LTRPのPOCのMSBサイクル値と前のLTRPのPOCのMSBとの間の差分であり得るオフセットとして、LTRPのMSBを再生するために使用され得るデータを信号伝達し得る。表4に示されているように、ビデオコーダは、SPSから継承される各LTRPのLSBの非減少順序(non-decreasingorder)でのピクチャカウント順序を制限し得る。この順序付けの結果は、0に等しいLSBを両方が有するPOC256をもつLTRPとPOC0をもつLTRPとが、ピクチャカウント順序でそれぞれ第1、第2に順序付けられ、POC10をもつLTRPが第3に順序付けられることである。ビデオコーダは、それがピクチャカウント順序で第1のLTRPであるので、POC256をもつLTRPのMSBサイクル値を9として信号伝達し、第2のLTRPのMSBサイクル値を、現在LTRPMSB(10)と前のLTRPMSB(9)との間の差分、即ち、10−9=1として信号伝達し、従って、ビデオコーダは、delta_poc_msb_cycle_lt[i]の値として1を信号伝達する。1の値を信号伝達することは、値10を信号伝達することと比較してより少ないビットを必要とし、その結果、この例では、delta_poc_msb_cycle_ltシンタックス要素の信号伝達のためのコード化効率の改善が生じ得る。従って、表4に関して説明した本開示の技法は、コード化ビデオシーケンスのための対応するSPSから継承されるLTRPのPOC値についてのMSBを信号伝達するために必要とされるビット数を低減し得る。
Figure 0006162228
[0058]上記で説明したように、長期参照ピクチャ(LTRP)のMSBを信号伝達することに関連する上述した問題を克服するために、本開示は、明示的に、LTRPのPOC値のLSBをスライスヘッダ中で信号伝達することによって、又はさもなければ、LTRPのPOCのLSBを決定するSPS中のLTRPのLSBのリスト中のエントリに対するインデックスをスライスヘッダ中で信号伝達することによってのいずれかで、コード化ピクチャのSPS中に含まれるべきLTRPを信号伝達することと、コード化ピクチャシーケンスのスライスヘッダ中でLTRPをインデックス付けすることとを行うための様々な技法について説明する。本開示は、フラグの値が、「参照のために使用される」とマークされたピクチャのみに依存することを保証するために適用され得るdelta_poc_msb_present_flag[i]のセマンティクスへの変更についても説明する。これら及び他の技法について以下でより詳細に説明する。
[0059]図1は、SPS又はスライスヘッダ中でLTRPについてのデータを信号伝達するための技法を利用し得る例示的なビデオ符号化及び復号システム10を示すブロック図である。図1に示されているように、システム10は、宛先機器14によって後で復号されるべき符号化ビデオデータを与える発信源機器12を含む。特に、発信源機器12は、コンピュータ可読媒体16を介してビデオデータを宛先機器14に与える。発信源機器12及び宛先機器14は、デスクトップコンピュータ、ノートブック(即ち、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、所謂「スマート」フォンなどの電話ハンドセット、所謂「スマート」パッド、テレビジョン、カメラ、表示装置、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミング機器などを含む、広範囲にわたる機器のいずれかを備え得る。場合によっては、発信源機器12及び宛先機器14は、ワイヤレス通信のために装備され得る。
[0060]宛先機器14は、コンピュータ可読媒体16を介して復号されるべき符号化ビデオデータを受信し得る。コンピュータ可読媒体16は、発信源機器12から宛先機器14に符号化ビデオデータを移動させることができる任意のタイプの媒体又は機器を備え得る。一例では、コンピュータ可読媒体16は、発信源機器12が、符号化ビデオデータを宛先機器14にリアルタイムで直接送信することを可能にするための通信媒体を備え得る。符号化ビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先機器14に送信され得る。通信媒体は、無線周波数(RF)スペクトルあるいは1つ又は複数の物理伝送線路など、任意のワイヤレス又はワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、又はインターネットなどのグローバルネットワークなど、パケットベースネットワークの一部を形成し得る。通信媒体は、発信源機器12から宛先機器14への通信を可能にするために有用であり得るルータ、スイッチ、基地局、又は任意の他の機器を含み得る。
[0061]幾つかの例では、符号化データは、出力インターフェース22から記憶装置に出力され得る。同様に、符号化データは、入力インターフェースによって記憶装置からアクセスされ得る。記憶装置は、ハードドライブ、Blu−ray(登録商標)ディスク、DVD、CD−ROM、フラッシュメモリ、揮発性又は不揮発性メモリ、又は符号化ビデオデータを記憶するための任意の他の好適なデジタル記憶媒体など、様々な分散された若しくはローカルにアクセスされるデータ記憶媒体のいずれかを含み得る。更なる一例では、記憶装置は、発信源機器12によって生成された符号化ビデオを記憶し得るファイルサーバ又は別の中間記憶装置に対応し得る。宛先機器14は、ストリーミング又はダウンロードを介して記憶装置から、記憶されたビデオデータにアクセスし得る。ファイルサーバは、符号化ビデオデータを記憶し、その符号化ビデオデータを宛先機器14に送信することが可能な任意のタイプのサーバであり得る。例示的なファイルサーバとしては、(例えば、ウェブサイトのための)ウェブサーバ、FTPサーバ、ネットワーク接続ストレージ(NAS)機器、又はローカルディスクドライブがある。宛先機器14は、インターネット接続を含む、任意の標準のデータ接続を介して符号化ビデオデータにアクセスし得る。これは、ファイルサーバに記憶された符号化ビデオデータにアクセスするのに好適であるワイヤレスチャネル(例えば、Wi−Fi(登録商標)接続)、ワイヤード接続(例えば、DSL、ケーブルモデムなど)、又はその両方の組合せを含み得る。記憶装置からの符号化ビデオデータの送信は、ストリーミング送信、ダウンロード送信、又はそれらの組合せであり得る。
[0062]本開示の技法は、必ずしもワイヤレス適用例又は設定に限定されるとは限らない。本技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、動的適応ストリーミングオーバーHTTP(DASH:dynamicadaptivestreamingoverHTTP)などのインターネットストリーミングビデオ送信、データ記憶媒体上に符号化されたデジタルビデオ、データ記憶媒体に記憶されたデジタルビデオの復号、又は他の適用例など、様々なマルチメディア適用例のいずれかをサポートするビデオコード化に適用され得る。幾つかの例では、システム10は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、及び/又はビデオテレフォニーなどの適用例をサポートするために、一方向又は双方向のビデオ送信をサポートするように構成され得る。
[0063]図1の例では、発信源機器12は、ビデオ発信源18と、ビデオエンコーダ20と、出力インターフェース22とを含む。宛先機器14は、入力インターフェース28と、ビデオデコーダ30と、表示装置32とを含む。本開示によれば、発信源機器12のビデオエンコーダ20は、LTRPについてのデータをSPS中で信号伝達するための技法を適用するように構成され得る。他の例では、発信源機器及び宛先機器は他の構成要素又は構成を含み得る。例えば、発信源機器12は、外部カメラなど、外部ビデオ発信源18からビデオデータを受信し得る。同様に、宛先機器14は、内蔵表示装置を含むのではなく、外部表示装置とインターフェースし得る。
[0064]図1の図示のシステム10は一例にすぎない。LTRPについてのデータをSPS中で信号伝達するための技法は、任意のデジタルビデオ符号化及び/又は復号機器によって実行され得る。概して、本開示の技法はビデオ符号化機器によって実行されるが、本技法は、一般に「コーデック」と呼ばれるビデオエンコーダ/デコーダによっても実行され得る。その上、本開示の技法は、ビデオプリプロセッサによっても実行され得る。発信源機器12及び宛先機器14は、発信源機器12が宛先機器14に送信するためのコード化ビデオデータを生成するような、コード化機器の例にすぎない。幾つかの例では、機器12、14は、機器12、14の各々がビデオ符号化構成要素とビデオ復号構成要素とを含むように、実質的に対称的に動作し得る。従って、システム10は、例えば、ビデオストリーミング、ビデオ再生、ビデオブロードキャスト、又はビデオテレフォニーのためのビデオ機器12とビデオ機器14との間の一方向又は双方向のビデオ送信をサポートし得る。
[0065]発信源機器12のビデオ発信源18は、ビデオカメラなどの撮像装置、前に撮影されたビデオを含んでいるビデオアーカイブ、及び/又はビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェースを含み得る。更なる代替として、ビデオ発信源18は、発信源ビデオとしてのコンピュータグラフィックスベースのデータ、又はライブビデオとアーカイブビデオとコンピュータ生成ビデオとの組合せを生成し得る。場合によっては、ビデオ発信源18がビデオカメラである場合、発信源機器12及び宛先機器14は、所謂カメラフォン又はビデオフォンを形成し得る。但し、上述のように、本開示で説明する技法は、概してビデオコード化に適用可能であり得、ワイヤレス及び/又はワイヤード適用例に適用され得る。各場合において、撮影されたビデオ、前に撮影されたビデオ、又はコンピュータ生成ビデオは、ビデオエンコーダ20によって符号化され得る。符号化ビデオ情報は、次いで、出力インターフェース22によってコンピュータ可読媒体16上に出力され得る。
[0066]コンピュータ可読媒体16は、ワイヤレスブロードキャスト又はワイヤードネットワーク送信などの一時媒体、若しくはハードディスク、フラッシュドライブ、コンパクトディスク、デジタルビデオディスク、Blu−rayディスク、又は他のコンピュータ可読媒体などの記憶媒体(即ち、非一時的記憶媒体)を含み得る。幾つかの例では、ネットワークサーバ(図示せず)は、発信源機器12から符号化ビデオデータを受信し、例えば、ネットワーク送信を介して、その符号化ビデオデータを宛先機器14に与え得る。同様に、ディスクスタンピング設備など、媒体製造設備のコンピュータ機器は、発信源機器12から符号化ビデオデータを受信し、その符号化ビデオデータを含んでいるディスクを生成し得る。従って、コンピュータ可読媒体16は、様々な例において、様々な形態の1つ又は複数のコンピュータ可読媒体を含むことが理解されよう。
[0067]宛先機器14の入力インターフェース28は、コンピュータ可読媒体16から情報を受信する。コンピュータ可読媒体16の情報は、ビデオエンコーダ20によって定義され、またビデオデコーダ30によって使用される、ブロック及び他のコード化単位、例えば、GOPの特性及び/又は処理を記述するシンタックス要素を含む、シンタックス情報を含み得る。表示装置32は、復号ビデオデータをユーザに対して表示し、陰極線管(CRT)、液晶表示器(LCD)、プラズマ表示器、有機発光ダイオード(OLED)表示器、又は別のタイプの表示装置など、様々な表示装置のいずれかを備え得る。
[0068]ビデオエンコーダ20及びビデオデコーダ30は、現在開発中の高効率ビデオコード化(HEVC)規格などのビデオコード化規格に従って動作し得、HEVCテストモデル(HM)に準拠し得る。代替的に、ビデオエンコーダ20及びビデオデコーダ30は、代替的にMPEG−4,Part10,AdvancedVideoCoding(AVC)と呼ばれるITU−TH.264規格など、他のプロプライエタリ規格又は業界規格、又はそのような規格の拡張に従って動作し得る。但し、本開示の技法は、いかなる特定のコード化規格にも限定されない。ビデオコード化規格の他の例には、MPEG−2及びITU−TH.263がある。図1には示されていないが、幾つかの態様では、ビデオエンコーダ20及びビデオデコーダ30は、それぞれオーディオエンコーダ及びオーディオデコーダと統合され得、適切なMUX−DEMUXユニット、又は他のハードウェア及びソフトウェアを含んで、共通のデータストリーム又は別個のデータストリーム中のオーディオとビデオの両方の符号化を処理し得る。適用可能な場合、MUX−DEMUXユニットはITUH.223マルチプレクサプロトコル、又はユーザデータグラムプロトコル(UDP)などの他のプロトコルに準拠し得る。
[0069]ITU−TH.264/MPEG−4(AVC)規格は、JointVideoTeam(JVT)として知られる共同パートナーシップの成果として、ISO/IECMovingPictureExpertsGroup(MPEG)とともにITU−TVideoCodingExpertsGroup(VCEG)によって策定された。幾つかの態様では、本開示で説明する技法は、H.264規格に概して準拠する機器に適用され得る。H.264規格は、ITU−TStudyGroupによる2005年3月付けのITU−T勧告H.264「AdvancedVideoCodingforgenericaudiovisualservices」に記載されており、本明細書ではH.264規格又はH.264仕様、あるいはH.264/AVC規格又は仕様と呼ぶことがある。JointVideoTeam(JVT)はH.264/MPEG−4AVCへの拡張に取り組み続けている。
[0070]ビデオエンコーダ20及びビデオデコーダ30はそれぞれ、1つ又は複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアなど、様々な好適なエンコーダ回路のいずれか、あるいはそれらの任意の組合せとして実装され得る。本技法が部分的にソフトウェアで実装されるとき、機器は、好適な非一時的コンピュータ可読媒体にソフトウェアの命令を記憶し、1つ又は複数のプロセッサを使用してその命令をハードウェアで実行して、本開示の技法を実行し得る。ビデオエンコーダ20及びビデオデコーダ30の各々は1つ又は複数のエンコーダ又はデコーダ中に含まれ得、そのいずれも、それぞれの機器において複合エンコーダ/デコーダ(コーデック)の一部として統合され得る。
[0071]JCT−VCは、HEVC規格の開発に取り組んでいる。HEVC規格化の取り組みは、HEVCテストモデル(HM)と呼ばれるビデオコード化機器の発展的モデルに基づく。HMは、例えば、ITU−TH.264/AVCに従う既存の機器に対してビデオコード化機器の幾つかの追加の能力を仮定する。例えば、H.264は9つのイントラ予測符号化モードを提供するが、HMは33個ものイントラ予測符号化モードを提供し得る。
[0072]概して、HMの作業モデルは、ビデオフレーム又はピクチャが、ルーマとクロマの両方のサンプルを含む一連のツリーブロック又は最大コード化単位(LCU:largestcodingunit)(「コード化ツリー単位」とも呼ばれる)に分割され得ることを記述する。ビットストリーム内のシンタックスデータが、画素の数に関して最大コード化単位であるLCUのサイズを定義し得る。スライスは、コード化順序で幾つかの連続するツリーブロックを含む。ビデオフレーム又はピクチャは、1つ又は複数のスライスに区分され得る。各ツリーブロックは、4分木(quadtree)に従ってコード化単位(CU)に分割され得る。一般に、4分木データ構造はCUごとに1つのノードを含み、ルートノードはツリーブロックに対応する。CUが4つのサブCUに分割された場合、CUに対応するノードは4つのリーフノードを含み、リーフノードの各々はサブCUのうちの1つに対応する。
[0073]従って、ビデオエンコーダ20は、ピクチャのスライスを形成する一連のLCUを符号化し得る。その上、ビデオエンコーダ20は、スライスのためのスライスヘッダを符号化するために本開示の技法を利用し得る。スライスヘッダは、スライスの復号中に使用され得るデータを含み得る。例えば、スライスヘッダは、スライス中に含まれるビデオデータの復号中に使用され得る参照ピクチャを示すデータを含み得る。本開示の技法によれば、ビデオエンコーダ20は、特定の長期参照ピクチャについての識別情報を表すデータがスライスヘッダ中で明示的にコード化されるかどうか、又はそのような識別情報が、スライスがその中に発生するピクチャを含むシーケンスピクチャに対応するシーケンスパラメータセット(SPS)から継承されるかどうかを示すスライスヘッダのデータを符号化し得る。
[0074]同様に、ビデオデコーダ30は、特定の長期参照ピクチャについての識別情報がスライスヘッダ中で明示的にコード化されるかどうか、又は識別情報が、スライスに対応するSPSから継承されるかどうかを示すデータを復号することを含み得る、スライスヘッダを復号するための本開示の技法を利用し得る。スライスヘッダが、識別情報が明示的にコード化されることを示す場合、ビデオデコーダ30は、スライスヘッダからの長期参照ピクチャについての識別情報を復号し得る。しかしながら、スライスヘッダが、識別情報がSPSから継承されることを示す場合、ビデオデコーダ30は、SPSからSPSについて識別情報を取り出し得る。スライスヘッダをコード化するための技法について以下でより詳細に説明する。
[0075]4分木データ構造の各ノードは、対応するCUにシンタックスデータを与え得る。例えば、4分木のノードは、そのノードに対応するCUがサブCUに分割されるかどうかを示す分割フラグを含み得る。CUのシンタックス要素は、再帰的に定義され得、CUがサブCUに分割されるかどうかに依存し得る。CUが更に分割されない場合、そのCUはリーフCUと呼ばれる。本開示では、元のリーフCUの明示的分割が存在しない場合でも、リーフCUの4つのサブCUをリーフCUとも呼ぶ。例えば、16×16サイズのCUが更に分割されない場合、この16×16CUが決して分割されなくても、4つの8×8サブCUをリーフCUとも呼ぶ。
[0076]CUは、CUがサイズ差異を有さないことを除いて、H.264規格のマクロブロックと同様の目的を有する。例えば、ツリーブロックは、4つの子ノード(サブCUとも呼ばれる)に分割され得、各子ノードは、今度は親ノードとなり、別の4つの子ノードに分割され得る。4分木のリーフノードと呼ばれる、最終的な分割されていない子ノードは、コード化ノードを備え、リーフCUとも呼ばれる。コード化ビットストリームに関連するシンタックスデータは、最大CU深度と呼ばれる、ツリーブロックが分割され得る最大回数を定義し得、また、コード化ノードの最小サイズを定義し得る。それに応じて、ビットストリームは最小コード化単位(SCU:smallestcodingunit)をも定義し得る。本開示では、HEVCのコンテキストにおけるCU、PU、又はTU、あるいは他の規格のコンテキストにおける同様のデータ構造(例えば、H.264/AVCにおけるマクロブロック及びそれのサブブロック)のいずれかを指すために「ブロック」という用語を使用する。
[0077]CUは、コード化ノードと、そのコード化ノードに関連する予測単位(PU:predictionunit)及び変換単位(TU:transformunit)とを含む。CUのサイズは、コード化ノードのサイズに対応し、形状が方形でなければならない。CUのサイズは、8×8画素から最大64×64以上の画素をもつツリーブロックのサイズまでに及び得る。各CUは、1つ又は複数のPUと、1つ又は複数のTUとを含み得る。CUに関連するシンタックスデータは、例えば、CUを1つ又は複数のPUに区分することを記述し得る。区分モードは、CUが、スキップモード符号化又はダイレクトモード符号化されるか、イントラ予測モード符号化されるか、若しくはインター予測モード符号化されるかの間で異なり得る。PUは、形状が非方形になるように区分され得る。CUに関連するシンタックスデータは、例えば、4分木に従ってCUを1つ又は複数のTUに区分することも記述し得る。TUは、形状が正方形又は非正方形(例えば、矩形)であり得る。
[0078]HEVC規格は、CUごとに異なり得るTUに従う変換を可能にする。TUは、一般に、区分されたLCUについて定義された所与のCU内のPUのサイズに基づいてサイズ決定されるが、常にそうであるとは限らない。TUは、一般にPUと同じサイズであるか又はPUよりも小さい。幾つかの例では、CUに対応する残差サンプルは、「残差4分木」(RQT:residualquadtree)として知られる4分木構造を使用してより小さい単位に再分割され得る。RQTのリーフノードは変換単位(TU)と呼ばれることがある。TUに関連する画素差分値は、変換されて変換係数が生成され得、その変換係数は量子化され得る。
[0079]リーフCUは、1つ又は複数の予測単位(PU)を含み得る。概して、PUは、対応するCUの全部又は一部分に対応する空間的エリアを表し、そのPUの参照サンプルを取り出すためのデータを含み得る。その上、PUは、予測に関係するデータを含む。例えば、PUがイントラモード符号化されるとき、PUのデータは、PUに対応するTUのイントラ予測モードを記述するデータを含み得る残差クワッドツリー(RQT)中に含まれ得る。別の例として、PUがインターモード符号化されるとき、PUは、PUのための1つ又は複数の動きベクトルを定義するデータを含み得る。PUの動きベクトルを定義するデータは、例えば、動きベクトルの水平成分、動きベクトルの垂直成分、動きベクトルの解像度(例えば、1/4画素精度又は1/8画素精度)、動きベクトルが指す参照ピクチャ、及び/又は動きベクトルの参照ピクチャリスト(例えば、リスト0、リスト1、又はリストC)を記述し得る。
[0080]1つ又は複数のPUを有するリーフCUはまた、1つ又は複数の変換単位(TU)を含み得る。変換単位は、上記で説明したように、(TU4分木構造とも呼ばれる)RQTを使用して指定され得る。例えば、分割フラグは、リーフCUが4つの変換単位に分割されるかどうかを示し得る。次いで、各変換単位は、更なるサブTUに更に分割され得る。TUが更に分割されないとき、そのTUはリーフTUと呼ばれることがある。概して、イントラコード化の場合、リーフCUに属する全てのリーフTUは同じイントラ予測モードを共有する。即ち、概して、リーフCUの全てのTUの予測値を計算するために同じイントラ予測モードが適用される。イントラコード化の場合、ビデオエンコーダは、イントラ予測モードを使用して各リーフTUの残差値を、TUに対応するCUの一部と元のブロックとの間の差分として計算し得る。TUは、必ずしもPUのサイズに制限されるとは限らない。従って、TUは、PUよりも大きいことも小さいこともある。イントラコード化の場合、PUは、同じCUの対応するリーフTUと同一位置に配置され得る。幾つかの例では、リーフTUの最大サイズは、対応するリーフCUのサイズに対応し得る。
[0081]その上、リーフCUのTUはまた、残差4分木(RQT)と呼ばれる、それぞれの4分木データ構造に関連付けられ得る。即ち、リーフCUは、リーフCUがどのようにTUに区分されるかを示す4分木を含み得る。TU4分木のルートノードは概してリーフCUに対応し、CU4分木のルートノードは概してツリーブロック(又はLCU)に対応する。分割されないRQTのTUはリーフTUと呼ばれる。概して、本開示では、特に明記しない限り、リーフCU及びリーフTUに言及するためにそれぞれCU及びTUという用語を使用する。
[0082]ビデオシーケンスは、一般に、一連のビデオフレーム又はピクチャを含む。ピクチャグループ(GOP)は、概して、ビデオピクチャのうちの一連の1つ又は複数を備える。GOPは、GOP中に含まれる幾つかのピクチャを記述するシンタックスデータを、GOPのヘッダ中、ピクチャのうちの1つ又は複数のヘッダ中、又は他の場所に含み得る。ピクチャの各スライスは、それぞれのスライスの符号化モードを記述するスライスシンタックスデータを含み得る。ビデオエンコーダ20は、一般に、ビデオデータを符号化するために個々のビデオスライス内のビデオブロックに対して動作する。ビデオブロックはCU内のコード化ノードに対応し得る。ビデオブロックは、固定サイズ又は可変サイズを有し得、指定のコード化規格に応じてサイズが異なり得る。
[0083]一例として、HMは、様々なPUサイズでの予測をサポートする。特定のCUのサイズが2N×2Nであると仮定すると、HMは、2N×2N又はN×NのPUサイズでのイントラ予測をサポートし、2N×2N、2N×N、N×2N、又はN×Nの対称的なPUサイズでのインター予測をサポートする。HMはまた、2N×nU、2N×nD、nL×2N、及びnR×2NのPUサイズでのインター予測のための非対称区分化をサポートする。非対称区分化では、CUの一方向は区分されないが、他の方向は25%と75%とに区分される。25%の区分に対応するCUの部分は、「n」とその後ろに付く「Up」、「Down」、「Left」、又は「Right」という表示によって示される。従って、例えば、「2N×nU」は、上部の2N×0.5NPUと下部の2N×1.5NPUとで水平方向に区分された2N×2NCUを指す。
[0084]本開示では、「N×N(NxN)」及び「N×N(NbyN)」は、垂直寸法及び水平寸法に関するビデオブロックの画素寸法、例えば、16×16(16x16)画素又は16×16(16by16)画素を指すために互換的に使用され得る。概して、16×16ブロックは、垂直方向に16画素を有し(y=16)、水平方向に16画素を有する(x=16)。同様に、N×Nブロックは、概して、垂直方向にN画素を有し、水平方向にN画素を有し、但し、Nは非負整数値(nonnegativeintegervalue)を表す。ブロック中の画素は行と列に構成され得る。その上、ブロックは、必ずしも、水平方向において垂直方向と同じ数の画素を有する必要があるとは限らない。例えば、ブロックはN×M画素を備え得、但し、Mは必ずしもNに等しいとは限らない。
[0085]上述のように、ビデオエンコーダ20及びビデオデコーダ30は、CUのPUをインター予測又はイントラ予測するように構成され得る。概して、インターコード化は、1つ又は複数の参照ピクチャに対する予測を伴う。参照ピクチャは、時間順序で前のピクチャ、将来のピクチャ、又は2つ以上の前に符号化されたピクチャからの予測の組合せであり得る。ビデオエンコーダ20又はビデオエンコーダ20は、参照ピクチャを復号ピクチャバッファ(DPB)に記憶し得る。ビデオエンコーダ20は、ピクチャを短期参照ピクチャ又は長期参照ピクチャとマークすることによってピクチャが参照ピクチャとして使用されるべきことを示すNAL単位値を信号伝達し得る。ビデオエンコーダ20及びビデオデコーダ30は、長期参照ピクチャ及び短期参照ピクチャを参照ピクチャリスト中に記憶する。ビデオエンコーダ20又はビデオエンコーダ20は、長期参照ピクチャを短期参照ピクチャよりも長い時間の間DPBに記憶し得、従って、短期参照ピクチャよりも多くのピクチャのための参照ピクチャとして使用され得る。
[0086]ビデオエンコーダ20又はビデオデコーダ30は、参照ピクチャを幾つかの方法でDPBから削除し得る。参照ピクチャがもはや必要とされないとき、ビデオエンコーダ20又はビデオデコーダ30は、参照ピクチャを参照のためにもはや必要とされないとマークし得、例えば、参照ピクチャを表示のために出力することによって、又は参照ピクチャがすでに表示のために出力されている場合は参照ピクチャを廃棄することによって、参照のためにもはや必要とされないピクチャをDPBから最終的に削除し得る。DPBがいっぱいである場合、ビデオエンコーダ20又はビデオデコーダ30は、最も古い短期参照ピクチャを削除し得る。
[0087]参照ピクチャをDPBに記憶することに加えて、ビデオエンコーダ20又はビデオデコーダ30は、リスト0及びリスト1と呼ばれる、2つの参照ピクチャリストのうちの1つに参照ピクチャを記憶する。特定のピクチャを予測するために使用されるリスト0及びリスト1に記憶された参照ピクチャは、参照ピクチャセット(RPS)と呼ばれることがある。リスト0及びリスト1に記憶されたピクチャは、SPS及びPPSなど、多種多様な発信源に由来し得る。上記で説明したように、スライスヘッダはまた、RPS中に含まれるべきピクチャを明示的に信号伝達し得る。は、例えば、次の瞬時復号リフレッシュ(IDR:instantaneousdecodingrefresh)ピクチャ、又は切断リンクアクセス(BLA:brokenlinkaccess)ピクチャまで、関連ピクチャ又は復号順序で関連ピクチャに続くピクチャ中のブロックのインター予測に使用され得る、復号順序で関連ピクチャに先立つ全ての参照ピクチャからなる、あるピクチャに関連する参照ピクチャのセットとして定義される。言い換えると、参照ピクチャセット中の参照ピクチャは、以下の特性を必要とし得る。即ち、(1)それらは全て、復号順序で現在のピクチャに先立ち、(2)それらは、現在ピクチャをインター予測し、及び/又は現在ピクチャに復号順序で続くどのピクチャも、幾つかの例では、次のIDRピクチャ又はBLAピクチャまで、インター予測するために使用され得る。
[0088]ビデオエンコーダ20又はビデオデコーダ30は、RPSを導出し、そのような導出の後に、参照ピクチャリスト、例えば、リスト0及びリスト1を構成し得る。ビデオエンコーダ20又はビデオデコーダ30は、pスライスを予測するときにリスト0からの参照ピクチャを利用し、双予測スライスを予測するときにリスト0又はリスト1からの参照ピクチャを利用し得る。RPS中の参照ピクチャのみが、参照ピクチャリストを構成するために使用される候補参照ピクチャであり得る。
[0089]参照ピクチャセットを構成するために、ビデオコーダは、複数の参照ピクチャサブセットを構成し得る。WD9には、ビデオデコーダが構成する5つの参照ピクチャサブセットが記載されている。参照ピクチャサブセットの組合せは、参照ピクチャセットを共に形成し得る。例えば、ビデオエンコーダ20は、コード化ビットストリーム中で、参照ピクチャセットに含まれる参照ピクチャのための識別子をビデオデコーダが決定することを可能にする値を明示的に信号伝達し得る。例えば、参照ピクチャの識別子はピクチャ順序カウントであり得る。各ピクチャは1つのPOC値に関連付けられる。ピクチャのPOC値は、復号順序での前のIDRピクチャに対する、対応するピクチャの出力順序又は表示順序を示し、幾つかの他の代替形態では、同じコード化ビデオシーケンス中の他のピクチャの出力順序位置に対する出力順序での関連ピクチャの位置を示す。例えば、コード化ビデオシーケンス内で、より小さいPOC値をもつピクチャは、より大きいPOC値をもつピクチャよりも早く出力又は表示される。
[0090]上記で説明したように、参照ピクチャは、DPBに記憶され、SPS、PPS又はスライスヘッダ中で信号伝達され得る。PPSは、SPSから参照ピクチャのサブセットを継承し得、ビデオエンコーダ20又はビデオデコーダ30が現在ピクチャのインター予測中に使用し得るピクチャを信号伝達するために使用され得る追加の参照ピクチャを信号伝達し得る。ビデオコーダは、参照ピクチャのための識別子、例えば、POC値又は他の識別子を決定し、これらの識別子から、複数の参照ピクチャサブセットを構成し得る。
[0091]参照ピクチャセットに属するピクチャのための識別子をビデオデコーダ30が決定し得る、様々な方法があり得る。概して、ビデオエンコーダ20は、参照ピクチャセットに属するピクチャを含むピクチャのための識別子をビデオデコーダ30がそれから決定し得る値を信号伝達し得る。ピクチャの識別子は、ピクチャの各々についてのPOCであり得る。上述したように、POC値は、ピクチャの表示又は出力順序を示し得、より小さいPOC値をもつピクチャが、より大きいPOC値をもつピクチャよりも早く表示される。所与のピクチャのPOC値は前のIDRピクチャに対し得る。例えば、IDRピクチャについてのPicOrderCnt(即ち、POC値)は0であり得、表示又は出力順序でIDRピクチャの後のピクチャのPOC値は1であり得、表示又は出力順序でPOC値1をもつピクチャの後ののPOC値は2であり得、以下同様である。
[0092]これらの参照ピクチャサブセットから、ビデオデコーダは、以下でより詳細に説明するように、参照ピクチャセットを導出し得る。幾つかの例では、参照ピクチャサブセットの各々は、参照ピクチャサブセット中で参照ピクチャが重複しないという点で、異なる参照ピクチャを含む。このように、参照ピクチャの各々は、参照ピクチャサブセットのうちのただ1つの中に存在し得、他の参照ピクチャサブセット中に存在し得ない。
[0093]参照ピクチャセット又はそれのサブセット中の参照ピクチャの識別子(例えば、POC値)を決定した後、ビデオデコーダは、参照ピクチャサブセットを構成し得る。以下でより詳細に説明するように、ビデオデコーダは、5つの参照ピクチャサブセットを構成し得るが、ビデオデコーダは、より多い又はより少ない参照ピクチャサブセットを構成することが可能であり得る。
[0094]これらの5つの参照ピクチャサブセットは、RefPicSetStCurrBefore、RefPicSetStCurrAfter、RefPicSetStFoll、RefPicSetLtCurr及びRefPicSetLtFollと称される。
[0095]RefPicSetStCurrBefore、RefPicSetStCurrAfter、及びRefPicSetStFoll参照ピクチャサブセットは、短期参照ピクチャを識別し得る。幾つかの例では、これらの参照ピクチャサブセットは、短期参照ピクチャが、コード化されている現在ピクチャよりも表示順序が早いか、又は表示順序が後であるか、及び短期参照ピクチャが、現在ピクチャと、復号順序で現在ピクチャに続くピクチャとをインター予測するために使用される可能性があり得るか、又は復号順序で現在ピクチャに続くピクチャのみをインター予測するために使用される可能性があり得るかに基づいて、短期参照ピクチャを識別し得る。
[0096]例えば、RefPicSetStCurrBefore参照ピクチャサブセットは、現在ピクチャよりも早い出力又は表示順序を有し、現在ピクチャのインター予測において参照のために使用される可能性があり得、復号順序で現在ピクチャに続く1つ又は複数のピクチャのインター予測において参照のために使用される可能性があり得る全ての短期参照ピクチャの、POC値などの識別情報を含み得、それのみを含み得る。RefPicSetStCurrAfter参照ピクチャサブセットは、現在ピクチャよりも後の出力又は表示順序を有し、現在ピクチャのインター予測において参照のために使用される可能性があり得、復号順序で現在ピクチャに続く1つ又は複数のピクチャのインター予測において参照のために使用される可能性があり得る全ての短期参照ピクチャの識別情報を含み得、それのみを含み得る。
[0097]RefPicSetStFoll参照ピクチャサブセットは、現在ピクチャよりも早い出力又は表示順序を有し、復号順序で現在ピクチャに続く1つ又は複数のピクチャのインター予測において参照のために使用される可能性があり得、現在ピクチャのインター予測においては参照のために使用され得ない、全ての短期参照ピクチャの識別情報を含み得、それのみを含み得る。
[0098]RefPicSetLtCurr及びRefPicSetLtFoll参照ピクチャサブセットは、長期参照ピクチャを識別し得る。幾つかの例では、これらの参照ピクチャサブセットは、長期参照ピクチャが、コード化されている現在ピクチャよりも表示順序が早いか、又は表示順序が後であるかに基づいて、長期参照ピクチャを識別し得る。
[0099]例えば、RefPicSetLtCurr参照ピクチャサブセットは、現在ピクチャのインター予測において参照のために使用される可能性があり得、復号順序で現在ピクチャに続く1つ又は複数のピクチャのインター予測において参照のために使用される可能性があり得る、全ての長期参照ピクチャの識別情報を含み得、それのみを含み得る。RefPicSetLtFoll参照ピクチャサブセットは、復号順序で現在のピクチャに続く1つ又は複数のピクチャのインター予測において参照のために使用される可能性があり得、現在ピクチャのインター予測においては参照のために使用され得ない、全ての長期参照ピクチャの識別情報を含み得、それのみを含み得る。
[0100]幾つかの例では、RefPicSetStCurrBefore、RefPicSetStCurrAfter、及びRefPicSetLtCurrサブセットは、現在ピクチャ中のブロックのインター予測において使用され得、復号順序で現在ピクチャに続くピクチャのうちの1つ又は複数のインター予測において使用され得る、全ての参照ピクチャを含み得る。RefPicSetStFoll、及びRefPicSetLtFollサブセットは、現在ピクチャ中のブロックのインター予測においては使用されないが、復号順序で現在ピクチャに続くピクチャのうちの1つ又は複数のインター予測において使用され得る、全ての参照ピクチャを含み得る。
[0101]RefPicSetLtCurr及びRefPicSetLtAfter参照ピクチャサブセットを構成するために、ビデオデコーダは、以下の擬似コードに従って、DPBを通して反復し、DPBに記憶されたLTRPをRefPicSetLtCurr及びRefPicSetLtAfter参照ピクチャサブセットに追加する。

for(i=0;i<NumPocLtCurr;i++)
if(!CurrDeltaPocMsbPresentFlag[i])
if(there is along term reference picture picX in the DPB with
pic_order_cnt_lsb equal to PocLtCurr[i])
RefPicSetLtCurr[i]=picX
else if(there is a short-term reference picture picY in the DPB
with pic_order_cnt_lsbequaltoPocLtCurr[i])
RefPicSetLtCurr[i]=picY
else
RefPicSetLtCurr[i]="no reference picture"
else
if(there is a long term reference picturepic X in the DPB
with PicOrderCntVal equal to PocLtCurr[i])
RefPicSetLtCurr[i]=picX
else if(there is a short-term reference picture picY in the DPB
with PicOrderCntVal equal to PocLtCurr[i])
RefPicSetLtCurr[i]=picY
else
RefPicSetLtCurr[i]="no reference picture"

for(i=0;i<NumPocLtFoll;i++)
if(!FollDeltaPocMsbPresentFlag[i])
if(there is a long term reference picture picX in the DPB
withpic_order_cnt_lsbequaltoPocLtFoll[i])
RefPicSetLtFoll[i]=picX
else if(there is a short-term reference picture picY in the DPB
with pic_order_cnt_lsbequaltoPocLtFoll[i])
RefPicSetLtFoll[i]=picY
else
RefPicSetLtFoll[i]="no reference picture"
else
if(there is a long term reference picture picX in the DPB
with PicOrderCntValtoPocLtFoll[i])
RefPicSetLtFoll[i]=picX
else if(there is a short-term reference picture picY in the
DPB with PicOrderCntVal equal to PocLtFoll[i])
RefPicSetLtFoll[i]=picY
else
RefPicSetLtFoll[i]="no reference picture"
[0102]RefPicSetLtCurr、及びRefPicSetLtFoll参照ピクチャリストを構築した後に、ビデオデコーダ30は、参照ピクチャ中のピクチャの各々を「長期参照のために使用される」とマークする。
[0103]RefPicSetStCurrBefore、RefPicSetStCurrAfter、及びRefPicSetLtCurr参照ピクチャセットを構成するために、ビデオデコーダ30は、DPBを通して反復し、POC値をもつDPBからのピクチャを対応する参照ピクチャセットに追加する、以下の擬似コードを実行し得る。
for( i = 0; i < NumPocStCurrBefore; i++ )
if( there is a short-term reference picture picX in the DPB
with PicOrderCntVal equal to PocStCurrBefore[ i ])
RefPicSetStCurrBefore[ i ] = picX
else
RefPicSetStCurrBefore[ i ] = "no reference picture"

for( i = 0; i < NumPocStCurrAfter; i++ )
if( there is a short-term reference picture picX in the DPB
with PicOrderCntVal equal to PocStCurrAfter[ i ])
RefPicSetStCurrAfter[ i ] = picX
else
RefPicSetStCurrAfter[ i ] = "no reference picture" (8-7)
for( i = 0; i < NumPocStFoll; i++ )
if( there is a short-term reference picture picX in the DPB
with PicOrderCntVal equal to PocStFoll[ i ])
RefPicSetStFoll[ i ] = picX
else
RefPicSetStFoll[ i ] = "no reference picture"
[0104]ビデオデコーダ30は、5つの参照ピクチャサブセットのうちの1つ中に含まれないマークされる参照ピクチャを「参照のために使用されない」とマークする。
[0105]復号されるべき現在のピクチャがIDRピクチャである場合、ビデオデコーダ30は、RefPicSetStCurrBefore、RefPicSetStCurrAfter、RefPicSetStFoll、RefPicSetLtCurr、及びRefPicSetLtFoll参照ピクチャサブセットを空に設定し得る。これは、IDRピクチャはインター予測され得ず、復号順序でIDRピクチャの後のピクチャは、参照のために復号する際に、IDRピクチャに先立つどのピクチャも使用することができないからであり得る。そうでない場合(例えば、現在ピクチャが非IDRピクチャであるとき)、ビデオデコーダ30は、以下の擬似コードを実装することによって、短期参照ピクチャサブセットと長期参照ピクチャサブセットとを構成し得る。
[0106]ビデオデコーダ30は複数の参照ピクチャサブセットから参照ピクチャセットを導出すると、ビデオデコーダは参照ピクチャセットから参照ピクチャリスト(例えば、リスト0及びリスト1)を構成し得る。例えば、参照ピクチャリストの構成は、初期化ステップと、場合によっては修正ステップとを含み得る。
[0107]幾つかの例では、ビデオデコーダは、初期参照ピクチャリストを構成するためにビデオデコーダが参照ピクチャサブセットを利用する、デフォルトの参照リスト構成技法を実装するように構成され得る。そのとき、参照ピクチャリストの修正が必要とされない場合、最終参照ピクチャリストは、参照ピクチャリストの追加の並べ替えを必要とすることなしに、初期参照ピクチャリストと同じになり得る。
[0108]単方向予測PUのインター予測中に、ビデオエンコーダ20又はビデオデコーダ30は、参照ピクチャリスト0の参照ピクチャを使用して、現在ブロックの現在及びルーマクロマ値を予測する。双方向予測PUのインター予測中に、ビデオエンコーダ20又はビデオデコーダ30は、参照ピクチャリスト0と参照ピクチャリスト1の両方の参照ピクチャを使用して、現在ルーマブロックの値と現在クロマブロックの値とを予測する。
[0109]ビデオデコーダ30は、RefPicList0、及びRefPicList1と呼ばれる、参照ピクチャの2つのリストのうちの1つへインデックス付けすることによって、LTRP及びSTRPなど、参照ピクチャにアドレッシングし得る。RefPicList0及びRefPicList1は、5つの参照ピクチャサブセット、RefPicSetStCurrBefore、RefPicSetStCurrAfter、RefPicSetStFoll、RefPicSetLtCurr、及びRefPicSetLtFollからの参照ピクチャを含む。単方向予測PUを復号するとき、ビデオデコーダ30は、現在ルーマブロックの値と現在クロマブロックの値とを予測するために、RefPicList0のに記憶されたピクチャのうちの1つを利用し得る。双予測PUを復号するとき、ビデオデコーダ30は、現在スライスのCUを予測するためにRefPicList0のピクチャとRefPicList1のピクチャとを利用し得る。Pスライス又はBスライスを復号することの始めに、ビデオデコーダ30は、以下の擬似コードに従って一時的参照ピクチャリスト、RefPicList0を構成し得る。

rIdx = 0
while( rIdx < NumRpsCurrTempList0 ) {
for( i = 0; i < NumPocStCurrBefore && rIdx < NumRpsCurrTempList0;
rIdx++, i++ )
RefPicListTemp0[ rIdx ] = RefPicSetStCurrBefore[ i ]
for( i = 0; i < NumPocStCurrAfter && rIdx < NumRpsCurrTempList0;
rIdx++, i++ )
RefPicListTemp0[ rIdx ] = RefPicSetStCurrAfter[ i ]
for( i = 0; i < NumPocLtCurr && rIdx < NumRpsCurrTempList0;
rIdx++, i++ )
RefPicListTemp0[ rIdx ] = RefPicSetLtCurr[ i ]
}

[0110]但し、RefPicListTemp0は、RefPicSetStCurrBefore、それに続くRefPicSetLtCurr、及びRefPicSetStCurrAfterのコンテンツを含む一時的変数である。
[0111]場合によっては、ビットストリームは、RefPicList0中のピクチャが並べ替えられるべきであることを信号伝達し得る。ビデオデコーダ30は、ref_pic_list_modification_flag_l0に基づいてRefPicListTemp0を並べ替え得る。RefPicListTemp0を構成した後に、ビデオデコーダ30は、以下の擬似コードに従ってRefPicList0を構成する。

for( rIdx = 0; rIdx <= num_ref_idx_l0_active_minus1; rIdx++)
RefPicList0[ rIdx ] = ref_pic_list_modification_flag_l0 ?
RefPicListTemp0[ list_entry_l0[ rIdx ] ] :
RefPicListTemp0[ rIdx ]

[0112]現在PUが双予測されるとき、ビデオデコーダ30は、RefPicListTemp0を構成するために使用されるのと同様のプロセスにおいて以下の擬似コードに従って、RefPicListTemp1と呼ばれる、RefPicList1の一時的バージョンを構成する。

rIdx = 0
while( rIdx < NumRpsCurrTempList1 ) {
for( i = 0; i < NumPocStCurrAfter && rIdx < NumRpsCurrTempList1;
rIdx++, i++ )
RefPicListTemp1[ rIdx ] = RefPicSetStCurrAfter[ i ]
for( i = 0; i < NumPocStCurrBefore && rIdx < NumRpsCurrTempList1;
rIdx++, i++ )
RefPicListTemp1[ rIdx ] = RefPicSetStCurrBefore[ i ]
for( i = 0; i < NumPocLtCurr && rIdx < NumRpsCurrTempList1;
rIdx++, i++ )
RefPicListTemp1[ rIdx ] = RefPicSetLtCurr[ i ]
}

[0113]ビデオデコーダ30は、以下の擬似コードに従って、ref_pic_list_modification_flag_l1に基づいてRefPicListTemp1を並べ替え得る。

for( rIdx = 0; rIdx <= num_ref_idx_l1_active_minus1; rIdx++)
RefPicList1[ rIdx ] = ref_pic_list_modification_flag_l1 ?
RefPicListTemp1[list_entry_l1[ rIdx ] ] :
RefPicListTemp1[ rIdx ]

[0114]上記で説明したように、HEVCビットストリームは、予測単位(PU)及び変換単位(TU)から構成されるコード化単位(CU)を含む。インター予測PUの場合、各予測単位は、PUの特定のインター予測モード、1つ又は複数の動きベクトル差分値(MVD)、及びCUの画素値を予測するときに使用されるべき参照ピクチャなど、動作予測情報を含み得る。各PUのために信号伝達される1つ又は2つの参照ピクチャ、CUが単方向予測される場合は1つの参照ピクチャ、及びCUが双方向予測される場合は2つの参照ピクチャがあり得る。
[0115]スライスのインター予測PUは、シンタックス要素ref_idx_l0、及びref_idx_l1を含み得る。ref_idx_l0及びref_idx_l1の各々の値は、それぞれ、参照ピクチャリスト、RefPicList0へのインデックスと、参照ピクチャリスト、RefPicList1へのインデックスとである。ref_idx_l0及びref_idx_l1は、ビデオデコーダ30が現在ブロックのクロマ値及びルーマ値を予測するために使用する予測サンプルのセットを決定するために、ビデオデコーダが動きベクトル差分値とともに使用する、参照ピクチャを信号伝達する。
[0116]PUが単方向予測又は双方向予測される場合、ビデオデコーダ30は、PUのMVD値を使用して1つ又は複数のクロマ動きベクトルとルーマ動きベクトルとを再構成する。ビデオデコーダ30は、CUの動きベクトル予測子を決定することと、CUの動きベクトルを形成するために動きベクトル予測子をMVDと組み合わせることとによって、ルーマ及びクロマ動きベクトルを再構成し得る。ビデオデコーダ30は、別の前にコード化されたCU、例えば、隣接する、前にコード化されたCUから、動きベクトル予測子を決定し得る。幾つかの事例において、PUは、ビデオデコーダ30が前にコード化されたCUの1つ又は複数の動きベクトルのみに基づいて現在PUの動きベクトル予測子を決定する、所謂マージモア又は高度動きベクトル予測(AMVP)を使用してコード化され得る。この場合、現在PUは信号伝達されたMVD値を含まない。
[0117]ビデオデコーダ30は、現在PUのクロマ及びルーマ動きベクトルを再構成すると、ビデオデコーダ30は、PU中でそれらのインデックスによって信号伝達された1つ又は複数の参照ピクチャに基づいて、ルーマ予測サンプルのアレイと、クロマ予測サンプルのアレイと、クロマ残差サンプルのアレイとを決定する。現在ルーマブロックのルーマ予測サンプル(例えば、予測値)を計算するために、ビデオデコーダ30は、ルーマ動きベクトルの整数部分と分数部分とを計算する。ビデオデコーダ30は、示された参照ピクチャのルーマサンプルのための対応する整数又は分数オフセットを決定するために、現在ルーマブロックの左上隅のx座標及びy座標をルーマ動きベクトルに加算する。オフセットに基づいて、ビデオエンコーダ20は、現在ルーマブロックのルーマ予測サンプルを決定するために、参照ピクチャのルーマサンプルの全画素値に基づいて分数サブ位置の値を補間し得る。一例として、ルーマ動きベクトル差分は、動きベクトル予測子と組み合わされるとき、ルーマ予測サンプルの特定の1/4画素位置を参照し得る。ビデオデコーダ30は、1つ又は複数の補間フィルタに基づいて1/4画素値を補間し得る。補間フィルタは、1/4画素値を生成するために、ルーマ参照サンプルからのサポートの全画素セットを利用し得る。ビデオデコーダ30は、生成された1/4画素ルーマ値を現在ルーマブロックの予測値として利用し得る。
[0118]ビデオデコーダ30は、現在クロマブロックの予測サンプルを決定するために同様のプロセスを実行し得る。ビデオデコーダ30は、ルーマ動きベクトルとは異なり得る少なくとも1つのクロマ動きベクトルを再構成し、クロマ動きベクトルを利用して参照ピクチャのクロマサンプルへのオフセットを決定する。また、ルーマ動きベクトルは最高1/4画素精度を有し得るが、クロマ動きベクトルは最高1/8画素精度を有し得る。参照ピクチャのクロマサンプルへのオフセットに基づいて、ビデオデコーダ30は、現在クロマブロックのクロマ値の予測子として予測サブ画素クロマ値を補間し得る。
[0119]現在PUが双予測される場合、ビデオデコーダ30は、ルーマ予測サンプルの2つのアレイを2つのルーマ動きベクトルの各々ごとに1つ、クロマ予測サンプルの2つのアレイを2つのクロマ動きベクトルの各々ごとに1つ決定する。ビデオデコーダ30は、予測サンプルの単一のアレイを形成するために、2つのルーマ予測サンプルと、クロマ予測サンプルの2つのアレイとを組み合わせる。ルーマサンプルアレイとクロマサンプルアレイとを各々予測するために使用される技法は、ビデオデコーダ30が2つの重み付けサンプル予測プロセスのどちらを実行するかを示す2つの予測フラグシンタックス要素、predFlagL0とpreFlagL1とに依存する。クロマ予測サンプルとルーマ予測サンプルの2つのアレイの各々に割り当てられる特定の重みは、スライスセグメントヘッダ中で信号伝達され得る重み付け予測シンタックステーブルによって定義される。
[0120]CUのPUを使用したイントラ予測コード化又はインター予測コード化の後、ビデオエンコーダ20又はビデオデコーダ30は、CUのTUのための残差データを計算し得る。PUは、(画素領域とも呼ばれる)空間領域において予測画素データを生成する方法又はモードを記述するシンタックスデータを備え得、TUは、例えば、残差ビデオデータへの離散コサイン変換(DCT)、整数変換、ウェーブレット変換、又は概念的に同様の変換などの変換の適用後に、変換領域において係数を備え得る。残差データは、符号化されていないピクチャの画素と、PUに対応する予測値との間の画素差分に対応し得る。ビデオエンコーダ20又はビデオデコーダ30は、CUのための残差データを含むTUを形成し、次いで、TUを変換して、CUの変換係数を生成し得る。
[0121]変換係数を生成するための任意の変換の後に、ビデオエンコーダ20又はビデオデコーダ30は、変換係数の量子化を実行し得る。量子化は、一般に、係数を表すために使用されるデータの量をできるだけ低減するために変換係数が量子化され、更なる圧縮を行うプロセスを指す。量子化プロセスは、係数の一部又は全部に関連するビット深度を低減し得る。例えば、量子化中にnビット値がmビット値に切り捨てられ得、但し、nはmよりも大きい。
[0122]量子化の後に、ビデオエンコーダは、変換係数を走査して、量子化変換係数を含む2次元行列から1次元ベクトルを生成し得る。走査は、アレイの前部により高いエネルギー(従って、より低い周波数)係数を配置し、アレイの後部により低いエネルギー(従って、より高い周波数)係数を配置するように設計され得る。幾つかの例では、ビデオエンコーダ20又はビデオデコーダ30は、エントロピー符号化され得るシリアル化ベクトルを生成するために、量子化変換係数を走査するために予め定義された走査順序を利用し得る。他の例では、ビデオエンコーダ20又はビデオデコーダ30は適応走査を実行し得る。量子化変換係数を走査して1次元ベクトルを形成した後に、ビデオエンコーダ20又はビデオデコーダ30は、例えば、コンテキスト適応型可変長コード化(CAVLC:context-adaptivevariablelengthcoding)、コンテキスト適応型バイナリ算術コード化(CABAC:context-adaptivebinaryarithmeticcoding)、シンタックスベースコンテキスト適応型バイナリ算術コード化(SBAC:syntax-basedcontext-adaptivebinaryarithmeticcoding)、確率間隔区分エントロピー(PIPE:ProbabilityIntervalPartitioningEntropy)コード化、又は別のエントロピー符号化方法に従って1次元ベクトルをエントロピー符号化し得る。ビデオエンコーダ20はまた、ビデオデータを復号する際にビデオデコーダ30が使用するための符号化ビデオデータに関連するシンタックス要素をエントロピー符号化し得る。
[0123]CABACを実行するために、ビデオエンコーダ20は、送信されるべきシンボルに、コンテキストモデル内のコンテキストを割り当て得る。コンテキストは、例えば、シンボルの隣接値が非0であるか否かに関係し得る。CAVLCを実行するために、ビデオエンコーダ20は、送信されるべきシンボルのための可変長コードを選択し得る。VLCにおけるコードワードは、相対的により短いコードが優勢シンボルに対応し、より長いコードが劣勢シンボルに対応するように構成され得る。このようにして、VLCを使用すると、例えば、送信されるべき各シンボルのために等長コードワードを使用するよりも、ビット節約を実現し得る。確率決定は、シンボルに割り当てられたコンテキストに基づき得る。
[0124]ビデオエンコーダ20は更に、ブロックベースのシンタックスデータ、フレームベースのシンタックスデータ、及びGOPベースのシンタックスデータなどのシンタックスデータを、例えば、フレームヘッダ、ブロックヘッダ、スライスヘッダ、又はGOPヘッダ中でビデオデコーダ30に送り得る。GOPシンタックスデータは、それぞれのGOP中の幾つかのフレームを記述し得、フレームシンタックスデータは、対応するフレームを符号化するために使用される符号化/予測モードを示し得る。
[0125]本開示の技法は、コード化ビデオビットストリーム中での参照ピクチャの信号伝達を改善するための技法を対象としている。概して、参照ピクチャのPOC値への参照を信号伝達するときにビットを節約するために、WD6には、短期参照ピクチャは完全なPOC値によって識別されるが、長期参照ピクチャを指すためにPOC値の一定数の最下位ビット(LSB)のみが信号伝達されることが示されている。
[0126]本開示は、ビデオエンコーダ20及びビデオデコーダ30が実装し得る、長期参照ピクチャの信号伝達に関する技法を提供する。詳細には、本開示は、長期参照ピクチャについての識別情報を、例えばスライスヘッダ中で、信号伝達するための技法について説明する。詳細には、本開示の技法は、コード化ビデオシーケンスのスライスヘッダ中での長期参照ピクチャの最上位ビット(MSB)及び最下位ビットの信号伝達を改善するための技法を対象としている。本開示の技法は、現在コード化ピクチャのためのアクティブシーケンスパラメータセット又はピクチャパラメータセット中に含まれる参照ピクチャのセット中に含まれない、追加の参照ピクチャをスライスヘッダ中で信号伝達するための技法を対象としている。
[0127]本開示の技法の第1の態様は、長期参照ピクチャの信号伝達を対象とし、より詳細には、コード化ビデオシーケンスのスライスヘッダ中での長期参照ビットの最上位ビットの信号伝達を対象とする。概して、本開示の技法は、上記の表2に関して説明したものとしてスライスヘッダシンタックスを実装し得る。表2によれば、スライスヘッダは、long_term_idx_sps[i]及びpoc_lsb_ltシンタックス要素を含む。特定のインデックス値iの場合、long_term_idx_sps[i]の値は、アクティブシーケンスパラメータセットからの候補長期参照ピクチャのリストへのインデックスを指定し、poc_lsb_lt[i]の値は、i番目の長期参照ピクチャについての最下位ビットを指定する。
[0128]このようにして、long_term_idx_sps及びpoc_lsb_ltシンタックス要素は、シーケンスパラメータセットから継承され、ビデオデコーダ30が現在スライスのCUを予測するために使用する長期参照ピクチャのサブセットを識別する。本開示の技法は、long_term_idx_sps[i]シンタックス要素中のSPSから継承されるLTRPPOCLSB値の順序を制限する。本開示の技法に従ってlong_term_idx_sps[i]のLTRPPOCLSB値の順序を制限することにより、コード化ビデオビットストリームの複雑さを低減し得る。従って、表2のスライスヘッダシンタックス要素のセマンティクスは、上記の表2に関して説明したセマンティクスに対して次のように変更され得る。
[0129]特定のインデックスi、の場合、long_term_idx_sps[i]の値は、参照されるシーケンスパラメータセットから現在ピクチャの長期参照ピクチャセットに継承されるi番目の長期参照ピクチャの、アクティブシーケンスパラメータセット中で指定される長期参照ピクチャのリストに対するインデックスを指定する。long_term_idx_sps[i]の値は、両端値を含む0〜num_long_term_ref_pics_sps−1の範囲内であり得る。
[0130]本開示の技法は、両端値を含む0〜num_long_term_sps−1の範囲内のj及びkの任意の値について、jがkをよりも小さい場合、lt_ref_pic_poc_lsb_sps[long_term_idx_sps[j]]が、lt_ref_pic_poc_lsb_sps[long_term_idx_sps[k]]以上であるように、poc_lsb_ltの値の順序付けを更に変更する。この例では、long_term_idx_sps[j]のLSBPOC値は、全てのj<kについて、long_term_idx_sps[k]のLSBPOC値よりも大きい。
[0131]スライスヘッダは、delta_poc_msb_present_flag[i]シンタックス要素をも含み得る。delta_poc_msb_present_flag[i]は、i番目のLTRP、即ちlong_term_idx_sps[i]又はpoc_lsb_lt[i]によって示されるLTRPについて、指定された数のMSBが信号伝達されるか否かを指定する。delta_poc_msb_present_flag[i]のi番目のインデックスが1に等しい場合、delta_poc_msb_cycle_lt[i]値が存在する。delta_poc_msb_present_flag[i]の値が0に等しい場合、信号伝達されるi番目のLTRPについてdelta_poc_msb_cycle_lt[i]が存在しない。本開示の技法は、2つ以上のピクチャが復号ピクチャバッファにあり、その参照ピクチャが「参照のために使用される」としてマークを付け、PocLsbLt[i]に等しいピクチャ順序カウント値の最下位ビットを有するとき、delta_poc_msb_present_flag[i]はただ1に等しいと信号伝達されるように、delta_poc_msb_present_flag[i]の信号伝達を変更する。前の技法は、ピクチャが「参照のために使用される」とマークされていないとき、即ち、ピクチャが参照のためにもはや必要とされないときでさえ、1つに等しいdelta_poc_msb_present_flag[i]と、delta_poc_msb_lt[i]値とを信号伝達し得る。delta_poc_msb_present_flag[i]の信号伝達を「参照のために使用される」とマークされたピクチャに制限することによって、本開示の技法は、参照ピクチャのMSBを信号伝達する頻度を低減し得、このことはコード化ビデオビットストリームの複雑さを低減し得る。
[0132]スライスヘッダは、delta_poc_msb_cycle_lt[i]シンタックス要素をも含み得る。ビデオデコーダ30は、現在ピクチャの長期参照ピクチャセット中に含まれるi番目の長期参照ピクチャのピクチャ順序カウント値の最上位ビットの値を決定するために、delta_poc_msb_cycle_lt[i]値を利用し得る。i番目のLTRPのMSB値を決定するために、ビデオコーダは、i番目のLTRPのMSBを示す変数DeltaPocMSBCycleLt[i]の値を決定し得る。
[0133]ビデオコーダは、以下の擬似コードに従って変数DeltaPocMSBCycleLt[i]を導出し得る。
if( i = = 0 | | i = = num_long_term_sps | | PocLsbLt[ i - 1 ] ! = PocLsbLt[ i ] )
DeltaPocMSBCycleLt[ i ] = delta_poc_msb_cycle_lt[ i ]
else
DeltaPocMSBCycleLt[ i ] = delta_poc_msb_cycle_lt[ i ] +
DeltaPocMSBCycleLt[ i - 1 ]
[0134]DeltaPocMSBCycleLt[i]*MaxPicOrderCntLsb+pic_order_cnt_lsb−PocLsbLt[i]の値は、両端値を含む1〜224−1の範囲内であり得る。
[0135]幾つかの事例において、ビデオデコーダ30は、DeltaPocMSBCycleLt[i−1]の値、前のLTRPのDeltaPocMSB値を、現在LTRPのdelta_poc_msb_cycle_lt[i]値に加算することによって、DeltaPocMSBCycleLt[i]を決定する。
[0136]DeltaPocMSBCycleLt[i]を決定するための前の技法と比較して、DeltaPocMSBCycleLt[i]は、iが、アクティブSPS中で指定され、現在ピクチャのためのLTRPのセット中に含まれるべきであるLTRPの数に等しい場合、delta_poc_msb_cycle_lt[i]であると定義される。
[0137](上記で説明した例と組み合わされ得る)本開示の技法による代替例では、スライスヘッダシンタックスは、表2の場合と実質的に同じであり得る。しかしながら、スライスヘッダは、以下で説明するように、シンタックス要素「lt_pic_from_sps_flag[i]」をも含み得る。SPSから継承されるPOCLSB値とスライスヘッダ中で直接信号伝達されるPOCLSB値との順序は、アレイPocLsbLt[i]の値に対する制約を通してまとめて制限され得る。delta_poc_msb_present_flag[i]に対する制限は、上記で説明した例の場合と同じであり得る。表5は、この例によるスライスヘッダのためのシンタックスの一例を与える。
Figure 0006162228
[0138]上述したように、表5は追加のシンタックス要素「lt_pic_from_sps_flag[i]」を与える。ビデオデコーダ30は、lt_pic_from_sps_flag[i]を使用して、スライスヘッダ中で信号伝達されるi番目のLTRPが、SPSから導出されるのか、スライスヘッダ中で明示的に信号伝達されるのかを決定し得る。フラグが1であるとき、LTRPはSPSから継承され得、信号伝達されるインデックスに対応する。フラグが0であるとき、長期参照ピクチャのLSBが明示的に信号伝達され得る。存在しないとき、ビデオコーダは、lt_pic_from_sps_flag[i]が0に等しいと推測し得る。
[0139]このようにして、lt_pic_from_sps_flag[i]は、長期参照ピクチャについての識別情報がスライスヘッダ中で明示的に信号伝達されるのか、又は、そこでスライスが発生するピクチャのシーケンスを含むシーケンスパラメータセット(即ち、スライスに対応するシーケンスパラメータセット)から導出されるのかを示す、スライスヘッダ中でコード化され得るシンタックス要素の例を表す。
[0140]この例では、long_term_idx_sps[i]は、現在ピクチャの長期参照ピクチャセットに対するi番目の長期参照ピクチャの、アクティブシーケンスパラメータセット中で指定される長期参照ピクチャのリストに対するインデックスを指定し得る。long_term_idx_sps[i]の値は、両端値を含む0〜num_long_term_ref_pics_sps−1の範囲内であり得る。
[0141]この例では、poc_lsb_lt[i]は、現在ピクチャの長期参照ピクチャセット中に含まれるi番目の長期参照ピクチャのピクチャ順序カウント値の最下位ビットの値を指定し得る。poc_lsb_lt[I]シンタックス要素の長さはlog2_max_pic_order_cnt_lsb_minus4+4ビットであり得る。変数PocLsbLt[i]は、i番目のLTRPについてのLSBを指定し得る。
[0142]変数PocLsbLt[i]は、以下の擬似コードにおいて次のように導出され得る。
if(lt_pic_from_sps_flag[ i ])
PocLsbLt[ i ] = lt_ref_pic_poc_lsb_sps [ long_term_idx_sps[ i ] ]
else
PocLsbLt[ i ] = poc_lsb_lt[ i ]
[0143]両端値を含む0〜num_long_term_pics+num_long_term_sps−1の範囲内のj及びkの任意の値について、jがkよりも小さい場合、PocLsbLt[j]はPocLsbLt[k]以上であるように制限される。従って、PocLsbLt[i]は、LTRPがSPSから継承される場合、SPSから継承される参照ピクチャのLSBとして定義され、LTRPがSPSから継承されない場合、スライスヘッダ中で明示的に信号伝達されるLSBとして定義される。更に、LSBは、非増加順序であるように制限される。
[0144]delta_poc_msb_present_flag[i]及びdelta_poc_msb_cycle_lt[i]のセマンティクスへの変更は、上記の例で説明したものと同じであり得、変数DeltaPocMSBCycleLt[i]の導出は、上記の表2に関する方法と同じであり得る。
[0145]代替的に、num_long_term_picsは、SPSから継承されるLTRPとスライスヘッダ中で明示的に信号伝達されるLTRPとを含む信号伝達されるLTRPの総数を指定し得、ビデオコーダは、num_long_term_spsを信号伝達する必要はない。
[0146]ビデオエンコーダ20及びビデオデコーダ30は、上述のシンタックス及びセマンティクスの様々な例に従ってスライスヘッダ及び/又はシーケンスパラメータセットのデータをコード化するように構成され得る。このようにして、ビデオエンコーダ20及びビデオデコーダ30は、例えば、幾つかの長期参照ピクチャについてのより少ない最上位ビットを信号伝達することによって、ビット節約を実現し得る。
[0147]従って、ビデオエンコーダ20及びビデオデコーダ30は、ビデオデータのスライスのためのスライスヘッダをコード化することと、ここにおいて、スライスヘッダは、長期参照ピクチャについての識別情報が、スライスヘッダ中で明示的に信号伝達されるか、又はスライスに対応するシーケンスパラメータセットから導出されるかを示すシンタックス要素を含む、シンタックス要素が、長期参照ピクチャについての識別情報が明示的に信号伝達されることを示すとき、スライスヘッダ中の長期参照ピクチャについてのLSBの値をコード化することとを行うように構成されたビデオコーダの例を表す。
[0148]ビデオエンコーダ20及びビデオデコーダ30はそれぞれ、適用可能なとき、1つ又は複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理回路、ソフトウェア、ハードウェア、ファームウェアなど、様々な好適なエンコーダ又はデコーダ回路のいずれか、あるいはそれらの任意の組合せとして実装され得る。ビデオエンコーダ20及びビデオデコーダ30の各々は1つ又は複数のエンコーダ又はデコーダ中に含まれ得、そのいずれも複合ビデオエンコーダ/デコーダ(コーデック)の一部として統合され得る。ビデオエンコーダ20及び/又はビデオデコーダ30を含む機器は、集積回路、マイクロプロセッサ、及び/又はセルラー電話などのワイヤレス通信機器を備え得る。
[0149]図2は、SPS又はスライスヘッダ中でLTRPについてのデータを信号伝達するための技法を実装し得るビデオエンコーダ20の一例を示すブロック図である。ビデオエンコーダ20は、ビデオスライス内のビデオブロックのイントラコード化とインターコード化とを実行し得る。イントラコード化は、所与のビデオフレーム又はピクチャ内のビデオの空間的冗長性を低減又は除去するために空間的予測に依拠する。インターコード化は、ビデオシーケンスの隣接フレーム又はピクチャ内のビデオの時間的冗長性を低減又は除去するために時間的予測に依拠する。イントラモード(Iモード)は、幾つかの空間ベースのコード化モードのいずれかを指し得る。単方向予測(Pモード)又は双方向予測(Bモード)などのインターモードは、幾つかの時間ベースのコード化モードのいずれかを指し得る。
[0150]図2に示すように、ビデオエンコーダ20は、符号化されるべきビデオフレーム内の現在ビデオブロックを受信する。図2の例では、ビデオエンコーダ20は、モード選択ユニット40と、参照ピクチャメモリ64と、加算器50と、変換処理ユニット52と、量子化ユニット54と、エントロピー符号化ユニット56とを含む。モード選択ユニット40は、今度は、動き補償ユニット44と、動き推定ユニット42と、イントラ予測ユニット46と、区分化ユニット48とを含む。ビデオブロック再構成のために、ビデオエンコーダ20はまた、逆量子化ユニット58と、逆変換ユニット60と、加算器62とを含む。再構成されたビデオからブロック歪み(blockiness artifacts)を除去するためにブロック境界をフィルタ処理するデブロッキングフィルタ(図2に図示せず)も含まれ得る。所望される場合、デブロッキングフィルタは、一般に、加算器62の出力をフィルタ処理することになる。追加のフィルタ(ループ内又はループ後)もデブロッキングフィルタに加えて使用され得る。そのようなフィルタは、簡潔のために示されていないが、所望される場合、(ループ内フィルタとして)加算器50の出力をフィルタ処理し得る。
[0151]符号化プロセス中に、ビデオエンコーダ20はコード化されるべきビデオフレーム又はスライスを受信する。フレーム又はスライスは、複数のビデオブロックに分割され得る。動き推定ユニット42及び動き補償ユニット44は、時間的予測を行うために、1つ又は複数の参照フレーム中の1つ又は複数のブロックに対して受信されたビデオブロックのインター予測コード化を実行する。イントラ予測ユニット46は、代替的に、空間的予測を行うために、コード化されるべきブロックと同じフレーム又はスライス中の1つ又は複数の隣接ブロックに対して受信されたビデオブロックのイントラ予測コード化を実行し得る。ビデオエンコーダ20は、例えば、ビデオデータのブロックごとに適切なコード化モードを選択するために、複数のコード化パスを実行し得る。
[0152]その上、区分化ユニット48は、前のコード化パスにおける前の区分方式の評価に基づいて、ビデオデータのブロックをサブブロックに区分し得る。例えば、区分化ユニット48は、初めにフレーム又はスライスをLCUに区分し、レート歪み分析(例えば、レート歪み最適化)に基づいてLCUの各々をサブCUに区分し得る。モード選択ユニット40は、LCUをサブCUに区分することを示す4分木データ構造を更に生成し得る。クワッドツリーのリーフノードCUは、1つ又は複数のPUと、1つ又は複数のTUとを含み得る。
[0153]モード選択ユニット40は、例えば、誤差結果に基づいてコード化モード、即ち、イントラ又はインターのうちの1つを選択し、残差ブロックデータを生成するために、得られたイントラコード化ブロック又はインターコード化ブロックを加算器50に与え、参照フレームとして使用するための符号化ブロックを再構成するために、得られたイントラコード化ブロック又はインターコード化ブロックを加算器62に与え得る。モード選択ユニット40はまた、動きベクトル、イントラモードインジケータ、区分情報、及び他のそのようなシンタックス情報など、シンタックス要素をエントロピー符号化ユニット56に与える。
[0154]動き推定ユニット42と動き補償ユニット44とは、高度に統合され得るが、概念的な目的のために別々に示してある。動き推定ユニット42によって実行される動き推定は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、例えば、現在フレーム(又は他のコード化単位)内でコード化されている現在ブロックに対する参照フレーム(又は他のコード化単位)内の予測ブロックに対する現在ビデオフレーム又はピクチャ内のビデオブロックのPUの変位を示し得る。予測ブロックは、絶対値差分和(SAD:sumofabsolutedifference)、2乗差分和(SSD:sumofsquaredifference)、又は他の差分メトリックによって決定され得る画素差分に関して、コード化されるべきブロックにぴったり一致することがわかるブロックである。幾つかの例では、ビデオエンコーダ20は、参照ピクチャメモリ64に記憶された参照ピクチャのサブ整数画素位置の値を計算し得る。例えば、ビデオエンコーダ20は、参照ピクチャの1/4画素位置、1/8画素位置、又は他の分数画素位置の値を補間し得る。従って、動き推定ユニット42は、フル画素位置と分数画素位置とに対する動き探索を実行し、分数画素精度で動きベクトルを出力し得る。
[0155]動き推定ユニット42は、PUの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコード化スライス中のビデオブロックのPUのための動きベクトルを計算する。参照ピクチャは、第1の参照ピクチャリスト(リスト0)又は第2の参照ピクチャリスト(リスト1)から選択され得、それらの参照ピクチャリストの各々は、参照ピクチャメモリ64に記憶された1つ又は複数の参照ピクチャを識別する。動き推定ユニット42は、計算された動きベクトルをエントロピー符号化ユニット56と動き補償ユニット44とに送る。
[0156]動き補償ユニット44によって実行される動き補償は、動き推定ユニット42によって決定された動きベクトルに基づいて予測ブロックをフェッチ又は生成することに関与し得る。この場合も、幾つかの例では、動き推定ユニット42と動き補償ユニット44とは機能的に統合され得る。現在ビデオブロックのPUのための動きベクトルを受信すると、動き補償ユニット44は、参照ピクチャリストのうちの1つにおいて動きベクトルが指す予測ブロックの位置を特定し得る。加算器50は、以下で説明するように、コード化されている現在ビデオブロックの画素値から予測ブロックの画素値を減算し、画素差分値を形成することによって、残差ビデオブロックを形成する。概して、動き推定ユニット42はルーマ成分に対して動き推定を実行し、動き補償ユニット44は、クロマ成分とルーマ成分の両方のためにルーマ成分に基づいて計算された動きベクトルを使用する。モード選択ユニット40はまた、ビデオスライスのビデオブロックを復号する際にビデオデコーダ30が使用するためのビデオブロックとビデオスライスとに関連するシンタックス要素を生成し得る。
[0157]イントラ予測ユニット46は、上記で説明したように、動き推定ユニット42と動き補償ユニット44とによって実行されるインター予測の代替として、現在ブロックをイントラ予測し得る。特に、イントラ予測ユニット46は、現在ブロックを符号化するために使用すべきイントラ予測モードを決定し得る。幾つかの例では、イントラ予測ユニット46は、例えば、別個の符号化パス中に、様々なイントラ予測モードを使用して現在ブロックを符号化し得、イントラ予測ユニット46(又は、幾つかの例では、モード選択ユニット40)は、テストされたモードから使用するのに適切なイントラ予測モードを選択し得る。
[0158]例えば、イントラ予測ユニット46は、様々なテストされたイントラ予測モードのためのレート歪み分析を使用してレート歪み値を計算し、テストされたモードの中で最良のレート歪み特性を有するイントラ予測モードを選択し得る。レート歪み分析は、概して、符号化ブロックと、符号化ブロックを生成するために符号化された元の符号化されていないブロックとの間の歪み(又は誤差)の量、及び符号化ブロックを生成するために使用されるビットレート(即ち、ビット数)を決定する。イントラ予測ユニット46は、どのイントラ予測モードがブロックについて最良のレート歪み値を呈するかを決定するために、様々な符号化ブロックの歪み及びレートから比率を計算し得る。
[0159]ブロックのためのイントラ予測モードを選択した後に、イントラ予測ユニット46は、エントロピー符号化ユニット56にブロックのための選択されたイントラ予測モードを示す情報を与え得る。エントロピー符号化ユニット56は、選択されたイントラ予測モードを示す情報を符号化し得る。ビデオエンコーダ20は、送信ビットストリーム中に、複数のイントラ予測モードインデックステーブル及び複数の変更されたイントラ予測モードインデックステーブル(コードワードマッピングテーブルとも呼ばれる)と、様々なブロックの符号化コンテキストの定義と、コンテキストの各々について使用すべき、最確イントラ予測モード、イントラ予測モードインデックステーブル、及び変更されたイントラ予測モードインデックステーブルの指示とを含み得る構成データを含み得る。
[0160]ビデオエンコーダ20は、コード化されている元のビデオブロックから、モード選択ユニット40からの予測データを減算することによって残差ビデオブロックを形成する。加算器50は、この減算演算を実行する1つ又は複数の構成要素を表す。変換処理ユニット52は、離散コサイン変換(DCT)又は概念的に同様の変換などの変換を残差ブロックに適用し、残差変換係数値を備えるビデオブロックを生成する。変換処理ユニット52は、DCTと概念的に同様である他の変換を実行し得る。ウェーブレット変換、整数変換、サブバンド変換又は他のタイプの変換も使用され得る。いずれの場合も、変換処理ユニット52は、変換を残差ブロックに適用し、残差変換係数のブロックを生成する。変換は、残差情報を画素値領域から周波数領域などの変換領域に変換し得る。変換処理ユニット52は、得られた変換係数を量子化ユニット54に送り得る。量子化ユニット54は、ビットレートを更に低減するために変換係数を量子化する。量子化プロセスは、係数の一部又は全部に関連するビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって変更され得る。幾つかの例では、量子化ユニット54は、次いで、量子化変換係数を含む行列の走査を実行し得る。代替的に、エントロピー符号化ユニット56が走査を実行し得る。
[0161]量子化の後、エントロピー符号化ユニット56は、量子化変換係数をエントロピーコード化する。例えば、エントロピー符号化ユニット56は、コンテキスト適応型可変長コード化(CAVLC)、コンテキスト適応型バイナリ算術コード化(CABAC)、シンタックスベースコンテキスト適応型バイナリ算術コード化(SBAC)、確率間隔区分エントロピー(PIPE)コード化又は別のエントロピーコード化技法を実行し得る。コンテキストベースエントロピーコード化の場合、コンテキストは隣接ブロックに基づき得る。エントロピー符号化ユニット56によるエントロピーコード化の後に、符号化ビットストリームは、別の機器(例えば、ビデオデコーダ30)に送信されるか、又は後で送信するか又は取り出すためにアーカイブされ得る。
[0162]逆量子化ユニット58及び逆変換ユニット60は、それぞれ逆量子化及び逆変換を適用して、例えば参照ブロックとして後で使用するために、画素領域中で残差ブロックを再構成する。動き補償ユニット44は、残差ブロックを参照ピクチャメモリ64のフレームのうちの1つの予測ブロックに加算することによって参照ブロックを計算し得る。動き補償ユニット44はまた、再構成された残差ブロックに1つ又は複数の補間フィルタを適用して、動き推定において使用するサブ整数画素値を計算し得る。加算器62は、再構成された残差ブロックを、動き補償ユニット44によって生成された動き補償予測ブロックに加算して、参照ピクチャメモリ64に記憶するための再構成されたビデオブロックを生成する。再構成されたビデオブロックは、後続のビデオフレーム中のブロックをインターコード化するために動き推定ユニット42及び動き補償ユニット44によって参照ブロックとして使用され得る。
[0163]動き推定ユニット42は、ビデオエンコーダ20がインター予測されるPUについての1つ又は複数の画素値を予測するため使用し得る1つ又は複数の参照ピクチャを決定し得る。動き推定ユニット42は、各参照ピクチャをLTRP又は短期参照ピクチャとして信号伝達し得る。動き推定ユニット42は、ピクチャが参照のために使用されないとマークされるまで、参照ピクチャを復号ピクチャバッファ(DPB)に記憶し得る。
[0164]ビデオエンコーダ20のモード選択ユニット40は、1つ又は複数の参照ピクチャについての識別情報を含む様々なシンタックス要素を符号化し得る。インター予測ピクチャの符号化中に、モード選択ユニット40は、シーケンスパラメータセット中の現在ピクチャのための1つ又は複数のLTRPの識別情報を符号化し得る。モード選択ユニット40は、現在ピクチャのスライスヘッダ中又は現在ピクチャのためのピクチャパラメータセット中の現在ピクチャを予測するために使用される1つ又は複数の短期参照ピクチャについての識別情報をも符号化し得る。幾つかの例では、シンタックス要素は、スライスヘッダがアクティブシーケンスパラメータセットから長期参照ピクチャを継承するか否か、又は長期参照ピクチャがスライスヘッダ中で明示的に信号伝達されるかどうかを示し得る。
[0165]このようにして、図2中のビデオエンコーダ20のモード選択ユニット40は、ビデオデータのスライスのためのスライスヘッダをコード化することと、ここにおいて、スライスヘッダは、長期参照ピクチャについての識別情報が、スライスヘッダ中で明示的に信号伝達されるか、又はスライスに対応するシーケンスパラメータセットから導出されるかを示すシンタックス要素を含む、シンタックス要素が、長期参照ピクチャについての識別情報が明示的に信号伝達されることを示すとき、スライスヘッダ中の長期参照ピクチャについての識別情報の値をコード化することとを行うように構成されたビデオエンコーダの一例を表す。
[0166]幾つかの例では、ビデオエンコーダ20は、長期参照ピクチャのPOC値のLSBのうちの幾つかのみをアクティブSPS又はスライスヘッダ中で信号伝達することよって、長期参照ピクチャの識別情報を信号伝達し得る。しかしながら、幾つかの事例において、2つのLTRPが同じPOCLSBを有することがあるので、ビデオエンコーダ20は、LTRPのPOC値のMSBのうちの幾つかを更に信号伝達し得る。
[0167]本開示の技法の別の例では、ビデオエンコーダ20は、現在スライスヘッダのシンタックス要素内の現在スライスの画素値を予測するために使用されるLTRPのリストを信号伝達し得る。ビデオエンコーダ20は、複数のピクチャについてのデータをコード化順序でコード化し得る。データは、複数のピクチャの各々がLTRPとして使用するために利用可能であることを示し得る。ビデオエンコーダ20は、最下位ビット(LSB)の値がピクチャコード化順序で非減少又は非増加のいずれかであるような、複数のピクチャのそれぞれのピクチャ順序カウント(POC)値のLSBの値を含む、現在ピクチャのスライスヘッダ中のシンタックス要素をコード化し得る。
[0168]SPS、PPS、及びスライスヘッダ中で信号伝達される参照ピクチャに基づいて、ビデオエンコーダ20は、RefPicSetStCurrBefore、RefPicSetStCurrAfter、RefPicSetStFoll、RefPicSetLtCurr及びRefPicSetLtFoll参照ピクチャリストなど、参照ピクチャのリストを構成する。ビデオエンコーダ20は、参照ピクチャのPOC値に基づいて参照ピクチャリストを構成し得る。5つの参照ピクチャリストに基づいて、ビデオエンコーダ20は、RefPicList0及びRefPicList1参照ピクチャリストをも構成し得る。ビデオエンコーダ20は、RefPicList0及びRefPicList1中に含まれる参照ピクチャを使用して双予測ブロックの画素値を予測し、RefPicList0の参照ピクチャを使用して単予測ブロックの画素値を予測し得る。
[0169]図3は、SPS又はスライスヘッダ中でLTRPについてのデータを信号伝達するための技法を実装し得るビデオデコーダ30の一例を示すブロック図である。図3の例では、ビデオデコーダ30は、エントロピー復号ユニット70と、動き補償ユニット72と、イントラ予測ユニット74と、逆量子化ユニット76と、逆変換ユニット78と、参照ピクチャメモリ82と、加算器80とを含む。ビデオデコーダ30は、幾つかの例では、ビデオエンコーダ20(図2)に関して説明した符号化パスとは概して逆の復号パスを実行し得る。動き補償ユニット72は、エントロピー復号ユニット70から受信された動きベクトルに基づいて予測データを生成し得、イントラ予測ユニット74は、エントロピー復号ユニット70から受信されたイントラ予測モードインジケータに基づいて予測データを生成し得る。
[0170]復号プロセス中に、ビデオデコーダ30は、ビデオエンコーダ20から、符号化ビデオスライスのビデオブロックと、関連するシンタックス要素とを表す符号化ビデオビットストリームを受信する。ビデオデコーダ30のエントロピー復号ユニット70は、量子化係数、動きベクトル又はイントラ予測モードインジケータ、及び他のシンタックス要素を生成するためにビットストリームをエントロピー復号する。エントロピー復号ユニット70は、動きベクトルと他の予測シンタックス要素とを動き補償ユニット72に転送する。ビデオデコーダ30は、ビデオスライスレベル及び/又はビデオブロックレベルでシンタックス要素を受信し得る。
[0171]ビデオスライスがイントラコード化(I)スライスとしてコード化されるとき、イントラ予測ユニット74は、信号伝達されたイントラ予測モードと、現在フレーム又はピクチャの、前に復号されたブロックからのデータとに基づいて、現在ビデオスライスのビデオブロックのための予測データを生成し得る。ビデオフレームがインターコード化(即ち、B、P又はGPB)スライスとしてコード化されるとき、動き補償ユニット72は、エントロピー復号ユニット70から受信された動きベクトルと他のシンタックス要素とに基づいて、現在ビデオスライスのビデオブロックのための予測ブロックを生成する。予測ブロックは、参照ピクチャリストのうちの1つ内の参照ピクチャのうちの1つから生成され得る。ビデオデコーダ30は、参照ピクチャメモリ82に記憶された参照ピクチャに基づいて、デフォルトの構成技法を使用して、参照フレームリスト、即ち、リスト0及びリスト1を構成し得る。
[0172]動き補償ユニット72は、動きベクトルと他のシンタックス要素とを構文解析することによって現在ビデオスライスのビデオブロックのための予測情報を決定し、その予測情報を使用して、復号されている現在ビデオブロックのための予測ブロックを生成する。例えば、動き補償ユニット72は、ビデオスライスのビデオブロックをコード化するために使用される予測モード(例えば、イントラ又はインター予測)と、インター予測スライスタイプ(例えば、Bスライス、Pスライス、又はGPBスライス)と、スライスの参照ピクチャリストのうちの1つ又は複数についての構成情報と、スライスの各インター符号化ビデオブロックについての動きベクトルと、スライスの各インターコード化ビデオブロックについてのインター予測ステータスと、現在ビデオスライス中のビデオブロックを復号するための他の情報とを決定するために、受信されたシンタックス要素の幾つかを使用する。
[0173]動き補償ユニット72はまた、補間フィルタに基づいて補間を実行し得る。動き補償ユニット72は、ビデオブロックの符号化中にビデオエンコーダ20によって使用された補間フィルタを使用して、参照ブロックのサブ整数画素の補間値を計算し得る。この場合、動き補償ユニット72は、受信されたシンタックス要素からビデオエンコーダ20によって使用された補間フィルタを決定し、その補間フィルタを使用して予測ブロックを生成し得る。
[0174]逆量子化ユニット76は、ビットストリーム中で与えられ、エントロピー復号ユニット70によって復号された量子化変換係数を逆量子化(inversequantize)、即ち、逆量子化(de-quantize)する。逆量子化プロセスは、量子化の程度を決定し、同様に、適用されるべき逆量子化の程度を決定するための、ビデオスライス中のビデオブロックごとにビデオエンコーダ30によって計算される量子化パラメータQPYの使用を含み得る。
[0175]逆変換ユニット78は、逆変換、例えば、逆DCT、逆整数変換、又は概念的に同様の逆変換プロセスを変換係数に適用して、画素領域において残差ブロックを生成する。
[0176]動き補償ユニット72が、動きベクトルと他のシンタックス要素とに基づいて現在ビデオブロックのための予測ブロックを生成した後、ビデオデコーダ30は、逆変換ユニット78からの残差ブロックを動き補償ユニット72によって生成された対応する予測ブロックと加算することによって、復号ビデオブロックを形成する。加算器80は、この加算演算を実行する1つ又は複数の構成要素を表す。所望される場合、ブロック歪みを除去するために、復号ブロックをフィルタ処理するためにデブロッキングフィルタも適用され得る。画素遷移を平滑化するために、又は場合によってはビデオ品質を改善するために、他のループフィルタも(コード化ループ中又はコード化ループ後のいずれかで)使用され得る。所与のフレーム又はピクチャの復号ビデオブロックは、次いで、その後の動き補償のために使用される参照ピクチャを記憶する参照ピクチャメモリ82に記憶される。参照ピクチャメモリ82はまた、図1の表示装置32などの表示装置上での後の表示のために、復号ビデオを記憶する。
[0177]上記で説明したように、インター予測中に、動き補償ユニット72は、ビデオデコーダ30が復号されている現在ブロックのための予測ビデオブロックを形成するために使用し得る1つ又は複数の参照ピクチャを決定し得る。動き補償ユニット72は、参照ピクチャが長期参照のためにマークされたか、又は短期参照のためにマークされたかを示すコード化ビデオビットストリームのシンタックス要素に基づいて、参照ピクチャが長期参照ピクチャであるのか、又は短期参照ピクチャであるのかを決定し得る。動き補償ユニット72は、参照のために使用されないとピクチャがマークされるまで、参照ピクチャを復号ピクチャバッファ(DPB)に記憶し得る。
[0178]ビデオデコーダ30の動き補償ユニット72は、現在復号ブロックのための予測ブロックを形成するために使用される1つ又は複数の参照ピクチャについての識別情報を含む様々なシンタックス要素を復号し得る。インター予測PUの復号中に、動き補償ユニット72は、アクティブシーケンスパラメータセット中で信号伝達される現在ピクチャのための1つ又は複数のLTRPの識別情報を復号し得る。動き補償ユニット72は、現在ピクチャのスライスヘッダ中又は現在ピクチャのためのピクチャパラメータセット中の現在ピクチャを予測するために使用される1つ又は複数の短期参照ピクチャについての識別情報をも復号し得る。幾つかの例では、シンタックス要素は、スライスヘッダがアクティブシーケンスパラメータセットから長期期間参照ピクチャを継承するか否か、又は長期参照ピクチャについての識別情報がスライスヘッダ中で明示的に信号伝達されるかどうかを示し得る。
[0179]このようにして、図3のビデオデコーダ30の動き補償ユニット72は、ビデオデータのスライスのためのスライスヘッダをコード化することと、ここにおいて、スライスヘッダは、長期参照ピクチャについての識別情報が、スライスヘッダ中で明示的に信号伝達されるか、又はスライスに対応するシーケンスパラメータセットから導出されるかを示すシンタックス要素を含む、シンタックス要素が、長期参照ピクチャについての識別情報が明示的に信号伝達されることを示すとき、スライスヘッダ中の長期参照ピクチャについての識別情報の値をコード化することとを行うように構成されたビデオデコーダの例を表す。
[0180]幾つかの例では、ビデオデコーダ30は、アクティブSPS又はスライスヘッダ中で信号伝達された長期参照ピクチャのPOC値のLSBのうちの幾つかのみに基づいて、長期参照ピクチャの識別情報を復号し得る。しかしながら、幾つかの事例において、2つのLTRPが同じPOCLSBを有することがあるので、ビデオエンコーダ20は、同じPOCLSBを有するLTRPの曖昧さを除去するためにLTRPのPOC値のMSBのうちの幾つかを更に復号し得る。
[0181]本開示の技法の別の例では、ビデオデコーダ30は、現在スライスヘッダのシンタックス要素内の現在スライスの画素値を予測するために使用されるLTRPのリストをコード化し得る。ビデオデコーダ30は、複数のピクチャについてのデータをコード化順序でコード化し得る。データは、複数のピクチャの各々がLTRPとして使用するために利用可能であることを示し得る。ビデオデコーダ30は、最下位ビット(LSB)の値がピクチャコード化順序で非減少又は非増加のいずれかであるような、複数のピクチャのそれぞれのピクチャ順序カウント(POC)値のLSBの値を含む、現在ピクチャのスライスヘッダ中のシンタックス要素をコード化し得る。
[0182]SPS、PPS、及びスライスヘッダ中で信号伝達される参照ピクチャに基づいて、ビデオデコーダ30は、RefPicSetStCurrBefore、RefPicSetStCurrAfter、RefPicSetStFoll、RefPicSetLtCurr及びRefPicSetLtFoll参照ピクチャサブセットなど、参照ピクチャのサブセットを構成する。ビデオデコーダ30は、参照ピクチャのPOC値に基づいて参照ピクチャリストを構成し得る。5つの参照ピクチャリストに基づいて、ビデオデコーダ30は、RefPicList0及びRefPicList1参照ピクチャリストをも構成し得る。ビデオデコーダ30は、RefPicList0及びRefPicList1中に含まれる参照ピクチャを使用して双予測ブロックの画素値を予測し、RefPicList0の参照ピクチャを使用して単予測ブロックの画素値を予測し得る。
[0183]図4は、本開示で説明する1つ又は複数の例による参照ピクチャについてのデータをコード化するためのプロセスを示すフローチャートである。説明のためにのみ、図4の方法は、ビデオエンコーダ20又はビデオデコーダ30のいずれかに対応するビデオコーダによって実行され得る。図4の方法では、ビデオコーダは、アクティブシーケンスパラメータセット(SPS)中の長期参照ピクチャについての識別情報をコード化する(100)。幾つかの例では、識別情報はLTRPのPOC値のLSBを含み得る。
[0184]ビデオコーダは、現在コード化されているピクチャのためのSPS及びスライスヘッダ中の1つ又は複数の短期参照ピクチャについての識別情報を含む1つ又は複数のシンタックス要素をもコード化する(102)。
[0185]SPS中のLTRPについての識別情報をコード化することに加えて、ビデオコーダは、現在コード化ピクチャの現在スライスヘッダ中のLTRPについての識別情報をもコード化する(104)。スライスヘッダは、現在スライスのためのLTRPのリストを備えるシンタックス要素を含み得る。幾つかの例では、リスト中のLTRPの少なくとも幾つかはアクティブSPSから継承され、リスト中のLTRPの幾つかは現在スライスヘッダ中でコード化される。継承されるSPSをコード化するプロセスは、図5に関して以下でより詳細に説明する。
[0186]LTRP及びSTRPをコード化した後に、ビデオコーダは、参照ピクチャサブセットを構成し得る。幾つかの例では、RefPicSetStCurrBefore、RefPicSetStCurrAfter、RefPicSetStFoll、RefPicSetLtCurr及びRefPicSetLtFoll参照ピクチャサブセットなど、参照ピクチャサブセット(106)。参照ピクチャサブセットに基づいて、ビデオコーダは、参照ピクチャリストRefPicList0、及びRefPicList1を構成する(108)。ビデオコーダは、参照ピクチャリストを構成するためにデフォルト構成技法を採用し得る。ビデオコーダはまた、参照ピクチャについて異なる順序を指定するシンタックス要素に基づいて、RefPicList0及びRefPicList1中の参照ピクチャの順序を変更し得る。
[0187]参照ピクチャリストを構成した後に、ビデオコーダは、参照ピクチャリストの参照ピクチャに基づいて、現在コード化ピクチャのための予測ブロックを形成する(110)。符号化中に、ビデオコーダは、長期参照ピクチャを使用してスライスのビデオデータの一部分を予測し、予測に基づいてビデオデータのその部分をコード化する(112)。
[0188]図5は、本開示で説明する1つ又は複数の例によるSPS又はスライスヘッダ中でLTRPについてのデータをコード化するためのプロセスを示すフローチャートである。説明のためにのみ、図5の方法は、ビデオエンコーダ20又はビデオデコーダ30のいずれかに対応するビデオコーダによって実行され得る。図5の方法では、ビデオコーダは、ビデオデータのスライスのためのスライスヘッダをコード化する(120)。幾つかの例では、スライスヘッダは、現在コード化ピクチャのためのスライスヘッダであり得る。
[0189]スライスヘッダは、LTRPについての識別情報がスライスヘッダ中で明示的に信号伝達されるか、又はスライスに対応するシーケンスパラメータセットから導出されるかを示すシンタックス要素を含む。シンタックス要素が、LTRPについての識別情報が明示的に信号伝達されることを示す場合、ビデオコーダは、スライスヘッダ中の長期参照ピクチャについての識別情報の値をコード化する(122)。シンタックス要素が、LTRPについての識別情報が明示的に信号伝達されることを示さない場合、ビデオコーダは、シンタックス要素が長期参照ピクチャについての識別情報が明示的に信号伝達されないことを示すとき、シーケンスパラメータセットからLTRPについての識別情報を導出する(124)。
[0190]幾つかの例では、図5のプロセスを実行するように構成されたビデオコード化機器は、第1のピクチャに対応する第1の復号ピクチャを復号ピクチャバッファに記憶するように更に構成され得る。復号ピクチャバッファが、「参照のために使用される」とマークされ、第1のピクチャと同じピクチャ順序カウント(POC)の最下位ビット(LSB)の値を有する、2つ以上の参照ピクチャを含んでいるとき、識別情報をコード化するために、機器は、第2のピクチャのスライスのスライスヘッダ中の1に等しい第1のシンタックス要素をコード化するように更に構成される。復号ピクチャバッファが、「参照のために使用される」とマークされ、第1のピクチャと同じPOCLSB値を有する、2つ以上のピクチャを含んでいないとき、識別情報をコード化するために、機器は、スライスヘッダ中の0に等しい第1のシンタックス要素をコード化するように構成され得る。第1のシンタックス要素が1に等しいとき、識別情報をコード化するために、機器は、第1のピクチャのPOC値の最上位ビット(MSB)を示す第2のシンタックス要素をコード化し、長期参照ピクチャとして第1のピクチャを使用して第2のピクチャをコード化するように更に構成される。
[0191]幾つかの例では、図5のプロセスを実行するように構成されたビデオコーダは、複数のピクチャについてのデータをピクチャコード化順序でコード化するように更に構成され得る。データは、複数のピクチャが各々長期参照ピクチャとして使用するために利用可能であることを示し得る。ビデオコーダはまた、複数のピクチャのピクチャ順序カウント(POC)値の最下位ビット(LSB)の値がピクチャコード化順序で非減少又は非増加のいずれかであるように、LSBの値をコード化し得る。
[0192]別の例では、LSBの値をコード化するために、ビデオコーダは、j及びkが、0から、長期参照ピクチャの数−1までの範囲内の整数である、j及びkの任意の値について、参照ピクチャのリスト中の位置jにおける複数のピクチャの第1のピクチャのPOC値のLSBが、参照ピクチャのリスト中の位置kにおける複数のピクチャの第2のピクチャのPOC値のLSBよりも大きいか又はそれに等しいように、若しくはそれに等しいよりも小さいように、LSBの値をコード化するように構成され得る。ビデオコーダは、LTRPの数を示す情報を含むSPSをコード化するように更に構成され得る。
[0193]また別の例では、複数のピクチャについてのデータは、複数のピクチャが参照のために使用されるかどうかを更に示し得、参照のために使用されると示される複数のピクチャの各々について、データは、ピクチャの各々についてのPOC値の最上位ビット(MSB)の値がコード化されるかどうかを決定するためのデータを更に含み得る。
[0194]別の例では、ビデオコーダは、DeltaPocMSBCycleLt変数値を決定し得、但し、複数のピクチャのうちの1つが、シーケンスパラメータセット中で指定される長期参照ピクチャの数に等しいコード化順序値を有するとき、複数のピクチャのうちの1つのDeltaPocMSBCycleLtの値は、複数のピクチャのうちの1つのシンタックス要素delta_poc_msb_cycle_ltの値に等しい。
[0195]例によっては、本明細書で説明した技法のうちいずれかの、幾つかの作用又はイベントは、異なるシーケンスで実行され得、追加、マージ、又は完全に除外され得る(例えば、全ての説明した作用又はイベントが、本技法の実施のために必要であるとは限らない)ことを認識されたい。更に、幾つかの例では、作用又はイベントは、連続的にではなく、同時に、例えば、マルチスレッド処理、割込み処理、又は複数のプロセッサを通して実行され得る。
[0196]1つ又は複数の例では、説明した機能は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組合せで実装され得る。ソフトウェアで実装される場合、機能は、1つ又は複数の命令又はコードとしてコンピュータ可読媒体上に記憶されるか、あるいはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、例えば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含むデータ記憶媒体又は通信媒体などの有形媒体に対応するコンピュータ可読記憶媒体を含み得る。このようにして、コンピュータ可読媒体は、概して、(1)非一時的である有形コンピュータ可読記憶媒体、あるいは(2)信号又は搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明した技法の実装のための命令、コード及び/又はデータ構造を取り出すために1つ又は複数のコンピュータあるいは1つ又は複数のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品はコンピュータ可読媒体を含み得る。
[0197]限定ではなく例として、そのようなコンピュータ可読記憶媒体は、RAM、ROM、EEPROM(登録商標)、CD−ROM又は他の光ディスクストレージ、磁気ディスクストレージ、又は他の磁気記憶装置、フラッシュメモリ、あるいは命令又はデータ構造の形態の所望のプログラムコードを記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体を備えることができる。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。例えば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線(DSL)、又は赤外線、無線、及びマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、又は他のリモート発信源から送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、DSL、又は赤外線、無線、及びマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。但し、コンピュータ可読記憶媒体及びデータ記憶媒体は、接続、搬送波、信号、又は他の一時媒体を含まないが、代わりに非一時的有形記憶媒体を対象とすることを理解されたい。本明細書で使用するディスク(disk)及びディスク(disc)は、コンパクトディスク(disc)(CD)、レーザーディスク(登録商標)(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)、及びBlu−rayディスク(disc)を含み、ディスク(disk)は、通常、データを磁気的に再生し、ディスク(disc)は、データをレーザーで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含まれるべきである。
[0198]命令は、1つ又は複数のデジタル信号プロセッサ(DSP)などの1つ又は複数のプロセッサ、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブル論理アレイ(FPGA)、あるいは他の等価な集積回路又はディスクリート論理回路によって実行され得る。従って、本明細書で使用する「プロセッサ」という用語は、前述の構造、又は本明細書で説明する技法の実装に好適な他の構造のいずれかを指す。更に、幾つかの態様では、本明細書で説明した機能は、符号化及び復号のために構成された専用のハードウェア及び/又はソフトウェアモジュール内に与えられ得、あるいは複合コーデックに組み込まれ得る。また、本技法は、1つ又は複数の回路又は論理要素中に十分に実装され得る。
[0199]本開示の技法は、ワイヤレスハンドセット、集積回路(IC)、又はICのセット(例えば、チップセット)を含む、多種多様な機器又は装置において実装され得る。本開示では、開示する技法を実行するように構成された機器の機能的態様を強調するために様々な構成要素、モジュール、又はユニットについて説明したが、それらの構成要素、モジュール、又はユニットを、必ずしも異なるハードウェアユニットによって実現する必要があるとは限らない。むしろ、上記で説明したように、様々なユニットが、好適なソフトウェア及び/又はファームウェアとともに、上記で説明した1つ又は複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わせられるか、又は相互動作ハードウェアユニットの集合によって与えられ得る。
[0200]様々な例について説明した。これら及び他の例は以下の特許請求の範囲内に入る。
以下に本件出願当初の特許請求の範囲に記載された発明を付記する。
[1] ビデオデータを復号する方法であって、前記方法は、ビデオデータのスライスのためのスライスヘッダを復号すること、ここにおいて、前記スライスヘッダが、長期参照ピクチャについての識別情報を備えるシンタックス要素を含み、ここにおいて、前記識別情報が、前記スライスヘッダ中で明示的に信号伝達されるか、又は前記スライスに対応するシーケンスパラメータセットから導出される、を備え、前記シンタックス要素が、前記長期参照ピクチャについての前記識別情報が明示的に信号伝達されることを示すとき、ここにおいて、前記スライスヘッダを復号することが、前記スライスヘッダ中の前記長期参照ピクチャについての前記識別情報の値を復号することを更に備える、方法。
[2] 前記長期参照ピクチャが第1のピクチャを備え、前記方法は、前記第1のピクチャに対応する第1の復号ピクチャを復号ピクチャバッファに記憶することと、前記復号ピクチャバッファが、「参照のために使用される」とマークされ、前記第1のピクチャと同じピクチャ順序カウント(POC)の最下位ビット(LSB)の値を有する、2つ以上の参照ピクチャを含んでいるとき、ここにおいて、前記識別情報を復号することが、第2のピクチャのスライスの前記スライスヘッダ中の1に等しい第1のシンタックス要素を復号することを更に備え、前記復号ピクチャバッファが、「参照のために使用される」とマークされ、前記第1のピクチャと同じ前記POCLSB値を有する、2つ以上のピクチャを含んでいないとき、ここにおいて、前記識別情報を復号することが、前記スライスヘッダ中の0に等しい前記第1のシンタックス要素を復号することを更に備え、前記第1のシンタックス要素が1に等しいとき、前記識別情報を復号することが、前記第1のピクチャのPOC値の最上位ビット(MSB)を示す第2のシンタックス要素を復号することを更に備え、長期参照ピクチャとして前記第1のピクチャを使用して前記第2のピクチャを復号することとを更に備える、[1]に記載の方法。
[3] 前記シンタックス要素が、前記長期参照ピクチャについての前記識別情報が明示的に信号伝達されないことを示すとき、前記シーケンスパラメータセットから前記長期参照ピクチャについての前記識別情報を導出することを更に備える、[1]に記載の方法。
[4] 前記スライスが現在ピクチャのスライスであり、前記方法が、複数のピクチャについてのデータをピクチャコード化順序で復号することと、ここにおいて、前記データは、前記複数のピクチャの各々が長期参照ピクチャとして使用するために利用可能であることを示す、前記現在ピクチャの前記スライスヘッダ中のシンタックス要素を復号することと、ここにおいて、前記シンタックス要素は、前記複数のピクチャのそれぞれのピクチャ順序カウント(POC)値の最下位ビット(LSB)の値が前記ピクチャコード化順序で非減少又は非増加のいずれかであるような、前記LSBの前記値を含む、を更に備える、[1]に記載の方法。
[5] 前記LSBの前記値を復号することは、j及びkが、0から、前記シーケンスパラメータセットから導出された長期参照ピクチャの数−1までの範囲内の整数である、j及びkの任意の値について、前記スライスヘッダ中で信号伝達される参照ピクチャのリスト中の位置jにおける前記複数のピクチャの第1のピクチャの前記POC値の前記LSBが、参照ピクチャの前記リスト中の位置kにおける前記複数のピクチャの第2のピクチャの前記POC値の前記LSBよりも大きいか又はそれに等しいように、前記LSBの前記値を復号することを備える、[4]に記載の方法。
[6] 長期参照ピクチャの前記数を示す情報を含む前記シーケンスパラメータセットを復号することを更に備える、[5]に記載の方法。
[7] 前記LSBの前記値を復号することは、j及びkが、0から、前記シーケンスパラメータセットから導出された長期参照ピクチャの数−1までの範囲内の整数である、j及びkの任意の値について、前記スライスヘッダ中で信号伝達される参照ピクチャのリスト中の位置jにおける前記複数のピクチャの第1のピクチャの前記POC値の前記LSBが、参照ピクチャの前記リスト中の位置kにおける前記複数のピクチャの第2のピクチャの前記POC値の前記LSBよりも小さいか又はそれに等しいように、前記LSBの前記値を復号することを備える、[4]に記載の方法。
[8] 長期参照ピクチャの前記数を示す情報を含む前記シーケンスパラメータセットを復号することを更に備える、[7]に記載の方法。
[9] 前記データが、前記複数のピクチャの前記POC値の最上位ビット(MSB)の値を更に示す、[4]に記載の方法。
[10] 前記複数のピクチャのうちの1つが、前記シーケンスパラメータセットから継承された長期参照ピクチャの数に等しいコード化順序値を有するとき、前記複数のピクチャのうちの前記1つのDeltaPocMSBCycleLtの値が、前記複数のピクチャのうちの前記1つのシンタックス要素delta_poc_msb_cycle_ltの値に等しい、[4]に記載の方法。
[11] 前記長期参照ピクチャが第1のピクチャを備え、ここにおいて、復号することが、長期参照ピクチャとして前記第1のピクチャを使用して第2のピクチャを復号することを更に備える、[10]に記載の方法。
[12] 前記長期参照ピクチャを使用して前記スライスの前記ビデオデータの一部分を予測することと、前記予測に基づいて前記ビデオデータの前記部分を復号することとを更に備える、[1]に記載の方法。
[13] ビデオデータを符号化する方法であって、前記方法が、ビデオデータのスライスのためのスライスヘッダを符号化すること、ここにおいて、前記スライスヘッダが、長期参照ピクチャについての識別情報を備えるシンタックス要素を含み、ここにおいて、前記識別情報が、前記スライスヘッダ中で明示的に信号伝達されるか、又は前記スライスに対応するシーケンスパラメータセットから導出される、を備え、前記シンタックス要素が、前記長期参照ピクチャについての前記識別情報が明示的に信号伝達されることを示すとき、ここにおいて、前記スライスヘッダを符号化することが、前記スライスヘッダ中の前記長期参照ピクチャについての前記識別情報の値を符号化することを更に備える、方法。
[14] 前記長期参照ピクチャが第1のピクチャを備え、前記方法が、前記第1のピクチャに対応する第1の復号ピクチャを復号ピクチャバッファに記憶することと、前記復号ピクチャバッファが、「参照のために使用される」とマークされ、前記第1のピクチャと同じピクチャ順序カウント(POC)の最下位ビット(LSB)の値を有する、2つ以上の参照ピクチャを含んでいるとき、ここにおいて、前記識別情報を符号化することが、第2のピクチャのスライスの前記スライスヘッダ中の1に等しい第1のシンタックス要素を符号化することを更に備え、前記復号ピクチャバッファが、「参照のために使用される」とマークされ、前記第1のピクチャと同じ前記POCLSB値を有する、2つ以上のピクチャを含んでいないとき、ここにおいて、前記識別情報を符号化することが、前記スライスヘッダ中の0に等しい前記第1のシンタックス要素を符号化することを更に備え、前記第1のシンタックス要素が1に等しいとき、前記識別情報を符号化することが、前記第1のピクチャのPOC値の最上位ビット(MSB)を示す第2のシンタックス要素を符号化することを更に備え、長期参照ピクチャとして前記第1のピクチャを使用して前記第2のピクチャを符号化することとを更に備える、[13]に記載の方法。
[15] 前記シンタックス要素が、前記長期参照ピクチャについての前記識別情報が明示的に信号伝達されないことを示すとき、前記シーケンスパラメータセットから前記長期参照ピクチャについての前記識別情報を導出することを更に備える、[13]に記載の方法。
[16] 前記スライスが現在ピクチャのスライスであり、前記方法が、複数のピクチャについてのデータをピクチャコード化順序で符号化することと、ここにおいて、前記データは、前記複数のピクチャの各々が長期参照ピクチャとして使用するために利用可能であることを示す、前記現在ピクチャの前記スライスヘッダ中のシンタックス要素を符号化することと、ここにおいて、前記シンタックス要素は、前記複数のピクチャのそれぞれのピクチャ順序カウント(POC)値の最下位ビット(LSB)の値が前記ピクチャコード化順序で非減少又は非増加のいずれかであるような、前記LSBの前記値を含む、を更に備える、[13]に記載の方法。
[17] 前記LSBの前記値を符号化することは、j及びkが、0から、前記シーケンスパラメータセットから導出された長期参照ピクチャの数−1までの範囲内の整数である、j及びkの任意の値について、前記スライスヘッダ中で信号伝達される参照ピクチャのリスト中の位置jにおける前記複数のピクチャの第1のピクチャの前記POC値の前記LSBが、参照ピクチャの前記リスト中の位置kにおける前記複数のピクチャの第2のピクチャの前記POC値の前記LSBよりも大きいか又はそれに等しいように、前記LSBの前記値を符号化することを備える、[16]に記載の方法。
[18] 長期参照ピクチャの前記数を示す情報を含む前記シーケンスパラメータセットを符号化することを更に備える、[17]に記載の方法。
[19] 前記LSBの前記値を符号化することは、j及びkが、0から、前記シーケンスパラメータセットから導出された長期参照ピクチャの数−1までの範囲内の整数である、j及びkの任意の値について、前記スライスヘッダ中で信号伝達される参照ピクチャのリスト中の位置jにおける前記複数のピクチャの第1のピクチャの前記POC値の前記LSBが、参照ピクチャの前記リスト中の位置kにおける前記複数のピクチャの第2のピクチャの前記POC値の前記LSBよりも小さいか又はそれに等しいように、前記LSBの前記値を符号化することを備える、[16]に記載の方法。
[20] 長期参照ピクチャの前記数を示す情報を含む前記シーケンスパラメータセットを符号化することを更に備える、[19]に記載の方法。
[21] 前記データが、前記複数のピクチャの前記POC値の最上位ビット(MSB)の値を更に示す、[16]に記載の方法。
[22] 前記複数のピクチャのうちの1つが、前記シーケンスパラメータセットから継承された長期参照ピクチャの数に等しいコード化順序値を有するとき、前記複数のピクチャのうちの前記1つのDeltaPocMSBCycleLtの値が、前記複数のピクチャのうちの前記1つのシンタックス要素delta_poc_msb_cycle_ltの値に等しい、[16]に記載の方法。
[23] 前記長期参照ピクチャが第1のピクチャを備え、ここにおいて、符号化することが、長期参照ピクチャとして前記第1のピクチャを使用して第2のピクチャを符号化することを更に備える、[13]に記載の方法。
[24] 前記長期参照ピクチャを使用して前記スライスの前記ビデオデータの一部分を予測することと、前記予測に基づいて前記ビデオデータの前記部分を符号化することとを更に備える、[13]に記載の方法。
[25] ビデオをコード化するための機器であって、前記機器は、ビデオデータのスライスのためのスライスヘッダをコード化するための手段と、ここにおいて、前記スライスヘッダが、長期参照ピクチャについての識別情報を備えるシンタックス要素を含み、ここにおいて、前記識別情報が、前記スライスヘッダ中で明示的に信号伝達されるか、又は前記スライスに対応するシーケンスパラメータセットから導出される、前記シンタックス要素が、前記長期参照ピクチャについての前記識別情報が明示的に信号伝達されることを示すときのための手段と、ここにおいて、前記スライスヘッダをコード化することが、前記スライスヘッダ中の前記長期参照ピクチャについての前記識別情報の値をコード化することを更に備える、を備える、機器。
[26] 前記シンタックス要素が、前記長期参照ピクチャについての前記識別情報が明示的に信号伝達されないことを示すとき、前記シーケンスパラメータセットから前記長期参照ピクチャについての前記識別情報を導出するための手段
を更に備える、[25]に記載の機器。
[27] 前記機器は、複数のピクチャについてのデータをピクチャコード化順序でコード化するための手段と、ここにおいて、前記データは、前記複数のピクチャの各々が長期参照ピクチャとして使用するために利用可能であることを示す、前記現在ピクチャの前記スライスヘッダ中のシンタックス要素をコード化するための手段と、ここにおいて、前記シンタックス要素は、前記複数のピクチャのそれぞれのピクチャ順序カウント(POC)値の最下位ビット(LSB)の値が前記ピクチャコード化順序で非減少又は非増加のいずれかであるような、前記LSBの前記値を含む、を更に備える、[25]に記載の機器。
[28] 前記LSBの前記値をコード化するための前記手段は、j及びkが、0から、前記シーケンスパラメータセットから導出された長期参照ピクチャの数−1までの範囲内の整数である、j及びkの任意の値について、前記スライスヘッダ中で信号伝達される参照ピクチャのリスト中の位置jにおける前記複数のピクチャの第1のピクチャの前記POC値の前記LSBが、参照ピクチャの前記リスト中の位置kにおける前記複数のピクチャの第2のピクチャの前記POC値の前記LSBよりも大きいか又はそれに等しいように、前記LSBの前記値をコード化するための手段を備える、[25]に記載の機器。
[29] 長期参照ピクチャの前記数を示す情報を含むシーケンスパラメータセットをコード化するための手段を更に備える、[28]に記載の機器。
[30] 前記LSBの前記値をコード化するための前記手段は、j及びkが、0から、前記シーケンスパラメータセットから導出された長期参照ピクチャの数−1までの範囲内の整数である、j及びkの任意の値について、前記スライスヘッダ中で信号伝達される参照ピクチャのリスト中の位置jにおける前記複数のピクチャの第1のピクチャの前記POC値の前記LSBが、参照ピクチャの前記リスト中の位置kにおける前記複数のピクチャの第2のピクチャの前記POC値の前記LSBよりも小さいか又はそれに等しいように、前記LSBの前記値をコード化するための手段を備える、[27]に記載の機器。
[31] 長期参照ピクチャの前記数を示す情報を含むシーケンスパラメータセットをコード化するための手段を更に備える、[30]に記載の機器。
[32] 前記データが、前記複数のピクチャの前記POC値の最上位ビット(MSB)の値を更に示す、[31]に記載の機器。
[33] 前記複数のピクチャのうちの1つが、前記シーケンスパラメータセットから継承された長期参照ピクチャの数に等しいコード化順序値を有するとき、前記複数のピクチャのうちの前記1つのDeltaPocMSBCycleLtの値が、前記複数のピクチャのうちの前記1つのシンタックス要素delta_poc_msb_cycle_ltの値に等しい、[27]に記載の機器。
[34] 前記長期参照ピクチャが第1のピクチャを備え、ここにおいて、コード化することが、長期参照ピクチャとして前記第1のピクチャを使用して第2のピクチャを復号するための手段を備える、[25]に記載の機器。
[35] 前記長期参照ピクチャが第1のピクチャを備え、ここにおいて、コード化するための前記手段が、長期参照ピクチャとして前記第1のピクチャを使用して第2のピクチャを符号化するための手段を備える、[25]に記載の機器。
[36] 前記長期参照ピクチャを使用して前記スライスの前記ビデオデータの一部分を予測するための手段と、前記予測に基づいて前記ビデオデータの前記部分をコード化するための手段とを更に備える、[25]に記載の機器。
[37] ビデオデータをコード化するための機器であって、前記機器は、ビデオデータのスライスのためのスライスヘッダをコード化すること、ここにおいて、前記スライスヘッダが、長期参照ピクチャについての識別情報を備えるシンタックス要素を含み、ここにおいて、前記識別情報が、前記スライスヘッダ中で明示的に信号伝達されるか、又は前記スライスに対応するシーケンスパラメータセットから導出される、を行うように構成されたビデオコーダを備え、前記シンタックス要素が、前記長期参照ピクチャについての前記識別情報が明示的に信号伝達されることを示すとき、前記スライスヘッダをコード化するために、前記機器が、前記スライスヘッダ中の前記長期参照ピクチャについての前記識別情報の値をコード化するように更に構成される、機器。
[38] 前記長期参照ピクチャが第1のピクチャを備え、前記機器は、前記第1のピクチャに対応する第1の復号ピクチャを復号ピクチャバッファに記憶することと、前記復号ピクチャバッファが、「参照のために使用される」とマークされ、前記第1のピクチャと同じピクチャ順序カウント(POC)の最下位ビット(LSB)の値を有する、2つ以上の参照ピクチャを含んでいるとき、前記識別情報をコード化するために、前記機器が、第2のピクチャのスライスの前記スライスヘッダ中の1に等しい第1のシンタックス要素をコード化するように更に構成され、前記復号ピクチャバッファが、「参照のために使用される」とマークされ、前記第1のピクチャと同じ前記POCLSB値を有する、2つ以上のピクチャを含んでいないとき、前記識別情報をコード化するために、前記機器が、前記スライスヘッダ中の0に等しい前記第1のシンタックス要素をコード化するように更に構成され、前記第1のシンタックス要素が1に等しいとき、前記識別情報をコード化するために、前記機器が、前記第1のピクチャのPOC値の最上位ビット(MSB)を示す第2のシンタックス要素をコード化するように更に構成され、長期参照ピクチャとして前記第1のピクチャを使用して前記第2のピクチャをコード化することとを行うように更に構成された、[37]に記載の機器。
[39] 前記機器は、前記シンタックス要素が、前記長期参照ピクチャについての前記識別情報が明示的に信号伝達されないことを示すとき、前記シーケンスパラメータセットから前記長期参照ピクチャについての前記識別情報を導出することを行うように更に構成された、[37]に記載の機器。
[40] 前記機器は、複数のピクチャについてのデータをピクチャコード化順序でコード化することと、ここにおいて、前記データは、前記複数のピクチャがそれぞれ長期参照ピクチャとして使用するために利用可能であることを示す、前記複数のピクチャのピクチャ順序カウント(POC)値の最下位ビット(LSB)の値が前記ピクチャコード化順序で非減少又は非増加のいずれかであるように、前記LSBの前記値をコード化することとを行うように更に構成された、[37]に記載の機器。
[41] 前記LSBの前記値をコード化するために、前記機器は、j及びkが、0から、前記シーケンスパラメータセットから導出された長期参照ピクチャの数−1までの範囲内の整数である、j及びkの任意の値について、前記スライスヘッダ中で信号伝達される参照ピクチャのリスト中の位置jにおける前記複数のピクチャの第1のピクチャの前記POC値の前記LSBが、参照ピクチャの前記リスト中の位置kにおける前記複数のピクチャの第2のピクチャの前記POC値の前記LSBよりも大きいか又はそれに等しいように、前記LSBの前記値をコード化するように構成された、[40]に記載の機器。
[42] 前記機器が、長期参照ピクチャの前記数を示す情報を含むシーケンスパラメータセットをコード化するように更に構成された、[41]に記載の機器。
[43] 前記LSBの前記値をコード化するために、前記機器は、j及びkが、0から、前記シーケンスパラメータセットから導出された長期参照ピクチャの数−1までの範囲内の整数である、j及びkの任意の値について、前記スライスヘッダ中で信号伝達される参照ピクチャのリスト中の位置jにおける前記複数のピクチャの第1のピクチャの前記POC値の前記LSBが、参照ピクチャの前記リスト中の位置kにおける前記複数のピクチャの第2のピクチャの前記POC値の前記LSBよりも小さいか又はそれに等しいように、前記LSBの前記値をコード化するように構成された、[40]に記載の機器。
[44] 長期参照ピクチャの前記数を示す情報を含むシーケンスパラメータセットをコード化することを更に備える、[43]に記載の機器。
[45] 前記データが、前記複数のピクチャの前記POC値の最上位ビット(MSB)の値を更に示す、[40]に記載の機器。
[46] 前記複数のピクチャのうちの1つが、前記シーケンスパラメータセットから継承された長期参照ピクチャの数に等しいコード化順序値を有するとき、前記複数のピクチャのうちの前記1つのDeltaPocMSBCycleLtの値が、前記複数のピクチャのうちの前記1つのシンタックス要素delta_poc_msb_cycle_ltの値に等しい、[40]に記載の機器。
[47] 前記長期参照ピクチャが第1のピクチャを備え、ここにおいて、コード化するために、前記機器が、長期参照ピクチャとして前記第1のピクチャを使用して第2のピクチャを復号するように構成された、[38]に記載の機器。
[48] 前記長期参照ピクチャが第1のピクチャを備え、ここにおいて、コード化するために、前記機器が、長期参照ピクチャとして前記第1のピクチャを使用して第2のピクチャを符号化するように構成された、[38]に記載の機器。
[49] 前記機器が、集積回路と、マイクロプロセッサと、ワイヤレス通信機器とのうちの少なくとも1つを備える、[38]に記載の機器。
[50] 前記機器が、前記長期参照ピクチャを使用して前記スライスの前記ビデオデータの一部分を予測するように更に構成され、前記予測に基づいて前記ビデオデータの前記部分をコード化する、[38]に記載の機器。
[51] 実行されたとき、プロセッサに、ビデオデータのスライスのためのスライスヘッダをコード化すること、ここにおいて、前記スライスヘッダは、長期参照ピクチャについての識別情報が、前記スライスヘッダ中で明示的に信号伝達されるか、又は前記スライスに対応するシーケンスパラメータセットから導出されるかを示すシンタックス要素を含む、を行わせる命令を記憶した非一時的コンピュータ可読記憶媒体であって、前記シンタックス要素が、前記長期参照ピクチャについての前記識別情報が明示的に信号伝達されることを示すとき、前記スライスヘッダをコード化するために、前記命令が、前記プロセッサに、前記スライスヘッダ中の前記長期参照ピクチャについての前記識別情報の値をコード化させる、非一時的コンピュータ可読記憶媒体。
[52] 前記シンタックス要素が、前記長期参照ピクチャについての前記識別情報が明示的に信号伝達されないことを示すとき、前記シーケンスパラメータセットから前記長期参照ピクチャについての前記識別情報を導出することを前記プロセッサに行わせる命令を更に備える、[51]に記載のコンピュータ可読媒体。
[53] 複数のピクチャについてのデータをピクチャコード化順序でコード化することと、ここにおいて、前記データは、前記複数のピクチャがそれぞれ長期参照ピクチャとして使用するために利用可能であることを示す、前記複数のピクチャのピクチャ順序カウント(POC)値の最下位ビット(LSB)の値が前記ピクチャコード化順序で非減少又は非増加のいずれかであるように、前記LSBの前記値をコード化することとを前記プロセッサに行わせる命令を更に備える、[51]に記載のコンピュータ可読ストレージ。
[54] 前記プロセッサに前記LSBの前記値をコード化させる前記命令は、j及びkが、0から、前記シーケンスパラメータセットから導出された長期参照ピクチャの数−1までの範囲内の整数である、j及びkの任意の値について、前記スライスヘッダ中で信号伝達される参照ピクチャのリスト中の位置jにおける前記複数のピクチャの第1のピクチャの前記POC値の前記LSBが、参照ピクチャの前記リスト中の位置kにおける前記複数のピクチャの第2のピクチャの前記POC値の前記LSBよりも大きいか又はそれに等しいように、前記LSBの前記値をコード化することを前記プロセッサに行わせる命令を備える、[53]に記載のコンピュータ可読媒体。
[55] 前記プロセッサに、長期参照ピクチャの前記数を示す情報を含むシーケンスパラメータセットをコード化させる命令を更に備える、[54]に記載のコンピュータ可読媒体。
[56] 前記プロセッサに前記LSBの前記値をコード化させる前記命令は、j及びkが、0から、前記シーケンスパラメータセットから導出された長期参照ピクチャの数−1までの範囲内の整数である、j及びkの任意の値について、前記スライスヘッダ中で信号伝達される参照ピクチャのリスト中の位置jにおける前記複数のピクチャの第1のピクチャの前記POC値の前記LSBが、参照ピクチャの前記リスト中の位置kにおける前記複数のピクチャの第2のピクチャの前記POC値の前記LSBよりも小さいか又はそれに等しいように、前記LSBの前記値をコード化することを前記プロセッサに行わせる命令を備える、[53]に記載のコンピュータ可読媒体。
[57] 実行されると、前記プロセッサに、長期参照ピクチャの前記数を示す情報を含むシーケンスパラメータセットをコード化させる命令を更に備える、[56]に記載のコンピュータ可読媒体。
[58] 前記データが、前記複数のピクチャの前記POC値の最上位ビット(MSB)の値を更に含む、[53]に記載のコンピュータ可読媒体。
[59] 前記複数のピクチャのうちの1つが、前記シーケンスパラメータセットから継承された長期参照ピクチャの数に等しいコード化順序値を有するとき、前記複数のピクチャのうちの前記1つのDeltaPocMSBCycleLtの値が、前記複数のピクチャのうちの前記1つのシンタックス要素delta_poc_msb_cycle_ltの値に等しい、[53]に記載のコンピュータ可読媒体。
[60] 前記長期参照ピクチャが第1のピクチャを備え、ここにおいて、前記プロセッサにコード化させる前記命令が、前記プロセッサに、長期参照ピクチャとして前記第1のピクチャを使用して第2のピクチャを復号させる命令を備える、[51]に記載のコンピュータ可読媒体。
[61] 前記長期参照ピクチャが第1のピクチャを備え、ここにおいて、前記プロセッサにコード化させる前記命令が、前記プロセッサに、長期参照ピクチャとして前記第1のピクチャを使用して第2のピクチャを符号化させる命令を備える、[51]に記載のコンピュータ可読媒体。

Claims (15)

  1. 高効率ビデオコード化(HEVC)準拠ビデオデータに従ってビデオデータを復号する方法であって、前記方法は、
    複数のピクチャのシンタックス要素データをピクチャコード化順序で復号することと、ここにおいて、前記シンタックス要素データが、前記複数のピクチャの各々が長期参照ピクチャ用として利用可能であることを示す、
    ビデオデータのスライスのためのスライスヘッダを復号すること、ここにおいて、前記スライスヘッダが、シーケンスパラメータセットから導出される長期参照ピクチャの数を示すシンタックス要素を含み、
    前記複数のピクチャのうちの長期参照ピクチャが前記スライスヘッダ中で明示的に信号伝達されるか、又は前記スライスに対応するシーケンスパラメータセットから導出されるかを決定することと、
    前記長期参照ピクチャが明示的に信号伝達されとき、前記スライスヘッダを復号することが、前記スライスヘッダ中の前記長期参照ピクチャについての識別情報の値を復号することを更に備える、
    前記長期参照ピクチャが前記シーケンスパラメータセットから受け継いだ長期参照ピクチャの数に等しいインデックス値を有するとき前記インデックス値iを有する前記長期参照ピクチャのDeltaPocMSBCycleLt[i]の値が前記インデックス値iを有する前記長期参照ピクチャのシンタックス要素delta_poc_msb_cycle_lt[i]の値に等しいことを決定することと、
    を備える方法。
  2. 前記長期参照ピクチャが第1のピクチャを備え、前記方法は、
    前記第1のピクチャに対応する第1の復号ピクチャを復号ピクチャバッファに記憶することと、
    前記復号ピクチャバッファが、「参照のために使用される」とマークされ、前記第1のピクチャと同じピクチャ順序カウント(POC)の最下位ビット(LSB)の値を有する、2つ以上の参照ピクチャを含んでいるとき、前記識別情報を復号することが、第2のピクチャのスライスの前記スライスヘッダ中の1に等しい第1のシンタックス要素を復号することを更に備え、
    前記復号ピクチャバッファが、「参照のために使用される」とマークされ、前記第1のピクチャと同じピクチャ順序カウント(POC)の最下位ビット(LSB)の値を有する、2つ以上のピクチャを含んでいないとき、前記識別情報を復号することが、前記スライスヘッダ中の0に等しい前記第1のシンタックス要素を復号することを更に備え、
    前記第1のシンタックス要素が1に等しいとき、前記識別情報を復号することが、前記第1のピクチャのPOC値の最上位ビット(MSB)を示す第2のシンタックス要素を復号することを更に備え、
    長期参照ピクチャとして前記第1のピクチャを使用して前記第2のピクチャを復号することと
    を更に備える、請求項1に記載の方法。
  3. 現在ピクチャの前記スライスヘッダ中のシンタックス要素を復号することと、ここにおいて、前記シンタックス要素は、前記複数のピクチャのそれぞれのピクチャ順序カウント(POC)値の最下位ビット(LSB)の値が前記ピクチャコード化順序で非減少又は非増加のいずれかであるような、前記LSBの前記値を含む、
    を更に備える、請求項1に記載の方法。
  4. 前記LSBの前記値を復号することは、j及びkが、0から、前記シーケンスパラメータセットから導出された長期参照ピクチャの数−1までの範囲内の整数である場合、j及びkの任意の値について、前記スライスヘッダ中で信号伝達される参照ピクチャのリスト中の位置jにおける前記複数のピクチャの第1のピクチャの前記POC値の前記LSBが、参照ピクチャの前記リスト中の位置kにおける前記複数のピクチャの第2のピクチャの前記POC値の前記LSB以上又は参照ピクチャの前記リスト中の位置kにおける前記複数のピクチャの第2のピクチャの前記POC値の前記LSB以下であるように、前記LSBの前記値を復号することを備える、請求項3に記載の方法。
  5. 長期参照ピクチャの前記数を示す情報を含む前記シーケンスパラメータセットを復号することを更に備える、請求項4に記載の方法。
  6. 高効率ビデオコード化(HEVC)ビデオデータを符号化する方法であって、前記方法が、
    複数のピクチャのシンタックス要素データをピクチャコード化順序で符号化することと、ここにおいて、前記シンタックス要素データが、前記複数のピクチャの各々が長期参照ピクチャ用として利用可能であることを示す、
    ビデオデータのスライスのためのスライスヘッダを符号化すること、ここにおいて、前記スライスヘッダが、シーケンスパラメータセットから導出される長期参照ピクチャの数を示すシンタックス要素を含み、
    前記複数のピクチャの長期参照ピクチャが前記スライスヘッダ中で明示的に信号伝達されるか、又は前記スライスに対応するシーケンスパラメータセットから導出されるかを決定することと、
    前記長期参照ピクチャが明示的に信号伝達されるとき、前記スライスヘッダを符号化することが、前記スライスヘッダ中の前記長期参照ピクチャについての識別情報の値を符号化することを更に備える、
    前記長期参照ピクチャが前記シーケンスパラメータセットから受け継いだ長期参照ピクチャの数に等しいインデックス値を有するときインデックス値iを有する前記長期参照ピクチャのDeltaPocMSBCycleLt[i]の値が前記インデックス値iを有する前記長期参照ピクチャのシンタックス要素delta_poc_msb_cycle_lt[i]の値に等しいことを決定することと、
    を備える、方法。
  7. 前記長期参照ピクチャが第1のピクチャを備え、前記方法が、
    前記第1のピクチャに対応する第1の復号ピクチャを復号ピクチャバッファに記憶することと、
    前記復号ピクチャバッファが、「参照のために使用される」とマークされ、前記第1のピクチャと同じピクチャ順序カウント(POC)の最下位ビット(LSB)の値を有する、2つ以上の参照ピクチャを含んでいるとき、前記識別情報を符号化することが、第2のピクチャのスライスの前記スライスヘッダ中の1に等しい第1のシンタックス要素を符号化することを更に備え、
    前記復号ピクチャバッファが、「参照のために使用される」とマークされ、前記第1のピクチャと同じピクチャ順序カウント(POC)の最下位ビット(LSB)の値を有する、2つ以上のピクチャを含んでいないとき、前記識別情報を符号化することが、前記スライスヘッダ中の0に等しい前記第1のシンタックス要素を符号化することを更に備え、
    前記第1のシンタックス要素が1に等しいとき、前記識別情報を符号化することが、前記第1のピクチャのPOC値の最上位ビット(MSB)を示す第2のシンタックス要素を符号化することを更に備え、
    長期参照ピクチャとして前記第1のピクチャを使用して前記第2のピクチャを符号化することと
    を更に備える、請求項6に記載の方法。
  8. 現在ピクチャの前記スライスヘッダ中のシンタックス要素を符号化することと、ここにおいて、前記シンタックス要素は、前記複数のピクチャのそれぞれのピクチャ順序カウント(POC)値の最下位ビット(LSB)の値が前記ピクチャコード化順序で非減少又は非増加のいずれかであるような、前記LSBの前記値を含む、
    を更に備える、請求項6に記載の方法。
  9. 前記LSBの前記値を符号化することは、j及びkが、0から、前記シーケンスパラメータセットから導出された長期参照ピクチャの数−1までの範囲内の整数である場合、j及びkの任意の値について、前記スライスヘッダ中で信号伝達される参照ピクチャのリスト中の位置jにおける前記複数のピクチャの第1のピクチャの前記POC値の前記LSBが、参照ピクチャの前記リスト中の位置kにおける前記複数のピクチャの第2のピクチャの前記POC値の前記LSB以上又は参照ピクチャの前記リスト中の位置kにおける前記複数のピクチャの第2のピクチャの前記POC値の前記LSB以下になるように、前記LSBの前記値を符号化することを備える、請求項8に記載の方法。
  10. 長期参照ピクチャの前記数を示す情報を含む前記シーケンスパラメータセットを符号化することを更に備える、請求項9に記載の方法。
  11. 高効率ビデオコード化(HEVC)準拠ビデオデータに従ってビデオデータをコード化するための機器であって、前記機器は、
    複数のピクチャのシンタックス要素データをピクチャコード化順序でコード化することと、ここにおいて、前記シンタックス要素データが、前記複数のピクチャの各々が長期参照ピクチャ用として利用可能であることを示す、
    ビデオデータのスライスのためのスライスヘッダをコード化すること、ここにおいて、前記スライスヘッダが、シーケンスパラメータセットから導出される長期参照ピクチャの数を示すシンタックス要素を含み、
    前記複数のピクチャの長期参照ピクチャが前記スライスヘッダ中で明示的に信号伝達されるか、又は前記スライスに対応するシーケンスパラメータセットから導出されるかを決定することと、
    識別情報が、前記長期参照ピクチャが明示的に信号伝達されることを示すとき、前記スライスヘッダをコード化するために、前記機器が、前記スライスヘッダ中の前記長期参照ピクチャについての前記識別情報の値をコード化するように更に構成され、
    前記長期参照ピクチャが前記シーケンスパラメータセットから受け継いだ長期参照ピクチャの数に等しいインデックス値を有するときインデックス値iを有する前記長期参照ピクチャのDeltaPocMSBCycleLt[i]の値が前記インデックス値iを有する前記長期参照ピクチャのシンタックス要素delta_poc_msb_cycle_lt[i]の値に等しいことを決定することと、
    を行うように構成されたHEVCビデオコーダを備える、
    機器。
  12. 前記長期参照ピクチャが第1のピクチャを備え、前記機器は、
    前記第1のピクチャに対応する第1の復号ピクチャを復号ピクチャバッファに記憶することと、
    前記復号ピクチャバッファが、「参照のために使用される」とマークされ、前記第1のピクチャと同じピクチャ順序カウント(POC)の最下位ビット(LSB)の値を有する、2つ以上の参照ピクチャを含んでいるとき、前記識別情報をコード化するために、前記機器が、第2のピクチャのスライスの前記スライスヘッダ中の1に等しい第1のシンタックス要素をコード化するように更に構成され、
    前記復号ピクチャバッファが、「参照のために使用される」とマークされ、前記第1のピクチャと同じピクチャ順序カウント(POC)の最下位ビット(LSB)の値を有する、2つ以上のピクチャを含んでいないとき、前記識別情報をコード化するために、前記機器が、前記スライスヘッダ中の0に等しい前記第1のシンタックス要素をコード化するように更に構成され、
    前記第1のシンタックス要素が1に等しいとき、前記識別情報をコード化するために、前記機器が、前記第1のピクチャのPOC値の最上位ビット(MSB)を示す第2のシンタックス要素をコード化するように更に構成され、
    長期参照ピクチャとして前記第1のピクチャを使用して前記第2のピクチャをコード化することと
    を行うように更に構成された、請求項11に記載の機器。
  13. 前記機器は、
    前記複数のピクチャのピクチャ順序カウント(POC)値の最下位ビット(LSB)の値が前記ピクチャコード化順序で非減少又は非増加のいずれかであるように、前記LSBの前記値をコード化することと
    を行うように更に構成された、請求項11に記載の機器。
  14. 前記LSBの前記値をコード化するために、前記機器は、j及びkが、0から、前記シーケンスパラメータセットから導出された長期参照ピクチャの数−1までの範囲内の整数である場合、j及びkの任意の値について、前記スライスヘッダ中で信号伝達される参照ピクチャのリスト中の位置jにおける前記複数のピクチャの第1のピクチャの前記POC値の前記LSBが、参照ピクチャの前記リスト中の位置kにおける前記複数のピクチャの第2のピクチャの前記POC値の前記LSB以上又は前記スライスヘッダ中で信号伝達される参照ピクチャの前記リスト中の位置kにおける前記複数のピクチャの第2のピクチャの前記POC値の前記LSB以下であるように、前記LSBの前記値をコード化するように構成された、請求項13に記載の機器。
  15. 実行されたとき、プロセッサに、請求項1〜10のいずれか1項の方法を実行させる命令を記憶したコンピュータ可読記憶媒体。
JP2015516028A 2012-06-07 2013-05-14 ビデオコード化のための長期参照ピクチャについてのデータの信号伝達 Active JP6162228B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261656877P 2012-06-07 2012-06-07
US61/656,877 2012-06-07
US13/828,354 2013-03-14
US13/828,354 US9319679B2 (en) 2012-06-07 2013-03-14 Signaling data for long term reference pictures for video coding
PCT/US2013/040938 WO2013184305A1 (en) 2012-06-07 2013-05-14 Signaling data for long term reference pictures for video coding

Publications (3)

Publication Number Publication Date
JP2015523012A JP2015523012A (ja) 2015-08-06
JP2015523012A5 JP2015523012A5 (ja) 2016-06-16
JP6162228B2 true JP6162228B2 (ja) 2017-07-12

Family

ID=48614115

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015516028A Active JP6162228B2 (ja) 2012-06-07 2013-05-14 ビデオコード化のための長期参照ピクチャについてのデータの信号伝達

Country Status (17)

Country Link
US (1) US9319679B2 (ja)
EP (1) EP2859725A1 (ja)
JP (1) JP6162228B2 (ja)
KR (1) KR101676938B1 (ja)
CN (1) CN104365106B (ja)
AU (1) AU2013272130B2 (ja)
BR (1) BR112014030605B1 (ja)
CA (1) CA2873419C (ja)
HK (1) HK1203116A1 (ja)
IL (1) IL235632A (ja)
MX (1) MX353754B (ja)
MY (1) MY168265A (ja)
PH (1) PH12014502598A1 (ja)
RU (1) RU2635248C2 (ja)
SG (1) SG11201407369SA (ja)
WO (1) WO2013184305A1 (ja)
ZA (1) ZA201500075B (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL2749027T3 (pl) 2011-08-25 2020-10-19 Sun Patent Trust Sposoby i urządzenia do kodowania i dekodowania wideo z użyciem zaktualizowanego opisu bufora
ES2685431T3 (es) 2011-09-07 2018-10-09 Sun Patent Trust Procedimiento de decodificación de imágenes y aparato de decodificación de imágenes
ES2844148T3 (es) 2011-09-19 2021-07-21 Sun Patent Trust Procedimiento de descodificación de imágenes, dispositivo de descodificación de imágenes
CN104025598B (zh) 2011-10-19 2017-11-14 太阳专利托管公司 图像编码方法、图像编码装置
US20130188709A1 (en) * 2012-01-25 2013-07-25 Sachin G. Deshpande Video decoder for tiles with absolute signaling
US9979958B2 (en) 2012-04-20 2018-05-22 Qualcomm Incorporated Decoded picture buffer processing for random access point pictures in video sequences
US9479776B2 (en) * 2012-07-02 2016-10-25 Qualcomm Incorporated Signaling of long-term reference pictures for video coding
US9584825B2 (en) * 2012-09-27 2017-02-28 Qualcomm Incorporated Long-term reference picture signaling in video coding
US10250902B2 (en) * 2013-05-24 2019-04-02 Kt Corporation Method for inducing motion information in multilayer structure and apparatus using same
US10645414B2 (en) * 2015-11-11 2020-05-05 Samsung Electronics Co., Ltd. Method for encoding/decoding image, and device therefor
AU2019297829B2 (en) * 2018-07-01 2022-10-06 FG Innovation Company Limited Systems and methods for signaling picture order count values for pictures included in coded video
CN114501018B (zh) 2018-08-17 2024-01-09 华为技术有限公司 参考图像管理的解码方法、设备和系统
EP3854099A4 (en) * 2018-09-21 2022-06-29 Sharp Kabushiki Kaisha Systems and methods for signaling reference pictures in video coding
WO2020122062A1 (en) * 2018-12-10 2020-06-18 Sharp Kabushiki Kaisha Systems and methods for signaling reference pictures in video coding
CN118714324A (zh) * 2019-01-28 2024-09-27 Op方案有限责任公司 扩展长期参考图片保留的显式信令
BR112021016926A2 (pt) * 2019-02-28 2021-11-03 Samsung Electronics Co Ltd Método de decodificação de imagem, aparelho de decodificação de imagem, e método de codificação de imagem
WO2021033749A1 (en) * 2019-08-22 2021-02-25 Sharp Kabushiki Kaisha Systems and methods for signaling picture information in video coding
CN115209153B (zh) * 2019-09-24 2023-06-06 华为技术有限公司 编码器、解码器及对应方法
WO2021107638A1 (ko) * 2019-11-27 2021-06-03 엘지전자 주식회사 슬라이스 관련 정보를 시그널링하는 방법 및 장치
WO2024080917A1 (en) * 2022-10-13 2024-04-18 Telefonaktiebolaget Lm Ericsson (Publ) Quantization parameter (qp) coding for video compression
WO2024080916A1 (en) * 2022-10-13 2024-04-18 Telefonaktiebolaget Lm Ericsson (Publ) Inter-predicted reference picture lists

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100491530B1 (ko) * 2002-05-03 2005-05-27 엘지전자 주식회사 모션 벡터 결정 방법
MY134659A (en) * 2002-11-06 2007-12-31 Nokia Corp Picture buffering for prediction references and display
FR2874292B1 (fr) * 2004-08-10 2007-01-26 Thales Sa Procede de mise en forme de trames d'une sequence video
CN101065780A (zh) * 2004-10-14 2007-10-31 诺基亚公司 视频编码中的参考图像管理
CN101455084A (zh) * 2006-03-30 2009-06-10 Lg电子株式会社 用于解码/编码视频信号的方法和装置
MX357910B (es) * 2006-07-06 2018-07-30 Thomson Licensing Método y aparato para desacoplar el número de cuadro y/o la cuenta del orden de imagen (poc) para la codificación y decodificación de video de múltiples vistas.
US8532178B2 (en) * 2006-08-25 2013-09-10 Lg Electronics Inc. Method and apparatus for decoding/encoding a video signal with inter-view reference picture list construction
US8948256B2 (en) * 2006-10-13 2015-02-03 Thomson Licensing Reference picture list management syntax for multiple view video coding
WO2008048515A2 (en) * 2006-10-13 2008-04-24 Thomson Licensing Method for reference picture management involving multiview video coding
CA2666452C (en) * 2006-10-16 2014-12-16 Nokia Corporation System and method for implementing efficient decoded buffer management in multi-view video coding
US20100266042A1 (en) * 2007-03-02 2010-10-21 Han Suh Koo Method and an apparatus for decoding/encoding a video signal
WO2010086500A1 (en) * 2009-01-28 2010-08-05 Nokia Corporation Method and apparatus for video coding and decoding
CN102047670B (zh) 2009-03-26 2014-03-12 松下电器产业株式会社 编码装置及方法、错误检测装置及方法、解码装置及方法
US20110194613A1 (en) 2010-02-11 2011-08-11 Qualcomm Incorporated Video coding with large macroblocks
US20110249729A1 (en) * 2010-04-07 2011-10-13 Apple Inc. Error resilient hierarchical long term reference frames
US9008176B2 (en) 2011-01-22 2015-04-14 Qualcomm Incorporated Combined reference picture list construction for video coding
ES2685431T3 (es) * 2011-09-07 2018-10-09 Sun Patent Trust Procedimiento de decodificación de imágenes y aparato de decodificación de imágenes
BR122021007881B1 (pt) * 2011-10-28 2023-03-21 Samsung Electronics Co., Ltd Método de decodificação de vídeo, e método de codificação de vídeo
US10003817B2 (en) * 2011-11-07 2018-06-19 Microsoft Technology Licensing, Llc Signaling of state information for a decoded picture buffer and reference picture lists

Also Published As

Publication number Publication date
RU2014153876A (ru) 2016-08-10
IL235632A0 (en) 2015-01-29
RU2635248C2 (ru) 2017-11-09
MX353754B (es) 2018-01-26
AU2013272130B2 (en) 2017-04-20
BR112014030605A2 (pt) 2017-06-27
ZA201500075B (en) 2017-01-25
US9319679B2 (en) 2016-04-19
WO2013184305A1 (en) 2013-12-12
CA2873419C (en) 2018-02-06
CN104365106B (zh) 2018-04-17
EP2859725A1 (en) 2015-04-15
PH12014502598B1 (en) 2015-01-26
JP2015523012A (ja) 2015-08-06
MX2014014919A (es) 2016-07-28
CN104365106A (zh) 2015-02-18
PH12014502598A1 (en) 2015-01-26
IL235632A (en) 2017-01-31
MY168265A (en) 2018-10-16
KR101676938B1 (ko) 2016-11-16
SG11201407369SA (en) 2015-02-27
BR112014030605A8 (pt) 2021-06-15
HK1203116A1 (en) 2015-10-16
AU2013272130A1 (en) 2014-12-11
BR112014030605B1 (pt) 2023-04-11
US20130329787A1 (en) 2013-12-12
KR20150024867A (ko) 2015-03-09
CA2873419A1 (en) 2013-12-12

Similar Documents

Publication Publication Date Title
JP6162228B2 (ja) ビデオコード化のための長期参照ピクチャについてのデータの信号伝達
JP6275780B2 (ja) 復号ピクチャバッファ管理
JP5972984B2 (ja) 参照ピクチャセットの効率的シグナリング
JP6117243B2 (ja) ビデオコーディング用のコーディングパラメータセットおよびnalユニットヘッダ
JP6169689B2 (ja) ビデオコーディングにおける長期参照ピクチャのランダムアクセスおよびシグナリング
JP6441354B2 (ja) マルチレイヤビデオコーディングのためのpoc値設計
JP6158422B2 (ja) アラインされていないirapピクチャを含み得るマルチレイヤビットストリームのクロスレイヤpocアラインメント
JP6239609B2 (ja) ビデオコーディングのための長期参照ピクチャをシグナリングすること
JP2017522799A (ja) ビットストリームパーティションのためのhrdパラメータを信号伝達すること
JP2016518759A (ja) ハイレベルシンタックスのみのスケーラブルビデオコーディングのための、レイヤ間参照ピクチャ制限
CN107079170B (zh) 用于多层视频译码的poc值设计
JP6526574B2 (ja) レイヤ間シンタックス予測制御
KR20160064124A (ko) Mv-hevc 에서의 인터-뷰 종속성 타입
JP6479798B2 (ja) マルチレイヤビデオコーディングのためのpoc値設計

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160419

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160419

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170424

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170516

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170614

R150 Certificate of patent or registration of utility model

Ref document number: 6162228

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250