JP2015517279A - リンク破損ピクチャを有するビデオシーケンス中の参照ピクチャのマーキング - Google Patents

リンク破損ピクチャを有するビデオシーケンス中の参照ピクチャのマーキング Download PDF

Info

Publication number
JP2015517279A
JP2015517279A JP2015507061A JP2015507061A JP2015517279A JP 2015517279 A JP2015517279 A JP 2015517279A JP 2015507061 A JP2015507061 A JP 2015507061A JP 2015507061 A JP2015507061 A JP 2015507061A JP 2015517279 A JP2015517279 A JP 2015517279A
Authority
JP
Japan
Prior art keywords
picture
bla
video
decoding
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015507061A
Other languages
English (en)
Other versions
JP6664959B2 (ja
JP2015517279A5 (ja
Inventor
ワン、イェ−クイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2015517279A publication Critical patent/JP2015517279A/ja
Publication of JP2015517279A5 publication Critical patent/JP2015517279A5/ja
Application granted granted Critical
Publication of JP6664959B2 publication Critical patent/JP6664959B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Abstract

ビデオデータを処理するためのシステム、方法、およびデバイスが開示される。いくつかの例は、現在のピクチャがリンク破損アクセス(BLA)ピクチャであると判定する。これらの例はまた、ピクチャ記憶バッファ中の参照ピクチャを、参照のために使用されないものとしてマーキングし得る。いくつかの例では、これは、BLAピクチャを復号する前になされ得る。

Description

[0001]本出願は、各々の内容全体が参照により本明細書に組み込まれる、
2012年5月4日に出願された米国仮特許出願第61/643,100号、
2012年4月20日に出願された米国仮特許出願第61/636,566号、および
2012年7月2日に出願された米国仮特許出願第61/667,371号
の利益を主張する。
[0002]本開示は一般にビデオデータを処理することに関し、より詳細には、ビデオシーケンスにおけるランダムアクセスポイント(RAP)ピクチャのコーディングに関する。
[0003]デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末(PDA)、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、セルラーまたは衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイス、トランスコーダ、ルータまたは他のネットワークデバイスなどを含む、広範囲にわたるデバイスに組み込まれ得る。デジタルビデオデバイスは、MPEG−2、MPEG−4、ITU−T H.263、ITU−T H.264/MPEG−4、Part 10、Advanced Video Coding(AVC)、現在開発中のHigh Efficiency Video Coding(HEVC)規格によって定義された規格、およびそのような規格の拡張に記載されているビデオ圧縮技法のような、ビデオ圧縮技法を実装する。ビデオデバイスは、そのようなビデオ圧縮技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、および/または記憶し得る。
[0004]ビデオ圧縮技法は、ビデオシーケンスに固有の冗長性を低減または除去するために空間的(イントラピクチャ)予測および/または時間的(インターピクチャ)予測を実行する。ブロックベースのビデオコーディングでは、ビデオスライス(すなわち、ビデオフレームまたはビデオフレームの一部)はビデオブロックに区分化されてもよく、これらのビデオブロックは、ツリーブロック、コーディングツリーユニット(CTU)、コーディングユニット(CU)および/またはコーディングノードと呼ばれる場合もある。ピクチャのイントラコーディングされた(I)スライス中のビデオブロックは、同じピクチャ中の近隣ブロック中の参照サンプルに対する空間的予測を使用して符号化される。ピクチャのインターコード化(PまたはB)スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間的予測、または他のピクチャ中の参照サンプルに対する時間的予測を使用し得る。ピクチャはフレームと呼ばれる場合があり、参照ピクチャは参照フレームと呼ばれる場合がある。ビデオシーケンスはビットストリームと呼ばれる場合もある。
[0005]空間的予測または時間的予測は、コーディングされるべきブロックのための予測ブロックを生じる。残差データは、コーディングされるべき元のブロックと予測ブロックとの間のピクセル差分を表す。インターコード化ブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトルと、コード化ブロックと予測ブロックとの間の差分を示す残差データとに従って符号化される。イントラコード化ブロックは、イントラコーディングモードと残差データとに従って符号化される。さらなる圧縮のために、残差データは、ピクセル領域から変換領域に変換されて残差変換係数をもたらすことができ、その残差変換係数は、次いで量子化され得る。最初に2次元アレイで構成されている量子化変換係数は、変換係数の1次元ベクトルを生成するために走査され得、なお一層の圧縮を達成するためにエントロピーコーディングが適用され得る。
[0006]本開示は、コード化ビデオシーケンスにおけるランダムアクセスポイント(RAP)ピクチャをコーディングするための技法に関する。いくつかの例では、復号されるべき現在のRAPピクチャが、リンク破損クリーンランダムアクセス(CRA)ピクチャまたはリンク破損アクセスピクチャ(BLAピクチャ)などのリンク破損RAPピクチャであるとき、シンタックス要素は、復号ピクチャバッファ中の復号順序においてBLAピクチャより前のピクチャはいずれも出力されるべきではないことを示す。シンタックス要素は、BLAピクチャのスライスヘッダ中の早い位置に、かつBLAピクチャ中の各スライスのいかなるエントロピーコード化スライスヘッダパラメータよりも前に与えられ得る。他の例では、復号されるべき現在のRAPピクチャがBLAピクチャであるとき、復号ピクチャバッファ中のすべての参照ピクチャは参照のために使用されないものとしてマーキングされる。
[0007]一例では、本開示は、ビデオデータを復号する方法であって、現在のピクチャがリンク破損アクセス(BLA)ピクチャであると判定することと、ピクチャ記憶バッファ中の参照ピクチャを、BLAピクチャを復号する前に参照のために使用されないものとしてマーキングすることとを含む方法について説明する。
[0008]別の例では、本開示は、ビデオデータを復号するためのデバイスであって、現在のピクチャがリンク破損アクセス(BLA)ピクチャであると判定することと、参照ピクチャを、BLAピクチャを復号する前に参照のために使用されないものとしてマーキングすることとを行うように構成されたプロセッサを含むデバイスについて説明する。
[0009]別の例では、本開示は、ビデオデータを復号するためのデバイスであって、現在のピクチャがリンク破損アクセス(BLA)ピクチャであると判定するための手段と、参照ピクチャを、BLAピクチャを復号する前に参照のために使用されないものとしてマーキングするための手段とを含むデバイスについて説明する。
[0010]別の例では、本開示は、コンピュータ可読記憶媒体について説明する。実行されると、現在のピクチャがリンク破損アクセス(BLA)ピクチャであると判定することと、参照ピクチャを、BLAピクチャを復号する前に参照のために使用されないものとしてマーキングすることとをデバイスの1つまたは複数のプロセッサに行わせる命令を記憶したコンピュータ可読記憶媒体。
[0011]1つまたは複数の例の詳細を添付の図面および以下の説明に記載する。他の特徴、目的、および利点は、その説明および図面、ならびに特許請求の範囲から明らかになろう。
[0014]本開示で説明される技法を利用し得る例示的なビデオ符号化および復号システムを示すブロック図。 [0015]本開示で説明される技法を実装し得る例示的なビデオエンコーダを示すブロック図。 [0016]本開示で説明される技法を実装し得る例示的なビデオデコーダを示すブロック図。 [0017]ビデオデータの通信のためのネットワークの一部を形成するデバイスの例示的なセットを示すブロック図。 [0018]本開示で説明される技法による、RAPピクチャを含む例示的なビデオシーケンスを示す図。 [0019]本開示で説明される1つまたは複数の例による、RAPピクチャをコーディングするための例示的な方法を示すフローチャート。 [0020]本開示で説明される1つまたは複数の例による、RAPピクチャをコーディングするための例示的な方法を示す流れ図。 [0021]本開示で説明される1つまたは複数の例による、RAPピクチャをコーディングするための例示的な方法を示す流れ図。 [0022]本開示で説明される1つまたは複数の例による、スライスを復号するための例示的な方法を示す流れ図。 [0023]本開示で説明される1つまたは複数の例による、スライスを符号化するための例示的な方法を示す流れ図。
[0022]本開示は、たとえば、時間層切替え点などの、ランダムアクセス点またはストリーム適応点として使用され得るピクチャに関係する、様々なビデオコーディング設計について説明する。たとえば、このタイプのピクチャは、ビットレート、フレームレートまたは空間解像度の適応のための切替え点とすることができ、このピクチャの各々は、本開示では一般にRAPピクチャと呼ばれる。場合によっては、ビデオエンコーダまたはビデオデコーダは、ビデオシーケンス中で、復号順序においてRAPピクチャの後に配置されるが、出力順序、すなわち、表示順序において、時間層切替え点などの、ランダムアクセス点またはストリーム適応点の前に配置される1つまたは複数のピクチャをコーディングすることができる。これらのピクチャは、先行ピクチャと呼ばれることがある。先行ピクチャは、復号順序においてRAPピクチャの後にくるが、出力順序においてRAPピクチャの前にくるピクチャである。より具体的には、これらのピクチャは、RAPピクチャの先行ピクチャと呼ばれることがある。
[0023]クリーンランダムアクセス(CRA)ピクチャは、RAPピクチャのタイプの1つである。復号が瞬時復号リフレッシュ(IDR)またはビデオシーケンス中で現在のCRAピクチャの前に配置されるCRAピクチャから始まる場合、現在のCRAピクチャの先行ピクチャは正確に復号され得る。しかしながら、現在のCRAピクチャからのランダムアクセスが行われるとき、CRAピクチャの先行ピクチャを正確に復号することができない。これは、先行ピクチャ、すなわち、復号順序において現在のCRAピクチャの後に配置されるが、出力順序において現在のCRAピクチャの前に配置されるピクチャが、利用できない前のピクチャ(たとえば、復号順序においてBLAピクチャより前のピクチャ)中の予測参照用のブロックを指すことがあるからである。
[0024]特に、ランダムアクセス復号が現在のCRAピクチャから始まるとき、復号順序において現在のCRAピクチャより前にあるピクチャは利用できない。したがって、先行ピクチャは、この場合、復号可能ではなく、ランダムアクセス復号がCRAピクチャで始まるとき、通常は破棄される。復号がどこから始まるかに応じて利用可能ではないことがあるピクチャからの誤り伝搬を防止するために、復号順序と出力順序の両方においてCRAピクチャの後にくるすべてのピクチャは、復号順序または出力順序のいずれかにおいて(先行ピクチャを含む)CRAピクチャの前にくるいかなるピクチャも参照ピクチャとして使用しない。
[0025]先行ピクチャが復号可能ではない場合、たとえば、復号が前のRAPピクチャから始まるとき、CRAピクチャはリンクが壊れているフラグを含み得る。このフラグは、たとえば、参照ピクチャが、復号されているビットストリームの変化により、先行ピクチャを復号する際に使用するのに有効ではないので、CRAピクチャの先行ピクチャが復号可能ではないことを示す。そのようなCRAピクチャは、リンク破損クリーンランダムアクセス(BLC)ピクチャまたはリンク破損アクセス(BLA)ピクチャと呼ばれることがある。
[0026]リンク破損は、一般に、復号順序におけるいくつかの後続のピクチャが、ビットストリームの生成時に実施される指定されていない動作により、かなりの視覚的アーティファクトを含むことがあることが示される、ビットストリーム中のロケーションを指すことがある。リンクが壊れているフラグを使用する代わりに、またはそれに加えて、BLC(または類似するBLA)ピクチャが、ビデオシーケンス中のリンク破損を示すために使用され得る。BLAまたはBLCピクチャは、たとえば、サーバ、メディアアウェアネットワーク要素(MANE)、またはビデオエディタ/スプライサなどの様々なデバイスのいずれかによるビットストリームスプライシングに使用され得る。HEVC WD9(下記参照)に記載されているように、ここでも、BLCピクチャは一般にBLAピクチャに類似すると見なされ得る。用語はわずかに異なるが、BLCまたはBLAピクチャは一般に、その先行ピクチャが復号可能ではないCRAピクチャまたは時間層アクセス(TLA)ピクチャを指すことができ、たとえば、復号が前のRAPピクチャから始まるとき、これらのピクチャは復号可能ではないことがある。
[0027]本開示の様々な例では、BLAまたはBLCピクチャの場合、復号順序においてBLAまたはBLCピクチャより前の、たとえば、スプライス点より前の参照ピクチャが利用可能ではないという理解のもとで、先行ピクチャは復号可能ではないと見なされる。本開示の一例によれば、現在のBLAまたはBLCピクチャを復号するために、復号ピクチャバッファ中の参照ピクチャは、デコーダによる参照のために使用されないものとしてマーキングされ得る。特に、復号されるべき現在のピクチャがBLAまたはBLCピクチャであるとき、復号ピクチャバッファ(DPB)中の参照ピクチャは、デコーダによる参照のために使用されないものとしてマーキングされ得る。別の例では、BLAまたはBLCピクチャの復号の場合、エンコーダまたは他のデバイスは、フラグ、たとえば、DPB中に記憶され得る、CRAピクチャまたはBLA(もしくはBLC)ピクチャより前の参照ピクチャのいずれも出力されるべきではないことを示すno_output_of_prior_pics_flagなどのシンタックス要素を生成することができ、デコーダはこれを受信することができる。いくつかの例では、このフラグまたは他のシンタックス要素は、エンコーダまたは他のデバイスによって、BLA(もしくはBLC)ピクチャまたはCRAピクチャのスライスヘッダ中で前に、たとえば、エントロピー復号される要素の前に配置することができ、その結果として、フラグをより容易に復号することができ、情報が復号プロセスにおいて早期に利用可能になり得るか、またはビデオデコーダ以外の他のエンティティにとって容易にアクセス可能になり得る。たとえば、メディアアウェアネットワーク要素(MANE)などの能力の劣るデバイスが、エントロピー復号を必要とすることなく情報にアクセスできるように、no_output_of_prior_pics_flagは、エントロピーコード化スライスヘッダパラメータの前にくるように、スライスヘッダ中の前の位置に配置され得る。
[0028]別の例では、コーダは、BLA(もしくはBLC)ピクチャまたはCRAピクチャがいつ先行ピクチャを有し、先行ピクチャを有さないかを示すように割り当てられたNALユニットタイプを処理することができる。BLAピクチャは実質的にBLCピクチャに類似していることに留意されたい。一般に、BLCピクチャからBLAピクチャへの変更は用語上の変更であるが、BLAピクチャの処理は本明細書で説明するNALユニットタイプの追加も含み得る。たとえば、NALユニットタイプは、NALユニットタイプ16、BLA_W_LP(先行ピクチャを有するBLA)と、NALユニットタイプ17、BLA_W_DLP(復号可能な先行ピクチャを有するが、復号可能でない先行ピクチャを有しないBLA)と、NALユニットタイプ18、BLA_N_LP(先行ピクチャを有しないBLA)とを含み得る。いくつかの例では、これらのNALユニットタイプは、BLAピクチャが復号可能な先行ピクチャと復号可能でない先行ピクチャの両方を含み得るか、復号可能な先行ピクチャのみを含み得るか、または先行ピクチャをまったく含み得ないかを示すために使用され得る。BLAピクチャが復号可能でない先行ピクチャを有しないとき、すべての関連する先行ピクチャは、存在する場合、復号可能である。
[0029]ITU−T Video Coding Experts Group(VCEG)とISO/IEC Motion Picture Experts Group(MPEG)とのJoint Collaboration Team on Video Coding(JCT−VC)によって開発中である高効率ビデオコーディング(HEVC)は、様々なワーキングドラフトに記載されている。「HEVC Working Draft 6」または「WD6」と呼ばれるHEVC規格の最近のドラフトは、文書JCTVC−H1003、Brossら、「High efficiency video coding(HEVC)text specification draft 6」、ITU−T SG16 WP3とISO/IEC JTC1/SC29/WG11とのJoint Collaborative Team on Video Coding(JCT−VC)、第8回会合:サンノゼ、カリフォルニア州、米国、2012年2月1日〜10日に記載されており、2012年5月4日現在、http://phenix.int−evry.fr/jct/doc_end_user/documents/8_San%20Jose/wg11/JCTVC−H1003−v22.zipからダウンロード可能であり、その内容全体は参照により本明細書に組み込まれる。以下でHEVC WD9と呼ばれるHEVCのより最近のワーキングドラフト(WD)は、文書JCTVC−K1003v13、Brossら、「High efficiency video coding(HEVC)text specification draft 9」、ITU−T SG16 WP3とISO/IEC JTC1/SC29/WG11とのJoint Collaborative Team on Video Coding(JCT−VC)、第11回会合:上海、中国、2012年10月10日〜19日に記載されており、2012年12月27日現在、http://phenix.int−evry.fr/jct/doc_end_user/documents/11_Shanghai/wg11/JCTVC−K1003−v13.zipからダウンロード可能であり、その内容全体は参照により本明細書に組み込まれる。WD9では、リンクが壊れているCRAピクチャを指すために使用されるBLCピクチャという用語は、BLAピクチャという用語に変更されている。したがって、BLCおよびBLAという用語は、一般に、本開示ではリンクが壊れているCRAピクチャを指すために互換的に使用され得る。
[0030]他の例示的なビデオコーディング規格は、ITU−T H.261、ISO/IEC MPEG−1 Visual、ITU−T H.262またはISO/IEC MPEG−2 Visual、ITU−T H.263、ISO/IEC MPEG−4 Visual、ならびに、そのスケーラブルビデオコーディング(SVC)拡張およびマルチビュービデオコーディング(MVC)拡張を含む(ISO/IEC MPEG−4 AVCとしても知られている)ITU−T H.264を含む。
[0031]次に、RAPピクチャの様々な態様について説明する。ランダムアクセスは、一般に、ビットストリーム中の最初のコード化ピクチャではないコード化ピクチャから始まる、ビデオビットストリームの復号を指す。ビットストリームへのランダムアクセスは、たとえば、ユーザが異なるチャネル間を切り替える、ビデオの特定の部分にジャンプする、ビットストリームスプライシングをサポートする、または(ビットレート、フレームレート、空間解像度などの)ストリーム適応のために異なるビットストリームに切り替えるために、ブロードキャストおよびストリーミングなどの多くのビデオアプリケーションにおいて必要とされ得る。ビデオアプリケーションは、規則的な間隔で何回でも、および/または選択されたロケーションで、RAPピクチャをビデオストリームに挿入して、この機能を可能にすることができる。
[0032]エンコーダおよびデコーダは、瞬時デコーダリフレッシュ(IDR)ピクチャをランダムアクセスに使用することができる。しかしながら、IDRピクチャはコード化ビデオシーケンスを開始し、常に復号ピクチャバッファ(DPB)をクリーンにするので、復号順序においてIDRの後にくるピクチャは、IDRピクチャより前に復号されたピクチャを参照ピクチャとして使用することができない。したがって、ランダムアクセスについてIDRピクチャに依存するビットストリームは、非常に低いコーディング効率を有する可能性がある。コーディング効率を改善するために、復号順序においてCRAピクチャの後にくるが、出力順序においてCRAピクチャの前にくるピクチャがCRAピクチャの前に復号されたピクチャを参照として使用することができるように、クリーンランダムアクセス(CRA)ピクチャの概念が開発中のHEVC規格に導入されている。したがって、CRAピクチャは、ビデオシーケンス中で最初に復号されたピクチャとしてランダムアクセスに使用され得るか、または前のRAP(たとえば、IDRまたはCRA)ピクチャが復号されたビデオシーケンスの一部として復号され得る。
[0033]復号順序においてCRAピクチャの後にくるが、出力順序においてCRAピクチャの前にくるピクチャは、CRAピクチャの先行ピクチャと呼ばれる。復号が現在のCRAピクチャの前のRAPピクチャから始まる場合、CRAピクチャの先行ピクチャは正確に復号され得る。しかしながら、CRAピクチャからのランダムアクセスが行われるとき、CRAピクチャの先行ピクチャを正確に復号することができない。したがって、上記で説明したように、HEVCプロセスでは、これらの先行ピクチャは通常、CRAピクチャのランダムアクセス復号の間、破棄される。復号がどこから始まるかに応じて利用可能ではない場合がある参照ピクチャからの誤り伝搬を防止するために、復号順序と出力順序の両方においてCRAピクチャの後にくるすべてのピクチャは、復号順序または出力順序のいずれかにおいて(先行ピクチャを含む)CRAピクチャの前にくるいかなるピクチャも参照ピクチャとして使用すべきでない。
[0034]ランダムアクセス機能が、回復点SEIメッセージによって、H.264/AVCにおいてサポートされている。H.264/AVCデコーダ実施態様は、この機能をサポートしている場合もあるし、またはしていない場合もある。HEVCにおいて、CRAピクチャで始まるビットストリームが適合するビットストリームとして考慮される。ビットストリームがCRAピクチャで始まるとき、CRAピクチャの先行ピクチャは、利用不可能な参照ピクチャを参照する場合があり、したがって、正確に復号されないことがある。しかしながら、HEVC規格は、開始CRAピクチャの先行ピクチャは出力されず、したがってその名称がCRAピクチャの「クリーンランダムアクセス」であると規定している。ビットストリーム適合の要件を確立するために、HEVCは、非出力先行ピクチャ、すなわち、出力されない先行ピクチャの復号用の利用できない参照ピクチャを生成するための復号プロセスを規定している。しかしながら、デコーダ実装形態が、復号プロセスがコード化ビデオシーケンスの先頭から実施されるときと比較して同一の出力を生成することができる限り、デコーダ実装形態を適合させるのに、その復号プロセスに従う必要はない。
[0035]HEVCでは、適合するビットストリームはIDRピクチャをまったく含まなくてもよく、したがって、コード化ビデオシーケンスのサブセットまたは不完全なコード化ビデオシーケンスを含んでもよい。HEVC WD6では、コード化ビデオシーケンスは次のように定義される。
コード化ビデオシーケンスは、復号順序において、最大ですべての後続のアクセスユニットを含むが、いかなる後続のIDRアクセスユニットも含まない0個以上の非IDRアクセスユニットが後に続くIDRアクセスユニットを含む、一連のアクセスユニットである。
[0036]「リンクが壊れているCRAピクチャ」の概念は、文書JCTVC−I0404、Sullivanら、「CRA pictures with broken links」、ITU−T SG16 WP3とISO/IEC JTC1/SC29/WG11とのJoint Collaborative Team on Video Coding(JCT−VC)、第9回会合:ジュネーブ、スイス、2012年4月27日〜5月7日に記載されており、2012年12月27日現在、http://phenix.int−evry.fr/jct/doc_end_user/documents/9_Geneva/wg11/JCTVC−I0404−v1.zipからダウンロード可能であり、その内容全体は参照により本明細書に組み込まれる。HEVC WD6に含まれるCRAの概念と比較して、一例では、ビットストリームを開始するCRAピクチャが有することができるのと同様に、ビットストリームの先頭にないCRAピクチャが復号可能でない先行ピクチャを有することを追加として可能にすることがJCTVC−I0404で提案されている。HEVC WD6では、ビットストリームを開始するCRAピクチャは、復号順序においてBLAピクチャより前に参照ピクチャがないために復号することができない先行ピクチャを(復号順序とも呼ばれるビットストリーム順序において)後に続けることができる。しかしながら、ビットストリームの中央にあるCRAピクチャは、そのような復号可能でない先行ピクチャを有することができない。一例では、そのような復号可能でない先行ピクチャの潜在的な存在を示す「リンクが壊れている」フラグを追加することによってこの制約を取り除くことがJCTVC−I0404で提案されている。
[0037]「リンクが壊れている」フラグは、スライスヘッダ中のCRAピクチャのピクチャレベル情報またはピクチャレベル情報の何らかの他の場所としてJCTVC−I0404で提案されている。適応パラメータセット(APS)を含む一例では、「リンクが壊れている」フラグはAPSの一部であり得る。ただし、いくつかの規格はAPSを提供していない。フラグが1に等しいとき、ビットストリームがビットストリーム順序において前にあるIDRピクチャまたはCRAピクチャから始まっても、ビットストリームは、先行する参照ピクチャがないために復号可能でないCRAピクチャの先行ピクチャを含むことが可能になる。
[0038]1に等しい「リンクが壊れている」フラグを有するCRAピクチャの場合、本明細書で論じるように復号可能でない先行ピクチャを有することが可能になることに加えて、そのピクチャ順序カウント(POC)最上位ビット(MSB)が0に設定される。加えて、1に等しいリンクが壊れているフラグを有するCRAピクチャは、IDRピクチャの場合と同様の方法でCRAピクチャを動作させるno_output_of_prior_pics_flagと、HEVC WD6におけるIDRピクチャのidr_pic_idの場合と同様の方法でCRAピクチャを動作させるrandom_access_pic_idとを含むことができる。加えて、HEVC WD6の場合の現在のidr_pic_idはrandom_access_pic_idに改称され、その制約は単にIDRピクチャのみにだけではなく、CRAピクチャとIDRピクチャの両方に適用されることになる。IDRピクチャと同様に、1に等しいbroken_link_flagを有するCRAピクチャは、異なるシーケンスパラメータセット(SPS)をアクティブにする、ピクチャサイズを変更する、といったことが可能になる。
[0039]いくつかの例では、スライスヘッダまたはAPS中での「リンクが壊れている」フラグのシグナリングには、通常のCRAピクチャを、本開示でBLAピクチャとも呼ばれる、いわゆるリンク破損クリーンランダムアクセス(BLC)ピクチャに変更するエンティティ(たとえば、サーバ、メディアアウェアネットワーク要素(MANE)、またはビデオエディタ/スプライサ)が必要となる。このエンティティは通常、スライスヘッダおよび/またはAPSをエントロピー符号化し、パースして、リンクが壊れているフラグを符号化することが可能である必要がある。同様に、BLAまたはBLCピクチャを識別するエンティティ(たとえば、サーバ、MANE、またはビデオエディタ)は、必要に応じて、スライスヘッダおよび/またはAPSをエントロピー復号し、パースして、フラグを見つけることが可能である必要がある。
[0040]いくつかの例では、リンクが壊れているCRA(BLA)ピクチャは、パラメータセットIDがアクティブなシーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)またはAPSと同じである場合、(ピクチャによって参照されたときに)SPS、PPSまたはAPSをアクティブにすることができないことがある。しかしながら、BLAピクチャは通常、たとえば、ビットストリームスプライシングの場合、復号順序において前にあるピクチャとは異なるビットストリームから生じるので、BLAまたはBLCピクチャと前にあるピクチャは、異なるSPS生ビットシーケンスペイロード(RBSP:raw bit sequence payload)と、PPS RBSPと、APS RBSPとを使用することができる。したがって、いくつかの例では、BLAまたはBLCピクチャと復号順序において前にあるピクチャの両方が(直接的にまたは間接的に)SPS IDまたはPPS IDの同じ値を参照し得る可能性が高い。加えて、いくつかの例では、ピクチャがAPS IDの同じ値を参照することも可能である。したがって、復号において前にあるピクチャにアクティブなSPS、PPS、またはAPSを使用すると、BLAまたはBLCピクチャと(先行ピクチャだけではない)後に続くピクチャの復号が不正確になる可能性が非常に高い。
[0041]通常のCRAピクチャ中にrandom_access_pic_idシンタックス要素とno_output_of_prior_pics_flagシンタックス要素とを含まない例では、通常のCRAピクチャをBLAまたはBLCピクチャになるように変更するエンティティ(たとえば、サーバ、メディアアウェアネットワーク要素(MANE)、またはビデオエディタ/スプライサ)は、必要に応じて、スライスヘッダおよび/またはAPSをエントロピー符号化またはエントロピー復号し、パースして、これらのシンタックス要素を符号化することが可能である必要がある。
[0042]BLAまたはBLCピクチャは通常、復号順序において前にあるピクチャとは異なるビットストリームから生じるので、no_output_of_prior_pics_flagが0に等しい場合、復号ピクチャバッファはオーバーフローし得る。結果として、復号順序における後に続くすべてのピクチャは不正確に復号される可能性があるか、またはデコーダがクラッシュする可能性さえある。
[0043]第1のビットストリームの一部および第2のビットストリームの一部(第2のビットストリームの一部はCRAピクチャ(picA)から始まる)が接合(splice)または連結(concatenate)されるとき、CRAピクチャをBLAまたはBLCピクチャに変更しない可能性があり得る。むしろ、復号が前にあるCRAピクチャまたはIDRピクチャまたはBLAもしくはBLCピクチャから始まる場合、picAをCRAピクチャとして維持することが可能であり、CRAピクチャpicAの先行ピクチャの復号品質は、(たとえば、先行ピクチャのうちの1つまたは複数のチェックサムが、HVEC WD6の場合の復号ピクチャハッシュ補足エンハンスメント情報(SEI:supplemental enhancement information)メッセージにおいてシグナリングされたチェックサムと一致しないとき)完璧ではないが許容可能である。しかしながら、この手法には、ビットストリーム中で上記の情報を示すための機構が欠けている。
[0044]上記の問題のいくつかに対処するために、一例では、CRAピクチャがリンク破損を有することを示す、すなわち、リンクが壊れているCRA(BLA)ピクチャを示すためのフラグを使用する代わりに、別個のNALユニットタイプ(たとえば、HVEC WD6で予約済みの、2に等しいNALユニットタイプ)が使用され得る。そのような例では、NALユニットによって提供される情報は、エントロピー符号化またはエントロピー復号することなしに利用可能であり得る。この手法は、必要に応じて、エンティティ(たとえば、サーバ、メディアアウェアネットワーク要素(MANE)、またはビデオエディタ/スプライサ)が、ビットストリームを開始しない場合にすべての関連する先行ピクチャが復号可能でなければならない(すなわち、正確に復号され得る)通常のCRAピクチャを、BLAまたはBLCピクチャに変更することを可能にし得る。これは、必要に応じて、エンティティ(たとえば、サーバ、MANE、またはビデオエディタ)がBLAまたはBLCピクチャを識別することも可能にし得る。
[0045]いくつかの例では、BLCピクチャが異なるSPSをアクティブにするのを可能にする代わりに、BLCピクチャによって参照されるSPS IDが復号順序において前にあるピクチャに対するアクティブSPSのSPS IDと同じであっても、BLCピクチャはSPSをアクティブにする必要がある。これは、HVEC WD6の場合のPPSを介して間接的に、または他の方法によって、たとえば、JCTVC−I0338に記載のグループパラメータセットを介して間接的に、または、たとえば、SPS IDが直接スライスヘッダに含まれるときは直接、またはバッファリング期間SEIメッセージを介して間接的に行われ得る。BLCピクチャは通常、復号順序において前にあるピクチャとは異なるビットストリームに由来したものであるので、BLCピクチャはSPSをアクティブにする必要があり得る。加えて、通常、異なるSPS RBSPは同一のまたは異なるSPS IDを用いて適用される。
[0046]BLCピクチャはまた、PPSをアクティブにするために使用され得る。BLCピクチャによって(JCTVC−I0338において記載されているようなグループパラメータセットを通じて間接的に、または、たとえば、PPS IDがHEVC WD6におけるようにスライスヘッダ内に直接含まれているときは直接的に)参照されるPPS IDが、復号順序において前にあるピクチャのアクティブPPSのPPS IDと同じであったとしても、そうである可能性がある。これは、ここでも、BLCピクチャが一般的に、復号順序において前にあるピクチャとは異なるビットストリームからのものであり、一般的に、同一のまたは異なるPPS IDに異なるPPS RBSPが適用されるためである。
[0047]いくつかの例では、BLAまたはBLCピクチャはまた、APSを参照する場合、BLAまたはBLCピクチャによって参照されるAPS IDが復号順序において前にあるピクチャに対するアクティブPPSのAPS IDと同じであっても、APSをアクティブにする必要がある。これは、やはり、BLAまたはBLCピクチャが通常、復号順序において前にあるピクチャとは異なるビットストリームに由来したものであるからである。加えて、通常、異なるAPS RBSPは同一のまたは異なるAPS IDを用いて適用される。
[0048]BLAまたはBLCピクチャは特殊なタイプのCRAピクチャと見なされ得、NALユニットタイプがBLCピクチャ用のNALユニットタイプ(たとえば、HVEC WD6で予約済みの、2に等しいNALユニットタイプ)であるコード化ピクチャとして定義され得る。この定義は、用語は異なるが同様の効果を有する、HVEC WD9に記載のBLAピクチャに適用することができる。非BLA CRAピクチャがビットストリームと関連する先行ピクチャとを開始するときの非BLA CRAピクチャ用の同じ復号プロセスは、BLAまたはBLCピクチャがビットストリーム中で最初のピクチャではない場合でも、BLAまたはBLCピクチャと関連する先行ピクチャとを復号するために適用され得る。代替として、BLAまたはBLCピクチャはCRAピクチャから除外され得る、すなわち、BLAまたはBLCピクチャはCRAピクチャではないと見なされ得る。その場合、CRAピクチャがビットストリームと関連する先行ピクチャとを開始するときのCRAピクチャ用の同じ復号プロセスは、BLAまたはBLCピクチャがビットストリーム中で最初のピクチャではない場合でも、BLAまたはBLCピクチャと関連する先行ピクチャとを復号するために適用される。以下の説明では、この代替策が適用されると仮定される。
[0049]いくつかの例では、BLAまたはBLCアクセスユニットは、コード化ピクチャがBLAまたはBLCピクチャであるアクセスユニットとして定義され得る。コード化ビデオシーケンスの定義は次のように変更され得る:復号順序において、最大ですべての後続のアクセスユニットを含むが、いかなる後続のIDRまたはBLAアクセスユニットも含まない0個以上の非IDRおよび非BLAアクセスユニットが後に続くIDRアクセスユニットまたはBLAもしくはBLCアクセスユニットを含む、一連のアクセスユニット。
[0050]JCTVC−I0404の場合のようにすべてのIDRピクチャおよびBLAピクチャのみに対してrandom_access_pic_idとno_output_of_prior_pics_flagとを有する代わりに、別の手法では、すべてのIDRピクチャ、BLA、およびすべてのCRAピクチャに対して常に2つのフィールドが存在する。各CRAピクチャについて、no_output_of_prior_pics_flagが0に等しい必要がある。いくつかの例では、必要に応じて、エンティティ(たとえば、サーバ、メディアアウェアネットワーク要素(MANE)、またはビデオエディタ/スプライサ)がCRAピクチャをBLAピクチャとなるように変更することはより容易であり得る。
[0051]別の代替例では、BLAピクチャについて、no_output_of_prior_pics_flagが1に等しいことが必要であり得る。代替として、各BLAピクチャはシグナリングされたno_output_of_prior_pics_flagを有しないが、ピクチャ出力挙動は、各BLAピクチャが1に等しいno_output_of_prior_pics_flagを有する場合と同じである。さらなる代替として、各BLAピクチャはシグナリングされたno_output_of_prior_pics_flagを有するが、ピクチャ出力挙動は、シグナリングされたno_output_of_prior_pics_flagの値にかかわらず、各BLAピクチャが1に等しいno_output_of_prior_pics_flagを有する場合と同じである。
[0052]BLAピクチャのピクチャ順序カウント(POC)最上位ビット(MSB)値は、たとえば、スライスヘッダ中でシグナリングされ得る。シグナリングされる場合、値にかかわらず、この値は依然として、復号プロセスにおいて0に等しいと見なされる。代替として、シグナリングされたPOC MSB値は復号プロセスで使用されるが、次いで、スプライサは値を確認し、場合によっては、復号順序における前のピクチャのPOC値に一致するように値を変更する必要がある。
[0053]第1のビットストリームの一部および第2のビットストリームの一部(第2のビットストリームの一部はCRAピクチャpicAから始まる)が接合(splice)または連結(concatenate)されるとき、スプライサは第1のビットストリームからのピクチャをCRAピクチャとして維持することができる。一例では、復号が前にあるCRAピクチャ、IDRピクチャ、またはBLAピクチャから始まるとき、CRAピクチャの先行ピクチャの復号品質は、完璧ではないが許容可能であり得る。たとえば、先行ピクチャのうちの1つまたは複数のチェックサムがHVEC WD6の場合の復号ピクチャハッシュSEIメッセージにおいてシグナリングされたチェックサムと一致しないとき、復号品質は許容可能であり得る。
[0054]上記の情報の指示は、ビットストリーム中でシグナリングされ得る。この情報は、第1のビットストリームからのCRAピクチャに関連付けられる指示を介して、たとえば、NALユニットヘッダもしくはスライスヘッダもしくは参照されるAPS中のフラグ、または第1のビットストリームからのCRAピクチャに関連付けられるSEIメッセージとしてシグナリングされ得る。フラグにはexact_match_flagという名前を付けることができる。一例では、値1は、第1のビットストリームからのCRAピクチャに関連付けられる各先行ピクチャのチェックサムが、存在する場合、復号ピクチャハッシュSEIメッセージにおいてシグナリングされたチェックサムと一致することを示す。値0は、第1のビットストリームからのCRAピクチャに関連付けられる各先行ピクチャのチェックサムが、存在する場合、復号ピクチャハッシュSEIメッセージにおいてシグナリングされたチェックサムと一致することもあり、一致しないこともあることを示す。
[0055]先行ピクチャと、CRAピクチャの先行ピクチャの存在とのシグナリングに関する説明は、http://phenix.int−evry.fr/jct/doc_end_user/documents/9_Geneva/wg11/JCTVC−I0275−v2.zipで入手可能なJCTVC−I0275と、先行ピクチャと、CRAピクチャの先行ピクチャの存在とのシグナリングに関する説明についてのhttp://phenix.int−evry.fr/jct/doc_end_user/documents/9_Geneva/wg11/JCTVC−I0277−v3.zipで入手可能な文書JCTVC−I0277とにおいて与えられており、各々の内容全体は参照により本明細書に組み込まれる。いくつかの例では、CRAピクチャの先行ピクチャの存在のシグナリングについての同様の概念は、BLAまたはBLCピクチャに適用され得る。
[0056]BLAまたはBLCピクチャなどのリンク破損RAPピクチャの使用は、いくつかの問題を提示することがある。BLAまたはBLCピクチャなどのリンク破損RAPピクチャと、他の既存のビデオランダムアクセス手法とに関連付けられるそのような問題に対処するために、様々な改善が行われ得る。
[0057]1つの問題は、先行ピクチャは時間層アクセス(TLA)ピクチャでもあり得るので、CRAピクチャに関連付けられる先行ピクチャに対して1つのみのNALユニットタイプを定義することは十分ではない可能性があるということである。したがって、本明細書で説明するシステムと方法とを実装するエンコーダおよびデコーダは、TLAピクチャでもある先行ピクチャに属するNALユニットと、TLAピクチャではない先行ピクチャに属するNALユニットとを識別するために、より多くのNALユニットタイプを必要とし得る。
[0058]別の問題として、BLAまたはBLCピクチャがビデオシーケンス中のピクチャの空間解像度を変更する場合、ビットストリームを開始するCRAピクチャの先行ピクチャに対する、HEVC WD6において規定された現在の復号プロセスを、BLAまたはBLCピクチャの先行ピクチャに直接適用することができない。場合によっては、空間解像度が現在のピクチャと現在のピクチャの参照ピクチャとでは異なるように見えることがある。別の問題として、HEVC WD6において規定された復号プロセスにおいて、シンタックス要素slice_typeがIDRピクチャ、CRAピクチャ、およびBLAまたはBLCピクチャのスライスのスライスヘッダ中に不必要に存在することがある。
[0059]本開示は、一般にはRAPピクチャのための、詳細にはビデオシーケンスにおけるリンク破損RAPピクチャ(たとえば、BLAピクチャ)をコーディングするための様々な技法について説明する。本技法のいくつかは上記で説明した問題のうちの1つまたは複数に対処することができ、本技法のいくつかはランダムアクセスピクチャのコーディングに有用であり得る追加の機能を提供することができる。
[0060]いくつかの例では、復号されるべき現在のRAPピクチャが、リンク破損クリーンランダムアクセス(CRA)ピクチャ(BLAピクチャ)などのリンク破損RAPピクチャであるとき、シンタックス要素は、復号ピクチャバッファ中の復号順序においてBLAピクチャより前の参照ピクチャはいずれも出力されるべきではないことを示す。このシンタックス要素はエンコーダによって符号化され、デコーダによって復号され得る。また、シンタックス要素は、現在のリンク破損RAPピクチャのスライスヘッダ中の早い位置に、かつ現在のリンク破損RAPピクチャ中の各スライスのいかなるエントロピーコード化スライスヘッダパラメータよりも前に与えられ得る。エントロピーコード化シンタックス要素より前の、たとえば、いかなるue(v)要素よりも前のシンタックス要素を与えることは、いくつかの例では、能力の劣るデバイスが、エントロピーコーディングを必要とすることなくシンタックス要素を解釈することを可能にし得る。他の例では、復号されるべき現在のRAPピクチャがリンク破損RAPピクチャであるとき、復号ピクチャバッファ中のすべての参照ピクチャは参照のために使用されないものとしてマーキングされる。この機能は、BLAまたはBLCピクチャが空間解像度を変更する場合でも、標準的な復号プロセスがBLAまたはBLCピクチャの先行ピクチャに適用されることを可能にし得る。これらおよび他の例示的な技法について本開示で説明する。
[0061]図1は、本開示で説明される技法を利用し得る例示的なビデオ符号化および復号システム10を示すブロック図である。図1に示されているように、システム10は、宛先デバイス14が後に復号し得る符号化ビデオデータを生成するソースデバイス12を含む。ソースデバイス12および宛先デバイス14は、デスクトップコンピュータ、ノートブック(すなわち、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスのいずれかを備え得る。場合によっては、ソースデバイス12および宛先デバイス14は、ワイヤレス通信に対応し得る。
[0062]場合によっては、ビデオエンコーダ20は、時間層切替え点(temporal layer switching point)のような、ランダムアクセス点またはストリーム適応点の後にくる1つまたは複数のピクチャを符号化し得る。たとえば、これは、ビットレート、フレームレートまたは空間分解能の適応のための切替え点であり得る。これらのピクチャのうちの1つまたは複数は、ビデオシーケンス内のCRAピクチャの先行ピクチャであり得る。デコーダは、ビデオシーケンスの復号が、ビデオシーケンス内で現在のCRAピクチャの前のRAPピクチャから始まる場合には、CRAピクチャの先行ピクチャを正確に復号し得る。しかしながら、CRAピクチャからのランダムアクセスが行われるとき、CRAピクチャの先行ピクチャは正確に復号され得ない。たとえば、先行ピクチャは、利用不可能である予測参照に関するブロックを指し得る。したがって、先行ピクチャは、ビデオデコーダ30において復号可能でない場合がある。したがって、宛先デバイス14は、一般的に、ランダムアクセス復号中はこれらの先行ピクチャを破棄し得る。
[0063]別の例では、BLAまたはBLCピクチャについて、エンコーダ20は、フラグ、たとえば、no_output_of_prior_pics_flag(より正確にシンタックス要素と呼ばれる場合がある)を符号化し得、それによって、DPBにおいて前にあるピクチャのいずれも出力されない。一部の例では、このフラグ、またはシンタックス要素は、エントロピー復号の前はスライスヘッダ内の初めにあってもよく、それによって、より容易に復号され得、この情報はコーディングプロセスのより早期に利用可能である。たとえば、それによって、たとえばno_output_of_prior_pics_flagがエントロピー復号される必要がないために、MANEのような、それほど洗練されていないデバイスがデコーダを必要とすることなく情報にアクセスすることができる。例示として、no_output_of_prior_picsフラグは、たとえば、可変長ue(v)要素のようなエントロピーコード化シンタックス要素の代わりに、たとえば、固定長u(1)要素のような非エントロピーコード化シンタックス要素として提示され得る。no_output_of_prior_picsフラグは、たとえば、first_slice_segment_in_picフラグの直後で、任意のエントロピーコード化シンタックス要素の前に提示され得る。
[0064]一例では、ビデオデコーダ30は、参照ピクチャバッファ内に記憶されているピクチャを、たとえば、これらのピクチャを使用する結果として不正確に復号されたピクチャがもたらされ得るときに、参照のために使用されないものとしてマーキングし得る。たとえば、復号順序または出力順序においてBLAまたはBLCピクチャの前にくる参照ピクチャは、復号順序においてBLAまたはBLCピクチャの後にくる先行ピクチャに対する参照のためには使用不可能であり得る。したがって、ビデオデコーダ30によって、復号順序または出力順序においてBLAまたはBLCピクチャの前にくる参照ピクチャは、復号順序においてBLAまたはBLCピクチャの後にくる先行ピクチャに対する参照のためには使用不可能であり得るを受信することに応答して、参照のためには使用されないものとしてマーキングされ得る。
[0065]一例では、ビデオエンコーダ20は、BLAまたはBLCピクチャが先行ピクチャを有するときおよび先行ピクチャを有しないときを示すために割り当てられたNALユニットタイプを含むように構成され得る。たとえば、1つの規格では、NALユニットタイプ16、BLA_W_LP(先行ピクチャを有するBLA)、NALユニットタイプ17、BLA_W_DLP(復号可能な先行ピクチャを有するBLA)、およびNALユニットタイプ18、BLA_N_LP(先行ピクチャを有しないBLA)が含まれる。
[0066]一例では、ビデオエンコーダ20は、BLAピクチャが先行ピクチャを有するときおよび先行ピクチャを有しないときを示すために割り当てられたNALユニットタイプを処理することができる。たとえば、ビデオエンコーダ20は、複数の異なるネットワーク抽象化層(NAL)ユニットタイプのうちの1つに従って、ピクチャを符号化することができる。複数のNALユニットタイプは、(1)リンクアクセスが壊れている(BLA)ピクチャのコード化スライスであって、BLAピクチャは、ビットストリーム内の関連付けられる先行ピクチャを有するBLAピクチャである、コード化スライス、(2)BLAピクチャのコード化スライスであって、BLAピクチャは、ビットストリーム内の関連付けられる復号可能な先行ピクチャを有するBLAピクチャである、コード化スライス、(3)BLAピクチャのコード化スライスであって、BLAピクチャは、ビットストリーム内の関連付けられる先行ピクチャを有しないBLAピクチャである、コード化スライスのうちの1つまたは複数を含む。
[0067]宛先デバイス14は、符号化ビデオデータを受信し得る。宛先デバイスは、リンク16を介して受信されたデータを復号することができる。リンク16は、ソースデバイス12から宛先デバイス14に符号化されたビデオデータを動かすことが可能な任意のタイプの媒体またはデバイスを備え得る。一例では、リンク16は、ソースデバイス12が、符号化ビデオデータをリアルタイムで宛先デバイス14に直接送信することを可能にするための通信媒体を備え得る。符号化ビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先デバイス14に送信され得る。通信媒体は、高周波(RF)スペクトルまたは1つもしくは複数の物理伝送線路のような、任意のワイヤレスまたは有線通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークのような、パケットベースネットワークの一部を形成し得る。通信媒体は、ソースデバイス12から宛先デバイス14への通信を支援するために有用であり得るルータ、スイッチ、基地局、または任意の他の機器を含み得る。
[0068]代替的に、符号化データは、出力インターフェース22からストレージデバイス34に出力されてもよい。同様に、符号化データは、入力インターフェースによってストレージデバイス34からアクセスされてもよい。ストレージデバイス34は、ハードドライブ、ブルーレイ(登録商標)ディスク、DVD、CD−ROM、フラッシュメモリ、揮発性または不揮発性メモリ、あるいは符号化ビデオデータを記憶するための任意の他の好適なデジタル記憶媒体のような、様々な分散したまたはローカルにアクセスされるデータ記憶媒体のいずれかを含み得る。さらなる一例では、ストレージデバイス34は、ソースデバイス12によって生成された符号化ビデオを保持し得るファイルサーバまたは別の中間ストレージデバイスに対応し得る。宛先デバイス14は、ストリーミングまたはダウンロードを介して、ストレージデバイス34から、記憶されたビデオデータにアクセスし得る。ファイルサーバは、符号化ビデオデータを記憶し、その符号化ビデオデータを宛先デバイス14に送信することが可能な任意のタイプのサーバであり得る。例示的なファイルサーバは、(たとえば、ウェブサイトのための)ウェブサーバ、FTPサーバ、ネットワーク接続ストレージ(NAS)デバイス、またはローカルディスクドライブを含む。宛先デバイス14は、インターネット接続を含む、任意の標準のデータ接続を介して符号化ビデオデータにアクセスし得る。これは、ファイルサーバに記憶された符号化ビデオデータにアクセスするのに好適であるワイヤレスチャネル(たとえば、Wi−Fi(登録商標)接続)、有線接続(たとえば、DSL、ケーブルモデムなど)、または両方の組合せを含み得る。ストレージデバイス34からの符号化ビデオデータの送信は、ストリーミング送信、ダウンロード送信、または両方の組合せであり得る。
[0069]本開示の技法は、必ずしもワイヤレス適用例または設定に限定されるとは限らない。本技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、たとえばインターネットを介したストリーミングビデオ送信、データ記憶媒体に記憶するためのデジタルビデオの符号化、データ記憶媒体に記憶されたデジタルビデオの復号、または他の適用例のような、様々なマルチメディア適用例のいずれかをサポートするビデオコーディングに適用され得る。一部の例では、システム10は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、および/またはビデオテレフォニーなどの適用例をサポートするために、一方向または双方向のビデオ送信をサポートするように構成され得る。
[0070]図1の例では、ソースデバイス12は、ビデオソース18、ビデオエンコーダ20、および出力インターフェース22を含む。場合によっては、出力インターフェース22は、変調器/復調器(モデム)および/または送信機を含み得る。ソースデバイス12において、ビデオソース18は、たとえばビデオカメラのようなビデオキャプチャデバイス、以前にキャプチャされたビデオを含んでいるビデオアーカイブ、ビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェース、および/もしくはソースビデオとしてコンピュータグラフィックスデータを生成するためのコンピュータグラフィックスシステムのようなソース、またはそのようなソースの組合せを含み得る。一例として、ビデオソース18がビデオカメラである場合、ソースデバイス12および宛先デバイス14は、いわゆるカメラ付き携帯電話またはビデオ電話を形成し得る。ただし、本開示で説明する技法は、概してビデオコーディングに適用可能であり得、ワイヤレスおよび/またはワイヤード適用例に適用され得る。
[0071]キャプチャされたビデオ、以前にキャプチャされたビデオ、またはコンピュータ生成されたビデオは、ビデオエンコーダ20によって符号化され得る。符号化ビデオデータは、ソースデバイス12の出力インターフェース22を介して宛先デバイス14に直接送信され得る。符号化ビデオデータは、さらに(または代替的に)、宛先デバイス14または復号および/もしくは再生のための他のデバイスによる後のアクセスのためにストレージデバイス34上に記憶され得る。
[0072]宛先デバイス14は、入力インターフェース28と、ビデオデコーダ30と、ディスプレイデバイス32とを含む。場合によっては、入力インターフェース28は、受信機および/またはモデムを含み得る。宛先デバイス14の入力インターフェース28は、リンク16を介して符号化ビデオデータを受信する。リンク16を介して通信され、またはストレージデバイス34上に与えられた符号化ビデオデータは、ビデオデータを復号する際に、ビデオデコーダ30のようなビデオデコーダが使用するためのビデオエンコーダ20によって生成される様々なシンタックス要素を含み得る。そのようなシンタックス要素は、通信媒体上で送信される、記憶媒体上に記憶される、またはファイルサーバ上に記憶される、符号化されたビデオデータとともに含まれ得る。
[0073]一部の例では、宛先デバイス14のビデオデコーダ30は、時間層切替え点のような、ランダムアクセス点またはストリーム適応点の後にくる1つまたは複数のピクチャを復号し得る。たとえば、これは、ビットレート、フレームレートまたは空間分解能の適応のための切替え点(すなわち、時間層切替え点)であり得る。これらのピクチャのうちの1つまたは複数は先行ピクチャであり得る。BLAまたはBLCピクチャからのランダムアクセスが行われるとき、先行ピクチャは正確に復号され得ない。
[0074]一例では、復号がどこから始まるかに応じて利用可能ではない場合がある参照ピクチャからの誤り伝搬を防止するために、ビデオデコーダ30は、復号順序または出力順序のいずれかにおいてBLAまたはBLCピクチャの前にくるいかなるピクチャ(先行ピクチャを含む)も参照ピクチャとして使用し得ない。
[0075]様々な例では、ビデオデコーダ30は、DPB内のすべての参照ピクチャを、BLAまたはBLCピクチャを復号するとき、BLAピクチャを復号する前に参照するためには使用されないとしてマーキングし得る。たとえば、ビデオデコーダ30は、復号ピクチャバッファ(DPB)内の参照ピクチャを参照のためには使用されないとしてマーキングし得る。
[0076]別の例では、BLAピクチャが復号されるために、エンコーダ20は、フラグまたは他のシンタックス要素、たとえば、no_output_of_prior_pics_flagをビットストリーム内に含み得、デコーダ30はそれを受信し得る。フラグは、1に等しいとき、DPB内で前にあるピクチャのいずれも表示のために出力されないことを示す。特に、no_output_of_prior_pics_flagが1に等しいとき、デコーダ30は、復号ピクチャバッファ内のすべてのピクチャ記憶バッファを、それらが含むピクチャを出力することなく空にする。一部の例では、このフラグ、またはシンタックス要素は、エントロピー復号の前はスライスヘッダ内のごく初めに提示されてもよく、それによって、エントロピーコーディングを必要とすることなく、より容易に復号され得、この情報はコーディングプロセスのより早期に利用可能である。たとえば、それによって、たとえばno_output_of_prior_pics_flagがエントロピー復号される必要がないために、MANEのような、それほど洗練されていないデバイスがデコーダを必要とすることなく情報にアクセスすることができる。
[0077]別の例では、ビデオデコーダ30は、BLAまたはBLCピクチャが先行ピクチャを有するときおよび先行ピクチャを有しないときを示すために割り当てられたNALユニットタイプを処理することができる。(ここでも、上記で説明されたように、BLAおよびBLCピクチャが、リンクが壊れているCRAピクチャを表すという点において、BLAピクチャは一般にBLCピクチャと概念的には同じである。)一例では、ビデオデコーダ30は、複数の異なるネットワーク抽象化層(NAL)ユニットタイプのうちの1つに従って、ピクチャを復号することができる。複数のNALユニットタイプは、(1)リンクアクセスが壊れている(BLA)ピクチャのコード化スライスであって、BLAピクチャは、ビットストリーム内の関連付けられる先行ピクチャを有するBLAピクチャである、コード化スライス、(2)BLAピクチャのコード化スライスであって、BLAピクチャは、ビットストリーム内の関連付けられる復号可能な先行ピクチャを有するBLAピクチャである、コード化スライス、(3)BLAピクチャのコード化スライスであって、BLAピクチャは、ビットストリーム内の関連付けられる先行ピクチャを有しないBLAピクチャである、コード化スライスのうちの1つまたは複数を含む。
[0078]一部の例では、ビデオデコーダ30は、BLA NALユニットタイプを検出した場合、すべての参照ピクチャを参照のためには使用されないとしてマーキングするように構成されている。BLA NALユニットタイプがデコーダ30によって検出された場合、参照ピクチャは、BLAピクチャ、または、復号もしくは出力順序においてBLAピクチャの後にくる任意のピクチャの復号には有効ではない。
[0079]ディスプレイデバイス32は、宛先デバイス14に一体化されても、または外付けされてもよい。一部の例では、宛先デバイス14は、一体型ディスプレイデバイスを含み、また、外部ディスプレイデバイスとインターフェースするように構成され得る。他の例では、宛先デバイス14はディスプレイデバイスであってもよい。一般に、ディスプレイデバイス32は、復号ビデオデータをユーザに対して表示し、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、または別のタイプのディスプレイデバイスのような、種々のディスプレイデバイスのいずれかを備え得る。
[0080]ビデオエンコーダ20およびビデオデコーダ30は、現在開発中のHigh Efficiency Video Coding(HEVC)規格のようなビデオ圧縮規格に従って動作することができ、HEVC Test Model(HM)に準拠し得る。代替的に、ビデオエンコーダ20およびビデオデコーダ30は、代替的にMPEG−4、Part 10、アドバンストビデオコーディング(AVC)と呼ばれるITU−T H.264規格のような、他のプロプライエタリもしくは業界標準、またはそのような規格の拡張に従って動作することができる。ただし、本開示の技法は、いかなる特定のコーディング規格にも限定されない。ビデオ圧縮規格の他の例には、MPEG−2およびITU−T H.263がある。
[0081]図1には示されていないが、一部の態様では、ビデオエンコーダ20およびビデオデコーダ30は、各々オーディオエンコーダおよびデコーダと統合されてよく、共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を処理するために、適切なMUX−DEMUXユニット、または他のハードウェアおよびソフトウェアを含んでもよい。妥当な場合は、一部の例では、MUX−DEMUXユニットは、ITU H.223多重化プロトコル(multiplexer protocol)、またはユーザデータグラムプロトコル(UDP)など他のプロトコルに準拠することができる。
[0082]ビデオエンコーダ20およびビデオデコーダ30はそれぞれ、1つもしくは複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアのような、様々な好適なエンコーダ回路のいずれか、またはそれらの任意の組合せとして実装され得る。本技法が部分的にソフトウェアにおいて実装されるとき、デバイスは、好適な非一時的コンピュータ可読媒体にソフトウェアの命令を記憶し、1つまたは複数のプロセッサを使用してその命令をハードウェアにおいて実行して、本開示の技法を実行し得る。ビデオエンコーダ20およびビデオデコーダ30の各々は1つまたは複数のエンコーダまたはデコーダ中に含まれ得、そのいずれも、それぞれのデバイスにおいて複合エンコーダ/デコーダ(コーデック)の一部として統合され得る。
[0083]JCT−VCは、HEVC規格の開発に取り組んでいる。HEVC規格化の取組みは、HEVCテストモデル(HM)と呼ばれるビデオコーディングデバイスの発展的モデルに基づく。HMは、たとえば、ITU−T H.264/AVCによる既存のデバイスと比較して、ビデオコーディングデバイスにいくつかの機能が追加されていると推定する。たとえば、H.264が9つのイントラ予測符号化モードを提供するのに対して、HMは33ものイントラ予測符号化モードを提供することができる。
[0084]一般的に、HMの作業モデルは、ビデオフレームまたはピクチャは、輝度と彩度の両方のサンプルを含むツリーブロック(treeblock)または最大のコーディングユニット(LCU)のシーケンスへと分割され得ると説明している。ツリーブロックは、H.264規格のマクロブロックと同様の目的を有する。スライスは、コーディング順序において連続するいくつかのツリーブロックを含む。ビデオフレームまたはピクチャは、1つまたは複数のスライスに区分化され得る。各ツリーブロックは、4分木に従ってコーディングユニット(CU)に分割され得る。たとえば、4分木のルートノードとしてのツリーブロックは、4つの子ノードに分割され得、各子ノードは、次に、親ノードとなり、別の4つの子ノードに分割され得る。4分木のリーフノードとしての、最終的な、分割されない子ノードは、コーディングノード、すなわち、コード化ビデオブロックを備える。コード化ビットストリームに関連付けられるシンタックスデータは、ツリーブロックが分割され得る最大回数を定義し得、コーディングノードの最小サイズをも定義し得る。
[0085]CUは、コーディングノードと、コーディングノードに関連付けられる予測ユニット(PU:prediction unit)および変換ユニット(TU:transform unit)とを含む。CUのサイズは、コーディングノードのサイズに対応し、形状は正方形である必要がある。CUのサイズは、8×8ピクセルから最大64×64以上のピクセルを有するツリーブロックのサイズまでに及ぶ場合がある。各CUは、1つまたは複数のPUと、1つまたは複数のTUとを含み得る。CUに関連付けられるシンタックスデータは、たとえば、CUを1つまたは複数のPUに区分化することを記述し得る。区分化モードは、CUがスキップモードもしくはダイレクトモードで符号化されているか、イントラ予測モードで符号化されているか、またはインター予測モードで符号化されているかの間で異なり得る。PUは、形状が非正方形になるように区分化され得る。CUに関連付けられるシンタックスデータは、たとえば、4分木に従って、CUを1つまたは複数のTUに区分化することも記述し得る。TUは、形状が正方形または非正方形であり得る。
[0086]HEVC規格は、CUごとに異なり得るTUに従った変換を可能にする。TUは、一般的には、区分化されたLCUに対して規定された所与のCU内のPUのサイズに基づいてサイズを決定されるが、これが必ずしも当てはまるとは限らない場合がある。TUは、一般的には、同じサイズであるか、またはPUよりも小さい。一部の例では、CUに対応する残差サンプルは、「残差4分木」(RQT:residual quad tree)として知られる4分木構造を使用して、より小さいユニットに再分割され得る。RQTのリーフノードは、変換ユニット(TU)と呼ばれる場合がある。TUに関連付けられるピクセル差分値は、量子化され得る変換係数を生成するために変換され得る。
[0087]一般に、PUは、予測プロセスに関係付けられるデータを含む。たとえば、PUがイントラモード符号化されるとき、PUは、PUについてのイントラ予測モードを記述するデータを含む場合がある。別の例として、PUがインターモード符号化されるとき、PUは、PUのための動きベクトルを定義するデータを含む場合がある。PUのための動きベクトルを定義するデータは、たとえば、動きベクトルの水平成分、動きベクトルの垂直成分、動きベクトルについての分解能(たとえば、1/4ピクセル精度もしくは1/8ピクセル精度)、動きベクトルが指す参照ピクチャ、および/または動きベクトル用の参照ピクチャリスト(たとえば、リスト0、リスト1、もしくはリストC)を記述することができる。
[0088]概して、TUは、変換プロセスと量子化プロセスとのために使用される。1つまたは複数のPUを有する所与のCUは、1つまたは複数の変換ユニット(TU)を含む場合もある。予測に続いて、ビデオエンコーダ20は、PUに対応する残余の値を計算することができる。残差値は、エントロピーコーディングのためのシリアル化変換係数(serialized transform coefficient)を生成するために、TUを使用して変換係数に変換され、量子化され、走査され得るピクセル差分値を備える。本開示では通常、CUのコーディングノードを指すために「ビデオブロック」という用語を使用する。一部の特定の場合には、本開示は、コーディングノードならびにPUおよびTUを含む、ツリーブロック、すなわちLCUまたはCUを示すために「ビデオブロック」という用語を使用する場合もある。
[0089]ビデオシーケンスは、一般に、一連のビデオフレームまたはピクチャを含む。ピクチャのグループ(GOP)は、一般的に、ビデオピクチャの1つまたは複数の連続を備える。GOPは、GOP中に含まれるいくつかのピクチャを記述するシンタックスデータを、GOPのヘッダ中、ピクチャのうちの1つまたは複数のヘッダ中、または他の場所に含み得る。ピクチャの各スライスは、それぞれのスライスの符号化モードを記述するスライスシンタックスデータを含み得る。ビデオエンコーダ20は、一般に、ビデオデータを符号化するために個々のビデオスライス内のビデオブロックに対して動作する。ビデオブロックは、CU内のコーディングノードに対応する場合がある。ビデオブロックは、固定サイズまたは可変サイズを有し得、指定のコーディング規格に応じてサイズが異なり得る。
[0090]一例として、HMは、様々なPUサイズでの予測をサポートする。特定のCUのサイズが2N×2Nであると想定すると、HMは、PUサイズが2N×2NまたはN×Nのイントラ予測、および対称なPUサイズが2N×2N、2N×N、N×2N、またはN×Nのインター予測をサポートする。HMはまた、2N×nU、2N×nD、nL×2N、およびnR×2NのPUサイズでのインター予測のための非対称区分化をサポートする。非対称区分化では、CUの一方向は区分化されないが、他の方向は25%と75%とに区分化される。25%の区分に対応するCUの部分は、「n」とその後ろに付く「Up」、「Down」、「Left」、または「Right」という指示によって示される。したがって、たとえば、「2N×nU」は、上部の2N×0.5NのPUおよび下部の2N×1.5NのPUで水平方向に区分化された2N×2NのCUを指す。
[0091]本開示では、たとえば16×16ピクセルまたは16かける16ピクセルなど、「N×N」および「NかけるN(N by N)」は、垂直および水平の寸法に関して、ビデオブロックのピクセル範囲を示すために区別なく使用され得る。一般的に、16×16ブロックは、垂直方向に16個のピクセルを有し(y=16)、水平方向に16個のピクセルを有する(x=16)。同様に、N×Nブロックは、一般的に、垂直方向にN個のピクセルを有し、水平方向にN個のピクセルを有し、ここでNは負でない整数値を表している。ブロック中のピクセルは行と列で構成され得る。さらに、ブロックは、必ずしも垂直方向と水平方向に同じピクセル数を持つ必要はない。たとえば、ブロックはN×Mピクセルを備えることができ、ここでMはNと必ずしも等しいとは限らない。
[0092]CUのPUを使用したイントラ予測コーディングまたはインター予測コーディングの後、ビデオエンコーダ20は、CUのTUのための残差データを計算し得る。PUは、(ピクセル領域とも呼ばれる)空間領域においてピクセルデータを備えてよく、TUは、たとえば、残差ビデオデータへの離散コサイン変換(DCT)、整数変換、ウェーブレット変換、または概念的に同様の変換などの変換の適用後に、変換領域において係数を備え得る。残差データは、符号化されていないピクチャのピクセルと、PUに対応する予測値との間のピクセル差分に対応し得る。ビデオエンコーダ20は、CUのための残差データを含むTUを形成し、次いで、TUを変換して、CUのための変換係数を生成し得る。
[0093]変換係数を生成するための任意の変換に続き、ビデオエンコーダ20は、変換係数の量子化を実行することができる。量子化は、一般的に、変換係数が、場合によっては、係数を表すために使用されるデータの量を減らすために量子化されるプロセスを指し、さらなる圧縮を可能にする。量子化プロセスは、係数の一部または全部に関連付けられるビット深度を低減し得る。たとえば、量子化中にnビット値をmビット値に切り捨てることができ、ここで、nはmよりも大きい。
[0094]一部の例では、ビデオエンコーダ20は、エントロピー符号化され得るシリアル化ベクトルを生成するために、量子化変換係数を走査するためにあらかじめ定義された走査順序を利用し得る。他の例では、ビデオエンコーダ20は適応走査を実行し得る。量子化変換係数を走査して1次元ベクトルを形成した後に、ビデオエンコーダ20は、たとえば、コンテキスト適応型可変長コーディング(CAVLC)、コンテキスト適応型バイナリ算術コーディング(CABAC)、シンタックスベースコンテキスト適応型バイナリ算術コーディング(SBAC)、確率間隔区分エントロピー(PIPE)コーディング、または別のエントロピー符号化方法に従って、1次元ベクトルをエントロピー符号化する場合がある。ビデオエンコーダ20はまた、ビデオデータを復号する際にビデオデコーダ30が使用するための、符号化ビデオデータに関連付けられるシンタックス要素をエントロピー符号化し得る。
[0095]CABACを実行するために、ビデオエンコーダ20は、送信される記号にコンテキストモデル内のコンテキストを割り当てることができる。コンテキストは、たとえば、シンボルの隣接値が0ではないか否かに関係し得る。CAVLCを実行するために、ビデオエンコーダ20は、送信される記号の可変長コードを選択することができる。比較的より短いコードはより可能性の高い記号に対応し、より長いコードはより可能性の低い記号に対応するように、VLCのコードワードを構成することができる。このようにして、VLCを使用することで、たとえば、送信される各記号に対して等しい長さのコードワードを使用することによって、ビットの節約を達成することができる。確率の決定は、記号に割り当てられたコンテキストに基づいてもよい。
[0096]図2は、本開示で説明するリンク破損RAPピクチャをコーディングするための技法を実装し得る例示的なビデオエンコーダ20を示すブロック図である。ビデオエンコーダ20は、ビデオスライス内のビデオブロックのイントラコーディングとインターコーディングとを実行し得る。イントラコーディングは、空間的予測を利用して、所与のビデオフレームまたはピクチャ内のビデオの空間的冗長性を低減または除去する。インターコーディングは、時間的予測を利用して、ビデオシーケンスの隣接フレームまたはピクチャ内のビデオの時間的冗長性を低減または除去する。イントラモード(Iモード(登録商標))は、いくつかの空間ベースの圧縮モードのいずれかを指すことがある。単方向予測(Pモード)または双方向予測(Bモード)などのインターモードは、いくつかの時間ベースの圧縮モードのいずれかを指し得る。
[0097]図2の例では、ビデオエンコーダ20は、区分モジュール35と、予測モジュール41と、フィルタモジュール63と、参照ピクチャメモリ64と、加算器50と、変換モジュール52と、量子化モジュール54と、エントロピー符号化モジュール56とを含む。予測モジュール41は、動き推定モジュール42と、動き補償モジュール44と、イントラ予測モジュール46とを含む。ビデオブロック再構成のために、ビデオエンコーダ20はまた、逆量子化モジュール58と、逆変換モジュール60と、加算器62とを含む。フィルタモジュール63は、デブロッキングフィルタ、適応ループフィルタ(ALF)、およびサンプル適応オフセット(SAO:sample adaptive offset)フィルタのような、1つまたは複数のループフィルタを表すように意図されている。フィルタモジュール63はループフィルタであるものとして図2において示されているが、他の構成においては、フィルタモジュール63はポストループフィルタ(post loop filter)として実装されてもよい。
[0098]図2に示されているように、ビデオエンコーダ20は、ビデオデータを受信し、区分化モジュール35は、ビデオブロックへとデータを区分化する。この区分化は、たとえば、LCUおよびCUの4分木構造に応じて、スライス、タイル、または他のより大きいユニットへの区分化、ならびにビデオブロック区分化をも含み得る。ビデオエンコーダ20は、一般に、符号化されるべきビデオスライス内のビデオブロックを符号化する構成要素を示す。スライスは、複数のビデオブロックに(および、場合によっては、タイルと呼ばれるビデオブロックのセットに)分割され得る。予測モジュール41は、誤差結果(たとえばコーディングレートおよびひずみのレベル)に基づいて現在のビデオブロックについて、複数のイントラコーディングモードの1つ、または複数のインターコーディングモードの1つなど、複数の可能なコーディングモードの1つを選択することができる。予測モジュール41は、得られたイントラコード化ブロックまたはインターコード化ブロックを、残差ブロックデータを生成するために加算器50に与え、参照ピクチャとして使用するための符号化ブロックを再構成するために加算器62に与え得る。
[0099]上記で説明されたように、場合によっては、ビデオエンコーダ20は、BLAまたはBLCピクチャのように、時間層切替え点のようなランダムアクセス点またはストリーム適応点を符号化し得る。たとえば、符号化は、エントロピー符号化と非エントロピー符号化の両方を実行し得るエントロピー符号化モジュール56内で行われ得る。これらのピクチャのうちの1つまたは複数は、CRAピクチャの先行ピクチャであり得る。現在のCRAピクチャの前にあるRAPピクチャから復号が始まる場合、CRAピクチャの先行ピクチャは正確に復号され得る。しかしながら、CRAピクチャからのランダムアクセスが行われるとき、CRAピクチャの先行ピクチャは正確に復号され得ない。たとえば、先行ピクチャは、利用不可能である予測参照に関するブロックを指し得る。したがって、先行ピクチャは、ビデオデコーダ30において復号可能でない場合がある。したがって、これらの先行ピクチャは、ランダムアクセス復号中は一般的に破棄される。
[0100]一例では、ビデオエンコーダ20は、スライスヘッダ内にフラグ、たとえば、no_output_of_prior_pics_flagまたはシンタックス要素を与え得、それによって、DPBブロック内の前にあるピクチャ、すなわち、BLAまたはBLCピクチャの前にあるピクチャのいずれも出力されない。一部の例では、このフラグ(またはシンタックス要素)は、エントロピー符号化の前はスライスヘッダ内の初めにあってもよく、それによって、たとえば、デコーダ30においてより容易に復号され得、この情報はコーディングプロセスのより早期に利用可能であり得る。シンタックス要素またはフラグは、たとえば、エントロピー符号化モジュール56(非エントロピー符号化を実行し得る)によってBLAまたはBLCピクチャのスライスヘッダ内に符号化され得る。これは、たとえば、MANEのような中間デバイスにとって有用であり得、それによって、シンタックス要素またはフラグによって与えられる情報は、エントロピー復号せずに中間デバイスにとって利用可能であり得、ただし、これは、エントロピー復号の前にそのような情報にアクセスすることができるデコーダにも役立ち得る。
[0101]たとえば、ビデオエンコーダ20(たとえば、エントロピー符号化モジュール56)は、ピクチャ記憶バッファからいかなるピクチャも出力されることなくピクチャ記憶バッファが空にされていることを示すシンタックス要素を含み得る。このシンタックス要素は、設定されると、復号順序において現在のピクチャより前にあり、現在のピクチャの復号時点においてピクチャ記憶バッファ内に存在するピクチャが、出力されることなくピクチャ記憶バッファから空にされるようにし得る。一部の例では、シンタックス要素は、複数のシンタックス要素のうちの1つであってもよい。加えて、複数のシンタックス要素は、エントロピーコード化スライスヘッダシンタックス要素および非エントロピーコード化スライスヘッダシンタックス要素を含んでもよい。一例では、ピクチャ記憶バッファからいかなるピクチャも出力されることなくピクチャ記憶バッファが空にされていることを示すシンタックス要素が、任意のエントロピーコード化スライスヘッダシンタックス要素の前にスライスヘッダに含まれており、それによって、シンタックス要素自体はエントロピーコーディングされない。
[0102]一部の例では、シンタックス要素はno_output_of_prior_pics_flagであってもよく、no_output_of_prior_pics_flagは、スライスヘッダ内でfirst_slice_in_pic_flagの直後に含まれてもよい。first_slice_in_pic_flagは、復号順序において、あるスライスがピクチャの最初のスライスであるか否かを示すフラグであり得る。
[0103]一例では、ビデオエンコーダ20は、BLAまたはBLCピクチャが先行ピクチャを有するときおよび先行ピクチャを有しないときを示すために割り当てられたNALユニットタイプを含むように構成され得る。たとえば、1つの規格では、NALユニットタイプ16、BLA_W_LP(先行ピクチャを有するBLA)、NALユニットタイプ17、BLA_W_DLP(復号可能な先行ピクチャを有するBLA)、およびNALユニットタイプ18、BLA_N_LP(先行ピクチャを有しないBLA)が含まれる。これらのNALユニットタイプは、エントロピー符号化モジュール56(非エントロピー符号化を実行し得る)によって符号化されてもよい。したがって、NALユニットタイプに基づいて、デコーダは、BLAピクチャが先行ピクチャを有するとき、および、先行ピクチャが復号可能でないとき、たとえば、復号が前にあるRAPピクチャから始まるときを知ることができる。したがって、この情報は、先行するピクチャが参照のために使用されないものとしてマーキングされ得るときを判定するのに使用され得、これが、復号ピクチャバッファ内の参照ピクチャを参照のために使用されないものとしてマーキングするようにデコーダをトリガし得る。
[0104]予測モジュール41内のイントラ予測モジュール46は、空間圧縮を行うために、コーディングされるべき現在ブロックと同じフレームまたはスライス中の1つまたは複数の隣接ブロックに対する現在のビデオブロックのイントラ予測コーディングを実行し得る。予測モジュール41内の動き推定モジュール42および動き補償モジュール44は、時間的な圧縮を提供するために1つまたは複数の参照ピクチャ内の予測参照のための1つまたは複数のブロックに関して現在のビデオブロックのインター予測コーディングを実行する。
[0105]動き推定モジュール42は、ビデオシーケンスの所定のパターンに従ってビデオスライスのためのインター予測モードを決定するように構成され得る。所定のパターンは、Pスライス、Bスライス、またはGPBスライスとしてシーケンスにおいてビデオスライスを指定することができる。動き推定モジュール42と動き補償モジュール44とは、高度に統合され得るが、概念的な目的のために別々に示されている。動き推定モジュール42によって実行される動き推定は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、たとえば、参照ピクチャ内の予測ブロックに対する現在ビデオフレームまたはピクチャ内のビデオブロックのPUの変位を示し得る。
[0106]予測ブロックは、絶対値差分和(SAD)、差分2乗和(SSD)、または他の差分尺度によって決定され得るピクセル差分に関して、コーディングされるべきビデオブロックのPUに厳密に一致することがわかるブロックである。一部の例では、ビデオエンコーダ20は、参照ピクチャメモリ64に記憶された参照ピクチャの下位整数ピクセル位置(sub−integer pixel position)に対する値を計算することができる。たとえば、ビデオエンコーダ20は、参照ピクチャの1/4ピクセル位置、1/8ピクセル位置、または他の分数ピクセル位置の値を補間し得る。したがって、動き推定モジュール42は、フルピクセル位置と分数ピクセル位置とに対する動き探索を実行し、分数ピクセル精度で動きベクトルを出力し得る。
[0107]動き推定モジュール42は、PUの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコーディングされたスライスのビデオブロックのPUの動きベクトルを計算する。参照ピクチャは、第1の参照ピクチャリスト(リスト0)または第2の参照ピクチャリスト(リスト1)から選択され得、その各々は参照ピクチャメモリ64に記憶された1つまたは複数の参照ピクチャを識別する。動き推定モジュール42は、エントロピー符号化モジュール56と動き補償モジュール44とに計算された動きベクトルを送る。
[0108]動き補償モジュール44によって実行された動き補償は、動き推定によって決定された動きベクトルに基づいて予測ブロックを取り込むか、または生成することを含み、場合によってはサブピクセル精度への補間を実行することができる。現在のビデオブロックのPUの動きベクトルを受信すると、動き補償モジュール44は、参照ピクチャリストの1つで動きベクトルが指し示す予測ブロックを見つけることができる。ビデオエンコーダ20は、コーディングされている現在のビデオブロックのピクセル値から予測ブロックのピクセル値を減算し、ピクセル差分値を形成することによって残差ビデオブロックを形成する。ピクセル差分値は、ブロックの残差データを形成し、輝度差分成分と彩度差分成分の両方を含み得る。加算器50は、この減算演算を実行する1つまたは複数の構成要素を表す。動き補償モジュール44はまた、ビデオスライスのビデオブロックを復号する際にビデオデコーダ30が使用するための、ビデオブロックとビデオスライスとに関連付けられるシンタックス要素を生成し得る。
[0109]イントラ予測モジュール46は、上記で説明したように、動き推定モジュール42と動き補償モジュール44とによって実行されるインター予測の代替として、現在ブロックをイントラ予測し得る。特に、イントラ予測モジュール46は、現在ブロックを符号化するために使用すべきイントラ予測モードを判定し得る。一部の例では、イントラ予測モジュール46は、たとえば、別個の符号化パス中に、様々なイントラ予測モードを使用して現在ブロックを符号化し得、イントラ予測モジュール46(または、一部の例では、モード選択モジュール40)は、テストされたモードから使用するのに適切なイントラ予測モードを選択し得る。たとえば、イントラ予測モジュール46は、様々なテストされたイントラ予測モードのためのレートひずみ分析を使用してレートひずみ値を計算し、テストされたモードの中で最良のレートひずみ特性を有するイントラ予測モードを選択し得る。レートひずみ分析は、概して、符号化ブロックと、符号化ブロックを生成するために符号化された元の符号化されていないブロックとの間のひずみ(または誤差)の量、ならびに符号化ブロックを生成するために使用されるビットレート(すなわち、ビット数)を求める。イントラ予測モジュール46は、どのイントラ予測モードがブロックについて最良のレートひずみ値を呈するかを判定するために、様々な符号化ブロックのひずみおよびレートから比を計算し得る。
[0110]いずれの場合も、ブロックのイントラ予測モードを選択した後に、イントラ予測モジュール46は、ブロックについての選択されたイントラ予測モードを示す情報をエントロピー符号化モジュール56に提供し得る。エントロピー符号化モジュール56は、本開示の技法に従って選択されたイントラ予測モードを示す情報を符号化し得る。ビデオエンコーダ20は、送信されたビットストリーム構成データを含んでもよい。ビットストリームは、複数のイントラ予測モードインデックステーブルおよび複数の変更されたイントラ予測モードインデックステーブル(コードワードマッピングテーブルとも呼ばれる)と、様々なブロックの符号化コンテキストの定義と、最も可能性の高いイントラ予測モード、イントラ予測モードインデックステーブル、およびコンテキストの各々に使用する変更されたイントラ予測モードインデックステーブルの指示とを含むことができる。
[0111]予測モジュール41が、インター予測またはイントラ予測のいずれかを介して、現在のビデオブロックのための予測ブロックを生成した後、ビデオエンコーダ20は、現在のビデオブロックから予測ブロックを減算することによって残差ビデオブロックを形成する。残差ブロックにおける残差ビデオデータは、1つまたは複数のTUに含まれ得、変換モジュール52に適用され得る。変換モジュール52は、変換、たとえば離散コサイン変換(DCT)または概念的に同様の変換を使用して、残差ビデオデータを残差変換係数に変換する。変換モジュール52は、ピクセル領域からの残差ビデオデータを周波数領域などの変換領域に変換し得る。
[0112]変換モジュール52は、得られた変換係数を量子化モジュール54に送り得る。量子化モジュール54は、ビットレートをさらに低減するために変換係数を量子化する。量子化プロセスは、係数の一部または全部に関連付けられるビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって、修正することができる。一部の例では、量子化モジュール54は、次いで、量子化変換係数を含む行列の走査を実行し得る。代替的に、エントロピー符号化モジュール56が走査を実行してもよい。
[0113]量子化の後、エントロピー符号化モジュール56は、量子化変換係数をエントロピー符号化する。たとえば、エントロピー符号化モジュール56は、コンテキスト適応型可変長コーディング(CAVLC)、コンテキスト適応型バイナリ算術コーディング(CABAC)、シンタックスベースコンテキスト適応型バイナリ算術コーディング(SBAC)、確率間隔区分エントロピー(PIPE)コーディングまたは別のエントロピー符号化方法または技法を実行し得る。エントロピー符号化モジュール56によるエントロピー符号化の後に、符号化ビットストリームは、ビデオデコーダ30に送信されるか、またはビデオデコーダ30が後で送信するかもしくは取り出すためにアーカイブされ得る。エントロピー符号化モジュール56はまた、コーディングされている現在のビデオスライスのための動きベクトルと他のシンタックス要素とをエントロピー符号化し得る。
[0114]逆量子化モジュール58および逆変換モジュール60は、それぞれ逆量子化および逆変換を適用して、参照ピクチャの参照ブロックとして後で使用するために、ピクセル領域において残差ブロックを再構成する。動き補償モジュール44は、残差ブロックを参照ピクチャリストのうちの1つ内の参照ピクチャのうちの1つの予測ブロックに加算することによって参照ブロックを計算し得る。動き補償モジュール44はまた、再構成された残差ブロックに1つまたは複数の補間フィルタを適用して、動き推定において使用するサブ整数ピクセル値を計算し得る。加算器62は、再構成された残差ブロックを動き補償モジュール44によって生成された動き補償予測ブロックに加算して、参照ピクチャメモリ64に記憶するための参照ブロックを生成する。参照ブロックは、後続のビデオフレームまたはピクチャ中のブロックをインター予測するために、動き推定モジュール42および動き補償モジュール44によって参照ブロックとして使用され得る。
[0115]図2のビデオエンコーダ20は、本開示の技法に従って、フラグまたは他のシンタックス要素を符号化して、復号順序においてBLAピクチャより前の参照ピクチャが参照ピクチャとして使用され得ないときを示すように構成されたビデオエンコーダの一例を表す。
[0116]図3は、上記で説明したRAPピクチャのような破損に基づくストリーム適応およびスプライシングの強化されたサポートについて説明された技法を実施し得る例示的なビデオデコーダ30を示すブロック図である。図3の例では、ビデオデコーダ30は、エントロピー復号モジュール80と、予測処理モジュール81と、逆量子化モジュール86と、逆変換モジュール88と、加算器90と、フィルタモジュール91と、参照ピクチャメモリ92とを含む。予測モジュール81は、動き補償モジュール82と、イントラ予測モジュール84とを含む。ビデオデコーダ30は、一部の例では、図2のビデオエンコーダ20に関して説明された符号化パスとは概して逆の復号パスを実行し得る。
[0117]復号プロセス中に、ビデオデコーダ30は、ビデオエンコーダ20から、符号化ビデオスライスのビデオブロックと、関連付けられるシンタックス要素とを表す符号化ビデオビットストリームを受信する。ビデオデコーダ30は、ネットワークエンティティ29から符号化ビデオビットストリームを受信することができる。ネットワークエンティティ29は、たとえば、サーバ、メディアアウェアネットワーク要素(MANE)、ビデオエディタ/スプライサ、または上記で説明した技法のうちの1つもしくは複数を実装するように構成された他のそのようなデバイスであってもよい。ネットワークエンティティ39はビデオエンコーダ20を含んでもよいし、または含まなくてもよい。上記で説明されたように、本開示において説明されている技法の一部は、ネットワーク29が符号化ビデオビットストリームをビデオデコーダ30に送信する前に、ネットワークエンティティ29によって実施されてもよい。一部のビデオ復号システムにおいて、ネットワークエンティティ29およびビデオデコーダ30は別個のデバイスの部分であってもよく、他の事例では、ネットワークエンティティ29に関連して説明される機能は、ビデオデコーダ30を備える同じデバイスによって実行されてもよい。
[0118]上記で説明されたように、一部の例では、ビデオデコーダ30は、BLAピクチャのようなリンク破損RAPピクチャ、または、先行ピクチャのような、時間層切替え点のようなランダムアクセス点もしくはストリーム適応点の後にあるピクチャを復号し得る。リンク破損RAPピクチャからのランダムアクセスが行われるとき、先行ピクチャは正確に復号され得ない。
[0119]一例では、復号がどこから始まるかに応じて利用可能ではない場合がある参照ピクチャからの誤り伝搬を防止するために、ビデオデコーダ30は、復号順序または出力順序のいずれかにおいてリンク破損RAPピクチャの前にくるいかなるピクチャ(先行ピクチャを含む)も参照ピクチャとして使用し得ない。たとえば、予測モジュール81は、復号順序または出力順序のいずれかにおいてリンク破損RAPピクチャの前にくる、参照ピクチャメモリ92に記憶されているいかなるピクチャ(先行ピクチャを含む)も参照ピクチャとして使用し得ない。
[0120]様々な例では、ビデオデコーダ30は、DPB内のすべての参照ピクチャを、BLAピクチャを参照するためには使用されないとして復号する前に参照するためには使用されないとしてマーキングし得る。たとえば、エントロピー復号および非エントロピー復号を実行し得るエントロピー復号モジュール80は、復号ピクチャバッファ(DPB)と呼ばれることがある参照ピクチャメモリ92内の参照ピクチャを参照のために使用されないものとしてマーキングし得る。ビデオデコーダ30(たとえば、エントロピー復号モジュール80)は、現在のピクチャがBLAまたはBLCピクチャであると判定し、ピクチャ記憶バッファ内の参照ピクチャを、BLAまたはBLCピクチャを復号する前の参照のために使用されないものとしてマーキングし得る。現在のピクチャがBLAまたはBLCピクチャであると判定することは、現在のピクチャがCRAピクチャであると判定すること、および、現在のピクチャがRAPピクチャであると判定することを含み得る。現在のピクチャがCRAピクチャとRAPピクチャの両方である場合、現在のCRAピクチャはBLAピクチャである。一部の例では、デコーダ30によるこの判定は、BLA NALユニットタイプを有するピクチャに基づいて行われてもよい。
[0121]別の例では、BLAピクチャを復号するとき、デコーダ30は、符号化ビットストリーム内のフラグまたはシンタックス要素、たとえば、no_output_of_prior_pics_flagを受信し得、それによって、DPB内で前にあるピクチャのいずれも出力されない。一部の例では、このフラグは、エントロピー復号の前はBLAピクチャのスライスのスライスヘッダ内の初めに提示されてもよく、それによって、より容易に復号され得、この情報はコーディングプロセスのより早期に利用可能である。フラグまたはシンタックス要素は、エントロピー符号化と非エントロピー符号化の両方を実行し得るエントロピー符号化モジュール80内で復号され得る。エントロピー符号化の前にフラグまたは他のシンタックス要素をスライスヘッダの初めに置くことによって、たとえば、no_output_of_prior_pics_flagがエントロピー復号される必要がないため、MANEのようなそれほど洗練されていないデバイスがエントロピーデコーダを必要とせずに情報にアクセスすることができるようになり得る。
[0122]一例では、ビデオデコーダ30は、シンタックス要素、たとえば、no_output_of_prior_pics_flagを、デコーダが受信するためにビットストリーム内に置き得る。シンタックス要素は、ピクチャ記憶バッファからいかなるピクチャも出力されることなくピクチャ記憶バッファが空にされていることを示し得る。このシンタックス要素は、設定されると、復号順序において現在のピクチャより前にあり、現在のピクチャの復号時点においてピクチャ記憶バッファ内に存在するピクチャが、出力されることなくピクチャ記憶バッファから空にされるようにし得る。一部の例では、シンタックス要素は、複数のシンタックス要素のうちの1つであってもよい。加えて、複数のシンタックス要素は、1つまたは複数のエントロピーコード化スライスヘッダシンタックス要素および1つまたは複数の非エントロピーコード化スライスヘッダシンタックス要素を含んでもよい。一例では、ピクチャ記憶バッファからいかなるピクチャも出力されることなくピクチャ記憶バッファが空にされていることを示すシンタックス要素が、任意のエントロピーコード化スライスヘッダシンタックス要素の前に、たとえば、任意のue(v)要素の前に、たとえば、u(1)要素)としてスライスヘッダに含まれている。一部の例では、シンタックス要素はno_output_of_prior_pics_flagであってもよく、no_output_of_prior_pics_flagは、スライスヘッダ内でfirst_slice_in_pic_flagの直後で任意のエントロピーコード化要素の前に含まれてもよい。first_slice_in_pic_flagは、復号順序において、あるスライスがピクチャの最初のスライスであるか否かを示すフラグであり得る。
[0123]別の例では、ビデオデコーダ30は、BLAピクチャが先行ピクチャを有するときおよび先行ピクチャを有しないときを示すために割り当てられたNALユニットタイプを処理することができる。ビデオデコーダ30は、BLAピクチャがいつ先行ピクチャを有し、先行ピクチャを有さないかを示すために割り当てられたNALユニットタイプを含むように構成され得る。たとえば、エントロピー復号および非エントロピー復号を実行し得るエントロピー復号モジュール80は、NALユニットタイプを処理し得る。
[0124]一例では、ビデオデコーダ30(たとえば、エントロピー復号モジュール80)は、複数の異なるネットワーク抽象化層(NAL)ユニットタイプのうちの1つに従って、ピクチャを復号することができる。複数のNALユニットタイプは、(1)リンク破損アクセス(BLA)ピクチャのコード化スライスであって、BLAピクチャは、ビットストリーム内の関連付けられる先行ピクチャを有するBLAピクチャである、コード化スライス、(2)BLAピクチャのコード化スライスであって、BLAピクチャは、ビットストリーム内の関連付けられる復号可能な先行ピクチャを有するBLAピクチャである、コード化スライス、(3)BLAピクチャのコード化スライスであって、BLAピクチャは、ビットストリーム内の関連付けられる先行ピクチャを有しないBLAピクチャである、コード化スライスのうちの1つまたは複数を含む。一例では、先行ピクチャは、表示順序においてランダムアクセスピクチャ(RAP)の前にくるが、復号順序においてはランダムアクセスピクチャの後にくるピクチャを備える。
[0125]ビデオデコーダ30のエントロピー復号モジュール80は、量子化係数と、動きベクトルと、他のシンタックス要素とを生成するために、ビットストリームをエントロピー復号する。エントロピー復号モジュール80は、予測モジュール81に動きベクトルと他のシンタックス要素とを転送する。ビデオデコーダ30は、ビデオスライスレベルおよび/またはビデオブロックレベルでシンタックス要素を受信し得る。
[0126]ビデオスライスがイントラコード化(I)スライスとしてコーディングされたとき、予測モジュール81のイントラ予測モジュール84は、シグナリングされたイントラ予測モードと、現在のフレームまたはピクチャの、前に復号されたブロックからのデータとに基づいて、現在のビデオスライスのビデオブロックのための予測データを生成し得る。ビデオフレームがインターコード化(すなわち、B、PまたはGPB)スライスとしてコーディングされるとき、予測モジュール81の動き補償モジュール82は、エントロピー復号モジュール80から受信された動きベクトルおよび他のシンタックス要素に基づいて、現在のビデオスライスのビデオブロックに対する予測参照のためのブロックを生成する。予測参照のためのブロックは、参照ピクチャリストの1つ内の参照ピクチャの1つから作成され得る。ビデオデコーダ30は、参照ピクチャメモリ92に記憶された参照ピクチャに基づいて、デフォルト構造技術を使用して、参照フレームリスト、リスト0およびリスト1を構成することができる。
[0127]動き補償モジュール82は、動きベクトルと他のシンタックス要素とをパースすることによって現在のビデオスライスのビデオブロックのための予測情報を決定し、その予測情報を使用して、復号されている現在のビデオブロックに対する予測参照のためのブロックを生成する。たとえば、動き補償モジュール82は、ビデオスライスのビデオブロックをコーディングするために使用される予測モード(たとえばイントラまたはインター予測)と、インター予測のスライスタイプ(たとえばBスライス、Pスライス、またはGPBスライス)と、スライスの参照ピクチャリストの1つまたは複数の構築情報と、スライスの各インター符号化されたビデオブロックの動きベクトルと、スライスの各インターコーディングされたビデオブロックのインター予測ステータスと、現在のビデオスライスのビデオブロックを復号するための他の情報とを決定するために受信されたシンタックス要素の一部を使用する。DPB内のピクチャが参照のために使用されないものとしてマーキングされるとき、利用可能な参照ピクチャはない。したがって、ビデオデコーダ30は、インター予測のために前にある参照ピクチャを参照する先行ピクチャを復号することが可能でないことになる。
[0128]動き補償モジュール82はまた、補間フィルタに基づいて補間を実行し得る。動き補償モジュール82は、ビデオブロックの符号化中にビデオエンコーダ20によって使用された補間フィルタを使用して、参照ブロックのサブ整数ピクセルの補間値を計算し得る。この場合、動き補償モジュール82は、受信されたシンタックス要素からのビデオエンコーダ20によって使用される補間フィルタを決定し、予測参照のためのブロックを作成するために補間フィルタを使用することができる。
[0129]逆量子化モジュール86は、ビットストリーム中で与えられエントロピー復号モジュール80によって復号された、量子化変換係数を逆量子化(inverse quantize)、すなわち、逆量子化(de-quantize)する。逆量子化プロセスは、ビデオスライス中の各ビデオブロックについてビデオエンコーダ20によって計算される量子化パラメータを使用して量子化の程度を判定し、同様に、適用すべき逆量子化の程度を判定することを含み得る。逆変換処理モジュール88は、ピクセル領域において残差ブロックを作成するために、たとえば、逆DCT、逆整数変換、または概念的に同様の逆変換プロセスなどの逆変換を変換係数に適用する。
[0130]動き補償モジュール82が、動きベクトルおよび他のシンタックス要素に基づいて現在のビデオブロックのための予測ブロックを生成した後、ビデオデコーダ30は、逆変換処理モジュール88からの残差ブロックを動き補償モジュール82によって生成された予測参照のための対応するブロックと加算することによって、復号ビデオブロックを形成する。加算器90は、この加算演算を実行する1つまたは複数のコンポーネントを表す。所望される場合、ループフィルタ(コーディングループで、またはコーディングループの後のいずれか)も、ピクセル移行を平滑化するか、または他の場合にはビデオ品質を向上させるために使用され得る。フィルタモジュール91は、デブロッキングフィルタ、適応ループフィルタ(ALF)、およびサンプル適応オフセット(SAO)フィルタのような、1つまたは複数のループフィルタを表すように意図されている。フィルタモジュール91はループフィルタにあるものとして図3において示されているが、他の構成においては、フィルタモジュール91はポストループフィルタとして実装されてもよい。次いで、所与のフレームまたはピクチャの復号されたビデオブロックは、続く動き補償に使用される参照ピクチャを記憶する、参照ピクチャメモリ92に記憶される。参照ピクチャメモリ92はまた、図1のディスプレイデバイス32のようなディスプレイデバイス上での後の表示のために、復号されたビデオを記憶する。
[0131]このようにして、図3のビデオデコーダ30は、本開示の技法に従ってコード化されたパラメータセットIDを復号するように構成されたビデオデコーダの一例を表す。
[0132]図4は、ネットワーク100の一部を形成するデバイスの例示的なセットを示すブロック図である。この例では、ネットワーク10は、ルーティングデバイス104A、104B(ルーティングデバイス104)とトランスコーディングデバイス106とを含む。ルーティングデバイス104およびトランスコーディングデバイス106は、ネットワーク100の一部を形成し得る少数のデバイスを表すように意図されている。スイッチ、ハブ、ゲートウェイ、ファイアウォール、ブリッジ、および他のそのようなデバイスなどの他のネットワークデバイスも、ネットワーク100内に含まれてもよい。その上、サーバデバイス102とクライアントデバイス108との間のネットワーク経路に沿って追加のネットワークデバイスが提供されてもよい。一部の例では、サーバデバイス102はソースデバイス12(図1)に対応し得、一方でクライアントデバイス108は宛先デバイス14(図1)に対応し得る。
[0133]概して、ルーティングデバイス104は、ネットワーク100を介してネットワークデータを交換するための1つまたは複数のルーティングプロトコルを実装する。一部の例では、ルーティングデバイス104は、プロキシまたはキャッシュ動作を実行するように構成され得る。したがって、一部の例では、ルーティングデバイス104はプロキシデバイスと呼ばれ得る。概して、ルーティングデバイス104は、ネットワーク100を介したルートを発見するためにルーティングプロトコルを実行する。そのようなルーティングプロトコルを実行することによって、ルーティングデバイス104Bは、それ自体からルーティングデバイス104Aを介してサーバデバイス102へ至るネットワークルートを発見することができる。
[0134]本開示の技法は、ネットワークデバイスそのようなルーティングデバイス104およびトランスコーディングデバイス106によって実装されてもよいが、クライアントデバイス108によっても実装されてもよい。このように、ルーティングデバイス104、トランスコーディングデバイス106、およびクライアントデバイス108は、本開示の技法を実行するように構成されているデバイスの例を表す。その上、図1のデバイス、ならびに図2に示されているエンコーダおよび図3に示されているデコーダも、本開示の技法を実行するように構成され得る例示的なデバイスである。
[0135]たとえば、サーバデバイス102は、時間層切替え点のような、ランダムアクセス点もしくはストリーム適応点、または他のストリーム適応点の後にくる1つまたは複数のピクチャを符号化するためのエンコーダを含み得る。たとえば、これは、ビットレート、フレームレート、または空間分解能の適応のための切替え点(すなわち、時間層切替え点)であり得る。同様に、クライアントデバイス108は、時間層切替え点のような、ランダムアクセス点またはストリーム適応点の後にくる1つまたは複数のピクチャを復号し得る。ここでも、これは、ビットレート、フレームレート、または空間分解能の適応のための切替え点(すなわち、時間層切替え点)であり得る。これらのピクチャのうちの1つまたは複数は先行ピクチャであってもよい。先行ピクチャは、BLAピクチャからのランダムアクセスが行われるとき、クライアントデバイス108において正確に復号され得ない。
[0136]一例では、復号がどこから始まるかに応じて利用可能ではない場合がある参照ピクチャからの誤り伝搬を防止するために、クライアントデバイス108は、復号順序または出力順序のいずれかにおいてBLAピクチャの前にくる、復号ピクチャバッファ(DPB)に記憶されているピクチャ(先行ピクチャを含む)を参照ピクチャとして適用し得ない。
[0137]様々な例では、クライアントデバイス108は、DPB内のすべての参照ピクチャを、BLAピクチャを復号する前に参照するためには使用されないとしてマーキングし得る。たとえば、クライアントデバイス108は、復号ピクチャバッファ(DPB)内の参照ピクチャを参照のためには使用されないとしてマーキングし得る。
[0138]別の例では、サーバデバイス102、クライアントデバイス108、またはその両方は、スライスヘッダ内にシンタックス要素またはフラグを含み、ビットストリーム内へとフラグ、たとえば、no_output_of_prior_pics_flagを符号化し得、それによって、ビデオデコーダ30によって処理されるDPB内の前にくるピクチャのいずれも、たとえば、モニタ上での提示のために先行ピクチャを復号もDPBから出力もされない。一部の例では、このフラグは、エントロピー復号の前はスライスヘッダ内の初めにあってもよく、それによって、より容易に復号され得、この情報はコーディングプロセスのより早期に利用可能である。一例では、これらのネットワーク要素デバイスの1つは、たとえば、スプライシングまたはチャネル切替えもしくは時間層切替えのようなストリーム適応が必要とされるとき、CRAをBLAに変換し得る。エントロピーコーディングすることなくこのフラグをアクセス可能であり得るようにすることによって、エントロピー復号する機能を有しないネットワーク要素が、このフラグにアクセスすることができるようになる。
[0139]複数のNALユニットタイプは、(1)リンク破損アクセス(BLA)ピクチャのコード化スライスであって、BLAピクチャは、ビットストリーム内の関連付けられる先行ピクチャを有するBLAピクチャである、コード化スライス、(2)BLAピクチャのコード化スライスであって、BLAピクチャは、ビットストリーム内の関連付けられる復号可能な先行ピクチャを有するBLAピクチャである、コード化スライス、(3)BLAピクチャのコード化スライスであって、BLAピクチャは、ビットストリーム内の関連付けられる先行ピクチャを有しないBLAピクチャである、コード化スライスのうちの1つまたは複数を含む。一例では、先行ピクチャは、表示順序においてランダムアクセスピクチャ(RAP)の前にくるが、復号順序においてはランダムアクセスピクチャの後にくるピクチャを備える。
[0140]様々な例では、ネットワーク100を構成するルーティングデバイス104A、104Bおよびトランスコーディングデバイス106はまた、時間層切替え点のような、ランダムアクセス点またはストリーム適応点の後にくる1つまたは複数のピクチャに対する何らかの処理を実行し得る。たとえば、これは、ビットレート、フレームレートの適応のための切替え点(すなわち、時間層切替え点)または空間分解能であり得る。上記で説明されたように、これらのピクチャのうちの1つまたは複数は、正確に復号され得ない先行ピクチャであり得る。
[0141]一例では、ルーティングデバイス104A、104B、およびトランスコーディングデバイス106のうちの1つまたは複数は、復号順序または出力順序のいずれかにおいてCRAピクチャの前にくる任意のピクチャ(先行ピクチャを含む)を参照ピクチャとして使用し得ない。別の例では、ルーティングデバイス104A、104B、およびトランスコーディングデバイス106のうちの1つまたは複数は、DPB内のすべての参照ピクチャを、BLAピクチャを復号する前に参照するためには使用されないとしてマーキングし得る。たとえば、ルーティングデバイス104A、104B、およびトランスコーディングデバイス106のうちの1つまたは複数は、復号ピクチャバッファ(DPB)内の参照ピクチャを、参照するためには使用されないとしてマーキングし得る。別の例では、ルーティングデバイス104A、104B、およびトランスコーディングデバイス106のうちの1つもしくは複数またはストリーミングサーバは、フラグ、たとえば、no_output_of_prior_pics_flagを使用してもよく、それによって、DPB内の前にくるピクチャのいずれも出力されない。加えて、ルーティングデバイス104A、104B、およびトランスコーディングデバイス106は、BLAピクチャが先行ピクチャを有するときおよび先行ピクチャを有しないときを示すために割り当てられたNALユニットタイプを処理することができる。
[0142]図5は、本開示において説明される技法による一例を示す図である。図5は、先行ピクチャが復号可能である場合および復号可能でない場合の例を示す。先行ピクチャの復号可能性は、予測ブロックの位置に基づき得る。加えて、先行ピクチャの復号可能性は、現在のCRAピクチャが、BLAピクチャではないCRAピクチャであるか、または、現在のCRAピクチャが、BLAピクチャでもあるCRAピクチャであるかに基づき得る。(BLAピクチャはCRAピクチャの部分集合である。)
[0143]図5の部分200は、復号順序における一連のピクチャを示す。最初、たとえば、ビデオデコーダ30(図1および図3)またはクライアントデバイス108(図4)は、位置202にあるRAPピクチャを、ビデオシーケンス内の最初のピクチャとして復号し得る。ビデオデコーダ30またはクライアントデバイス108は、次いで、位置204において参照ピクチャとして機能し得るピクチャまたはピクチャの一部を復号し得る。図5に示されているように、位置204は、復号順序における参照ピクチャの可能性のある位置である。参照ピクチャが位置204に位置しており、位置206にあるピクチャが、BLAピクチャではないCRAピクチャである場合、位置208にある先行ピクチャは復号可能であることになる。逆に参照ピクチャが位置204に位置しており、位置206にあるピクチャがBLAピクチャでもあるCRAピクチャである場合、位置208にある先行ピクチャは復号可能でないことになる。(BLAピクチャは、CRAピクチャの部分集合である。)
[0144]位置202にあるRAPピクチャが、復号が始まるRAPピクチャであり、位置206にある現在のCRAピクチャがBLAピクチャでない場合、上記で説明されたように、位置208にある先行ピクチャは復号可能である。逆に、位置206にある現在のCRAピクチャがRAPである場合、位置206にある現在のCRAピクチャがBLAピクチャでもある場合、位置208にある先行ピクチャは復号可能でない。これは、位置204にある予測ブロックが、位置206にある現在のCRAピクチャであるBLAピクチャにとって利用可能でないためである。したがって、位置204にある予測ブロックは(1)参照のために使用されないものとしてマーキングされ得、(2)no_output_of_prior_pics_flagは、位置208にある先行ピクチャまでの、その先行ピクチャを含む前にあるピクチャが出力されるべきでないことを示し得る。
[0145]図5に示されているように、位置210は、復号順序における参照ピクチャの可能性のあるもう1つの位置である。参照ピクチャが位置210に位置する場合、位置208にある先行ピクチャは復号可能であることになる。
[0146]図5の部分212は、出力順序における一連のピクチャを示す。最初に、ビデオデコーダ(図1および図3)またはクライアントデバイス108(図4)RAPピクチャ202。ビデオデコーダ30またはクライアントデバイス108は、次いで、位置204において予測ブロックとして機能し得るピクチャまたはピクチャの一部を復号し得る。図5に示されているように、位置204は、出力順序における予測ブロックの可能性のある位置である。
[0147]出力順序において、図5に示されているように、先行ピクチャ208は位置206にある現在のCRAピクチャより前に出力され得る。図5に示されているように、位置210は、出力順序における予測ブロックの可能性のあるもう1つの位置である。
[0148]図6は、本開示で説明される1つまたは複数の例による、RAPピクチャをコーディングするための例示的な方法を示す流れ図である。図6に示されているように、一部の例では、ビデオコーダ、たとえば、ビデオエンコーダ20またはビデオデコーダ30が、ビデオシーケンス内の時間層切替え点のようなランダムアクセス点またはストリーム適応点についてBLAピクチャをコーディングし得る。たとえば、これは、ビットレート、フレームレートまたは空間分解能の適応のための切替え点であり得る。BLAピクチャは、1つまたは複数の先行ピクチャを含み得る。先行ピクチャは、BLAピクチャからのランダムアクセスが行われるとき、(たとえば、デコーダ30、MANE、または他の復号デバイスによって)正確に復号され得ない。
[0149]一例では、復号がどこから始まるかに応じて利用可能ではない場合がある参照ピクチャからの誤り伝搬を防止するために、ビデオコーダは、復号順序または出力順序のいずれかにおいてBLAピクチャの前にくるいかなるピクチャ(先行ピクチャを含む)も参照ピクチャとして使用し得ない。
[0150]たとえば、ビデオデコーダ30は、ピクチャ記憶バッファからいかなるピクチャも出力されることなくピクチャ記憶バッファが空にされていることを示すシンタックス要素を受信および復号し得る(600)。シンタックス要素は、エンコーダ20または中間ネットワーク要素によって符号化ビデオビットストリーム内に含まれてもよい。ビデオデコーダ30は、前にくるピクチャの出力が行われるべきではないことをシンタックス要素が示すか否かを判定し得、たとえば、ビデオデコーダ30は、シンタックス要素が設定される、すなわち、1に等しいか否かを判定するために、シンタックス要素をチェックし得る(602)。ビデオデコーダ30が設定されているシンタックス要素を受信すると、ビデオデコーダ30は、復号順序において現在のピクチャより前にあり、現在のピクチャの復号時点においてピクチャ記憶バッファ内に存在するピクチャが、出力されることなくピクチャ記憶バッファから空にされるようにし得る(604)。
[0151]一部の例では、シンタックス要素は、複数のシンタックス要素のうちの1つであってもよい。加えて、複数のシンタックス要素は、エントロピーコード化スライスヘッダシンタックス要素および非エントロピーコード化スライスヘッダシンタックス要素を含んでもよい。一例では、シンタックス要素は、復号ピクチャバッファからいかなるピクチャも出力されることなくピクチャ記憶バッファが空になっていることを示し得、任意のエントロピーコード化スライスヘッダシンタックス要素の前にスライスヘッダに含まれている。別の例では、シンタックス要素は、ピクチャ記憶バッファ内のデータが、ピクチャ記憶バッファからいかなるピクチャも出力されることなく無視および/または上書きされるべきでないことを示し得、任意のエントロピーコード化スライスヘッダシンタックス要素の前にスライスヘッダに含まれている。一部の例では、シンタックス要素はno_output_of_prior_pics_flagであってもよく、no_output_of_prior_pics_flagは、スライスヘッダ内でfirst_slice_in_pic_flagの直後に含まれてもよい。first_slice_in_pic_flagは、復号順序において、あるスライスがピクチャの最初のスライスであるか否かを示すフラグであり得る。
[0152]図7は、本開示で説明する1つまたは複数の例による例示的な方法を示すフローチャートである。示されている例では、ビデオコーダは、現在のピクチャがCRAピクチャであると判定し得る(700)。ビデオコーダは、現在のピクチャがRAPピクチャであるとも判定し得る(702)。ビデオコーダは、現在のピクチャがBLAピクチャであると判定し得る(700)。他の例では、ビデオコーダは、現在のピクチャがBLAピクチャであるか否かを判定するためにNALユニットタイプを使用し得る。
[0153]様々な例では、ビデオコーダは、DPB内のすべての参照ピクチャを、BLAピクチャを復号する前に参照のために使用されないものとしてマーキングし得る。たとえば、ビデオデコーダ30が、復号ピクチャバッファ(DPB)と呼ばれることがある参照ピクチャメモリ92内の参照ピクチャを参照のために使用されないものとしてマーキングし得る。したがって、ピクチャはインターコード化のために使用されないことになり、これは、可能性のある誤りを回避し、一部の例では、空間的適応による問題に対処し得る。加えて、一般にこれらのピクチャは、たとえば、それらが見られ得るモニタまたは画面に出力されないことになる。
[0154]ビデオデコーダ30は、現在のピクチャがBLAピクチャであると判定し、ピクチャ記憶バッファ内の参照ピクチャを、BLAピクチャを復号する前の参照のために使用されないものとしてマーキングし得る。一例では、ピクチャ記憶バッファ内の参照ピクチャのマーキングは、BLAピクチャが復号可能でないBLAピクチャを備えるときに行われ得、これは、一部の例では、NALユニットタイプに基づいて判定され得る。一部の例では、(1)DPB内のピクチャを参照のために使用されないものとしてマーキングすること、(2)no_output_of_prior_pics_flagのようなシンタックス要素を使用すること、および(3)BLAピクチャを示すNALユニットタイプを使用することのうちの1つまたは複数が、独立してまたは任意の組合せで使用されてもよい。
[0155]図8は、本開示において説明される1つまたは複数の例による例示的な方法を示す流れ図である。ビデオコーダは、BLAピクチャがいつ先行ピクチャを有し、先行ピクチャを有さないかを示すように割り当てられたNALユニットタイプを処理することができる。ビデオコーダは、BLAピクチャがいつ先行ピクチャを有し、先行ピクチャを有さないかを示すように割り当てられたNALユニットタイプを含むように構成され得る。たとえば、1つの規格では、NALユニットタイプ16、BLA_W_LP(先行ピクチャを有するBLA)、NALユニットタイプ17、BLA_W_DLP(復号可能な先行ピクチャを有するBLA)、およびNALユニットタイプ18、BLA_N_LP(先行ピクチャを有しないBLA)が含まれる。
[0156]一例では、ビデオコーダは、以下の1つまたは複数を含む複数の異なるネットワーク抽象化層(NAL)ユニットタイプのうちの1つに従って、ピクチャをコーディングすることができる。たとえば、ビデオコーダは、BLAピクチャが関連付けられる先行ピクチャを有しないと判定し(800)、BLAピクチャがビットストリーム内で関連付けられる先行ピクチャのないBLAピクチャであることを示すNALユニットタイプを使用して、BLAピクチャのコード化スライスまたはBLAピクチャ全体をコード化し得る(802)。ビデオコーダは、BLAピクチャが復号可能な先行ピクチャを関連付けられていると判定し(804)、BLAピクチャがビットストリーム内で関連付けられる復号可能な先行ピクチャのあるBLAピクチャであることを示すNALユニットタイプを使用して、コード化スライスまたはBLAピクチャ全体をコード化し得る(806)。ビデオコーダは、BLAピクチャが先行ピクチャを関連付けられていると判定し(808)、BLAピクチャがビットストリーム内で関連付けられる先行ピクチャのあるBLAピクチャであることを示すNALユニットタイプを使用して、BLAピクチャのコード化スライスまたはBLAピクチャ全体をコード化し得る(810)。一例では、ビデオデコーダ30がBLA NALユニットタイプを検出した場合、ビデオデコーダ30は、たとえば、DPB内のピクチャを参照のために使用されないものとしてマーキングし得る。
[0157]一部の例では、(1)DPB内のピクチャを参照のために使用されないものとしてマーキングすること、(2)no_output_of_prior_pics_flagのようなシンタックス要素を使用すること、および(3)BLAピクチャを示すNALユニットタイプを使用することのうちの1つまたは複数が、独立してまたは任意の組合せで使用されてもよい。たとえば、場合によっては、これらの3つすべてが使用されてもよい。他の例では、例示的なNALユニットタイプが、DPB内のピクチャの参照のために使用されないものとしてのマーキングとともに使用され得る。別の例では、先行ピクチャ無出力シンタックス要素(no output of prior pictures syntax element)と、ピクチャの参照のために使用されないものとしてのマーキングとが使用され得る。別の例では、先行ピクチャ無出力シンタックス要素と、NALユニットタイプとが使用され得る。
[0158]本明細書において使用される場合、BLCとは、リンク破損クリーンランダムアクセスを指し、BLCLとは、ビットストリーム内で関連付けられる先行ピクチャのあるBLCピクチャを指し、BLCNLは、ビットストリーム内で関連付けられる先行ピクチャのないBLCピクチャを指す。本明細書において説明されているように、BLCピクチャは概して、BLAピクチャと同じである。CRAとは、クリーンランダムアクセスを指し、CRALとは、ビットストリーム内で関連付けられる先行ピクチャのあるCRAピクチャを指し、CRANLは、ビットストリーム内で関連付けられる先行ピクチャのないCRAピクチャを指す。IDRとは、瞬時復号リフレッシュを指し、LPRとは、ランダムアクセス点ピクチャに関連付けられる先行ピクチャを指し、NSPとは、ナッシングスペシャルプレーン(Nothing Special Plain)を指し、RAPとは、ランダムアクセス点を指し、RPSとは、参照ピクチャセットを指す。本明細書において使用される場合、TLAは時間層アクセス(Temporal Layer Access)を指し、TLALは、LRPピクチャでもあるTLAピクチャを指し、TLANLは、LRPピクチャではないTLAピクチャを指す。
[0159]BLCアクセスユニットは、コード化ピクチャがBLAピクチャであるアクセスユニットを指す。BLCピクチャは、コード化スライスのスライスヘッダがRPSシンタックスを含み、一方RPSがRPSシンタックスを使用することなく空であるとして導出されるRAPピクチャである。BLCLアクセスユニットは、コード化ピクチャがBLCLピクチャであるアクセスユニットである。BLCLピクチャは、関連付けられるLPRピクチャがビットストリーム内に存在するBLAピクチャである。一部の例では、BLCLアクセスユニットは、BLA_W_DLPとBLA_W_LPとの組合せと等価であり得る。BLCNLアクセスユニットは、コード化ピクチャがBLCNLピクチャであるアクセスユニットである。一部の例では、BLCNLアクセスユニットは、BLA_N_LPと等価であり得る。BLCNLピクチャは、関連付けられるLPRピクチャがビットストリーム内に存在しないBLAピクチャである。
[0160]一例では、CRAアクセスユニットは、コード化ピクチャがCRAピクチャであるアクセスユニットである。CRAピクチャは、コード化スライスのスライスヘッダがRPSシンタックスを含み、RPSシンタックスがRPSの導出に使用されるRAPピクチャである。CRALアクセスユニットは、コード化ピクチャがCRALピクチャであるアクセスユニットである。CRALピクチャは、関連付けられるLPRピクチャがビットストリーム内に存在するCRAピクチャである。CRANLアクセスユニットは、コード化ピクチャがCRANLピクチャであるアクセスユニットである。CRANLピクチャは、関連付けられるLPRピクチャがビットストリーム内に存在しないCRAピクチャである。
[0161]一例では、IDRアクセスユニットは、コード化ピクチャがIDRピクチャであるアクセスユニットである。IDRピクチャは、コード化スライスのスライスヘッダがRPSシンタックスを含まず、RPSが空であるとして導出されるRAPピクチャである。
[0162]一例では、復号順序においてすべての前にくるアクセスユニットが存在するとは限らない場合、コード化ピクチャによって参照される各パラメータセットおよび復号順序におけるすべての後続のコード化ピクチャがそのアクティブ化の前に存在するという条件で、IDRピクチャおよび復号順序におけるすべての後続のコード化ピクチャは正確に復号され得る。代替的に、別の例では、IDRピクチャは、HEVCにおいて定義されているものに、上記が加わったものであってもよい。
[0163]他の例では、IDRピクチャは先行する注に加えて次のように定義することができ、IDRピクチャはIスライスのみを含むコード化ピクチャであってもよい。加えて、例示的なIDRピクチャについて、復号順序におけるIDRピクチャの後続のすべてのコード化ピクチャは、復号順序においてIDRピクチャの前にくる任意のピクチャからのインター予測を使用しない。一例では、復号順序においてIDRピクチャの前にくる任意のピクチャは、出力順序においてもIDRピクチャの前にくる。
[0164]先行ピクチャは、RAPピクチャではなく、かつ、復号順序において何らかの他の特定のピクチャに続き、出力順序において特定のピクチャの前にくるコード化ピクチャである。LPRピクチャは、RAPピクチャに関連付けられる先行ピクチャまたはRAPピクチャの先行ピクチャである。
[0165]ピクチャ順序カウントは、各コード化ピクチャに関連付けられる変数であり得、復号順序において前にくるRAPピクチャに対して出力順序におけるピクチャ位置が増大するとともに増大する値を有する。
[0166]一例では、RAPアクセスユニットは、コード化ピクチャがRAPピクチャであるアクセスユニットである。RAPピクチャは、Iスライスのみを含むコード化ピクチャであってもよい。RAPピクチャについて、復号順序と出力順序の両方におけるRAPピクチャの後続のすべてのコード化ピクチャは、復号順序または出力順序のいずれかにおいてRAPピクチャの前にくる任意のピクチャからのインター予測を使用しない。復号順序においてRAPピクチャの前にくる任意のピクチャの出力は、RAPピクチャの出力に先行すべきである。復号順序においてすべての前にくるアクセスユニットが存在するとは限らない場合、コード化ピクチャによって参照される各パラメータセットおよび復号順序におけるすべての後続のコード化ピクチャがそのアクティブ化の前に存在するという条件で、RAPピクチャおよび復号順序と出力順序の両方におけるすべての後続のコード化ピクチャは正確に復号され得る。
[0167]代替的に、RAPピクチャは、上記の論述と一致して次のように定義されてもよい。RAPピクチャは、Iスライスのみを含み、かつ、復号順序と出力順序の両方におけるRAPピクチャの後続のすべてのコード化ピクチャが、復号順序または出力順序のいずれかにおいてRAPピクチャの前にくる任意のピクチャからのインター予測を使用しないコード化ピクチャであってもよい。復号順序においてRAPピクチャの前にくる任意のピクチャは、出力順序においてもRAPピクチャの前にくる。
[0168]TLAアクセスユニットは、コード化ピクチャがTLAピクチャであるアクセスユニットである。TLAピクチャはコード化ピクチャであり、そのTLAピクチャ、および、TLAピクチャのtemporal_id以上のtemporal_idを有するすべてのコード化ピクチャ。復号順序においてTLAピクチャの後にくるTLAピクチャは、復号順序においてTLAピクチャの前にくるTLAピクチャのtemporal_id以上のtemporal_idを有するいかなるピクチャからのインター予測も使用すべきでない。TLALアクセスユニットは、コード化ピクチャがTLAピクチャであるアクセスユニットである。
[0169]一部の例では、次の明確なVCL NALユニットタイプが定義され得る。第1の例として、NALユニットタイプは、IDRピクチャのコード化スライスに提供されてもよい(たとえば、nal_unit_type=5)。このNALユニットタイプに対しては、HEVC W6におけるIDRピクチャ概念が適用される。他のタイプのVCL NALユニットと比較した、このVCL NALユニットタイプの固有の特徴は、スライスヘッダに含まれる参照ピクチャセット(RPS)シンタックスがないことである。
[0170]一部の例は、BLCNLピクチャのコード化スライスを含む(ビットストリーム内で関連付けられる先行ピクチャのないBLCピクチャ、たとえば、nal_unit_type=2)。IDRピクチャのコード化スライスと比較して、BLCNLピクチャのコード化スライスは、スライスヘッダ内にRPSシンタックスを含むが、RPSシンタックスはRPS導出に使用されず、むしろ、すべてのRPSサブセットが空であるとして導出される。
[0171]一部の例は、BLCLピクチャのコード化スライスを含む(ビットストリーム内で関連付けられる先行ピクチャのあるBLCピクチャ、たとえば、nal_unit_type=3)。BLCNLピクチャと比較して、ビットストリーム内でBLCLピクチャに関連付けられる先行ピクチャがある。
[0172]一部の例は、CRANLピクチャのコード化スライスを含む(ビットストリーム内で関連付けられる先行ピクチャのないCRA、たとえば、nal_unit_type=15)。BLCNLピクチャのコード化スライスと比較して、CRANLピクチャのコード化スライスは、スライスヘッダ内にRPSシンタックスを含み、RPSシンタックスはRPS導出に使用される。
[0173]一部の例は、CRALピクチャのコード化スライスを含む(ビットストリーム内で関連付けられる先行ピクチャのあるCRAピクチャ、たとえば、nal_unit_type=4)。CRANLピクチャと比較して、ビットストリーム内でCRALピクチャに関連付けられる先行ピクチャがある。
[0174]一部の例は、TLANLピクチャのコード化スライスを含む(LFRピクチャではないTLAピクチャ、たとえば、nal_unit_type=16)。一部の例は、TLALピクチャのコード化スライスを含む(LPRピクチャでもあるTLAピクチャ、たとえば、nal_unit_type=17)。一部の例は、NSPピクチャのコード化スライスを含む(上記のいずれでもない、ナッシングスペシャルプレーンピクチャ、nal_unit_type=1)。
[0175]各BLCピクチャ(BLCLまたはBLCNL)ピクチャのスライスデータを復号する前に、復号ピクチャバッファ(DPB)内のすべての参照ピクチャは、上記で説明されたように、デコーダ30によって「参照のために使用されない」としてマーキングされなければならない。これが実施されたときにのみ、ビットストリームの始まりにあるCRAピクチャの先行ピクチャに対する、HEVC WD6において現在規定されているものとしての現行の復号プロセスが、BLAピクチャが空間分解能を変化させるか否かにかかわらず、BLAピクチャの先行ピクチャのためにデコーダ30によって直接適用され得る。
[0176]上記がなく、BLAピクチャが空間分解能を変化させない場合、ビットストリームの始まりにあるCRAピクチャの先行ピクチャに対する、HEVC WD6において現在規定されているものとしての現行の復号プロセスが、BLAピクチャの先行ピクチャのためにデコーダ30によって直接適用され得る。しかしながら、BLAピクチャが空間分解能を変化させる場合、この状況は、現在のピクチャおよび現在のピクチャの参照ピクチャによって空間分解能が異なると考えられ得るため、ビットストリームの始まりにあるCRAピクチャの先行ピクチャに対する、HEVC WD6において現在規定されているものとしての現行の復号プロセスは、BLAピクチャの先行ピクチャのために直接適用され得ない。
[0177]各BLAピクチャのスライスデータを復号する前に、DPB内のすべての参照ピクチャが「参照のために使用されない」としてマーキングされることを保証するための1つの方法は、スライスヘッダ内のRPSシグナリングが空でないRPSを示すか否かにかかわらず、各BLAピクチャのRPSを空であるものとして導出することである。たとえば、ピクチャがBLAである場合、たとえRPSがある場合であっても、ビデオデコーダ30は、これを無効にしてRPSを空であるものとして導出または処理し得る。
[0178]実際、スライスヘッダにおけるRPSシグナリングが、BLAピクチャまたはCRA(CRALまたはCRANL)ピクチャについて空のRPSを示す場合、ピクチャはIDRピクチャとしてコーディングされているはずである。
[0179]一部の例では、RAPピクチャは、Iスライスのみを含むコード化ピクチャとして定義されてもよい。RAPピクチャについて、復号順序と出力順序の両方におけるRAPピクチャの後続のすべてのコード化ピクチャは、復号順序または出力順序のいずれかにおいてRAPピクチャの前にくる任意のピクチャからのインター予測を使用しない。加えて、復号順序においてRAPピクチャの前にくる任意のピクチャの出力は、RAPピクチャの出力に先行し得る。
[0180]復号順序においてRAPピクチャの前にくる任意のピクチャの出力がRAPピクチャの出力に先行すべきであることを保証するための1つの方法は、ビデオエンコーダ20が、上記で説明されたように、たとえば、ビデオデコーダ30に送信されるコード化ビットストリーム内で、1に等しいno_output_of_prior_pics_flagを設定することである。別の例では、ビデオデコーダ30が、BLAピクチャについてno_output_of_prior_pics_flagが(その値にかかわらず)1に等しいと推定してもよい。このように、スプライシングされるビットストリームにおいてBLAピクチャのより前にあるピクチャのPOC値がBLAピクチャのPOC値よりも大きい、BLAピクチャにおけるスプライシング動作が可能にされる。特に、BLAピクチャのPOC値がそのPOC LSBに等しいものとして導出され(0に等しいPOC MSBを仮定することによって)、上記は容易に起こり得る。これを保証するための別の方法は、復号順序においてBLAピクチャの前にくるピクチャの出力時点が、BLAピクチャの出力時点よりも早いことを確実にすることである。
[0181]一部の例は、ビデオエンコーダ20および/またはビットストリームスプライサが、本明細書に説明されているいずれの方法を使用するかを判定することを可能にする。したがって、たとえば、ビデオエンコーダ20は、一部の例ではBLAピクチャのスライスヘッダ内にno_output_of_prior_pics_flagを含み得る。他の例では、ビデオエンコーダ20は、ビデオデコーダ30にあるバッファに記憶されているピクチャが参照に使用され得るか否かを示すNALユニットタイプを含んでもよい。したがって、ビデオデコーダ30は、たとえば、そのようなピクチャを復号に使用する結果としてピクチャが不正確に復号されることになるとき、ピクチャを参照のために使用されないものとしてマーキングし得る。
[0182]ネットワーク要素によってCRAをBLAピクチャに単純に書き換えることを可能にするために、CRAピクチャのスライスヘッダ内にno_output_of_prior_pics_flagを置くことに加えて、no_output_of_prior_pics_flagはまた、スライスヘッダ内に可能な限り早期に含まれ得る。これは、上記で説明されたように、任意のエントロピーコード化スライスヘッダパラメータの前、たとえば、一部の例におけるfirst_slice_in_pic_flagの直後であり得る。
[0183]一例では、2つの連続するBLAピクチャは同じPOC LSBを有し、それらは、random_access_pic_id(またはrap_pic_idに改称されている)によってしか区別することが可能でない。したがって、rap_pic_idに固定長コーディングを使用し、スライスヘッダ内で可能な限り早期に、好ましくは任意のエントロピーコード化スライシングヘッダパラメータの後でなく、たとえば、たとえばCRAピクチャとBLAピクチャの両方のfirst_slice_in_pic_flagおよびno_output_of_prior_pics_flagの直後に、置くことが好ましい場合もある。ピクチャ境界検出に使用され得る他のスライスヘッダシンタックス要素、たとえば、pic_parameter_set_id、およびPOC LSB(すなわち、pic_order_cnt_lsb)は同様であり得る。
[0184]特定のタイプ(たとえば、SPS)またはすべてのタイプのすべてのパラメータセットが、ビットストリームの始まりに存在し得る、すなわち、ビットストリーム内の最初のアクセスユニットに含まれ得る。そうである場合、特定のタイプのすべてのパラメータセットをフェッチして、これらを帯域外で送ることが簡便である。たとえば、コーダは、セッションネゴシエーション中に使用されるセッション記述プロトコル(SDP)パラメータ内に含み得る。それゆえ、エンコーダが、特定のタイプまたはすべてのタイプのすべてのパラメータセットがビットストリームの始まりに存在するという指示をビットストリーム内に含むことが有益であり得る。この指示は、SEIメッセージ、アクセスユニットデリミタ、またはパラメータセットに含まれてもよい。たとえば、すべてのSPS(またはPPSもしくはAPS)がビットストリームの始まりに存在することを示すために、SPS、ピクチャパラメータセット(PPS)、または適応パラメータセット(APS)に明確なNALユニットタイプが使用され得る。
[0185]シンタックス要素slice_typeは、スライスを含むピクチャがIDRピクチャ、CRAピクチャ、またはBLAピクチャであることをNALユニットタイプが示すか否かに基づいて、条件付きでスライスヘッダ内に存在し得る。たとえば、スライスを含むピクチャがIDRピクチャ、CRAピクチャ、またはBLAピクチャであることをNALユニットタイプが示す場合、slice_typeはスライスヘッダ内に存在しない。そうでない場合、エンコーダはslice_typeをスライスヘッダに挿入する。存在しないとき、slice_typeの値は、スライスがIスライスであることを示す。
[0186]図9は、本開示で説明される1つまたは複数の例による、スライスを復号するための例示的な方法を示す流れ図である。一例では、ビデオデコーダ30は、ビデオデータを復号し得、これは、ビデオデータのシーケンスの、復号されるべき現在のピクチャのスライスを受信することを含む(900)。ビデオデコーダ30は、スライスのスライスヘッダ内で、少なくとも1つのエントロピーコード化シンタックス要素、および、少なくとも1つの非エントロピーコード化シンタックス要素を受信し得る。非エントロピーコード化シンタックス要素は、スライスヘッダ内でエントロピーコード化シンタックス要素の前にあり得る。加えて、非エントロピーコード化シンタックス要素は、復号順序において現在のピクチャの前にくるピクチャが、出力されることなくピクチャ記憶バッファから空にされるべきであるか否かを示し得る(902)。一例では、シンタックス要素はno_output_of_prior_pics_flagであってもよい。no_output_of_prior_pics_flagは、たとえば、復号順序において現在のピクチャの前にくるピクチャが、出力されることなくピクチャ記憶バッファから空にされるべきである場合を示すために、「1」に設定され得る。ビデオデコーダ30は、非エントロピーコード化シンタックス要素に基づいてスライスを復号し得る(904)。
[0187]図10は、本開示で説明される1つまたは複数の例による、スライスを符号化するための例示的な方法を示す流れ図である。エンコーダ20は、ビデオデータを符号化し得る。ビデオエンコーダ20は、ビデオデータのシーケンスの、現在のピクチャのスライスを符号化し得る(1000)。
[0188]ビデオエンコーダ20は、スライスのスライスヘッダ中で、少なくとも1つのエントロピー符号化シンタックス要素と少なくとも1つの非エントロピーコード化シンタックス要素とを符号化し、ここで、非エントロピー符号化シンタックス要素は、スライスヘッダ中でエントロピー符号化シンタックス要素の前にあり、復号順序において現在のピクチャより前のピクチャが出力されることなくピクチャ記憶バッファから空にされるべきか否かを示す(1002)。一例では、シンタックス要素はno_output_of_prior_pics_flagであってもよい。no_output_of_prior_pics_flagは、たとえば、復号順序において現在のピクチャの前にくるピクチャが、出力されることなくピクチャ記憶バッファから空にされるべきである場合を示すために、「1」に設定され得る。
[0189]1つまたは複数の例では、説明された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアにおいて実装される場合、機能は、1つもしくは複数の命令もしくはコードとしてコンピュータ可読媒体上に記憶されるか、またはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、たとえば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含む、データ記憶媒体または通信媒体のような有形媒体に対応するコンピュータ可読記憶媒体を含み得る。このようにして、コンピュータ可読媒体は、全般に、(1)非一時的である有形コンピュータ可読記憶媒体、または(2)信号もしくは搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明した技法の実装のための命令、コードおよび/またはデータ構造を取り出すために1つもしくは複数のコンピュータまたは1つもしくは複数のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品は、コンピュータ可読媒体を含んでもよい。
[0190]さらに他の例では、本開示は、その上に記憶されたデータ構造を備えるコンピュータ可読媒体を企図し、データ構造は本開示に一致する符号化ビットストリームを含む。特に、データ構造は、本明細書において説明されているNALユニット設計を含み得る。
[0191]限定ではなく例として、そのようなコンピュータ可読記憶媒体は、RAM、ROM、EEPROM(登録商標)、CD−ROMもしくは他の光ディスクストレージ、磁気ディスクストレージ、もしくは他の磁気ストレージデバイス、フラッシュメモリ、または、命令またはデータ構造の形態の所望のプログラムコードを記憶するために使用されコンピュータによってアクセスされ得る、任意の他の媒体を備え得る。同様に、いかなる接続も適切にコンピュータ可読媒体と称される。たとえば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線、無線、およびマイクロ波のようなワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、DSL、または赤外線、無線、およびマイクロ波のようなワイヤレス技術は、媒体の定義に含まれる。ただし、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時媒体を含まないが、代わりに非一時的有形記憶媒体を対象とすることを理解されたい。本明細書で使用するディスク(disk)およびディスク(disc)は、コンパクトディスク(disc)(CD)、レーザーディスク(登録商標)(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)およびブルーレイディスク(disc)を含み、ディスク(disk)は、通常、データを磁気的に再生し、ディスク(disc)は、データをレーザーで光学的に再生する。上記の組合せも、コンピュータ可読媒体の範囲内に含まれるべきである。
[0192]命令は、1つまたは複数のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブルロジックアレイ(FPGA)または他の等しい統合されているか個別の論理回路など1つまたは複数のプロセッサによって実行され得る。したがって、本明細書で使用される場合、「プロセッサ」という用語は、前述の構造、または本明細書で説明される技法の実装に好適な任意の他の構造のいずれかを指し得る。さらに、一部の態様では、本明細書で説明された機能は、符号化および復号のために構成された専用のハードウェアおよび/もしくはソフトウェアモジュール内に与えられてよく、または複合コーデックに組み込まれてよい。また、本技法は、1つまたは複数の回路または論理要素中で完全に実装され得る。
[0193]本開示の技法は、ワイヤレスハンドセット、集積回路(IC)またはICのセット(たとえば、チップセット)を含む、多種多様なデバイスまたは装置において実装され得る。本開示では、開示される技法を実行するように構成されたデバイスの機能的態様を強調するために、様々なコンポーネント、モジュール、またはユニットが説明されたが、それらのコンポーネント、モジュール、またはユニットは、必ずしも異なるハードウェアユニットによる実現を必要とするとは限らない。むしろ、上で説明されたように、様々なユニットが、好適なソフトウェアおよび/またはファームウェアとともに、上で説明された1つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わせられてよく、または相互動作するハードウェアユニットの集合によって与えられてよい。
[0194]様々な例が説明された。これらおよび他の例は添付の特許請求の範囲内に入る。
[0194]様々な例が説明された。これらおよび他の例は添付の特許請求の範囲内に入る。
以下に本願出願当初の特許請求の範囲を付記する。
[C1] ビデオデータを復号する方法であって、
現在のピクチャがリンク破損アクセス(BLA)ピクチャであると判定することと、
ピクチャ記憶バッファ中の参照ピクチャを、前記BLAピクチャを復号する前に参照のために使用されないものとしてマーキングすることと
を備える方法。
[C2] 現在のピクチャがBLAピクチャであると判定することが、前記現在のピクチャがクリーンランダムアクセス(CRA)ピクチャであると判定し、前記現在のピクチャがランダムアクセスピクチャ(RAP)であると判定することをさらに備える、C1に記載の方法。
[C3] 前記現在のピクチャがBLAピクチャであると判定することが、前記現在のピクチャのネットワーク抽象化層(NAL)ユニットタイプに基づく、C1に記載の方法。
[C4] 前記先行ピクチャが復号可能でない先行ピクチャを備えるときに前記ピクチャ記憶バッファ中の前記参照ピクチャをマーキングすることをさらに備える、C1に記載の方法。
[C5] 前記ピクチャ記憶バッファが復号ピクチャバッファ(DPB)を含む、C1に記載の方法。
[C6] 前記BLAピクチャを復号することが、デコーダにおいて前記BLAピクチャを復号することを備える、C1に記載の方法。
[C7] 前記BLAピクチャを復号することが、ネットワーク要素において前記BLAピクチャを復号することを備える、C1に記載の方法。
[C8] 前記ネットワーク要素がメディアアウェアネットワーク要素(MANE)である、C7に記載の方法。
[C9] 前記ネットワーク要素がストリーミングサーバである、C7に記載の方法。
[C10] 前記ネットワーク要素がスプライサである、C7に記載の方法。
[C11] 参照のために使用されないものとしてマーキングされた前記前にあるピクチャを使用することなく、前記BLAピクチャを復号することをさらに備える、C1に記載の方法。
[C12] ビデオデータのシーケンスの、復号されるべき現在のピクチャのスライスを受信することと、
前記スライスのスライスヘッダ中で、少なくとも1つのエントロピーコード化シンタックス要素と少なくとも1つの非エントロピーコード化シンタックス要素とを受信することであって、前記非エントロピーコード化シンタックス要素が前記スライスヘッダ中で前記エントロピーコード化シンタックス要素の前にあり、復号順序において前記現在のピクチャより前のピクチャが、出力されることなく、復号ピクチャバッファから空にされるべきか否かを示すことと、
前記非エントロピーコード化シンタックス要素に基づいて前記スライスを復号することと
をさらに備える、C1に記載の方法。
[C13] 前記非エントロピーコード化シンタックス要素がno_output_of_prior_pics_flagを備える、C12に記載の方法。
[C14] ビデオデータを復号するためのデバイスであって、
現在のピクチャがリンク破損アクセス(BLA)ピクチャであると判定することと、
ピクチャ記憶バッファ中の参照ピクチャを、前記BLAピクチャを復号する前に参照のために使用されないものとしてマーキングすることと
を行うように構成された1つまたは複数のプロセッサを備えるデバイス。
[C15] 前記1つまたは複数のプロセッサが、前記現在のピクチャがクリーンランダムアクセス(CRA)ピクチャであり、前記現在のピクチャがランダムアクセスピクチャ(RAP)である場合、現在のピクチャがBLAピクチャであると判定するように構成される、C14に記載のデバイス。
[C16] 前記1つまたは複数のプロセッサが、前記現在のピクチャのネットワーク抽象化層(NAL)ユニットタイプに基づいて、前記現在のピクチャがBLAピクチャであると判定するように構成される、C14に記載のデバイス。
[C17] 前記1つまたは複数のプロセッサが、前記先行ピクチャが復号可能でない先行ピクチャを備えるときに前記参照ピクチャをマーキングするように構成される、C14に記載のデバイス。
[C18] 前記ピクチャ記憶バッファをさらに備え、前記ピクチャ記憶バッファが復号ピクチャバッファ(DPB)を含む、C14に記載のデバイス。
[C19] 前記デバイスがデコーダを備える、C18に記載のデバイス。
[C20] 前記デバイスがネットワーク要素を備える、C18に記載のデバイス。
[C21] 前記ネットワーク要素がメディアアウェアネットワーク要素(MANE)を備える、C20に記載のデバイス。
[C22] 前記ネットワーク要素がストリーミングサーバを備える、C20に記載のデバイス。
[C23] 前記ネットワーク要素がスプライサを備える、C20に記載のデバイス。
[C24] 前記プロセッサが、参照のために使用されないものとしてマーキングされた前記前にあるピクチャを使用することなく、前記BLAピクチャを復号するようにさらに構成される、C14に記載のデバイス。
[C25] 前記プロセッサが、
ビデオデータのシーケンスの、復号されるべき現在のピクチャのスライスを受信することと、
前記スライスのスライスヘッダ中で、少なくとも1つのエントロピーコード化シンタックス要素と少なくとも1つの非エントロピーコード化シンタックス要素とを受信することであって、前記非エントロピーコード化シンタックス要素が前記スライスヘッダ中で前記エントロピーコード化シンタックス要素の前にあり、復号順序において前記現在のピクチャより前のピクチャが、出力されることなく、復号ピクチャバッファから空にされるべきか否かを示すことと、
前記非エントロピーコード化シンタックス要素に基づいて前記スライスを復号することと
を行うようにさらに構成される、C14に記載のデバイス。
[C26] 前記非エントロピーコード化シンタックス要素がno_output_of_prior_pics_flagを備える、C25に記載のデバイス。
[C27] ビデオデータを復号するためのデバイスであって、
現在のピクチャがリンク破損アクセス(BLA)ピクチャであると判定するための手段と、
ピクチャ記憶バッファ中の参照ピクチャを、前記BLAピクチャを復号する前に参照のために使用されないものとしてマーキングするための手段と
を備えるデバイス。
[C28] 現在のピクチャがBLAピクチャであると判定するための前記手段が、前記現在のピクチャがクリーンランダムアクセス(CRA)ピクチャであると判定し、前記現在のピクチャがランダムアクセスピクチャ(RAP)であると判定するための手段をさらに備える、C27に記載のデバイス。
[C29] 前記現在のピクチャがBLAピクチャを備えると判定するための前記手段が、ネットワーク抽象化層(NAL)ユニットタイプに基づいて、前記現在のピクチャがBLAピクチャを備えると判定するための手段を含む、C27に記載のデバイス。
[C30] 前記参照ピクチャをマーキングするための前記手段が、前記先行ピクチャが復号可能でない先行ピクチャを備えるときに前記参照ピクチャをマーキングするための手段を備える、C27に記載のデバイス。
[C31] 前記ピクチャ記憶バッファをさらに備え、前記ピクチャ記憶バッファが復号ピクチャバッファ(DPB)を備える、C27に記載のデバイス。
[C32] 実行されると、
現在のピクチャがリンク破損アクセス(BLA)ピクチャであると判定することと、
参照ピクチャを、前記BLAピクチャを復号する前に参照のために使用されないものとしてマーキングすることと
をデバイスの1つまたは複数のプロセッサに行わせる命令を記憶したコンピュータ可読記憶媒体。
[C33] 現在のピクチャがBLAピクチャであると判定することを1つまたは複数のプロセッサに行わせる前記命令が、前記現在のピクチャがクリーンランダムアクセス(CRA)ピクチャであり、前記現在のピクチャがランダムアクセスピクチャ(RAP)であると判定したことに基づいて、現在のピクチャがBLAピクチャであると判定することを前記1つまたは複数のプロセッサに行わせる命令をさらに備える、C32に記載のコンピュータ可読記憶媒体。
[C34] ネットワーク抽象化層(NAL)ユニットタイプに基づいて、前記現在のピクチャがBLAピクチャであると判定することを前記1つまたは複数のプロセッサに行わせる命令をさらに備える、C32に記載のコンピュータ可読記憶媒体。
[C35] 前記先行ピクチャが復号可能でない先行ピクチャを備えるときに前記参照ピクチャをマーキングすることを前記1つまたは複数のプロセッサに行わせる命令をさらに備える、C32に記載のコンピュータ可読記憶媒体。
[C36] 復号ピクチャバッファ(DPB)の一部を形成するピクチャ記憶バッファにメモリの一部分を割り振ることを前記1つまたは複数のプロセッサに行わせる命令をさらに備える、C32に記載のコンピュータ可読記憶媒体。
[C37] デコーダに前記BLAピクチャを復号させることを前記1つまたは複数のプロセッサに行わせる命令をさらに備える、C32に記載のコンピュータ可読記憶媒体。
[C38] ネットワーク要素に前記BLAピクチャを復号させることを前記1つまたは複数のプロセッサに行わせる命令をさらに備える、C32に記載のコンピュータ可読記憶媒体。

Claims (38)

  1. ビデオデータを復号する方法であって、
    現在のピクチャがリンク破損アクセス(BLA)ピクチャであると判定することと、
    ピクチャ記憶バッファ中の参照ピクチャを、前記BLAピクチャを復号する前に参照のために使用されないものとしてマーキングすることと
    を備える方法。
  2. 現在のピクチャがBLAピクチャであると判定することが、前記現在のピクチャがクリーンランダムアクセス(CRA)ピクチャであると判定し、前記現在のピクチャがランダムアクセスピクチャ(RAP)であると判定することをさらに備える、請求項1に記載の方法。
  3. 前記現在のピクチャがBLAピクチャであると判定することが、前記現在のピクチャのネットワーク抽象化層(NAL)ユニットタイプに基づく、請求項1に記載の方法。
  4. 前記先行ピクチャが復号可能でない先行ピクチャを備えるときに前記ピクチャ記憶バッファ中の前記参照ピクチャをマーキングすることをさらに備える、請求項1に記載の方法。
  5. 前記ピクチャ記憶バッファが復号ピクチャバッファ(DPB)を含む、請求項1に記載の方法。
  6. 前記BLAピクチャを復号することが、デコーダにおいて前記BLAピクチャを復号することを備える、請求項1に記載の方法。
  7. 前記BLAピクチャを復号することが、ネットワーク要素において前記BLAピクチャを復号することを備える、請求項1に記載の方法。
  8. 前記ネットワーク要素がメディアアウェアネットワーク要素(MANE)である、請求項7に記載の方法。
  9. 前記ネットワーク要素がストリーミングサーバである、請求項7に記載の方法。
  10. 前記ネットワーク要素がスプライサである、請求項7に記載の方法。
  11. 参照のために使用されないものとしてマーキングされた前記前にあるピクチャを使用することなく、前記BLAピクチャを復号することをさらに備える、請求項1に記載の方法。
  12. ビデオデータのシーケンスの、復号されるべき現在のピクチャのスライスを受信することと、
    前記スライスのスライスヘッダ中で、少なくとも1つのエントロピーコード化シンタックス要素と少なくとも1つの非エントロピーコード化シンタックス要素とを受信することであって、前記非エントロピーコード化シンタックス要素が前記スライスヘッダ中で前記エントロピーコード化シンタックス要素の前にあり、復号順序において前記現在のピクチャより前のピクチャが、出力されることなく、復号ピクチャバッファから空にされるべきか否かを示すことと、
    前記非エントロピーコード化シンタックス要素に基づいて前記スライスを復号することと
    をさらに備える、請求項1に記載の方法。
  13. 前記非エントロピーコード化シンタックス要素がno_output_of_prior_pics_flagを備える、請求項12に記載の方法。
  14. ビデオデータを復号するためのデバイスであって、
    現在のピクチャがリンク破損アクセス(BLA)ピクチャであると判定することと、
    ピクチャ記憶バッファ中の参照ピクチャを、前記BLAピクチャを復号する前に参照のために使用されないものとしてマーキングすることと
    を行うように構成された1つまたは複数のプロセッサを備えるデバイス。
  15. 前記1つまたは複数のプロセッサが、前記現在のピクチャがクリーンランダムアクセス(CRA)ピクチャであり、前記現在のピクチャがランダムアクセスピクチャ(RAP)である場合、現在のピクチャがBLAピクチャであると判定するように構成される、請求項14に記載のデバイス。
  16. 前記1つまたは複数のプロセッサが、前記現在のピクチャのネットワーク抽象化層(NAL)ユニットタイプに基づいて、前記現在のピクチャがBLAピクチャであると判定するように構成される、請求項14に記載のデバイス。
  17. 前記1つまたは複数のプロセッサが、前記先行ピクチャが復号可能でない先行ピクチャを備えるときに前記参照ピクチャをマーキングするように構成される、請求項14に記載のデバイス。
  18. 前記ピクチャ記憶バッファをさらに備え、前記ピクチャ記憶バッファが復号ピクチャバッファ(DPB)を含む、請求項14に記載のデバイス。
  19. 前記デバイスがデコーダを備える、請求項18に記載のデバイス。
  20. 前記デバイスがネットワーク要素を備える、請求項18に記載のデバイス。
  21. 前記ネットワーク要素がメディアアウェアネットワーク要素(MANE)を備える、請求項20に記載のデバイス。
  22. 前記ネットワーク要素がストリーミングサーバを備える、請求項20に記載のデバイス。
  23. 前記ネットワーク要素がスプライサを備える、請求項20に記載のデバイス。
  24. 前記プロセッサが、参照のために使用されないものとしてマーキングされた前記前にあるピクチャを使用することなく、前記BLAピクチャを復号するようにさらに構成される、請求項14に記載のデバイス。
  25. 前記プロセッサが、
    ビデオデータのシーケンスの、復号されるべき現在のピクチャのスライスを受信することと、
    前記スライスのスライスヘッダ中で、少なくとも1つのエントロピーコード化シンタックス要素と少なくとも1つの非エントロピーコード化シンタックス要素とを受信することであって、前記非エントロピーコード化シンタックス要素が前記スライスヘッダ中で前記エントロピーコード化シンタックス要素の前にあり、復号順序において前記現在のピクチャより前のピクチャが、出力されることなく、復号ピクチャバッファから空にされるべきか否かを示すことと、
    前記非エントロピーコード化シンタックス要素に基づいて前記スライスを復号することと
    を行うようにさらに構成される、請求項14に記載のデバイス。
  26. 前記非エントロピーコード化シンタックス要素がno_output_of_prior_pics_flagを備える、請求項25に記載のデバイス。
  27. ビデオデータを復号するためのデバイスであって、
    現在のピクチャがリンク破損アクセス(BLA)ピクチャであると判定するための手段と、
    ピクチャ記憶バッファ中の参照ピクチャを、前記BLAピクチャを復号する前に参照のために使用されないものとしてマーキングするための手段と
    を備えるデバイス。
  28. 現在のピクチャがBLAピクチャであると判定するための前記手段が、前記現在のピクチャがクリーンランダムアクセス(CRA)ピクチャであると判定し、前記現在のピクチャがランダムアクセスピクチャ(RAP)であると判定するための手段をさらに備える、請求項27に記載のデバイス。
  29. 前記現在のピクチャがBLAピクチャを備えると判定するための前記手段が、ネットワーク抽象化層(NAL)ユニットタイプに基づいて、前記現在のピクチャがBLAピクチャを備えると判定するための手段を含む、請求項27に記載のデバイス。
  30. 前記参照ピクチャをマーキングするための前記手段が、前記先行ピクチャが復号可能でない先行ピクチャを備えるときに前記参照ピクチャをマーキングするための手段を備える、請求項27に記載のデバイス。
  31. 前記ピクチャ記憶バッファをさらに備え、前記ピクチャ記憶バッファが復号ピクチャバッファ(DPB)を備える、請求項27に記載のデバイス。
  32. 実行されると、
    現在のピクチャがリンク破損アクセス(BLA)ピクチャであると判定することと、
    参照ピクチャを、前記BLAピクチャを復号する前に参照のために使用されないものとしてマーキングすることと
    をデバイスの1つまたは複数のプロセッサに行わせる命令を記憶したコンピュータ可読記憶媒体。
  33. 現在のピクチャがBLAピクチャであると判定することを1つまたは複数のプロセッサに行わせる前記命令が、前記現在のピクチャがクリーンランダムアクセス(CRA)ピクチャであり、前記現在のピクチャがランダムアクセスピクチャ(RAP)であると判定したことに基づいて、現在のピクチャがBLAピクチャであると判定することを前記1つまたは複数のプロセッサに行わせる命令をさらに備える、請求項32に記載のコンピュータ可読記憶媒体。
  34. ネットワーク抽象化層(NAL)ユニットタイプに基づいて、前記現在のピクチャがBLAピクチャであると判定することを前記1つまたは複数のプロセッサに行わせる命令をさらに備える、請求項32に記載のコンピュータ可読記憶媒体。
  35. 前記先行ピクチャが復号可能でない先行ピクチャを備えるときに前記参照ピクチャをマーキングすることを前記1つまたは複数のプロセッサに行わせる命令をさらに備える、請求項32に記載のコンピュータ可読記憶媒体。
  36. 復号ピクチャバッファ(DPB)の一部を形成するピクチャ記憶バッファにメモリの一部分を割り振ることを前記1つまたは複数のプロセッサに行わせる命令をさらに備える、請求項32に記載のコンピュータ可読記憶媒体。
  37. デコーダに前記BLAピクチャを復号させることを前記1つまたは複数のプロセッサに行わせる命令をさらに備える、請求項32に記載のコンピュータ可読記憶媒体。
  38. ネットワーク要素に前記BLAピクチャを復号させることを前記1つまたは複数のプロセッサに行わせる命令をさらに備える、請求項32に記載のコンピュータ可読記憶媒体。
JP2015507061A 2012-04-20 2013-04-11 リンク破損ピクチャを有するビデオシーケンス中の参照ピクチャのマーキング Active JP6664959B2 (ja)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US201261636566P 2012-04-20 2012-04-20
US61/636,566 2012-04-20
US201261643100P 2012-05-04 2012-05-04
US61/643,100 2012-05-04
US201261667371P 2012-07-02 2012-07-02
US61/667,371 2012-07-02
US13/796,828 US10051264B2 (en) 2012-04-20 2013-03-12 Marking reference pictures in video sequences having broken link pictures
US13/796,828 2013-03-12
US13/797,458 US9979959B2 (en) 2012-04-20 2013-03-12 Video coding with enhanced support for stream adaptation and splicing
US13/797,458 2013-03-12
PCT/US2013/036225 WO2013158462A1 (en) 2012-04-20 2013-04-11 Marking reference pictures in video sequences having broken link pictures

Publications (3)

Publication Number Publication Date
JP2015517279A true JP2015517279A (ja) 2015-06-18
JP2015517279A5 JP2015517279A5 (ja) 2016-05-12
JP6664959B2 JP6664959B2 (ja) 2020-03-13

Family

ID=49380095

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2015507047A Active JP6284924B2 (ja) 2012-04-20 2013-04-09 ストリーム適応およびスプライシングに対するサポートが強化されたビデオコーディング
JP2015507061A Active JP6664959B2 (ja) 2012-04-20 2013-04-11 リンク破損ピクチャを有するビデオシーケンス中の参照ピクチャのマーキング
JP2015507060A Active JP6234997B2 (ja) 2012-04-20 2013-04-11 ビデオシーケンスにおけるランダムアクセスポイントピクチャのための復号ピクチャバッファ処理

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2015507047A Active JP6284924B2 (ja) 2012-04-20 2013-04-09 ストリーム適応およびスプライシングに対するサポートが強化されたビデオコーディング

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2015507060A Active JP6234997B2 (ja) 2012-04-20 2013-04-11 ビデオシーケンスにおけるランダムアクセスポイントピクチャのための復号ピクチャバッファ処理

Country Status (24)

Country Link
US (3) US10051264B2 (ja)
EP (3) EP2839642B1 (ja)
JP (3) JP6284924B2 (ja)
KR (3) KR102061378B1 (ja)
CN (3) CN104272745B (ja)
AU (2) AU2013249666B2 (ja)
BR (2) BR112014026026B1 (ja)
CA (2) CA2868521C (ja)
DK (3) DK2839642T3 (ja)
ES (3) ES2750175T3 (ja)
HK (2) HK1201113A1 (ja)
HU (3) HUE045842T2 (ja)
IL (2) IL234836B (ja)
MY (2) MY168214A (ja)
PH (2) PH12014502202B1 (ja)
PL (1) PL2839643T3 (ja)
PT (2) PT2839643T (ja)
RU (2) RU2630173C2 (ja)
SG (4) SG10201608770QA (ja)
SI (3) SI2839642T1 (ja)
TR (1) TR201815255T4 (ja)
UA (2) UA116775C2 (ja)
WO (3) WO2013158415A1 (ja)
ZA (1) ZA201408512B (ja)

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2595562C2 (ru) 2011-06-30 2016-08-27 Телефонактиеболагет Л М Эрикссон (Пабл) Сигнализация опорных изображений
US20130272619A1 (en) * 2012-04-13 2013-10-17 Sharp Laboratories Of America, Inc. Devices for identifying a leading picture
US9351016B2 (en) 2012-04-13 2016-05-24 Sharp Kabushiki Kaisha Devices for identifying a leading picture
US10051264B2 (en) 2012-04-20 2018-08-14 Qualcomm Incorporated Marking reference pictures in video sequences having broken link pictures
US10491913B2 (en) * 2012-04-24 2019-11-26 Telefonaktiebolaget L M Ericsson (Publ) Identifying a parameter set for decoding a multi-layer video representation
PL3471419T3 (pl) * 2012-06-25 2023-07-17 Huawei Technologies Co., Ltd. Obrazy stopniowego dostępu do warstwy czasowej w kompresji wideo
JP6045222B2 (ja) * 2012-06-28 2016-12-14 株式会社Nttドコモ 動画像予測復号装置、方法及びプログラム
US9479776B2 (en) 2012-07-02 2016-10-25 Qualcomm Incorporated Signaling of long-term reference pictures for video coding
JP2015526016A (ja) * 2012-07-03 2015-09-07 サムスン エレクトロニクス カンパニー リミテッド 時間的スケーラビリティを有するビデオ符号化方法及びその装置、並びに時間的スケーラビリティを有するビデオ復号化方法及びその装置
JP6319083B2 (ja) 2012-07-10 2018-05-09 ソニー株式会社 画像復号装置、画像復号方法、画像符号化装置及び画像符号化方法
JP2014039252A (ja) * 2012-08-10 2014-02-27 Panasonic Corp 画像復号方法および画像復号装置
US9992490B2 (en) * 2012-09-26 2018-06-05 Sony Corporation Video parameter set (VPS) syntax re-ordering for easy access of extension parameters
KR20140043239A (ko) * 2012-09-27 2014-04-08 한국전자통신연구원 계층간 전환을 이용한 영상 부호화/복호화 방법 및 그 장치
JP6094126B2 (ja) * 2012-10-01 2017-03-15 富士通株式会社 動画像復号装置
US10419778B2 (en) 2013-01-04 2019-09-17 Sony Corporation JCTVC-L0227: VPS_extension with updates of profile-tier-level syntax structure
US10219006B2 (en) 2013-01-04 2019-02-26 Sony Corporation JCTVC-L0226: VPS and VPS_extension updates
US9807421B2 (en) * 2013-04-05 2017-10-31 Sharp Kabushiki Kaisha NAL unit type restrictions
EP3061233B1 (en) 2013-10-25 2019-12-11 Microsoft Technology Licensing, LLC Representing blocks with hash values in video and image coding and decoding
KR20160075705A (ko) 2013-10-25 2016-06-29 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 비디오 및 이미지 코딩에서의 해시 기반 블록 매칭
US10136145B2 (en) 2014-01-03 2018-11-20 Samsung Electronics Co., Ltd. Method and apparatus for managing buffer for encoding and decoding multi-layer video
US20150195549A1 (en) * 2014-01-08 2015-07-09 Qualcomm Incorporated Support of non-hevc base layer in hevc multi-layer extensions
EP3104614A4 (en) * 2014-02-03 2017-09-13 Mitsubishi Electric Corporation Image encoding device, image decoding device, encoded stream conversion device, image encoding method, and image decoding method
US10368092B2 (en) 2014-03-04 2019-07-30 Microsoft Technology Licensing, Llc Encoder-side decisions for block flipping and skip mode in intra block copy prediction
CN105393537B (zh) * 2014-03-04 2019-08-27 微软技术许可有限责任公司 用于基于散列的块匹配的散列表构建和可用性检查
EP3598758B1 (en) * 2014-06-23 2021-02-17 Microsoft Technology Licensing, LLC Encoder decisions based on results of hash-based block matching
CN115665423A (zh) 2014-09-30 2023-01-31 微软技术许可有限责任公司 用于视频编码的基于散列的编码器判定
WO2016066093A1 (en) 2014-10-31 2016-05-06 Mediatek Inc. Method of improved directional intra prediction for video coding
CN107409220B (zh) 2015-01-29 2020-07-24 Vid拓展公司 块内拷贝搜索
US10798432B2 (en) * 2015-02-05 2020-10-06 Cisco Technology, Inc. Method and system for processing HEVC coded video in broadcast and streaming applications
WO2016133440A1 (en) * 2015-02-19 2016-08-25 Telefonaktiebolaget Lm Ericsson (Publ) Methods, encoder and decoder for coding of video sequences
CN104768011B (zh) 2015-03-31 2018-03-06 浙江大学 图像编解码方法和相关装置
US10148983B2 (en) * 2015-09-25 2018-12-04 Qualcomm Incorporated Methods and systems of improved video stream switching and random access
US20170105004A1 (en) * 2015-10-07 2017-04-13 Qualcomm Incorporated Methods and systems of coding a predictive random access picture using a background picture
US10063861B2 (en) * 2015-10-07 2018-08-28 Qualcomm Incorporated Methods and systems of performing predictive random access using a background picture
US10097608B2 (en) * 2015-12-26 2018-10-09 Intel Corporation Technologies for wireless transmission of digital media
US10356800B2 (en) * 2016-05-09 2019-07-16 Qualcomm Incorporated Scalable numerology with symbol boundary alignment for uniform and non-uniform symbol duration in wireless communication
US10390039B2 (en) 2016-08-31 2019-08-20 Microsoft Technology Licensing, Llc Motion estimation for screen remoting scenarios
US11095877B2 (en) 2016-11-30 2021-08-17 Microsoft Technology Licensing, Llc Local hash-based motion estimation for screen remoting scenarios
GB2594615B (en) * 2017-03-20 2022-11-30 Canon Kk Method and apparatus for encoding and transmitting at least a spatial part of a video sequence
CN107194961B (zh) * 2017-05-19 2020-09-22 西安电子科技大学 群体图像编码中多参考图像的确定方法
WO2019191890A1 (zh) * 2018-04-02 2019-10-10 深圳市大疆创新科技有限公司 用于图像处理的方法和图像处理装置
EP3777455B1 (en) 2018-04-05 2021-10-27 Telefonaktiebolaget LM Ericsson (publ) Multi-stage sidelink control information
CN110401622B (zh) * 2018-04-25 2022-04-29 中国移动通信有限公司研究院 一种语音质量评估方法、装置、电子设备和存储介质
CN109739667B (zh) * 2019-01-10 2021-04-02 广州方硅信息技术有限公司 一种消息的消费方法、装置及设备
WO2020171230A1 (en) * 2019-02-24 2020-08-27 Sharp Kabushiki Kaisha Systems and methods for signaling types of pictures and associated information in video coding
CN114026863A (zh) * 2019-06-24 2022-02-08 交互数字Vc控股公司 使用高级语法元素发信号通知解码数据的方法和装置
CN110446047A (zh) * 2019-08-16 2019-11-12 苏州浪潮智能科技有限公司 视频码流的解码方法及装置
EP4058935A4 (en) 2019-12-26 2023-01-18 ByteDance Inc. TECHNIQUES FOR IMPLEMENTING A DECODE ORDER IN AN ENCODED IMAGE
WO2021188796A1 (en) 2020-03-20 2021-09-23 Bytedance Inc. Use of subpicture information in video coding
BR112022021342A2 (pt) * 2020-04-20 2022-12-13 Bytedance Inc Método de processamento de vídeo, aparelho para processamento de dados de vídeo, meios de armazenamento e de gravação não transitórios legíveis por computador
US11202085B1 (en) 2020-06-12 2021-12-14 Microsoft Technology Licensing, Llc Low-cost hash table construction and hash-based block matching for variable-size blocks
US11962936B2 (en) * 2020-09-29 2024-04-16 Lemon Inc. Syntax for dependent random access point indication in video bitstreams
WO2024030279A1 (en) * 2022-08-01 2024-02-08 Innopeak Technology, Inc. Encoding method, decoding method, encoder and decoder

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001069515A (ja) * 1998-01-23 2001-03-16 Matsushita Electric Ind Co Ltd 画像伝送方法
JP2007214814A (ja) * 2006-02-08 2007-08-23 Sony Corp 復号化方法、復号化プログラムおよび復号化装置

Family Cites Families (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US62009A (en) * 1867-02-12 Charles t
JP3358835B2 (ja) 1992-12-14 2002-12-24 ソニー株式会社 画像符号化方法及び装置
US5515107A (en) 1994-03-30 1996-05-07 Sigma Designs, Incorporated Method of encoding a stream of motion picture data
KR100557103B1 (ko) 1997-03-17 2006-03-03 마츠시타 덴끼 산교 가부시키가이샤 데이터 처리방법 및 데이터 처리장치
CA2273940C (en) 1997-10-03 2008-12-09 Sony Corporation Encoded stream splicing device and method, and an encoded stream generating device and method
JPH11177921A (ja) 1997-12-11 1999-07-02 Sony Corp ディジタルデータ編集方法、ディジタルデータ編集装置
ES2569491T3 (es) * 1999-02-09 2016-05-11 Sony Corporation Sistema de codificación y método asociado
KR100959573B1 (ko) 2002-01-23 2010-05-27 노키아 코포레이션 비디오 코딩시 이미지 프레임들의 그루핑
WO2004008733A2 (en) 2002-07-15 2004-01-22 Nokia Corporation Method for error concealment in video sequences
US7953194B2 (en) * 2002-09-27 2011-05-31 Broadcom Corporation Handling video transition errors in video on demand streams
JP3513148B1 (ja) 2002-10-11 2004-03-31 株式会社エヌ・ティ・ティ・ドコモ 動画像符号化方法、動画像復号方法、動画像符号化装置、動画像復号装置、動画像符号化プログラム、及び動画像復号プログラム
KR20050090377A (ko) 2003-01-20 2005-09-13 마쯔시다덴기산교 가부시키가이샤 화상 부호화 방법
US8194751B2 (en) 2003-02-19 2012-06-05 Panasonic Corporation Moving picture coding method and moving picture decoding method
ES2379265T3 (es) 2003-03-03 2012-04-24 Panasonic Corporation Procedimiento de decodificación de videos
US7724818B2 (en) 2003-04-30 2010-05-25 Nokia Corporation Method for coding sequences of pictures
EP1496707A1 (en) 2003-07-09 2005-01-12 Matsushita Electric Industrial Co., Ltd. Encoding and decoding of video images with delayed reference picture refresh
US7609762B2 (en) 2003-09-07 2009-10-27 Microsoft Corporation Signaling for entry point frames with predicted first field
US7924921B2 (en) 2003-09-07 2011-04-12 Microsoft Corporation Signaling coding and display options in entry point headers
US7466984B2 (en) 2004-02-19 2008-12-16 Research In Motion Limited Apparatus, and associated method, for improvement in facilitating routing of data by a mobile node operable in a packet radio communication system
CN1950907B (zh) 2004-04-28 2011-04-13 松下电器产业株式会社 运动画面流产生装置,运动画面编码装置,运动画面多路复用装置和运动画面解码装置
ES2405131T3 (es) 2004-06-02 2013-05-30 Panasonic Corporation Aparato de codificación de imagen y aparato de decodificación de imagen
JP4617773B2 (ja) 2004-08-23 2011-01-26 ソニー株式会社 記録装置および方法、再生装置および方法、記録媒体、並びにプログラム
JP4769717B2 (ja) 2005-01-17 2011-09-07 パナソニック株式会社 画像復号化方法
US20070030894A1 (en) 2005-08-03 2007-02-08 Nokia Corporation Method, device, and module for improved encoding mode control in video encoding
CN101326833B (zh) 2005-12-07 2012-11-14 汤姆森特许公司 利用参考帧选择规则进行视频错误隐藏的方法与装置
GB0600141D0 (en) * 2006-01-05 2006-02-15 British Broadcasting Corp Scalable coding of video signals
KR100966567B1 (ko) 2006-03-30 2010-06-29 엘지전자 주식회사 비디오 신호를 디코딩/인코딩하기 위한 방법 및 장치
JP2008010110A (ja) 2006-06-30 2008-01-17 Sony Corp ファイル分割装置、ファイル分割方法及びファイル分割プログラム
US8559510B2 (en) 2006-08-10 2013-10-15 Canon Kabushiki Kaisha Image decoding apparatus
MX2009003967A (es) 2006-10-16 2009-06-01 Nokia Corp Sistema y método para implementar una administración eficiente de memoria intermedia decodificada en codificación de video de vistas múltiples.
WO2008084443A1 (en) 2007-01-09 2008-07-17 Nokia Corporation System and method for implementing improved decoded picture buffer management for scalable video coding and multiview video coding
CN101257624B (zh) * 2007-02-27 2011-08-24 华为技术有限公司 实现随机访问的方法及解码器
US8958486B2 (en) 2007-07-31 2015-02-17 Cisco Technology, Inc. Simultaneous processing of media and redundancy streams for mitigating impairments
EP2048886A1 (en) 2007-10-11 2009-04-15 Panasonic Corporation Coding of adaptive interpolation filter coefficients
US8107754B2 (en) 2007-12-07 2012-01-31 Mediatek Inc. Systems and methods for randomly accessing compressed images
WO2010002420A1 (en) 2008-07-01 2010-01-07 Thomson Licensing Network abstraction layer (nal)-aware multiplexer
JP2010041354A (ja) 2008-08-05 2010-02-18 Victor Co Of Japan Ltd 動画像符号化方法、符号化装置及び符号化プログラム
US20100098156A1 (en) 2008-10-16 2010-04-22 Qualcomm Incorporated Weighted prediction based on vectorized entropy coding
CN102265617A (zh) 2008-12-26 2011-11-30 日本胜利株式会社 图像编码装置、图像编码方法及其程序、以及图像解码装置、图像解码方法及其程序
EP2413606B1 (en) 2009-03-26 2018-05-02 Sun Patent Trust Decoding method, decoding device
JP5227875B2 (ja) 2009-04-06 2013-07-03 株式会社日立製作所 動画像符号化装置
US20120106634A1 (en) 2009-04-21 2012-05-03 Lg Electronics Inc. Method and apparatus for processing multi-view video signal
US20110222837A1 (en) 2010-03-11 2011-09-15 Cisco Technology, Inc. Management of picture referencing in video streams for plural playback modes
WO2012011859A1 (en) 2010-07-21 2012-01-26 Telefonaktiebolaget L M Ericsson (Publ) Picture coding and decoding
US9706227B2 (en) * 2011-03-10 2017-07-11 Qualcomm Incorporated Video coding techniques for coding dependent pictures after random access
JP5341952B2 (ja) 2011-05-30 2013-11-13 株式会社東芝 ビデオサーバ及びデータ収録再生方法
RU2595562C2 (ru) 2011-06-30 2016-08-27 Телефонактиеболагет Л М Эрикссон (Пабл) Сигнализация опорных изображений
CN103765900B (zh) 2011-06-30 2016-12-21 瑞典爱立信有限公司 绝对或显式的参考画面信号通知
US20140169449A1 (en) 2011-07-05 2014-06-19 Telefonaktiebolaget L M Ericsson (Publ) Reference picture management for layered video
US9277228B2 (en) 2011-07-18 2016-03-01 Qualcomm Incorporated Adaptation parameter sets for video coding
KR20170005464A (ko) 2011-08-30 2017-01-13 노키아 테크놀로지스 오와이 비디오 코딩 및 디코딩을 위한 장치, 방법 및 컴퓨터 프로그램
WO2013030458A1 (en) 2011-08-31 2013-03-07 Nokia Corporation Multiview video coding and decoding
PL3094092T3 (pl) 2011-09-07 2018-11-30 Sun Patent Trust Sposób dekodowania obrazów i urządzenie do dekodowania obrazów
JP5932811B2 (ja) 2011-09-19 2016-06-08 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 画像復号方法、及び画像復号装置
US9936197B2 (en) 2011-10-28 2018-04-03 Samsung Electronics Co., Ltd. Method for inter prediction and device therefore, and method for motion compensation and device therefore
US10447990B2 (en) 2012-02-28 2019-10-15 Qualcomm Incorporated Network abstraction layer (NAL) unit header design for three-dimensional video coding
US9351016B2 (en) 2012-04-13 2016-05-24 Sharp Kabushiki Kaisha Devices for identifying a leading picture
US20130272619A1 (en) 2012-04-13 2013-10-17 Sharp Laboratories Of America, Inc. Devices for identifying a leading picture
US9532055B2 (en) 2012-04-16 2016-12-27 Microsoft Technology Licensing, Llc Constraints and unit types to simplify video random access
US10051264B2 (en) 2012-04-20 2018-08-14 Qualcomm Incorporated Marking reference pictures in video sequences having broken link pictures
US9319679B2 (en) 2012-06-07 2016-04-19 Qualcomm Incorporated Signaling data for long term reference pictures for video coding
US9332255B2 (en) 2012-06-28 2016-05-03 Qualcomm Incorporated Signaling long-term reference pictures for video coding
JP6190397B2 (ja) 2012-07-01 2017-08-30 シャープ株式会社 パラメータセットにおいて長期参照ピクチャをシグナリングするためのデバイス
US9479776B2 (en) 2012-07-02 2016-10-25 Qualcomm Incorporated Signaling of long-term reference pictures for video coding
US20140301477A1 (en) * 2013-04-07 2014-10-09 Sharp Laboratories Of America, Inc. Signaling dpb parameters in vps extension and dpb operation

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001069515A (ja) * 1998-01-23 2001-03-16 Matsushita Electric Ind Co Ltd 画像伝送方法
JP2007214814A (ja) * 2006-02-08 2007-08-23 Sony Corp 復号化方法、復号化プログラムおよび復号化装置

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
AKIRA FUJIBAYASHI(外1名): "Random access support for HEVC", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 JCTVC, JPN6017006083, 28 January 2011 (2011-01-28), US, pages 1 - 8 *
BENJAMIN BROSS(外4名): "High efficiency video coding (HEVC) text specification draft 6", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 JCTVC, JPN6017006078, 2 April 2012 (2012-04-02), US, pages p.1-7,34,54-55,74-75,90-98,220-224 *
GARY J. SULLIVAN: "CRA pictures with broken links", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 JCTVC, JPN6017006075, 17 April 2012 (2012-04-17), US, pages 1 - 2 *
HENDRY(外3名): "Random Access Detection and Notification", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 JCTVC, JPN6017006081, 30 November 2011 (2011-11-30), US, pages 1 - 6 *
JONATAN SAMUELSSON (外1名): "Temporal layer access pictures", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 JCTVC, JPN6017006077, 10 February 2012 (2012-02-10), US, pages 1 - 5 *
SACHIN DESHPANDE(外1名): "On Leading Pictures", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 JCTVC, JPN6017006080, 17 April 2012 (2012-04-17), US, pages 1 - 3 *

Also Published As

Publication number Publication date
BR112014026135B1 (pt) 2023-03-14
US9979958B2 (en) 2018-05-22
CN104272745B (zh) 2018-06-15
CA2868529A1 (en) 2013-10-24
SI2839642T1 (sl) 2019-09-30
SG10201608770QA (en) 2016-12-29
KR20150008136A (ko) 2015-01-21
ZA201408512B (en) 2019-09-25
IL234836B (en) 2018-11-29
CA2868529C (en) 2019-05-07
ES2750175T3 (es) 2020-03-25
MY168214A (en) 2018-10-15
CN104247430A (zh) 2014-12-24
UA116775C2 (uk) 2018-05-10
AU2013249666B2 (en) 2017-06-15
CA2868521A1 (en) 2013-10-24
SG10201608666QA (en) 2016-12-29
EP2839642A1 (en) 2015-02-25
PT2839644T (pt) 2018-12-04
PT2839643T (pt) 2018-12-19
HUE045842T2 (hu) 2020-01-28
HUE040542T2 (hu) 2019-03-28
DK2839643T3 (da) 2019-01-02
EP2839643A1 (en) 2015-02-25
WO2013158462A1 (en) 2013-10-24
UA115982C2 (uk) 2018-01-25
PH12014502201A1 (en) 2014-12-10
HUE041322T2 (hu) 2019-05-28
US20130279575A1 (en) 2013-10-24
BR112014026135A8 (pt) 2021-06-22
SG11201406007VA (en) 2014-11-27
EP2839644A1 (en) 2015-02-25
PL2839643T3 (pl) 2019-03-29
RU2014146625A (ru) 2016-06-10
RU2630181C2 (ru) 2017-09-05
KR20150013547A (ko) 2015-02-05
AU2013249619A1 (en) 2014-10-30
PH12014502201B1 (en) 2014-12-10
EP2839643B1 (en) 2018-09-12
BR112014026135A2 (pt) 2017-06-27
JP6234997B2 (ja) 2017-11-22
JP2015517278A (ja) 2015-06-18
PH12014502202A1 (en) 2014-12-10
WO2013158415A1 (en) 2013-10-24
KR102061378B1 (ko) 2019-12-31
CN104247430B (zh) 2017-12-29
EP2839644B1 (en) 2018-08-29
JP2015517277A (ja) 2015-06-18
SI2839643T1 (sl) 2019-01-31
PH12014502202B1 (en) 2014-12-10
KR102115051B1 (ko) 2020-05-25
CA2868521C (en) 2020-03-10
RU2630173C2 (ru) 2017-09-05
JP6664959B2 (ja) 2020-03-13
ES2701786T3 (es) 2019-02-25
SG11201405987WA (en) 2014-11-27
DK2839644T3 (en) 2018-12-10
CN104272745A (zh) 2015-01-07
US20130279599A1 (en) 2013-10-24
IL234834A0 (en) 2014-12-31
US9979959B2 (en) 2018-05-22
US20130279564A1 (en) 2013-10-24
KR20150013546A (ko) 2015-02-05
SI2839644T1 (sl) 2018-12-31
DK2839642T3 (da) 2019-10-14
HK1201113A1 (en) 2015-08-21
WO2013158461A1 (en) 2013-10-24
RU2014146588A (ru) 2016-06-10
CN104272746A (zh) 2015-01-07
BR112014026026B1 (pt) 2023-03-14
JP6284924B2 (ja) 2018-02-28
MY170383A (en) 2019-07-27
AU2013249666A1 (en) 2014-10-30
ES2699656T3 (es) 2019-02-12
BR112014026026A8 (pt) 2021-06-22
EP2839642B1 (en) 2019-07-24
CN104272746B (zh) 2018-01-23
IL234834B (en) 2019-11-28
BR112014026026A2 (pt) 2017-06-27
TR201815255T4 (tr) 2018-11-21
AU2013249619B2 (en) 2017-06-15
KR102115050B1 (ko) 2020-05-25
HK1201663A1 (en) 2015-09-04
US10051264B2 (en) 2018-08-14

Similar Documents

Publication Publication Date Title
JP6234997B2 (ja) ビデオシーケンスにおけるランダムアクセスポイントピクチャのための復号ピクチャバッファ処理
JP6235026B2 (ja) 誤り耐性のある復号単位関連付け
JP2015517278A5 (ja)
JP6177905B2 (ja) 映像コーディングに関する長期基準ピクチャのシグナリング
JP6321002B2 (ja) 固定長コード化されたビデオパラメータセット(vps)idを有する補足強化情報(sei)メッセージ
JP6177884B2 (ja) パラメータセットコーディング
JP6092382B2 (ja) クリーンランダムアクセス(cra)ピクチャに基づくストリーミング適合化
US9525883B2 (en) Cross-layer alignment of intra random access point pictures

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160314

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160314

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170517

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20171128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180326

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20180403

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20180615

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190909

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200219

R150 Certificate of patent or registration of utility model

Ref document number: 6664959

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250